数据库
DEVISIGN中国手语数据库是在微软亚洲研究院的资助下由中国科学院计算技术研究所视觉信息处理和学习研究组(VIPL)构建的。创建该数据库的目标包括:
(1)为世界各地手语识别研究人员进行算法训练和评价提供大规模中国手语数据库
(2)推动先进的手语识别技术向可实用化的应用方向发展,尤其是针对未知用户的情况
目前,DEVISIGN数据库覆盖全部4414个标准中国手语词汇,共包含来自于30个对象(13名男性,17名女性)的331,050个词汇数据。每一个词汇数据由RGB视频(“avi”格式)和深度及骨架信息(“bin”格式)构成。数据库包含词汇类内和词汇类间的变化。对于15个采集对象,对所有4414个词汇采集了4遍;对其余15个采集对象,仅采集1遍。
在第一阶段,DEVISIGN数据库会部分公开用于研究目的。由VIPL负责进行数据库发布,并拥有数据库所有视频和文件的版权。
数据子集
目前对DEVISIGN数据库的三个子集进行公开发布。第一个子集包含26个字母和10个数字,简称为DEVISIGN-G。第二个子集包含500个日常常用的词汇(包含DEVISIGN-G中的36个词汇),简称为DEVISIGN-D。第三个子集是一个大词汇量的数据集,包含2000个中国手语词汇(包含DEVISIGN-D中的500个词汇),简称为DEVISIGN-L。
上面三个数据集合中,只是词汇规模不同,被采集手语人员和采集的次数都是一致的。数据覆盖8个不同的手语示范人员,对于其中4名被采集对象,记录两遍所有词汇的数据;对于其他4名被采集对象,仅记录一遍。下表对DEVISIGN的三个子集内容进行了总结。
集合 | 词汇数 | 采集对象人数 | 数据记录次数 | 总视频数 |
---|---|---|---|---|
DEVISIGN-G | 36 | 8 | 4 人 : 2次 4 人 : 1次 |
432 |
DEVISIGN-D | 500 | 6000 | ||
DEVISIGN-L | 2000 | 24000 |
DEVISIGN-G 数据集合中的视频示例:
P04_0001_1(一)
P04_0001_2(一)
P07_0001_1(一)
数据集合中的视频示例
DEVISIGN-G DEVISIGN-D DEVISIGN-L数据开放计划
DEVISIGN-G/-D/-L数据库面向用于研究目的的大学和科研机构开放。如需获取数据资源的下载权限,请按照下文所示进行操作:
(1)下载DEVISIGN数据库发布协议,仔细阅读并正确填写。请注意该协议应由全职工作人员签署(不接受学生签名)。对签名的协议进行扫描,并发送至闵越聪先生(yuecong.min@vipl.ict.ac.cn),抄送给柴秀娟(chaixiujuan@ict.ac.cn)。若您来自于中国,请用中文进行签名。收到协议表格后,我们会对您的信息进行确认并与您联系确认如何进行数据下载。这里需要注意的是,因为数据量很大我们不推荐直接从网上下载数据。希望能够通过移动硬盘邮寄来进行数据的传送。您可以选择邮寄一个空的硬盘给我们或者汇款相应的金额至我们指定的账户。
(2)在使用数据库前,您可以参考关于DEVISIGN的技术报告,或者访问我们研究组在手语识别方面的其他文章。
关于DEVISIGN数据库,如果您有其他疑问,请和我们联系:
闵越聪
视觉信息处理和学习研究组(VIPL)
中国科学院计算技术研究所
电话:+86 10 6260 0551
传真:+86 10 6260 0548
邮箱: yuecong.min@vipl.ict.ac.cn
Copyright © 2014