中科院计算所视觉信息处理与学习组
中科院计算所视觉信息处理与学习组


您所在的位置 / 科学研究

科学研究
唇语识别组

组  长:杨双 博士;山世光 研究员

Email:shuang dot yang [at] ict dot ac dot cn; sgshan [at] ict dot ac dot cn

* 唇语识别组成立于2017年,主要以唇语识别为核心任务,以相关的视觉语音活性检测、关键说话内容检索等问题为辅助任务展开研究。相关技术可用于辅助语音识别,实现更加智能、鲁棒的人机交互,也可独立应用于辅助教学、安全验证、军事公安等领域。


* News:

2018.10:研究组发布唇语识别数据集LRW-1000。该数据库既是唇读领域内公开的最大规模的词级唇语识别数据集,也同时是目前唯一公开的大规模词级中文唇语识别数据集。详情请点击数据主页(内含论文和代码)

2018.4~2018.10:研究组受邀参加CCTV-1《机智过人》第二季节目录制,向全国观众展示唇语识别技术。详情请点击这里
研究内容

* 研究问题:

※ 唇语识别

※ 关键说话内容检索

※ 说话人脸生成

※ 视觉语音活性检测

※ 音视觉结合的说话内容识别/检索、说话状态检测

* 相关应用:

※ 唇语密码、活体检测、指令语句识别、发音口型打分

部分论文

刊物论文

会议论文


视觉信息处理和学习组
  • 单位地址:北京海淀区中关村科学院南路6号
  • 邮编:100190
  • 联系电话:010-62600514
  • Email:yi.cheng@vipl.ict.ac.cn
  • Valse

  • 深度学习大讲堂

版权所有 @ 中科院计算所视觉信息处理与学习组 京ICP备05002829号 京公网安备1101080060