多媒体计算与多模态智能组
组 长: 蒋树强 研究员
Email: sqjiang [at] dot ict dot ac dot cn
课题组简介

现有研究员1人、副研究员1人、博士后1人、博士和硕士研究生10余人。

曾经或正在承担国家自然科学基金杰出青年科学基金、国家自然科学基金优秀青年科学基金、国家自然科学基金重点项目、国家自然科学基金面上项目、国家863课题、北京市科技项目、企业合作项目等课题二十余项。


获奖情况:

在基于搜索的多物体识别技术获得ACM ICMR2013 Best Demo Award;基于多传感器的视觉识别技术获得ImageClef Robot Vision竞赛2013年度的冠军,在图像与语言的关联理解技术上的工作分别获ACM Multimedia 2016 Yahoo-Flickr Challenge on Caption Prediction竞赛的冠军。


数据库:

复杂场景下的实例级图像数据集,主页为:http://vipl.ict.ac.cn/isia/instre/;论文:Shuang Wang, Shuqiang Jiang, INSTRE: A New Benchmark for Instance-Level Object Retrieval and Recognition. ACM Transactions on Multimedia Computing, Communications, and Applications(TOMCAT) Vol.11(3), pp. 37:1-37:21, 2015

建立了基于多传感器的手持物体检测数据集,主页为:http://vipl.ict.ac.cn/isia/HOD/;论文:Xiong Lv, Shuqiang Jiang, Luis Herranz, Shuang Wang, RGB-D Hand-Held Object Recognition Based on Heterogeneous Feature Fusion. Journal of Computing Science and Technology, Vol.30(2), pp.340-352 ,2015

建立了面向食品图像识别和多模态菜谱分析的多个食品相关数据集,主页为:http://123.57.42.89/FoodComputing__Dataset.html

研究内容

图像/视频等多媒体信息的分析、理解与搜索技术;
视觉、语言、知识库和各种上下文信息的多模态关联、融合与理解技术;
多模态智能交互技术。


部分论文

刊物论文

会议论文