多媒体计算与多模态智能组----视觉信息处理与学习研究组网站

您当前的位置：

首页 > 科学研究>多媒体计算与多模态智能组

多媒体计算与多模态智能组

组长：蒋树强研究员

Email： sqjiang [at] dot ict dot ac dot cn

课题组简介

现有研究员1人、副研究员1人、博士后1人、博士和硕士研究生10余人。

曾经或正在承担国家自然科学基金杰出青年科学基金、国家自然科学基金优秀青年科学基金、国家自然科学基金重点项目、国家自然科学基金面上项目、国家863课题、北京市科技项目、企业合作项目等课题二十余项。

获奖情况：

在基于搜索的多物体识别技术获得ACM ICMR2013 Best Demo Award；基于多传感器的视觉识别技术获得ImageClef Robot Vision竞赛2013年度的冠军，在图像与语言的关联理解技术上的工作分别获ACM Multimedia 2016 Yahoo-Flickr Challenge on Caption Prediction竞赛的冠军。

数据库：

复杂场景下的实例级图像数据集，主页为：http://vipl.ict.ac.cn/isia/instre/；论文：Shuang Wang, Shuqiang Jiang, INSTRE: A New Benchmark for Instance-Level Object Retrieval and Recognition. ACM Transactions on Multimedia Computing, Communications, and Applications(TOMCAT) Vol.11(3), pp. 37:1-37:21, 2015

建立了基于多传感器的手持物体检测数据集，主页为：http://vipl.ict.ac.cn/isia/HOD/；论文：Xiong Lv, Shuqiang Jiang, Luis Herranz, Shuang Wang, RGB-D Hand-Held Object Recognition Based on Heterogeneous Feature Fusion. Journal of Computing Science and Technology, Vol.30(2), pp.340-352 ,2015

建立了面向食品图像识别和多模态菜谱分析的多个食品相关数据集，主页为：http://123.57.42.89/FoodComputing__Dataset.html

研究内容

图像/视频等多媒体信息的分析、理解与搜索技术；
视觉、语言、知识库和各种上下文信息的多模态关联、融合与理解技术；
多模态智能交互技术。

部分论文

图像/视频等多媒体信息的分析、理解与搜索技术；
视觉、语言、知识库和各种上下文信息的多模态关联、融合与理解技术；
多模态智能交互技术。

刊物论文

会议论文

图像/视频等多媒体信息的分析、理解与搜索技术；视觉、语言、知识库和各种上下文信息的多模态关联、融合与理解技术；多模态智能交互技术。

刊物论文

会议论文

图像/视频等多媒体信息的分析、理解与搜索技术；
视觉、语言、知识库和各种上下文信息的多模态关联、融合与理解技术；
多模态智能交互技术。