中科院计算所视觉信息处理与学习组
中科院计算所视觉信息处理与学习组


您所在的位置 / 新闻动态

新闻动态

实验室关于可解释物体分类模型的论文被IEEE TPAMI接收

发表日期:2019-12-01      点击击数: 43

近日,实验室关于可解释物体分类模型的工作被IEEE TPAMI接收。TPAMI的全称为IEEE Transactions on Pattern Analysis and Machine Intelligence,是计算机视觉领域的国际顶级期刊之一,2019SCI影响因子为17.730。论文信息如下:


Haomiao Liu, Ruiping Wang, Shiguang Shan and Xilin Chen. “What is Tabby? Interpretable Model Decisions by Learning Attribute-based Classification Criteria,” IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2019. (Accepted on Nov. 3rd, 2019).


视觉属性(如颜色、形状等)和语义类别(如猫、狗、马等)是日常生活中常见的语义概念,并且这些语义概念之间存在一定的关联。例如,虎斑猫是一种有条纹的猫,其中“虎斑猫”和“猫”这两种语义类别通过“有条纹”这个属性联系在了一起。这种语义概念之间的关联一方面可以作为推理线索,辅助计算机视觉算法进行复杂的认知任务,另一方面还可以为计算机视觉模型的设计提供指导。但是,由于这些关联关系的高度复杂性,以及极高的标注难度,目前公开的数据库上针对这些关联关系的标注还十分稀缺。因此,该工作提出通过机器学习算法,利用物体类别间天然存在的层级结构,自动从大量数据中挖掘语义概念之间的关联关系,建立类别与属性之间的可解释组合表示模型,实现了物体分类规则的自动学习与挖掘。方法的总体框架图如下:




总体而言,该工作的主要贡献包括:1)设计了一种有效的模型结构,在保证模型识别精度的情况下,还可以自动学习语义概念间的关联关系,从而解释了模型的推理机制,提升了模型的可解释性;2)模型学到的语义概念间的关联关系是人可以理解的,使得使用人工反馈对模型进行校正成为可能,甚至可以用于教会普通人辨别视觉上相似类别之间的区分规则;3)通过大量实验对方法的运行机制进行了分析,为物体分类这一经典视觉问题的研究提供了深入的洞察和思考。


视觉信息处理和学习组
  • 单位地址:北京海淀区中关村科学院南路6号
  • 邮编:100190
  • 联系电话:010-62600514
  • Email:yi.cheng@vipl.ict.ac.cn
  • Valse

  • 深度学习大讲堂

版权所有 @ 中科院计算所视觉信息处理与学习组 京ICP备05002829号 京公网安备1101080060