中科院计算所视觉信息处理与学习组
中科院计算所视觉信息处理与学习组
宋国利

职 称:博士后

研究方向:跨媒体技术、机器学习

Guoli Song (宋国利) is currently a postdoc in the School of Computer and Control Engineering, University of Chinese Academy of Sciences. I received the Ph.D. degree in computer engineering from University of Chinese Academy of Sciences in 2018, and received the B.S. degree in mathematics and applied mathematics and the M.S. degree in operational research and cybernetics from Zhengzhou University, in 2009 and 2012, respectively. My research interests include cross-media content analysis, computer vision, and machine learning.

经历
教育经历
  • 2005.09~2009.07 郑州大学 数学与应用数学 理学学士
  • 2009.09~2012.06 郑州大学 运筹学与控制论 理学硕士
  • 2012.09~2018.01 中国科学院大学 计算机应用技术 工学博士
著论

论文

Journal


[1] Guoli Song, Shuhui Wang, Qingming Huang, and Qi Tian, "Multimodal Similarity Gaussian Process Latent Variable Model", IEEE Transactions on Image Processing, vol. 26, no.9, pp. 4168-4181, 2017. [pdf] [code]


【摘要】 考虑到跨模态数据的内容多样性和语义复杂性,本文利用高斯过程隐变量模型(GPLVM)挖掘异质对象间的潜在关联信息。GPLVM可以利用灵活的非参数高斯过程映射将高维多模态数据嵌入低维隐空间,但是在降维嵌入过程中无法保持数据的拓扑结构,即无法使得在观测空间中(不)相似的点在隐空间也(不)相似。为了解决这个问题,我们对GPLVM引入结构信息和语义先验,提出了提出了相似度高斯过程隐变量模型m-SimGP, 及其扩展模型m-DSimGP,m-RSimGP和m-DRSimGP。我们在五个公开数据集上进行了实验,验证了所提方法在跨模态检索和分类应用中的有效性。


Conference


[1] Guoli Song, Shuhui Wang, Qingming Huang, and Qi Tian, "Multimodal Gaussian Process Latent Variable  Models with Harmonization", IEEE International Conference on Computer Vision (ICCV2017), pp. 5039-5047, Venice, Italy, 2017. [pdf] [code]


【摘要】为了实现跨模态数据间的信息共享,本文对多模态高斯过程模型的参数提出了一种调和机制。通过对高斯过程的核参数和隐变量的联合建模,提出了一种新的调和约束,使不同模态的核矩阵和隐空间相似度矩阵趋于一致,从而实现了跨模态数据的模态间结构保持学习。本文将提出的调和约束作为模型参数的先验信息引入到不同类型的多模态高斯过程隐变量模型中,利用隐空间构造了不同模态间的信息传播渠道,使模型在参数层面实现了跨模态结构信息共享。我们在PASCAL、Wiki 和 TVGraz 三个公开数据集上进行了跨模态检索实验,验证了所提调和模型的有效性。


[2] Guoli Song, Shuhui Wang, Qingming Huang, and Qi Tian, "Similarity Gaussian Process Latent Variable Model for Multi-Modal Data Analysis", IEEE International Conference on Computer Vision (ICCV2015), pp. 4050-4058, Santiago, Chile, 2015. [pdf] [code]
[3] Guoli Song, Shuhui Wang, and Qi Tian, "Fusing feature and similarity for multimodal search", IEEE China Summit and International Conference on Signal and Information Processing (ChinaSIP2015), pp. 787-791,  Chengdu, China, 2015. [pdf]




视觉信息处理和学习组
  • 单位地址:北京海淀区中关村科学院南路6号
  • 邮编:100190
  • 联系电话:010-62600514
  • Email:yi.cheng@vipl.ict.ac.cn
  • Valse

  • 深度学习大讲堂

版权所有 @ 中科院计算所视觉信息处理与学习组 京ICP备05002829号 京公网安备1101080060