报告题目:基于独立同任务分布假设的机器学习泛化性研究
时间:8月23日下午15:30-16:30
地点:计算所446会议室
报告摘要:
深度学习应用的宽度和深度都达到了前所未有的程度,其出色的应用效果促使学术界开始重新重视深度学习应用背后的理论问题。目前主流的机器学习泛化理论一方面无法解释小样本+大参数的良好拟合现象(不知道为什么“好”),另一方面无法解释随机标签、对抗样本等新现象(不知道为什么“不好”)。
本次报告将介绍我们最近在机器学习泛化性方面的研究工作。我们通过引入影响数据生成过程的任务相关/无关生成变量,将对数据分布的独立同分布假设放松为独立同任务分布假设;在此基础上给出了与任务和数据分布相关的泛化误差界,以及在新误差界指导下通过增加模型不变性来提升模型泛化性能的具体算法。我们希望这一工作能对数据增强、随机标签、对抗样本等现象提供一种新的理论视角,并为深度学习“逐层处理”、“特征内部变化”的特点从不变性角度给出理论解释。
报告人简介:
桑基韬,教授,博士生导师,北京交通大学计算机科学系副主任。曾获ACM中国新星奖、中科院院长特别奖等。现任中国计算机学会多媒体专委会副秘书长、SIGMM中国执委会委员等。主要研究方向为多媒体计算、多源数据挖掘、机器学习解释性等。已出版Springer英文专著一部、发表IEEE/ACM汇刊近30篇,曾7次获得中国计算机学会推荐会议的论文奖。担任SCI期刊Neurocomputing和KSII TIIS编委,曾担任国际会议PCM2015和ICIMCS2015程序委员会主席、国际多媒体会议ACM Multimedia 2018/2019和国际模式识别会议ICPR 2018领域主席。先后作为负责人主持国家自然科学基金重点项目、国家重点研发计划课题等,以第二完成人获得中国电子学会自然科学一等奖和北京市科学技术奖。