报告题目:可信赖机器学习
报告人:桑基韬,北京交通大学教授
报告时间:2021年08月24日,19:00
腾讯会议号:353 706 438
报告摘要:随着深度神经网络的广泛应用,机器学习相关算法在单项测试中的准确率达到甚至超过了人类水平,正逐步实现从“不能用”到“可以用”的技术跨越。然而,在医疗诊断、无人驾驶等强安全性的应用领域,由于鲁棒性差、违背常识伦理、难以测试调试等问题,机器学习算法距离工业级大规模场景下的“很好用”仍有一段距离。我们尝试将这种“不好用”的原因归结为机器学习算法对人知识蒸馏的过程中学习到的两类“虚假相关性”:(1)欠蒸馏,数据不完备导致机器提取和利用任务无关特征,对应泛化性/公平性/因果性等问题;(2)过蒸馏,人和机器信息处理机制不同导致机器提取和利用非语义特征,对应对抗鲁棒性/解释性等问题。在这一理解下,可信赖机器学习致力于学习任务相关的语义特征:学习器学习任务相关特征,满足系统内部应用;解释器进一步筛选任务相关的语义特征,同时满足与人交互的应用;测试器检测两类虚假相关性,与学习器和解释器形成闭环,通过测试-调试共同保证机器学习算法从实验室级向工业级的可信赖应用。此次课程将包括三个部分:(1) 为什么需要可信赖:“可以用”≠“很好用”;(2) “不好用”的原因:两类虚假相关性;(3) 可信赖机器学习框架: 学习-解释-测试"。
报告人简介:桑基韬,教授,博士生导师。主要研究方向为社会多媒体计算、多源数据挖掘、可信赖机器学习等。作为负责人先后承担相关方向的国家自然科学基金重点项目、科技部重点研发计划课题和北京市杰出青年基金,第一/二作者论文曾7次获得CCF推荐会议论文奖项,以第二完成人获得中国电子学会自然科学一等奖和北京市科学技术奖。