报告题目:数据筛选-从算法到理论
报告人: 孟德宇 教授
报告时间:2024年10月23日(周三)下午15:20-16:20
报告地点:藕舫楼 724室
主持人:徐玮玮 教授
报告摘要:现有深度学习方法的有效性依赖于对训练数据集的高质量要求,当训练集呈现蕴含复杂标记噪声、类别不均衡等数据偏差问题时,其有效性往往不能得以保证,这被称之为深度学习的鲁棒性学习问题。这一问题已经严重制约了深度学习在现实场景中的有效应用,是领域亟需面对的瓶颈问题。本报告将特别针对样本筛选这一类典型的处理数据偏差的方法论展开讨论,介绍该方法论从针对少量数据偏差类型的传统手工赋权设定方法,如何演进到更为前沿的大模型背景下针对更多数据偏差类型的自动化赋权方法。特别地,将深入讨论在该方法论背后蕴含的元学习思想本质,挖掘其有效性理论内涵,从而揭示其可能对现实场景中复杂鲁棒深度学习问题的潜在泛化可用性。
报告人简介:孟德宇,西安交通大学教授,博导,教育部长江特聘教授,任大数据算法与分析技术国家工程实验室机器学习教研室负责人。发表论文百余篇,谷歌学术引用超过31000次。现任IEEE Trans. PAMI,NSR等7个国内外期刊编委。目前主要研究聚焦于元学习、概率机器学习、可解释性神经网络等机器学习基础研究问题。
欢迎广大师生踊跃参加!
数学与统计学院
江苏省应用数学(南京信息工程大学)中心
江苏省系统建模与数据分析国际合作联合实验室
江苏省统计科学研究基地
2024年10月15日