报告题目:多智能体深度强化学习方法
报告时间:5月15日上午10:30-12:00
报告形式:腾讯会议(会议号:992 180 297)
报告人:孙长银 教授
主持人:陆振宇 教授
欢迎广大师生踊跃参加!
南京信息工程大学人工智能学院
2020年5月9日
报告摘要:人工智能驱动的多智能体自主控制已成为研究的热点方向。多智能系统是由众多具有一定自主协同能力的智能体组成,按一定规则协同作业,完成单个智能体无法完成的任务使命,表现出较高智能行为的开放环境下的复杂系统,如卫星群、飞机群、导弹群、多机器人群。多智能体系统通过多个智能体之间的简单有效协作,克服个体能力上的不足,完成个体不可能实现的任务。深度强化学习将深度神经网络用于强化学习的策略函数以及值函数的拟合中,研究多智能体不确定性、脆弱性和开放性条件下的任务建模、环境建模和人类行为建模,把人对复杂问题分析与响应的高级认知机制与机器智能系统紧密耦合,实现多智能体系统的交互和协同控制。
报告人简介:孙长银,1975年生,安徽霍邱人,中国自动化学会会士、中国科协九大代表、东南大学二级教授、特聘教授、学习机器研究中心主任、自动化学院学术委员会主任,国家创新群体项目负责人,科技部2030-“人工智能专项”重大项目首席科学家(2019-2022),2011年国家杰出青年科学基金获得者。全国优秀科技工作者,第三届国家 “万人计划”科技领军人才。曾获得2007年教育部自然科学一等奖,2010年教育部自然科学二等奖,2013年国家自然科学二等奖和2017年杨嘉墀科技奖一等奖,以及“智能机器人感知与控制”江苏省高校优秀科技创新团队带头人(2013年)、2015年科技部中青年创新领军人才以及2008年教育部新世纪优秀人才等荣誉和奖励。目前任CAA常务理事、副秘书长、人工智能与机器人教育委员会主任,CAAI常务理事、智能控制与智能管理专业委员会主任等。发表论文被引用5000余篇次,出版专著4部。荣获建国70周年纪念章一枚。