报告时间:2021 年4月25日(星期日)19:00 -22:00
讲者:陈胜勇 博士、王楠楠 博士、王瑞平 博士、俞俊博士
报告地点:腾讯会议ID(366 681 734),密码(425425)
主持人:郑钰辉 博士、张敬林 博士
报告一题目:三维视觉感知及应用
报告摘要:我们与机器人都在三维空间中活动,自主机器人要实现智能技术就需要具备像人一样三维视觉能力,使机器可以随时获取环境信息并理解对象所处的状态。本报告介绍三维视觉的基本原理,研究如何让计算机突破传统的二维图像空间,实现三维空间的分析,重构场景的三维几何信息,对场景对象和内容进行理解和交互。报告结合相关应用系统,包括移动机器人系统,无人机及遥感测量,海洋安防系统等,解决机器视觉系统的可靠性、实时性和主动性,尤其在实时视觉感知、三维成像、视觉定位、跟踪、识别及内容理解等方面给出相关例子,实现多种智能化应用系统,例如基于无人机的目标识别、跟踪、定点投放物资、无人巡检等。
讲者简介:陈胜勇,博士、教授、博士生导师,中国图象图形学学会理事,IET Fellow,英国特许工程师及认证官,天津市特色学科群“新一代人工智能与系统”负责人、天津市高校重点学科带头人、天津市重点领域创新团队负责人、天津理工大学副校长。2003年香港城市大学取得博士学位、2004西班牙萨拉戈萨大学博士后研究员、2007德国汉堡大学洪堡学者、2009年英国帝国理工学院访问教授,2013年获得国家杰出青年科学基金资助。主要从事机器视觉与模式识别领域的研究,先后主持国家级项目8项,在国际期刊上发表200多篇SCI论文,在Springer、科学出版社等编著10多部英文学术著作、5部中文著作,发明专利100多项。被SCI他引4000多次,多次被评全球高被引科学家。获得省部级自然科学一等奖、二等奖、科技进步一等奖、二等奖共4项。担任3种国际学术期刊的主编和副编,作为主席、副主席、专题主席组织10多次国际学术会议。
报告二题目:图像跨域重建
报告摘要:跨域图像是指同一目标通过不同传感器所形成的不同类型的图像,而图像跨域重建是指利用跨域图像之间内容的关联性和表达的互补性由一个域的图像生成另外一个域的图像或由一个域的图像识别另外一个图像的过程。本报告中的图像跨域重建主要包括人脸画像-照片合成和图像超分辨率重建。本报告将介绍现有的图像跨域重建方法以及我们课题组在此方向上的进展。
讲者简介:王楠楠,男,华山学者特聘教授,博士生导师。西安电子科技大学综合业务网理论及关键技术国家重点实验室智能信息处理中心主任。近年来从事计算机视觉和统计机器学习方面的研究,在图像跨域重建与识别方面进行了深入研究,内容包括画像-照片合成与识别,图像/视频超分辨率重建、图像恢复,行为分析与识别,行人重识别等。在IEEE TPAMI、IJCV、CVPR、NeurIPS等国际顶级期刊和会议上发表学术论文100余篇,获得国家自然科学基金委优秀青年基金,入选中国科协青年人才托举工程,获教育部自然科学一等奖、陕西省科学技术一等奖、中国图象图形学学会自然科学奖二等奖、中国人工智能学会优秀博士学位论文、陕西省优秀博士学位论文奖等奖项。
报告三题目:视觉场景图—表示、生成与应用
报告摘要:近年来面向视觉场景理解的认知任务探索成为热点,研究视角从关注局部的视觉实体(object-centric)转向关注全局的实体间关系(relationship-centric),如何建立纷繁视觉信息与其本质语义内涵之间的跨模态通路成为关键挑战。结构化的视觉场景图(scene graph)为连接底层的物体识别检测等感知任务与高层的语言描述问答等认知任务提供了桥梁。本课题组近几年围绕场景图的表示、生成与应用开展了系列研究,致力于建立“物体-->场景-->语言-->知识”的递进式场景理解统一框架。报告将介绍取得的一些具体进展,包括:结构化图推理驱动的物体检测、场景关系图的自动生成、复杂场景跨模态图文检索、图像描述生成的认知评测体系等工作。
讲者简介:王瑞平,中科院计算所研究员、博导,研究领域为计算机视觉与模式识别,重点关注真实开放环境下的视觉场景理解问题。发表主流国际期刊和会议论文70余篇,Google Scholar引用4800余次,获授权国家发明专利8项。围绕相关学术专题,先后在CVPR2015、ECCV2016、ICCV2019等国际会议合作组织并主讲Tutorial。担任国际期刊Pattern Recognition、Neurocomputing、The Visual Computer编委,国际会议IEEE CVPR2021、ICCV2021、FG2021、WACV2018-2020、ICME2019-2021、IJCB2020、ICPR2020领域主席。研究成果获得2015年度国家自然科学奖二等奖(第4完成人)、2019年度国家自然科学基金委优青项目资助。入选2019年度北京智源人工智能研究院“青年科学家”。
报告四题目:图像异构模态计算理论与方法
报告摘要:图像作为当下互联网时代最重要的信息载体之一,正在以惊人速度不断积累增长。对图像内容进行精确、细粒度的理解是一个亟需解决的基本问题。然而,现有方法在复杂通用场景下无法像人一样实现稳定、精准的图像理解,并基于理解结果进行更高层的认知理解。俞俊教授在国家自然科学优青基金等项目的持续支持下,突破传统图像计算方法一直受限于图像单一视觉模态的定性思维,构建以 “点击关联、高阶融合、层次认知”为核心的图像计算新途径。本报告主要介绍近年来,项目组利用点击预测结合点击排序的框架关联图像异构模态信息,构建维度互补的高阶融合框架,形成基于逐层知识凝练和结构优化的层次化图像认知机制。
讲者简介:俞俊,杭州电子科技大学教授、博士生导师,2016年获国家优青,2017年获教育部青年学者。主要研究方向为跨媒体分析技术。相关工作发表于SCI源期刊论文100余篇,包括ACM汇刊与IEEE汇刊及CCF A类会议40余篇。论文的Google Scholar引用次数6000余次。10余篇论文入选ESI高被引/热点论文;近年来主持国家自然科学基金重点项目、国家自然科学基金面上项目等,2015、2016、2017连续获得IEEE TMM、TIP、TCYB最佳论文奖,2018年教育部自然科学二等奖。担任多个国际期刊的副编辑。