10月27日,第五届中国(瑞昌)市政疏浚设备博览会暨2025中国国际管网展览会-瑞昌站在“中国疏浚之乡”江西省瑞昌市开幕。本届博览会以“科技赋能,疏通...
2025-10-27 0
10月22日下午,CNCC 2025“视觉智能邂逅多模态:从感知到理解”论坛在哈尔滨华旗饭店3层308顺利举行。本次论坛聚焦视觉智能与多模态的协同发展,围绕多模态信息对齐与特征融合、协同感知、表征与推理、以及生成与交互等关键问题,结合大规模预训练与生成式人工智能的最新进展,探讨从单一感知走向复杂语义理解与决策的实践路径。论坛汇集了来自天津大学、武汉大学、哈尔滨工业大学的学者,分别围绕多模态表征学习与推理,多模态图像融合与协同感知技术,多模态视觉生成、编辑与交互技术展开主题报告与交流,展示了跨模态对齐、任务联动与开放环境下泛化能力提升在智能系统中的作用,为多模态人工智能的落地应用提供清晰的技术思路与可操作经验。此次论坛由哈尔滨工业大学江俊君教授和江奎副教授担任共同主席。
第一阶段由天津大学教授张长青作《多模态表征学习与推理:理论、技术与应用》主题报告。报告围绕多模态数据在广泛领域的重要应用,面向科学发现、医疗诊断、机器人等场景,分析不同模态信息的互补性、冗余性、动态性、不平衡与不完整对融合效果的影响,探讨在不确定性条件下的表征与推理路径,重点介绍面向低量多模态数据的理论框架、方法与应用示例。
第二阶段由武汉大学教授马佳义作《多模态图像融合与协同感知技术》主题报告。报告围绕实际应用的图像融合技术为主线,系统介绍未配准融合、文本驱动的退化鲁棒框架、视觉语义协同感知与通用融合方法,并以安防监控、遥感监测、智慧医疗等场景展示其在公共安全、环境感知与辅助诊断中的价值。
第三阶段由哈尔滨工业大学左旺孟老师作《多模态视觉生成、编辑与交互技术》主题报告。报告从介绍文生图像、文生视频与文生3D的最新进展开始,重点梳理扩散与自回归两类生成模型,展示身份保持、布局控制、动作与相机运动等维度的可控生成技术;同时涵盖多模态视觉编辑、Agentic生成与交互式编辑,并讨论相关伦理与安全议题。
“视觉智能邂逅多模态:从感知到理解”论坛的成功举办,不仅为多模态与视觉智能的研究与应用带来清晰思路,也为高校与产业搭建了高效的交流平台。展望未来,论坛将继续面向表征与推理、协同感知、生成与交互等方向推进合作与实践,推动方法、数据与工具的开放共享,促进多模态人工智能在真实场景的落地与健康发展。
相关文章
10月27日,第五届中国(瑞昌)市政疏浚设备博览会暨2025中国国际管网展览会-瑞昌站在“中国疏浚之乡”江西省瑞昌市开幕。本届博览会以“科技赋能,疏通...
2025-10-27 0
10月27日消息,美团LongCat团队今日发布并开源LongCat-Video视频生成模型,以统一模型在文生、图生视频基础任务上达到开源SOTA(最...
2025-10-27 0
10月22日下午,CNCC 2025“视觉智能邂逅多模态:从感知到理解”论坛在哈尔滨华旗饭店3层308顺利举行。本次论坛聚焦视觉智能与多模态的协同发展...
2025-10-27 0
10月27日星期一全球首款类脑智算体智者一号亮相工信部:我国将大力推进“5G+工业互联网”512工程升级版实施方案上海打造全国首个脑机接口产业集聚区山...
2025-10-27 0
2019年至2025年,柳州市不动产档案管理中心在全区率先引入RFID智能档案管理技术,解决了长期以来困扰纸质档案管理工作的诸多难题,成功实现了海量纸...
2025-10-27 0
【67岁“彩电大王”长虹借AI实现数智新生,业绩与转型成果显著】67岁的长虹迎来数智新生,它从传统家电制造商转型为技术驱动的产业集团。2024年,四川...
2025-10-27 0
OpenAI 最近真的是忙飞了,一会做电商,一会做社交,现在又推出了浏览器,emmmm…..七姐妹已经树敌了一半。三天一个热搜,海豚君简直跟不过来。在...
2025-10-27 0
新眸原创·作者 | 棠宁过去几个月,支付宝以其意想不到的方式,一次次闯入公众视野。2025年的它,从在江苏卫视跨年演唱会上跟着周深喊“碰一下”支付,到...
2025-10-27 0
发表评论