我们总以为量子是微观世界的魔法师,只在原子里耍酷——直到2025年诺贝尔物理学奖告诉你:你的手机芯片,早就能让量子效应在毫米级电路里跳芭蕾。今年的物理...
2025-10-10 0
9月28日,由北京化工大学科协、北京科技社团服务中心主办的“数智赋能·低碳韧性——双碳目标下能源资源转型青年科技沙龙”成功举行。本次活动特邀“院士-四青-青托”学术梯队人才,聚焦数智化驱动绿色低碳转型等核心议题进行深入交流,内容贯通数智技术底层算法到绿色低碳能源领域的场景应用,旨在对关键科技问题凝聚共识,激发突破,为后续工作提供借鉴。
科协频道对本场沙龙上作“聚焦场景落地的通用人形机器人研究与应用”主题报告的张正涛研究员进行专访,共探具身智能和人形机器人研究的挑战与前景。
张正涛
博士,中国科学院自动化所研究员,博士生导师,中组部万人领军,中国科学院工业视觉智能装备技术工程实验室主任,中国自动化学会第十二届理事,智能制造系统与技术专业委员会主任,工信部智能检测装备产业专家咨询委员会委员,中国科学院大学岗位教授,长期从事工业外观检测、具身机器人的研究。在IEEE Trans.等高质量期刊发表学术论文90余篇,合著图书2本,授权发明专利36项。主持及参与国家自然基金、重点研发计划等课题20余项,获2022年度中国科学院科技促进发展奖、2024年度河南省科技进步奖一等奖、2023年度中国图象图形学学会科技进步奖一等奖等荣誉。
不同于传统路径的创新
从学术课题到实现社会价值
张正涛选择投身具身智能和人形机器人研究的契机既来自其个人研究经历,也有政策与产业共振的因素。在中科院自动化所对人工智能与强化学习方向的长期研究中,张正涛和同事们发现,在虚拟数据上表现优异的算法一旦进入真实环境,效果常常不理想。这让他意识到,必须结合真实场景数据来推动智能体的演进。他也注意到,国家在过去三年印发了《人形机器人创新发展指导意见》《“机器人+”应用行动实施方案》等重要文件,强调人形机器人是继电动车、智能手机之后的战略性新产品,反映出社会的真实需求:人口老龄化应对、产业升级、高危场景替代。“对于一个科研工作者而言,这不仅是学术课题,更是社会责任。”张正涛希望为推动“科研成果—产业落地—社会价值”之间形成真正的循环贡献一份力量。
真实世界中的数据远比虚拟仿真复杂,且成本高昂。在具身智能和人形机器人研究中,缺乏大规模、多模态的交互数据,是行业普遍的瓶颈。场景适配也是研究中的一大挑战,实验室里能做到的“标准化操作”,一旦进入开放环境,就会遇到干扰、噪声、突发情况,机器人往往难以稳定完成。为了解决这些问题,张正涛和同事们一方面通过场景合作积累数据,与工厂、矿山、服务业场景合作,在真实环境中沉淀可复用的数据集;另一方面结合轻量化与强化学习,通过轻量化VLA模型和强化学习后训练,让机器人能更快适应新场景;此外,协同多产品线,同时布局双足人形、轮式人形和灵巧手,用不同形态互为补充,提升整体落地的灵活性与适配度。
张正涛团队研发的具身智能机器人
依靠上述三个方法,张正涛和同事们有效化解了数据和场景适配两方面的挑战。他们的研究收获了几个不同于传统路径的创新点:
第一,在算法层面聚焦数据瓶颈,提出了真实交互数据驱动模型优化的路线。例如,在RoboBERT模型中,将语言、动作、感知三者进行深度耦合,并在CALVIN等国际基准任务上取得领先成绩,表明轻量化模型也能在有限数据下实现高效泛化。
第二,在系统层面坚持全栈自研。从机器人本体结构、灵巧手设计,到决策架构与控制系统,都保持了自主研发。张正涛表示,“这种纵向一体化的优势,使得我们能在系统优化时做到真正的协调一致,而不是零散拼接。”
第三,在发展路径上始终坚持“场景牵引”。与国外一些团队偏重技术表演不同,张正涛和同事们选择直接切入矿山、工厂、文旅等场景。这样做能持续获取一手数据,并通过场景需求倒推技术演进,独特性在于“不仅关注能否实现,还关注为什么实现、为谁实现”。
张正涛团队研发的具身智能机器人
具身智能驱动的人形机器人
如何从实验室走向真实场景?
具身智能与人形机器人不是抽象的科研成果,它们有明确的应用方向。例如,在工业质检领域,张正涛和同事们基于亿级缺陷数据集,探索让人形机器人在复杂生产线上实现柔性质检,未来可覆盖8个以上细分行业;在代表高危、极端场景的矿业与能源领域,他们与中科深矿合作,验证机器人替代人工进入无人化采场的可行性,不仅可以提升安全系数,也可以为能源行业“减人、提效、增安”提供路径;在人机互动性更强的文旅与服务领域,他们力求让机器人通过多模态交互承担辅助角色。“从长远看,这些应用会在三个层面产生影响:一是降低人力风险,二是提升产业效率,三是推动社会对人形机器人的正向认知。”
具身智能机器人在文旅与服务领域工作的概念图
本场沙龙上,张正涛主要围绕“具身智能驱动的人形机器人如何从实验室走向真实场景”进行了报告。他认为,第一,具身智能是人工智能发展的必然方向。从虚拟世界的认知模型到真实世界的交互智能是人工智能的一次质变,大模型的突破带来了新的工具,但没有场景数据的驱动,它们仍只能停留在表层。第二,人形机器人只有进入实际应用场景,才能形成完整的“感知—决策—执行”闭环,进而推动整个行业走向成熟。换句话说,技术展示很重要,但真正的价值来自于场景落地。第三,具身智能不仅是科研问题,也是产业问题。它将成为新质生产力的重要支撑点,影响制造、能源、医疗、养老等多个行业。张正涛希望能推动机器人从“能表演”到“能工作”,从“会执行”到“懂场景”。
具身智能机器人通过多模态交互,在人文展馆导览场景下承担辅助角色的概念图
展望未来,张正涛认为具身智能和人形机器人研究的关键趋势也有三个。其一是具身智能与大模型的深度融合。如今,大模型解决了语言和感知的问题,但还没有解决动作与环境的闭环;未来,“语言—感知—动作”的统一模型应是主流方向。其二是场景驱动的演进。不同领域的实际应用需求都会成为推动机器人演进的重要动力,“人形机器人不会一蹴而就,它会在高需求、高价值场景中逐步成熟。”其三是系统化的竞争力。张正涛表示,能构建“产品—技术—场景”的闭环,才能真正在行业竞争中领先。“中国企业有很大机遇,因为我们与产业结合更紧密,能更快获得场景反馈。”
以服务社会为目标
迎接挑战与可能性
本场沙龙上,跨学科交流的价值让张正涛印象深刻。他觉得,能源、交通、医疗等不同领域的专家从各自角度提出需求和挑战,更加明确了“技术与场景结合”的必要性。“对于我们而言,这不仅是展示成果的机会,更是理解社会痛点的过程。具身智能最终要服务于社会,它必须解决具体问题。沙龙上的交流,是对这一理念的再次印证。”
作为具身智能和人形机器人研究的“前辈”,张正涛有不少想为青年科技工作者们分享的经验。保持好奇是排在第一位的——“具身智能的核心是不断追问,为什么实验室有效而现实无效?为什么模型准确率高但泛化差?这些问题才是推动进步的起点。”其次是要坚持长期主义,因为人形机器人是一个涉及机械、控制、算法、材料等多个学科的长周期工程,“不要期待一两年见效,而是要有持续积累的耐心。”主动拥抱场景同样重要,迎难而上、把研究成果放进真实环境中磨合,才能使技术真正具备生命力,“不能只在实验室里打转”。最后,张正涛也希望青年科技工作者们能带着信念进入具身智能领域,带着信念走上这条“既充满挑战也充满可能性的赛道”。
推介单位|中国科学院自动化所
编辑排版| 潘谢阳
审核|六朵 钱炜 苏苏 贞贞
图片|作者提供
文章未经授权,请勿转载。 免责声明:本文内容仅代表作者个人观点,不代表平台立场,欢迎大家在评论区讨论。
栏目推荐
滑动查看更多栏目
相关文章
我们总以为量子是微观世界的魔法师,只在原子里耍酷——直到2025年诺贝尔物理学奖告诉你:你的手机芯片,早就能让量子效应在毫米级电路里跳芭蕾。今年的物理...
2025-10-10 0
9月28日,由北京化工大学科协、北京科技社团服务中心主办的“数智赋能·低碳韧性——双碳目标下能源资源转型青年科技沙龙”成功举行。本次活动特邀“院士-四...
2025-10-10 0
10月9日,美芯晟(688458.SH)在投资者关系活动记录表中称,公司用于机器人和AI端侧领域的芯片已在知名品牌批量出货,DToF芯片可用于多种类型...
2025-10-10 0
前阵子刷到篇哈佛博士写的论文,是SeyedM.Hosseini和GuyLichtinger这两位搞的,经“卫夕指北”编译后在朋友圈传疯了。核心就一句话...
2025-10-10 0
亲,这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-10-10 8
微乐捉鸡麻将控牌器是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加微下载使用。 手机打牌可以一键让你轻松成为“必赢”...
2025-10-10 11
微乐陕西挖坑怎么能拿到好牌是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加微下载使用。 手机打牌可以一键让你轻松成为...
2025-10-10 15
开心十三张透明挂辅助器脚本是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加微下载使用。 手机打牌可以一键让你轻松成为...
2025-10-10 9
发表评论