今天(10 月 7 日)凌晨,苹果发布了 iOS 26.1 的第二版 Developer Beta 测试更新,系统版本号为 23B5059e。如果你此...
2025-10-07 0
国际机器人学习大会
(Conference on Robot Learning, CoRL)
是全球AI顶级学术会议之一
近年来伴随具身智能热潮
该方向的关注度持续攀升
在今年的 CoRL会议上
共计投稿近千篇
收录论文264篇
产生42篇Oral
有8篇论文入围Award Finalist
最终评选2篇杰出论文
通研院团队的论文
“UniFP: Learning a Unified Policy for Force and Position Control in Legged Loco-Manipulation”
从全球顶尖研究中脱颖而出
荣获大会最高奖项
杰出论文奖(Outstanding Paper Award)
这是CoRL历史上首次
由全中国籍学者团队摘得该奖项
通研院于25年4月中关村论坛上
正式推出“通智大脑”
并与宇树、乐聚等头部机器人企业
组成“通智大脑联盟”
为不同的机器人本体
赋予类人级别的物理智能
从而解决机器人与实际应用
“最后10厘米问题”
使机器人能真正
走入千家万户
赋能千行百业
在本次获奖论文中
通研院提出了首个力位混合控制算法
能够让机器人在无需力传感器的条件下
同时学习位置与力的控制
可实现位置跟踪、施力、力跟踪
以及柔顺交互等多种操作行为该策略的成功率比仅使用
位置控制的策略提高约39.5%
让机器人不再只是“执行轨迹”
而是真正理解并掌握
与物理世界交互的方式
论文地址:https://arxiv.org/pdf/2505.20829
项目地址:https://unified-force.github.io/
主要作者:通研院研究员智佩渊、通研院-北京邮电大学“通计划”24级联培博士生李佩洋
通讯作者:通研院研究员贾宝雄、通研院具身机器人中心主任黄思远
成果简介
机器人操作任务常需与环境进行接触交互,需同时控制位置和接触力。现有视觉-运动策略多只关注位置或力的控制,忽略了二者的协同。通研院提出首个统一的力位混合控制算法,能够在无需力传感器的条件下,同时学习位置与力的控制。该研究通过强化学习,训练策略从机器人历史状态中估计力,并借助位置与速度调整进行补偿,从而模拟多种位置、力指令及外部扰动。该策略可实现位置跟踪、施力、力跟踪和柔顺交互等多种操作行为。此外,力估计模块引入的接触信息提升了基于轨迹的模仿学习效果,在四项接触丰富的操作任务中,成功率比仅使用位置控制的策略提高约39.5%。
图 1: 本研究提出了一种适用于足式机器人的统一力–位控制策略,可实现位置跟踪、力控制和柔顺控制等多种移动操作行为(上图)。在模仿学习数据采集过程中,策略中训练得到的力估计器能够提供包含力信息的轨迹数据,从而在无需力传感器的情况下提升模型在接触密集型任务中的性能(中图)。在四足机器人和人形机器人上的实验结果均验证了该策略的通用性与鲁棒性(下图)。
研究背景
近年来,视觉–语言–动作模型(VLA)的兴起,让研究者们看到了通用机器人系统的希望。通过规模化的数据和强大的模型结构,VLA 在模拟环境中展现出了惊人的泛化能力:它们似乎能“想象”并执行各种操作任务。但当这些方法真正落地到物理机器人上时,差距却立刻显现出来。
许多任务都包含着复杂的接触:擦黑板时,手臂必须既贴合表面又保持适当的压力;开关柜门时,机器人需要准确感知只有 3 毫米行程的推拉式弹簧机构;拉抽屉时,如果有遮挡,仅凭视觉几乎不可能完成任务;甚至削一根黄瓜,力过小则刀划不动,力过大则会切断或损坏。这些任务都指向一个事实:仅靠位置控制是远远不够的。
机器人需要的不仅是“走到哪里”“手伸到哪里”,还需要理解“该用多大的力”。然而,力传感器在机器人上往往昂贵、笨重或者根本不可用。现有的方法通常要么只考虑位置,要么只考虑力,尤其是对于足式操作机器人来说,还没有工作对两者同时进行建模。于是出现了一个巨大的研究空白:能否让机器人在没有额外力传感器的情况下,学会同时控制力与位置?
研究方法
带着这个问题,本研究提出了 UniFP(Unified Force and Position Control Policy)。这是足式机器人第一个能够在单一框架下统一处理力与位置的控制算法。它的核心灵感来自于阻抗控制。阻抗控制的思想是把机器人末端执行器与环境之间的交互视作一个弹簧–阻尼–质量系统,通过控制偏差来同时调节位置与力。
在 UniFP 中,只考虑末端执行器低速移动的问题,忽略速度和加速度项,把期望的位置、位置指令和力指令、外部的接触力统一写进了一个公式,让策略既能完成轨迹跟随,又能根据接触情况自动调节。同时通过一个力估计器,利用机器人历史状态信息和动作信息估计出受到的合外力。这样一来,机器人不再是“机械地走完路径”,而是能够感知并主动对环境施加力,回应环境。
为了让 UniFP 真正具备鲁棒性,该研究在仿真环境 Isaac Gym 中,通过强化学习对其进行训练。训练过程中,通过不断施加随机外力、随机命令,让策略学会在各种组合情况下的应有表现,并通过tracking reward function进行优化。并加入了各种域随机化操作,这样得到的策略在真实机器人上也能良好迁移。
更进一步,本文利用 UniFP 中的力估计器,提出了一条新的模仿学习的数据采集,任务推理执行管线。现有的数据集几乎都只包含位置轨迹,缺乏接触力信息,导致模仿学习无法覆盖接触任务。而本文提出的力估计器能够在没有传感器的情况下预测外部作用力,并将其与位置一起记录下来。这些“力感知数据”用于模仿学习时,使得策略在接触丰富的任务中表现大幅提升,成功率比基线提高了约 39.5%。
图 2:方法概述。 (a) 通过强化学习训练得到的统一力–位控制策略架构,该策略能够在外部干扰下同时跟踪位置指令和力指令; (b) 利用训练好的控制策略采集机器人轨迹数据,实现无需力传感器的力感知模仿学习; (c) 位置与速度补偿机制示意图; (d) 策略训练阶段中用于模拟多样接触场景的力指令与干扰力采样可视化示意图。
实验与结果
UniFP 策略首先展现出多样的控制能力。在力跟踪模式下,末端会顺应外部扰动并停留在新的位置;
在柔顺控制模式下,策略不仅能够跟踪目标位置,还会根据偏差施加与之成比例的回复力,从而实现类似阻抗控制的柔顺交互;
在力控制模式下机器人可以主动对外施加力,并完成类似重力补偿等任务。
在受到外部冲击时,四足机器人依靠位置与速度补偿机制自动调整运动,保持整体稳定。
这些结果表明,UniFP 不仅能精确执行位置和力的控制指令,还能在外界干扰下保持稳健与安全的交互。
该研究在Unitree B2-Z1四足操控平台和Unitree G1 人形机器人上开展了七项实验任务。在擦黑板任务中,位置控制的策略要么擦不干净,要么用力过大,而 UniFP 能保持稳定的接触压力,把黑板彻底擦干净。在开关柜门任务中,视觉方法根本无法识别微小的推拉式弹簧,而 UniFP 通过力估计器准确地触发开关。在抽屉被遮挡的场景下,基线方法成功率急剧下降到 0.3,而 UniFP 借助力感知将成功率提升到 0.76。
图 3:力感知模仿学习。(a)在擦黑板任务中,经训练的力感知模仿策略所输出的位置指令与力指令的时间序列。其中,“cmd” 代表模仿学习策略的输出,“pred” 代表低层级策略所估计的外力。(b)数据采集过程的可视化展示。(c)在四项任务的 50 次试验中,本文提出的策略与仅基于视觉的基准策略的性能对比。
更令人鼓舞的是,UniFP 并不局限于某一种机器人形态。该研究在人形机器人 Unitree G1上也进行了训练部署,UniFP 同样展现了强大的泛化能力。也就是说,我们第一次拥有了一个能够同时跨任务、跨形态、跨平台的统一力-位控制策略。
意义与展望
UniFP赋能给通智大脑,在执行任务中展示了统一力–位控制的优势,具有很好的柔顺性,在与人协作的任务中会更加安全。同时在接触丰富的任务中,位置与力不是分离的,而是必须被一起考虑的。此外也为未来的研究打开了新的方向:不仅仅是末端执行器,还包括全身的多点接触;不仅仅是简单操作,还包括医疗、康复等需要精细力控的应用。
未来我们可以想象这样的场景:一只四足机器人开门时,用身体支撑住门板,同时用机械臂压下把手;一个人形机器人用细腻的力控执行超声检查、康复训练。这样的机器人不再只是“执行轨迹”,而是真正理解并掌握与物理世界交互的方式。
来源:北京通用人工智能研究院
相关文章
今天(10 月 7 日)凌晨,苹果发布了 iOS 26.1 的第二版 Developer Beta 测试更新,系统版本号为 23B5059e。如果你此...
2025-10-07 0
孩子上了初中后,作业量明显增加,常常要写到晚上十一点。之前用的普通台灯总让孩子抱怨眼睛酸、看字模糊,有时写着写着就会揉眼睛、眨眼睛,作为家长既心疼又焦...
2025-10-07 0
国际机器人学习大会(Conference on Robot Learning, CoRL)是全球AI顶级学术会议之一近年来伴随具身智能热潮该方向的关注...
2025-10-07 0
《开源π对》源于由 Gitee 发起的,为开源项目及其背后的开发者与企业提供全方位的扶持力量,助力开源生态蓬勃发展的 DeepGitee 计划,是为开...
2025-10-07 0
岚皋县佐龙镇塔园粗面岩矿开发利用项目(EPC)工程总承包中标候选人公示项目所在地区:陕西省,安康市规模:本项目位于岚皋县佐龙镇乱石沟村,矿区面积1.9...
2025-10-07 0
近日,荣耀首席影像工程师罗巍分享了 Magic8 Pro 手机的“近视视力表”和“泉州郑成功”拍摄样张,并称该机的确强了不少,加上大王影像的进步,在“...
2025-10-07 0
在数字的潮汐里,我们总以为消息一旦发出,便如飞鸟掠过天空,不留痕迹。可微信,却悄悄为我们留下了一道温柔的退路——“撤回”功能的悄然升级,不声不响地,把...
2025-10-07 0
台积电涨价:一个时代的终结,另一个时代的开始当台积电宣布2纳米晶圆价格将飙升50%,达到3万美元一片时,整个科技行业都应该清醒了:那个依靠芯片制程升级...
2025-10-07 1
发表评论