news 2026/4/17 20:06:45

灵巧操作的“强力之躯”:Franka Research 3 在 GR-Dexter 通用机器人系统中的深度应用

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
灵巧操作的“强力之躯”:Franka Research 3 在 GR-Dexter 通用机器人系统中的深度应用

在具身智能(Embodied AI)的浪潮中,如何让机器人像人一样灵活地处理复杂、多变的日常任务,是学术界与工业界的共同目标。字节跳动Seed团队近日发布的GR-Dexter技术报告,展示了一个集成了先进硬件、直观遥操作和大规模视觉-语言-动作(VLA)模型的通用操作框架。而在这一庞大系统中,Franka Research 3 (FR3) 机械臂不仅是整个系统的物理支柱,更是实现高精度、高动态响应灵巧操作的核心载体。

硬件协同:FR3与21自由度灵巧手的”合体操作

GR-Dexter系统采用了一套极具竞争力的双臂灵巧操作平台。其核心架构由两台Franka Research 3 (FR3)机械臂组成,每台机械臂末端集成了一只ByteDexter V2灵巧手。

FR3 的角色:宏观定位与动力支撑

FR3作为经典的7自由度协作机器人,以其高灵敏度的力反馈和开放的控制接口闻名。在 GR-Dexter 中,两台 FR3 构成了系统的“大臂”,负责在三维空间内进行大范围的位姿调整。

  • 空间触达FR3的7自由度设计确保了末端灵巧手能够以最优的角度进入受限空间(如抽屉内部、密集的桌面)。

  • 力控优势:利用FR3内置的力传感器,系统能够实现精准的重力补偿和顺从控制,这对于保护脆弱的灵巧手硬件至关重要。

1:展示GR-Dexter 的整体硬件设置。

56 自由度的复杂系统

单侧系统由“7 自由度FR3+21自由度灵巧手”组成,双侧总计拥有56个主动自由度。这种配置极大地扩张了机器人的动作空间(Action Space),使其不仅能完成简单的“抓取-放置”,更能完成如“捏起化妆刷”、“旋转盖子”等需要极高协调性的任务。

PART.02

遥操作:人类智慧向FR3的实时映射

为了训练复杂的VLA 模型,高质量的专家数据必不可少。GR-Dexter 开发了一套基于 VR 设备的直观遥操作界面,将 FR3 的潜力发挥到了极致。

实时动作重定位(Retargeting)

操作员穿戴Meta Quest VR 头显和 Manus 触觉手套。系统需要将人类的动作实时转化为 FR3 关节指令。

  • 位姿对齐:系统将操作员的腕部位置映射为FR3 的末端执行器位姿。

  • 避障与优化:为了防止FR3 在剧烈运动中发生自碰撞或超越运动限制,研究团队采用顺序二次规划(SQP)算法,在毫秒级时间内求解最优关节路径。

2:遥操作系统的示意图。

PART.03

数据驱动:FR3的多模态学习进化

FR3的表现并非仅仅依靠预设程序,而是通过“数据金字塔”进行驱动。

  • FR3真实轨迹数据:团队利用遥操作采集了约20小时、包含各种复杂日常场景(如清理化妆台、吸尘)的高质量数据。

  • 跨具身数据迁移(Cross-Embodiment):这是报告的一大亮点。通过算法将其他机器人平台(如ALOHA或2自由度夹持器)的数据“重定位”到FR3平台上。

  • 互联网级视觉语言数据:通过让模型学习人类视频,FR3获取了对物理世界(如“什么是杯子”、“如何推开门”)的常识性理解。

模型架构:驱动FR3的4B参数“大脑”

GR-Dexter采用了一个拥有40亿参数的VLA模型。该模型将四台摄像头(其中三台俯瞰FR3工作区,一台固定在FR3基座上方)捕获的视觉信息与语言指令相结合,实时输出FR3的关节动作。

动作空间的精细控制

模型输出的动作向量包含88维,其中:

  • 14维用于控制两台FR3的关节角度。

  • 12维用于控制FR3的末端位姿增量。

  • 其余维数控制灵巧手的每一个手指关节。

这种深度集成的控制方式,使得FR3能够与灵巧手形成“手眼协同”,在感知到物体滑移时,FR3能够迅速做出位姿微调以稳固抓取。

3:模型架构图。左侧输入多视角图像和指令,中间经过Transformer结构,右侧输出FR3关节和手部动作的Action Chunk。

PART.04

实战考核:FR3在复杂任务中的卓越表现

在真实世界测试中,基于FR3的GR-Dexter系统展现了惊人的泛化能力。

长程任务:清理化妆台

在这一任务中,FR3需要在凌乱的桌面中识别出化妆刷、调色盘,并逐一将其放入指定的收纳盒。实验结果显示,即使在面对未见过的(OOD)物体布局时,FR3 依然能保持近90%的成功率。

复杂工具使用:吸尘与协作

  • 单臂任务:FR3驱动灵巧手抓握吸尘器,并精准地用拇指按下开关,随后在桌面进行往复式清扫。

  • 双臂协作:一台FR3稳稳托住托盘,另一台 FR3使用夹子将面包精准地放置到托盘中心。这种高动态的力学交互充分证明了FR3在负载平衡与同步控制上的优异性能。

4:一系列任务演示拼图。包括FR3抓取吸尘器、FR3整理化妆品、以及双臂协作分发面包的实拍图。

结语

GR-Dexter框架证明了,依托于Franka Research 3机械臂这一成熟的科研平台,结合高自由度的自主研发灵巧手和多源数据共同训练的VLA模型,机器人可以实现从简单的夹持向人类级灵巧操作的跨越 。

FR3机械臂在这一过程中不仅提供了基础的运动能力,更通过其高精度的控制接口和力反馈特性,成为了连接AI算法与物理世界的高效纽带。

项目链接:https://byte-dexter.github.io/gr-dexter/

原论文:https://arxiv.org/abs/2512.24210

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/17 14:08:50

[C++][cmake]基于C++在windows上部署yolo26的目标检测onnx模型

yolo26已经正式发布了,第一时间手搓C代码实现YOLO26部署,首先看yolov11网络结构,发现输出shape是1x84x8400 再看看YOLO26网络结构: 可见yolo11和yolo26输出是不一样的是不能共用代码。 模型使用官方yolo26n.pt转换成的onnx&#…

作者头像 李华
网站建设 2026/4/17 23:49:20

【拯救HMI】HMI设计中的色彩与视觉语言

一、色彩在HMI设计中的作用色彩是HMI设计中最有力的视觉效果,它不仅影响界面工具的美观性,更在信息传达、用户引导、情感表达等方面发挥关键作用。信息传递功能:色彩是传递信息最快速的方式。在工业控制系统中,红色通常表示快速警…

作者头像 李华
网站建设 2026/4/17 7:59:40

微软VC运行库合集2005-2026合集 解决软件故障的必备工具

在使用电脑系统时经常会出现丢失找不到某些文件的情况,由于很多常用软件都是采用 Microsoft Visual Studio 编写的,所以这类软件的运行需要依赖微软Visual C运行库,比如像 QQ、迅雷、Adobe 软件等等,如果没有安装VC运行库或者安装…

作者头像 李华
网站建设 2026/4/17 21:17:47

30页精品可编辑PPT | AI_Agent在业务增长中的落地实践

在海外业务迅猛扩张的背景下,公司面临着巨大的客服挑战。由于客户数量的急剧增长和客服资源相对匮乏,客户服务的响应速度显著下降,导致客户体验不佳。新员工的培训跟不上,人员流动性大,夜班无人替补,基础问…

作者头像 李华
网站建设 2026/4/17 3:52:20

千问APP接入淘宝闪购后,为什么说外卖行业竞争形势“高下已判”

出品 | 何玺排版 | 叶媛“AI点外卖“真的来了!1月15日,阿里巴巴召开千问App发布会,宣布全面接入淘宝闪购和支付宝AI付等阿里生态。其中,千问App与淘宝闪购、支付宝"AI付"完成深度整合,用户在授权前提下可在对…

作者头像 李华