news 2026/6/25 15:26:22

HumanEgo 论文主实验硬件解析:Trossen WidowX AI 双臂工作站实操方案

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
HumanEgo 论文主实验硬件解析:Trossen WidowX AI 双臂工作站实操方案

当前视觉操作(VLA)、具身模仿学习算法普遍存在数据采集门槛高的问题:主流训练方案依赖大量机器人遥操作轨迹,单套双臂设备采集数十小时数据,人力与硬件损耗成本高昂;同时算法高度绑定特定机械臂,跨设备零样本泛化能力薄弱。马里兰大学发表相关 HumanEgo 框架给出全新解法,主实验真实场景验证基于 Trossen Robotics WidowX AI 双臂工作站(Stationary AI 套件)完成。

一、HumanEgo 框架核心技术链路

HumanEgo 核心逻辑是彻底脱离机器人采集环节,仅使用普通人佩戴 Meta Aria 智能眼镜(MPS 感知管线)录制分钟级第一视角视频训练操作策略:

1.数据采集端:Meta Aria 内置 MPS 感知管线,原生输出高精度 6DoF 相机 SLAM 轨迹、21 点手部三维关键点、同步 RGB 画面,无需实验室标定,居家场景即可完成倒水、收纳、取物等任务演示;

2.算法核心创新:提出交互中心 Token (ICT) 表征,剥离相机、机械臂运动学差异,只保留手与物体的相对空间关系;搭配多稠密辅助目标流匹配策略,充分挖掘少量人类视频内监督信号;

3.量化实验结果:仅 15 分钟人类演示视频平均任务成功率 75%,30 分钟数据可达 92.5%,同等时长下性能超越遥操作基线 41%,支持跨 WidowX AI、UR10、Franka 三类机械零样本泛化。

二、实验真机硬件:Trossen WidowX

论文四组居家实操任务均采用两台 WidowX AI 组成Stationary AI双臂工作台:

1.单臂硬件参数:6 自由度串联结构,配套平行夹爪末端执行器,最大有效载荷 1.5kg,末端重复定位精度 ±1mm;

2.实验部署方案:工作台上方架设 Intel RealSense D405 作为全局唯一视觉输入,全程未启用机械腕部相机,严格复现算法纯全局视觉训练逻辑;

3.平台适配优势:开源底层控制接口,兼容 MuJoCo、ROS、各类视觉大模型,是可开展双臂模仿学习对照实验的常用科研硬件。

三、算法与硬件协同科研价值

HumanEgo 框架具备硬件无关特性,训练完成的策略可零样本迁移至 WidowX AI、Franka、UR10 多类机械臂;对于课题组而言,搭配 Trossen WidowX AI 双臂设备,可大幅缩减机器人数据集采集周期,快速迭代居家柔性抓取、多物体整理类具身 AI 模型。

论文 arXiv 查阅链接:https://arxiv.org/abs/2605.24934

欢迎关注 “欣佰特科技” ,持续为大家带来 “具身智能领域” 前沿技术及应用!详情可邮件咨询sales@cnbestec.com

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/25 15:23:53

FMPy:统一多平台FMU仿真与系统建模的Python解决方案

FMPy:统一多平台FMU仿真与系统建模的Python解决方案 【免费下载链接】FMPy Simulate Functional Mock-up Units (FMUs) in Python 项目地址: https://gitcode.com/gh_mirrors/fm/FMPy FMPy作为一款功能强大的Python库,为工程师和研究人员提供了功…

作者头像 李华
网站建设 2026/6/25 15:21:53

调试器 netcoredbg 跨平台及其 LoongArch 架构支持进展

项目概述与核心定位1.1 基本属性1.1.1 开源主体与实现语言netcoredbg 是由 三星电子(Samsung Electronics) 主导并开源的跨平台 .NET 调试器项目,其核心技术栈基于 C 语言 实现。该项目托管于 GitHub 平台(https://github.com/Sam…

作者头像 李华
网站建设 2026/6/25 15:20:13

支付逻辑漏洞深度剖析:从业务安全原理到实战挖掘与修复

1. 项目概述:从一次实战到原理通解最近在复盘一些安全测试项目时,翻到了一个挺有意思的案例,正好结合“支付逻辑漏洞”这个老生常谈却又屡见不鲜的话题,和大家深入聊聊。那次测试的目标是一个电商平台,我并非通过什么高…

作者头像 李华
网站建设 2026/6/25 15:19:50

Input Leap架构解析:跨平台KVM软件的核心实现与分布式输入管理

Input Leap架构解析:跨平台KVM软件的核心实现与分布式输入管理 【免费下载链接】input-leap Open-source KVM software 项目地址: https://gitcode.com/gh_mirrors/in/input-leap 在现代多设备工作环境中,开发者和技术专家面临着一个普遍的技术挑…

作者头像 李华
网站建设 2026/6/25 15:19:03

Koin:Kotlin 依赖注入的务实选择

文章目录Koin:Kotlin 依赖注入的务实选择1、解决什么问题2、编译期安全检查3、Kotlin Multiplatform 支持4、配套工具5、企业级支持6、适合什么场景Koin:Kotlin 依赖注入的务实选择 Koin 在 GitHub 上已经拿到 9,988 Star 了。 这是一个面向 Kotlin 开发…

作者头像 李华