news 2026/5/10 22:47:13

阿里达摩院发布具身智能大脑基础模型 RynnBrain:首次赋予机器人时空记忆与物理推理能力

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
阿里达摩院发布具身智能大脑基础模型 RynnBrain:首次赋予机器人时空记忆与物理推理能力

2026年2月10日,阿里巴巴达摩院正式发布其自主研发的具身智能基础模型RynnBrain,并同步开源包含30B MoE 架构模型在内的7个全系列模型,以及全新评测基准RynnBrain-Bench。这一发布标志着具身智能从“动作执行”迈向“认知理解”的关键一步。

两大核心能力:时空记忆 + 物理空间推理

传统具身模型常因缺乏长期记忆而“健忘”,或因脱离物理上下文而产生“幻觉”。RynnBrain 针对性地引入两项基础能力:

  • 时空记忆能力:使机器人能在完整历史轨迹中回溯物体位置、目标区域乃至运动路径,实现全局状态感知。例如,当执行任务A时被临时打断去处理任务B,RynnBrain 能准确记住任务A中断时的空间坐标与时间上下文,并在完成后无缝恢复。

  • 物理空间推理机制:摒弃纯文本推理范式,采用文本描述与空间定位交错进行的策略,确保每一步推理都锚定于真实环境,显著降低幻觉风险 。

技术底座:基于 Qwen3-VL,训练效率翻倍

RynnBrain 在Qwen3-VL 视觉语言模型基础上构建,采用达摩院自研的RynnScale 训练架构,在同等算力资源下训练速度提升2倍。模型训练使用超过2000万对高质量具身交互数据,其中包括专门生成的100万对“第一人称视角”OCR问答数据,用于提升对药瓶标签、门牌号等细粒度物理信息的理解能力 。

性能全面领先:16项SOTA,超越谷歌与英伟达

在权威评测中,RynnBrain 在16项具身开源榜单上刷新纪录(SOTA),涵盖:

  • 环境感知与对象推理
  • 第一人称视觉问答(FPVQA)
  • 三维空间推理
  • 运动轨迹预测

其综合性能已超越谷歌 Gemini Robotics ER 1.5英伟达 Cosmos Reason 2等国际顶尖模型 。

极致高效:30B MoE 模型仅激活 3B 参数

此次开源的RynnBrain-30B-MoE是业界首个采用混合专家(MoE)架构的具身大模型。尽管总参数达30B,但推理时仅激活约3B参数,即可超越72B稠密模型(如Pelican-VL)的效果,大幅降低硬件成本,同时提升机器人动作响应速度与流畅度 。

强可扩展性:数百条数据即可微调出SOTA专用模型

RynnBrain 具备优异的迁移能力。以具身规划任务为例,仅需几百条后训练样本微调,即可获得超越Gemini 3 Pro的性能,轻松达到SOTA水平。这使其有望成为导航、操作、任务规划等下游应用的统一基础模型 。

开源生态:模型 + 基准 + 代码全开放

达摩院此次不仅开源全部7个模型(含基础版与专用版),还发布了RynnBrain-Bench评测基准,首次系统支持时空细粒度具身任务评估,填补行业空白 。

达摩院具身智能实验室负责人赵德丽表示:“RynnBrain 首次实现了大脑对物理世界的深度理解与可靠规划,为‘大小脑分层架构’下的通用具身智能迈出关键一步。”

随着 RynnBrain 的全面开源,具身智能正加速从实验室走向工厂、厨房、物流等真实场景,推动 AI 真正“走进物理世界”。

大模型相关课程:

11.大模型的发展与局限性
21.1 ollama本地快速部署deepseek
31.2 linux本地部署deepseek千问蒸馏版+web对话聊天
41.3 linux本地部署通义万相2.1+deepseek视频生成
51.4 Qwen2.5-Omni全模态大模型部署
61.5 Stable Diffusion中文文生图模型部署
71.6 DeepSeek-OCR部署尝鲜
82.1 从零训练自己的大模型概述
92.2 分词器
102.3 预训练自己的模型
112.4 微调自己的模型
122.5 人类对齐训练自己的模型
133.1 微调训练详解
143.2 Llama-Factory微调训练deepseek-r1实践
153.3 transform+LoRA代码微调deepseek实践
164.1 文生图(Text-to-Image)模型发展史
174.2 文生图GUI训练实践-真人写实生成
184.3 文生图代码训练实践-真人写实生成
195.1 文生视频(Text-to-Video)模型发展史
205.2 文生视频(Text-to-Video)模型训练实践
216.1 目标检测模型的发展史
226.2 YOLO模型训练实践及目标跟踪
231.1 Dify介绍
241.2 Dify安装
251.3 Dify文本生成快速搭建旅游助手
261.4 Dify聊天助手快速搭建智能淘宝店小二
271.5 Dify agent快速搭建爬虫助手
281.6 Dify工作流快速搭建数据可视化助手
291.7 Dify chatflow快速搭建数据查询智能助手
302.1 RAG介绍
312.2 Spring AI-手动实现RAG
322.3 Spring AI-开箱即用完整实践RAG
332.4 LlamaIndex实现RAG
342.5 LlamaIndex构建RAG优化与实践
352.6 LangChain实现RAG企业知识问答助手
362.7 LangChain构建RAG企业知识问答助手实践
373.1 agent核心功能与概念
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 13:17:36

【MySQL】SELECT 优化

文章目录WHERE 条件优化范围优化单部索引范围访问多部索引范围访问索引合并优化三个概念索引下推 (ICP) 优化辨析 IPC 和索引合并和 BTREE 索引外连接优化ORDER BY 优化使用索引进行 order byGROUP BY 优化为什么聚合函数中使用索引列更高效函数调用优化总结避免索引使用不当加…

作者头像 李华
网站建设 2026/5/6 20:10:07

A-Lin「歌迹」巡演成都站三晚顺利收官 多首金曲献唱出道二十周年

2026年2月6日至8日,A-Lin黄丽玲「歌迹Journey」巡演第三站——成都,一连三晚盛大开唱。作为纪念出道二十周年的主题巡演,成都站临近A-Lin出道二十周年纪念日,承载着特殊的纪念意义。三场演出座无虚席,累计近五万歌迷汇…

作者头像 李华
网站建设 2026/4/30 17:55:11

mpip 如何获取Mpi调用的总次数 awk

cat tm | awk $4 ~ /^[0-9]/ {print $1,$4} | awk {sum[$1]$2} END {for (k in sum) print k, sum[k]} Irecv 6720 Barrier 4 Wait 6720 Send 6720 Bcast 4 Reduce 4

作者头像 李华
网站建设 2026/5/9 18:29:05

Modbus RTU转TCP,不换工业设备就能快速实现!

Modbus RTU通信协议作为工业领域的常青树,广泛应用于各类基于RS485/232串口的设备中。 然而,随着工业互联网的发展,SCADA系统、上位机及HMI已逐渐普及以太网架构,甚至实现了向Wi-Fi无线通信的迭代。 在许多工厂中,现有…

作者头像 李华