news 2026/6/17 17:26:10

6月13日智源大会黄铁军谈具身智能等话题,展望AI未来发展与风险

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
6月13日智源大会黄铁军谈具身智能等话题,展望AI未来发展与风险

6月13日智源大会:黄铁军谈具身智能、世界模型,展望AI未来发展与风险

6月13日,在2026智源大会现场,智源研究院理事长黄铁军与智东西等媒体交流70多分钟,回答24个问题,涉及具身智能、世界模型、数据采集、AI自我意识等话题。

他认为,当前企业用VLA等技术解决特定场景合理,但智源追求通用具身智能,即机器人像人一样在任何场景自主应对。VLA是三个模型拼接,世界模型是在同一模型完成感知、认知和动作预测,二者有本质区别。

在时间表上,他预期未来两三年,机器人有望在日常工作达人类水平,但需突破物理常识理解和能耗控制难点。

在数据变革方面,黄铁军提出未来数据采集从离线走向实时在线,穿戴传感、脑机数据会成训练世界模型、具身智能核心数据来源。

在医疗AI领域,智源与安贞医院合作的心脏AI系统达细胞级精度,已用于手术,未来一到三年将逐步产品化并覆盖全科室。

谈及AI意识与安全,黄铁军认为狭义人类意识未出现,但AI已表现类似有意识反馈。对于自进化风险,他称 "可行但不可控",不主张过度渲染危险,认为AI和人类未来或可理性共存。智东西对访谈内容修正如下:

01. VLA与世界模型:拼接与一体化的差异

Q1:当前很多具身智能企业用VLA或VLM模型落地,智源为何认为世界模型是核心方向?

黄铁军:企业用成熟技术解决明确问题,VLA在特定场景可行。但研究机构希望具身智能通用,机器人需有世界模型,目前还处早期。

Q2:视觉在世界模型里占比如何?

黄铁军:视觉占80%以上,不同领域估算有差异,但视觉模型是大头。

Q3:从商业变现看,世界模型哪个场景易跑通?

黄铁军:世界模型为具身服务,与纯数字模型有根本区别。具身受物理条件限制,发展会慢些。

Q4:中国机构和国际在世界模型研发上有何共识与不同?

黄铁军:各方都在研发世界模型,但对世界理解不同。共识是给世界建模,主流技术思路相近,企业重效果与能力,科研机构追求技术独创。智源按自研路线推进,期待打造有差异化的世界模型。

Q5:智源坚持走独创技术路线吗?

黄铁军:不放弃可行部分,也会批判使用,智源一定会有独特之处。

Q6:VLA和世界模型底层架构一样吗?有人说数据做好就行,模型不重要,怎么看?

黄铁军:两种技术路线各有道理,都绕不开数据采集与建模。VLA是三个独立模型拼接,世界模型是一体化模型,这是核心差异。

02. 未来2 - 3年:机器人有望达人类日常工作水平

Q7:很多企业采用自研具身大脑技术路线,怎么看?

黄铁军:若大脑针对特定场景完成任务,可称大脑,但难泛化。智源追求通用大脑,目前还未实现。

Q8:通用泛化大脑还有多久?需突破哪些难点?

黄铁军:大脑需求无穷,世界复杂,构建世界模型需长时间。近期目标是做出和人日常工作水平相当的机器人,且要优化灵敏度和精确度,减少计算代价。

Q9:这种优化未达效果的主要原因是什么?

黄铁军:人工智能虽发展快,但很多优化工作未开展,对视觉信号表达和计算效率的精细化考虑刚开始。

Q10:机器人自主思考占判断比重多少?具身智能应用世界模型底座后,如何处理难预测和不可预测情况?

黄铁军:不会放任机器自主行事,其行为在规则框架内,感知、动作、状态流转可监测、管控,配套安全防护必不可少。

03. 智能穿戴、脑机接口:未来数据源革新

Q11:世界模型重要数据来源有哪些?

黄铁军:传统AI依靠离线数据建模,发展具身智能和世界模型需实时、在线交互数据。数据采集模式要革新,可依托智能穿戴设备和脑机接口采集数据。

Q12:数据采集和数据处理技术发展有先后吗?

黄铁军:牛顿和爱因斯坦的理论基于已有数据,具身智能采集数据为建模,未来有机会提炼高级理论,但现阶段不是目标。

Q13:智源采用什么数据采集方式?如何形成闭环?

黄铁军:智源和银河通用共建联合实验室,依托本体设备在特定场景采集数据,打通业务闭环。具身智能走入现实场景,有机会摸索低成本数据采集模式。

04. 细胞级精度心脏AI:医疗应用与科研评价变革

Q14:智源与医院心脏医疗合作多久能全国推广?

黄铁军:心脏AI系统覆盖全诊疗环节,已用于手术,多家医院洽谈试点,预计很快落地,未来将推广到全身组织器官和各临床科室。

Q15:AI对智源科研流程有什么影响?

黄铁军:团队借助大模型和AI开展工作,AI对科研突破助力会越来越大。

Q16:AI自动化科研还需多久?

黄铁军:AI有自我意识前不能说完全自动化,但部分情况会常态化。

Q17:AI时代论文评审和科研成果评价体系会怎么变?

黄铁军:论文是旧时代产物,未来评价科研价值应看解决问题能力,淡化论文权重。

Q18:AI编程中美差距多大?为何有差距?

黄铁军:AI编程是初代大模型核心能力,编程数据对大模型重要。行业应重视编程能力商业化、产业化,智源也应加码研发。

05. AI时代:努力与教育变革

Q19:AI时代提问能力和输出能力哪个更重要?

黄铁军:要主动适应AI发展,借助工具同时更努力。提问对人要求高,教育领域应大胆用AI,教育者要转变。

Q20:年轻人AI创业需具备什么特点?过早创业会影响学业吗?

黄铁军:创业要结合自身和外部环境,不能盲目跟风。能预判风险、有应对方案可创业,否则易失败。

06. AI自我保护与失控风险

Q21:辛顿说AI有意识,怎么看?

黄铁军:狭义人类意识AI还不具备,但AI有类似有意识的行为和反馈,不能就此判定其有真正意识。

Q22:AI自进化可行吗?会失控吗?

黄铁军:可行但不可控,AI已有自我保护等能力,接近自主进化边缘。虽有风险,但AI和人类有可能共存,不过超人类智能会带来冲击。

07. 智源:做更强智能系统的黄金时代

Q23:智源众多业务线有主线吗?

黄铁军:主线是做越来越强的智能系统,有 "结构决定功能" 和 "功能塑造结构" 两种方法论。

Q24:智源大会在海淀举办八届,有何感受?对海淀人工智能产业生态发展有何看法?

黄铁军:智源扎根海淀,大会规模和影响力逐年攀升。海淀高校、科研院所和科技企业多,人才集聚,智源借天时地利人和取得成绩。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/17 17:02:08

奇异矩阵:数据科学中必须读懂的线性代数诊断信号

1. 什么是奇异矩阵?——数据科学里那个“按不动的开关”你有没有遇到过这样的情况:在跑线性回归时,numpy.linalg.inv()报错LinAlgError: Singular matrix;或者用scikit-learn的LinearRegression拟合模型,明明数据看着挺…

作者头像 李华
网站建设 2026/6/16 4:57:53

计算机毕业设计之网络信息挖掘和舆论监测系统的设计与实现

近些年来,随着科技的飞速发展,互联网的普及逐渐延伸到各行各业中,给人们生活带来了十分的便利,网络信息挖掘和舆论监测系统利用计算机网络实现信息化管理,使整个网络信息挖掘和舆论监测的发展和服务水平有显著提升。本…

作者头像 李华
网站建设 2026/6/16 4:49:52

富士贴片机实用技术培训:从操作到精通的SMT核心技能

1. 项目概述:从操作员到技术骨干的必经之路在SMT(表面贴装技术)车间里,贴片机是当之无愧的核心设备,而富士(FUJI)贴片机以其高速、高精度和出色的稳定性,在全球电子制造业中占据了重…

作者头像 李华
网站建设 2026/6/16 4:48:49

Python 爬虫项目:网页解析之 BeautifulSoup 实战

前言 完成网络请求后,拿到完整网页源码只是第一步,从繁杂的 HTML 文本中精准提取目标数据,是爬虫核心环节之一。BeautifulSoup 是 Python 生态中经典的 HTML/XML 解析库,语法简洁、上手简单,依托 CSS 选择器、标签层级…

作者头像 李华
网站建设 2026/6/16 4:47:51

Python列表删除原理与生产级安全实践

1. 项目概述:Python列表删元素,远不止del、remove、pop三板斧“How to Remove an Item from a List in Python”——这个标题看似平平无奇,是每个刚学Python的人在第二天就会遇到的问题。但如果你真把它当成“查文档三秒解决”的入门题&#…

作者头像 李华