news 2026/6/9 17:53:36

交互式世界建模新方案!腾讯混元发布世界模型WorldPlay,兼顾实时生成与长期几何一致性;5万条样本!Med-Banana-50K支持增删病灶双向编辑

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
交互式世界建模新方案!腾讯混元发布世界模型WorldPlay,兼顾实时生成与长期几何一致性;5万条样本!Med-Banana-50K支持增删病灶双向编辑

世界模型正驱动计算智能领域的重心逐渐从语言任务拓展至视觉与空间推理,通过构建动态三维环境的模拟能力,这些模型使智能体得以感知并与复杂场景交互,从而为具身智能、游戏开发等领域开启了新的研究与应用前景。世界模型的前沿正聚焦于实时交互式视频生成,尽管已取得显著进展,但如何同时达成实时生成的低延迟与长期几何的高一致性,仍然是该领域悬而未决的关键问题。

基于此,腾讯混元团队推出了世界模型 WorldPlay,能够实现实时、交互式的世界建模,并保持长期的几何一致性,从而有效解决了现有方法在生成速度与内存占用之间的固有权衡。该系统的实现包括三项关键技术创新:

*双重动作表示法:采用双重动作表示,实现对用户键盘与鼠标输入的稳健动作控制,确保交互响应的准确性与稳定性。

*重构上下文记忆机制:为保障长期一致性,该模型设计了一种动态重构上下文记忆模块,能够重建历史帧的上下文信息,并通过时间重构策略,保持几何关键但时间久远的帧仍可被访问,从而显著缓解记忆衰减问题。

*情境强迫(Context Forcing)蒸馏方法:研究团队提出了一种专为记忆感知模型设计的新型蒸馏方法,称之为「情境强迫」。该方法通过对齐教师模型与学生模型之间的记忆上下文,使学生模型在保持实时推理速度的同时,不丧失利用远程信息的能力,有效抑制误差偏移。

WorldPlay 能够以 24 FPS 的速率稳定生成长序列、720p 的高清流媒体视频,在多项指标上优于现有技术,并在多样化场景中展现出优秀的泛化能力。通过提供系统化的控制、记忆和提炼框架,WorldPlay 在创建实时且一致的世界模型领域迈出了关键一步。

目前,HyperAI超神经官网已上线了「HY-World 1.5: 交互式世界建模系统框架」,快来试试吧~

在线使用:https://go.hyper.ai/Dgd3Z

12 月 29 日-1 月 2 日,hyper.ai 官网更新速览:

  • 优质教程精选:3 个

  • 热门百科词条:5 条

  • 1 月截稿顶会:10 个

访问官网:hyper.ai

公共教程精选

1. HY-World 1.5: 交互式世界建模系统框架

HY-World 1.5(WorldPlay)是腾讯混元团队发布的首个具有长期几何一致性的开源实时交互世界模型。该模型通过流式视频扩散技术实现实时交互世界建模,解决了当前方法中速度与内存之间的权衡问题。

在线运行:https://go.hyper.ai/Dgd3Z



Demo 页面

2. Maya1:高真实感情感语音生成服务

Maya1 是由 Maya Research 发布的一款高保真情感文本转语音(TTS)模型,专为高质量的语音合成任务设计,具有丰富的情感表达和可控的语音风格。该模型专注于通过自然语言描述准确建模说话者的情绪状态、说话速度、语调、音色和表现力,能够生成高度逼真的语音输出,极其接近人类表达。

在线运行:https://go.hyper.ai/RmmI3

效果示例

3. RFdiffusion3:蛋白质设计模型

RFdiffusion3(RFD3)是华盛顿大学蛋白质设计研究所发布的一个模型。这一最先进的生物设计 AI 模型能够生成几乎与活细胞中任何分子相互作用的新型蛋白质,解决了长期以来令蛋白质工程师感到沮丧的研究难题。

效果示例

在线运行:https://go.hyper.ai/gv4Rz

热门百科词条精选

1. 每秒帧数 Frames Per Second (FPS)

2. 双向长短期记忆 Bi-LSTM

3. 门控注意力 Gated Attention

4. 具身导航 Embodied Navigation

5. 门控循环单元 Gated Recurrent Unit

这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:

https://go.hyper.ai/wiki

一站式追踪人工智能学术顶会:https://go.hyper.ai/event

以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!

下周再见!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/8 11:32:01

虚拟机安装麒麟操作系统如何重置root密码

最近我们主要学习的是关于如何在虚拟机里面使用麒麟操作系统进行相关的学习。其中,麒麟操作系统属于国产操作系统,它其实和类似于 Ubuntu、CentOS 这样主流的 Linux 操作系统操作起来没有太大的区别。 但是我在实践的过程中遇到了如下的问题:…

作者头像 李华
网站建设 2026/6/4 19:54:47

为什么你的Bonding总是单线跑?一文讲透layer2/layer2+3/layer3+4

文章目录前言一、Linux Bonding驱动底层架构简述二、Hash Policy三、 策略解析(layer2 / layer23 / layer34)1.layer22.layer233.layer34四、 底层实现细节(以Kernel源码为例)总结前言 今天同事在部署环境的时候遇到了一个奇怪的…

作者头像 李华
网站建设 2026/6/8 20:14:29

大数据领域数据交易的商业模式探讨

大数据领域数据交易的商业模式探讨:解锁数据价值新密码 关键词:大数据、数据交易、商业模式、数据安全、数据隐私、数据市场、数据应用 摘要:在当今数字化时代,数据已成为一种极具价值的资产。大数据领域的数据交易如同一片新兴的商业蓝海,吸引着众多参与者。本文将深入…

作者头像 李华
网站建设 2026/6/9 5:11:45

鸿蒙生态再落一子,广汽集团与华为终端达成全面合作

云开发 在鸿蒙操终端设备数量突破3600万台、生态发展进入快车道之际,鸿蒙生态今日再次迎来汽车产业的重量级合作伙伴。1月5日,华为常务董事、产品投资评审委员会主任、终端BG董事长余承东带队访问广汽集团番禺总部,并与广汽集团董事长冯兴亚等…

作者头像 李华
网站建设 2026/6/8 18:51:53

计算机深度学习毕设实战-基于python深度学习的树叶健康识别机器学习

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华