news 2026/7/4 0:16:38

告别漫长等待:3D生成进入“秒时代”!Apple 重新定义实时视图合成

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
告别漫长等待:3D生成进入“秒时代”!Apple 重新定义实时视图合成

告别漫长等待:3D 生成进入“秒时代”!Apple 重新定义实时视图合成

论文标题:Sharp Monocular View Synthesis in Less Than a Second

👉 一键直达论文

👉Lab4AI 大模型实验室论文阅读

✨ 研究背景

在 AR/VR 及互动照片浏览领域,用户迫切需要能从单张照片快速生成高保真、可交互的 3D 场景 。然而,传统的神经渲染技术(如 NeRF)通常需要多张输入图像和耗时的场景优化过程,难以满足实时交互的需求。

另一方面,虽然现有的扩散模型能实现单图转 3D,但其合成时间往往长达数分钟,且在近距离观察时图像细节不够锐利。因此,如何在极低延迟内生成支持实时渲染、且具备摄影级精细度的 3D 表示,是当前的一大技术痛点。

✨ 核心创新

SHARP(Single-image High-Accuracy Real-time Parallax)采用纯回归框架,通过单一前馈神经网络直接回归出 3D 高斯表示 。其关键技术选择包括:

  • 🔍 端到端架构:设计了一个包含预训练编码器、深度解码器和高斯解码器的网络,能够生成约 120 万个高斯基元。
  • 🔍 有状态的深度调整模块:引入学习型的深度调整模块,在训练中通过解决深度估计的不确定性(如透明或反射表面)来提升合成视角的锐度 。
  • 🔍 优化的损失配置:结合了颜色损失、感知损失(LPIPS)、Gram 矩阵损失以及多种正则化项,在确保图像锐利的同时抑制了常见的视觉伪影。
  • 🔍 自监督微调(SSFT):在真实图像上利用模型生成的伪标签进行进一步微调,增强了模型处理复杂视角效果的能力。

✨ 贡献

SHARP 框架通过单前馈神经网络,1 秒内回归 120 万基元 3D 高斯表示,比扩散模型快三个数量级。零样本测试刷新 SOTA,LPIPS(25-34%)、DISTS(21-43%)降低,图像质量提升;搭载深度调整模块与自监督微调策略,解决单目深度估计模糊,保障视角锐度与保真度。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/3 6:17:25

5分钟上手SQLCoder:智能SQL生成器的终极使用指南

5分钟上手SQLCoder:智能SQL生成器的终极使用指南 【免费下载链接】sqlcoder SoTA LLM for converting natural language questions to SQL queries 项目地址: https://gitcode.com/gh_mirrors/sq/sqlcoder 你是否曾经面对复杂的数据库查询需求却不知从何下手…

作者头像 李华
网站建设 2026/7/1 7:21:47

如何快速下载国家中小学智慧教育资源?knowledge-grab完整使用指南

如何快速下载国家中小学智慧教育资源?knowledge-grab完整使用指南 【免费下载链接】knowledge-grab knowledge-grab 是一个基于 Tauri 和 Vue 3 构建的桌面应用程序,方便用户从 国家中小学智慧教育平台 (basic.smartedu.cn) 下载各类教育资源。 项目地…

作者头像 李华
网站建设 2026/7/1 14:02:46

如何通过knowledge-grab实现教育资源的高效管理:一站式解决方案

如何通过knowledge-grab实现教育资源的高效管理:一站式解决方案 【免费下载链接】knowledge-grab knowledge-grab 是一个基于 Tauri 和 Vue 3 构建的桌面应用程序,方便用户从 国家中小学智慧教育平台 (basic.smartedu.cn) 下载各类教育资源。 项目地址…

作者头像 李华
网站建设 2026/7/2 0:08:12

键盘声音魔法师:让普通键盘秒变机械键盘的终极指南

键盘声音魔法师:让普通键盘秒变机械键盘的终极指南 【免费下载链接】mechvibes Mechvibes 项目地址: https://gitcode.com/gh_mirrors/me/mechvibes 还在羡慕机械键盘那清脆悦耳的敲击声吗?现在,无需花费上千元购买机械键盘&#xff0…

作者头像 李华
网站建设 2026/7/2 0:08:10

Open-AutoGLM电脑版下载速度慢如蜗牛?3招提速技巧让你秒下完成

第一章:Open-AutoGLM电脑版下载 获取 Open-AutoGLM 的电脑版是使用该自动化大语言模型工具的第一步。目前官方提供了跨平台支持,用户可在 Windows、macOS 和 Linux 系统上部署运行。 系统要求 操作系统:Windows 10/11 64位、macOS 12、Ubun…

作者头像 李华
网站建设 2026/7/1 16:16:18

Windows文件资源管理器的3D模型预览革命:STL缩略图扩展深度解析

Windows文件资源管理器的3D模型预览革命:STL缩略图扩展深度解析 【免费下载链接】STL-thumbnail Shellextension for Windows File Explorer to show STL thumbnails 项目地址: https://gitcode.com/gh_mirrors/st/STL-thumbnail 还在为海量STL模型文件难以快…

作者头像 李华