点击下方卡片,关注“自动驾驶之心”公众号
戳我->领取自动驾驶近30个方向学习路线
>>直播和内容获取转到 →自动驾驶之心知识星球
点击按钮预约直播
自动驾驶场景下的动态场景重建仍是一项核心难题,其难点在于场景存在显著的时间变化、移动物体干扰以及复杂的场景动态特征。现有前馈式三维模型在静态场景重建中表现出优异性能,却难以有效捕捉场景的动态运动信息。
为解决上述问题,复旦大学联合引望研究团队提出 DynamicVGGT 框架 ——一款将 VGGT 从静态三维感知拓展至动态四维重建的统一前馈式架构,旨在以前馈式三维模型为基础,通过动态且时间一致的方式对三维点云的运动特征进行建模。为此,该框架在共享参考坐标系中联合预测当前帧与未来帧的点云映射,使模型能够通过帧间时间对应关系,隐式学习点云的动态表征。为高效捕捉帧间时间依赖关系,本文设计了运动感知时间注意力模块(MTA),实现对运动连续性的学习;同时构建了动态三维高斯溅射头(DGSHead),在场景流的监督下,通过可学习的运动token预测高斯速度,实现对点云运动的显式建模,并借助连续的三维高斯优化完成动态几何结构的精修。在自动驾驶相关数据集上开展的大量实验表明,DynamicVGGT 在重建精度上显著优于现有方法,能够在复杂的驾驶场景下,实现鲁棒的前馈式四维动态场景重建。
为此,自动驾驶之心很荣幸邀请到文章一作何卓霖做客自动驾驶之心直播间。今晚七点钟,不见不散~
论文标题:DynamicVGGT: Learning Dynamic Point Maps for 4D Scene Reconstruction in Autonomous Driving
论文链接:https://arxiv.org/abs/2603.08254
分享介绍
更多精彩回顾
🚀 直播精华看不够?完整版深度内容已独家上线知识星球「自动驾驶之心」!涵盖所有技术细节、QA及未公开彩蛋。深度解析!
FSD v14里面藏了VLA吗?谁在定义自动驾驶下一代方案:VLA vs WA的一场深入探讨......学术和量产的分歧,技术路线的持续较量!从技术掌舵人的角度一览智驾的十年路....
硬核夜话:和一线量产专家深入聊聊自驾数据闭环工程
干货满满,快来加入
END