news 2026/6/10 16:24:16

世界模型与自动驾驶:最新算法实战项目(特斯拉、视频、OCC等)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
世界模型与自动驾驶:最新算法实战项目(特斯拉、视频、OCC等)

点击下方卡片,关注“自动驾驶之心”公众号

戳我->领取自动驾驶近30个方向学习路线

世界模型,近一年自动驾驶学术界和工业界的热词。很多小伙伴咨询柱哥,有没有一门系统讲解世界模型和自动驾驶的精品课程,筹备了很久终于和大家见面!

我们联合工业界大佬共同开展,先前的《端到端与VLA自动驾驶小班课》备受大家好评,因此我们进一步推出这门世界模型小班课,课程聚焦于通用世界模型、视频生成、OCC生成等世界模型算法,涵盖特斯拉世界模型、李飞飞团队Marble等。欢迎大家加入学习~

早鸟优惠!开课即止~

讲师介绍

Jason:C9本科+QS50 PhD,已发表CCF-A论文2篇,CCF-B论文若干。现任国内TOP主机厂算法专家,目前从事端到端、大模型、世界模型等前沿算法的预研和量产,并已主持和完成多项自动驾驶感知和端到端算法的产品量产交付,拥有丰富的端到端算法研发和实战经验。

课程大纲

这门课程讲如何展开

第一章:世界模型介绍

第一章主要针对自动驾驶世界模型概括性的内容讲解。这一章老师会先复盘世界模型和端到端自动驾驶的联系,接着讲解世界模型的发展历史以及当下的应用案例。然后介绍世界模型有哪些流派:纯仿真的世界模型、仿真+Planning、生成传感器输入、生成感知结果等等流派。每一种流派在当前业界的应用,能解决什么问题,处于自驾的哪个环节。学术界和工业界都在做什么,相关的数据集、评测都有啥。在这一章节为大家一一解答~

第二章:世界模型的背景知识

世界模型的技术栈涉及十分广泛,第二章主要讲解世界模型的基础知识。我们从世界模型的场景表征开始,进一步扩展到Transformer、BEV感知等,在这一章老师会非常细致的带大家学习世界模型涉及到的背景知识,也为后续章节的展开奠定基础。

  • 首先老师会带大家复习下Transformer的基本概念,扩展到视觉Transformer,接着讲解为多模态大模型奠定基础的CLIP和LLAVA;

  • 接着详细介绍BEV感知的基础知识,以及世界模型相关工作中最常见的占用网络Occupancy Network;

  • 之后是扩散模型的理论知识讲解,当前基于扩散模型输出多模轨迹也是学术界和工业界追捧的热点,很多公司都在尝试落地;

  • 然后是世界模型中长提的闭环仿真,NeRF和3DGS,老师重点带大家梳理下核心概念,方便同学们后续自己扩展;

  • 最后讲解其他生成式模型,像VAE、GAN以及Next Token Prediction都是比较常见的生成式方法;

总结来说,第二章的内容是当下世界模型求职面试频率最高的技术关键词!

第三章:通用世界模型探讨

第三章聚焦在大家最关心的通用世界模型和最近自驾的热门工作。李飞飞团队的Marble、DeepMind提出的Genie 3、Meta团队最新的JEPA以及导航世界模型,还有最近业界讨论很广泛的VLA+世界模型算法 - DriveVLA-W0 和 特斯拉ICCV上最新分享的世界模型模拟器。Jason老师会把这些模型的来龙去脉、核心技术以及设计理念都会给大家通透的讲解。

第四章:基于视频生成的世界模型

第四章聚焦在视频生成类的世界模型算法上,也是目前学术界和工业界研究最多的领域。我们从Wayve的经典工作GAIA-1 & GAIA-2开始讲解,扩展到CVR'25 上交的UniScene、商汤的OpenDWM、中科大ICCV'25的工作InstaDrive。兼顾经典工作和最新的前沿进展为大家呈现视频生成类世界模型的领域进展。实战我们选取了商汤开源的OpenDWM为大家细致展开。

第五章:基于OCC的世界模型

第五章则聚焦在另一大类算法上 - OCC生成类的世界模型,三大论文讲解 + 一个项目实战:

  • 清华经典工作OccWorld;

  • 复旦OccLLaMA;

  • 华科ICCV'25中稿的HERMES;

  • 西交最新的II-World。

这类方法不局限于OCC生成一个任务,可以较容易的扩展为自车轨迹规划,从而进一步实现端到端。

第六章:世界模型岗位专题

有了前面五个章节的算法基础,第六章我们聚焦在更高层面的经验输出,这一章都是实打实老师工作多年的经验积累。世界模型在工业界的应用到底如何?行业内的痛点是什么?我们期望世界模型解决什么问题?又如何准备相关岗位的面试,什么内容是公司真正关注的?在这一章都会有答案!

面向人群

  • 需要自备GPU,推荐算力在4090及以上;

  • 一定的自动驾驶领域基础,熟悉自动驾驶的基本模块;

  • 了解transformer大模型、扩散模型、BEV感知等技术的基本概念;

  • 一定的概率论和线性代数基础,熟悉常用的数学运算;

  • 具备一定的python和pytorch语言基础;

学后收获

这门课程是首个面向端到端自动驾驶进阶实战教程,我们期望能够推动端到端在工业界中的落地,助力更多想要加入到自动驾驶行业的同学真正理解端到端。

  • 我们期望学完本课程:学完能够达到1年左右世界模型自动驾驶算法工程师水平;

  • 掌握世界模型技术进展,涵盖视频生成、OCC生成等方法;

  • 对BEV感知、多模态大模型、3DGS、扩散模型等关键技术有更深刻的了解;

  • 可复现II-World、OpenDWM等主流算法框架;

  • 能够将所学应用到项目中,真正搞懂如何设计自己的世界模型;

  • 无论是实习、校招、社招都能从中受益;

课程进度安排

课程开课时间:1.1号,预计两个半月结课。离线视频教学,vip群内答疑+三次线上答疑,答疑时间截止2026.12.31日。

开始解锁时间

对应章节

12.10

第一章

1.1

第二章

1.20

第三章

2.4

第四章

2.24

第五章

3.1

第六章

课程咨询

早鸟拼团!扫码试听
扫码报名!抢占课程名额
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 8:56:37

前蔚来智驾高管加盟新公司

原文链接:蚀刻独家 | 前蔚来智驾高管加盟新公司 点击下方卡片,关注“自动驾驶之心”公众号戳我-> 领取自动驾驶近30个方向学习路线>>自动驾驶前沿信息获取→自动驾驶之心知识星球本文只做学术分享,如有侵权,联系删文某前…

作者头像 李华
网站建设 2026/6/9 22:03:13

量子电路优化难题,R语言如何做到效率提升90%?

第一章:量子电路优化难题概述量子计算作为下一代计算范式的代表,正逐步从理论走向工程实现。然而,在构建高效量子算法的过程中,量子电路的优化成为制约性能提升的关键瓶颈。由于量子比特的相干时间有限、门操作易受噪声干扰&#…

作者头像 李华
网站建设 2026/6/9 21:22:56

揭秘量子纠缠度计算:如何用R语言精准模拟多体系统纠缠行为

第一章:量子纠缠度计算的核心概念量子纠缠是量子力学中最引人入胜的现象之一,描述了两个或多个粒子之间即使相隔遥远仍能瞬间相互影响的状态。在量子信息科学中,衡量这种非经典关联强度的量化指标被称为“纠缠度”。理解纠缠度的计算方法&…

作者头像 李华
网站建设 2026/6/10 2:17:30

26、深入解析GNU Lesser General Public License

深入解析GNU Lesser General Public License 1. 软件许可概述 在软件的世界里,许可协议至关重要,它规定了软件的使用、分发和修改方式。大多数软件许可旨在限制用户分享和修改软件的自由,而GNU通用公共许可(GPL)则致力于保障用户自由分享和修改自由软件的权利,确保软件…

作者头像 李华
网站建设 2026/6/10 11:39:55

KaiGeQQ凶吉每日测试炫酷科技版源码

源码介绍:这是一个科技风格的QQ每日运势测试网页应用,采用科技风设计 科技风格的界面风格,输入QQ号即可测试今日运势!html单页,测试的结果显示内容可以在源码里面修改,评分那些都是随机显示的【主要功能】•…

作者头像 李华