蔚来世界模型蓄势待发,到底能不能打?

更深刻了解汽车产业变革
出品: 电动星球
作者:毓肥
从上周开始,有关蔚来世界模型 NWM 的传言、感受、推测,就开始在舆论场酝酿。
比如蔚来智能驾驶产品与体验负责人 @Harry_AD,5 月 16 号发布的首个封版体验视频:

也比如 21 号,也就是今天下午传遍各个蔚来车主群、讨论群的「第一梯队」感受:

同时也包括微博上很多博主们,对初版世界模型表现的判断:


观点参差,但有一点是确定的:蔚来世界模型已经蓄势待发。
目前剩下的悬念,就是「到底能不能打?」
尤其是 ADS 4 抢下了「率先发布商用 L3」的舆论阵地,另一边理想 VLA 路线也已经处于发布阶段,蔚来今年能否上演一次「绝地翻盘」?
我们签了保密协议,但今天还是可以根据已有信息简单聊几句。
1. 什么是蔚来世界模型?
世界模型不是蔚来首创的概念,它是人工智能领域一个具有几十年历史的老词。
事实上汽车圈以外,最近最具热度的世界模型,是谷歌发布的 Genie 2,它可以生成多种多样的 3D 世界,任何人都可以在模型内用自己的语言定义一个世界,Genie 2 甚至可以模拟世界内人物的动作。
同理,蔚来 NWM 可以为智驾系统模拟出同一个场景下的不同路况,比如生成左转、右转、直行的不同路况,并生成仿真视频。

基座版 NWM 是一个「训练」大模型,并不是推送到车端的「推理」大模型。基座版的意义在于「生成世界的规则」,而车端的任务则在于「理解世界的规则」。
李斌此前提到,NWM 可以蒸馏到乐道的地平线芯片方案上,同时 NT2 的四 Orin、NT3 的神玑,也都会陆续推送世界模型方案。
@Harry_AD 的官方表态则是:
「现款的乐道车型预计在今年合适的时间,会基于端到端模型进行体验迭代,L60 始终会保持相当的竞争力。 后续乐道品牌也会有基于蔚来世界模型架构的辅助驾驶量产解决方案。」
这意味着蔚来公司的不同车端硬件方案,将来可以共享同样的技术底座。
2. 蔚来世界模型是不是端到端?
理论上,任何生成式 AI 都是端到端——「输入端」到「输出端」。
从特斯拉 2019 年推出高速 NOA 以来,过去六年间所有车企、供应商努力的,都是如何让辅助驾驶端到端的过程更真实、更统一。
而这六年间我们听到过无数营销名词:「全国都能开」、「全国都好开」、「一段式端到端」、「两段式端到端」,本质上都是技术前进路线的一个个节点。
世界模型、基座模型,与端到端、VLA 很难放在同一个维度下讨论。
比如 Waymo 去年 11 月发布的 EMMA,全称就是「自动驾驶端到端多模态模型 End-to-End Multimodal Model for Autonomous Driving」,它的技术原理和 VLA 一致;而 Waymo 表示 EMMA 是基于基座模型 Gemini「开发」的自动驾驶专用模型。
3. 蔚来世界模型能不能打?
从技术原理上看,世界模型拥有更符合「第一性原理」的技术基础。它为辅助驾驶,以及之后的自动驾驶搭建了统一的训练框架,而这个框架符合人类的直觉。
什么直觉?举一反三。
早在 1971 年「Mental Model」概念提出的时候,从认知科学到人工智能学界,都力求打造一个对真实世界完成「认知、推理、决策」全流程的「大脑」。
过程中衍生出一个概念:「反事实推理」,它让深度学习模型拥有回答「what if 如果 ...」问题,也就是「凭空想象可能性」的能力。
举一反三人类与生俱来,但 AI 不行,或者说需要外力。世界模型则成为谷歌、OpenAI 等企业「超越数据」,让 AI 更接近人类直觉的工具。
当然世界模型不一定是最终路线,但遵循人类直觉开发的辅助驾驶功能,已经证明了它的价值。
大家都记得马斯克的名人名言:「你不是靠双眼发射激光在开车」;这句话说完六年后,特斯拉用 FSD V13 向国内新造车证明了第一性原理的含金量。
自动驾驶是否需要激光,还在商榷阶段;但 FSD V13 的能力和体验,感受过的国内各家智驾研发同仁,只能说「一试一个不吱声」。

然而,即使世界模型更符合第一性原理,这并不代表它的第一版体验会很好。
比如 2020 年 10 月底,FSD Beta 正式推送的时候,就曾出现体验明显的倒退;而当马斯克从 FSD V12 迭代到统一高速城区技术栈的 V13 过程中,也曾出现实际表现的螺旋上升。
4. 你能不能违反保密协议?
这个肯定不行,事实上 @Harry_AD 的官方视频,已经可以说明很多问题。
如果就那个视频解读,蔚来正在重新获得辅助驾驶的话语权。而另一方面,强调安全、事故率,也是蔚来一贯的宣传方式。
这里可以举一个类比的例子:比起中国新造车层出不穷的数字竞赛,马斯克基本只会用一种数字宣传特斯拉 Autopilot(FSD)的能力:比如由 NHTSA 美国交通安全局公布的「汽车品牌事故率」。
当然我们也不能让看到这的大家扑个空,最后一句话总结:
NWM 世界模型会定义自动驾驶时代的蔚来,而从第一个版本开始,它就跟以往的 NOP 有了性格、性质的差异。
(完)

