「VLA是自动驾驶最好的模型方案。」理想汽车自动驾驶研发高级副总裁郎咸朋给出了

飞瑶看汽车啊 2025-12-11 09:59:07

「VLA 是自动驾驶最好的模型方案。」理想汽车自动驾驶研发高级副总裁郎咸朋给出了一个这样的判断,原因有这么几点:第一,端到端的天花板,显而易见。传统端到端本质就像猴子开车,这套模仿学习不具备逻辑思考能力。即便数据规模突破千万级别,依然是「应激反应系统」,而非智能驾驶。比如遇到复杂路况就懵,经常做出不合常理的决策。在桥洞等视线受阻区域,不会像人类司机那样凭经验提前减速。这种「按下葫芦起来瓢」的窘境,根源在于缺乏推理能力。理想曾尝试端到端+VLM 双系统架构,但遇到了新问题——VLM 虽能做深度思考,但推理速度慢,且其决策无法被端到端吸收。这就像两个说不同语言的司机坐在方向盘前,沟通效率极低。第二,VLA 能打破这个认知天花板。VLA 的本质改变是:不再单纯模仿人类驾驶,而是通过生成式方法和仿真环境,主动构造稀缺数据,在仿真中反复试错迭代。VLA 具备思维、沟通、记忆、自主学习四大核心能力——被认为是真正的「司机机大脑」。理想的 VLA 将语言模型和逻辑推理结合,输出的 Token 不是文本,而是轨迹和控制信号。这种生成式范式与 GPT 异曲同工,却能直接驱动车辆行为。更重要的是,VLA 推理帧率达到 10Hz 左右,比之前 VLM 提升三倍多, 彻底解决了「思考慢」的痛点。第三,数据与系统适配是核心壁垒。理想拥有 12 亿公里真实数据,只有在充分了解这些数据的基础上,才能更好生成数据。理想目前拥有 13 EFLOPS 训练平台, 其中 3 EFLOPS 用于推理——等效于 3 万张英伟达 L20 推理卡。世界模型仿真能力, 正是最难复制的技术壁垒。4、VLA 是通往 L4 的唯一路径。李想在三季度业绩会表态:实现 L4 级自动驾驶的汽车就是汽车机器人。而 VLA 成功整合空间智能、语言智能和行为智能,一旦跑通物理世界和数字世界结合的范式,将有望赋能多个行业协同发展。郎咸朋给出了明确的指标:希望辅助驾驶功能下能做到 600 万公里才出一次事故——是人类驾驶安全性的 10 倍。如果将 MPI 提升到 1000 公里, 意味着用户两三个月才需接管一次——这就是 L4 的现实模样。所以郎咸朋说 VLA 是「最好方案」, 并不夸张,它是目前唯一一条能让机器真正「理解」驾驶、而非「模仿」驾驶的技术路径。端到端永远困在数据天花板下,VLA 却能通过强化学习自我进化——这才是具身智能该有的样子。理想高管回应王兴兴质疑

0 阅读:0
飞瑶看汽车啊

飞瑶看汽车啊

感谢大家的关注