Copyright 2018-2024 集齐豆 版权所有 京ICP备2018023569号
日前,我们从相关渠道获悉,理想汽车正通过封闭开发模式全力攻坚下一代VLA(视觉-语言-动作)智能驾驶大模型,计划于2025年下半年实现技术落地突破。这项被视为智能驾驶领域年度核心技术竞赛的创新,目前由理想汽车、吉利汽车及元戎启行三家主导推进,各方均试图抢占行业首发优势。
在技术落地层面,VLA面临双重挑战:一方面模型融合需要攻克多模态数据协同难题,另一方面现有车载芯片算力普遍无法满足需求。据悉,理想原计划基于自研"舒马赫"芯片开发,但因流片失败,现转为采用英伟达最新Thor-U MAX计算平台,该芯片单颗算力达1000TOPS,较当前主流的双Orin-X方案(508TOPS)实现性能倍增。
当前智能驾驶系统采用的端到端大模型虽能模拟人类驾驶行为,但仍存在决策黑箱、极端场景失效等局限性。为此,理想去年通过叠加VLM(视觉语言)模型增强复杂场景理解能力——端到端模型负责实时驾驶控制,VLM则作为辅助系统提供语义化环境解析。不过该方案需占用整颗Orin-X芯片算力,且双模型协同效率待提升。
基于2024年Q2财报披露的技术路线,理想正着力将端到端与VLM深度融合为统一VLA架构。革新后的模型将实现多模态能力内化,使语言理解与视觉感知深度耦合,不仅能实时解析交通标志语义,还可预判行人意图等复杂场景,理论上可将接管率降低80%。行业分析认为,这种"感知-决策-执行"的全链路整合,可能成为高阶智能驾驶的终极解决方案。