在理想汽车Livis Day软件与具身智能发布会上,CEO李想提出一个引发行业热议的新概念:具身智能汽车是“四位一体”的融合体,集电动车、职业司机、AI计算机与生活助手功能于一身。这一定义不仅重新解构了传统汽车的属性,更将智能汽车的竞争维度从单一功能延伸至生态级能力整合。
发布会次日,CTO谢炎与基座模型负责人詹锟接受深度专访,首次披露理想汽车从车企向具身智能公司转型的核心战略。这场转型以自研芯片马赫M100、基座大模型马赫Mind系列及自动驾驶VLA架构为三大支点,试图构建从硬件到算法的完整技术闭环。
四年前,当理想宣布自研芯片时,业界普遍质疑其可行性。彼时英伟达Orin芯片已成为行业标配,一家成立仅数年的车企挑战芯片巨头被视为冒险之举。谢炎坦言:“若无法实现性能四倍提升且成本更低,自研毫无意义。”团队通过半年技术论证,最终锁定数据流架构这一颠覆性路径——不同于传统冯·诺依曼架构,该方案通过消除指令翻译环节直接处理数据流,理论上可突破算力瓶颈。
数据流架构的研发充满挑战。谢炎透露,其导师高光荣教授六十年代提出的该理论,在通用计算领域长期未获突破。理想团队从AI计算本质出发,重构芯片设计范式,最终在2026年5月实现全球首款动态数据流AI芯片马赫M100量产。这款采用5nm车规级工艺的芯片,单芯算力达1280TOPS,运行效率超82%,搭载双芯的理想L9 Livis整车算力突破2560TOPS,较英伟达Orin-X提升近十倍。
芯片设计过程中,理想打破传统硬件主导模式,建立算法、软件、模型与硬件团队的“篝火会议”协作机制。软件工程师可直接参与硬件架构设计,这种跨层级沟通使芯片设计周期缩短30%,同时确保算力资源与算法需求精准匹配。
在自动驾驶领域,理想提出激进追赶计划:2026年第三季度向AD Max用户推送全新马赫VLA版本,第四季度实现智驾能力全面对标特斯拉FSD V14。詹锟介绍,新一代系统通过扩大模仿学习规模50%、强化学习规模15倍,使模型参数量与计算量均提升10倍。其2.0版本集成3D ViT感知模型,融合激光雷达与视觉数据,可视距离提升50%,多模态计算量较前代增长十倍。
对于自动驾驶技术路线之争,詹锟明确表示视觉应为核心基础:“3D空间感知与环境理解必须依赖视觉,语言模型则用于推理决策与规则理解。”他预测,随着L3/L4级自动驾驶普及,语言模型在处理泛化场景中的作用将愈发关键,但视觉主导的多模态架构仍是长期方向。
在基座模型领域,理想同步发布马赫Mind-Pro与马赫Mind-Edge。前者在指令跟随、长文本理解等基准测试中跻身行业第一梯队,Agent综合能力超越多数主流模型。面对“是否应采用通用基座模型”的质疑,詹锟强调:“汽车场景需要定制化模型,云端通用基模上车时必须裁剪适配,参数量需与芯片完全匹配。”
对于行业热议的“舱驾融合”概念,谢炎提出不同观点:“L3/L4级智驾需要确定性算力资源,强行融合意义有限。”他指出,当前操作系统无法实现舱驾实时资源切换,高端车型更应通过芯片紧密集成提升性能,而非追求单芯片方案。这一判断解释了为何英伟达、理想等企业均未选择芯片级舱驾融合路径。
这场转型背后,是理想对估值逻辑的重构尝试。从传统车企的PE/PB估值体系,转向“硬件+软件”双轮驱动模式,甚至对标SaaS企业估值,需要突破三大关卡:数据流芯片量产稳定性、VLA对FSD的追赶速度,以及资本市场对具身智能商业模式的认可度。谢炎认为,理想的护城河在于垂直整合能力——从芯片架构到操作系统,从编译器到算法模型,形成技术闭环的同时降低BOM成本。
詹锟将汽车视为具身智能的理想载体:“座舱交互、自动驾驶与机械操作三大能力天然集成,基座模型可无缝扩展至物理机器人领域。”但他也承认,从算力达标到创造用户依赖体验,中间横亘着数据闭环效率、算力底座支撑与模型算法突破三重挑战。
当被问及技术路线类比问题时,谢炎强调:“类比只是沟通工具,真正的创新需要原始技术突破。”数据显示,理想团队自2022年以来已发表近200篇论文与技术报告,覆盖芯片、系统、模型等多个领域。这场转型的本质,或许正如李想所言:重新定义智能产品的边界,将汽车从交通工具进化为具有自主生命属性的智能体。
