理想汽车VLA司机大模型：人工智能进化新里程，持续引领行业创新-智能汽车-ITBear科技资讯

在人工智能领域，理想汽车正引领一场深刻的变革。近日，理想汽车董事长兼CEO李想在“理想AI Talk第二季”活动中，深入探讨了人工智能的最新进展，特别是其自研的VLA司机大模型，这一创新技术不仅标志着AI在交通领域的重大突破，也体现了理想汽车对于未来出行的深刻洞察。

李想将AI工具划分为三个层次：信息工具、辅助工具和生产工具。他指出，当前AI大多被用作信息工具，但信息冗杂、效率低下。作为辅助工具，AI虽能提升效率，如辅助驾驶，但仍需人类参与。而真正的突破在于将AI发展为生产工具，能够独立承担专业任务，显著提升效率与质量。VLA司机大模型正是这一愿景的具现，它将AI推向了交通领域的专业生产工具新阶段。

VLA司机大模型的发展并非一蹴而就，而是经历了从“昆虫动物智能”到“哺乳动物智能”，再到“人类智能”的逐步进化。起初，理想汽车依赖规则算法和高精地图实现辅助驾驶，这相当于“昆虫动物智能”。随后，通过引入端到端模型和VLM视觉语言模型，辅助驾驶能力接近“哺乳动物智能”。然而，端到端模型在处理复杂问题和与人类沟通方面存在局限。为此，理想汽车研发了VLA司机大模型，它不仅能通过3D和2D视觉完整感知物理世界，还具备语言理解和思维链推理能力，真正实现了“人类智能”。

VLA司机大模型的训练过程模拟了人类学习驾驶的过程，包括预训练、后训练和强化训练。预训练阶段，通过大量数据训练出云端的VL基座模型，并转化为车端高效运行的端侧模型。后训练阶段，加入动作数据，使VL基座模型转变为VLA司机大模型。强化训练阶段，则通过基于人类反馈的强化学习和世界模型训练，提升模型的安全性和舒适性，使其对齐人类价值观，甚至超越人类驾驶水平。

VLA司机大模型以“司机Agent”的形式呈现，用户可通过自然语言与其沟通，就像与人类司机交流一样。为了确保VLA司机大模型的专业性和安全性，理想汽车在强化训练环节投入大量资源，组建了超级对齐团队，为司机Agent注入职业素养。同时，为解决模型的黑盒问题，理想汽车打造了真实、符合物理世界规律的世界模型，使VLA能够在其中低成本、准确地验证现实问题，提升解决问题的效率。

在人工智能时代，理想汽车坚持自研，从研究、研发到能力表达，再到将能力变成业务价值，每一步都扎实积累。例如，针对英伟达Orin-X芯片无法直接运行语言模型的问题，理想汽车自研底层推理引擎，使芯片能够运行VLM。理想汽车还凭借芯片、控制器设计和自研汽车操作系统等综合能力，实现了双Orin-X芯片和Thor-U芯片运行同等规模的VLA司机大模型。这些努力不仅提升了技术能力，也为用户带来了更好的体验。

在谈及创业和个人成长时，李想表示，创业路上苦多于甜，但他选择保留有价值的美好片段，激励自己保持正能量。他认为，成为更有能量的人的关键在于关注自我，接受自身的优点和不足，并用成长替代改变。同时，他也强调亲密关系的重要性，家人和同事能够形成互补，相互支撑。正是这份积极乐观的心态和团队的支持，让理想汽车能够快速成长为千亿营收规模、百万交付量的新势力企业。

李想还分享了理想汽车在开源方面的贡献。得益于DeepSeek的开源，理想汽车在VLA司机大模型的语言能力研发上取得了显著进展。尽管如此，理想汽车仍选择加大投入，专注打造适配多场景的自研模型。同时，理想汽车也选择开源自研的汽车操作系统——理想星环OS，回馈社会。这一举措不仅体现了理想汽车的技术实力，也展现了其开放共享的精神。