理想VLA司机大模型：引领AI创新，破解行业难题新篇章-智能汽车-ITBear科技资讯

在近日的一次重大技术分享活动中，理想汽车董事长兼首席执行官李想深入探讨了人工智能（AI）的最新进展，特别是其推出的VLA司机大模型，这一创新技术被视为从动物进化到人类智能模拟的重要里程碑。李想不仅分享了VLA司机大模型的作用、训练方法及其面临的挑战，还谈到了创业和个人成长的深刻见解。

李想将AI工具划分为三个层次：信息工具、辅助工具和生产工具。他指出，当前大多数用户仅将AI作为信息工具，但这类工具往往伴随着大量无效信息，仅具备有限的参考价值。作为辅助工具，AI能够提升效率，例如辅助驾驶系统，但仍需人类参与。然而，李想强调，AI真正的潜力在于成为生产工具，能够独立执行专业任务，显著提高效率与质量。他比喻道，就像人类雇佣司机一样，AI技术最终也将承担类似角色，成为真正的生产工具。

VLA司机大模型的训练过程模拟了人类学习驾驶的过程，包括预训练、后训练和强化训练三个阶段。预训练阶段相当于人类学习交通规则和物理世界的基础知识，通过大量高清视觉和语言数据，训练出云端的基座模型，并转化为车端高效运行的模型。后训练阶段则类似于人类在驾校学习驾驶，通过加入实际驾驶行为数据，将基座模型转变为VLA司机大模型。强化训练则相当于人类在社会中实际驾驶，旨在让VLA司机大模型更加安全、舒适，与人类价值观保持一致，甚至超越人类驾驶水平。

在强化训练中，理想汽车采用了基于人类反馈的强化学习（RLHF）和纯强化学习模型，以确保VLA司机大模型的安全性和舒适性。通过这两部分训练，VLA司机大模型不仅能够遵守交通规则，贴合中国用户的驾驶习惯，还能在复杂交通环境中做出安全、舒适的决策。

VLA司机大模型以“司机智能体”的形式呈现，用户可以通过自然语言与其沟通，就像与人类司机交流一样。简单指令由车端的VLA直接处理，复杂指令则由云端的基座模型解析后再交由VLA处理。这种设计使得VLA司机大模型能够灵活应对各种驾驶场景。

除了专业能力，VLA司机大模型还注重安全性和模型透明度。为了确保其安全性和职业性，理想汽车在强化训练环节投入了大量资源，并组建了超级对齐团队，为司机智能体注入职业素养。同时，为了解决模型的黑盒问题，理想汽车打造了真实、符合物理世界规律的世界模型，使得VLA可以在世界模型中低成本、准确地验证现实问题，有效提升解决问题的效率。

李想表示，判断一个司机智能体是否优秀，关键在于其专业能力、职业能力和构建信任的能力。VLA司机大模型通过训练提升了专业能力，超级对齐增强了职业能力，而理解自然语言和具备记忆能力则提升了构建信任的能力。

在分享中，李想还谈到了理想汽车的技术积累和创新理念。他指出，理想汽车实现从研究、研发到能力表达，再到业务价值转化的快速跃迁，得益于扎实的基本功积累。理想汽车坚持自研，通过技术赋能用户价值。例如，在辅助驾驶方面，理想汽车自研底层推理引擎，使芯片能够运行语言模型，实现了双Orin-X芯片和Thor-U芯片运行同等规模的VLA司机大模型。

李想强调，虽然理想汽车在VLA司机大模型的语言能力研发上受益于开源项目DeepSeek，节省了时间和成本，但理想汽车仍选择加大投入，专注打造适配多场景的自研模型。同时，理想汽车也选择开源自研的汽车操作系统——理想星环OS，回馈社会。

在谈到个人成长和创业心态时，李想表示，创业路上苦多于甜，但他选择保留那些有价值的美好片段，用来激励自己保持正能量。他认为，成长带来能量，关注自我、接受自身的优点和不足，并用成长替代改变是关键。亲密关系同样重要，家人和同事能够相互支撑，形成强大的脑力和心力。

回顾自己的创业经历，李想表示，从高中创办个人网站至今，他的思维方式没有本质变化：遇到问题解决问题，解决别人不愿解决的难题，解决用户的痛点，不断向他人学习。面对AI的发展，李想认为，在AI面前所有的人性都应被保留，因为一切人性都是文化、生命、性格、能力的特质，也是人类真正的生命力所在。