在近期的一次重大科技分享活动中,理想汽车董事长兼首席执行官李想,深度剖析了人工智能(AI)的未来发展路径,特别是理想汽车自主研发的VLA司机大模型,这一创新成果标志着理想汽车在AI技术应用上的重大突破。
李想将AI的应用划分为三个层次:信息工具、辅助工具及生产工具。他指出,当前AI主要作为信息工具存在,但其提供的信息往往掺杂大量无效内容,仅具有有限的参考价值。作为辅助工具时,AI能够提升工作效率,如辅助驾驶系统,但仍需人类监控。而AI真正成为生产工具时,将能够独立完成专业任务,显著提升效率与质量,这一愿景与李想提出的“AI司机”概念不谋而合。
“AI能否成为真正的智能体,关键在于它能否作为生产工具存在。”李想强调,“正如人类会雇佣司机,AI技术也将承担类似角色,成为真正的生产力。”
VLA司机大模型的训练过程,模拟了人类学习驾驶的三个阶段:预训练、后训练和强化训练。预训练阶段,模型通过大量高清视觉数据和语言语料,学习物理世界和交通领域的常识。后训练阶段,加入动作数据,模型从理论走向实践,初步具备驾驶能力。强化训练阶段,则通过模拟真实驾驶环境和人类反馈,进一步提升模型的安全性和舒适性,使其驾驶水平甚至超越人类。
VLA司机大模型以“司机智能体”的形态呈现,用户可以通过自然语言与其沟通,如同与真实司机对话。简单指令由车载模型即时处理,复杂指令则通过云端解析后执行,确保了高效且流畅的交互体验。
在安全性方面,理想汽车投入大量资源,组建了专业的超级对齐团队,确保VLA司机大模型遵守交通规则,贴合中国用户的驾驶习惯,避免学习不良驾驶行为。同时,通过打造真实、符合物理规律的世界模型,理想汽车有效解决了AI模型的黑盒问题,提升了解决问题的效率和准确性。
李想认为,一个优秀的AI司机,应具备专业能力、职业能力和构建信任的能力。VLA司机大模型通过先进的训练方法和强化学习,不仅提升了专业能力,还通过超级对齐增强了职业能力,并通过理解自然语言、具备记忆能力,提升了构建信任的能力。
理想汽车坚持自研道路,通过技术赋能用户价值。在辅助驾驶领域,面对英伟达Orin-X芯片无法直接运行语言模型的挑战,理想汽车依托自研的底层推理引擎,使芯片能够高效运行VLM。同时,凭借在芯片、控制器设计和汽车操作系统等方面的综合能力,理想汽车实现了双Orin-X芯片和Thor-U芯片运行同等规模的VLA司机大模型。
李想分享道,理想汽车在VLA司机大模型的语言能力研发上,得益于DeepSeek的开源,取得了显著进展,节省了时间和成本。但理想汽车并未止步,而是选择加大投入,专注打造适配多场景的自研模型。
谈及个人成长和企业发展,李想表示,创业路上虽然充满挑战,但他选择保持乐观态度,将挑战视为成长的机会。他认为,成长意味着增强能力,而关注自我和亲密关系同样重要。家人和同事能够形成互补,相互支撑,共同面对挑战。
李想还提到,从高中创办个人网站至今,他的思维方式始终如一:遇到问题解决问题,解决他人不愿解决的难题,解决用户的痛点。面对AI的发展,他强调应保留所有人性特质,因为这正是人类真正的生命力所在。理想汽车将继续以技术创新为驱动,不断挑战成长的极限,为行业和用户创造更多价值。