ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

理想VLA司机大模型:引领AI创新,破解行业难题新篇章

时间:2025-05-08 23:56:29来源:ITBEAR编辑:快讯团队

在近日的一次重大技术分享活动中,理想汽车董事长兼首席执行官李想深入探讨了人工智能(AI)的最新进展,特别是其推出的VLA司机大模型,这一创新技术被视为从动物进化到人类智能模拟的重要里程碑。李想不仅分享了VLA司机大模型的作用、训练方法及其面临的挑战,还谈到了创业和个人成长的深刻见解。

李想将AI工具划分为三个层次:信息工具、辅助工具和生产工具。他指出,当前大多数用户仅将AI作为信息工具,但这类工具往往伴随着大量无效信息,仅具备有限的参考价值。作为辅助工具,AI能够提升效率,例如辅助驾驶系统,但仍需人类参与。然而,李想强调,AI真正的潜力在于成为生产工具,能够独立执行专业任务,显著提高效率与质量。他比喻道,就像人类雇佣司机一样,AI技术最终也将承担类似角色,成为真正的生产工具。

VLA司机大模型的训练过程模拟了人类学习驾驶的过程,包括预训练、后训练和强化训练三个阶段。预训练阶段相当于人类学习交通规则和物理世界的基础知识,通过大量高清视觉和语言数据,训练出云端的基座模型,并转化为车端高效运行的模型。后训练阶段则类似于人类在驾校学习驾驶,通过加入实际驾驶行为数据,将基座模型转变为VLA司机大模型。强化训练则相当于人类在社会中实际驾驶,旨在让VLA司机大模型更加安全、舒适,与人类价值观保持一致,甚至超越人类驾驶水平。

在强化训练中,理想汽车采用了基于人类反馈的强化学习(RLHF)和纯强化学习模型,以确保VLA司机大模型的安全性和舒适性。通过这两部分训练,VLA司机大模型不仅能够遵守交通规则,贴合中国用户的驾驶习惯,还能在复杂交通环境中做出安全、舒适的决策。

VLA司机大模型以“司机智能体”的形式呈现,用户可以通过自然语言与其沟通,就像与人类司机交流一样。简单指令由车端的VLA直接处理,复杂指令则由云端的基座模型解析后再交由VLA处理。这种设计使得VLA司机大模型能够灵活应对各种驾驶场景。

除了专业能力,VLA司机大模型还注重安全性和模型透明度。为了确保其安全性和职业性,理想汽车在强化训练环节投入了大量资源,并组建了超级对齐团队,为司机智能体注入职业素养。同时,为了解决模型的黑盒问题,理想汽车打造了真实、符合物理世界规律的世界模型,使得VLA可以在世界模型中低成本、准确地验证现实问题,有效提升解决问题的效率。

李想表示,判断一个司机智能体是否优秀,关键在于其专业能力、职业能力和构建信任的能力。VLA司机大模型通过训练提升了专业能力,超级对齐增强了职业能力,而理解自然语言和具备记忆能力则提升了构建信任的能力。

在分享中,李想还谈到了理想汽车的技术积累和创新理念。他指出,理想汽车实现从研究、研发到能力表达,再到业务价值转化的快速跃迁,得益于扎实的基本功积累。理想汽车坚持自研,通过技术赋能用户价值。例如,在辅助驾驶方面,理想汽车自研底层推理引擎,使芯片能够运行语言模型,实现了双Orin-X芯片和Thor-U芯片运行同等规模的VLA司机大模型。

李想强调,虽然理想汽车在VLA司机大模型的语言能力研发上受益于开源项目DeepSeek,节省了时间和成本,但理想汽车仍选择加大投入,专注打造适配多场景的自研模型。同时,理想汽车也选择开源自研的汽车操作系统——理想星环OS,回馈社会。

在谈到个人成长和创业心态时,李想表示,创业路上苦多于甜,但他选择保留那些有价值的美好片段,用来激励自己保持正能量。他认为,成长带来能量,关注自我、接受自身的优点和不足,并用成长替代改变是关键。亲密关系同样重要,家人和同事能够相互支撑,形成强大的脑力和心力。

回顾自己的创业经历,李想表示,从高中创办个人网站至今,他的思维方式没有本质变化:遇到问题解决问题,解决别人不愿解决的难题,解决用户的痛点,不断向他人学习。面对AI的发展,李想认为,在AI面前所有的人性都应被保留,因为一切人性都是文化、生命、性格、能力的特质,也是人类真正的生命力所在。

更多热门内容