ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

理想汽车VLA司机大模型:人工智能进化新里程,持续引领行业创新

时间:2025-05-10 12:01:58来源:ITBEAR编辑:快讯团队

在人工智能领域,理想汽车正引领一场深刻的变革。近日,理想汽车董事长兼CEO李想在“理想AI Talk第二季”活动中,深入探讨了人工智能的最新进展,特别是其自研的VLA司机大模型,这一创新技术不仅标志着AI在交通领域的重大突破,也体现了理想汽车对于未来出行的深刻洞察。

李想将AI工具划分为三个层次:信息工具、辅助工具和生产工具。他指出,当前AI大多被用作信息工具,但信息冗杂、效率低下。作为辅助工具,AI虽能提升效率,如辅助驾驶,但仍需人类参与。而真正的突破在于将AI发展为生产工具,能够独立承担专业任务,显著提升效率与质量。VLA司机大模型正是这一愿景的具现,它将AI推向了交通领域的专业生产工具新阶段。

VLA司机大模型的发展并非一蹴而就,而是经历了从“昆虫动物智能”到“哺乳动物智能”,再到“人类智能”的逐步进化。起初,理想汽车依赖规则算法和高精地图实现辅助驾驶,这相当于“昆虫动物智能”。随后,通过引入端到端模型和VLM视觉语言模型,辅助驾驶能力接近“哺乳动物智能”。然而,端到端模型在处理复杂问题和与人类沟通方面存在局限。为此,理想汽车研发了VLA司机大模型,它不仅能通过3D和2D视觉完整感知物理世界,还具备语言理解和思维链推理能力,真正实现了“人类智能”。

VLA司机大模型的训练过程模拟了人类学习驾驶的过程,包括预训练、后训练和强化训练。预训练阶段,通过大量数据训练出云端的VL基座模型,并转化为车端高效运行的端侧模型。后训练阶段,加入动作数据,使VL基座模型转变为VLA司机大模型。强化训练阶段,则通过基于人类反馈的强化学习和世界模型训练,提升模型的安全性和舒适性,使其对齐人类价值观,甚至超越人类驾驶水平。

VLA司机大模型以“司机Agent”的形式呈现,用户可通过自然语言与其沟通,就像与人类司机交流一样。为了确保VLA司机大模型的专业性和安全性,理想汽车在强化训练环节投入大量资源,组建了超级对齐团队,为司机Agent注入职业素养。同时,为解决模型的黑盒问题,理想汽车打造了真实、符合物理世界规律的世界模型,使VLA能够在其中低成本、准确地验证现实问题,提升解决问题的效率。

在人工智能时代,理想汽车坚持自研,从研究、研发到能力表达,再到将能力变成业务价值,每一步都扎实积累。例如,针对英伟达Orin-X芯片无法直接运行语言模型的问题,理想汽车自研底层推理引擎,使芯片能够运行VLM。理想汽车还凭借芯片、控制器设计和自研汽车操作系统等综合能力,实现了双Orin-X芯片和Thor-U芯片运行同等规模的VLA司机大模型。这些努力不仅提升了技术能力,也为用户带来了更好的体验。

在谈及创业和个人成长时,李想表示,创业路上苦多于甜,但他选择保留有价值的美好片段,激励自己保持正能量。他认为,成为更有能量的人的关键在于关注自我,接受自身的优点和不足,并用成长替代改变。同时,他也强调亲密关系的重要性,家人和同事能够形成互补,相互支撑。正是这份积极乐观的心态和团队的支持,让理想汽车能够快速成长为千亿营收规模、百万交付量的新势力企业。

李想还分享了理想汽车在开源方面的贡献。得益于DeepSeek的开源,理想汽车在VLA司机大模型的语言能力研发上取得了显著进展。尽管如此,理想汽车仍选择加大投入,专注打造适配多场景的自研模型。同时,理想汽车也选择开源自研的汽车操作系统——理想星环OS,回馈社会。这一举措不仅体现了理想汽车的技术实力,也展现了其开放共享的精神。

更多热门内容