【ITBEAR】理想汽车近日正式向全量用户推送了全新一代双系统智能驾驶解决方案——端到端+VLM技术,标志着其智能驾驶正式迈入AI大模型时代。这一创新技术实现了像人一样思考、像人一样驾驶,全面覆盖各类驾驶场景,让行驶更加舒适、通行更加高效。
理想汽车的端到端技术,摒弃了传统人工制定规则的方式,转而采用人工智能模型进行机械自学习。该技术从视觉输入端到智能驾驶系统的控制输出端,完全依靠模型自身系统处理,实现了功能的完全黑盒化。
在端到端技术的基础上,理想汽车引入了VLM视觉语言模型,形成了双系统架构。系统1负责视觉感知和执行操作,而系统2则通过长期积累知识,为系统1提供提醒和告知,辅助规划决策。这一双系统架构使得理想汽车的智能驾驶技术更加完善,具备更强的复杂环境理解能力。
理想汽车的VLM视觉语言模型具备应对复杂场景的逻辑思考及决策能力,能够识别并应对限时公交车道、潮汐/可变车道、减速带、坑洼路面等多种复杂场景。同时,在安全性、舒适性和效率方面都有显著提升,拟人化程度再上新台阶。
全新的智能驾驶解决方案还对车机交互界面进行了全面焕新,双系统的“所见所想”可以实时展现,让用户更易理解智驾过程,更加安心。同时,新增了智驾行程卡自动上传手机的功能,方便用户随时随地分享。
此次推送的版本基于V4.8.6模型,是在400万clips基础上迭代的第16个版本。主要在超车场景理解能力、导航信息理解能力以及障碍物检测精度三个方面进行了优化,提升了驾驶体验。
从“无图NOA系统”到“端到端+VLM”,理想汽车在智能驾驶领域取得了显著进步。其端到端+VLM视觉语言模型具备更拟人化的驾驶方式,拥有老司机般的丝滑体验。同时,整体大幅提升了安全、舒适和效率,能力更强、上限更高。
理想汽车还成为首个将视觉语言模型部署到Orin-X芯片的企业,并率先采用了双系统架构。凭借百万辆的规模化运营效率,其智能驾驶累积里程预计将达到30亿公里,训练算力超过8 EFLOPS。这些成就标志着理想汽车在智能驾驶技术前沿稳步迈进。