在人工智能领域,一个被广泛认可的观点是“80%的数据+20%的模型=更好的AI”,这一理念由斯坦福大学计算机科学教授吴恩达在其45岁生日时提出。他强调,数据准备在人工智能项目中占据了绝大部分工作,确保数据质量是团队的重要任务。这一观点在智能驾驶领域同样适用,智能驾驶技术的推进不仅需要高质量的数据作为基石,还需要强大的算力支持和先进的算法。
智能驾驶技术的发展,犹如一场激烈的竞赛,各家车企都在努力争夺领先地位。然而,这场竞赛并非仅靠招募顶级工程人才就能取胜,关键在于模型设计、工具链开发以及模型的测试验证。如今,行业的比拼焦点已经从团队规模转向了云端算力和数据质量。
在智能驾驶技术的演进过程中,数据闭环能力成为了车企决胜的关键。数据闭环包括数据采集、存储、挖掘、标注、模型训练、仿真验证以及集成部署等整个工作流程。这一过程将隐藏在驾驶数据中的驾驶知识逐步迁移到智能驾驶系统的参数文件中,使系统的表现更加拟人化,从而提升驾驶体验。特斯拉曾表示,一个端到端的自动驾驶系统至少需要100万个高质量的视频片段进行训练,而小鹏和理想等车企也在积极收集数据,以训练更先进的智能驾驶模型。
然而,高质量数据的获取并非易事。车企主要通过两种方式收集数据:一是从量产车上挖掘,通过特定规则筛选用户的驾驶数据;二是在存量数据中挖掘,通过算法规则筛选有价值的数据。但这两种方式都面临着数据质量、数据分布和数据泛化等挑战。因此,车企需要不断提升数据闭环能力,以确保智能驾驶系统的迭代质量。
与此同时,算力军备竞赛也在智能驾驶领域愈演愈烈。随着智能驾驶系统的升级,传感器数量和类型增多,数据处理量激增,算力需求呈现指数级增长。理想、华为和小鹏等车企纷纷加大算力投入,以提升智能驾驶系统的性能。然而,算力供给紧张的问题也随之而来,摩尔定律的极限和汽车商品属性的限制使得算力堆砌并非长久之计。
为了缓解算力供给紧张的问题,云端大模型成为了一种可行的解决方案。云端大模型具有更高的参数量和更强的计算能力,能够处理更大规模的数据集。然而,训练一个云端大模型也对大规模高性能算力以及数据存储和处理提出了非常高的要求。因此,车企需要在算力基础设施、模型训练稳定性、数据存储和处理能力等方面进行全面提升。
在智能网联汽车的发展趋势下,车路云一体化成为了智能驾驶降本增效的新途径。通过车路云网络,可以建立一个横跨车端、路侧和云端的体系化闭环,实现数据的实时感知、分析和处理。路侧数据可以弥补车端的天然局限,丰富车端的全局数据,进一步提升智能驾驶能力和安全性。同时,车路云网络还可以实现交通态势的全面、及时、精准感知、控制与决策,推动智能交通的发展。
在车路云一体化的场景中,云计算和边缘计算各自发挥着重要作用。云计算聚焦非实时、长周期数据的大数据分析,为业务决策提供支持;边缘计算则聚焦实时、短周期数据的分析,支撑车端实时智能化处理与执行。通过多级协同计算,车路云网络可以实现事件感知的准确和智能交通的发展。
智能驾驶技术的演进已经进入了新的阶段,单车智能和车路云一体化都在不断发展。虽然目前坚持单车智能路线的车企仍占大多数,但车路云一体化的潜力已经不容忽视。无论是单车智能还是车路云一体化,都需要更多的数据和算力支持,以及让算力和数据流转起来的机制和工程能力。在这场竞赛中,任何一环的缺失都可能带来变数。