北京,今日的世界机器人大会(WRC)现场热闹非凡,众多高科技爱好者与专业人士汇聚一堂,共同见证这场机器人领域的盛宴。据大会统计,今年参展的机器人数量突破了百位大关,其中一款人形机器人尤为引人注目。
在熙熙攘攘的展馆内,一个展台前人头攒动,观众的欢呼声和掌声此起彼伏。挤入人群后,眼前的景象令人眼前一亮:一个人形机器人正随着《北京欢迎你》的旋律,精准地敲击着架子鼓,节奏感十足,表演结束后,它还礼貌地作出揖谢幕,赢得阵阵喝彩。
这款机器人名为爱宝,由智平方公司打造。然而,爱宝的吸引力远不止于此。它的多才多艺,以及在现场展现出的多任务处理能力,让观众看到了通用机器人的潜力。
通用机器人,是指具备广泛能力,能够胜任多种任务与环境的智能机器人。与以往只能执行单一任务的专用机器人不同,通用机器人旨在实现类人或类通用智能体的灵活性与适应性,根据指令、上下文甚至环境变化,自主决策并完成任务。
爱宝正是这样一款机器人。它仅需一个基座模型,通过快速学习,便能应对多种任务。在架子鼓表演结束后,爱宝迅速转换角色,成为软饮吧的主理人,熟练地为观众制作冰淇淋。它先是用左手拿起纸杯,放置在冰淇淋出口下方,右手精准抓住冰淇淋机器手柄,随着冰淇淋的流出,左手配合旋转,完美地将冰淇淋装入杯中,整个过程流畅自然,宛如人类操作。
不仅如此,爱宝还能制作咖啡、饮料,甚至在展会现场展示了“真·搬砖”任务,化身工厂码垛搬运员工,精准拿起箱子,移动到指定位置放下,如此反复,展现了其全域行动、全身协同的工作能力。
爱宝之所以能够展现出如此强大的多任务处理能力,关键在于其大脑——Alpha Brain中搭载了智平方自研的全域全身视觉-语言-行动大模型GOVLA。这款大模型赋予了爱宝前所未有的智能化水平,具备全域感知、全身协同、长程柔性和快速学习四大核心能力。
全域感知能力让爱宝拥有360度的视野,能够感知和理解整个空间环境;全身协同能力则使爱宝能够像人一样,用全身协调完成复杂任务;长程柔性能力让爱宝能够理解并执行由多个步骤组成的复杂任务;而快速学习能力则让爱宝能够通过观察和少量数据,迅速学会新技能。
在展会现场,爱宝的表演和展示,不仅让观众看到了通用机器人的影子,也让业内人士对智平方的技术实力刮目相看。据悉,智平方的GOVLA大模型相较于硅谷主流的VLA模型,展现出了明显的优势,从“桌面级”到“全域级”、从“单臂”到“全身”的突破,让爱宝在多个场景中都能大放异彩。
目前,搭载GOVLA大模型的爱宝机器人已经在工业制造、半导体、生物科技和公共服务等多个领域与头部企业展开合作,开始了商业化落地的征程。从繁忙的汽车生产线到无菌车间,再到即将部署在国内一线城市机场的爱宝,它将为来往的旅客提供信息咨询、路线指引等服务,成为具身智能在开放、复杂公共环境中应用的一大亮点。
智平方选择多场景并进的具身智能之道,旨在通过多样化的任务寻找共通的解决方案,加速数据的积累和模型的迭代。从开发者场景到工业服务、公共服务,再到家庭服务,智平方正通过坚实的场景落地,一步步将通用智能机器人的梦想变为现实,为人类带来更加便捷、高效的生活体验。