在科技日新月异的今天,曾经只存在于科幻电影中的场景正逐渐变为现实。想象一下,只需简单的一句话,机器人便能为你倒果汁、打鸡蛋,甚至读懂你的情绪,用幽默的方式给你讲笑话。这样的场景,如今已成为科技巨头们发布机器人新品时的标配演示。
这一切的变革,离不开AI大模型的快速发展。它让AI能够更好地理解世界,与人类及周围环境产生更加自然的交互。在这样的背景下,具身智能成为了机器人领域的热门话题,吸引了众多企业和投资者的目光。
近日,全球服务器机器人领域的佼佼者擎朗智能,再次推出了一系列新品,并展示了其基于海量真实场景数据打造的具身多模态模型。其中,人形具身服务机器人XMAN-R1凭借其出色的表现,成为了业界的焦点。
XMAN-R1
XMAN-R1的设计理念围绕着“岗位化、亲和力、安全性”展开,已经具备了处理服务行业长程任务的能力。它的出现,标志着服务机器人正朝着更加智能化、人性化的方向发展。
具身智能的核心在于智能体通过身体与环境的互动来学习,而这一过程天然需要泛化能力。然而,当前具身智能的泛化面临着数据瓶颈。相比于多模态大模型可以利用互联网上的丰富数据进行训练,具身智能大模型目前仍缺乏高质量、大规模的人类操作数据。
为了克服这一挑战,擎朗智能选择了优先实现局部泛化的策略。他们认为,现阶段直接实现完全泛化的具身智能是不现实的,但通过单一任务泛化实现商业落地是可行的。因此,他们让机器人先专注于特定岗位场景,再逐步扩展其他岗位场景,最终实现融会贯通。
XMAN-W3
事实上,擎朗智能在具身智能商业化落地方面一直走在前列。早在去年的WAIC世界机器人大会上,他们就推出了具备灵活双臂的酒店机器人XMAN-W3,这是他们在具身智能领域的前瞻探索。而此次推出的XMAN-R1,则是他们在人形具身服务机器人领域的又一力作。
除了XMAN-R1之外,擎朗智能还展示了其丰富的产品矩阵和落地场景。从餐饮配送、商用清洁到银行导览、酒店服务等领域,他们的机器人已经形成了规模化落地。而在商超、文娱、医疗、康养等细分领域,也展现出了强劲的增长潜力。
在软硬件自研技术方面,擎朗智能同样取得了显著成果。他们通过不断的创新和积累,在避障算法、环境感知、任务理解等方面实现了诸多突破。这些技术的加持,使得他们的机器人在复杂动态化的环境中能够更加高效地完成各种任务。
随着AI大模型的赋能加速和多模态感知技术的迭代升级,具身服务机器人正朝着“通用泛化”的方向发展。未来,机器人将通过模块化技能库组合应对新任务,像人类婴儿一样通过感知运动经验自主构建物理规律认知。而擎朗智能作为这一领域的佼佼者,已经掌握了技术、市场和模式的多重优势,成为了撕开万亿蓝海市场的核心推手。