阿里巴巴近日在大模型领域迈出关键一步——其旗下通义千问团队正式成立“机器人与具身智能小组”,目标是将AI从语言交互推向物理世界操作。这一动向并非通过官方声明披露,而是由通义千问技术负责人林俊旸在社交平台X上的一句言论引发关注:“多模态模型正在进化为能处理长时序任务的基础智能体,而它们的终极形态必然是连接虚拟与现实的桥梁。”
32岁的林俊旸是阿里内部具身智能研究的核心人物,这位北大毕业的年轻技术领袖,曾主导M6、OFA等多模态预训练项目,并带领团队开发出Qwen3-Max和QwQ-32B等旗舰模型。如今他挂帅的这支新团队,核心任务并非制造实体机器人,而是为通义千问赋予“行动力”——使其能通过视觉感知、空间推理和动作规划,实现对物理设备的精准操控。这标志着阿里的大模型战略从“语言理解”向“环境交互”的深度转型。
全球科技巨头正竞相布局具身智能领域。软银集团本周宣布以54亿美元收购ABB工业机器人业务,英伟达CEO黄仁勋则公开强调“AI+机器人”是数万亿美元级的市场机遇。与传统机器人研发路径不同,阿里选择将具身智能直接嵌入Qwen大模型体系,通过统一的智能底座实现语言与动作能力的协同进化。这种“软件定义硬件”的模式,已在仓储自动化领域初显成效——上个月,阿里领投了自变量机器人1亿美元融资,这家专注工业场景的创业公司,正为阿里提供现实世界的验证场景。
阿里CEO吴泳铭近期指出,未来五年全球AI投资规模将突破4万亿美元。作为回应,阿里云已宣布投入3800亿元建设AI基础设施,而具身智能团队的成立,正是其将智能能力从云端延伸至物理终端的关键布局。从智能家电到工厂协作臂,阿里正利用自身在云计算、物流、IoT等领域的场景优势,构建“感知-决策-执行”的完整闭环。
这场变革背后,是阿里对AI本质的重新定义。当行业还在比拼模型参数时,阿里已将目光投向“改变世界”的能力——让AI不仅能回答问题,更能操作设备、优化流程、创造价值。在仓储机器人自动分拣包裹、智能机械臂精准装配零件的场景中,通义千问正从“对话者”蜕变为“行动者”。这种转型不仅关乎技术突破,更可能重塑未来十年的AI产业格局。