在华为开发者大会现场,一档聚焦科技前沿的开放麦节目《鸿蒙脑洞大开麦》正式开播。北京大学计算机学院副教授、上纬启元首席科学家董豪以星光嘉宾身份首次公开以上纬启元首席科学家身份亮相,引发行业关注。他在节目中高度评价鸿蒙系统的开源生态理念,指出其通过全场景分布式技术打破设备边界,以开放姿态汇聚全球开发者力量,使高中生、残障人士等群体都能以低成本参与创新,真正实现“技术平权”。董豪强调,鸿蒙不仅是操作系统,更是数字时代的普惠基础设施,为人工智能与具身智能的深度融合提供了关键生态支撑。
作为横跨学术研究与产业实践的专家,董豪近期在北大内部学术分享中提出了具身智能领域的前沿理论。他拆解了当前模仿学习、强化学习等主流技术路线的局限性,并创新性地提出横向二维Scaling Law框架。该框架统一解释了世界模型、生成式数据增强等技术方案的底层逻辑,为家用与通用人形机器人的技术演进指明了方向。这一理论突破被视为推动具身智能从专用场景向通用能力跨越的关键路径。
回顾人工智能发展史,董豪以AlphaGo与ChatGPT的演进轨迹为例,揭示了“模仿-强化”的技术范式。AlphaGo通过海量人类棋谱进行监督学习,再以自对弈强化学习突破人类经验边界;ChatGPT则基于互联网文本预训练后,引入人类反馈的强化学习实现表达优化。这种路径在具身智能领域同样适用:当前模型通过采集人类专家示范数据进行模仿学习,但面对未训练的意外场景时仍易出错。为此,2011年提出的DAgger算法通过“试错-纠错-再训练”闭环持续优化模型,成为提升鲁棒性的有效手段。
尽管DAgger算法在自动驾驶领域因安全风险与长尾问题遭遇落地障碍,但在具身智能任务中展现出更大潜力。以叠衣服为例,模型可通过多次尝试弥补单次成功率不足,且失败后果可控。这种容错空间差异使得具身智能的商业化进程可能快于自动驾驶。然而,董豪指出,现有“模仿+强化”模式仅能解决单一任务优化,无法满足通用具身智能的需求——行业需要的是能执行万种任务的通用机器人,而非万个专用机器人。
针对这一挑战,董豪提出重构Scaling Law维度:将“任务数量”与“数据量”并列为核心坐标轴。他解释,通用能力源于跨任务迁移而非单一任务堆砌,当模型在海量不同任务中训练时,会逐渐掌握物理世界通用规律,如重力、摩擦力等。此时面对新任务,模型初始完成率将显著提升,额外样本需求持续下降,实现“越学越快”的指数级成长。当前行业热议的世界模型、仿真数据生成等技术,本质上都在加速这条新Scaling曲线的形成,通过提升数据跨任务价值或降低训练成本,共同推动具身智能向通用化演进。
