近日,人工智能领域迎来一则重磅消息:谷歌工程副总裁、Gemini模型联合负责人诺姆·沙泽尔(Noam Shazeer)宣布离开谷歌,转而加入OpenAI担任架构研究负责人。OpenAI首席研究官马克·陈(Mark Chen)确认了这一人事任命,公司首席执行官山姆·阿尔特曼(Sam Altman)更是直言,自OpenAI创立之初就希望与沙泽尔合作,这一等待已持续十年之久。
沙泽尔在人工智能领域声名显赫,他是2017年发表的具有里程碑意义论文《Attention Is All You Need》的核心作者之一。这篇论文提出的Transformer架构,如今已成为现代大型语言模型的底层技术基础,广泛应用于各类人工智能模型中。沙泽尔还是推动稀疏混合专家模型(MoE)发展的先驱人物之一,为人工智能模型的高效训练和优化提供了重要思路。
回顾沙泽尔的职业生涯,他与谷歌的关系可谓“分分合合”。2000年,沙泽尔首次加入谷歌,开启了他的科技征程。2009年,他短暂离开谷歌,探索其他领域的发展机会。2012年,谷歌Brain团队的吸引力让他选择回归,继续在人工智能研究领域深耕。2017年,他参与发表Transformer论文后,于2021年与同事丹尼尔·德弗雷塔斯(Daniel De Freitas)离开谷歌,共同创办了Character.AI。此次离开的原因是谷歌拒绝公开发布他们开发的聊天机器人Meena,这一决定促使他们决定自主创业。
2024年,谷歌通过一笔约27亿美元的技术授权与人才回流交易,成功将沙泽尔及部分Character.AI团队成员重新招揽至麾下。沙泽尔因持有Character.AI股份,在这笔交易中获得了数亿美元的收益。回归谷歌后,他参与了Gemini模型的研发工作。然而,不到两年时间,沙泽尔再次做出职业转变,选择离开谷歌,投身OpenAI。
沙泽尔的这一跳槽决定,正值人工智能行业对Transformer架构局限性进行深刻反思的时期。当前,业界普遍认为,单纯通过扩大预训练规模来提升模型性能的边际收益正在逐渐下降。Transformer架构在长上下文记忆、动态状态追踪以及真正的推理能力等方面存在明显的结构性短板。因此,下一代人工智能模型需要在架构层面实现重大突破,以更好地维护状态、组织计算并更新对世界的表示。
对于谷歌而言,沙泽尔的离开不仅意味着失去了一位Gemini模型的联合负责人,更反映出公司在将前沿研究成果快速转化为实际产品方面存在的反复延迟问题。这一情况可能会对谷歌在人工智能领域的竞争力产生一定影响。而对于OpenAI来说,沙泽尔的加入无疑是一大利好。他在大规模训练、MoE技术、高效解码等方面的丰富经验,以及从“小实验”到“大系统”的架构判断能力,将为OpenAI在寻找Transformer架构之后的下一代模型提供有力支持。
与此同时,OpenAI正面临着沉重的财务压力。据相关报道,OpenAI在2025年的支出预计约340亿美元,净亏损约390亿美元。在财务状况严峻的情况下,OpenAI仍需在激烈的市场竞争中保持领先地位。与此同时,其竞争对手Anthropic等也在加紧人才布局,双方几乎同时提交了首次公开募股(IPO)文件。前沿模型领域的竞争已演变成一场围绕架构创新和人才争夺的昂贵战争,各大公司都在竭尽全力争夺有限的顶尖人才,以在未来的市场竞争中占据优势。