7月2日消息,大模型领域技术专家孙天祥正式加入百度,就任基础模型研发部(BMU)负责人,并同时进入百度模型委员会(BMC)。此前,百度已分别成立基础模型研发部(BMU) 和应用模型研发部(AMU) ,其中应用模型研发部由贾磊负责。随着孙天祥的加盟,百度在AI基础模型领域的战略布局进入新阶段。
孙天祥是谁?
孙天祥,1997年出生,是一位在大模型领域备受瞩目的技术专家。他的职业生涯轨迹清晰且亮眼。
孙天祥的学术根基深厚,于2024年获得复旦大学计算机科学与技术博士学位。他是国内首个公开邀请公众参与内测的类ChatGPT对话大模型MOSS的核心研发负责人与主导者。同时,他还在国际上较早地提出了Model-as-a-Service (MaaS,模型即服务) 的概念。在学术产出方面,他累计在ICML、ICLR、NeurIPS、ACL等人工智能顶级会议上发表了四十余篇论文。
在产业实践上,孙天祥的履历同样丰富。在攻读博士学位期间,他先后在亚马逊上海人工智能实验室(2019-2020年)、阿里巴巴达摩院(2022年) 和上海人工智能实验室(2023年) 实习,积累了从自然语言处理到大规模语言模型训练与工程化的丰富实战经验。博士毕业后,他曾创办大模型创业公司日行迹智能,其创业项目首轮投资人曾评价他“绝对是心中有火的人”。
他还曾担任上海人工智能研究院的助理教授。
百度方面表示,孙天祥从研发MOSS到提出MaaS再到创业的学术与产业路径,与百度在基础模型上的战略投入方向高度契合。他的加入也被视为百度在AI人才战略上的重要布局。
百度的组织变革与人才布局
此次孙天祥的加盟,被认为是百度AI组织架构持续迭代的关键一步。
以组织变革牵引人才、以产品突破验证组织,这套路径正在成为百度AI人才战略的清晰主线。
今年以来,百度已进行了多次组织架构调整。1月合并百度文库与网盘,3月推动百度大模型与搜索融合,5月成立百度模型委员会,在6月完成百度MEG商业与电商板块的整合。以AI大模型为技术底座,打通内容、电商、数字人、广告等多元变现链路,并通过组织扁平化加速决策与创新的战略主线愈发清晰。
过去一段时间,百度在AI组织架构和人才梯队上持续迭代:设立百度模型委员会、多批次引入年轻技术力量,围绕基础模型的系统性人才布局逐步成型。
Unlimited OCR曾引发人才猜想
就在孙天祥加盟前不久,百度开源了端到端OCR模型Unlimited OCR,其优异表现引发业界广泛关注。
在OmniDocBench v1.6基准测试中,Unlimited OCR以93.92%的综合成绩刷新端到端OCR最新纪录。在保持高精度解析能力的同时,真实文档场景推理速度较DeepSeek OCR提升约12.7%,输出长度达6000 tokens时速度优势扩大至35%。Unlimited OCR提出的参考滑动窗口注意力(Reference Sliding Window Attention, R-SWA) 机制,让模型能够模仿人类抄书时的注意力模式,在一次前向推理中连续完成数十页文档解析,告别了传统OCR“逐页解析+结果拼接”的工程方案。
Unlimited OCR发布次日即登顶GitHub Daily Trending榜,5天内GitHub Star突破一万,并在HuggingFace全球模型总趋势榜和多模态模型趋势榜均排名第一,实现GitHub、HuggingFace四榜登顶。
正是这一卓越表现,引发了业界对Unlimited OCR核心作者“YY”的广泛关注和猜测。
而百度方面并没有将YY和孙天祥划等号,只是表示:Unlimited OCR为百度的人才战略提供了直接验证——组织变革的成效,正在产品侧加速兑现。