ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

MIT天才博士毕业即投身新锐公司 聚焦大模型预训练 年薪或达300万起

时间:2026-01-12 02:08:38来源:快讯编辑:快讯

MIT博士肖光烜近日在社交平台宣布完成学业,即将加入由OpenAI前CTO创立的初创公司Thinking Machines,专注大模型预训练领域。这一消息引发科技圈关注,英伟达科学家、xAI研究员及UCSD学者等业内人士纷纷在评论区送上祝贺。

翻开肖光烜的履历,其学术背景堪称亮眼。本科阶段就读于清华大学计算机系,同时辅修金融学并获得双学位,期间斩获国家奖学金、全国大学生数学建模竞赛一等奖等十余项荣誉。2020年至2021年,他以访问学者身份赴斯坦福大学开展研究,2022年进入MIT攻读博士学位,师从韩松教授,研究方向聚焦深度学习的高效算法与系统。

在MIT期间,肖光烜展现出极强的工程实践能力。2024年初,他在英伟达实习期间提出的DuoAttention技术,通过结合检索与流式注意力头,成功解决长上下文大语言模型的推理加速问题。此后参与的XAttention项目,利用反对角评分机制实现块稀疏注意力优化;StreamingVLM模型则突破视频流处理时长限制,可实时分析数小时长视频内容。这些成果均体现其从理论到落地的完整技术闭环能力。

其博士论文《Efficient Algorithms and Systems for Large Language Models》更被视为行业里程碑。针对大模型显存爆炸、推理迟缓等痛点,论文提出SmoothQuant量化技术,首次实现十亿级模型W8A8无损压缩;StreamingLLM架构通过"注意力汇点"机制,将模型上下文处理能力从数千token提升至百万级。更值得关注的是,团队通过信噪比分析证明"块越小越好"的理论极限,并开发FlashMoBA内核使小块架构在实际应用中提速9倍,为AGI发展开辟新路径。

科技行业薪酬数据印证了这场人才争夺战的激烈程度。据Business Insider获取的2025年一季度招聘记录显示,Thinking Machines为技术员工开出平均46.25万美元年薪,其中基础薪资最高达50万美元。这一水平不仅远超OpenAI技术团队29.2万美元的平均年薪,也高于Anthropic的38.75万美元。尽管与meta某些高管超亿元薪酬仍有差距,但在初创公司中已属顶尖水准。

更多热门内容
智元GE-Sim 2.0发布:构建可交互“模型世界” 引领机器人自主进化新篇章
真实数据与生成数据的组合,使策略训练既具备真实性,又拥有更强的泛化能力;而后,智元提出Real2Edit2Real流程,真实数据不再只是被动采集,而是成为可被模型扩展与编辑的基础,从而显著提升数据规模与多样性…

2026-04-12

清华教授领衔!生数科技获阿里云领投近20亿,从AI视频迈向通用世界模型新赛道
就在融资前一天,生数科技旗下的视频生成模型Vidu全系列刚刚登陆阿里云百炼模型广场。自己研发了HappyHorse模型,登顶盲测榜单;上月领投3D生成平台Tripo AI的5000万美元融资;去年9月领投爱诗…

2026-04-12

小米产教融合再传佳音:成都新基地启用 共同体成果丰硕签约不断
IT之家 4 月 11 日消息,4 月 11 日至 12 日,2026小米产教融合大会暨新一代智能硬件技术行业产教融合共同体(下文简称小米产教融合共同体)年会在四川成都科幻馆召开。 小米在会上宣布,正式与柔…

2026-04-12