近日,小米公司迎来了一位重量级的新成员——罗福莉,她将在小米AI实验室中扮演关键角色,领导小米的大模型团队。罗福莉的背景令人瞩目,她不仅拥有北京大学计算语言学的硕士学位,还曾在阿里达摩院机器智能实验室担任重要职务,主导开发了多语言预训练模型VECO,并在DeepSeek参与了MoE大模型DeepSeek-V2的研发。
据悉,小米创始人雷军对公司在大型模型领域的起步较晚表示担忧,因此决定亲自下场,投入巨资招募核心人才。据知情人士透露,为了吸引罗福莉,小米开出了高达千万元级别的薪酬。
罗福莉的加入,无疑为小米的技术实力注入了新的活力。在智能手机市场日益激烈的竞争中,AI技术已成为品牌维护用户群体的核心护城河。随着芯片算力的持续提升,AI Agent在智能手机上的应用逐渐成为常态,能够更好地理解用户需求,主动完成任务,成为用户高度定制化的私人助理。据IDC预测,到2025年,中国新一代AI手机市场出货量将达到1.18亿台,同比增长59.8%,整体市场占比达到40.7%。
面对这一巨大机遇,小米选择了轻量化和本地部署作为大模型技术的突破口。从成本、用户构成和产品方面考虑,小米更倾向于在端侧进行AI推理,这不仅可以更接近用户的数据,实现更有效的训练,还能够大量节约云端算力开支。同时,小米的用户对于互联网新技术的接受程度较高,这也为其未来部署本地化AI创造了条件。
为了确保本地部署模型的效果,小米团队开发了专用的硬件加速模块,并采用了创新的“TransAct大模型结构化剪枝方法”和端侧量化技术,显著提升了训练效率并降低了量化精度损失。目前,小米已经成功在端侧部署了MiLM2-4B模型,为未来更多设备的本地化部署打下了坚实基础。
罗福莉的加入,无疑将加速小米在大模型技术领域的布局。她所研究的语音和文本识别技术,正是目前手机、平板、PC等移动终端以及车机设备中最为常用的场景。罗福莉曾在阿里主导开发的VECO模型是跨语言理解与生成的典范,为智能终端设备提供了核心技术支撑。她的到来,将进一步提升小米在文本生成与风格转换领域的技术实力。
除了智能手机业务,小米还在汽车领域展开了大模型技术的实践。雷军在演讲中提出,通过AI赋能“人车家”生态,推动技术与场景的深度融合。小米的智能驾驶系统通过接入多模态大模型技术,赋能从语音交互到复杂道路环境识别的全链路场景。目前,小米的端到端全场景智能驾驶系统已经展现出了“类人”的驾驶能力,能够应对多种复杂场景。
小米的大模型技术还深入渗透到AIoT生态中。从家电控制到安防监控,从语音助手到健康管理,大模型技术正赋能每一个AIoT设备。小米希望通过统一的AI框架和大模型算法,实现设备之间的数据共享和协同工作,为用户带来更加流畅和智能的体验。
为了吸引更多顶尖人才,小米不仅提供了高薪酬,还打造了开放的研发环境和多样化的技术交流平台。小米AI实验室的研究项目数量在过去一年增长了45%,其中多模态交互、图像生成和语义理解成为重点方向。罗福莉的到来,将加速小米在这些前沿领域的技术落地,进一步缩小与行业领先者的差距。
不仅如此,小米还在加强与高校和研究机构的合作,共同推动AI技术的基础研究和应用落地。这种双向合作模式将为小米注入源源不断的技术创新动力,推动其在大型模型赛道上不断前行。
在罗福莉的加入下,小米正加快构建“人车家”融合的完整智能生活场景。未来,小米将不仅关注技术突破,更将致力于将AI能力与用户需求深度结合,为用户带来更加智能、便捷和舒适的生活体验。