ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

印度AI实验室Sarvam发布两款MoE架构大语言模型 本地化测试表现亮眼

时间:2026-02-20 23:56:43来源:互联网编辑:快讯

印度人工智能实验室Sarvam在近日举行的人工智能影响力峰会上,正式推出两款自主研发的最新一代大语言模型。这两款模型基于混合专家(MoE)架构打造,采用从底层架构到训练框架的完全自主技术路线,标志着印度在生成式AI领域取得重要突破。

据技术白皮书披露,此次发布的模型包含300亿参数的轻量级版本和1050亿参数的旗舰版本。轻量级模型采用30B-A1B架构设计,预训练数据规模达16万亿token,支持32K上下文窗口,特别针对实时交互场景进行优化,在保持低延迟的同时实现高效推理。该模型已通过多项基准测试验证,在对话响应速度和资源占用率方面表现突出。

旗舰级105B-A9B模型则展现出更强大的处理能力,其128K上下文窗口可支持超长文本分析,在复杂逻辑推理和多轮对话任务中表现优异。实验室负责人特别强调,该模型在印度本土语言处理方面实现重大突破,在包含12种印度官方语言的综合测试集中,准确率较国际主流模型提升17.6%,特别是在方言识别和语义理解层面表现突出。

在性能对比测试中,105B-A9B模型展现出显著优势。针对印度市场定制的评估基准显示,该模型在本地化任务中的表现超越谷歌Gemini 2.5 Flash等国际竞品。在通用能力测试中,其数学推理和代码生成能力在多数指标上领先DeepSeek R1,在多模态理解等部分领域与Gemini Flash形成有力竞争。实验室透露,模型训练过程中特别强化了对南亚文化语境的理解,在处理宗教典籍、历史文献等垂直领域时具有独特优势。

开发团队宣布,两款模型将采取阶梯式开放策略。即日起在Hugging Face平台开放基础权重下载,供全球开发者进行本地化微调。三月中旬将推出API接口服务,支持企业级用户进行商业部署。配套的可视化仪表盘系统也在开发中,该系统将提供模型训练监控、性能评估等全流程管理功能,预计二季度正式上线。

更多热门内容
科研船近海作业打捞到境外装置 竟是暗藏玄机的水文数据“窃取者”
一艘正在执行常规海洋环境勘测任务的科研船,突然捕捉到一条异常信号。科研人员立即启动了应急探测程序,随后将一个筒形装置打捞出水。该装置通体采用耐腐蚀合金材质,表面覆盖仿生涂层,隐约可见外文标识。 科研团队联想…

2026-04-16

50元入手小米初代智能屏!刷机解锁安卓8.1,秒变监控电视多功能神器
它搭载了封闭式的安卓系统,官方最后版本是2.42.118,只集成了米家、爱奇艺、B站等极少数APP,不允许用户下载第三方APP,因此才需要刷机。 最新固件是基于安卓8.1内核的V5版本,刷完后不仅能装第三方…

2026-04-16

华为苹果入局AI眼镜赛道,行业“内热外冷”何时迎破局曙光?
在AI眼镜赛道,华为和苹果并非“第一个吃螃蟹的人”,Meta于2023年引爆AI眼镜市场后,小米、夸克、理想等科技公司纷纷推出相关产品。 套用前百度产品副总裁、首席产品架构师俞军的产品价值公式“产品价值=(…

2026-04-16

阿里旗下高德ABot-PhysWorld登顶WorldArena,具身智能布局再进一步
4月15日,一款标注为来自阿里巴巴的世界模型ABot-PhysWorld登顶世界模型领域的权威评测WorldArena。 该模型在对物理规律的深度内化与长程动态预测能力上表现优异。不同于多数模型仅能生成短时、…

2026-04-16

高德布局具身智能领域有新进展 预计近期发布首款四足机器人
来源:环球网【环球网科技报道】4月14日,针对近日有消息称,阿里巴巴旗下高德地图具身业务部即将发布一款四足机器人,这也将成为阿里巴巴集团推出的首个具身机器人产品。 高德相关负责人对记者表示:我们已在具身智…

2026-04-16