ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

MiniMax 稀宇科技推出万亿参数MoE模型abab 6.5 ,核心能力接近 GPT-4

时间:2024-04-17 16:49:26来源:ITBEAR编辑:茹茹

【ITBEAR科技资讯】4月17日消息,国内AI初创企业MiniMax稀宇科技今日宣布,他们已成功研发出基于MoE(Mixture of Experts)混合专家模型架构的abab 6.5系列模型,这标志着该公司在人工智能领域取得了重要突破。据悉,该系列模型的核心能力已经开始接近当前领先的GPT-4、Claude-3和Gemini-1.5等模型。

abab 6.5系列包含两个重要模型:abab 6.5和abab 6.5s。其中,abab 6.5模型拥有万亿级别的参数,能够支持长达200k tokens的上下文长度,展现出强大的语言处理能力。而abab 6.5s模型则在保持与abab 6.5相同训练技术和数据的基础上,实现了更高的效率。它同样支持200k tokens的上下文长度,并且能在1秒内处理近3万字的文本,为实时、高效的语言处理提供了可能。

据ITBEAR科技资讯了解,自今年1月MiniMax发布国内首个基于MoE架构的abab 6模型以来,该公司一直致力于通过改进模型架构、重构数据pipeline、优化训练算法及并行训练策略等手段,加速Scaling Laws的过程。这一系列努力终于取得了阶段性的成果,即abab 6.5系列的诞生。

为了验证abab 6.5系列模型的性能,MiniMax官方进行了业界常用的“大海捞针”测试。在该测试中,官方在一段很长的文本中插入一个与该文本无关的句子,并尝试通过自然语言向模型提问,以检验模型是否能够准确找出这个“针”。经过891次测试,abab 6.5均能够准确地回答出这个“针”,展现出极高的精确度和可靠性。

随着abab 6.5与abab 6.5s模型的推出,MiniMax稀宇科技将进一步巩固其在人工智能领域的地位。这两个模型将陆续更新至MiniMax旗下的产品中,包括海螺AI和MiniMax开放平台。

更多热门内容
谷歌CEO皮查伊:OpenAI使用YouTube训练AI将遭法律追究
【ITBEAR科技资讯】5月17日消息,近日,谷歌CEO桑达尔·皮查伊就微软支持的OpenAI使用YouTube内容训练AI模型一事表态。皮查伊明确表示,如果OpenAI确实依赖YouTube视频来训练其能够生成视频的人工智能模型,谷歌将采取相应的法律行动来解决这一问题。此前有报道称,Open

2024-05-17

索尼音乐向AI公司发出严正声明:未授权不得使用其音乐资产进行模型训练
【ITBEAR科技资讯】5月17日消息,近日,彭博社发布的一份新报告显示,索尼音乐集团正在积极采取措施,警告各大AI公司禁止“未经授权使用公司旗下的资产进行模型训练”。据该报告披露,索尼音乐已经向全球超过700家AI技术相关企业发送了正式通知,明确表示对其知识产权的

2024-05-17

AI周报 | 谷歌OpenAI字节推出AI新品,万兴“天幕”赋能《歌手》片头制作
1.Google I/O 2024开发者大会发布多款AI模型Google在I/O 2024开发者大会上发布了近10款AI模型,包括上下文窗口扩展到200万tokens的Gemini 1.5 Pro,以及轻量级模型Gemini 1.5 Flash。此外,还推出了视频生成模型Veo、文本到图像模型Imagen 3,和全新的架构Gemma 2.0。Androi

2024-05-17

OpenAI携手Reddit,实现实时贴文引用与内容理解升级
【ITBEAR科技资讯】5月17日消息,Reddit与OpenAI今日联合发布新闻稿,宣布双方已达成“合作伙伴关系”,旨在将Reddit的丰富问答内容融入OpenAI的系列产品中,同时OpenAI也将成为Reddit的广告合作伙伴。根据合作协议,OpenAI将获得Reddit的数据API访问权限,从而能够实时

2024-05-17

小米AI大模型MiLM正式备案,智能家居、手机与汽车将迎新智能体验
【ITBEAR科技资讯】5月16日消息,据小米公司官方微博宣布,其大语言模型MiLM已正式通过大模型备案。这一里程碑式的事件预示着小米在人工智能领域的又一重大进展,未来该模型将逐步应用于小米汽车、手机、智能家居等系列产品,并计划面向更多用户开放体验。回顾去年8月,

2024-05-16