ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

MiniMax启动上市辅导又推M3大模型,自研架构助力性能与性价比双提升

时间:2026-06-02 22:49:31来源:快讯编辑:快讯

上海科技企业MiniMax近日成为行业焦点,这家同时已在港交所上市、且不久前启动A股上市辅导的公司,于6月1日正式推出新一代通用大模型MiniMax M3。该模型以解决长文档处理、复杂代码推理等场景中的效率痛点为目标,成为国内首个同时具备超长上下文、原生多模态与前沿编程能力的"三合一"模型。

在核心能力构建上,M3展现出显著技术突破。其100万token的上下文窗口容量可容纳两部中文长篇小说,通过自研的稀疏注意力架构MSA(MiniMax Sparse Attention),将长文本处理成本降低至传统模型的二十分之一。这种技术架构创新使模型在处理法律文书、科研论文等长文本时,能保持更完整的信息链路,同时支持多轮任务协作与复杂代码仓库管理。

多模态能力成为M3的显著优势。不同于传统模型后期叠加视觉功能的开发路径,该模型从训练阶段就实现文字、图像、视频的混合训练,形成原生多模态处理能力。在编程能力评测中,M3在SWE-Bench Pro基准测试中超越GPT-5.5与Gemini 3.1Pro,与Anthropic公司4月发布的Claude Opus 4.7形成直接竞争态势。尽管尚未在综合性能上实现全面超越,但其开源策略与成本优势已引发行业关注。

全球大模型竞争已进入深水区,智能体任务复杂度提升带来的技术挑战愈发凸显。行业观察指出,当Agent需要处理跨领域、长周期任务时,模型的长上下文记忆能力、稳定推理性能与成本控制成为关键竞争要素。M3通过MSA架构实现的百万级上下文窗口,配合显著降低的计算成本,为复杂任务处理提供了新的技术路径。

这家上海企业的研发节奏持续加快。自2023年6月发布M1模型后,公司保持每季度迭代新版本的频率,相继推出M2、M2.1及今年2月的M2.5模型。此次M3的发布,不仅延续了高频迭代策略,更在核心技术指标上实现跨越式发展。其自研的稀疏注意力架构已形成技术壁垒,为后续模型升级奠定基础。

更多热门内容
四川聚焦前沿领域发布20个重点场景项目 18个项目现场签约共启新篇
活动现场发布了20个重点场景项目,涵盖清洁能源、战略性矿产、低空经济、人工智能、智慧医疗等前沿领域,18个场景项目现场签署合作协议。 据了解,本次发布的20个重点场景项目分为3个综合性场景项目和17个高价值应…

2026-06-02

光伏革新新篇章!阳光新能源全球首发智能组件,引领行业升维发展
上海人工智能研究院、全球工业人工智能联盟卓越中心秘书长徐纯表示:“L1到L4的智能分级体系绘制了清晰的技术路线图,将引导产业链上下游协同发力,推动产品创新从企业单点突破升级为全行业共识共建,加速光伏产业的智能…

2026-06-02

A股早盘分化:通信设备吸金超百亿,传媒新能源资金加速撤离
通信设备板块成为早盘资金流入的绝对核心,电子产业链相关板块也同步获得资金布局。通信设备板块午间主力资金净流入106.11亿元,位居所有板块首位,板块上涨1.71%。 此外,文化传媒板块主力资金净流出29.…

2026-06-02

四川聚焦前沿领域发布20个重点场景项目 18个项目签约助力多元发展
活动现场发布了20个重点场景项目,涵盖清洁能源、战略性矿产、低空经济、人工智能、智慧医疗等前沿领域,18个场景项目现场签署合作协议。 据了解,本次发布的20个重点场景项目分为3个综合性场景项目和17个高价值应…

2026-06-02