ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

MiniMax M3发布:12小时自主炼模,解码加速15倍,多模态能力再升级

时间:2026-06-01 22:09:19来源:快讯编辑:快讯

MiniMax正式推出新一代旗舰大模型MiniMax M3,在编程与Agent能力领域取得显著突破。该模型在多个基准测试中展现出领先水平,尤其在真实软件工程能力评估框架SWE-Bench Pro上,其表现超越GPT-5.5和Gemini 3.1 Pro,接近Claude Opus 4.7。

技术架构方面,MiniMax M3采用全新稀疏注意力机制MSA(MiniMax Sparse Attention),支持百万级上下文窗口处理。相较于前代全注意力模型M2,该架构在预填充阶段实现9倍加速,解码阶段加速效率达15倍以上。这种设计通过精确的KV块分块策略,在保持计算精度的同时显著降低资源消耗,使单token计算量仅为前代的二十分之一。

作为原生多模态模型,M3具备图片、视频输入及桌面操作能力。在OmniDocBench多模态测试集中,其表现优于Gemini 3.1 Pro;在自主Agent评测框架Claw-eval上获得最高评分。训练数据规模达100万亿token级别,通过交错数据排列方式实现不同模态语义空间的深度融合。实测显示,该模型能详细描述图像细节,但在地理定位等复杂视觉任务中,与头部模型仍存在差距。

在自主训练能力测试中,M3展现惊人潜力。研究团队要求其在12小时内从零开始训练4个基础模型,全程无人干预完成数据合成、训练、评估全流程。最终这些模型在数学推理、工具调用等任务上达到基础能力水平,综合得分0.37,接近GPT-5.5(0.39)和Claude Opus 4.7(0.42)。在CUDA内核优化任务中,该模型连续工作24小时,通过1959次工具调用将硬件利用率从7.6%提升至71.3%,实现9.4倍加速。

配套发布的AI编程工具MiniMax Code专为M3设计,充分发挥其长上下文处理和原生多模态特性。该工具支持跨应用、跨系统操作,具备Computer Use能力。实测显示,M3在文档协作系统开发任务中,能主动规划技术方案、设计单元测试,并在执行过程中持续反思优化代码结构。

商业化方面,M3已通过API、Token Plan和MiniMax Code平台上线。API定价采用512k上下文分档策略,提供标准模式和优先调用方案,输入输出价格分别为2.1元/百万tokens和8.4元/百万tokens,缓存读取费用0.42元/百万tokens。当前模型技术报告及权重代码计划在十日内开源,MiniMax Code也将后续开放。

在编程任务实测中,M3展现双面性:其生成的赛车游戏界面美观但可玩性不足,动态SVG图像存在细节偏差;但在复杂文档系统开发中,能准确规划技术架构并设计验证环节。这种能力特征反映出当前大模型在工程化落地过程中,既具备理解复杂工作流的潜力,仍需提升任务交付的完整性。

更多热门内容
WWDC 2024倒计时:iOS 27界面优化 AI赋能,老设备或迎“养老”新体验
彭博社获悉,目前 iOS 26 的液态玻璃界面还并非苹果内部一开始预期的「完全体」,下一个版本会做出更多调整,试图兼顾透明度和可读性。彭博社爆料,iOS 27 的新相机应用将会提供一个「高级」选项卡,可以…

2026-06-01

英伟达推出NVIDIA Isaac GR00T开源人形机器人 助力通用物理智能研究新突破
此外,英伟达Isaac GR00T开发者平台还将支持被广泛使用的宇树G1人形机器人,相关的开发工作流预计很快将在GitHub和Hugging Face上开源。根据官方路线图,这款开源人形机器人参考设计将于2…

2026-06-01

英伟达GTC Taipei 2026将启,黄仁勋透露新PC芯片秋季发布用于电脑
英伟达(NVDA.US)GTC Taipei2026将于6月1日至4日在中国台北国际会议中心举行。英伟达CEO黄仁勋6月1日上午11:00发表主题演讲,揭晓驱动新一代 AI的突破性技术进展。 黄仁勋表…

2026-06-01

华为成都发布会亮点纷呈:nova 16系列领衔,多款新品共筑全场景智慧生活
6月1日,华为nova 16系列及全场景新品发布会在成都举行,带来nova 16系列、华为MatePad Pro Max、华为WATCH GTRunner 2赛道传奇款、华为超新星手表 X1 Pro、华为F…

2026-06-01

华为6月1日成都盛大发布:nova 16系列领衔,全场景新品共筑鸿蒙生态新未来
6月1日,华为nova 16系列及全场景新品发布会在成都举行,带来nova 16系列、华为MatePad Pro Max、华为WATCH GTRunner 2赛道传奇款、华为超新星手表 X1 Pro、华为F…

2026-06-01

AI应用出海实录:海外云免备案如何解燃眉之急,适配不同场景需求
从落地实践里提炼的可复用经验上个月我对接的一个佛山家居出海的小团队,总共才6个人,之前打算用两个月时间测东南亚、中东、欧洲三个区域的独立站转化,换了适配的节点服务之后,他们只用了6天就完成了三个区域的部署和…

2026-06-01

四川合睿达全域感知方案:以智能预警筑牢城市内涝安全防线
该系统作为城市内涝风险预警与应急调度平台,整合了水位监测、视频监控、数据分析等功能模块,实现了从数据采集到预警发布的全流程自动化。后期则可以与排水管网监测、气象预报等系统深度融合,构建综合性的城市水安全管理平…

2026-06-01

光智融合启新篇:华为全光园区方案引领AI时代园区数智化变革
AI技术的融入,让全光园区突破了传统网络的边界,具备了全光统一联接、鸿蒙开放物联、融合多维感知、网络自动驾驶四大创新特性。 此次升级的AIF5G-A全光园区方案,不仅是华为在光网络根技术的集大成者,也创新融入…

2026-06-01

电子陶瓷:5G与芯片背后的“隐形支柱”,推动电子科技不断前行
从5G基站的介质滤波器,到芯片封装的陶瓷基板,再到手机里的压电陶瓷指纹识别模块,电子陶瓷已经渗透进现代电子工业的每一个角落,它的性能直接决定了高端电子产品的上限,是名副其实的电子科技“幕后英雄”。 现在国产微…

2026-06-01

中国移动引领个人云服务变革:数据安全护航 智能服务开启数字生活新篇章
面对智算时代机遇,中国移动率先提出“Byte(数据资产)与Token(算力价值)双向奔赴”的个人云发展新理念,推动移动云盘从单一存储工具,向“个人数字资产图书馆”与“个人智能中枢”全面进化。同时,中国移动以…

2026-06-01