ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

6位前DeepMind成员创元系统,低成本策略引领大模型推理新突破

时间:2025-12-15 09:11:06来源:快讯编辑:快讯

在人工智能领域,一场由前Google DeepMind成员掀起的技术革新正引发广泛关注。这支6人团队成立的新公司Poetiq,通过构建元系统重新定义了大模型的应用方式,在复杂推理任务中展现出突破性表现。其研发的Gemini 3 Pro优化技术在ARC-AGI-2基准测试中以54%的准确率登顶排行榜,同时将计算成本压缩至行业最优水平的一半。

这个技术团队虽成立不足一年,却汇聚了来自DeepMind的资深专家,累计拥有53年人工智能研发经验。他们选择了一条与众不同的技术路径:不追求构建更大规模的模型,而是专注于开发能够智能调度现有模型的元系统。这种创新架构使系统能够自动生成针对特定任务的解决方案,通过组合不同模型的优势实现性能突破。

在12月8日公布的官方验证结果中,Poetiq系统在ARC-AGI-2半私有评估集上创造了新纪录。其纯Gemini配置方案以每题30.57美元的成本达成54%准确率,相比前纪录保持者Gemini 3 Deep Think(77.16美元/45%)实现双重超越。更引人注目的是,该系统在公共数据集上构建的帕累托前沿,同时推进了准确率与成本效率的边界。

技术核心在于其递归式元系统架构。该系统通过多轮交互实现自我优化:首先生成初步解决方案,再根据反馈持续改进,最终形成可靠答案。这种自我监控机制能够智能判断何时终止计算,有效避免算力浪费。测试数据显示,基于Grok-4-Fast的配置在保持高准确率的同时,成本比原始模型降低两个数量级;而开源模型GPT-OSS-120B的衍生方案,甚至实现了单题成本低于1美分的突破。

该系统的适应性在跨模型测试中得到充分验证。当应用于ChatGPT、Claude Haiku、Gemini等12个主流模型时,Poetiq均实现了准确率与成本的双重优化。这种表现源于其完全基于大语言模型的架构设计——从系统构建到运行监控,整个流程均由模型自主完成。这种递归式强化机制,使得系统能够快速整合新模型的能力,在Gemini 3和GPT-5.1发布后数小时内即完成适配并取得领先成绩。

选择ARC-AGI作为测试场源于其对复杂推理能力的严苛考验。该基准测试要求模型具备抽象推理、归纳总结和策略生成能力,恰好对应Poetiq系统的优势领域。通过让模型自主发现最优推理路径,系统能够在预算、算力等现实约束下,持续优化解决方案。这种设计理念在测试中得到充分验证:系统在处理多样化任务时展现出强大的自适应能力,能够根据任务特性动态调整模型组合策略。

技术团队透露,其开源配置旨在证明智能的本质不在于提示词工程,而在于构建能够自我进化的系统。通过多步骤验证和自我检查机制,系统能够逐步打磨解决方案,这种运行模式突破了传统大模型对提示词的依赖。随着任务多样性的增加,元系统的进化速度将进一步提升,为生成式AI在复杂场景的应用开辟新路径。

更多热门内容
谷歌Gemini 2.5音频模型来袭:实时翻译还能捕捉情绪,开启交互新时代
【新智元导读】谷歌发布Gemini 2.5Flash原生音频模型,不仅能保留语调进行实时语音翻译,更让AI在复杂指令和连续对话中像真人一样自然流畅。 意味着在Google AI Studio、Vertex…

2025-12-15

SpaceX估值飙至8000亿美元,2026年IPO或成全球最大规模上市交易
如果马斯克最终决定推进IPO,这将是他又一次引发市场轰动的大动作。这家由马斯克掌舵的公司,目标是为整体业务争取约1.5万亿美元的估值,这一水平将接近沙特阿美在2019年创纪录上市时确立的市值。 不过,约翰…

2025-12-15

12月下半月手机圈再掀热潮 三款新机齐发 最高售价直逼万元
该系列定位中高端,定位低于此前发布的华为Mate 80系列,将推出包括华为nova 15和华为nova 15Pro在内的多款机型。作为该系列第四款机型,小米17 Ultra聚焦专业级移动摄影体验,预计将搭载…

2025-12-15

一加15:3999元起售却配置拉满,3500元档位性价比“王者”来袭
搭载3nm骁龙8至尊芯、7300mAh电池+120W快充、165Hz电竞屏和全焦段三摄,用旗舰配置打出中端价格,成为3500元档位最凶猛的'价格屠夫。设计细节上,一加15延续简洁利落的「金属魔方」Deco设计…

2025-12-15

探秘小米汽车超级工厂:科技赋能 打造新能源智能制造新标杆
在中国汽车工业飞速发展的浪潮中,小米汽车超级工厂如一颗璀璨的明珠,正闪耀在京华大地上。这个由小米公司投资建设的大型现代化汽车生产基地,展现了前所未有的科技魅力和制造实力。涂装车间则以环保为先,采用80%水性涂…

2025-12-15