ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

三星AI研究院发布开源TRM模型:小参数大作为,结构化推理领域挑战顶尖大模型

时间:2025-10-10 15:35:42来源:互联网编辑:快讯

三星高级人工智能研究院近日公布了一项突破性成果——一款名为微型递归模型(TRM)的开源AI系统,其参数规模仅700万,却在特定结构化推理任务中展现出与谷歌Gemini 2.5 Pro等万倍参数量级模型相抗衡的实力。这一发现为AI领域“小而精”模型的发展提供了全新思路。

该模型由研究院资深研究员Alexia Jolicoeur-Martineau团队开发,其核心设计理念颠覆了传统AI架构。不同于依赖多层网络协作的分层推理模型(HRM),TRM采用仅含两层的极简结构,通过“递归推理”机制实现性能突破。模型会反复检验自身输出的预测结果,在每轮迭代中修正前序错误,直至获得稳定解。

这种设计使TRM在保持低计算资源消耗的同时,通过深度迭代模拟了大型模型的复杂推理过程。研究团队形象地将其策略概括为“以递归替代规模”,即通过算法优化而非参数堆砌实现性能提升。

在实测环节,TRM在多个结构化任务基准测试中表现亮眼:极限数独测试准确率达87.4%,困难迷宫任务准确率85%,抽象推理能力测试ARC-AGI中取得45%准确率,ARC-AGI-2测试准确率则为8%。这些数据表明,其性能已接近或超越DeepSeek R1、o3-mini等知名大模型,尽管参数规模不足后者的0.01%。

但研究团队明确指出,TRM的卓越表现具有特定适用范围。该模型专为数独、迷宫等规则明确的网格类问题优化,在需要开放式语言生成的场景中并不适用。其优势在于封闭环境下的精确逻辑推理,而非通用语言处理能力。

深入分析显示,TRM的成功源于对“极简主义”的极致追求。实验表明,增加模型层数或参数规模反而会导致小数据集上的过拟合现象,降低实际性能。双层结构与递归机制的组合,恰好实现了复杂度与效率的最优平衡。

目前,TRM的全部代码、训练脚本及测试数据集已通过MIT许可证在GitHub平台开源。全球开发者可自由获取、修改并用于商业项目,这一举措预计将推动结构化推理AI在工业、教育等领域的快速应用。

更多热门内容
百融云创领衔智能体生态建设 携手伙伴共拓AI应用新边界
作为智能体产业的早期探路者与行业引领者,百融云创将以此次受聘“智能体生态建设工作组组长单位”为契机,承接更多行业使命。 面向未来,百融云创将依托在垂直行业的深耕与泛行业的实践经验,联动产学研各界,不断拓宽A…

2025-10-10

Figure AI推出Figure 03人形机器人:家庭商业双场景适用,多项性能显著升级
公司表示Figure 03的视觉架构经过全面升级,帧率提升一倍、延迟减少四分之一、单镜头视野扩大 60%,并具备更宽的景深范围。公司还表示,Figure 03具备10Gbps毫米波数据传输能力,能将所有机…

2025-10-10

心理VR设备:以沉浸式体验赋能心理咨询,从技术到应用解锁新可能
这类设备通过沉浸式体验帮助用户进行情绪调节和认知训练,在焦虑症、创伤后应激障碍等心理问题的辅助治疗中展现出独特优势。国内一些专业机构如玖辰心理开发的VR心理调试系统,结合放松训练和情绪宣泄功能,为不同年龄段的…

2025-10-10

长虹AI中台赋能“数字员工”上岗,驱动企业运营效能与智能化升级双提升
作为中国制造业领军企业,在以AI技术为核心的新一轮比拼中,长虹敏锐把握技术变革机遇,将 AI技术与企业全场景运营深度融合,构建起以“AI+运营”为核心的智能生态体系,打造了长虹企业级智能体开发平台(以下简称…

2025-10-10