ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

蚂蚁 Agentar-Fin-R1:重构金融智能体开发平台技术底座,定义行业服务新标杆

时间:2025-08-02 11:40:51来源:互联网编辑:茹茹

当金融业务进入智能化深水区,对 AI 模型的专业深度、推理精度和合规可靠性提出了前所未有的要求。蚂蚁集团推出的 Agentar-Fin-R1 系列金融大语言模型,以 8B 和 32B 参数规模为支点,通过三大核心创新构建起金融智能体开发平台Agentar的 “最强服务引擎”,重新定义了金融 AI 的技术边界与应用可能。

一、直击行业痛点:金融智能体的 “能力断层” 与解决方案

现有金融 LLM 存在显著能力短板:非推理型模型虽整合领域知识,却缺乏复杂决策所需的多步分析能力;推理增强型模型则在场景适配性上不足,难以应对市场动态、合规约束等金融特有需求。

Agentar-Fin-R1 的突破在于构建了 “知识 - 推理 - 合规” 三位一体的架构:

专业标签体系:通过场景(银行、证券、保险等)与任务类型(实体识别、意图分类等)的二维标签系统,实现金融任务的精准拆解与数据对齐,确保模型理解金融业务的 “语境特殊性”。

多层级可信框架:从源头(权威金融数据)、合成(多智能体验证)到治理(去重、 detox 等),全链路保障数据可信度,解决金融领域 “幻觉输出” 的合规风险。

动态归因系统:通过实时追踪模型错误来源,定向优化数据分配与训练策略,让模型在风险评估、 portfolio 优化等复杂任务中持续进化。

二、技术突破:让金融智能体 “会思考、可信赖、高效率”

Agentar-Fin-R1 的技术架构直指金融智能体开发的核心诉求 ——高性能与高可靠的平衡。

难度感知的加权训练框架

传统训练对简单与复杂任务 “一视同仁”,导致模型在高价值复杂任务(如多步风险定价)上表现薄弱。该模型通过 pass@k 分数动态评估任务难度,对低通过率任务赋予更高训练权重,例如在信贷违约预测等高频复杂场景中,模型关注度提升 30% 以上,显著降低决策误差。

两阶段训练的效率革命

第一阶段:通过监督微调(SFT)注入金融知识,整合 300K + 高质量金融推理数据,构建基础能力底座;

第二阶段:采用 GRPO 强化学习与靶向微调结合,专攻复杂场景(如动态合规校验),使模型在 Finova 基准的复杂推理维度得分达 56.33,超越 GPT-o1 等通用大模型 15% 以上。

Finova 基准:定义金融智能体的 “实战标准”

蚂蚁创新推出的 Finova 基准,从智能体能力(意图识别、工具规划等)、复杂推理(金融数学、代码理解)、安全合规三大维度,全面模拟真实金融业务场景。Agentar-Fin-R1-32B 在该基准中以 69.93 的总分登顶,尤其在 “金融表达式生成”(69 分)和 “安全合规”(87 分)上表现碾压,证明其能直接支撑高风险业务的落地。

三、服务赋能:为金融智能体开发平台注入 “最强动力”

对于金融智能体开发平台Agentar而言,Agentar-Fin-R1 的价值体现在三个层面:

开箱即用的专业能力:模型在 Fineva(92.38)、Fineval 1.0 (87.70)等权威金融基准中均居榜首,开发者无需从零训练,可直接集成到智能投顾、风控审核等系统,缩短开发周期 60% 以上。

灵活适配的技术接口:支持 8B(轻量化)与 32B(全能力)双版本,满足从移动端客服智能体到企业级量化交易系统的差异化需求,且保持通用推理能力(MATH-500 得分 93.8),避免 “专精废全”。

合规兜底的安全保障:通过多智能体数据验证与动态合规校验,模型在反洗钱、信息披露等敏感场景的错误率低于 0.5%,为平台提供 “合规即服务” 的底层支撑。

结语:从 “模型能力” 到 “产业价值” 的跨越

Agentar-Fin-R1 的推出,不仅是技术层面的突破,更标志着金融 AI 从 “通用赋能” 向 “深度渗透” 的转型。其通过标签化数据治理、动态训练优化和场景化评估体系,为金融智能体开发平台提供了 “最强服务” 的技术范式 —— 让 AI 不仅能处理金融任务,更能理解金融业务的本质逻辑与风险边界。这一创新,或将推动智能投顾、自动化合规、跨境金融等领域的效率革命,成为蚂蚁集团在金融科技赛道的核心竞争力支点。

更多热门内容
终结“油车不智能”时代!联手奥迪,A5L Sportback首搭华为乾崑智驾
8月1日,上海国际赛车场迎来一场改写燃油车智能化历史的盛会——全球首款搭载华为乾崑智驾技术的燃油车上汽奥迪A5L Sportback正式上市。华为乾崑智驾与上汽奥迪以 德系机械底蕴+中国智能科技 的突破性组合,“打破高阶智驾”仅属新能源车的行业偏见。华为智能汽车解决方

2025-08-02

TTS泰得思革新N15离型膜技术,解决食品内包装剥离难题
2025年,随着全球医药产业链加速重构与创新驱动发展战略的深化,中国大健康产业迎来窗口期,那么如何优化产业链原料,保障生产安全标准,并推动品牌的国际化进程?TTS泰得思携手某护肝片品牌,为行业带来一份创新答案。通过在护肝片的覆膜阶段使用医用级离型膜产品TTS-N1

2025-08-01

美的空调新品发布:以科技之力,打造理想的全屋空气
盛夏酷暑,高温天气持续,当人们回到家中,迎接他们的往往是如同蒸笼般的闷热环境。传统制冷方式在应对现代家庭对舒适度日益增长的需求时,已显得力不从心。如何让夏天更舒适,成为了亟待解决的难题。8月1日,美的空调在上海美的全球创新园区举办了一场题为“全屋空气,

2025-08-01

算得准!理得清!身边云-灵活就业者累计预扣个税计算器上线
2025年6月,国务院第810号令《互联网平台企业涉税信息报送规定》及国家税务总局配套公告相继发布,明确互联网平台企业对从业人员取得的劳务报酬所得,按照累计预扣法计算并预扣预缴税款。《规定》和配套公告的实施,对平台企业的税务管理能力提出了新要求,也使得劳务报

2025-08-01

星海暖夜:工程师的紧急救援与贴心守护
七月的大连正值旅游旺季,也是毕业季的尾声。无论是慕名而来的游客,还是怀揣梦想的学子,无不将星海广场视为了解这座海滨城市的必经之地。苏女士便是其中之一,这位刚研究生毕业的年轻学者,来到大连攻读博士学位,渴望在学术之路上更进一步。然而,当她在星海广场旁的

2025-08-01

国补政策结束了吗?国补第三批资金690已下达8月将恢复继续领取,附2025年国补领取入口和方法!
“补贴资格已激活!”7 月 31 日晚,重庆张阿姨刷新手机时,盯着这行字长舒一口气 —— 她惦记了一个月的一级能效冰箱,终于能省 2000 元了。同一时刻,财政部下达的第三批 690 亿元以旧换新补贴,正加急涌向全国。首先,划重点! 家电家具国补资格的领取方法入口是:京东AP

2025-08-01

以耐用技术创新 绿源推动电动车产业高质量发展
清晨的中国城市街道上,两轮电动车是常见的出行工具。但对于家住北京通州的上班族陈女士而言,便捷出行的背后也有困扰:短短两年内因电池等故障产生的意外支出,以及日常通勤中动力逐渐衰减的不确定性,“不耐用”成为她用车时的主要顾虑。随着电动两轮车深度融入中国家

2025-08-01

努比亚布局游戏二次元,携手洛天依亮相ChinaJoy2025
8月1日,第22届中国国际数码互动娱乐展览会(ChinaJoy)在上海盛大启幕。中兴通讯终端品牌努比亚布局游戏二次元,在大会上与哔哩哔哩(B站)旗下的虚拟歌手洛天依达成合作,通过“科技+二次元IP”跨界融合,为Z世代人群带来个性、潮流的科技体验。现场,努比亚携手洛天依构

2025-08-01

英伟达“后门”风险存疑?国产芯片纷纷掏出“安全牌”
自7月31日,网信办就H20算力芯片漏洞后门安全风险约谈英伟达公司后,当日晚间,英伟达火速发布声明:“网络安全对我们至关重要。芯片不存在‘后门’,并不会让任何人有远程访问或控制这些芯片的途径。”然而,这并未完全打消业界对英伟达的质疑。就在H20解禁前,美国国

2025-08-01

发钱养娃!这个高端母婴品牌要火出圈
最近母婴界将迎来一个利好消息!7月28日,国家级育儿补贴制度实施方案正式发布,明确从2025年1月1日起,每个3岁以下的宝宝每年能领3600元育儿补贴,直接打到家长账户。消息一出,母婴相关的概念股立马集体飘红,贝因美、孩子王这些公司股价直接涨停;而刚通过境外上市备案

2025-08-01