ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

月之暗面Kimi-Researcher登顶HLE,AI智能体新强者来袭!

时间:2025-06-23 11:10:01来源:ITBEAR编辑:快讯团队

月之暗面公司今日震撼发布其备受瞩目的Kimi研究功能,正式进军竞争激烈的AI智能体领域。据悉,该功能在多项严格测试中展现出了卓越性能,特别是在“人类终极考验”(HLE)测试中,以压倒性优势超越了谷歌与OpenAI的同类产品,荣登榜首。

Kimi研究功能的核心竞争力在于其自主研发的Kimi-Researcher智能体,这款智能体在多轮搜索与推理方面展现出了非凡的能力。据统计,Kimi-Researcher在执行任务时,平均会执行23个推理步骤,并浏览超过200个相关网页,其强大的信息处理与分析能力令人瞩目。

在HLE测试中,Kimi-Researcher基于Kimi k-系列模型的内部版本构建,并通过端到端的智能体强化学习进行训练。其Pass@1得分率达到了26.9%,Pass@4准确率更是高达40.17%,刷新了业界记录。尤为Kimi-Researcher的HLE初始得分仅为8.6%,经过强化学习训练后,成绩实现了质的飞跃,这充分证明了端到端智能体强化学习在提升智能体智能水平方面的巨大潜力。

Kimi-Researcher在多个复杂且具有挑战性的真实世界基准测试中同样表现出色。在xbench测试的xbench-DeepSearch项目上,Kimi-Researcher取得了69%的Pass@1得分率(四次运行平均值),优于其他配备搜索工具的模型。在涉及多轮搜索推理(如frameS、Seal-0)和事实性信息问答(如SimpleQA)的基准测试中,Kimi-Researcher同样展现出了卓越的性能。

为了让更多用户能够体验到Kimi-Researcher的强大功能,月之暗面公司宣布,即日起将逐步向用户开放内测申请。用户只需访问kimi.com即可提交申请。更令人期待的是,月之暗面公司计划在未来几个月内开源Kimi-Researcher背后的基础预训练模型以及经过强化学习训练后的模型,这将为AI社区的发展注入新的活力。

感兴趣的用户可以访问月之暗面公司的GitHub页面(https://moonshotai.github.io/Kimi-Researcher/),了解更多关于Kimi-Researcher的详细信息。

更多热门内容
冒险再启程!快手团综《带你趣户外2025》官宣定档
热血冒险,步履不停。近日,由快手平台出品的首档户外互动竞技直播团综《带你趣户外》正式宣布回归定档。据悉,今年再度启航的《带你趣户外2025》将邀请快手主播加盟,开启《带你趣巴厘岛》与《带你趣香港》的冒险新篇章,分别于6月21日与7月5日分别开播。节目中,快手

2025-06-23

快手618购物节:全域经营驱动行业增长,成交破亿商品数同比增长475%
全域经营带动快手618购物节实现突破性增长。6月19日,快手电商发布2025快手618购物节收官战报,货架场持续高速增长,泛货架商品卡GMV同比增长超53%,搜索GMV同比增长超143%,快手商城大牌大补频道百万GMV单品数同比增长超124%,内容场消费繁荣,挂车短视频GMV同比增长超

2025-06-23

掀翻传统推荐!OneRec端到端模型如何同时"吞噬"效果与成本双难题
AI大模型(LLM)掀起的生成式革命,正重塑各行各业,连我们每天刷到的推荐系统也不例外。传统推荐系统像一条多环节的“流水线”(级联架构),容易导致算力浪费、目标冲突,制约了发展。要突破瓶颈,关键在于用LLM技术进行“一体化”重构,实现效果提升和成本降低。快手技术

2025-06-23