ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

AI模型评估赛道崛起:90后团队打造LMArena 获1.5亿美元融资估值17亿

时间:2026-01-07 23:46:47来源:快讯编辑:快讯

AI大模型评估领域迎来一匹黑马——LMArena正式宣布完成1.5亿美元A轮融资,公司估值跃升至17亿美元。这支由90后华人主导的团队,凭借独特的评估模式和开源技术积累,在资本市场掀起热潮。本轮融资由Felicis与加州大学投资公司UC Investments联合领投,Andreessen Horowitz、The House Fund等知名机构跟投。

故事要从2023年ChatGPT引发的AI革命说起。当时由UC伯克利、斯坦福等顶尖高校学者组成的开源组织LMSYS,因开发出革命性的推理引擎SGLang崭露头角。该引擎首次实现96块H100显卡集群达到接近DeepSeek官方报告的吞吐量,现已被xAI、英伟达、阿里云等全球数十家科技企业采用。但真正让团队出圈的,却是他们为验证自研模型Vicuna性能而打造的第三方评估平台——Chatbot Arena。

"传统基准测试无法区分模型的真实水平。"LMSYS核心成员郑怜悯回忆道。他们开创性地将模型匿名化,通过用户实际交互投票决定优劣。这种双盲测试模式迅速吸引全球AI开发者,新模型发布前都会偷偷在这个平台"打榜"。随着影响力扩大,2024年Chatbot Arena正式独立为商业公司lmarena.ai,转型专注AI模型评估赛道。

当前主打的LMArena平台构建了三维评估体系:匿名对战机制下,用户提问后系统随机匹配两个模型匿名作答,投票后才揭晓身份;评分系统采用改进版Elo算法,通过胜负关系动态调整分数;人机协同框架则通过算法平衡模型曝光度,避免"刷榜"行为。这种设计使评估结果兼具实时性与客观性,成为行业公认的"模型试金石"。

数据印证着平台的爆发式增长:自2024年获得1亿美元种子轮融资后,累计收集5000万张跨模态投票,完成400余种开放/专有模型评估,产出14.5万个开源战斗数据点。当前排行榜上,Gemini 3 Pro以1490分领跑,OpenAI、Anthropic等头部企业的模型均在此接受检验。资本的青睐与行业的认可,让这个由学术团队转型的创业公司,在AI评估赛道走出独特路径。

更多热门内容
马斯克立下“军令状”:Grok两月后能否追上并超越Claude Opus 4.6?
根据金融界AI电报的报道,Claude Opus4.6在“GDPval-AA”这一评估金融、法律等领域经济价值知识工作任务的性能指标上,表现极为强劲,且在“Agent编程评估Terminal-Bench …

2026-04-12

OpenAI“星门”项目三名核心成员或将转投Meta 助力其AI布局
来源:观点地产网 观点网讯:4月12日,据媒体报道,知情人士透露,参与OpenAI“星门”项目的三名核心人员即将加盟Meta公司。 这些人员包括曾在项目中发挥关键作用的彼得·赫舍勒,以及负责算力战略与业务拓展…

2026-04-12

马斯克携XChat入局通讯领域,端对端加密或成“西方微信”新亮点
来源:滚动播报 科技界亿万富翁、X(原Twitter)、特斯拉及SpaceX首席执行官埃隆·马斯克周日宣布推出一款名为XChat的全新通讯应用。这款应用主打端对端加密、无广告、无追踪。从2025年5月内测算起…

2026-04-12

谷歌CEO深度对话:错失先机不气馁,2027年AI领域将迎质变飞跃
但这也会让你陷入一种反思:“既然AI都能帮我总结了,那我到底还应该投入多少第一手的精力,去亲身体验那种一线体感?但我从 Waymo的漫长研发中、以及在AI端亲自做TPU芯片等项目里获得的一个核心经验是,如果…

2026-04-12

小米成都郫都区产教融合基地启用 构建全国化阵地网络赋能西部发展
观点网讯:4月12日,据“成都发布”发布,小米集团在成都市郫都区成都科幻馆举行2026小米新一代智能硬件技术行业产教融合共同体年会,现场完成小米全国第三座产教融合基地启用签约。 据介绍,这是小米继江苏常熟、河…

2026-04-12

小红书首届黑客松巅峰赛收官:00后成主力军,12岁少年与初中生团队闪耀赛场
其中“脑控轮椅”获硬件赛道一等奖,AI发型设计产品“Chic Chic”获软件赛道一等奖,口袋吉他智能硬件PocketGuitar摘得全场大奖。 而获得“AI原住民”特别单元奖的团队Page One则由4…

2026-04-12