AI模型评估赛道崛起：90后团队打造LMArena 获1.5亿美元融资估值17亿-业界动态-ITBear比尔科技

AI大模型评估领域迎来一匹黑马——LMArena正式宣布完成1.5亿美元A轮融资，公司估值跃升至17亿美元。这支由90后华人主导的团队，凭借独特的评估模式和开源技术积累，在资本市场掀起热潮。本轮融资由Felicis与加州大学投资公司UC Investments联合领投，Andreessen Horowitz、The House Fund等知名机构跟投。

故事要从2023年ChatGPT引发的AI革命说起。当时由UC伯克利、斯坦福等顶尖高校学者组成的开源组织LMSYS，因开发出革命性的推理引擎SGLang崭露头角。该引擎首次实现96块H100显卡集群达到接近DeepSeek官方报告的吞吐量，现已被xAI、英伟达、阿里云等全球数十家科技企业采用。但真正让团队出圈的，却是他们为验证自研模型Vicuna性能而打造的第三方评估平台——Chatbot Arena。

"传统基准测试无法区分模型的真实水平。"LMSYS核心成员郑怜悯回忆道。他们开创性地将模型匿名化，通过用户实际交互投票决定优劣。这种双盲测试模式迅速吸引全球AI开发者，新模型发布前都会偷偷在这个平台"打榜"。随着影响力扩大，2024年Chatbot Arena正式独立为商业公司lmarena.ai，转型专注AI模型评估赛道。

当前主打的LMArena平台构建了三维评估体系：匿名对战机制下，用户提问后系统随机匹配两个模型匿名作答，投票后才揭晓身份；评分系统采用改进版Elo算法，通过胜负关系动态调整分数；人机协同框架则通过算法平衡模型曝光度，避免"刷榜"行为。这种设计使评估结果兼具实时性与客观性，成为行业公认的"模型试金石"。

数据印证着平台的爆发式增长：自2024年获得1亿美元种子轮融资后，累计收集5000万张跨模态投票，完成400余种开放/专有模型评估，产出14.5万个开源战斗数据点。当前排行榜上，Gemini 3 Pro以1490分领跑，OpenAI、Anthropic等头部企业的模型均在此接受检验。资本的青睐与行业的认可，让这个由学术团队转型的创业公司，在AI评估赛道走出独特路径。

智元分拆四足机器人业务，以AGI赋能新物种，剑指百亿市场新蓝海

2026-04-12

天娱数科CineART接入字节跳动Seedance 2.0 开启AI视频创作新征程

2026-04-12

一汽奥迪纯电新车：藏起激光雷达，以德系克制拥抱中国创新浪潮

2026-04-12

马斯克立下“军令状”：Grok两月后能否追上并超越Claude Opus 4.6？

根据金融界AI电报的报道，Claude Opus4.6在“GDPval-AA”这一评估金融、法律等领域经济价值知识工作任务的性能指标上，表现极为强劲，且在“Agent编程评估Terminal-Bench …

2026-04-12

OpenAI“星门”项目三名核心成员或将转投Meta 助力其AI布局

来源：观点地产网观点网讯：4月12日，据媒体报道，知情人士透露，参与OpenAI“星门”项目的三名核心人员即将加盟Meta公司。这些人员包括曾在项目中发挥关键作用的彼得·赫舍勒，以及负责算力战略与业务拓展…

2026-04-12

马斯克携XChat入局通讯领域，端对端加密或成“西方微信”新亮点

来源：滚动播报科技界亿万富翁、X（原Twitter）、特斯拉及SpaceX首席执行官埃隆·马斯克周日宣布推出一款名为XChat的全新通讯应用。这款应用主打端对端加密、无广告、无追踪。从2025年5月内测算起…

2026-04-12

谷歌CEO深度对话：错失先机不气馁，2027年AI领域将迎质变飞跃

但这也会让你陷入一种反思：“既然AI都能帮我总结了，那我到底还应该投入多少第一手的精力，去亲身体验那种一线体感？但我从 Waymo的漫长研发中、以及在AI端亲自做TPU芯片等项目里获得的一个核心经验是，如果…

2026-04-12

小米成都郫都区产教融合基地启用构建全国化阵地网络赋能西部发展

观点网讯：4月12日，据“成都发布”发布，小米集团在成都市郫都区成都科幻馆举行2026小米新一代智能硬件技术行业产教融合共同体年会，现场完成小米全国第三座产教融合基地启用签约。据介绍，这是小米继江苏常熟、河…

2026-04-12

小红书首届黑客松巅峰赛收官：00后成主力军，12岁少年与初中生团队闪耀赛场

其中“脑控轮椅”获硬件赛道一等奖，AI发型设计产品“Chic Chic”获软件赛道一等奖，口袋吉他智能硬件PocketGuitar摘得全场大奖。而获得“AI原住民”特别单元奖的团队Page One则由4…

2026-04-12