ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

陈天桥创立的AI公司MiroMind成为全球顶尖预测型大模型,性能领先行业基准

时间:2025-09-22 13:59:30来源:互联网编辑:茹茹

科技的走向、股市的涨跌、比赛的胜负、选举的结果……在AI时代,未来还会像过去那样不可知吗?全球首个动态实时LLM智能体未来预测基准FutureX推出,被马斯克称为衡量智能的最佳标准。9月18日,全球创新企业家、慈善家陈天桥旗下的MiroMind团队在这一AI未来大考中,连续第二周蝉联冠军。与专注文本输出的生成式模型不同,MiroMind 采用记忆驱动机制,专为预测与决策设计,旨在打造全球最好的预测大模型。

科幻电影早已为我们描绘过可能性:《少数派报告》AI预测犯罪,让“未发生的事件”变得可防可控;《Her》智能系统能够预测人类行为和选择。今天,这些幻想正逐步照进现实。长期以来,AI评估大多停留在答案已知的静态问题上,如同学生反复练习往年高考试卷。然而,真正有价值的能力是对未知未来的准确预测。投资和规划将不再依赖盲目试错,可以提前洞察趋势,把握机遇,有效规避风险,真正掌握主动权。毕竟,谁不曾幻想过回到过去,提前买入Nvidia或Tesla呢?

正如伊隆·马斯克所说:“预测未来的能力是衡量智能的最佳标准。”让AI具备像人类一样在不确定环境下的决策能力,这正是通向AGI的重要一步。

1758520176100495.jpg

首次参与打榜,Grok取得第一名,MiroMind为开源模型的第一。马斯克为此兴奋发文,称之为最好的benchmark

FutureX与Prophet Arena:AI智能体未来预测基准的诞生

不久前,字节跳动 SEED 团队联合斯坦福大学、复旦大学、普林斯顿大学共同推出Future X,是全球首个动态实时 LLM 智能体未来预测基准。它从全球200多个高质量网站精选只有下周才会有明确结果的问题,让AI直面正的未来事件:股票价格的涨跌、体育比赛的胜负、政治选举的结果、科技公司的战略走向等。

这种评估方式的核心优势非常显著。AI 必须像人类分析师一样,基于当前可获得的信息,运用逻辑推理、趋势分析和概率计算来做出预测。这一机制极大地推动了 AI 智能体在真实世界复杂场景中的实用能力提升,也成为衡量智能体系统核心智能水平的重要标杆。

Prophet Arena则是另一个AI预测能力评估平台,通过实时收集和分析真实世界事件,考察AI模型在不确定性推理、信息整合和概率预测等方面的表现。

MiroMind如何成功预测未来

MiroMind 在 FutureX 榜单上表现惊艳。8 月第 3 周,首次参与即获得第六名的成绩。而在 9 月的提交中,更实现了双重突破:搭载 GPT-5 的 MiroFlow 智能体框架在第 1 周和第 2 周连续夺得榜首,同时搭载自研模型 MiroThinker 的 MiroFlow 均位列前五,力压众多国际顶尖机构和闭源商业模型。

1758520209545027.jpg

在测试中,MiroMind 成功预测了 2025 年 9 月 9 日ATP 男子单打排名第 4-6 位的选手,其难点在于网球排名系统极为复杂,涉及积分计算、比赛结果、时间窗口等多个变量。

MiroMind 的模型在预测中制定了五步策略:

1. 制定详细预测计划:模型首先展现了战略规划能力,制定了系统性的预测方案。

2. 获取基础数据:通过网络检索获取 9 月 1 日的男子网球 TOP 10 排名数据,建立预测基准线。

3. 理解积分规则:深入研究比赛排名与积分的对应关系,特别对比了 2024 年与 2025 年的 dropping 规则,确保计算一致性。

4. 动态信息更新:搜索 9 月 1 日之后的比赛成绩,并分类处理:对已有结果的比赛,直接更新对应选手排名;对尚未结束的比赛,识别其可能影响。

5. 概率分析与综合判断:多情景分析,针对尚未出结果的比赛,模型分析了6种可能情况;引入博彩网站概率数据,作为外部验证基准;最终基于 outcome 和 probability 加权计算,得出最可能排名结果。

MiroMind 还成功预测了 2025 年 9 月 11 日 数字加密货币 Solana 将突破的一系列关键价格档位,体现了模型在处理价格波动类问题上的系统建模能力与风险控制水平。这轮预测中,MiroMind 则是制定了六步策略:

1. 构建市场基准线:聚合 CoinGecko、Coinbase、Binance、Kraken 等多平台实时数据,明确 Solana 当前价格区间及近期价格走势,建立精准预测起点;

2. 量化短期波动空间:基于历史数据计算年化波动率、平均日内振幅等关键指标,评估 Solana 在一天内可能达到的价格区间,判断各档位的突破概率;

3. 梳理外部影响因素:系统检索 9 月 10 日的宏观经济事件(如美国 PPI 发布)、Solana 链上动态和潜在生态活动,评估是否存在可能引发剧烈波动的催化因素;

4. 分析市场情绪信号:提取 OKX、Kraken 等平台的永续合约资金费率与基差数据,判断市场是否存在明显的多空倾斜,作为重要情绪指标参考;

5. 挑选稳健价格档位:结合价格分布、风险容差与市场结构,挑选那些在大多数行情路径下都有可能成立的价格档位,避开临界边缘值,确保预测结果稳健可靠;

6. 交叉验证与最终判断:对比统计结果、衍生品信号与第三方市场预期,最终确定最优预测选项,兼顾稳健性与覆盖率。

MiroMind 的登顶并非偶然,而是基于AI预测未来的几项核心能力:

· 信息洞察力:能快速抓取、理解和整合海量数据——从股市行情到新闻动态,再到社交舆情。没有全面信息,预测就是空想。

· 逻辑推理与趋势感知:能发现模式、识别因果、判断趋势。未来不是凭直觉,而是建立在严密逻辑和数据分析之上。

· 概率与不确定性管理:能量化可能性、权衡风险,在不确定环境下做出最优判断。未来充满变数,聪明的预测是概率化的决策。

· 跨领域整合能力:能把金融、政治、科技、社会等多领域信息融会贯通。未来事件往往是多因素交织,单一视角难以洞察全局。

建设最好预测大模型和创新者平台

MiroFlow 框架在 GAIA-Validation 上也取得了 82.4% 的优异成绩,并在 HLE、BrowseComp 以及 xBench-DeepSearch 等基准测试中领先众多国际对手。更值得关注的是,MiroFlow 提供了完全开源、可复现的框架和配置,致力于建设一个创新者平台。这个平台为研究者和开发者提供从基础框架、模型到工具链的完整支持,使大家能够自由实验、快速迭代,并在多 Agent 协作、多模态理解等前沿领域进行探索。

1758520126919740.png

MiroFlow 框架之外,MiroMind 团队推出的自研旗舰基础智能体模型(Agent Foundation Model)——MiroThinker,不仅具备强大的推理、决策和多模态理解能力,还能在多 Agent 协作中发挥核心作用,在各类榜单中已成为开源模型的引领者,并不断缩小与闭源商业模型的差距。MiroThinker 很快将以完全开源的形式向全球开发者和研究者开放,提供可复现的模型和实验环境。

陈天桥:持续投入,诚邀全球AI人才

从盛大,到天桥脑科学研究院,再到All in AI,陈天桥四分之一个世纪以来持续探索人类未来科技的边界:

· 虚拟世界的创造者,1999年创办盛大,开创了中国网络游戏与网络文学行业。

· 人类大脑的探索者,2016年创办全球最大的私人脑科学机构天桥脑科学研究院,在脑机接口等基础、前沿研究领域硕果累累。

· 未来世界的塑造者,开展AI+长期记忆、AI预测未来等全新前沿探索。目前MiroMind 正在探索将长期记忆模块深度嵌入模型,在复杂、多变的环境中做出更精准可靠的预测,实现真正的时间维度智能。

陈天桥说:“我们正在全力打造一个全球最好的预测大模型,让AI记住过去,洞察未来。我们持续欢迎全球志同道合的AI优秀人才加入,共同创造未来。”

更多热门内容
【AI 智惠季】全模态大模型齐发优惠,GPU新客包月2.8折起
随着AI技术加速融入千行百业,近日阿里云正式启动双十一“AI智惠季”大型优惠活动,为广大企业及开发者送上全栈AI云的政策及福利。此次活动聚焦企业多元AI场景落地需求、推出7000万tokens大模型免费体验,助力企业零门槛点燃AI创造力;提供了GPU 新客特惠活动,大幅降低A

2025-11-01

元戎启行“破局”:全国首家消费级量产车 Robotaxi 年底即将落地
10月31日,元戎启行宣布与无锡市政府签约建设测试研发基地,进一步提速自动驾驶出租车(Robotaxi)业务落地。元戎启行CEO周光表示,“公司计划于今年年底以消费级量产车型落地Robotaxi业务,届时将成为全国首家以消费级量产车开展Robotaxi业务的企业。”对比行业内普遍采

2025-11-01

第八届进博会倒计时5天,德国卡赫进入布展冲刺阶段
距离第八届中国国际进口博览会开幕仅剩5天。作为连续八届参展的“全勤生”,恰逢品牌成立90周年的德国卡赫,将携六大首发首秀展品,再度奔赴“进博之约”。日前,伴随着卡赫商用矿泉鲜水机作为首批展品进馆,德国卡赫的布展工作已进入最后冲刺阶段。作为全球最大的清洁

2025-11-01

短交通产品电池安全有了新国标,九号率先完成“全系转换”
无论是手机、汽车,还是各类短交通工具、甚至是商场里的共享充电宝,大家每天都在和电池打交道。它藏在金属外壳、塑料外壳甚至脚踏板下,不被看见,却承载着提供出行动力能量的主要职责。绝大多数时候,没人会去想它——直到安全事件发生,才会意识到:评判电池的体验好

2025-11-01

11月1日苏超决赛福利来袭:上京东猜胜负赢京豆、签名球衣1元起拍、武艺陪你看直播
随着江苏省城市足球联赛(以下简称“苏超”)决赛战幕将启,作为苏超官方战略合作伙伴,京东11月1日推出京东11.11“球迷惊喜日”主题活动,通过多重福利活动,为球迷带来一场沉浸式的观赛体验。活动期间,消费者不仅可1元竞拍C罗、梅西等众多球星亲签球衣等稀缺藏品、参与

2025-11-01

重磅登场!京东物流狼族机器人全阵容亮相世界物联网博览会
10月31日,以“万物智联、无尽前沿”为主题的世界物联网博览会在江苏无锡正式开幕。在这个全球物联网领域最具影响力的展会上,京东物流“狼族”智能机器人军团以全系列产品阵容重磅亮相,成为展会焦点。本次物博会正值京东11.11大促期间,京东物流首次将经过实战检验的

2025-11-01

京东直播开展“暖阳助老公益行动” 联手芙崽、雨森、元萝卜等品牌捐赠爱心物资
10月29日重阳节,京东直播在中国老龄事业发展基金会、京东公益联合发起的“暖阳助老公益行动” 中,以“暖阳速递·总裁送温暖”为直播主题,联合芙崽、雨森、元萝卜、爱舒乐、多亲(QIN)等品牌积极参与,通过直播形式向养老院捐赠爱心物资。创新公益模式,直播传递温暖本

2025-11-01

48小时斩获200+台订单!FX Super One创中东MPV销售纪录
10月31日,Faraday Future(纳斯达克代码:FFAI),简称FF)宣布,FX Super One在中东终结发布会结束后48小时内累计收取B2B不可退付费预订单200+台,体现出B2B合作伙伴对FX Super One的超高热情和信心。2C付费预订单中,有一台是用户通过USTD加密资产成功预订FX Super One

2025-11-01

官宣!八位堂格斗产品代言人双子星闪耀登陆
八位堂品牌创立于2013年7月15日,历经十多年发展,八位堂已成长为国内知名的游戏外设厂商,不断破圈,声名远播。在2025年街霸6白金赛来临之际,八位堂正式官宣:与中国职业格斗游戏新生代力量——Zhen村肉和Vxbao小宝签约,八位堂格斗产品代言人双子星闪耀登陆!Zhen村肉

2025-11-01

联想保值换新保障来袭:双十一买得安心,用得更久
年终将近,桌上那台陪伴了一整年的设备,似乎也在悄悄“泄气”:开机越来越慢,软件频繁卡顿,风扇一天比一天吵,甚至连平时最信赖的键盘鼠标都开始“不听话”,明明还没打算换电脑,设备却开始用各种“暗示”逼你做决定。更糟的是,这些问题通常不是一下子爆发,而是“

2025-11-01