ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

罗福莉深度剖析:Anthropic调整背后,AI行业该告别token低效消耗了

时间:2026-04-07 11:03:17来源:互联网编辑:快讯

近日,关于“Anthropic封禁OpenClaw”的讨论引发广泛关注,但实际情况是,Anthropic并未完全禁止第三方产品调用其能力,而是停止了通过Claude Pro等固定付费订阅模式直接调用的路径。用户若想使用Anthropic的模型和产品,仍可通过官方订阅模式或按量充费的API额度进行操作。这一调整被部分人误解为“封禁”,甚至引发“过河拆桥”的争议,但小米MiMo大模型负责人罗福莉从行业角度进行了深入分析,认为这一举措是必要的纠偏。

罗福莉指出,Anthropic此前推出的Claude Code订阅设计在算力分配问题上具有创新性,其逻辑是通过补贴重度用户来平衡轻度用户的低频使用,从而实现整体均衡。然而,这一模式的前提是用户必须使用Anthropic自身的框架。一旦脱离原生框架,第三方工具如OpenClaw的接入会打破这种平衡。她以OpenClaw为例,说明其在单次用户查询中会触发多轮低价值工具调用,每轮请求携带的上下文窗口往往超过100K tokens,导致实际请求次数是原生框架的数倍。按API定价计算,真实成本可能是订阅价格的数十倍。

除了请求次数的问题,第三方工具的缓存效率也令人担忧。罗福莉提到,许多第三方工具在接近上下文长度限制时,会频繁压缩工具返回结果,导致缓存命中率极低。Claude的缓存机制依赖上下文前缀的一致性,而压缩操作会改写上下文内容,使前缀失配,缓存失效,模型被迫重新全量读入。这种双重问题将每次查询的实际token消耗推向极值,使得订阅制赖以成立的分布假设彻底崩塌,Anthropic不得不独自承担成本缺口。

她用健身房办卡的例子形象地解释了这一现象:健身房的盈利模式依赖于部分用户办卡后不常使用,从而补贴高频用户的成本。但如果所有用户都像OpenClaw的用户一样,7x24小时高强度使用,健身房的成本将无法控制。同样,Anthropic的订阅制在第三方工具的滥用下,成本结构彻底失衡。

对于用户的愤怒,罗福莉认为这是短期阵痛,但长期来看有助于改善工程纪律。她指出,第三方工具仍可调用Claude,只是不能再依赖订阅制的“便宜”。短期内,用户会感受到成本激增,但这种压力将推动工具开发者优化上下文管理、提高缓存命中率、减少无效token消耗。她强调,订阅制的问题在于,它让开发者无需为单次请求的token消耗负责,导致上下文管理粗糙、缓存命中率低等问题被忽视。而一旦回到API计费模式,token浪费将直接体现在账单上,优化效率将成为商业驱动的工程需求。

罗福莉还批评了当前大模型行业的“token价格战”。她认为,单纯为了token消耗而狂欢,以及模型厂商为争夺用户而打的价格战,是不可持续的。她警告说,低价卖token的同时向第三方全面开放,看似对用户友好,实则是一个陷阱。Anthropic刚刚从这一陷阱中走出来,其他厂商若盲目跟进,可能导致用户在劣质工具、不稳定推理服务或降配模型上反复碰壁,最终影响用户体验和留存。

她进一步解释了这一陷阱的机制:大模型公司推出coding plan向第三方工具开放,会因上下文管理粗放、冗余请求和低缓存命中率而导致算力浪费,成本完全由平台承担。为了控制成本,平台只能降低算力或换用更便宜的低智模型,用户表面上有充足的额度,但实际效果不佳,留存率自然下降。问题的根源在于计费结构,订阅制切断了用量与成本之间的信号传导,迫使平台最终选择封禁第三方或降速、限流、降配模型。

罗福莉还介绍了小米MiMo的Token Plan,认为其走了一条不同的路。MiMo没有封掉第三方入口,而是改变了计费结构:按实际token消耗量配额,开发者购买以Credit为单位的token额度。无论使用原生框架还是第三方工具,每一个浪费的token都直接从用户的额度包里扣除。平台不再为低效工具买单,用得多付得多,用得糙成本高,“用量-成本”的关系重新透明起来。她将这套逻辑定位为:不是不让用,而是让计费结构本身成为约束机制,推动生态向高效率方向演化。

最后,罗福莉将视野拉到了更大的框架上。她指出,全球算力的供给速度已经追不上Agent场景下token消耗的增速,真正的出路不是更便宜的token,而是协同进化:更高token效率的Agent工具,乘以更强大、更高效的模型。她认为,Anthropic的调整,无论出于什么动机,都在客观上把整个生态推向了这个方向。对于各类工具产品以及模型厂商来说,这一举措的信号意义很强,若仍想着靠免费量大管饱去接住一波流量用户,就太不合时宜了。一个阶段性的狂欢是时候让位于在工程和基础设施设计上的真正重要的工作了。

更多热门内容
科梦奇迎宾机器人:解锁接待新场景,从入口到导览的智能服务全攻略
品牌对比如何理解科梦奇机器人侧重迎宾接待、场馆讲解、路线引导和内容展示,适合需要长期运行的接待空间。 日常使用中的任务分工迎宾机器人更适合承担清晰、重复、可标准化的岗位。科梦奇机器人在部署时,应结合入口视线…

2026-05-31

Hermes Agent智能体赋能Coredoo Store:构建全域电商智能运营新生态
Hermes Agent 智能体框架的出现,为企业搭建了一个“人机协同、数据驱动、智能决策”的全新商业中枢,将商城系统从传统管理平台升级为智能化运营生态。通过全域触点的覆盖,HermesAgent 智能…

2026-05-31

小米REDMI K90至尊版入网:骁龙8至尊版加持,165Hz高刷屏6月登场
作为旗舰系列,所有版本均为旗舰配置起步,确保整体性能需求,而区别在影像、续航、处理器、散热等方面,进行精准调整。 整体性能同样达到旗舰级别,可流畅运行各大手游,而且是高画质+高帧率模式下,提升视觉+游戏体验…

2026-05-31

拯救者Y70新机来袭!2K大屏搭配8000mAh电池,6月9日开启游戏新体验
“高配置、高性能”成为高端机、旗舰机、游戏手机的主力方向,主要是考虑到高负载场景运行,尤其是大型游戏,具备高画质+高帧率模式,流畅与视觉体验兼顾。 新机整体亮点明确,比如2K大屏、三重散热、高续航、第五代骁龙…

2026-05-31

小米MiMo-V2.5系列大揭秘:全链路优化技术细节首公开,推理成本大降
据介绍,该团队围绕 Hybrid SWA + MoE + 多模态的复合架构,系统性重构了从 KVCache管理、分级缓存、前缀缓存到调度策略与 Prefill / Decode 链路的完整推理栈,KVCa…

2026-05-31

专为水上运动而生!零零科技哈浮AQUA飞行相机开启水上拍摄新纪元
AQUA 不仅延续了哈浮飞行相机经典的 AI 智能运镜、无需遥控器的交互体验,更在 IP67专业级防尘防水、水面起降的可靠性,以及专为水上运动优化的飞行性能等方面,实现了革命性突破。 AQUA 致力于攻克…

2026-05-31