Fable 5 刚复活,就先把用户气笑了。
比如有网友发文调侃,自己的很多问题都被回退到了 Opus 4.8,于是他去查看日志,发现上面发现上面写着一行很扎心的标签:
「TOO_DUMB_TO_NEED_FABLE」。
粗暴点翻译就是,问题太蠢,不配用 Fable。更好笑的是,Anthropic 工程师 Thariq Shihipar 在底下回了一句:「说实话,我没想到你会去看日志。」
本来以为这已经够有节目效果了,但没想到更离谱的还在后面。
Fable 5 被网友抓包其有着极其丰富、甚至近乎癫狂的内心戏。这下,网友围观重点不只是过于严苛的回退机制了,而是 Fable 5 背后到底在用什么方式思考?
一场漏洞,暴露了 Fable 的「内心戏」
先说说事情的起因。
按照原帖描述,Fable 5 回归当天,他拿它做了一些轻量测试。题目来自 Codeforces,最开始是一道很难的竞赛编程题,后来因为触发思考强度限制,又换成了相对容易的题目。
结果 Fable 5 不按常理出牌,并没有直接给出清爽的题解或代码,而是在网页界面里吐出一大段密密麻麻的推理文本。
黑底白字铺满屏幕,内容混合了英语、图论术语、数学符号、变量名、伪代码和自我提醒。中间还会突然冒出几个很抓眼的词:
「GRRR」(愤怒低吼) 「GAAAH」(崩溃大叫) 「PHEW」(如释重负) 以及极其洗脑的 「DATA DATA DATA. GO.」
乍看像模型失控,细看又不像纯乱码。
网友截图里的核心,是模型在处理一个复杂的容量约束问题。它反复提到 window [τ, i-1]、leg j、crossing-slots、used[i] ≤ m-2,说明它在尝试定义某个路径或区间上的资源占用规则。
GRRR 出现的位置很关键:
前面它意识到 「commitments are retroactive」,也就是某些提交会回溯影响之前的区间,导致当前规则在提交时不知道未来会覆盖什么。随后它立刻写下 「RESOLUTION」,改成提前给当前 leg 的占用计费。
换成人类竞赛选手的草稿,可以理解为:他发现当前的建模方法走不通,于是意识到需要推翻原来的思路,重新设计规则,或者换一种更贴切、更容易处理的抽象方式来描述问题。
随后,模型从理论推导转向验证策略。
GAAAH. Data first!! 出现的位置也更像是在给自己下指令:停止继续空想,先用数据验证,先把对拍程序写出来。
再往后,PHEW 出现在模型刚推过一个中间结论之后。它认为 mid-leg 的 active count 可以被限制在 m-1 以内,像是终于过了一关。但松口气之后,它马上又发现新问题:如果 used[j] = m-1,再加上当前边,可能变成 m,于是再次进入 「VIOLATION?!」 的状态。
最有代表性的,是那句 「I'M DROWNING IN EMPIRICS!!」,后面接着 「DATA DATA DATA. GO.」。看到这,我们不妨换个角度看,这些词更像是模型在不同阶段给自己打的「标记」。
当原有思路走不通时,它会用类似 GRRR 的提示提醒需要调整方向;当决定停止空想、转向验证时,会出现 GAAAH 或 DATA DATA DATA. GO. 这样的信号;而在某个中间结论暂时成立时,则会用 PHEW 标记一个阶段性的通过。
与其说它们是在表达情绪,不如说是在划分推理流程中的不同状态。
而且尽管这样的内心独白看着很罕见,翻阅 Fable 5 和 Claude Mythos 5 的系统卡也能找到类似「illegible reasoning(难以阅读的推理)」的现象。
系统卡提到,在一个纸牌谜题环境下,模型一开始还能写出比较正常的人类语言,随后逐渐变成由牌面、箭头、全大写词、符号、emoji 和尖叫组成的文本。
SystemCard