深度拆解 Claude Fable 5:给神话戴上笼口,改名寓言,卖你两倍价
6 月 9 日,Anthropic 发了新模型。官方推文一夜堆到八万赞、两千两百万阅读,官方账号还顺手把全体用户的用量限额重置了一遍,生怕你不去试。
模型叫 Claude Fable 5。Fable,寓言。
这名字得对照着另一个名字读。今年 4 月,Anthropic 拿出过一个叫 Mythos 的模型——Mythos,神话。它挖漏洞的能力越过了公司自己定的风险线,没敢公开发售,只锁给 12 家启动伙伴和 40 多家基础设施机构:微软、谷歌、英伟达、摩根大通、CrowdStrike 这个级别,整个项目叫 Glasswing,跟美国政府合作。前两天衔尾蛇那篇里,把同一道优化题从人类熟手的 4 倍干到 52 倍的那个内部模型,就是它的上一版。
现在,Anthropic 给神话戴上笼口,改了个名字,牵出来开架卖了。
神话是供起来的,寓言是讲给孩子听的:被驯化过、有教育意义、保证安全的故事。这次公告把话挑明了:Fable 5 和同日发布的 Mythos 5 是同一个底座,唯一的区别,前者戴着护栏。
所以这篇拆三件事:它多强,笼口怎么工作,以及账单上的几行小字。
一、强到 Karpathy 说"别看代码了"
先看成绩单。
官方成绩单。先记住最底下还有一行灰色小字,第三节要考。来源:anthropic.com
SWE-Bench Pro,真实软件工程任务,Fable 5 跑 80.3%。自家 Opus 4.8 是 69.2%,GPT-5.5 只有 58.6%。Cognition 那个专收前沿难题的 FrontierCode 更夸张:Fable 5 拿 29.3%,Opus 4.8 13.4%,GPT-5.5 5.7%。这不叫赢,这叫把第二名打成零头。
官方那句定调比任何数字都狠:任务越长、越复杂,Fable 5 甩开其他模型越远。
跑分之外的案例更有画面。Stripe 在 5000 万行的 Ruby 代码库上让它做全库迁移,原本一个团队要手搓两个多月,它一天交付。旧版 Claude 玩宝可梦得靠一整套辅助工具喂地图喂状态,Fable 5 只看原始截图,通关了。最离谱的是基因组学:Mythos 5 几乎全自主地跑了一个多星期的研究,训出来的模型比《Science》上发表的同类更强,体积只有人家的百分之一。
社区那边,Karpathy 当天写了篇长评:这是去年 11 月以来头一回"配得上大版本号"的台阶。然后他补了一句很危险的话——他头一次觉得"完全不看代码"这件事如此诱人,“但别在生产环境这么干”。
Karpathy 的发布日长评,130 万阅读。来源:x.com
Claude Code 负责人 Boris Cherny 的说法更玄,说它有股"big model smell",大模型的体味,闻一下就知道这次不一样。体味这东西因人而异,但有一样人人闻得到:贵。第四节算账。
二、笼口怎么工作:不拒答,换人
Fable 5 这套新护栏,跟你见过的"对不起,我帮不了你"不是一个设计。
它的主路径不是拒答,是换人。系统里蹲着三个分类器,看见命中的请求不挡下来,而是把这一单转给上一代的 Opus 4.8 来答,答完告诉你一声:刚才换人了。官方数据是 95% 以上的会话碰不到这一下;Karpathy 的实测体感是分类器调得有点神经过敏,误伤不少。这点 Anthropic 自己也认了,说会慢慢调松。
值得盯着看的,是三个分类器各自管什么。第一个管网络攻击。第二个管生物化学武器。都好理解,Mythos 当初就是因为这个被锁起来的——挖漏洞的基准 ExploitBench 上它考 78 分,Opus 4.8 只有 40 分,将近翻倍。
第三个,管蒸馏。
蒸馏(distillation)这词圈外读者值得认识一下:拿强模型的回答当教材,喂给自己的小模型,把人家花几十亿美金训出来的能力"抄"过来。过去两年小厂追大厂,走的多半是这条近道。Anthropic 这回明说了:被认出是蒸馏尝试的请求,一律降级给上一代回答——想抄,只能抄到旧课本。
笼口上三根铁条,两根防的是危险,一根防的是同行。
金色那根,防的是同行。
三、成绩单的小字:考试的是神话,发货的是寓言
上一篇我说过,读 AI 厂商的报告得养个习惯:吓人的话用大字,说实话用小字。这张成绩单的小字又有故事。
表格底部那行 methodology 写着:本表展示 Mythos 5 和 Fable 5 两者中较高的分数;带星号的项目因为护栏拦截,Fable 5 的实际表现"更接近 Opus 4.8"。
说白了:Terminal-Bench 那个 88%、网络安全那个 78%,是没戴笼口的神话考出来的。你花钱买到的寓言,在这些带星项目上,考得跟便宜一半的 Opus 4.8 差不多。
这不算骗,小字写得清清楚楚。但你得弯下腰才看得见。
四、账单:先白请你吃两周
| 模型 | 输入(美元/百万 token) | 输出(美元/百万 token) |
|---|---|---|
| Claude Fable 5 | 10 | 50 |
| Claude Opus 4.8 | 5 | 25 |
| GPT-5.5 | 5 | 30 |
| Mythos Preview(参考) | 25 | 125 |
输入 10 美元、输出 50 美元,正好是 Opus 4.8 的两倍,现役价目表上最贵的一档。比起神话内测期的 25/125 美元,算是打了四折,但对普通开发者,这是实打实的提价。
订阅用户的剧本更刺激。6 月 22 日之前,Pro、Max、Team 计划免费随便用;6 月 23 日起从订阅里拿掉,想继续,单独买额度。官方说"产能充足后会恢复标配",没给日期。X 上已经有人在替 6 月 23 日的舆情预写剧本:先让你尝到,再让你戒断。
免费试吃,到这天为止。
还有一条容易被划走的公告:从这一代起,所有神话级模型的流量强制保留 30 天,第三方平台不豁免,承诺只用于安全监控、不拿去训练。普通订阅用户感知不大,真正被动到的,是当年冲着零保留协议选 Anthropic 的企业客户——这周该开会了。
说句公道话。Opus 4.1 当年卖 15/75 美元,照样进订阅计划,Fable 5 其实比它便宜;1M 的上下文窗口也没像友商那样切档加价。贵,贵得有先例。真正没有先例的是另一件事:同一头兽,放给谁、解开几根铁条,看的是你的身份——政府合作项目里的防御机构、受信名单上的企业、普通用户,护栏一层比一层厚。
安全,第一次成了 SKU。
尾声
我的工位今天已经切到 Fable 5。体感这种东西写出来都像软文,我只讲一个细节:接活之前,它会先把我上周留下的烂摊子翻出来读一遍,然后指出我有两个假设从一开始就是错的。以前的模型不干这事。以前的模型只会顺着我。
对了,还有件事得交代。
这篇稿子,从查资料、核定价到落笔,是 Fable 5 自己干的。我把选题丢给它,它去调研它自己,然后写下你正在读的每一个字,包括这一句。
上一篇我们写,那条衔尾蛇埋头又咬了一口。
这一篇,它抬起头,开始给自己写传记了。