命题 XXVI — 大语言模型

深度拆解 Claude Fable 5：给神话戴上笼口，改名寓言，卖你两倍价

2026·06·10约 2,532 字6 MIN

6 月 9 日，Anthropic 发了新模型。官方推文一夜堆到八万赞、两千两百万阅读，官方账号还顺手把全体用户的用量限额重置了一遍，生怕你不去试。

模型叫 Claude Fable 5。Fable，寓言。

这名字得对照着另一个名字读。今年 4 月，Anthropic 拿出过一个叫 Mythos 的模型——Mythos，神话。它挖漏洞的能力越过了公司自己定的风险线，没敢公开发售，只锁给 12 家启动伙伴和 40 多家基础设施机构：微软、谷歌、英伟达、摩根大通、CrowdStrike 这个级别，整个项目叫 Glasswing，跟美国政府合作。前两天衔尾蛇那篇里，把同一道优化题从人类熟手的 4 倍干到 52 倍的那个内部模型，就是它的上一版。

现在，Anthropic 给神话戴上笼口，改了个名字，牵出来开架卖了。

神话是供起来的，寓言是讲给孩子听的：被驯化过、有教育意义、保证安全的故事。这次公告把话挑明了：Fable 5 和同日发布的 Mythos 5 是同一个底座，唯一的区别，前者戴着护栏。

所以这篇拆三件事：它多强，笼口怎么工作，以及账单上的几行小字。

一、强到 Karpathy 说"别看代码了"

先看成绩单。

官方成绩单。先记住最底下还有一行灰色小字，第三节要考。来源：anthropic.com

SWE-Bench Pro，真实软件工程任务，Fable 5 跑 80.3%。自家 Opus 4.8 是 69.2%，GPT-5.5 只有 58.6%。Cognition 那个专收前沿难题的 FrontierCode 更夸张：Fable 5 拿 29.3%，Opus 4.8 13.4%，GPT-5.5 5.7%。这不叫赢，这叫把第二名打成零头。

官方那句定调比任何数字都狠：任务越长、越复杂，Fable 5 甩开其他模型越远。

跑分之外的案例更有画面。Stripe 在 5000 万行的 Ruby 代码库上让它做全库迁移，原本一个团队要手搓两个多月，它一天交付。旧版 Claude 玩宝可梦得靠一整套辅助工具喂地图喂状态，Fable 5 只看原始截图，通关了。最离谱的是基因组学：Mythos 5 几乎全自主地跑了一个多星期的研究，训出来的模型比《Science》上发表的同类更强，体积只有人家的百分之一。

社区那边，Karpathy 当天写了篇长评：这是去年 11 月以来头一回"配得上大版本号"的台阶。然后他补了一句很危险的话——他头一次觉得"完全不看代码"这件事如此诱人，“但别在生产环境这么干”。

Karpathy 的发布日长评，130 万阅读。来源：x.com

Claude Code 负责人 Boris Cherny 的说法更玄，说它有股"big model smell"，大模型的体味，闻一下就知道这次不一样。体味这东西因人而异，但有一样人人闻得到：贵。第四节算账。

二、笼口怎么工作：不拒答，换人

Fable 5 这套新护栏，跟你见过的"对不起，我帮不了你"不是一个设计。

它的主路径不是拒答，是换人。系统里蹲着三个分类器，看见命中的请求不挡下来，而是把这一单转给上一代的 Opus 4.8 来答，答完告诉你一声：刚才换人了。官方数据是 95% 以上的会话碰不到这一下；Karpathy 的实测体感是分类器调得有点神经过敏，误伤不少。这点 Anthropic 自己也认了，说会慢慢调松。

值得盯着看的，是三个分类器各自管什么。第一个管网络攻击。第二个管生物化学武器。都好理解，Mythos 当初就是因为这个被锁起来的——挖漏洞的基准 ExploitBench 上它考 78 分，Opus 4.8 只有 40 分，将近翻倍。

第三个，管蒸馏。

蒸馏（distillation）这词圈外读者值得认识一下：拿强模型的回答当教材，喂给自己的小模型，把人家花几十亿美金训出来的能力"抄"过来。过去两年小厂追大厂，走的多半是这条近道。Anthropic 这回明说了：被认出是蒸馏尝试的请求，一律降级给上一代回答——想抄，只能抄到旧课本。

笼口上三根铁条，两根防的是危险，一根防的是同行。

金色那根，防的是同行。

三、成绩单的小字：考试的是神话，发货的是寓言

上一篇我说过，读 AI 厂商的报告得养个习惯：吓人的话用大字，说实话用小字。这张成绩单的小字又有故事。

表格底部那行 methodology 写着：本表展示 Mythos 5 和 Fable 5 两者中较高的分数；带星号的项目因为护栏拦截，Fable 5 的实际表现"更接近 Opus 4.8"。

说白了：Terminal-Bench 那个 88%、网络安全那个 78%，是没戴笼口的神话考出来的。你花钱买到的寓言，在这些带星项目上，考得跟便宜一半的 Opus 4.8 差不多。

这不算骗，小字写得清清楚楚。但你得弯下腰才看得见。

四、账单：先白请你吃两周

模型	输入（美元/百万 token）	输出（美元/百万 token）
Claude Fable 5	10	50
Claude Opus 4.8	5	25
GPT-5.5	5	30
Mythos Preview（参考）	25	125

输入 10 美元、输出 50 美元，正好是 Opus 4.8 的两倍，现役价目表上最贵的一档。比起神话内测期的 25/125 美元，算是打了四折，但对普通开发者，这是实打实的提价。

订阅用户的剧本更刺激。6 月 22 日之前，Pro、Max、Team 计划免费随便用；6 月 23 日起从订阅里拿掉，想继续，单独买额度。官方说"产能充足后会恢复标配"，没给日期。X 上已经有人在替 6 月 23 日的舆情预写剧本：先让你尝到，再让你戒断。

免费试吃，到这天为止。

还有一条容易被划走的公告：从这一代起，所有神话级模型的流量强制保留 30 天，第三方平台不豁免，承诺只用于安全监控、不拿去训练。普通订阅用户感知不大，真正被动到的，是当年冲着零保留协议选 Anthropic 的企业客户——这周该开会了。

说句公道话。Opus 4.1 当年卖 15/75 美元，照样进订阅计划，Fable 5 其实比它便宜；1M 的上下文窗口也没像友商那样切档加价。贵，贵得有先例。真正没有先例的是另一件事：同一头兽，放给谁、解开几根铁条，看的是你的身份——政府合作项目里的防御机构、受信名单上的企业、普通用户，护栏一层比一层厚。

安全，第一次成了 SKU。

尾声

我的工位今天已经切到 Fable 5。体感这种东西写出来都像软文，我只讲一个细节：接活之前，它会先把我上周留下的烂摊子翻出来读一遍，然后指出我有两个假设从一开始就是错的。以前的模型不干这事。以前的模型只会顺着我。

对了，还有件事得交代。

这篇稿子，从查资料、核定价到落笔，是 Fable 5 自己干的。我把选题丢给它，它去调研它自己，然后写下你正在读的每一个字，包括这一句。

上一篇我们写，那条衔尾蛇埋头又咬了一口。

这一篇，它抬起头，开始给自己写传记了。

∎