命题 XXV — 随笔 · 大语言模型

AI 开始造自己了：Anthropic 把内部账本摊开，一条衔尾蛇正在成形

2026·06·07约 3,136 字7 MIN

6 月 4 日，Anthropic 发了一条推文。两万八千个赞，一千七百多万次阅读，正文就两句话：

Our internal data shows Claude is accelerating AI development—a possible path to recursive self-improvement, or AI autonomously building a more capable successor. It’s happening faster than we thought.

翻过来：Claude 正在加速 AI 开发，这是一条通往递归自我改进的路——AI 自己造出比自己更强的下一代。而且，比我们预想的快。

链接后面，是一篇叫《When AI Builds Itself》的长文，Anthropic 头一回把内部账本摊开。我读完，后背发凉。

凉的不是又刷了什么榜。是一家估值快摸到一万亿、刚递交上市招股文件的公司，用自己的数据告诉所有人：我们造的东西，已经开始造比它更强的下一代了，而我们不确定，到时候还拦不拦得住。

更拧巴的是——喊"该踩刹车"的，恰恰是跑得最快的那个。

一、衔尾蛇是什么

递归自我改进（RSI）在 AI 安全圈飘了很多年，一直是个纸面词，像虫洞，人人听过，没人见过。

它的意思很朴素：一个 AI 能改进自己、造出更强的版本；更强的版本再造更强的，一圈一圈，指数级加速。

说白了，它是一条咬住自己尾巴的蛇，每咬一口，就长大一圈。

它和"AI 写代码"是两回事。Copilot 那种是人指挥、AI 干活，你是司机。RSI 是 AI 开始插手"造出它自己的那个过程"——调训练管线、搜模型架构、配超参、筛数据，这些原本是研究员工位上最贵的活。所以 Anthropic 说"比预想快"，重点不是"AI 会写代码了"，而是：在"怎么造更强的 AI"这件事上，AI 开始一项项把活从人手里接走。

二、它把账本摊开了

这篇长文最炸的不是观点，是一组平时捂得很严的内部数据。

先看代码。截至 2026 年 5 月，合并进 Anthropic 代码库的代码，超过 80% 是 Claude 写的——而一年前 Claude Code 刚出研究预览版时，这数字还是个位数。工程师人均每天合并的代码量，是 2024 年的 8 倍。

在造 AI 这条流水线上，人正从"亲手干"退到"出题和监督"——实现、测试、评估都交了出去。

任务时长更直观：2024 年 3 月，Claude 能自主干的活约等于人类 4 分钟；一年后是 1.5 小时；再一年，12 小时。翻倍的周期，还从 7 个月缩到了 4 个月。

但真正让我停住的是两个。

一个是代码优化。同一道校准题，人类熟手 4 到 8 小时能优化到 4 倍；2026 年 4 月，内部模型 Mythos Preview 跑出了约 52 倍。（这道题能压多少倍，取决于初始代码留了多大余地，不等于真实训练快了 52 倍——但这道沟够说明问题。）

人类熟手，4 到 8 小时，4 倍。Mythos Preview，52 倍。

另一个是端到端研究。两名研究员花一周做一个开放式课题，完成了 23%；同一个题交给 Agent，跑 800 个累计小时、烧约 1.8 万美元算力，完成了 97%。

Claude Code 的负责人 Boris Cherny 一句话说得最白：

我已经不 prompt Claude 了。我跑一堆循环，让循环去 prompt 它、去决定下一步。我的工作，变成了写循环。

而联合创始人 Jack Clark 撂下一句让人发凉的话——注意他用的是"如果"：

如果那一步真到来，每一个新版本的 Claude，都可能由上一版造出来，不需要人参与。

蛇还没真咬到尾巴。但它的牙，已经够到了。

三、那个 64%，有个注脚

社区最爱传的是另一个数字：研究会话里，当人走偏了，让 Claude 提一个"下一步"的方案跟人比——2025 年 11 月的 Opus 4.5 赢 51%，2026 年 4 月的 Mythos Preview 赢到 64%。

“AI 科研判断超过人类了”，这标题够吓人。但去看 Anthropic 自己那张图的脚注，味道就变了。

“模型能不能选出比人更好的下一步？“从 22% 涨到 64%。但图脚那行小字写明：129 个会话，且每个都是刻意截在"人本来就走得不太好"的岔路口。来源：anthropic.com

捅破窗户纸：这 64% 不是"随机决策上 AI 比人强”，而是"在 129 个精心挑出来、人当时本就走偏了的岔路口，让一个能看到会话最终结果的裁判来评，AI 的备选有 64% 更好”。

仍然值得警惕，但它离"AI 已是更强的研究员"还差一整段。Anthropic 把脚注老实写在图上，是诚实的；可数字一旦被剥掉脚注扔进信息流，就成了另一回事。读这种报告得养个习惯：吓人的是大字，说实话的是小字。

四、不止一家，但还隔着一道鸿沟

要只有 Anthropic 在敲锣，你可以说它做 PR。可这周敲锣的不止一个。

OpenAI 在最新的治理蓝图里把 RSI 写进了风险框架，承认当前系统已能看到它的"早期迹象"，还把它列为"未来十年最重大的前沿安全问题"之一。软银的孙正义对 CNBC 说，他跟 Altman 和工程师聊过，有一个模型正在设计下一个模型——他顺手把"超级智能"的预期从十年压到了两年。东京的 Sakana AI 干脆成立了 RSI 实验室，他们的系统能自主重写自己的代码、把 SWE-bench 抬高约 30 个百分点，相关成果还登上了《Nature》。

但泼瓢冷水。有个绕不过的技术质疑：这些模型干活只在"上下文"层面，推理时自己的权重是不动的——你喂再多反馈，它也只是这一轮对话记了笔记，下一轮重开，还是原来那个。真正的 RSI，要模型自己训练自己的底座、自己调损失和梯度、自己处理半夜崩了的硬件，这一整套，眼下没有任何自动化系统能独立扛。

所以更准确的说法是：今天是"人用 AI 造 AI"在指数级提速，还不是"AI 甩开人自己造自己"。 中间隔着一道真实的鸿沟。Anthropic 的数据也没说鸿沟没了，它说的是——在造 AI 的流水线上，AI 正一个工位一个工位把人换下来。沟还在，但在变窄。可能一年跨过去，也可能卡十年。

五、两个 Anthropic

说回最拧巴的地方。

Anthropic 在文里说，它"支持保留减缓或暂停的选项"，还说"同行要是也停，我们愿意跟上"。听着很有担当。但把时间线拉开就魔幻了：就在发这篇"该踩刹车"前后几天，它 6 月 1 日秘密递交了上市招股文件、以 9650 亿美元估值融了 650 亿，还跟 SpaceX 签了一纸算力大单——据其招股文件，每月 12.5 亿美元、签到 2029 年、锁下约 32.5 万张英伟达 GPU。

嘴上踩刹车，脚下踩油门。同一个 Anthropic，同一个星期。

一家刚排队上市、承诺每月烧 12.5 亿美元买算力的公司，转头让全行业慢一点。这味道，你自己品。

2023 年喊"暂停 AI"的，是上千名签公开信的外部科学家。2026 年喊暂停的，换成了造物主自己。但造物主的手，没有要停的意思。

这不是谁虚伪，是囚徒困境：每家都知道"停"可能对，但谁都不敢第一个停——先停的，就是被淘汰的。何况它自己点破了一句：一次大规模训练，比一座导弹发射井还好藏。你明着停，别人闷声跑，你就再也追不回来。

收尾

说句掏心窝的。我每天用 Claude Code。半年前还得我手把手领，现在很多时候是它在告诉我下一步怎么走。Boris 那句"我的工作变成了写循环"，我读到笑了一下——因为我也已经在干同样的事。

但话别说满。那些 52 倍、97%、64% 背后，仍然站着出题、定方向、看结果的人。连 Anthropic 自己人都承认，人现在的优势还在"看见更大的图景，想到题框之外的东西"。AI 现在最像的，是一个能力恐怖、但还得你给它指北的超级实习生。

只有一件事是确定的：速度在加快，没有减速的迹象。如果"每 4 个月翻倍"继续走，2027 年 AI 就能自主啃下以"周"计的任务。到那时，“人用 AI 造 AI"和"AI 自己造自己"的区别，可能只剩一个定义问题。

那条咬着自己尾巴的蛇，没听见任何人喊停。它只是埋头，又咬了一口——然后，长大了一圈。

∎