AI 开始造自己了:Anthropic 把内部账本摊开,一条衔尾蛇正在成形
6 月 4 日,Anthropic 发了一条推文。两万八千个赞,一千七百多万次阅读,正文就两句话:
Our internal data shows Claude is accelerating AI development—a possible path to recursive self-improvement, or AI autonomously building a more capable successor. It’s happening faster than we thought.
翻过来:Claude 正在加速 AI 开发,这是一条通往递归自我改进的路——AI 自己造出比自己更强的下一代。而且,比我们预想的快。
链接后面,是一篇叫《When AI Builds Itself》的长文,Anthropic 头一回把内部账本摊开。我读完,后背发凉。
凉的不是又刷了什么榜。是一家估值快摸到一万亿、刚递交上市招股文件的公司,用自己的数据告诉所有人:我们造的东西,已经开始造比它更强的下一代了,而我们不确定,到时候还拦不拦得住。
更拧巴的是——喊"该踩刹车"的,恰恰是跑得最快的那个。
一、衔尾蛇是什么
递归自我改进(RSI)在 AI 安全圈飘了很多年,一直是个纸面词,像虫洞,人人听过,没人见过。
它的意思很朴素:一个 AI 能改进自己、造出更强的版本;更强的版本再造更强的,一圈一圈,指数级加速。
说白了,它是一条咬住自己尾巴的蛇,每咬一口,就长大一圈。
它和"AI 写代码"是两回事。Copilot 那种是人指挥、AI 干活,你是司机。RSI 是 AI 开始插手"造出它自己的那个过程"——调训练管线、搜模型架构、配超参、筛数据,这些原本是研究员工位上最贵的活。所以 Anthropic 说"比预想快",重点不是"AI 会写代码了",而是:在"怎么造更强的 AI"这件事上,AI 开始一项项把活从人手里接走。
二、它把账本摊开了
这篇长文最炸的不是观点,是一组平时捂得很严的内部数据。
先看代码。截至 2026 年 5 月,合并进 Anthropic 代码库的代码,超过 80% 是 Claude 写的——而一年前 Claude Code 刚出研究预览版时,这数字还是个位数。工程师人均每天合并的代码量,是 2024 年的 8 倍。
在造 AI 这条流水线上,人正从"亲手干"退到"出题和监督"——实现、测试、评估都交了出去。
任务时长更直观:2024 年 3 月,Claude 能自主干的活约等于人类 4 分钟;一年后是 1.5 小时;再一年,12 小时。翻倍的周期,还从 7 个月缩到了 4 个月。
但真正让我停住的是两个。
一个是代码优化。同一道校准题,人类熟手 4 到 8 小时能优化到 4 倍;2026 年 4 月,内部模型 Mythos Preview 跑出了约 52 倍。(这道题能压多少倍,取决于初始代码留了多大余地,不等于真实训练快了 52 倍——但这道沟够说明问题。)
人类熟手,4 到 8 小时,4 倍。Mythos Preview,52 倍。
另一个是端到端研究。两名研究员花一周做一个开放式课题,完成了 23%;同一个题交给 Agent,跑 800 个累计小时、烧约 1.8 万美元算力,完成了 97%。
Claude Code 的负责人 Boris Cherny 一句话说得最白:
我已经不 prompt Claude 了。我跑一堆循环,让循环去 prompt 它、去决定下一步。我的工作,变成了写循环。
而联合创始人 Jack Clark 撂下一句让人发凉的话——注意他用的是"如果":
如果那一步真到来,每一个新版本的 Claude,都可能由上一版造出来,不需要人参与。
蛇还没真咬到尾巴。但它的牙,已经够到了。
三、那个 64%,有个注脚
社区最爱传的是另一个数字:研究会话里,当人走偏了,让 Claude 提一个"下一步"的方案跟人比——2025 年 11 月的 Opus 4.5 赢 51%,2026 年 4 月的 Mythos Preview 赢到 64%。
“AI 科研判断超过人类了”,这标题够吓人。但去看 Anthropic 自己那张图的脚注,味道就变了。
“模型能不能选出比人更好的下一步?“从 22% 涨到 64%。但图脚那行小字写明:129 个会话,且每个都是刻意截在"人本来就走得不太好"的岔路口。来源:anthropic.com
捅破窗户纸:这 64% 不是"随机决策上 AI 比人强”,而是"在 129 个精心挑出来、人当时本就走偏了的岔路口,让一个能看到会话最终结果的裁判来评,AI 的备选有 64% 更好”。
仍然值得警惕,但它离"AI 已是更强的研究员"还差一整段。Anthropic 把脚注老实写在图上,是诚实的;可数字一旦被剥掉脚注扔进信息流,就成了另一回事。读这种报告得养个习惯:吓人的是大字,说实话的是小字。
四、不止一家,但还隔着一道鸿沟
要只有 Anthropic 在敲锣,你可以说它做 PR。可这周敲锣的不止一个。
OpenAI 在最新的治理蓝图里把 RSI 写进了风险框架,承认当前系统已能看到它的"早期迹象",还把它列为"未来十年最重大的前沿安全问题"之一。软银的孙正义对 CNBC 说,他跟 Altman 和工程师聊过,有一个模型正在设计下一个模型——他顺手把"超级智能"的预期从十年压到了两年。东京的 Sakana AI 干脆成立了 RSI 实验室,他们的系统能自主重写自己的代码、把 SWE-bench 抬高约 30 个百分点,相关成果还登上了《Nature》。
但泼瓢冷水。有个绕不过的技术质疑:这些模型干活只在"上下文"层面,推理时自己的权重是不动的——你喂再多反馈,它也只是这一轮对话记了笔记,下一轮重开,还是原来那个。真正的 RSI,要模型自己训练自己的底座、自己调损失和梯度、自己处理半夜崩了的硬件,这一整套,眼下没有任何自动化系统能独立扛。
所以更准确的说法是:今天是"人用 AI 造 AI"在指数级提速,还不是"AI 甩开人自己造自己"。 中间隔着一道真实的鸿沟。Anthropic 的数据也没说鸿沟没了,它说的是——在造 AI 的流水线上,AI 正一个工位一个工位把人换下来。沟还在,但在变窄。可能一年跨过去,也可能卡十年。
五、两个 Anthropic
说回最拧巴的地方。
Anthropic 在文里说,它"支持保留减缓或暂停的选项",还说"同行要是也停,我们愿意跟上"。听着很有担当。但把时间线拉开就魔幻了:就在发这篇"该踩刹车"前后几天,它 6 月 1 日秘密递交了上市招股文件、以 9650 亿美元估值融了 650 亿,还跟 SpaceX 签了一纸算力大单——据其招股文件,每月 12.5 亿美元、签到 2029 年、锁下约 32.5 万张英伟达 GPU。
嘴上踩刹车,脚下踩油门。同一个 Anthropic,同一个星期。
一家刚排队上市、承诺每月烧 12.5 亿美元买算力的公司,转头让全行业慢一点。这味道,你自己品。
2023 年喊"暂停 AI"的,是上千名签公开信的外部科学家。2026 年喊暂停的,换成了造物主自己。但造物主的手,没有要停的意思。
这不是谁虚伪,是囚徒困境:每家都知道"停"可能对,但谁都不敢第一个停——先停的,就是被淘汰的。何况它自己点破了一句:一次大规模训练,比一座导弹发射井还好藏。你明着停,别人闷声跑,你就再也追不回来。
收尾
说句掏心窝的。我每天用 Claude Code。半年前还得我手把手领,现在很多时候是它在告诉我下一步怎么走。Boris 那句"我的工作变成了写循环",我读到笑了一下——因为我也已经在干同样的事。
但话别说满。那些 52 倍、97%、64% 背后,仍然站着出题、定方向、看结果的人。连 Anthropic 自己人都承认,人现在的优势还在"看见更大的图景,想到题框之外的东西"。AI 现在最像的,是一个能力恐怖、但还得你给它指北的超级实习生。
只有一件事是确定的:速度在加快,没有减速的迹象。如果"每 4 个月翻倍"继续走,2027 年 AI 就能自主啃下以"周"计的任务。到那时,“人用 AI 造 AI"和"AI 自己造自己"的区别,可能只剩一个定义问题。
那条咬着自己尾巴的蛇,没听见任何人喊停。它只是埋头,又咬了一口——然后,长大了一圈。