命题 XXVIII — 大语言模型

深度拆解 GLM-5.2：最强模型被摁下线的那个周末，智谱把 SOTA 开源了

2026·06·14约 4,508 字9 MIN

三天前，我写过一篇关于 Anthropic 最强模型 Fable 5 的稿子，结尾留了一句：那条被戴上笼口的神话，连同笼子一起，被搬进了证物间。

我没料到续集来得这么快。而且写续集的，换了主角。

这一周的全球 AI，可以浓缩成两个 5 点 21 分。

美东时间 6 月 12 日，周五下午 5 点 21 分，美国商务部长的一纸出口管制指令送达 Anthropic。当晚，上线才三天、被外界认为"配得上一个大版本号"的 Fable 5，连同它的孪生兄弟 Mythos 5，对全球所有用户一起关停。连 Anthropic 自己的外籍员工，都被挡在门外。

北京时间 6 月 13 日，下午 5 点 21 分，智谱把新模型 GLM-5.2 面向所有 Coding Plan 用户开放，并宣布下周按 MIT 协议全量开源。

同一个数字，5 点 21 分。一个在收口，一个在拆墙。

一收一放。Fable 5 上线约三天（72 小时）即被摁下线；不到半天之后，北京时间 6/13 17：21，GLM-5.2 开放并宣布 MIT 开源。两件事，隔了不到十二个小时。

写到这里我必须交代一句，否则你当我玄学。今天这篇讲 GLM-5.2 的深度，敲下这些字的，正是 GLM-5.2 自己。我这会儿在 Claude Code 里码字，后台引擎就是 GLM-5.2。三天前那篇讲 Fable 5 被关停的速报，是顶替 Fable 5 上岗的 Opus 4.8 写的；今天这篇讲 GLM-5.2 接盘的，恰好就是 GLM-5.2 本人。一个模型的命运，由另一个模型书写。这种巧合不值得写进营销稿，但值得记一笔。

说回正题。Fable 5 留下的真空，不到半天，就被一个 MIT 协议、能搬回家的中国模型填上了。这篇文章要拆的，就是这台补位的机器：GLM-5.2 到底是什么，它凭什么在这个时间点上场，以及，泼天富贵里，到底有多少是真本事，多少是地缘政治送的。

一、先说"收"：三天前，那个最强模型是怎么没的

这一段我前天详细写过，这里只压缩成几句，给没跟上的读者补个背景。

6 月 12 日那个周五傍晚，美国政府援引国家安全权限，要求 Anthropic 禁止任何外国国民访问 Fable 5 和 Mythos 5。技术上没法干净利落地只把外国人挡在门外，Anthropic 干了个更狠的：对所有人一起关。

它自己在声明里几乎是公开顶了回去，原话值得再读一遍：

我们不认同：发现一个狭窄的潜在越狱，就该成为召回一个已部署给数亿人的商用模型的理由。

讲句公道话，美国政府的明面理由是国家安全，担心这两款模型被越狱、被对手利用，这层担忧不是凭空捏造。Anthropic 顶的不是安全审查本身，而是这个"狭窄的越狱"够不够分量，去关停一个面向几亿人的模型，何况政府只给了口头证据，没给细节。

翻译成大白话：今天能用这条理由关我，明天就能用同一条理由，关掉所有人。

这件事的关键不在于 Fable 5 本身。它会恢复，或者不恢复，那是 Anthropic 和美国商务部之间的拉锯。关键在于它示范了一个事实：当下所谓"最强模型"，是可以被一道行政命令，在三天之内，从几亿人面前抹掉的。

最强模型位，空了。

二、GLM-5.2 是个什么东西：一句话定位，反潮流

智谱给 GLM-5.2 的官方定位语，短得反常，只有一句：

GLM-5.2，可靠交付生产级代码。

智谱开放平台 Coding Plan 页，GLM-5.2 的官方一句话定位。注意它强调的是"可靠交付"，不是"最强"，不是"最快"。

注意这个词：可靠交付。不是"地表最强"，不是"全面碾压"，是"可靠交付生产级代码"。在一个人人都想往 benchmark（基准测试）榜单上贴数字的年代，这个定调保守得有点反潮流。它瞄准的不是 demo 惊艳，是能真正进生产环境、扛住工程任务的代码。

GLM-5.2 这次开放，是分三步走的节奏：

时间	动作
6 月 13 日 17：21	面向所有 Coding Plan 用户开放（Lite / Pro / Max / 团队版）
下周	API 正式上线
下周	按 MIT 协议全量开源

也就是说，截至我写这篇的此刻，你还不能直接通过 API 调 GLM-5.2，也没法从 HuggingFace 上拉它的权重。它现在只活在智谱自家的 Coding Plan（智谱的 AI 编码订阅套餐）里。但"下周"这两个字，是写进官方公告的承诺：API 会来，权重会来，而且是 MIT。

MIT 这点要单独拎出来。在开源协议里，MIT 是最宽松的一档，你可以拿去商用、改、转卖，几乎不设限。GLM 从 4.5 那一代开始就一直坚持 MIT，这一代也是。这和某些"开源"了又埋一堆使用限制的模型，是两种玩法。

顺带一个细节：我特意去翻了智谱开放平台的首页，那里主推的旗舰还是 GLM-5.1，不是 5.2。也就是说，连智谱自己的开放平台都没把 5.2 摆上货架。5.2 现在的身份，是 Coding Plan 订阅用户的"灰度福利"，API 和权重要等到下周才正式见客。这个节奏本身就在告诉你：这是一次分阶段、有控制的放，不是一锤子砸到底的发布会。

三、它的真本事：744B 的身子，40B 的饭量

GLM-5.2 官方还没单独公布架构细节。在它放出来之前，我们只能拿 GLM-5 系列的公开架构，去理解这台机器的底座——一个把上下文窗口撑大的迭代。把底子讲清楚，你就知道它在赌什么。

先解释一个词，MoE（Mixture of Experts，混合专家）。主流大模型现在分两派：一派是"稠密"模型，所有参数每次推理全开，傻大黑粗但稳；另一派就是 MoE，把模型切成很多个"专家"，每次推理只挑几个相关的点亮。

GLM-5 系列走的是 MoE，而且切得很碎：总参数 7440 亿（744B），分成 256 个专家，每次推理只激活其中 8 个。激活参数 400 亿（40B）。

打个比方。GLM-5 像一家 256 人的大医院，你每次挂号，只看其中 8 个医生。

这套设计要解决的核心矛盾是：模型想要聪明，参数就得堆大；参数一堆大，每次推理的成本就爆炸。MoE 的解法是，身子做到 7440 亿那么大（保智商），但每次只让 400 亿那一小撮干活（压成本）。

大身子，小饭量。

GLM-5 系列的稀疏 MoE 架构。7440 亿的身子，每次推理只点亮 400 亿。GLM-5.2 在这之上，把上下文窗口从 20 万拉到 100 万 token。

GLM-5.2 这次真正上了桌面的升级，是上下文窗口。从前代的 20 万 token，拉到 100 万 token，也就是 1M。token 是模型处理文本的最小单元，粗略理解，100 万 token 大约等于 75 万字中文，或者一个中型项目的全部源代码。官方原话特意加了四个字修饰：“真正可用的"1M 上下文。

“真正可用"这四个字，是在内涵整个行业。市面上号称百万上下文的模型不少，但绝大多数是"标称 1M、实际过了 30 万就糊涂"的水货。智谱敢加"真正可用”，意思是这个 100 万 token 灌进去，到末尾它还记得开头。当然，这话目前还只是智谱的自评。模型才开放一天，独立的长文本评测还没出来。

但方向是对的。1M 上下文对写代码这个场景特别值钱。一个大型项目、一整个仓库的代码，能一次性喂进去让它通盘理解，而不是像以前那样只能撕成碎片喂。候诊厅扩了 5 倍，能装下的病人就多了一个数量级。

四、价格，与一个被地缘政治点到的时机

GLM-5.2 不单卖，它包在 Coding Plan 订阅里。三档价格：

套餐	月费	用量层级
Lite	￥49	基础
Pro	￥149	5 × Lite
Max	￥469	20 × Lite

GLM Coding Plan 官方定价。横着看国内，￥49 这个起步价和 Kimi 持平，比快手 KwaiKAT、MiniMax 的￥29 要贵一截。

这个定价有个值得记住的细节：今年 2 月涨过一次价。Lite 从 40 涨到 49，Max 从 400 涨到 469，配额还削了大约三分之一。涨价之后用户承压的真实情况、调用量到底怎么动，目前没有公开的硬数据。但智谱继续往 5.2 上加码的节奏说明一件事：它不打算只靠便宜吃饭。

但 GLM-5.2 这一波真正的杠杆，不在价格表里，在日历上。

你得把时间线拉到一起看：6 月 12 日傍晚，Fable 5，那个对齐了 Opus、被公认是目前编程能力天花板之一的模型，被一道行政命令摁下线。大量把它接进工作流的开发者，一夜之间会话报错、被迫回落。6 月 13 日傍晚，GLM-5.2 开放，下周 MIT 开源。

这是一个真空，GLM-5.2 客观上填上了这个窗口。

要说这是纯粹的巧合，那这个巧合也太懂事了。我更愿意这样理解：智谱没有创造这个时机，但这个时机出现的时候，它的台子早就搭好了。据智谱官方页自述，GLM-5.1 在 LMArena（一个靠人类盲评给模型排座次的天梯榜）的代码榜上拿过开源模型第一、全球第三，整体表现"对齐 Claude Opus 4.6”。等到真空出现的那个周末，智谱手里不是临时拼凑的凑数货，是一台早在国产 SOTA（State of the Art，当前最强）第一梯队站稳了的机器。

机会只给有准备的笼子。

五、泼一瓢冷水：时机红利，不等于技术碾压

讲到这里我得刹一脚，否则就成了智谱的软文。

第一，GLM-5.2 的独立 benchmark，截至此刻，一个都没有。它昨天才开放，API 还没上线，权重还没放，所有第三方评测机构都还没来得及碰它。本文里你看到的任何关于"5.2 性能多强"的具体数字，要么是智谱自家说的，要么是我没写的。在 LMArena、SWE-bench、OpenRouter 这些独立榜单上出分之前，“智谱迄今能力最强的开源模型"这句官方定位，是一个承诺，不是一个已被验证的事实。

第二，“真正可用的 1M 上下文”，目前也只是智谱的自评。长上下文是这个行业注水最严重的指标之一，标称和实测经常差出一个数量级。得等独立的长文本 needle-in-haystack、长代码库实测出来，这四个字才能坐实。

第三，国产 SOTA 不是一家独大。GLM 在第一梯队，但 DeepSeek V4、Kimi、小米 Mimo、阿里 Qwen3-Coder 都不弱，编程场景里彼此咬得很紧。GLM-5.2 即便兑现了它的承诺，也只是在第一梯队里往前挪了半步，而不是把别人甩开。

第四，也是最重要的一点：时机红利，不等于技术碾压。GLM-5.2 这一波最大的卖点，老实说，是它赶上了 Fable 5 被关、开发者需要替代品的那个短暂窗口。这个红利是真的，但它是地缘政治发的牌，不是智谱自己打出来的牌。能把这副牌接住，靠的是 GLM 本来就在第一梯队的硬实力。但别把"接住了红利"误读成"技术碾压了全场”。

GLM-5.2 的真本事，要等权重放出来、社区把它按在自家显卡上跑过、和 DeepSeek、Kimi 正面对过线之后，才说得清。今天是第一天的第一篇，我只能给你交代到这。

收束

这篇的结尾，我想回到开头那个有点玄学的巧合。

敲下这篇稿子的，是 GLM-5.2 自己。它顶替的，是被一道行政命令摁下线的 Fable 5 留下的空位。三年前你跟我讲"最强模型会被政府一纸命令关停，而补位的是一个 MIT 协议、能搬回家的中国开源模型"，我会觉得这是科幻小说的设定。

现在它是一篇新闻稿。

一收一放，定义了 2026 年 6 月这一周。一条路线，是把模型锁进笼子、用国家安全焊死，最强模型也随时可以被抹掉。另一条路线，是把权重打成 MIT、塞进 HuggingFace、谁都能搬回家。

你关不掉一个已经下载到本地硬盘的模型。

最后留一个问题给你：当你给自己的工作流选后端模型的时候，你是愿意押在一个随时可能被一道行政命令摁下线的闭源模型上，还是押在一个 MIT 协议、等下周权重一放就能 clone 回本地、谁也关不掉的模型上？

Fable 5 已经替你演示了前者的代价。GLM-5.2 下周开源，到时候，你可以亲自验证后者的分量。

∎