命题 XXXIII — 大语言模型

DeepSeek 又更新了，但这次它一个脑细胞都没动

2026·07·05约 1,733 字4 MIN

六月底，DeepSeek 在 HuggingFace 上挂出一个叫 DeepSeek-V4-Pro-DSpark 的东西。

名字够唬人：V4、Pro、还带个不明觉厉的后缀。我点开的时候，肌肉记忆已经准备好去看又一场“参数军备竞赛”的新怪兽——结果模型卡第一句话就把我整不会了：

“DeepSeek-V4-Pro-DSpark is not a new model.”

这不是一个新模型。

同一个 V4-Pro 权重，一个字节没改，DeepSeek 只是给它挂了个叫 DSpark 的新模块。打个比方：它没换脑子，换了张嘴。一张快得多的嘴。

一、模型不是变聪明了，是不结巴了

要讲明白 DSpark，得先说说大模型平时是怎么“说话”的。

你以为它是把一整段答案想好了、“唰”地一下打印给你？不是。它是一个字一个字往外蹦的——专业点叫“自回归”：每吐一个字，都得把前面说过的通盘掂量一遍，才能决定下一个字该是啥。而每决定一个字，那个 1.6 万亿参数的大脑袋就得整个发动一次。

这就像一个博学但较真的人，每往下说一个字，都要把前文在心里过一遍才敢开口。脑子好使，但嘴太慢，急死人。

DSpark 干的事，就是给这位学霸配了个手脚麻利的实习生（一个很小的“草稿模型”）。实习生飞快地把接下来一串话先草拟出来，学霸不用自己一个字一个字憋了，只要“唰”地扫一眼草稿——对的地方一路签字放行，碰到第一个不对劲的才亲自接手往下写。

妙就妙在：学霸的工作量几乎没变，还是把内容过了一遍；但因为大部分字是实习生并行草拟、他批量验收的，吐字速度肉眼可见地窜上去了。这套路数有个正经名字，叫“推测解码”（speculative decoding）。

同一颗脑子	老办法（自回归）	DSpark（推测解码）
怎么出字	大模型一个字一个字憋	实习生打草稿、学霸验收
每步开销	每个字都发动一次大模型	一次验收放行一串字
答案质量	基准线	分毫不降
生成速度	慢	快 57%~78%

一句话：它没变聪明，只是不结巴了。

二、DSpark 的实习生，比别家的会来事

推测解码不是 DeepSeek 独创，难点全在这个“实习生”上：太轴或太浪，都不行。轴的（业界叫 EAGLE-3 那一派）一个字一个字顺着猜，准，但慢；浪的（DFlash 那一派）一口气并行猜一大片，快，可越往后越离谱，因为后面的字根本不知道前面写了啥，学霸验收时一半得打回。

DSpark 的实习生学会了两条腿走路：先并行把一整片草稿铺出来（要的是快），再用一个极轻的小脑筋回头瞄一眼前一个字、顺手校正（把准度找回来）。快和准，它全都要。

更妙的是这实习生懂得看老板脸色——DeepSeek 给它配了个调度器，盯着 GPU 忙不忙：机器闲就多猜几个字，机器忙得冒烟就收着点，绝不跟正经活抢算力。这一手治的是推测解码最尴尬的老毛病：给一个人加速很爽，可一到高并发，验收草稿反倒拖累整台机器的总产能。DSpark 靠看人下菜，把那道“人一多就崩”的悬崖磨成了平滑下坡——只让每个人变快，不拖累所有人的总吞吐。

至于快多少：据 DeepSeek 自己披露，在他们的生产环境里，V4-Pro 每个用户的生成速度提了 57% 到 78%，更小的 V4-Flash 提了 60% 到 85%。整套东西连同训练草稿模型的工具包（叫 DeepSpec），全是 MIT 协议开源，谁想抄就抄。

三、先泼盆冷水

热闹归热闹，有三件事得跟你说清楚，免得回头失望。

第一，它真的不会让模型变聪明。推测解码有个硬保证：每个字最终都得学霸亲自点头，实习生说了不算——所以出来的答案和大模型自己慢慢憋出来的是同一个水准，质量分毫不降，它只负责让答案来得更快。指望它涨智商的，可以散了。

第二，那些 57%~85% 的漂亮数字，是 DeepSeek 在自家机房、用自己的流量测的，眼下没有第三方独立复现。换成你的显卡、你的并发，能不能吃满，是另一回事。

第三，网上会流传一堆 V4-Pro 的高分——LiveCodeBench 93.5%、Codeforces 3206 分之类。那是 V4-Pro-Max 版本的成绩，跟 DSpark 没半点关系。DSpark 手里只有一块秒表，没有智商测试卷，别把跑分安错了头。

四、为什么这么个“小更新”值得看一眼

当所有人都在卷“更大、更强、更贵”的时候，DeepSeek 又一次把刀口对准了“更省、更快”这条冷板凳。

这事其实不小。模型真到你我手里，卡住体验的往往不是它不够聪明，而是吐字太慢、跑起来太烧钱。DSpark 抠的正是这最后一公里——同样一颗脑子，让它把话说利索，还把这套提速术白送给了整个开源社区。

造神很性感，教神好好说话很枯燥。但你我天天要用的，恰恰是后面这件枯燥的事。

∎