欧稽里得
命题 XXXIII — 大语言模型

DeepSeek 又更新了,但这次它一个脑细胞都没动

六月底,DeepSeek 在 HuggingFace 上挂出一个叫 DeepSeek-V4-Pro-DSpark 的东西。

名字够唬人:V4、Pro、还带个不明觉厉的后缀。我点开的时候,肌肉记忆已经准备好去看又一场“参数军备竞赛”的新怪兽——结果模型卡第一句话就把我整不会了:

“DeepSeek-V4-Pro-DSpark is not a new model.”

这不是一个新模型。

同一个 V4-Pro 权重,一个字节没改,DeepSeek 只是给它挂了个叫 DSpark 的新模块。打个比方:它没换脑子,换了张嘴。一张快得多的嘴。

一、模型不是变聪明了,是不结巴了

要讲明白 DSpark,得先说说大模型平时是怎么“说话”的。

你以为它是把一整段答案想好了、“唰”地一下打印给你?不是。它是一个字一个字往外蹦的——专业点叫“自回归”:每吐一个字,都得把前面说过的通盘掂量一遍,才能决定下一个字该是啥。而每决定一个字,那个 1.6 万亿参数的大脑袋就得整个发动一次。

这就像一个博学但较真的人,每往下说一个字,都要把前文在心里过一遍才敢开口。脑子好使,但嘴太慢,急死人。

DSpark 干的事,就是给这位学霸配了个手脚麻利的实习生(一个很小的“草稿模型”)。实习生飞快地把接下来一串话先草拟出来,学霸不用自己一个字一个字憋了,只要“唰”地扫一眼草稿——对的地方一路签字放行,碰到第一个不对劲的才亲自接手往下写。

妙就妙在:学霸的工作量几乎没变,还是把内容过了一遍;但因为大部分字是实习生并行草拟、他批量验收的,吐字速度肉眼可见地窜上去了。这套路数有个正经名字,叫“推测解码”(speculative decoding)。

同一颗脑子 老办法(自回归) DSpark(推测解码)
怎么出字 大模型一个字一个字憋 实习生打草稿、学霸验收
每步开销 每个字都发动一次大模型 一次验收放行一串字
答案质量 基准线 分毫不降
生成速度 快 57%~78%

一句话:它没变聪明,只是不结巴了。

二、DSpark 的实习生,比别家的会来事

推测解码不是 DeepSeek 独创,难点全在这个“实习生”上:太轴或太浪,都不行。轴的(业界叫 EAGLE-3 那一派)一个字一个字顺着猜,准,但慢;浪的(DFlash 那一派)一口气并行猜一大片,快,可越往后越离谱,因为后面的字根本不知道前面写了啥,学霸验收时一半得打回。

DSpark 的实习生学会了两条腿走路:先并行把一整片草稿铺出来(要的是快),再用一个极轻的小脑筋回头瞄一眼前一个字、顺手校正(把准度找回来)。快和准,它全都要。

更妙的是这实习生懂得看老板脸色——DeepSeek 给它配了个调度器,盯着 GPU 忙不忙:机器闲就多猜几个字,机器忙得冒烟就收着点,绝不跟正经活抢算力。这一手治的是推测解码最尴尬的老毛病:给一个人加速很爽,可一到高并发,验收草稿反倒拖累整台机器的总产能。DSpark 靠看人下菜,把那道“人一多就崩”的悬崖磨成了平滑下坡——只让每个人变快,不拖累所有人的总吞吐。

至于快多少:据 DeepSeek 自己披露,在他们的生产环境里,V4-Pro 每个用户的生成速度提了 57% 到 78%,更小的 V4-Flash 提了 60% 到 85%。整套东西连同训练草稿模型的工具包(叫 DeepSpec),全是 MIT 协议开源,谁想抄就抄。

三、先泼盆冷水

热闹归热闹,有三件事得跟你说清楚,免得回头失望。

第一,它真的不会让模型变聪明。推测解码有个硬保证:每个字最终都得学霸亲自点头,实习生说了不算——所以出来的答案和大模型自己慢慢憋出来的是同一个水准,质量分毫不降,它只负责让答案来得更快。指望它涨智商的,可以散了。

第二,那些 57%~85% 的漂亮数字,是 DeepSeek 在自家机房、用自己的流量测的,眼下没有第三方独立复现。换成你的显卡、你的并发,能不能吃满,是另一回事。

第三,网上会流传一堆 V4-Pro 的高分——LiveCodeBench 93.5%、Codeforces 3206 分之类。那是 V4-Pro-Max 版本的成绩,跟 DSpark 没半点关系。DSpark 手里只有一块秒表,没有智商测试卷,别把跑分安错了头。

四、为什么这么个“小更新”值得看一眼

当所有人都在卷“更大、更强、更贵”的时候,DeepSeek 又一次把刀口对准了“更省、更快”这条冷板凳。

这事其实不小。模型真到你我手里,卡住体验的往往不是它不够聪明,而是吐字太慢、跑起来太烧钱。DSpark 抠的正是这最后一公里——同样一颗脑子,让它把话说利索,还把这套提速术白送给了整个开源社区。

造神很性感,教神好好说话很枯燥。但你我天天要用的,恰恰是后面这件枯燥的事。

延伸阅读 · RELATED
  1. 命题 XXXII深度拆解 Loop Engineering:大厂忙着造更聪明的神,我忙着给这个健忘又固执的神装一套关不掉的循环2026·07·03
  2. 命题 XXXI深度拆解 Claude Sonnet 5:升级的不是脑子,是计价器2026·07·01
  3. 命题 XXXClaude Code 被爆「后门」:那不是暗道,是一道专查中国用户的隐形海关2026·07·01