DeepSeek V4发布:让英伟达最焦虑的,不是模型
1.6万亿参数、1M上下文、零帧开源——但真正改变格局的,是发布稿里一句被99%的人忽略的话。
2026年4月24日。
没有发布会。没有预热海报。没有"即将揭晓"的倒计时海报。
DeepSeek 把 V4 直接甩了出来——同步开源,同步上线官网和 App,同步更新 API。
零帧起手。
全球 AI 圈的反应是:先刷跑分,再吵参数,最后发现,真正改变格局的那句话,被 99% 的人忽略了。
如果你关注 AI 投资或正在做 AI 应用开发,这篇文章值得你花 8 分钟读完。因为 V4 的背后,藏着一个正在发生的结构性拐点。
01 V4 发布第一天,到底强在哪?
V4 一口气发了两个版本,刀法极准。
| 版本 | 总参数 | 激活参数 | 定位 |
|---|---|---|---|
| V4-Pro | 1.6 万亿 | 49 亿 | 旗舰,对标顶级闭源 |
| V4-Flash | 2840 亿 | 130 亿 | 性价比,更快更便宜 |
看到 1.6 万亿这个数字,你可能觉得"又是一个堆参数的暴力美学"。
但你理解错了。
V4 用的是 MoE(混合专家)架构。模型内部有大量"专家"子网络,每次处理请求时,路由机制只激活其中一小部分参与计算。
通俗地说——你家有 1600 个员工,个个身怀绝技,但每个项目只派 49 人上阵。 知识储备是 1600 人的水平,运营成本只有 49 人。
总参数决定知识容量,激活参数决定推理成本。
这才是 MoE 最核心的商业逻辑。
在能力对比上,V4 做了一个在国内 AI 发布中很少见的事:
它承认了自己不如谁。
发布稿明确写道:V4-Pro 的 Agent 能力优于 Sonnet 4.5,接近 Opus 4.6 非思考模式,但与 Opus 4.6 思考模式存在一定差距。
不吹、不躲、不玩文字游戏。反而让人更信了。
不躲差距的自信,才是真自信。
数学、STEM、竞赛代码等推理密集型任务,V4-Pro 超越所有开源,比肩顶级闭源。
世界知识方面,仅稍逊于 Gemini Pro 3.1。
但最打动我的不是这些跑分——
02 1M 上下文:一年前还是"王牌",今天变成了"标配"
这是 V4 最值得你认真对待的技术变化。
一年前,百万 token 上下文窗口是 Gemini 的独家王牌。
彼时其他主流模型呢?闭源的要么 128K、要么 200K,开源的几乎没人能做到这个量级可用。
1M 上下文意味着什么?
一整部长篇小说 + 一个大型代码库 + 几十份研究报告,同时塞进模型的"工作记忆"。
这不是量变。这是质变。
今天,DeepSeek 把 1M 上下文做成了标配,并且开源。
问题来了:为什么之前做不到的事,现在做到了?
因为传统 Transformer 架构有一个死穴——注意力机制的计算量随上下文长度平方级增长。
上下文翻倍,计算量变四倍。128K 到 1M,理论计算量增长约 60 倍。结果就是:要么贵到离谱,要么慢到不可用,或者两者兼有。
V4 的解法叫 DSA(DeepSeek Sparse Attention,稀疏注意力机制)。
用大白话解释——假设你在读一本 1000 页的书,有人问你"第 500 页的观点和哪些内容有关"。
笨办法:把第 500 页和其他 999 页逐一比较。
DSA 的办法分两步:
- 第一步,先粗筛——扫一眼就知道哪些页面可能相关,只精读那几十页,其余跳过。
- 第二步,做压缩——就算那几十页"相关页面",也不用一字不差地读,先浓缩成摘要再比较。
两步叠加,书从 1000 页变成 2000 页,工作量不再是四倍,而是大概两倍多。
增长曲线被压平了。
真正厉害的突破,从来不是把现有的路走得更远,而是换一条路走。
1M 上下文变成开源标配的真正意义是什么?
是成本曲线被改写了。
这个技术壁垒一旦被打破并且开源,任何团队都能在 DSA 架构基础上继续迭代。长上下文从一个"有足够算力才能玩"的高端功能,变成了人人都能用的基础设施。
这对 Agent 应用的影响尤其致命——任务链越长,上下文窗口的瓶颈越明显。1M 意味着 Agent 可以在更长的操作链里保持状态连贯,处理更大规模的代码库。
但这些都还不是重点。
03 那条被忽略的消息,才是整场发布最狠的一步
回到文章开头我说的那句话。
发布稿里有一句轻描淡写的话,被绝大多数人忽略了:
下半年批量上国产算力。
轻吗?轻。
重要吗?太重要了。
这句话的分量,你得放在过去两年的地缘政治背景里才能看清。
2023 年起,美国对华芯片出口管制一波比一波紧。英伟达 H100、H800、A100 相继被禁。中国 AI 公司能合法拿到的高端 GPU 越来越少。
DeepSeek 此前靠的是英伟达——V3 的训练用的是 H800 集群。 但这条路,越走越窄。
昇腾,是目前国内最成熟的替代方案。
这次发布稿里,昇腾方面给出了相当硬的数据:昇腾 950 超节点上,V4-Pro 推理延迟 TPOT 20ms,V4-Flash 10ms。
算力自由,才是 AI 时代真正的自由。
当然,这些是离线推理的数据,实际部署会打折。但方向是明确的——
昇腾已经能支撑 V4 量产部署,不再是实验室里的"备胎"。
“下半年批量上国产算力”,至少两层含义:
第一层,供给安全。
如果 DeepSeek 能在昇腾上跑出和英伟达相近的推理性能,算力就不再是一个单点风险。出口管制的压力,被直接对冲。
第二层,生态信号。
这才是真正让英伟达睡不着觉的部分。
DeepSeek 是中国最具影响力的开源模型之一。它在昇腾上规模部署,意味着什么?
意味着整个开源社区和下游应用会被带动去适配昇腾生态。
这对国产算力生态的价值,远超卖出 1000 块芯片。
硬件卖的是产品,生态卖的是未来。
硬件层面的竞争是可以被超越的。但一旦生态形成了用户惯性和开发者社区,这就是一个自我强化的飞轮。
DeepSeek 和国产算力的深度绑定,是这次发布里最具长期战略意义的一笔。没有之一。
04 对你我意味着什么?
别急,下面这部分才是和你最相关的。
如果你是个开发者:
- V4 是一个真正能替代部分商业 API 的开源大模型——成本更低,可控性更高。
- 100 万 token 上下文,直接降低企业部署门槛。长文档、大代码库、多文件分析,一次性搞定。
- 原生多模态,减少你拼接各种模型的复杂度。
如果你在做投资或关注市场:
- 国产芯片厂商将直接受益——华为、寒武纪、海光等产业链标的。
- AIDC 基础设施和云计算公司获得更多订单机会。
- 别忘了,过去 DeepSeek 发新模型就引发过英伟达股价大跌。V4 同样可能带来市场波动。
但比这些更值得关注的是一个趋势——
AI 的竞争正在从"谁的模型更强"转向"谁能在更低的成本下把模型用得更广"。
V4 的 MoE 架构降低推理成本,DSA 降低长上下文成本,国产算力降低供给风险——三条线同时发力,指向同一个目标:
让顶级 AI 能力不再是"有足够预算才能玩"的奢侈品。
05 写在最后
回看 DeepSeek V4 的整个发布,给我最大的感受不是某个跑分数字。
是它安静地、几乎不着痕迹地,做了三件事:
把 1M 上下文做成了开源标配。
把国产算力的量产路线图摆上了台面。
把顶级 AI 能力的门槛又往下压了一截。
没有发布会。没有 PPT。没有一句"遥遥领先"。
引用发布稿里的那句荀子:
“不诱于誉,不恐于诽,率道而行,端然正己。”
不喧哗,但有分量。
这个时代最可怕的不是高调的颠覆者,而是安静地改变规则的人。
AI 这条赛道,正在从一个"技术竞赛"变成一个"生态战争"。
而生态战争的胜负,不取决于谁跑分最高——取决于谁能让最多的开发者,以最低的成本,做出最酷的东西。
你怎么看 DeepSeek V4 的发布?
是又一场 hype,还是真的在改变游戏规则?欢迎在评论区聊聊你的判断。
如果你觉得这篇文章有价值,点个在看或转发,让更多人看到。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)