DeepSeek V4 重磅开源!百万上下文+双算力兼容,国产大模型正式迈入新时代
DeepSeek V4 重磅开源!百万上下文+双算力兼容,国产大模型正式迈入新时代
DeepSeek V4 预览版正式开源,推出 Pro/Flash 双版本,支持100万上下文,同时兼容 NVIDIA 与华为 Ascend 算力平台,在推理、Agent、知识储备上全面对标国际顶级闭源模型。
一、DeepSeek V4 来了!开源+双算力平台支持
就在今天,DeepSeek 正式发布 DeepSeek-V4 预览版并同步开源,一举把百万字上下文变成标配,同时打通 NVIDIA GPU + 华为 Ascend NPU 双算力平台,不再单一依赖 CUDA 生态。
这次发布两个版本,覆盖高性能与高性价比两套场景:
-
DeepSeek-V4-Pro
- 激活参数:49B
- 预训练数据:33T
- 上下文长度:1M
- 定位:极致性能,对标国际顶闭源模型
-
DeepSeek-V4-Flash
- 激活参数:13B
- 预训练数据:32T
- 上下文长度:1M
- 定位:轻量化、低成本、快速推理
两大版本均支持思考模式/非思考模式,可通过 reasoning_effort 控制思考强度。
性能比肩顶级闭源模型

DeepSeek-V4-Flash:主攻性价比
二、核心亮点:百万上下文 + 三大能力拉满
1. 百万上下文成标配
DeepSeek V4 自研 CSA 压缩稀疏注意力 + HCA 高度压缩注意力,用更低显存实现 100万 token 上下文。
-
读整本小说、长代码工程、超大文档不截断
-
长文本处理速度大幅提升
2. 三大能力全面爆发
-
推理能力:数学、竞赛、代码全面超越开源模型,接近 GPT-5.4 水平
-
Agent 能力:智能体工具调用、复杂任务规划大幅增强,官方已内部替代旧模型
-
世界知识:知识准确率大幅提升,信息更准确、更少幻觉
3. 真正支持双算力平台
-
同时在 NVIDIA 与 华为 Ascend 完成专家并行(EP)方案验证
-
下半年昇腾 950 超节点规模上线后,API 价格将进一步下降
-
国产算力可完整支撑顶级大模型训练与推理
三、关键技术创新
1. Engram 记忆模块:查表与推理分离
把“死记硬背”的知识从 Transformer 里抽出来,做成哈希查找表:
-
知识检索从 O(n) 变成 O(1)
-
节省算力,专注复杂推理
-
同等参数下,效果超越传统 MoE 模型
2. mHC 流形约束超连接
解决极深网络训练不稳定问题:
-
信号增益稳定在 1.6 倍
-
计算利用率从 60% → 85%+
-
减少 30%+ 算力依赖
3. 混合注意力机制
-
CSA:先压缩再稀疏,长文本极速处理
-
HCA:超高压缩率,适合低信息密度场景
-
显存占用更低、推理更快
4. FP4 量化训练
-
权重与索引路径使用 FP4 量化感知训练
-
显存大幅降低,推理加速
-
解量化到 FP8 基本无损
四、API 快速调用(5分钟上手)
DeepSeek V4 兼容 OpenAI 格式接口,直接改模型名即可调用。
1. 模型名称
- 高性能:
deepseek-v4-pro - 性价比:
deepseek-v4-flash
2. 调用示例(Python)
from openai import OpenAI
client = OpenAI(
api_key="你的API_KEY",
base_url="https://api.deepseek.com"
)
response = client.chat.completions.create(
model="deepseek-v4-pro",
messages=[{"role":"user","content":"讲解DeepSeek V4技术亮点"}],
reasoning_effort="max" # 开启最强思考模式
)
print(response.choices[0].message.content)
3. 重要提醒
-
旧模型
deepseek-chat/deepseek-reasoner将于 2026年7月24日 停止服务 -
百万上下文统一支持,无需额外配置
五、本地部署建议(CPU/GPU/NPU均可)
DeepSeek V4 系列模型已开源,可本地运行:
-
支持平台:Linux / Windows
-
算力:建议 NVIDIA 24G+ 或华为 Ascend 加速卡
-
轻量化版本可在 CPU + 大内存 环境运行
-
可搭配 Ollama / Llama.cpp / LM Studio 本地可视化界面
适合场景:
-
企业私有部署、数据不出内网
-
AI Agent 开发、RAG 知识库
-
代码助手、文档分析、长文本处理
六、总结
DeepSeek V4 的发布,标志着国产开源大模型正式进入百万上下文普惠时代,同时实现双算力平台兼容,在推理、Agent、长文本处理上全面对标国际第一梯队。
对于开发者:
-
免费开源,可二次开发、商用探索
-
API 低门槛接入,兼容 OpenAI 生态
-
支持国产算力,安全可控
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)