DeepSeek V4 重磅开源!百万上下文+双算力兼容,国产大模型正式迈入新时代

DeepSeek V4 预览版正式开源,推出 Pro/Flash 双版本,支持100万上下文,同时兼容 NVIDIA 与华为 Ascend 算力平台,在推理、Agent、知识储备上全面对标国际顶级闭源模型。

一、DeepSeek V4 来了!开源+双算力平台支持

就在今天,DeepSeek 正式发布 DeepSeek-V4 预览版并同步开源,一举把百万字上下文变成标配,同时打通 NVIDIA GPU + 华为 Ascend NPU 双算力平台,不再单一依赖 CUDA 生态。
在这里插入图片描述

这次发布两个版本,覆盖高性能高性价比两套场景:

  • DeepSeek-V4-Pro

    • 激活参数:49B
    • 预训练数据:33T
    • 上下文长度:1M
    • 定位:极致性能,对标国际顶闭源模型
  • DeepSeek-V4-Flash

    • 激活参数:13B
    • 预训练数据:32T
    • 上下文长度:1M
    • 定位:轻量化、低成本、快速推理

两大版本均支持思考模式/非思考模式,可通过 reasoning_effort 控制思考强度。

性能比肩顶级闭源模型

在这里插入图片描述

DeepSeek-V4-Flash:主攻性价比
在这里插入图片描述

二、核心亮点:百万上下文 + 三大能力拉满

1. 百万上下文成标配

DeepSeek V4 自研 CSA 压缩稀疏注意力 + HCA 高度压缩注意力,用更低显存实现 100万 token 上下文。

  • 读整本小说、长代码工程、超大文档不截断

  • 长文本处理速度大幅提升

2. 三大能力全面爆发

  • 推理能力:数学、竞赛、代码全面超越开源模型,接近 GPT-5.4 水平

  • Agent 能力:智能体工具调用、复杂任务规划大幅增强,官方已内部替代旧模型

  • 世界知识:知识准确率大幅提升,信息更准确、更少幻觉

3. 真正支持双算力平台

  • 同时在 NVIDIA华为 Ascend 完成专家并行(EP)方案验证

  • 下半年昇腾 950 超节点规模上线后,API 价格将进一步下降

  • 国产算力可完整支撑顶级大模型训练与推理

三、关键技术创新

1. Engram 记忆模块:查表与推理分离

把“死记硬背”的知识从 Transformer 里抽出来,做成哈希查找表

  • 知识检索从 O(n) 变成 O(1)

  • 节省算力,专注复杂推理

  • 同等参数下,效果超越传统 MoE 模型

2. mHC 流形约束超连接

解决极深网络训练不稳定问题:

  • 信号增益稳定在 1.6 倍

  • 计算利用率从 60% → 85%+

  • 减少 30%+ 算力依赖

3. 混合注意力机制

  • CSA:先压缩再稀疏,长文本极速处理

  • HCA:超高压缩率,适合低信息密度场景

  • 显存占用更低、推理更快

4. FP4 量化训练

  • 权重与索引路径使用 FP4 量化感知训练

  • 显存大幅降低,推理加速

  • 解量化到 FP8 基本无损

四、API 快速调用(5分钟上手)

DeepSeek V4 兼容 OpenAI 格式接口,直接改模型名即可调用。
在这里插入图片描述

1. 模型名称

  • 高性能:deepseek-v4-pro
  • 性价比:deepseek-v4-flash

2. 调用示例(Python)

from openai import OpenAI

client = OpenAI(
    api_key="你的API_KEY",
    base_url="https://api.deepseek.com"
)

response = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[{"role":"user","content":"讲解DeepSeek V4技术亮点"}],
    reasoning_effort="max" # 开启最强思考模式
)

print(response.choices[0].message.content)

3. 重要提醒

  • 旧模型 deepseek-chat / deepseek-reasoner 将于 2026年7月24日 停止服务

  • 百万上下文统一支持,无需额外配置

五、本地部署建议(CPU/GPU/NPU均可)

DeepSeek V4 系列模型已开源,可本地运行:

  • 支持平台:Linux / Windows

  • 算力:建议 NVIDIA 24G+ 或华为 Ascend 加速卡

  • 轻量化版本可在 CPU + 大内存 环境运行

  • 可搭配 Ollama / Llama.cpp / LM Studio 本地可视化界面

适合场景:

  • 企业私有部署、数据不出内网

  • AI Agent 开发、RAG 知识库

  • 代码助手、文档分析、长文本处理

六、总结

DeepSeek V4 的发布,标志着国产开源大模型正式进入百万上下文普惠时代,同时实现双算力平台兼容,在推理、Agent、长文本处理上全面对标国际第一梯队。

对于开发者:

  • 免费开源,可二次开发、商用探索

  • API 低门槛接入,兼容 OpenAI 生态

  • 支持国产算力,安全可控

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐