DeepSeek V4 重磅开源！百万上下文+双算力兼容，国产大模型正式迈入新时代

beyond阿亮

663人浏览 · 2026-04-24 20:31:43

beyond阿亮 · 2026-04-24 20:31:43 发布

DeepSeek V4 重磅开源！百万上下文+双算力兼容，国产大模型正式迈入新时代

DeepSeek V4 预览版正式开源，推出 Pro/Flash 双版本，支持100万上下文，同时兼容 NVIDIA 与华为 Ascend 算力平台，在推理、Agent、知识储备上全面对标国际顶级闭源模型。

一、DeepSeek V4 来了！开源+双算力平台支持

就在今天，DeepSeek 正式发布 DeepSeek-V4 预览版并同步开源，一举把百万字上下文变成标配，同时打通 NVIDIA GPU + 华为 Ascend NPU 双算力平台，不再单一依赖 CUDA 生态。
在这里插入图片描述

这次发布两个版本，覆盖高性能与高性价比两套场景：

DeepSeek-V4-Pro
- 激活参数：49B
- 预训练数据：33T
- 上下文长度：1M
- 定位：极致性能，对标国际顶闭源模型
DeepSeek-V4-Flash
- 激活参数：13B
- 预训练数据：32T
- 上下文长度：1M
- 定位：轻量化、低成本、快速推理

两大版本均支持思考模式/非思考模式，可通过 reasoning_effort 控制思考强度。

性能比肩顶级闭源模型

在这里插入图片描述

DeepSeek-V4-Flash：主攻性价比
在这里插入图片描述

二、核心亮点：百万上下文 + 三大能力拉满

1. 百万上下文成标配

DeepSeek V4 自研 CSA 压缩稀疏注意力 + HCA 高度压缩注意力，用更低显存实现 100万 token 上下文。

读整本小说、长代码工程、超大文档不截断
长文本处理速度大幅提升

2. 三大能力全面爆发

推理能力：数学、竞赛、代码全面超越开源模型，接近 GPT-5.4 水平
Agent 能力：智能体工具调用、复杂任务规划大幅增强，官方已内部替代旧模型
世界知识：知识准确率大幅提升，信息更准确、更少幻觉

3. 真正支持双算力平台

同时在 NVIDIA 与 华为 Ascend 完成专家并行（EP）方案验证
下半年昇腾 950 超节点规模上线后，API 价格将进一步下降
国产算力可完整支撑顶级大模型训练与推理

三、关键技术创新

1. Engram 记忆模块：查表与推理分离

把“死记硬背”的知识从 Transformer 里抽出来，做成哈希查找表：

知识检索从 O(n) 变成 O(1)
节省算力，专注复杂推理
同等参数下，效果超越传统 MoE 模型

2. mHC 流形约束超连接

解决极深网络训练不稳定问题：

信号增益稳定在 1.6 倍
计算利用率从 60% → 85%+
减少 30%+ 算力依赖

3. 混合注意力机制

CSA：先压缩再稀疏，长文本极速处理
HCA：超高压缩率，适合低信息密度场景
显存占用更低、推理更快

4. FP4 量化训练

权重与索引路径使用 FP4 量化感知训练
显存大幅降低，推理加速
解量化到 FP8 基本无损

四、API 快速调用（5分钟上手）

DeepSeek V4 兼容 OpenAI 格式接口，直接改模型名即可调用。
在这里插入图片描述

1. 模型名称

高性能：deepseek-v4-pro
性价比：deepseek-v4-flash

2. 调用示例（Python）

from openai import OpenAI

client = OpenAI(
    api_key="你的API_KEY",
    base_url="https://api.deepseek.com"
)

response = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[{"role":"user","content":"讲解DeepSeek V4技术亮点"}],
    reasoning_effort="max" # 开启最强思考模式
)

print(response.choices[0].message.content)

3. 重要提醒

旧模型 deepseek-chat / deepseek-reasoner 将于 2026年7月24日 停止服务
百万上下文统一支持，无需额外配置

五、本地部署建议（CPU/GPU/NPU均可）

DeepSeek V4 系列模型已开源，可本地运行：

支持平台：Linux / Windows
算力：建议 NVIDIA 24G+ 或华为 Ascend 加速卡
轻量化版本可在 CPU + 大内存 环境运行
可搭配 Ollama / Llama.cpp / LM Studio 本地可视化界面

适合场景：

企业私有部署、数据不出内网
AI Agent 开发、RAG 知识库
代码助手、文档分析、长文本处理

六、总结

DeepSeek V4 的发布，标志着国产开源大模型正式进入百万上下文普惠时代，同时实现双算力平台兼容，在推理、Agent、长文本处理上全面对标国际第一梯队。

对于开发者：

免费开源，可二次开发、商用探索
API 低门槛接入，兼容 OpenAI 生态
支持国产算力，安全可控

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

G-Star 精选开源项目推荐｜第十九期

BuildAdmin 是一个基于 Vue 3、ThinkPHP 6、TypeScript、Vite、Pinia 和 Element Plus 的后台管理系统，面向中后台业务系统快速开发场景。项目提供可视化 CRUD 代码生成、权限管理、Web 终端、数据回收站、字段级修改保护等能力，帮助开发者减少重复后台开发工作。对于需要快速搭建管理后台、业务配置台或二开系统的团队来说，它提供了一套相对完整的工程