DeepSeek-V4 预览版上线:开启百万上下文普惠时代
深度求索 DeepSeek 2026年4月24日于北京正式发布 DeepSeek-V4 系列模型的预览版本,并同步开源。DeepSeek-V4 实现了百万 token 超长上下文的高效支持,在 Agent 能力、世界知识和推理性能上均达到国内与开源领域的领先水平。
模型概览:两大版本,按需选择
DeepSeek-V4-Pro:旗舰级模型,拥有 1.6T 参数(激活 49B),性能比肩顶级闭源模型,专为高复杂度任务设计。
DeepSeek-V4-Flash:高效版模型,拥有 284B 参数(激活 13B),推理速度更快、成本更低,是经济高效的选择。
即日起,登录官网或官方 App 即可体验 DeepSeek-V4,感受1M超长上下文记忆的全新交互方式。

左:DeepSeekV4ProMax及对比模型的基准测试性能
右:DeepSeekV4系列和DeepSeekV3.2的推理FLOPs和KV缓存大小
核心能力:全面突破,开源领先
1. Agent 能力大幅跃升
DeepSeek-V4-Pro 的 Agent 能力显著增强。在 Agentic Coding 评测中,其表现已达到当前开源模型的最佳水平。目前,DeepSeek-V4 已成为公司内部员工使用的 Agentic Coding 模型,据评测反馈,其使用体验优于 Claude Sonnet 4.5,交付质量接近 Claude Opus 4.6(非思考模式)。
2. 世界知识储备丰富
在世界知识测评(如 SimpleQA、MMLU-Pro 等)中,DeepSeek-V4-Pro 大幅领先其他开源模型,仅稍逊于顶尖闭源模型 Gemini-3.1-Pro,显著缩小了与专有模型的差距。

分析、生成、编辑任务和整体表现的胜率比较
3. 推理性能比肩顶级
在数学、STEM、竞赛型代码等核心推理基准上,DeepSeek-V4-Pro 超越了所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩。DeepSeek-V4-Flash 在推理任务上也展现出接近 Pro 版本的能力,提供了高性价比的选择。
架构创新:效率革命,百万上下文成标配
DeepSeek-V4 的核心突破在于其混合注意力架构,彻底解决了长上下文的内存与计算瓶颈:
飞跃:相比 DeepSeek-V3.2,在 1M token 上下文场景下,DeepSeek-V4-Pro 的单 token 推理 FLOPs 降至 27%,KV 缓存大小降至 10%;DeepSeek-V4-Flash 的单 token 推理 F混合注意力机制:结合压缩稀疏注意力(CSA)和高度压缩注意力(HCA),在 token 维度进行压缩,显著降低了长序列的处理成本。
效率LOPs 更是降至 10%,KV 缓存大小降至 7%。
标配支持:从现在开始,1M(一百万)上下文将是 DeepSeek 所有官方服务的标配,长文档分析、复杂工作流等场景变得触手可及。
此外,模型还引入了流形约束超连接(mHC)增强信号传播稳定性,并
用 Muon 优化器加速训练收敛。
服务与部署:即刻体验
API 服务
DeepSeek API 已同步上线 V4-Pro 与 V4-Flash,支持 OpenAI ChatCompletions 接口与 Anthropic 接口。访问时,base_url不变,model参数需改为 deepseek-v4-pro或 deepseek-v4-flash。
上下文长度:最大支持 1M token。

思考模式:均支持思考模式(Reasoning Mode),可通过 reasoning_effort参数设置思考强度(high/max)。对于复杂的 Agent 场景,建议使用思考模式并设置最高强度。
重要提示:旧有 API 接口的模型名 deepseek-chat与 deepseek-reasoner将于 2026年7月24日停止使用。当前阶段,这两个模型名分别指向 DeepSeek-V4-Flash 的非思考模式与思考模式。
开源信息
DeepSeek-V4 模型权重与技术报告已同步开源,欢迎开发者下载与研究:
模型权重:https://huggingface.co/collections/deepseek-ai/deepseek-v4
技术报告:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf
相关链接:
官方体验:https://chat.deepseek.com
API 文档:https://api-docs.deepseek.com
#DeepSeek-V4#混合注意力架构#百万上下文#1M上下文#MoE#压缩稀疏注意力#高度压缩注意力#流形约束超连接#Muon优化器#Agent能力#开源模型#推理性能#在线策略蒸馏#API服务#模型权重
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐
所有评论(0)