2026年4月：AI史上最疯狂的30天——从GPT-6到DeepSeek V4，大模型竞争进入“干活“时代

流年似水～

913人浏览 · 2026-05-02 11:11:08

流年似水～ · 2026-05-02 11:11:08 发布

4月AI圈连发9款旗舰模型：GPT-6参数破5万亿，DeekSeek V4成本仅GPT的1/700

摘要： 2026年4月的大模型发布密度创历史之最。OpenAI连发GPT-6和GPT-5.5，Anthropic祭出Claude Opus 4.7，但最大的变数来自中国——DeepSeek V4以1.6万亿参数跑在华为昇腾芯片上，API价格仅为GPT-5.5的1/700。同一时间，Sora关停、OpenAI增长失速、Anthropic估值奔万亿美元、Claude Code抢占54%编程工具市场。本文用28个关键数据点还原这场"AI史上最疯狂的30天"。

一、4月14日到24日，到底发生了什么
二、DeepSeek V4：成本比GPT低700倍是怎么做到的
三、Sora之死：每月烧1500万美元，收入只有210万
四、Claude Code一统天下，Cursor不服
五、OpenAI的烦恼：钱融到了，但增长没到
六、从"聊天"到"干活"的五个根本转变
七、我的判断：接下来会发生什么

一、4月14日到24日，到底发生了什么

先扔一张时间线表，感受一下密度：

日期	厂商	事件	关键数据
4月14日	OpenAI	GPT-6发布	5-6万亿参数、200万Token上下文
4月16日	Anthropic	Claude Opus 4.7	100万Token输入，编程序SOTA
4月23日	OpenAI	GPT-5.5 / Pro	Agent-first架构，综合能力压Opus 4.7
4月24日	DeepSeek	V4-Pro / Flash	1.6T参数，100%昇腾适配，成本降97%

10天，4款旗舰模型。

但光看发布时间线等于白看。真正该看的是这些模型发布背后的数据逻辑。

GPT-6的200万Token上下文意味着什么？它能一次性吞下整本《三体》三部曲。不是摘要，是逐字逐句。对长文档处理而言，这基本宣告了"短时记忆限制"这个问题的终结。

Claude Opus 4.7在编码基准上跑出了历史最高分。但更有意思的是，Anthropic同时"雪藏"了一款更猛的模型Mythos——因为自主攻击能力过强，不敢公开发布。你品，一个AI公司造出了一个能力太强以至于不敢放出来的东西，这本身就说明了很多事。

GPT-5.5的意义在于定位转变——它是OpenAI的第一个"Agent-first"模型。翻译成人话：之前的大模型是"你说我答"，GPT-5.5是"你告诉我目标，我来完成"。这两个定位之间的差距，就是聊天机器人和数字员工的差距。

好，说完美国玩家的常规操作，接下来才是这个月最值得深度拆解的事件。

二、DeepSeek V4：成本比GPT低700倍是怎么做到的

2.1 沉默145天后的炸弹

DeepSeek上一次发新品是去年底。这145天里发生了什么？春节AI技术战、Agent热潮、GPT-5发布、Claude Opus 4.7发布、Kimi K2.6发布——DeepSeek全部缺席。

然后4月24日，它甩出了这张牌。

2.2 硬核参数直接拉满

版本	总参数	激活参数	预训练数据	定位
V4-Pro	1.6万亿	490亿	33万亿Token	对标GPT-5.5
V4-Flash	2840亿	130亿	32万亿Token	高性价比

MoE稀疏架构是这套系统的核心。推理时只激活约490亿参数，兼顾性能与成本。说人话就是：用十分之一的算力跑出接近顶级的水平。

但参数从来不是DeepSeek的杀招。

2.3 真正的杀手锏：彻底告别英伟达

V4的硬件验证清单里并列写了两行：英伟达GPU，华为昇腾芯片。

这是全球首个发布即适配的万亿参数级纯国产大模型。不光是昇腾，寒武纪、海光、沐曦、摩尔线程、昆仑芯——一口气适配了全系列国产AI芯片。

几个扎心的数字：

华为昇腾新款推理芯片采购价格：英伟达同等芯片的1/4
单卡算力：较英伟达对华特供版提升2.87倍
API输入价格：0.25元/百万词元 vs GPT-5.5 Pro 约30美元/百万词元
价差：超过700倍

700倍价差是什么概念？一家公司每月花100万调用GPT-5.5，换成DeepSeek V4只需要不到1500块。这笔账，任何有算力需求的团队都会算。

资本市场反应更直接：A股算力板块单日成交额突破1200亿元，华为昇腾芯片出货目标冲75万片——其中50万片订单已经锁定。

但我必须说一句实话：DeepSeek自己坦承，V4整体水平落后主要闭源对手约3到6个月。这不是谦虚，这是战术。落后3个月但便宜700倍 vs 领先3个月但贵700倍——这个选择题对99.99%的企业来说根本不需要犹豫。

三、Sora之死：每月烧1500万美元，收入只有210万

大模型这边烧钱烧得欢，Sora那边已经凉透了。

2024年2月，Sora首次亮相时，全网都在喊"好莱坞要完"。2025年9月正式上线，5天下载量破百万。然后呢？

11月下载量峰值：333万次
1月下载量：暴跌45%
2月下载量：113万次
30日留存率：不到5%
全生命周期内购收入：约210万美元
每月推理成本：1500万美元

你算一下。花1500万，赚210万。这生意搁谁身上都得关。

而且平台上62%的内容是低质量的"无厘头"视频。说白了，大部分人下载Sora就是为了生成几条搞笑视频发朋友圈，然后永远不再打开。

Sora不是死于技术不行。它是死于商业模型不成立。技术惊艳和商业可持续性之间的鸿沟，比大多数人想象的要宽得多。

但更值得关注的是Sora倒下后谁站起来了：快手可灵AI。3月全球月活780万，而Sora只有470万。可灵单季收入3.4亿元，ARR突破3亿美元。快手今年砸了260亿资本开支，比去年多了110亿，主要方向就是AI视频。

从"Sora统治一切"到"可灵全球第一"，这个权力交接快得让人来不及眨眼。

四、Claude Code一统天下，Cursor不服

说完了模型层，来看应用层最直接的一个细分市场：AI编程工具。

4.1 一份让人窒息的市场份额

工具	份额	SWE-bench	年收入	核心用户
Claude Code	54%	80.8%	25亿美元	全栈、架构师、复杂项目
Copilot	22%	—	—	VS Code用户、个人开发者
Cursor	15%	71.8%	20亿美元	前端、日常开发、快速原型
Windsurf	5%	—	—	特定团队

CR4 = 96%。这个市场不是"竞争激烈"，是"赢家通吃"。

Claude Code凭什么拿54%？几个硬指标：100万Token上下文约等于7.5万行代码，Auto Mode可以自主规划→修改→测试→提交，实测3小时完成原本3天的工作量。

但我想说一个很多人忽略的点：Claude Code真正的护城河不是模型能力，是Skills生态。Anthropic围绕Claude Code构建了一个可安装、可复用、可交易的技能市场。开发者安装一个Skill，AI就"学会"一个能力。这等于给AI编程助手装了个App Store。

Cursor的策略不一样。它主打体验，最多8个Agent并行工作，延迟优化到0.8秒。月活突破500万，正在寻求20亿美元融资，估值冲500亿美元。

说实话，我个人判断Cursor的500亿估值有点虚。一个15%市场份额的产品估值500亿，Claude Code 54%的份额年收入才25亿——这里面的水分你品。

五、OpenAI的烦恼：钱融到了，但增长没到

5.1 财报引发的暴跌

4月27日，《华尔街日报》扔了一个炸弹：OpenAI营收和用户增长均未达到内部预期。ChatGPT没能在2025年底实现10亿周活目标，年营收也没达标。

市场哗然：

甲骨文（签了3000亿美元算力合同）：股价跌超6%
英伟达、博通、AMD：跌3%-5%
软银（核心投资方）：暴跌约10%

Sam Altman紧急回应说报道"荒谬不实"，但数据不会哄人——就在同一时期，Anthropic的年化收入已经突破300亿美元，首次超过了OpenAI的250亿。

5.2 Anthropic的反超

指标	OpenAI	Anthropic
最新融资	1220亿美元	300亿美元（G轮）
投后估值	8520亿美元	3800亿→8000亿→奔向9000亿
年化收入	~250亿美元	~300亿美元
Q1营收份额	29.0%	31.4%
每活跃用户月均收入	—	16.20美元

Anthropic的估值变化曲线本身就是一个商业案例：2025年3月615亿，2026年2月3800亿，4月8000亿，5月正在冲刺9000亿甚至1万亿。从"OpenAI的追随者"到"估值即将反超"，只用了不到半年。

什么概念？一家成立不到5年的公司，估值已经相当于2个贵州茅台。这个泡沫会不会破？不好说。但二级市场上Anthropic股票的交易价格已经炒到了接近1万亿美元对应的数字——说明真有人在用真金白银赌它能赢。

六、从"聊天"到"干活"的五个根本转变

4月21日的全球AI大会上，业界形成了五个共识。我没有全盘接受，以下是三个我认为真正值得关注的：

转变一：AI不再是你说一句它回一句

GPT-5.4原生支持Computer Use——像人类一样操作电脑，截图→分析→操作→验证。Claude Code的Auto Mode可以从需求文档一直跑到代码提交。这不是"会聊天的AI"，这是"会干活的数字员工"。

我不是在危言耸听。Cursor每天生成1.5亿行企业代码，超2/3财富500强企业在用。41%的代码由AI生成或协助完成。这两个数字放一起看，意味着代码劳动正在以肉眼可见的速度从人类手里转移到AI手里。

转变二：成本正在碾压一切

DeepSeek V4的700倍价差不仅仅是一个数字，它代表了一种新的竞争范式：当性能差距缩小到可接受范围（3-6个月）时，成本优势将成为决定性变量。

这不是降维打击，这是成本碾压。一个类比：没有人会因为BBA的驾驶体验更好就去买一辆700倍价格的手机——但你在AI领域正在看到类似的事情发生。

转变三：生态的竞争正在超越模型的竞争

Claude Code用Skills生态绑定了54%的开发者。MCP协议月下载9700万次，超过1万个活跃Server在生产环境运行。这些都不是模型能力，而是生态能力。

说白了，大模型本身正在从"壁垒"变成"水电煤"——越来越强、越来越便宜、越来越同质化。真正拉开差距的是你能连接多少工具、做得了多少种任务。

OpenAI显然也看到了这一点。这大概也是他们急着和微软"分手"的原因之一——当你的合作伙伴也在开发竞品模型的时候，“独家合作"就变成了"互相提防”。

七、我的判断：接下来会发生什么

7.1 短期（5-6月）

欧盟AI法案高风险条款正式生效，罚款额度高达全球营业额6%。第一批被罚的企业一定会成为新闻头条，而且大概率是中国的出海AI产品。

国内《人工智能拟人化互动服务管理暂行办法》7月15日施行，虚拟主播、AI陪伴、AI客服都将受到分类分级监管。这几个赛道会在5-6月出现明显的收缩。

7.2 中期（下半年）

Anthropic大概率在10月前后上市。如果它以9000亿-1万亿美元估值IPO，将成为史上最大科技IPO。这笔钱进来之后，AI赛道的资本格局将彻底重构。

DeepSeek V4下半年昇腾950超节点批量上市后，Pro版本会大幅降价。届时如果V4在昇腾上稳定跑出竞争力，它就是全球首个不依赖英伟达的前沿模型——这个标签的技术和战略意义远超商业本身。

7.3 我的核心判断

2026年4月这30天，大概率是AI行业一个分水岭。不是因为模型变强了，而是因为商业逻辑变清晰了。

Sora证明了技术惊艳不能当饭吃。DeepSeek证明了成本优势可以当饭吃。Claude Code证明了生态锁定可以当饭吃。Anthropic证明了企业级市场可以当饭吃。

所以如果你问我4月最大的新闻是什么——不是GPT-6，不是DeepSeek V4，不是Sora关停，而是所有这些事件组合在一起传递的同一个信号：AI行业终于开始认真思考怎么赚钱了。

本文数据截至2026年5月2日，部分数据来源于华尔街日报、彭博社、福布斯、36氪等公开报道。如有更新，欢迎在评论区补充。

你对Anthropic冲击1万亿美元估值怎么看？泡沫还是合理？评论区聊聊。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

技术选型历程

本文档就是这些决策过程的完整记录，但只写到"当时怎么想的、考虑了哪些选项"，具体选了哪个由对应的专题文档给出。它不仅决定了数据的存储方式，还决定了 Text-to-SQL 的 SQL 方言、向量检索的实现方式（pgvector 还是独立向量库）、甚至 Android 端做数据缓存时的查询语法。不论选了哪个 Text-to-SQL 方案，都会面临同一个问题：十几张表的 DDL、业务文档和示例 SQL

AtomGit开源社区

Halcon超盒分类器(陈旧)---个人学习篇

AtomGit开源社区

（IEEE顶刊复现）改进的中点电位平衡策略：基于最优零序电压注入法的二极管钳位型NPC三电平拓扑中点电位平衡仿真

本文针对二极管钳位型NPC三电平拓扑中存在的中点电位不平衡问题，提出一种基于最优零序电压注入法的改进控制策略。通过理论分析建立中点电位波动模型，推导出最优零序电压的解析计算方法，并采用载波脉宽调制（CPWM）实现控制。仿真结果表明，在0.3s时注入最优零序电压后，中点电位波动显著降低，系统动态性能得到显著提升。研究为三电平逆变器的工程应用提供了理论支持与仿真验证。