4月AI圈连发9款旗舰模型:GPT-6参数破5万亿,DeekSeek V4成本仅GPT的1/700

摘要: 2026年4月的大模型发布密度创历史之最。OpenAI连发GPT-6和GPT-5.5,Anthropic祭出Claude Opus 4.7,但最大的变数来自中国——DeepSeek V4以1.6万亿参数跑在华为昇腾芯片上,API价格仅为GPT-5.5的1/700。同一时间,Sora关停、OpenAI增长失速、Anthropic估值奔万亿美元、Claude Code抢占54%编程工具市场。本文用28个关键数据点还原这场"AI史上最疯狂的30天"。


目录


一、4月14日到24日,到底发生了什么

先扔一张时间线表,感受一下密度:

日期 厂商 事件 关键数据
4月14日 OpenAI GPT-6发布 5-6万亿参数、200万Token上下文
4月16日 Anthropic Claude Opus 4.7 100万Token输入,编程序SOTA
4月23日 OpenAI GPT-5.5 / Pro Agent-first架构,综合能力压Opus 4.7
4月24日 DeepSeek V4-Pro / Flash 1.6T参数,100%昇腾适配,成本降97%

10天,4款旗舰模型。

但光看发布时间线等于白看。真正该看的是这些模型发布背后的数据逻辑

GPT-6的200万Token上下文意味着什么?它能一次性吞下整本《三体》三部曲。不是摘要,是逐字逐句。对长文档处理而言,这基本宣告了"短时记忆限制"这个问题的终结。

Claude Opus 4.7在编码基准上跑出了历史最高分。但更有意思的是,Anthropic同时"雪藏"了一款更猛的模型Mythos——因为自主攻击能力过强,不敢公开发布。你品,一个AI公司造出了一个能力太强以至于不敢放出来的东西,这本身就说明了很多事。

GPT-5.5的意义在于定位转变——它是OpenAI的第一个"Agent-first"模型。翻译成人话:之前的大模型是"你说我答",GPT-5.5是"你告诉我目标,我来完成"。这两个定位之间的差距,就是聊天机器人和数字员工的差距。

好,说完美国玩家的常规操作,接下来才是这个月最值得深度拆解的事件。

二、DeepSeek V4:成本比GPT低700倍是怎么做到的

2.1 沉默145天后的炸弹

DeepSeek上一次发新品是去年底。这145天里发生了什么?春节AI技术战、Agent热潮、GPT-5发布、Claude Opus 4.7发布、Kimi K2.6发布——DeepSeek全部缺席。

然后4月24日,它甩出了这张牌。

2.2 硬核参数直接拉满

版本 总参数 激活参数 预训练数据 定位
V4-Pro 1.6万亿 490亿 33万亿Token 对标GPT-5.5
V4-Flash 2840亿 130亿 32万亿Token 高性价比

MoE稀疏架构是这套系统的核心。推理时只激活约490亿参数,兼顾性能与成本。说人话就是:用十分之一的算力跑出接近顶级的水平。

但参数从来不是DeepSeek的杀招。

2.3 真正的杀手锏:彻底告别英伟达

V4的硬件验证清单里并列写了两行:英伟达GPU,华为昇腾芯片。

这是全球首个发布即适配的万亿参数级纯国产大模型。不光是昇腾,寒武纪、海光、沐曦、摩尔线程、昆仑芯——一口气适配了全系列国产AI芯片。

几个扎心的数字:

  • 华为昇腾新款推理芯片采购价格:英伟达同等芯片的1/4
  • 单卡算力:较英伟达对华特供版提升2.87倍
  • API输入价格:0.25元/百万词元 vs GPT-5.5 Pro 约30美元/百万词元
  • 价差:超过700倍

700倍价差是什么概念?一家公司每月花100万调用GPT-5.5,换成DeepSeek V4只需要不到1500块。这笔账,任何有算力需求的团队都会算。

资本市场反应更直接:A股算力板块单日成交额突破1200亿元,华为昇腾芯片出货目标冲75万片——其中50万片订单已经锁定。

但我必须说一句实话:DeepSeek自己坦承,V4整体水平落后主要闭源对手约3到6个月。这不是谦虚,这是战术。落后3个月但便宜700倍 vs 领先3个月但贵700倍——这个选择题对99.99%的企业来说根本不需要犹豫。

三、Sora之死:每月烧1500万美元,收入只有210万

大模型这边烧钱烧得欢,Sora那边已经凉透了。

2024年2月,Sora首次亮相时,全网都在喊"好莱坞要完"。2025年9月正式上线,5天下载量破百万。然后呢?

  • 11月下载量峰值:333万次
  • 1月下载量:暴跌45%
  • 2月下载量:113万次
  • 30日留存率:不到5%
  • 全生命周期内购收入:约210万美元
  • 每月推理成本:1500万美元

你算一下。花1500万,赚210万。这生意搁谁身上都得关。

而且平台上62%的内容是低质量的"无厘头"视频。说白了,大部分人下载Sora就是为了生成几条搞笑视频发朋友圈,然后永远不再打开。

Sora不是死于技术不行。它是死于商业模型不成立。技术惊艳和商业可持续性之间的鸿沟,比大多数人想象的要宽得多。

但更值得关注的是Sora倒下后谁站起来了:快手可灵AI。3月全球月活780万,而Sora只有470万。可灵单季收入3.4亿元,ARR突破3亿美元。快手今年砸了260亿资本开支,比去年多了110亿,主要方向就是AI视频。

从"Sora统治一切"到"可灵全球第一",这个权力交接快得让人来不及眨眼。

四、Claude Code一统天下,Cursor不服

说完了模型层,来看应用层最直接的一个细分市场:AI编程工具。

4.1 一份让人窒息的市场份额

工具 份额 SWE-bench 年收入 核心用户
Claude Code 54% 80.8% 25亿美元 全栈、架构师、复杂项目
Copilot 22% VS Code用户、个人开发者
Cursor 15% 71.8% 20亿美元 前端、日常开发、快速原型
Windsurf 5% 特定团队

CR4 = 96%。这个市场不是"竞争激烈",是"赢家通吃"。

Claude Code凭什么拿54%?几个硬指标:100万Token上下文约等于7.5万行代码,Auto Mode可以自主规划→修改→测试→提交,实测3小时完成原本3天的工作量。

但我想说一个很多人忽略的点:Claude Code真正的护城河不是模型能力,是Skills生态。Anthropic围绕Claude Code构建了一个可安装、可复用、可交易的技能市场。开发者安装一个Skill,AI就"学会"一个能力。这等于给AI编程助手装了个App Store。

Cursor的策略不一样。它主打体验,最多8个Agent并行工作,延迟优化到0.8秒。月活突破500万,正在寻求20亿美元融资,估值冲500亿美元。

说实话,我个人判断Cursor的500亿估值有点虚。一个15%市场份额的产品估值500亿,Claude Code 54%的份额年收入才25亿——这里面的水分你品。

五、OpenAI的烦恼:钱融到了,但增长没到

5.1 财报引发的暴跌

4月27日,《华尔街日报》扔了一个炸弹:OpenAI营收和用户增长均未达到内部预期。ChatGPT没能在2025年底实现10亿周活目标,年营收也没达标。

市场哗然:

  • 甲骨文(签了3000亿美元算力合同):股价跌超6%
  • 英伟达、博通、AMD:跌3%-5%
  • 软银(核心投资方):暴跌约10%

Sam Altman紧急回应说报道"荒谬不实",但数据不会哄人——就在同一时期,Anthropic的年化收入已经突破300亿美元,首次超过了OpenAI的250亿。

5.2 Anthropic的反超

指标 OpenAI Anthropic
最新融资 1220亿美元 300亿美元(G轮)
投后估值 8520亿美元 3800亿→8000亿→奔向9000亿
年化收入 ~250亿美元 ~300亿美元
Q1营收份额 29.0% 31.4%
每活跃用户月均收入 16.20美元

Anthropic的估值变化曲线本身就是一个商业案例:2025年3月615亿,2026年2月3800亿,4月8000亿,5月正在冲刺9000亿甚至1万亿。从"OpenAI的追随者"到"估值即将反超",只用了不到半年。

什么概念?一家成立不到5年的公司,估值已经相当于2个贵州茅台。这个泡沫会不会破?不好说。但二级市场上Anthropic股票的交易价格已经炒到了接近1万亿美元对应的数字——说明真有人在用真金白银赌它能赢。

六、从"聊天"到"干活"的五个根本转变

4月21日的全球AI大会上,业界形成了五个共识。我没有全盘接受,以下是三个我认为真正值得关注的:

转变一:AI不再是你说一句它回一句

GPT-5.4原生支持Computer Use——像人类一样操作电脑,截图→分析→操作→验证。Claude Code的Auto Mode可以从需求文档一直跑到代码提交。这不是"会聊天的AI",这是"会干活的数字员工"。

我不是在危言耸听。Cursor每天生成1.5亿行企业代码,超2/3财富500强企业在用。41%的代码由AI生成或协助完成。这两个数字放一起看,意味着代码劳动正在以肉眼可见的速度从人类手里转移到AI手里。

转变二:成本正在碾压一切

DeepSeek V4的700倍价差不仅仅是一个数字,它代表了一种新的竞争范式:当性能差距缩小到可接受范围(3-6个月)时,成本优势将成为决定性变量。

这不是降维打击,这是成本碾压。一个类比:没有人会因为BBA的驾驶体验更好就去买一辆700倍价格的手机——但你在AI领域正在看到类似的事情发生。

转变三:生态的竞争正在超越模型的竞争

Claude Code用Skills生态绑定了54%的开发者。MCP协议月下载9700万次,超过1万个活跃Server在生产环境运行。这些都不是模型能力,而是生态能力。

说白了,大模型本身正在从"壁垒"变成"水电煤"——越来越强、越来越便宜、越来越同质化。真正拉开差距的是你能连接多少工具、做得了多少种任务。

OpenAI显然也看到了这一点。这大概也是他们急着和微软"分手"的原因之一——当你的合作伙伴也在开发竞品模型的时候,“独家合作"就变成了"互相提防”。

七、我的判断:接下来会发生什么

7.1 短期(5-6月)

欧盟AI法案高风险条款正式生效,罚款额度高达全球营业额6%。第一批被罚的企业一定会成为新闻头条,而且大概率是中国的出海AI产品。

国内《人工智能拟人化互动服务管理暂行办法》7月15日施行,虚拟主播、AI陪伴、AI客服都将受到分类分级监管。这几个赛道会在5-6月出现明显的收缩。

7.2 中期(下半年)

Anthropic大概率在10月前后上市。如果它以9000亿-1万亿美元估值IPO,将成为史上最大科技IPO。这笔钱进来之后,AI赛道的资本格局将彻底重构。

DeepSeek V4下半年昇腾950超节点批量上市后,Pro版本会大幅降价。届时如果V4在昇腾上稳定跑出竞争力,它就是全球首个不依赖英伟达的前沿模型——这个标签的技术和战略意义远超商业本身。

7.3 我的核心判断

2026年4月这30天,大概率是AI行业一个分水岭。不是因为模型变强了,而是因为商业逻辑变清晰了

Sora证明了技术惊艳不能当饭吃。DeepSeek证明了成本优势可以当饭吃。Claude Code证明了生态锁定可以当饭吃。Anthropic证明了企业级市场可以当饭吃。

所以如果你问我4月最大的新闻是什么——不是GPT-6,不是DeepSeek V4,不是Sora关停,而是所有这些事件组合在一起传递的同一个信号:AI行业终于开始认真思考怎么赚钱了。


本文数据截至2026年5月2日,部分数据来源于华尔街日报、彭博社、福布斯、36氪等公开报道。如有更新,欢迎在评论区补充。

你对Anthropic冲击1万亿美元估值怎么看?泡沫还是合理?评论区聊聊。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐