AI一周炸了十次!万亿订单、套壳风波、匿名霸榜全解读
文章目录
- 1、前言
- 2、一周大事件时间线
- 3、NVIDIA GTC 2026:万亿美元的AI硬件帝国
- 4、OpenAI:GPT-5.4轻量家族 + 收购Astral
- 5、Anthropic:Claude Code Channels与五角大楼之争
- 6、小米MiMo-V2:手机厂商的万亿参数"猎人"
- 7、Cursor"套壳"Kimi K2.5:中国模型的硅谷征途
- 8、腾讯AI重组:AI Lab解散,27岁首席科学家接棒
- 9、全球AI生态:Mistral、Midjourney、白宫立法
- 10、开发者生态变局:MCP协议、AI IDE竞争
- 11、竞争格局一览
- 12、其他值得关注的动态
- 13、总结:Agent时代全面到来
🍃作者介绍:25届双非本科网络工程专业,阿里云专家博主,深耕 AI 原理 / 应用开发 / 产品设计。前几年深耕Java技术体系,现专注把 AI 能力落地到实际产品与业务场景。
🦅个人主页:@逐梦苍穹
🐼GitHub主页:https://github.com/XZL-CODE
✈ 您的一键三连,是我创作的最大动力🌹
1、前言
2026年3月第三周(3/17–3/23),可能是今年AI行业信息密度最高的一周。
NVIDIA GTC大会抛出万亿美元级硬件路线图;OpenAI收购Python核心工具链;Anthropic把Claude Code接入Telegram和Discord;小米一个"匿名模型"搞得全球开发者以为是DeepSeek V4;Cursor被曝底层跑的是Kimi K2.5——十余条重磅新闻接连引爆。
一个清晰的信号浮出水面:AI正在从"聊天工具"全面切换到"自主Agent"。
本文是我对这一周所有重要事件的梳理与解读,既有新闻事实,也有我的个人分析。不废话,直接开始。

2、一周大事件时间线
先上一张总览图,方便大家快速定位本周发生了什么:
信息量很大,下面逐个展开。
3、NVIDIA GTC 2026:万亿美元的AI硬件帝国
3.1、Vera Rubin 平台发布
3月16日,GTC 2026在圣何塞开幕,Jensen Huang的主题演讲再次刷新了行业对AI基础设施规模的认知。
Vera Rubin是Blackwell之后的下一代AI计算平台,核心是NVL72机架——一个5机架、7芯片的集成系统,内含72颗Rubin GPU、36颗Vera CPU(ARM架构)和超过130万个组件,通过NVLink 6高速互联。完整的Vera Rubin POD由40个这样的机架组成,共1152颗GPU,总算力达60 exaFLOPS。
关键性能指标:
- 训练性能较Blackwell提升4倍
- 每瓦推理性能提升10倍
- 预计2026年下半年通过Azure和Google Cloud交付
Jensen Huang同时把Blackwell + Vera Rubin的合计采购订单预期从5000亿美元翻倍至1万亿美元。
3.2、Groq 3 LPU:专用推理芯片首秀
另一个重头戏是Groq 3 LPU——NVIDIA在2025年圣诞夜以200亿美元收购Groq后的首款芯片。这是一颗基于SRAM的推理加速器:
- 每颗芯片512MB片上SRAM
- 内存带宽150 TB/s
- 三星4nm工艺
- LPX机架可容纳256颗LPU
核心卖点:与NVL72配合使用时,每兆瓦推理吞吐量提升35倍。这是NVIDIA首次在其平台中加入专用推理硬件,信号很明确——推理(inference)已经和训练(training)一样重要了。
3.3、软件生态:NemoClaw、Nemotron联盟
硬件之外,NVIDIA的软件生态布局同样值得关注:
NemoClaw:面向企业的OpenClaw安全部署栈。Jensen Huang在演讲中称OpenClaw为"个人AI的操作系统",NemoClaw就是让企业能安全地大规模部署它。
Nemotron Coalition:由Mistral AI、Perplexity、Cursor、LangChain、Black Forest Labs等参与的开放模型联盟,将在DGX Cloud上共同开发开源前沿模型。
Nemotron 3 Super:1200亿参数、120亿活跃的混合Mamba-Transformer MoE模型,在SWE-Bench Verified上拿到60.47%——开源模型第一。

我的看法:NVIDIA的战略已经从"卖GPU"进化为"卖AI全栈平台"。Groq 3 LPU的加入意味着它不再只做训练硬件——Agent时代推理需求爆炸,NVIDIA在补这块拼图。Nemotron Coalition更是直接把生态伙伴绑在了DGX Cloud上,软硬件闭环越来越紧。
4、OpenAI:GPT-5.4轻量家族 + 收购Astral
4.1、GPT-5.4 mini 和 nano
3月17日,OpenAI发布了GPT-5.4系列的两款轻量模型:
GPT-5.4 mini:面向免费和Go用户通过"Thinking"模式提供,在SWE-Bench Pro等基准上接近完整版GPT-5.4的95%水平,速度快2倍以上。
GPT-5.4 nano:最小最便宜,API定价$0.20/百万输入token、$1.25/百万输出token,面向高吞吐场景。
同时,ChatGPT的模型选择器被简化为三层:Instant(快速日常)、Thinking(推理优先)、Pro(最强能力),支持自动路由。
4.2、收购Astral:拿下Python基础设施
3月19日的收购Astral才是本周OpenAI最值得关注的动作。
Astral开发了Python社区最受欢迎的三个工具:包管理器uv、代码检查器Ruff、类型检查器Ty。这三个工具基本上是2025–2026年Python开发者的标配。Astral团队将加入OpenAI的Codex团队。
背景数据:Codex现在的周活跃用户超过200万,自2026年1月以来用户增长3倍、使用量增长5倍。
OpenAI承诺继续维护这些开源工具,但社区反应很复杂——知名开发者Simon Willison发表长文分析了担忧点,核心是:当一家AI公司控制了编程语言的核心工具链,开源社区的独立性怎么保证?
4.3、IPO准备与扩张
OpenAI本周还被曝出多条扩张消息:
- 最新估值8400亿美元(1100亿融资:亚马逊500亿、软银300亿、NVIDIA 300亿)
- ChatGPT周活跃用户超9亿,付费订阅5000万
- 计划年底前员工从4500人扩至8000人
- 2026年Q4启动IPO
我的看法:收购Astral是OpenAI从"AI模型公司"向"AI开发者平台"转型的关键一步。控制了uv/ruff这样的基础工具意味着OpenAI可以深度整合到开发者日常工作流中——这比任何API定价战都更有战略价值。不过社区担忧是合理的,Python生态的中立性确实值得关注。
5、Anthropic:Claude Code Channels与五角大楼之争
5.1、Claude Code Channels:把AI编程搬进聊天App
3月20日,Anthropic发布了Claude Code Channels——这可能是本周最具想象力的产品发布。
它的核心思路很简单:把Claude Code连接到Discord和Telegram。用户可以在手机上通过聊天App直接给Claude Code发编程指令,实现异步自主编程。不需要打开IDE,不需要坐在电脑前——你在地铁上给它发条消息,到公司的时候代码已经写好了。
技术上,它基于MCP(Model Context Protocol)协议构建,通过--channels标志启动后,Claude Code作为轮询服务运行在持久化服务器上。VentureBeat直接称其为"OpenClaw杀手"。
此外,Claude Code在3月还更新了:
- 按键说话语音模式(
/voice,支持15+语言) /loop循环监控命令- 100万token上下文窗口全面开放
- 新的MCP引导交互功能
5.2、vs 五角大楼:AI伦理红线之争
另一条线是Anthropic与美国国防部的法律对峙。
五角大楼把Anthropic列为"供应链风险"——原因是公司拒绝让Claude被不受限制地用于自主武器和大规模监控。3月18日国防部提交反驳文件,3月20日Anthropic回击,声称政府的论据基于"技术误解"。
有意思的是,微软、Google和OpenAI的员工(包括Google首席科学家Jeff Dean)都提交了支持Anthropic的法庭简报。CNN报道这场争端反而提升了Anthropic的品牌认知度——员工留存率80%、offer接受率88%。
听证会定于3月24日(也就是明天)在旧金山举行。
我的看法:Claude Code Channels的意义在于——它验证了"AI编程不一定要发生在IDE里"这个假设。对于我们做NewClaw这种AI伴侣产品的人来说,这条路已经被Anthropic官方跑通了。五角大楼事件则可能成为AI行业安全伦理的标志性案例。
6、小米MiMo-V2:手机厂商的万亿参数"猎人"
6.1、匿名测试霸榜
本周中国AI最炸裂的新闻是小米。
3月11日,一个叫"Hunter Alpha"的匿名模型出现在OpenRouter平台,一周内消耗超过1万亿token,多日霸榜第一。全球开发者都在猜——这是DeepSeek V4吧?
3月18–19日,路透社确认:不是DeepSeek V4,而是小米MiMo-V2-Pro。
6.2、核心参数
MiMo-V2-Pro的参数相当亮眼:
- 总参数1万亿,每次推理激活420亿
- MoE架构 + Hybrid Attention(7:1比率)+ 多Token预测
- 100万token上下文窗口
- 全球排名第8,中国排名第2(仅次于智谱GLM-5)
- 编程/Agent能力接近Claude Opus 4.6,整体超过Claude Sonnet 4.6
- 定价$1/百万输入、$3/百万输出——Claude Opus 4.6的五分之一
同期还发布了MiMo-V2-Omni(全模态Agent模型)和MiMo-V2-TTS(支持粤语、四川话等方言的语音合成)。
该项目由前DeepSeek核心研究员罗福莉领衔。雷军宣布小米2026年AI研发+资本开支将超过1600亿元人民币。
我的看法:小米这波操作很聪明——匿名测试先让市场验证产品力,再揭面收获最大关注度。"被误认为DeepSeek V4"本身就是最好的背书。更深层的信号是:中国AI竞争已经不只是互联网公司的游戏了,硬件厂商正在凭借资金和工程能力强势入场。
7、Cursor"套壳"Kimi K2.5:中国模型的硅谷征途
7.1、事件始末
这是本周最具戏剧性的故事。
3月20日,估值293亿美元的AI编程工具Cursor发布"Composer 2",宣称自研模型。数小时内,开发者@fynnso发现模型ID写着kimi-k2p5-rl-0317-s515-fast——直指月之暗面的Kimi K2.5。
Elon Musk亲自评论确认了这一点。月之暗面预训练负责人杜玉伦公开指控Cursor违反许可协议(帖子后来删除)。
7.2、反转与真相
事情很快反转:
- Kimi官方发布祝贺声明,确认Cursor通过Fireworks AI的授权商业协议获取K2.5
- Cursor承认K2.5是基础(约占25%算力),75%来自自行的继续预训练+强化学习
- Composer 2在内部评测中得分61.3,超过Claude Opus 4.6的58.2
7.3、更深的意义
Kimi K2.5于1月27日发布,20天内收入即超过2025全年。Stripe数据显示订阅量环比增长8280%。目前月之暗面正以1800亿美元估值进行100亿美元新融资,阿里和腾讯均参与。
Kimi团队还在本周发表了"Attention Residuals"论文——提出替代Transformer残差连接的方案,训练效率提升约25%。论文联合作者中包括一名17岁的深圳高中生。Andrej Karpathy和前OpenAI VP Jerry Tworek均给予高度评价。
我的看法:中国开源模型正在成为硅谷产品的底层基础设施。 这句话放在一年前说出来,大多数人会觉得不可思议。Kimi K2.5驱动着全球最火的AI编程工具——这个事实比任何benchmark都有说服力。同时这也提醒我们:模型供应链的透明度正在成为新的行业议题。
8、腾讯AI重组:AI Lab解散,27岁首席科学家接棒
3月20日,腾讯正式解散运营10年的AI Lab,全部人员并入混元(Hunyuan)团队。新团队由27岁的前OpenAI研究员姚顺雨领导,直接向总裁刘炽平汇报。
几个关键数字:
- 2025年总收入7518亿元(+14%)
- 2025年混元+元宝AI投入约1800亿元
- 2026年AI投入承诺翻倍至3600亿+
- 资本开支792亿元、研发费用857.5亿元均创新高
- 元宝App月活超1亿
- 混元3.0确认4月发布
另外,DeepSeek核心成员郭大亚据报已离开,加入字节跳动Seed团队。
我的看法:腾讯这次重组的力度很大。把独立的AI Lab并入产品线(混元),说明腾讯要的不是论文产出,而是AI产品化落地。27岁的首席科学家也打破了传统——AI行业的竞争已经快到不能靠论资排辈了。混元3.0四月发布,值得持续关注。
9、全球AI生态:Mistral、Midjourney、白宫立法
9.1、Mistral Small 4:60亿活跃参数的MoE新标杆
Mistral AI在GTC期间发布了Mistral Small 4:
- 128个专家、每token激活4个的MoE架构
- 总参数1190亿,活跃参数仅60亿
- 25.6万token上下文窗口
- 首次统一了推理(Magistral)、多模态(Pixtral)和Agent编程(Devstral)三大能力
- 延迟降低40%,每秒请求量提升3倍
- Apache 2.0开源
同时发布的Mistral Forge是一个企业定制平台,支持在私有数据上进行预训练、微调和强化学习。早期客户包括爱立信、ESA、ASML等。
9.2、Midjourney V8 Alpha
Midjourney V8 Alpha是V5以来最大的升级:
- 生成速度提升5倍
- 原生2K分辨率输出
- 文字渲染准确度大幅提升
- 复杂构图的空间、光照、纹理遵循度显著增强
- 新增
--q 4质量模式 - 全新代码库和GPU基础设施
目前仅在alpha.midjourney.com可用。
9.3、白宫AI立法框架
3月20日,白宫发布国家AI立法框架,七大支柱包括保护儿童、社区安全、知识产权、反审查、创新、劳动力、以及联邦法律取代各州AI法律。
核心立场:反对设定开放式AI责任,反对创建新的联邦AI监管机构,主张行业自律。已遭50多位共和党议员和AI监管组织反对。
同期,欧盟理事会同意将AI法案高风险系统规则推迟最多16个月执行。美国司法部指控三人涉嫌将AI GPU服务器非法转运至中国。
10、开发者生态变局:MCP协议、AI IDE竞争
10.1、MCP成为事实标准
MCP(Model Context Protocol)由Anthropic于2024年11月创建,2025年12月捐赠给Linux基金会的Agentic AI Foundation。
截至2026年3月:
- SDK月下载量超9700万次
- 活跃公共MCP服务器超1万个
- 被ChatGPT、Cursor、Claude Code、Windsurf、Codex CLI、VS Code全部支持
- 配套A2A协议形成三层架构:MCP(工具层)→ A2A(Agent层)→ WebMCP(Web访问层)
10.2、AI IDE最新格局
2026年3月AI IDE排名:
- Windsurf:Arena Mode + 5路并行Agent
- Google Antigravity:免费Agent优先IDE
- Cursor 2.0:Composer模型4倍加速、8路并行
- Claude Code:终端优先、SWE-bench 80.9%
- OpenAI Codex:重返前五
一个惊人的数字:92%的美国开发者每日使用AI编程工具,41–46%的代码现在由AI生成。
10.3、OpenClaw生态继续膨胀
OpenClaw的GitHub Star突破21万,成为GitHub史上增长最快的项目。支持WhatsApp、Telegram、Slack等全渠道,社区已构建5700+技能。创始人Peter Steinberger已加入OpenAI,项目正在向开源基金会过渡。
11、竞争格局一览

12、其他值得关注的动态
- 字节豆包内测AI购物功能(App内直接浏览下单),2月MAU 3.15亿(+87%),中国第一
- 阿里通义App 2月MAU从3100万暴增至2.03亿(+553%),阿里成立ATH事业群提升至一级BU
- MiniMax发布全球首份大模型公司财报:2025年收入7900万美元(+159%),2月ARR突破1.5亿
- DeepSeek V4截至3/23仍未正式发布,多个预期窗口已过
- 行业交易:Meta与Nebius签270亿美元AI基础设施协议、IBM完成收购Confluent、Accenture收购Faculty
- AI安全融资:Xbow 1.2亿美元(估值超10亿)、Oasis Security 1.2亿美元、AMI Labs 10.3亿美元种子轮(欧洲史上最大)
13、总结:Agent时代全面到来
回顾这一周,一个共同主线清晰而明确:AI正在从"回答问题"全面转向"执行任务"。
每一家主要公司的核心发布都围绕Agent能力展开——NVIDIA的NemoClaw、OpenAI的Codex+Astral、Anthropic的Claude Code Channels、小米的MiMo Agent评测领先。行业基准也在从传统的MMLU、HumanEval转向Agent导向的PinchBench、ClawEval。
中国AI力量本周展现了前所未有的影响力:小米万亿参数模型性价比碾压式入场,Kimi K2.5成为硅谷顶级编程工具的底层,腾讯3600亿AI投入承诺。中美模型性能差距已从7个月缩短至约3个月,而在成本效率上中国模型已全面领先。
对开发者而言,现在面对的不再是"是否使用AI"的选择,而是"如何在多模型、多Agent、多协议的生态中构建最优工作流"。MCP+A2A协议栈的标准化、AI IDE的激烈竞争、Agent框架的快速迭代——这些正在重塑软件开发的每一个环节。
这是新范式确立的关键时刻。
我是龙哥,我们下期见。
🚀 持续探索 AI 与前沿技术 分享大模型应用、软件开发实战与行业洞察。 欢迎关注公众号 【龙哥AI】,加入 7000+ 技术同行的交流圈! 🌟 探索技术边界,让开发更有效率 |
![]() |
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)