AI一周炸了十次！万亿订单、套壳风波、匿名霸榜全解读

︶ㄣ释然

1041人浏览 · 2026-03-23 20:48:21

︶ㄣ释然 · 2026-03-23 20:48:21 发布

文章目录

1、前言
2、一周大事件时间线
3、NVIDIA GTC 2026：万亿美元的AI硬件帝国
- 3.1、Vera Rubin 平台发布
- 3.2、Groq 3 LPU：专用推理芯片首秀
- 3.3、软件生态：NemoClaw、Nemotron联盟
4、OpenAI：GPT-5.4轻量家族 + 收购Astral
- 4.1、GPT-5.4 mini 和 nano
- 4.2、收购Astral：拿下Python基础设施
- 4.3、IPO准备与扩张
5、Anthropic：Claude Code Channels与五角大楼之争
- 5.1、Claude Code Channels：把AI编程搬进聊天App
- 5.2、vs 五角大楼：AI伦理红线之争
6、小米MiMo-V2：手机厂商的万亿参数"猎人"
- 6.1、匿名测试霸榜
- 6.2、核心参数
7、Cursor"套壳"Kimi K2.5：中国模型的硅谷征途
- 7.1、事件始末
- 7.2、反转与真相
- 7.3、更深的意义
8、腾讯AI重组：AI Lab解散，27岁首席科学家接棒
9、全球AI生态：Mistral、Midjourney、白宫立法
- 9.1、Mistral Small 4：60亿活跃参数的MoE新标杆
- 9.2、Midjourney V8 Alpha
- 9.3、白宫AI立法框架
10、开发者生态变局：MCP协议、AI IDE竞争
- 10.1、MCP成为事实标准
- 10.2、AI IDE最新格局
- 10.3、OpenClaw生态继续膨胀
11、竞争格局一览
12、其他值得关注的动态
13、总结：Agent时代全面到来

🍃作者介绍：25届双非本科网络工程专业，阿里云专家博主，深耕 AI 原理 / 应用开发 / 产品设计。前几年深耕Java技术体系，现专注把 AI 能力落地到实际产品与业务场景。
🦅个人主页：@逐梦苍穹
🐼GitHub主页：https://github.com/XZL-CODE
✈ 您的一键三连，是我创作的最大动力🌹

1、前言

2026年3月第三周（3/17–3/23），可能是今年AI行业信息密度最高的一周。

NVIDIA GTC大会抛出万亿美元级硬件路线图；OpenAI收购Python核心工具链；Anthropic把Claude Code接入Telegram和Discord；小米一个"匿名模型"搞得全球开发者以为是DeepSeek V4；Cursor被曝底层跑的是Kimi K2.5——十余条重磅新闻接连引爆。

一个清晰的信号浮出水面：AI正在从"聊天工具"全面切换到"自主Agent"。

本文是我对这一周所有重要事件的梳理与解读，既有新闻事实，也有我的个人分析。不废话，直接开始。

在这里插入图片描述

2、一周大事件时间线

先上一张总览图，方便大家快速定位本周发生了什么：
在这里插入图片描述

信息量很大，下面逐个展开。

3、NVIDIA GTC 2026：万亿美元的AI硬件帝国

3.1、Vera Rubin 平台发布

3月16日，GTC 2026在圣何塞开幕，Jensen Huang的主题演讲再次刷新了行业对AI基础设施规模的认知。

Vera Rubin是Blackwell之后的下一代AI计算平台，核心是NVL72机架——一个5机架、7芯片的集成系统，内含72颗Rubin GPU、36颗Vera CPU（ARM架构）和超过130万个组件，通过NVLink 6高速互联。完整的Vera Rubin POD由40个这样的机架组成，共1152颗GPU，总算力达60 exaFLOPS。

关键性能指标：

训练性能较Blackwell提升4倍
每瓦推理性能提升10倍
预计2026年下半年通过Azure和Google Cloud交付

Jensen Huang同时把Blackwell + Vera Rubin的合计采购订单预期从5000亿美元翻倍至1万亿美元。

3.2、Groq 3 LPU：专用推理芯片首秀

另一个重头戏是Groq 3 LPU——NVIDIA在2025年圣诞夜以200亿美元收购Groq后的首款芯片。这是一颗基于SRAM的推理加速器：

每颗芯片512MB片上SRAM
内存带宽150 TB/s
三星4nm工艺
LPX机架可容纳256颗LPU

核心卖点：与NVL72配合使用时，每兆瓦推理吞吐量提升35倍。这是NVIDIA首次在其平台中加入专用推理硬件，信号很明确——推理（inference）已经和训练（training）一样重要了。

3.3、软件生态：NemoClaw、Nemotron联盟

硬件之外，NVIDIA的软件生态布局同样值得关注：

NemoClaw：面向企业的OpenClaw安全部署栈。Jensen Huang在演讲中称OpenClaw为"个人AI的操作系统"，NemoClaw就是让企业能安全地大规模部署它。

Nemotron Coalition：由Mistral AI、Perplexity、Cursor、LangChain、Black Forest Labs等参与的开放模型联盟，将在DGX Cloud上共同开发开源前沿模型。

Nemotron 3 Super：1200亿参数、120亿活跃的混合Mamba-Transformer MoE模型，在SWE-Bench Verified上拿到60.47%——开源模型第一。

在这里插入图片描述

我的看法：NVIDIA的战略已经从"卖GPU"进化为"卖AI全栈平台"。Groq 3 LPU的加入意味着它不再只做训练硬件——Agent时代推理需求爆炸，NVIDIA在补这块拼图。Nemotron Coalition更是直接把生态伙伴绑在了DGX Cloud上，软硬件闭环越来越紧。

4、OpenAI：GPT-5.4轻量家族 + 收购Astral

4.1、GPT-5.4 mini 和 nano

3月17日，OpenAI发布了GPT-5.4系列的两款轻量模型：

GPT-5.4 mini：面向免费和Go用户通过"Thinking"模式提供，在SWE-Bench Pro等基准上接近完整版GPT-5.4的95%水平，速度快2倍以上。

GPT-5.4 nano：最小最便宜，API定价$0.20/百万输入token、$1.25/百万输出token，面向高吞吐场景。

同时，ChatGPT的模型选择器被简化为三层：Instant（快速日常）、Thinking（推理优先）、Pro（最强能力），支持自动路由。

4.2、收购Astral：拿下Python基础设施

3月19日的收购Astral才是本周OpenAI最值得关注的动作。

Astral开发了Python社区最受欢迎的三个工具：包管理器uv、代码检查器Ruff、类型检查器Ty。这三个工具基本上是2025–2026年Python开发者的标配。Astral团队将加入OpenAI的Codex团队。

背景数据：Codex现在的周活跃用户超过200万，自2026年1月以来用户增长3倍、使用量增长5倍。

OpenAI承诺继续维护这些开源工具，但社区反应很复杂——知名开发者Simon Willison发表长文分析了担忧点，核心是：当一家AI公司控制了编程语言的核心工具链，开源社区的独立性怎么保证？

4.3、IPO准备与扩张

OpenAI本周还被曝出多条扩张消息：

最新估值8400亿美元（1100亿融资：亚马逊500亿、软银300亿、NVIDIA 300亿）
ChatGPT周活跃用户超9亿，付费订阅5000万
计划年底前员工从4500人扩至8000人
2026年Q4启动IPO

我的看法：收购Astral是OpenAI从"AI模型公司"向"AI开发者平台"转型的关键一步。控制了uv/ruff这样的基础工具意味着OpenAI可以深度整合到开发者日常工作流中——这比任何API定价战都更有战略价值。不过社区担忧是合理的，Python生态的中立性确实值得关注。

5、Anthropic：Claude Code Channels与五角大楼之争

5.1、Claude Code Channels：把AI编程搬进聊天App

3月20日，Anthropic发布了Claude Code Channels——这可能是本周最具想象力的产品发布。

它的核心思路很简单：把Claude Code连接到Discord和Telegram。用户可以在手机上通过聊天App直接给Claude Code发编程指令，实现异步自主编程。不需要打开IDE，不需要坐在电脑前——你在地铁上给它发条消息，到公司的时候代码已经写好了。

技术上，它基于MCP（Model Context Protocol）协议构建，通过--channels标志启动后，Claude Code作为轮询服务运行在持久化服务器上。VentureBeat直接称其为"OpenClaw杀手"。

此外，Claude Code在3月还更新了：

按键说话语音模式（/voice，支持15+语言）
/loop循环监控命令
100万token上下文窗口全面开放
新的MCP引导交互功能

5.2、vs 五角大楼：AI伦理红线之争

另一条线是Anthropic与美国国防部的法律对峙。

五角大楼把Anthropic列为"供应链风险"——原因是公司拒绝让Claude被不受限制地用于自主武器和大规模监控。3月18日国防部提交反驳文件，3月20日Anthropic回击，声称政府的论据基于"技术误解"。

有意思的是，微软、Google和OpenAI的员工（包括Google首席科学家Jeff Dean）都提交了支持Anthropic的法庭简报。CNN报道这场争端反而提升了Anthropic的品牌认知度——员工留存率80%、offer接受率88%。

听证会定于3月24日（也就是明天）在旧金山举行。

我的看法：Claude Code Channels的意义在于——它验证了"AI编程不一定要发生在IDE里"这个假设。对于我们做NewClaw这种AI伴侣产品的人来说，这条路已经被Anthropic官方跑通了。五角大楼事件则可能成为AI行业安全伦理的标志性案例。

6、小米MiMo-V2：手机厂商的万亿参数"猎人"

6.1、匿名测试霸榜

本周中国AI最炸裂的新闻是小米。

3月11日，一个叫"Hunter Alpha"的匿名模型出现在OpenRouter平台，一周内消耗超过1万亿token，多日霸榜第一。全球开发者都在猜——这是DeepSeek V4吧？

3月18–19日，路透社确认：不是DeepSeek V4，而是小米MiMo-V2-Pro。

6.2、核心参数

MiMo-V2-Pro的参数相当亮眼：

总参数1万亿，每次推理激活420亿
MoE架构 + Hybrid Attention（7:1比率）+ 多Token预测
100万token上下文窗口
全球排名第8，中国排名第2（仅次于智谱GLM-5）
编程/Agent能力接近Claude Opus 4.6，整体超过Claude Sonnet 4.6
定价$1/百万输入、$3/百万输出——Claude Opus 4.6的五分之一

同期还发布了MiMo-V2-Omni（全模态Agent模型）和MiMo-V2-TTS（支持粤语、四川话等方言的语音合成）。

该项目由前DeepSeek核心研究员罗福莉领衔。雷军宣布小米2026年AI研发+资本开支将超过1600亿元人民币。

我的看法：小米这波操作很聪明——匿名测试先让市场验证产品力，再揭面收获最大关注度。"被误认为DeepSeek V4"本身就是最好的背书。更深层的信号是：中国AI竞争已经不只是互联网公司的游戏了，硬件厂商正在凭借资金和工程能力强势入场。

7、Cursor"套壳"Kimi K2.5：中国模型的硅谷征途

7.1、事件始末

这是本周最具戏剧性的故事。

3月20日，估值293亿美元的AI编程工具Cursor发布"Composer 2"，宣称自研模型。数小时内，开发者@fynnso发现模型ID写着kimi-k2p5-rl-0317-s515-fast——直指月之暗面的Kimi K2.5。

Elon Musk亲自评论确认了这一点。月之暗面预训练负责人杜玉伦公开指控Cursor违反许可协议（帖子后来删除）。

7.2、反转与真相

事情很快反转：

Kimi官方发布祝贺声明，确认Cursor通过Fireworks AI的授权商业协议获取K2.5
Cursor承认K2.5是基础（约占25%算力），75%来自自行的继续预训练+强化学习
Composer 2在内部评测中得分61.3，超过Claude Opus 4.6的58.2

7.3、更深的意义

Kimi K2.5于1月27日发布，20天内收入即超过2025全年。Stripe数据显示订阅量环比增长8280%。目前月之暗面正以1800亿美元估值进行100亿美元新融资，阿里和腾讯均参与。

Kimi团队还在本周发表了"Attention Residuals"论文——提出替代Transformer残差连接的方案，训练效率提升约25%。论文联合作者中包括一名17岁的深圳高中生。Andrej Karpathy和前OpenAI VP Jerry Tworek均给予高度评价。

我的看法：中国开源模型正在成为硅谷产品的底层基础设施。 这句话放在一年前说出来，大多数人会觉得不可思议。Kimi K2.5驱动着全球最火的AI编程工具——这个事实比任何benchmark都有说服力。同时这也提醒我们：模型供应链的透明度正在成为新的行业议题。

8、腾讯AI重组：AI Lab解散，27岁首席科学家接棒

3月20日，腾讯正式解散运营10年的AI Lab，全部人员并入混元（Hunyuan）团队。新团队由27岁的前OpenAI研究员姚顺雨领导，直接向总裁刘炽平汇报。

几个关键数字：

2025年总收入7518亿元（+14%）
2025年混元+元宝AI投入约1800亿元
2026年AI投入承诺翻倍至3600亿+
资本开支792亿元、研发费用857.5亿元均创新高
元宝App月活超1亿
混元3.0确认4月发布

另外，DeepSeek核心成员郭大亚据报已离开，加入字节跳动Seed团队。

我的看法：腾讯这次重组的力度很大。把独立的AI Lab并入产品线（混元），说明腾讯要的不是论文产出，而是AI产品化落地。27岁的首席科学家也打破了传统——AI行业的竞争已经快到不能靠论资排辈了。混元3.0四月发布，值得持续关注。

9、全球AI生态：Mistral、Midjourney、白宫立法

9.1、Mistral Small 4：60亿活跃参数的MoE新标杆

Mistral AI在GTC期间发布了Mistral Small 4：

128个专家、每token激活4个的MoE架构
总参数1190亿，活跃参数仅60亿
25.6万token上下文窗口
首次统一了推理（Magistral）、多模态（Pixtral）和Agent编程（Devstral）三大能力
延迟降低40%，每秒请求量提升3倍
Apache 2.0开源

同时发布的Mistral Forge是一个企业定制平台，支持在私有数据上进行预训练、微调和强化学习。早期客户包括爱立信、ESA、ASML等。

9.2、Midjourney V8 Alpha

Midjourney V8 Alpha是V5以来最大的升级：

生成速度提升5倍
原生2K分辨率输出
文字渲染准确度大幅提升
复杂构图的空间、光照、纹理遵循度显著增强
新增--q 4质量模式
全新代码库和GPU基础设施

目前仅在alpha.midjourney.com可用。

9.3、白宫AI立法框架

3月20日，白宫发布国家AI立法框架，七大支柱包括保护儿童、社区安全、知识产权、反审查、创新、劳动力、以及联邦法律取代各州AI法律。

核心立场：反对设定开放式AI责任，反对创建新的联邦AI监管机构，主张行业自律。已遭50多位共和党议员和AI监管组织反对。

同期，欧盟理事会同意将AI法案高风险系统规则推迟最多16个月执行。美国司法部指控三人涉嫌将AI GPU服务器非法转运至中国。

10、开发者生态变局：MCP协议、AI IDE竞争

10.1、MCP成为事实标准

MCP（Model Context Protocol）由Anthropic于2024年11月创建，2025年12月捐赠给Linux基金会的Agentic AI Foundation。

截至2026年3月：

SDK月下载量超9700万次
活跃公共MCP服务器超1万个
被ChatGPT、Cursor、Claude Code、Windsurf、Codex CLI、VS Code全部支持
配套A2A协议形成三层架构：MCP（工具层）→ A2A（Agent层）→ WebMCP（Web访问层）

10.2、AI IDE最新格局

2026年3月AI IDE排名：

Windsurf：Arena Mode + 5路并行Agent
Google Antigravity：免费Agent优先IDE
Cursor 2.0：Composer模型4倍加速、8路并行
Claude Code：终端优先、SWE-bench 80.9%
OpenAI Codex：重返前五

一个惊人的数字：92%的美国开发者每日使用AI编程工具，41–46%的代码现在由AI生成。

10.3、OpenClaw生态继续膨胀

OpenClaw的GitHub Star突破21万，成为GitHub史上增长最快的项目。支持WhatsApp、Telegram、Slack等全渠道，社区已构建5700+技能。创始人Peter Steinberger已加入OpenAI，项目正在向开源基金会过渡。

11、竞争格局一览

在这里插入图片描述

12、其他值得关注的动态

字节豆包内测AI购物功能（App内直接浏览下单），2月MAU 3.15亿（+87%），中国第一
阿里通义App 2月MAU从3100万暴增至2.03亿（+553%），阿里成立ATH事业群提升至一级BU
MiniMax发布全球首份大模型公司财报：2025年收入7900万美元（+159%），2月ARR突破1.5亿
DeepSeek V4截至3/23仍未正式发布，多个预期窗口已过
行业交易：Meta与Nebius签270亿美元AI基础设施协议、IBM完成收购Confluent、Accenture收购Faculty
AI安全融资：Xbow 1.2亿美元（估值超10亿）、Oasis Security 1.2亿美元、AMI Labs 10.3亿美元种子轮（欧洲史上最大）

13、总结：Agent时代全面到来

回顾这一周，一个共同主线清晰而明确：AI正在从"回答问题"全面转向"执行任务"。

每一家主要公司的核心发布都围绕Agent能力展开——NVIDIA的NemoClaw、OpenAI的Codex+Astral、Anthropic的Claude Code Channels、小米的MiMo Agent评测领先。行业基准也在从传统的MMLU、HumanEval转向Agent导向的PinchBench、ClawEval。

中国AI力量本周展现了前所未有的影响力：小米万亿参数模型性价比碾压式入场，Kimi K2.5成为硅谷顶级编程工具的底层，腾讯3600亿AI投入承诺。中美模型性能差距已从7个月缩短至约3个月，而在成本效率上中国模型已全面领先。

对开发者而言，现在面对的不再是"是否使用AI"的选择，而是"如何在多模型、多Agent、多协议的生态中构建最优工作流"。MCP+A2A协议栈的标准化、AI IDE的激烈竞争、Agent框架的快速迭代——这些正在重塑软件开发的每一个环节。

这是新范式确立的关键时刻。

我是龙哥，我们下期见。

🚀 持续探索 AI 与前沿技术

分享大模型应用、软件开发实战与行业洞察。
欢迎关注公众号 【龙哥AI】，加入 7000+ 技术同行的交流圈！

🌟 探索技术边界，让开发更有效率

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

实战：为你的异步网络库手写一个 `awaiter` 对象：实现自定义的挂起逻辑

awaiter。

AtomGit开源社区

数据团队该醒醒了：AI智能体不是你的下一个仪表盘

—而就在半年前，这个目标还被外界视为“疯狂”。与此同时，Just Eat有超过95%的工程师每天都在使用AI编码工具，30-40%的生产代码由AI生成。数据团队也正站在一个十字路口。

AtomGit开源社区

AI时代，重温10大经典排序算法

生活类比：就像整理扑克牌，如果手里有很多牌，一次只按相隔一定间距（比如每隔10张牌）把牌插入到已排好的位置，先把大块牌大致排好序，再缩小间距，一次次精细调整，最后整个牌堆就排好了。：统计每个元素出现的次数，用额外数组记录到对应下标，再按顺序输出，实现排序，不进行元素比较。：就像整理一堆水果，把最大的放在顶上，每次取出最顶上的水果放到盘子里，然后让剩下的水果重新“自动堆成一座山”，下一次再取最大的。