🍃作者介绍:25届双非本科网络工程专业,阿里云专家博主,深耕 AI 原理 / 应用开发 / 产品设计。前几年深耕Java技术体系,现专注把 AI 能力落地到实际产品与业务场景。
🦅个人主页:@逐梦苍穹
🐼GitHub主页:https://github.com/XZL-CODE
✈ 您的一键三连,是我创作的最大动力🌹

1、前言

2026年3月第三周(3/17–3/23),可能是今年AI行业信息密度最高的一周。

NVIDIA GTC大会抛出万亿美元级硬件路线图;OpenAI收购Python核心工具链;Anthropic把Claude Code接入Telegram和Discord;小米一个"匿名模型"搞得全球开发者以为是DeepSeek V4;Cursor被曝底层跑的是Kimi K2.5——十余条重磅新闻接连引爆。

一个清晰的信号浮出水面:AI正在从"聊天工具"全面切换到"自主Agent"。

本文是我对这一周所有重要事件的梳理与解读,既有新闻事实,也有我的个人分析。不废话,直接开始。

在这里插入图片描述

2、一周大事件时间线

先上一张总览图,方便大家快速定位本周发生了什么:
在这里插入图片描述

信息量很大,下面逐个展开。

3、NVIDIA GTC 2026:万亿美元的AI硬件帝国

3.1、Vera Rubin 平台发布

3月16日,GTC 2026在圣何塞开幕,Jensen Huang的主题演讲再次刷新了行业对AI基础设施规模的认知。

Vera Rubin是Blackwell之后的下一代AI计算平台,核心是NVL72机架——一个5机架、7芯片的集成系统,内含72颗Rubin GPU、36颗Vera CPU(ARM架构)和超过130万个组件,通过NVLink 6高速互联。完整的Vera Rubin POD由40个这样的机架组成,共1152颗GPU,总算力达60 exaFLOPS。

关键性能指标:

  • 训练性能较Blackwell提升4倍
  • 每瓦推理性能提升10倍
  • 预计2026年下半年通过Azure和Google Cloud交付

Jensen Huang同时把Blackwell + Vera Rubin的合计采购订单预期从5000亿美元翻倍至1万亿美元

3.2、Groq 3 LPU:专用推理芯片首秀

另一个重头戏是Groq 3 LPU——NVIDIA在2025年圣诞夜以200亿美元收购Groq后的首款芯片。这是一颗基于SRAM的推理加速器:

  • 每颗芯片512MB片上SRAM
  • 内存带宽150 TB/s
  • 三星4nm工艺
  • LPX机架可容纳256颗LPU

核心卖点:与NVL72配合使用时,每兆瓦推理吞吐量提升35倍。这是NVIDIA首次在其平台中加入专用推理硬件,信号很明确——推理(inference)已经和训练(training)一样重要了。

3.3、软件生态:NemoClaw、Nemotron联盟

硬件之外,NVIDIA的软件生态布局同样值得关注:

NemoClaw:面向企业的OpenClaw安全部署栈。Jensen Huang在演讲中称OpenClaw为"个人AI的操作系统",NemoClaw就是让企业能安全地大规模部署它。

Nemotron Coalition:由Mistral AI、Perplexity、Cursor、LangChain、Black Forest Labs等参与的开放模型联盟,将在DGX Cloud上共同开发开源前沿模型。

Nemotron 3 Super:1200亿参数、120亿活跃的混合Mamba-Transformer MoE模型,在SWE-Bench Verified上拿到60.47%——开源模型第一

在这里插入图片描述

我的看法:NVIDIA的战略已经从"卖GPU"进化为"卖AI全栈平台"。Groq 3 LPU的加入意味着它不再只做训练硬件——Agent时代推理需求爆炸,NVIDIA在补这块拼图。Nemotron Coalition更是直接把生态伙伴绑在了DGX Cloud上,软硬件闭环越来越紧。

4、OpenAI:GPT-5.4轻量家族 + 收购Astral

4.1、GPT-5.4 mini 和 nano

3月17日,OpenAI发布了GPT-5.4系列的两款轻量模型:

GPT-5.4 mini:面向免费和Go用户通过"Thinking"模式提供,在SWE-Bench Pro等基准上接近完整版GPT-5.4的95%水平,速度快2倍以上。

GPT-5.4 nano:最小最便宜,API定价$0.20/百万输入token、$1.25/百万输出token,面向高吞吐场景。

同时,ChatGPT的模型选择器被简化为三层:Instant(快速日常)、Thinking(推理优先)、Pro(最强能力),支持自动路由。

4.2、收购Astral:拿下Python基础设施

3月19日的收购Astral才是本周OpenAI最值得关注的动作。

Astral开发了Python社区最受欢迎的三个工具:包管理器uv、代码检查器Ruff、类型检查器Ty。这三个工具基本上是2025–2026年Python开发者的标配。Astral团队将加入OpenAI的Codex团队

背景数据:Codex现在的周活跃用户超过200万,自2026年1月以来用户增长3倍、使用量增长5倍。

OpenAI承诺继续维护这些开源工具,但社区反应很复杂——知名开发者Simon Willison发表长文分析了担忧点,核心是:当一家AI公司控制了编程语言的核心工具链,开源社区的独立性怎么保证?

4.3、IPO准备与扩张

OpenAI本周还被曝出多条扩张消息:

  • 最新估值8400亿美元(1100亿融资:亚马逊500亿、软银300亿、NVIDIA 300亿)
  • ChatGPT周活跃用户超9亿,付费订阅5000万
  • 计划年底前员工从4500人扩至8000人
  • 2026年Q4启动IPO

我的看法:收购Astral是OpenAI从"AI模型公司"向"AI开发者平台"转型的关键一步。控制了uv/ruff这样的基础工具意味着OpenAI可以深度整合到开发者日常工作流中——这比任何API定价战都更有战略价值。不过社区担忧是合理的,Python生态的中立性确实值得关注。

5、Anthropic:Claude Code Channels与五角大楼之争

5.1、Claude Code Channels:把AI编程搬进聊天App

3月20日,Anthropic发布了Claude Code Channels——这可能是本周最具想象力的产品发布。

它的核心思路很简单:把Claude Code连接到Discord和Telegram。用户可以在手机上通过聊天App直接给Claude Code发编程指令,实现异步自主编程。不需要打开IDE,不需要坐在电脑前——你在地铁上给它发条消息,到公司的时候代码已经写好了。

技术上,它基于MCP(Model Context Protocol)协议构建,通过--channels标志启动后,Claude Code作为轮询服务运行在持久化服务器上。VentureBeat直接称其为"OpenClaw杀手"。

此外,Claude Code在3月还更新了:

  • 按键说话语音模式(/voice,支持15+语言)
  • /loop循环监控命令
  • 100万token上下文窗口全面开放
  • 新的MCP引导交互功能

5.2、vs 五角大楼:AI伦理红线之争

另一条线是Anthropic与美国国防部的法律对峙。

五角大楼把Anthropic列为"供应链风险"——原因是公司拒绝让Claude被不受限制地用于自主武器和大规模监控。3月18日国防部提交反驳文件,3月20日Anthropic回击,声称政府的论据基于"技术误解"。

有意思的是,微软、Google和OpenAI的员工(包括Google首席科学家Jeff Dean)都提交了支持Anthropic的法庭简报。CNN报道这场争端反而提升了Anthropic的品牌认知度——员工留存率80%、offer接受率88%。

听证会定于3月24日(也就是明天)在旧金山举行。

我的看法:Claude Code Channels的意义在于——它验证了"AI编程不一定要发生在IDE里"这个假设。对于我们做NewClaw这种AI伴侣产品的人来说,这条路已经被Anthropic官方跑通了。五角大楼事件则可能成为AI行业安全伦理的标志性案例。

6、小米MiMo-V2:手机厂商的万亿参数"猎人"

6.1、匿名测试霸榜

本周中国AI最炸裂的新闻是小米。

3月11日,一个叫"Hunter Alpha"的匿名模型出现在OpenRouter平台,一周内消耗超过1万亿token,多日霸榜第一。全球开发者都在猜——这是DeepSeek V4吧?

3月18–19日,路透社确认:不是DeepSeek V4,而是小米MiMo-V2-Pro

6.2、核心参数

MiMo-V2-Pro的参数相当亮眼:

  • 总参数1万亿,每次推理激活420亿
  • MoE架构 + Hybrid Attention(7:1比率)+ 多Token预测
  • 100万token上下文窗口
  • 全球排名第8,中国排名第2(仅次于智谱GLM-5)
  • 编程/Agent能力接近Claude Opus 4.6,整体超过Claude Sonnet 4.6
  • 定价$1/百万输入、$3/百万输出——Claude Opus 4.6的五分之一

同期还发布了MiMo-V2-Omni(全模态Agent模型)和MiMo-V2-TTS(支持粤语、四川话等方言的语音合成)。

该项目由前DeepSeek核心研究员罗福莉领衔。雷军宣布小米2026年AI研发+资本开支将超过1600亿元人民币

我的看法:小米这波操作很聪明——匿名测试先让市场验证产品力,再揭面收获最大关注度。"被误认为DeepSeek V4"本身就是最好的背书。更深层的信号是:中国AI竞争已经不只是互联网公司的游戏了,硬件厂商正在凭借资金和工程能力强势入场。

7、Cursor"套壳"Kimi K2.5:中国模型的硅谷征途

7.1、事件始末

这是本周最具戏剧性的故事。

3月20日,估值293亿美元的AI编程工具Cursor发布"Composer 2",宣称自研模型。数小时内,开发者@fynnso发现模型ID写着kimi-k2p5-rl-0317-s515-fast——直指月之暗面的Kimi K2.5。

Elon Musk亲自评论确认了这一点。月之暗面预训练负责人杜玉伦公开指控Cursor违反许可协议(帖子后来删除)。

7.2、反转与真相

事情很快反转:

  • Kimi官方发布祝贺声明,确认Cursor通过Fireworks AI的授权商业协议获取K2.5
  • Cursor承认K2.5是基础(约占25%算力),75%来自自行的继续预训练+强化学习
  • Composer 2在内部评测中得分61.3,超过Claude Opus 4.6的58.2

7.3、更深的意义

Kimi K2.5于1月27日发布,20天内收入即超过2025全年。Stripe数据显示订阅量环比增长8280%。目前月之暗面正以1800亿美元估值进行100亿美元新融资,阿里和腾讯均参与。

Kimi团队还在本周发表了"Attention Residuals"论文——提出替代Transformer残差连接的方案,训练效率提升约25%。论文联合作者中包括一名17岁的深圳高中生。Andrej Karpathy和前OpenAI VP Jerry Tworek均给予高度评价。

我的看法中国开源模型正在成为硅谷产品的底层基础设施。 这句话放在一年前说出来,大多数人会觉得不可思议。Kimi K2.5驱动着全球最火的AI编程工具——这个事实比任何benchmark都有说服力。同时这也提醒我们:模型供应链的透明度正在成为新的行业议题。

8、腾讯AI重组:AI Lab解散,27岁首席科学家接棒

3月20日,腾讯正式解散运营10年的AI Lab,全部人员并入混元(Hunyuan)团队。新团队由27岁的前OpenAI研究员姚顺雨领导,直接向总裁刘炽平汇报。

几个关键数字:

  • 2025年总收入7518亿元(+14%)
  • 2025年混元+元宝AI投入约1800亿元
  • 2026年AI投入承诺翻倍至3600亿+
  • 资本开支792亿元、研发费用857.5亿元均创新高
  • 元宝App月活超1亿
  • 混元3.0确认4月发布

另外,DeepSeek核心成员郭大亚据报已离开,加入字节跳动Seed团队。

我的看法:腾讯这次重组的力度很大。把独立的AI Lab并入产品线(混元),说明腾讯要的不是论文产出,而是AI产品化落地。27岁的首席科学家也打破了传统——AI行业的竞争已经快到不能靠论资排辈了。混元3.0四月发布,值得持续关注。

9、全球AI生态:Mistral、Midjourney、白宫立法

9.1、Mistral Small 4:60亿活跃参数的MoE新标杆

Mistral AI在GTC期间发布了Mistral Small 4

  • 128个专家、每token激活4个的MoE架构
  • 总参数1190亿,活跃参数仅60亿
  • 25.6万token上下文窗口
  • 首次统一了推理(Magistral)、多模态(Pixtral)和Agent编程(Devstral)三大能力
  • 延迟降低40%,每秒请求量提升3倍
  • Apache 2.0开源

同时发布的Mistral Forge是一个企业定制平台,支持在私有数据上进行预训练、微调和强化学习。早期客户包括爱立信、ESA、ASML等。

9.2、Midjourney V8 Alpha

Midjourney V8 Alpha是V5以来最大的升级:

  • 生成速度提升5倍
  • 原生2K分辨率输出
  • 文字渲染准确度大幅提升
  • 复杂构图的空间、光照、纹理遵循度显著增强
  • 新增--q 4质量模式
  • 全新代码库和GPU基础设施

目前仅在alpha.midjourney.com可用。

9.3、白宫AI立法框架

3月20日,白宫发布国家AI立法框架,七大支柱包括保护儿童、社区安全、知识产权、反审查、创新、劳动力、以及联邦法律取代各州AI法律。

核心立场:反对设定开放式AI责任,反对创建新的联邦AI监管机构,主张行业自律。已遭50多位共和党议员和AI监管组织反对。

同期,欧盟理事会同意将AI法案高风险系统规则推迟最多16个月执行。美国司法部指控三人涉嫌将AI GPU服务器非法转运至中国。

10、开发者生态变局:MCP协议、AI IDE竞争

10.1、MCP成为事实标准

MCP(Model Context Protocol)由Anthropic于2024年11月创建,2025年12月捐赠给Linux基金会的Agentic AI Foundation。

截至2026年3月:

  • SDK月下载量超9700万次
  • 活跃公共MCP服务器超1万个
  • 被ChatGPT、Cursor、Claude Code、Windsurf、Codex CLI、VS Code全部支持
  • 配套A2A协议形成三层架构:MCP(工具层)→ A2A(Agent层)→ WebMCP(Web访问层)

10.2、AI IDE最新格局

2026年3月AI IDE排名:

  1. Windsurf:Arena Mode + 5路并行Agent
  2. Google Antigravity:免费Agent优先IDE
  3. Cursor 2.0:Composer模型4倍加速、8路并行
  4. Claude Code:终端优先、SWE-bench 80.9%
  5. OpenAI Codex:重返前五

一个惊人的数字:92%的美国开发者每日使用AI编程工具,41–46%的代码现在由AI生成。

10.3、OpenClaw生态继续膨胀

OpenClaw的GitHub Star突破21万,成为GitHub史上增长最快的项目。支持WhatsApp、Telegram、Slack等全渠道,社区已构建5700+技能。创始人Peter Steinberger已加入OpenAI,项目正在向开源基金会过渡。

11、竞争格局一览

在这里插入图片描述

12、其他值得关注的动态

  • 字节豆包内测AI购物功能(App内直接浏览下单),2月MAU 3.15亿(+87%),中国第一
  • 阿里通义App 2月MAU从3100万暴增至2.03亿(+553%),阿里成立ATH事业群提升至一级BU
  • MiniMax发布全球首份大模型公司财报:2025年收入7900万美元(+159%),2月ARR突破1.5亿
  • DeepSeek V4截至3/23仍未正式发布,多个预期窗口已过
  • 行业交易:Meta与Nebius签270亿美元AI基础设施协议、IBM完成收购Confluent、Accenture收购Faculty
  • AI安全融资:Xbow 1.2亿美元(估值超10亿)、Oasis Security 1.2亿美元、AMI Labs 10.3亿美元种子轮(欧洲史上最大)

13、总结:Agent时代全面到来

回顾这一周,一个共同主线清晰而明确:AI正在从"回答问题"全面转向"执行任务"。

每一家主要公司的核心发布都围绕Agent能力展开——NVIDIA的NemoClaw、OpenAI的Codex+Astral、Anthropic的Claude Code Channels、小米的MiMo Agent评测领先。行业基准也在从传统的MMLU、HumanEval转向Agent导向的PinchBench、ClawEval。

中国AI力量本周展现了前所未有的影响力:小米万亿参数模型性价比碾压式入场,Kimi K2.5成为硅谷顶级编程工具的底层,腾讯3600亿AI投入承诺。中美模型性能差距已从7个月缩短至约3个月,而在成本效率上中国模型已全面领先。

对开发者而言,现在面对的不再是"是否使用AI"的选择,而是"如何在多模型、多Agent、多协议的生态中构建最优工作流"。MCP+A2A协议栈的标准化、AI IDE的激烈竞争、Agent框架的快速迭代——这些正在重塑软件开发的每一个环节。

这是新范式确立的关键时刻。

我是龙哥,我们下期见。



🚀 持续探索 AI 与前沿技术

分享大模型应用、软件开发实战与行业洞察。
欢迎关注公众号 【龙哥AI】,加入 7000+ 技术同行的交流圈!

🌟 探索技术边界,让开发更有效率
公众号二维码
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐