AI Weekly 3.30-4.5

乱世刀疤

618人浏览 · 2026-04-06 17:35:13

乱世刀疤 · 2026-04-06 17:35:13 发布

本周 AI 快讯 | 1 分钟速览

01 DeepSeek 连续三天服务异常，社区猜测 V4 疑似灰度上线 ：3 月 29 日晚至 31 日反复中断，最长一次近 13 小时，3.55 亿用户受影响，微博热搜 95 万+；宕机前后模型能力出现明显变化，知识库截止日期更新至 2026 年，多名开发者确认 Zero-shot 编码水平质变。

02 阿里三天三连发，Qwen3.6-Plus 编程逼近 Opus，视频图像双线并进 ：Qwen3.6-Plus SWE-bench 78.8 分，参数量不到 GLM-5 和 Kimi K2.5 的一半；Wan2.7-Image 破解 AI 标准脸，支持 12 种语言超长文本渲染；Wan2.7-Video 全模态输入覆盖生成到续写全链路，同周字节 Seedance 2.0 同步企业公测。

03 小米 MiMo 日调用量突破万亿 Token，Token Plan 上线四档订阅 ：雷军官宣里程碑；Token Plan ¥39-659 元/月，无 5 小时限额支持集中消耗；Max 档 ¥659/月仅含 1600M Credits，折合单价高于多数国产模型 API，高端定价引发讨论。

04 Apple Intelligence 国行意外上线又紧急撤回，苹果远程删除本地模型 ：3 月 31 日凌晨 iOS 26.4 Beta 用户发现 9.5GB 端侧模型可下载激活；苹果数小时内下线功能并远程删除已下载文件，称因「软件问题」，上线时间待监管审批。

05 Claude Code 51 万行源码泄露，Anthropic 清理泄露误伤 8100 个 GitHub 仓库 ：npm 打包失误暴露 59.8MB source map，三层记忆架构、自主后台代理「KAIROS」、宠物系统「Buddy」等核心设计被扒；GitHub 镜像 8.4 万星 8.2 万 fork；清理泄露代码时误伤约 8100 个仓库，大量为与泄露无关的正常 fork。

06 Anthropic 宣布订阅不再覆盖 OpenClaw 等第三方工具，仅给一天迁移 ：4 月 4 日 12pm PT 起生效，用户需购买额外用量包或使用 API key；Claude Code 负责人 Boris Cherny 称第三方工具对系统造成「过大压力」；OpenClaw 创始人此前已加入 OpenAI。

07 谷歌 Gemma 4 发布，首次 Apache 2.0 完全开源 ：4 款模型覆盖 2B 到 31B，旗舰 31B Arena AI 排名第 3（1452 Elo），AIME 数学从 20.8% 飙至 89.2%；无 MAU 限制、无使用限制、完全商用自由，累计下载超 4 亿次。

08 OpenAI 1220 亿美元融资创纪录，估值 8520 亿，同周收购 TBPN 播客 ：亚马逊 500 亿美元、英伟达和软银各 300 亿领投，月收入已达 20 亿美元，周活 9 亿用户；同周以低几亿美元收购科技播客 TBPN，首次涉足媒体，为 IPO 铺叙事。

09 龙虾生态周报：腾讯企业版 + 记忆服务，智谱视觉编程，OpenClaw 中国镜像 ：腾讯云「ClawPro」企业版公测，「Agent Memory」四层记忆架构使准确率提升 59%；智谱 GLM-5V-Turbo 多模态视觉编程基座发布；OpenClaw 上线中国镜像站并原生捆绑 QQ Bot。

01｜DeepSeek 连续三天服务异常，社区猜测「V4」疑似灰度上线

3 月 29 日晚 21:35 至 30 日上午 10:33，DeepSeek 经历了自 2025 年初爆红以来最长的一次服务中断，持续近 13 个小时。此后 3 月 30 日和 31 日又分别出现数小时不等的异常，三天内服务反复瘫痪。3.55 亿用户受到影响，微博相关话题热度一度冲至 95 万以上，网页端和 App 持续提示「服务器繁忙」，深度思考、长文本推理等核心功能大面积限流甚至完全不可用。截至发稿，官方未发布正式故障公告或补偿方案。

蹊跷的是，宕机前后 DeepSeek 的模型能力出现了明显变化。多名开发者在 Zero-shot 编码测试中发现输出结构更清晰、逻辑严谨程度质变，知识库截止日期也已更新至 2026 年。社区因此猜测这次中断并非单纯事故，而是 DeepSeek V4 灰度切换的前奏，部分能力或蒸馏版本可能已经替换了现有 V3 接口，只是标签尚未更换。预测市场上「V4 是否在 4 月 15 日前发布」的看涨比例已达 65%。有传闻称 V4 Lite 规模达 200B 参数，支持 1M token 上下文和全模态，通过 mHC 架构最高可扩展至万亿参数级别，但均未经官方证实。

02｜阿里三天三连发，「Qwen3.6-Plus」编程逼近 Opus，视频图像双线并进

三天，三个赛道，三款模型。4 月 2 日阿里发布 Qwen3.6-Plus，千问 3.6 系列的首个模型，聚焦 Agent 编程能力。SWE-bench Verified 拿到 78.8 分，Terminal-Bench 2.0 拿到 61.6 分，在多项编程基准上匹敌 Claude Opus 4.5，超越 GLM-5 和 Kimi K2.5，而参数量不到后两者的一半。百万 token 上下文，百炼 API 输入价格 2 元/百万 token，支持 OpenAI 和 Anthropic 协议，可直接在 OpenClaw、Claude Code 中切换使用。同日字节 Seedance 2.0 视频生成模型也面向企业开放公测，主打肖像安全和版权合规，视频生成赛道本周两家同步发力。

4 月 1 日上线的 Wan2.7-Image 是阿里的图像生成与编辑统一模型，核心卖点是破解 AI「标准脸」，支持从骨相到五官的像素级捏脸，全新「调色盘」功能可一键提取参考图色调比例并精准迁移，超长文本渲染覆盖 12 种语言，最高输出一页 A4 论文的排版内容。4 月 3 日跟进的 Wan2.7-Video 覆盖文本、图像、视频、音频全模态输入，打通生成、编辑、复刻、续写、驱动全链路。三款模型均已上线百炼 API 和通义千问 App，Qwen3.6 系列后续还将发布更强的 Max 版本和小尺寸开源模型。

03｜小米 MiMo 日调用量破万亿 Token，「Token Plan」上线四档订阅

4 月 3 日雷军在微博宣布，4 月 2 日 MiMo 大模型调用量突破 1 万亿 Token。从 3 月 19 日三款模型全球发布到破万亿，刚好两周。MiMo-V2-Pro 在 Text Arena 评测中闯入全球前五，仅次于 Anthropic、OpenAI 和谷歌三家。同日小米推出 MiMo Token Plan，统一 Credit 点数体系，单次订阅覆盖 MiMo-V2-Pro、MiMo-V2-Omni、MiMo-V2-TTS 三款模型。

Token Plan 分四档，Lite ¥39/月（6000 万 Credits）、Standard ¥99/月（2 亿）、Pro ¥329/月（7 亿）、Max ¥659/月（16 亿），首购 88 折。MiMo-V2-Omni 按 1 倍消耗，MiMo-V2-Pro 按 2 倍（超过 256K 上下文按 4 倍），MiMo-V2-TTS 限时免费。没有 5 小时滚动窗口限制，所有额度支持集中消耗，用户自己掌控节奏。但定价不算便宜，Max 档 ¥659/月约合 90 美元，16 亿 Credits 折算下来的 token 单价高于 DeepSeek、Kimi 等国产模型 API。

04｜「Apple Intelligence」国行意外上线，苹果远程删除已下载的本地 AI 模型

一个不该出现的选项，在 3 月 31 日凌晨悄悄出现在了部分国行 iPhone 的设置页面。更新了 iOS 26.4 Beta 的用户发现，「Siri」变成了「Apple 智能与 Siri」，点进去后系统提示可以下载一个 9.5GB 的端侧 AI 模型，部分功能确实可以激活使用。知名苹果爆料人马克·古尔曼很快证实这是意外上线，苹果尚未获得中国监管部门的审批。数小时内苹果紧急下线了该功能。

真正引发争议的是苹果的处理方式。据多位用户反馈，苹果不仅撤回了推送更新，还远程删除了已经下载到本地的 AI 模型文件。你下载到手机里的东西，苹果随时可以删掉。苹果官方回应称系「软件问题」导致其他地区的模型被短暂开放下载，已迅速修复。中国大陆目前是 Apple Intelligence 唯一未上线的主要市场，上线时间「依监管部门审批情况而定」。据此前爆料，国行版将采用百度文心一言做底层语言处理、阿里通义千问负责合规审查的混合架构，技术对接已完成，系统接口已打通，9.5GB 的模型包都已经挂在服务器上，唯一在等的就是监管部门的审批文件。

05｜「Claude Code」51 万行源码泄露，Anthropic 清理泄露误伤 8100 个 GitHub 仓库

59.8MB，51.2 万行 TypeScript，一个被意外打入 npm 包的 source map 文件。3 月 31 日凌晨，Claude Code v2.1.88 的 npm 发布中包含了完整的源码映射，安全研究员 Chaofan Shou 在 UTC 08:23 公开披露，帖子浏览量突破 2800 万。数小时内 GitHub 上出现了重建的完整镜像仓库，累计获得 8.4 万星和 8.2 万 fork。Anthropic 发言人确认这是「人为打包失误，非安全漏洞」，并表示没有涉及或泄露任何敏感用户数据或凭证。

被扒出的核心设计包括解决「上下文熵」问题的三层记忆架构，MEMORY.md 作为轻量指针索引常驻上下文，主题文件按需加载，原始对话记录仅通过 grep 检索而不回读；名为「KAIROS」的自主后台代理可在用户离开时持续运行，执行索引构建、记忆合并和代码库一致性检查；还有一个完整的宠物养成系统「Buddy」，包含扭蛋机制和稀有度分级，几乎确定是 4 月 1 日的彩蛋功能。据 TechCrunch 报道，Anthropic 随后向 GitHub 提交 DMCA 下架通知，但范围严重失控，约 8100 个仓库被波及，其中大量是 Anthropic 自己公开仓库的正常 fork，与泄露代码无关。Anthropic 承认是操作失误，已撤回绝大部分通知，仅保留对 1 个仓库及其 96 个 fork 的下架。安全公司 Straiker 警告，攻击者现在可以精确研究 Claude Code 的上下文管道，针对性构造越狱载荷，盲试时代结束了。

06｜Anthropic 宣布订阅不再覆盖「OpenClaw」等第三方工具，仅给一天迁移

Claude Code 负责人 Boris Cherny 周五晚间在社交媒体发帖，宣布从明天起砍掉第三方工具的订阅覆盖。4 月 4 日中午 12 点（太平洋时间）起，Claude 订阅将不再覆盖 OpenClaw 等第三方工具的用量。想继续用，要么购买额外的用量包（限时折扣），要么切换到 API key 付费。从公告到生效，留给用户的迁移窗口只有一天。Anthropic 发言人对 Business Insider 表示，第三方工具对系统造成了「过大的压力」，通过订阅接入的 OpenClaw 实质上是在用聊天级别的价格跑多租户自动化任务，属于「订阅套利」。

时间点耐人寻味。OpenClaw 创始人 Peter Steinberger 不久前刚加入 OpenAI，据他透露，他和 OpenClaw 基金会董事 Dave Morin 曾尝试说服 Anthropic 推迟，成功延后了一周。Steinberger 正在引导 OpenClaw 用户转向 OpenAI 的 GPT-5.x Codex 系列作为默认引擎。这条消息叠加此前的额度危机（Max 用户 19 分钟烧完 5 小时额度、3 月促销结束、token 计数 bug 三重叠加），Anthropic 的开发者口碑正在快速消耗。免费午餐结束了，多数用户表示理解收费逻辑，但一天迁移期的做法让社区反感远大于价格本身。

07｜谷歌「Gemma 4」发布，首次 Apache 2.0 完全开源

AIME 数学 20.8% 到 89.2%，Codeforces 编程 ELO 从 110 到 2150。4 月 2 日谷歌在 Cloud Next 大会上发布 Gemma 4，这是 Gemma 家族首次采用 Apache 2.0 协议，无 MAU 限制、无使用限制、商用魔改二次分发全部自由。四款模型覆盖从树莓派到数据中心的完整算力场景：E2B（2.3B 参数）和 E4B（4.5B）面向端侧，26B MoE（128 专家激活 8 个，实际推理参数仅 3.8B）和 31B Dense 面向服务器。旗舰 31B 在 Arena AI 排名第 3，Elo 1452，仅次于两个体量远超自己的闭源模型。

自初代发布以来，Gemma 累计下载超 4 亿次，社区衍生版本超 10 万个。Gemma 4 的架构引入了交替注意力机制（局部滑动窗口与全局全上下文交替切换）和双 RoPE 位置编码，使 256K 上下文在长距离时不掉质量。所有模型原生支持图像和视频输入、函数调用和结构化 JSON 输出，小模型还额外支持音频输入，覆盖 140 多种语言。从跑分看，Gemma 4 在部分基准上略逊 Qwen 3.5、GLM-5 和 Kimi K2.5，但综合模型质量、本地部署便利性、多模态能力和许可证透明度，Gemma 4 在质量、本地部署和许可证三者的平衡上很难找到对手。Hugging Face、Kaggle、Ollama、llama.cpp、MLX 等框架已全部首日支持。

08｜OpenAI 1220 亿美元融资创纪录，估值 8520 亿，同周收购「TBPN」播客

亚马逊 500 亿美元，英伟达 300 亿，软银 300 亿。三家巨头联手撑起了人类历史上最大的单笔融资。3 月 31 日 OpenAI 宣布完成 1220 亿美元融资，投后估值 8520 亿美元，超过英特尔、AMD、IBM 市值之和。微软继续参与，黑石、富达、红杉、淡马锡、ARK Invest 等跟投。首次引入散户投资者，通过银行渠道募集超 30 亿美元。亚马逊 500 亿中有 350 亿以 OpenAI IPO 或实现 AGI 为对赌条件。OpenAI 披露月收入已达 20 亿美元，ChatGPT 周活用户 9 亿，企业业务占比超 40%，预计年底前与消费者业务持平。

同周 4 月 2 日，OpenAI 以「低几亿美元」的价格收购了科技播客 TBPN（Technology Business Programming Network），首次涉足媒体。TBPN 由前科技创始人 John Coogan 和 Jordi Hays 主持，每天在 YouTube 直播三小时，被称为「科技界的 SportsCenter」，扎克伯格、纳德拉、Altman 是常驻嘉宾。2025 年广告收入 500 万美元，2026 年预计超 3000 万。TBPN 将并入 OpenAI 战略部门，向 Chris Lehane 汇报，Altman 承诺保持编辑独立。但批评者指出，一家估值 8520 亿的 AI 公司在 IPO 前收购一个频繁讨论自己和竞争对手的媒体平台，1926 年 RCA 创建 NBC 卖收音机的故事正在 AI 时代重演。

09｜龙虾生态周报：腾讯「ClawPro」+ 记忆服务，智谱视觉编程，OpenClaw 中国镜像

一周之内，龙虾生态同时补齐了四块拼图。4 月 2 日腾讯云发布企业版 OpenClaw「ClawPro」并开启公测。4 月 3 日紧跟发布「龙虾」记忆服务 TencentDB Agent Memory，自研四层渐进式记忆架构，从 L0 原始对话全量保存到 L1 自动提取事实偏好、L2 按项目聚类场景分块、L3 形成稳定用户画像，逐层提炼。以插件形态无缝集成至 Lighthouse 和 ClawPro，免费一键开启。评测数据显示，接入后 OpenClaw 总回答准确率达 76.10%，较原生记忆提升近 59%。

视觉层方面，4 月 2 日智谱发布 GLM-5V-Turbo，一款从预训练阶段就深度融合视觉与文本的多模态 Coding 基座。它能看懂设计稿、截图和网页界面，并据此生成可运行代码，深度适配 Claude Code 和龙虾场景。本土化方面，OpenClaw 4 月 1 日上线了官方中国镜像站，告诉龙虾「registry 使用中国镜像站」即可切换；3 月 31 日发布的 v2026.3.31 版本原生捆绑 QQ Bot 作为内置渠道插件。企业级、记忆层、视觉层、本土化，四个方向同周推进，龙虾正在从极客玩具变成企业级基础设施。