我本来想好好写教程的,结果这几天AI圈的瓜一个接一个往外蹦,根本吃不过来!
大模型估值500亿美元、搜索榜杀疯了、AI从“聊天”进化到“干活”……
来,我帮你把这周的AI圈顶流新闻,用人话给你盘一遍!


💰 一、资本圈核爆:中国大模型估值进入“500亿美元时代”

过去:大模型拼谁的技术牛
现在:大模型拼谁的钱多、谁的估值高

🥇 DeepSeek:首轮估值500亿美元,创始人自掏200亿“兜底”!

兄弟们,这新闻我看了三遍才敢信。

DeepSeek之前一直说“我不接受融资、我不稀释股权”。结果呢?一出手就是王炸:

  • 首轮估值直接飙到450-500亿美元

  • 传腾讯拟出资60亿元参与

  • 最离谱的是——创始人梁文锋计划自掏200亿元认购

200亿!自己掏钱给自己的公司“托底”!这是什么操作?就是为了给员工期权“定个价”,防止竞争对手挖人。格局,这就叫格局。

🥈 Kimi:20亿美元到账,半年估值翻5倍

月之暗面的Kimi也拿到了约20亿美元融资,投后估值突破200亿美元

半年翻了5倍,一年吸金39亿美元。这家公司的ARR(年度经常性收入)在4月已经超过2亿美元。拿钱拿到手软,赚钱也赚到手软。

🥉 阶跃星辰:25亿美元,带着“消费电子天团”冲刺港股

消息人士透露,阶跃星辰将完成近25亿美元融资,正在全力冲刺港股IPO。

本轮的投资方名单很刺激:华勤技术、龙旗科技、豪威集团、中兴通讯……全是消费电子产业链的大佬。

换句话说,手机厂商们正在“组团”投资大模型公司。目前,阶跃星辰的Step系列多模态模型已经与OPPO、荣耀、吉利等厂商合作,手机预装机量突破4200万台


🚀 二、模型能力炸裂:百度文心5.1发布,成本只要同行的6%

5月9日,百度正式发布文心大模型5.1

核心亮点(重点加粗):

预训练成本 = 业界同行的6%

你没看错,6%的成本,效果却很强:

  • LMArena搜索榜:国内第一、全球第四,是唯一进入全球前五的国产模型

  • 智能体能力:超越DeepSeek-V4-Pro

  • 创意写作:与Gemini 3.1 Pro同水平

  • 推理能力:接近全球顶级闭源模型

这意味着什么?意味着国内模型的“成本效率”正在全面反超。花更少的钱,跑更强的模型。

PS:5月13-14日百度Create大会,据说还有更多大招。兄弟们,板凳搬好。


🤖 三、AI Agent(智能体):从“聊天”到“干活”,正在改写一切

如果说前两年AI是“能聊天的智障”,2026年的AI正在变成“能干活的下属”

案例1:“龙虾”智能体爆火——AI不需要网页了,IM就是新入口

一个叫“龙虾”的智能体最近火遍全网。它做对了什么?

  1. 把AI直接放在微信/钉钉这类IM工具里,超80%的用户不用打开网页,直接和自己“对话”

  2. 用户可以“养成”自己的AI——设置人设、技能、记忆,AI会随着交互变聪明

这告诉我们:AI不再是“工具”,而是“可对话的伙伴”。

案例2:高盛预测——2030年Token需求暴增24倍

高盛5月5日发布了一篇重磅报告《解码智能体经济》。

报告的核心预测:

到2030年,全球每月token处理量 = 2026年的24倍

每天AI查询量从50亿次 → 230亿次

为什么会爆发?因为AI智能体是“永动机”

  • 聊天机器人:一次交互消耗约1700个token

  • 智能体:一个邮件管理的活儿,一天消耗9.1万输入token

  • 程序员AI助手:一天消耗627万输入token

AI从“用户提问”变成“自动跑流程”,token消耗增长几十倍甚至几百倍。

案例3:美图RoboNeo——“Agent Teams”团队上线

美图的AI Agent RoboNeo推出了Agent Teams功能。

什么意思?不是单个AI,而是多个AI角色分工协作

  • 一个负责理解需求

  • 一个负责生成内容

  • 一个负责修改优化

  • ……

就像雇了一支“AI外包团队”帮你干活。效果怎么样?美图一季度AI算力点消耗比上季度增长59%,其中RoboNeo贡献了316%的增长。


🦾 四、具身智能:AI正在从“虚拟空间”走进“物理世界”

AI不只是在你手机里,它正在进入汽车、机器人、工厂。

小鹏何小鹏在最近的大会上说:“物理AI必须走全栈自研、软硬件深度融合的路”。

小鹏在做的:

  • 搭载VLA大模型的智能汽车

  • 自研图灵AI芯片

  • 人形机器人

  • 飞行汽车“陆地航母”

物流行业也在落地——德马科技正在把人形机器人放进仓库,做自动化分拣和搬运。

另一个重要信号:艾为电子战略投资Rokid(AR眼镜公司),双方将联合研发“面向空间计算的多模态感知芯片”。

芯片+AR眼镜+机器人 = 2026年正在发生的“物理AI”革命。


🧱 五、多模态训练提速45%!百度开源全模态训练框架

当AI开始同时理解文字、图像、视频,甚至物理世界动起来,传统的训练方法已经不够用了。

百度百舸开源了LoongForge,这是一个面向“全模态”时代的训练框架。

有多猛?

  • 在多模态模型上训练提速15%-45%

  • 在5000+卡集群上实现90%以上的线性扩展效率

  • 覆盖LLM、VLM、VLA、Diffusion等各种模型

  • 兼容NVIDIA GPU和昆仑芯XPU跨平台

说白了:训练多模态AI更快、更便宜、更灵活。


📊 六、资本市场的“AI狂热”

5月7日,A股AI产业链全面爆发

  • 机器人、消费电子、光通信、存储芯片、算力……全线大涨

  • 多只个股涨停并刷新历史新高

为什么?内外共振:

  • 海外AI大模型迭代带动算力需求刚性增长

  • 半导体上游材料、晶圆代工、封装需求旺盛

  • 头部科技企业AI资本投入大幅增加,财报亮眼

AI已经不只是“概念股”,而是实打实的业绩驱动。


⚠️ 七、冷静一下:MiniMax“叫错人名”事件

5月9日,MiniMax发布技术报告,承认M2系列模型在输出人名“马嘉祺”时出现异常。

排查发现:分词器把“嘉祺”切成了一个独立词元,这个词元在训练数据里只出现了不到5条,参数被“挤压偏移”了。

更夸张的是,扫描20万词表后发现约4.9%的Token存在类似退化,日语的Token退化率高达29.7%,曾经导致对话里混入俄语或韩语字符。

这说明什么?

资本再疯狂,技术依然有坑。

融资额度不等于工程稳健性。大模型从“demo好看”到“生产可用”,中间隔着成千上万个“马嘉祺”。


💎 总结:2026年5月这周,AI进入“新阶段”

用一句话概括这一周:

大模型正在从“技术竞赛”进入“商业落地竞赛”,AI从“聊天工具”进化为“可工作的智能体”。

三个方向,你必须盯住:

方向 核心看点
模型层 文心5.1“6%成本”驱动降本增效;DeepSeek估值500亿美元
应用层 AI Agent成为核心,高盛预测2030年token需求暴增24倍
硬件层 具身智能、AI眼镜、算力芯片需求爆发

2026年将是AI Agent的“商业化元年”。未来的竞争,不再是“谁模型参数量大”,而是“谁的智能体最能干活”。


最后提醒一句:以上热点很多都涉及API调用、模型部署、算力消耗。学AI不能只看新闻,动起手来才是王道。

那个能让你低成本调用这些“顶流模型”、国内直连、支持OpenAI协议的API平台,已经在上一篇文章里给你安利过了。传送门在这里:

👉 www.wellapi.org

(懂的都懂,不懂的……赶紧点进去看看就知道了。)

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐