MIAOYUN | 模型上新及AI新鲜事儿 260605

秒云

218人浏览 · 2026-06-08 10:06:49

秒云 · 2026-06-08 10:06:49 发布

本周国内外AI领域集中上新：秒云Tokens管家上新Seedance 2.0，国内阶跃、MiniMax、阿里等接连发布多款落地型大模型，字节上线Coze 3.0；海外NVIDIA、Google、微软、OpenAI等推出世界模型、轻量化模型、Agent工具与新型硬件；多款AI协作与Token降本工具密集落地；行业迎来转变，企业严控AI使用成本，头部AI企业扎堆筹备IPO，行业迈入精细化落地阶段，一起来回顾本周发生的AI新鲜事儿吧！

AI 大模型

阶跃星辰发布并开源面向生产级智能体的「Step 3.7 Flash」模型

5月29日，阶跃星辰发布并开源面向生产级智能体的「Step 3.7 Flash」模型，采用196B语言参数+1.8B视觉编码器的稀疏MoE架构，推理仅激活11B参数、最高生成速率达400Tokens/s，围绕智能体、代码、检索、多模态四大场景优化，具备原生多模态解析界面文档并生成任务代码、联网视觉交叉检索、长链路稳定调用多类工具、兼容多款主流Agent开发框架四项核心能力，在多项权威评测中表现优异，经实操验证可解析软件界面并输出操作步骤、搭建并行智能体集群，支持云端与本地多环境部署，现已上线多大模型开源平台与官方API、体验站点，后续还将持续完善技术内容并拓展生态合作。

参考：阶跃发布 Step 3.7 Flash，面向生产级 Agent 的高效率 Flash 模型

MiniMax稀宇科技发布旗舰开源大模型「MiniMax M3」

6月1日，MiniMax稀宇科技发布旗舰开源大模型「MiniMax M3」，依托自研MSA稀疏注意力架构，集齐百万（1M）超长上下文、顶尖代码与智能体能力、原生多模态三大前沿能力，是国内首个同时具备三项能力的开源模型；多项权威评测中，其代码、SVG生成、多模态、自主智能体成绩对标甚至超越GPT、Gemini、Opus等海外头部闭源模型，官方通过复现学术论文、优化CUDA算子、自主训练小模型三类实测验证了M3长程自主作业实力；配套升级可操控电脑桌面的「MiniMax Code」智能体产品，上线分三档定价、性价比突出的Token订阅套餐与支持双推理模式的API，限时5折，还将在10日内放出技术报告与模型权重。

参考：MiniMax M3：前沿 Coding 能力、1M 上下文、原生多模态，一个模型全给你

VAST官宣完成A+、A++融资，同步发布全新世界模型「Project Eden」

6月1日，通用AI企业VAST官宣完成合计近2亿美元A+、A++两轮融资，同步发布全新世界模型「Project Eden」，该产品跳出行业主流视频生成、静态3D建模路线，采用结构化状态层、条件接口层、生成渲染层三层解耦架构，将世界状态推演与画面渲染分开设计，成为全球首个可自主维护、确定性管控世界状态的世界模型，依托独创架构实现环境状态长效留存、场景可存档复用、多用户与多智能体原生并发交互三大独有能力，配套采用互联网视频拆解+引擎合成的双轨数据方案保障模型物理逻辑与泛化效果；依托此前Tripo系列3D大模型技术积淀，「Project Eden」不仅能落地沉浸式互动内容创作，还可作为具身智能、多智能体仿真训练的底层基座，推动世界模型行业从单纯生成画面转向可持续运转的虚拟世界搭建。

参考：世界模型第一次有了「存档」！VAST发布Project Eden

NVIDIA推出面向物理AI的全开放基础模型「NVIDIA Cosmos™ 3」

6月1日，NVIDIA正式推出面向物理AI的全开放基础模型「NVIDIA Cosmos™ 3」，采用混合Transformer架构，集成视觉推理、世界生成与动作预测能力，可高精度实现文本、图像、视频、环境音、动作的理解与生成，大幅把物理AI训练评估周期由数月压缩至数天，还能破解物理AI因数据短缺、仿真碎片化难以落地现实的痛点；NVIDIA同步联合多家行业企业成立Cosmos Coalition全球协作组织，黄仁勋称该模型将助力机器人、智能汽车、视觉AI研发实现跨越式升级，推动物理AI行业发展。

参考：NVIDIA 正式推出 Cosmos 3：面向物理 AI 的开放前沿基础模型

阿里通义实验室发布多模态智能体大模型「Qwen3.7-Plus」

6月2日，阿里通义实验室发布多模态智能体大模型「Qwen3.7-Plus」，在Qwen3.7文本与智能体能力基础上，深度融合视觉与语言，构建一体化智能体基座，能看懂画面、思考推理、编写代码、操控界面、结果校验的全链路闭环，在屏幕理解、代码工程、多模态问答等12项权威基准测评中多项成绩优于GPT、Gemini、Claude等主流海外模型；实测中可连续十多小时自主完成英语APP全流程开发、复刻macOS股票软件，还支持视觉转SVG代码、浏览器自动化运维、识图查资料、解析复杂线路图，同时优化了视频与自动驾驶场景感知能力，目前模型已登陆阿里云百炼平台，支持多类协议API调用，可通过多款智能体工具接入使用。

参考：Qwen3.7-Plus：把多模态AI变成“实干家”

深度原理团队发布「MPA」材料基座模型，递归AI加速迈向AGI

6月2日，深度原理团队发布了「MPA」（Materials Property Axiom）材料基座模型，依托自研MIRA平台，通过递归自训练，自主完成代码重构、数据清洗、训练框架设计，在40项材料实验预测任务全面刷新SOTA，平均MAE降低10%，最高降幅达51%，多项指标优于Suiren等老牌模型，凭借独创三阶段训练与双分支混合预测头大幅降低预测误差、提升陌生分子泛化能力；当下全球多家机构发力递归自进化智能体研发，AI自主迭代优化模型的闭环落地，加速向AGI迈进。

参考：AGI将至！40项实验全面SOTA，超级递归智能体自主打造最强材料基座模型

微软发布「MAI」七款自研模型+软硬协同，构筑自主AI生态

6月3日，在Build2026发布会上，微软发布全栈AI布局，推出七款「MAI」自研大模型，覆盖推理、代码、图像、语音和转录等方向，适配自研Maia芯片并推出企业微调工具「Frontier Tuning」；硬件端联手NVIDIA推出基于RTX Spark架构开发主机「Surface RTX Spark Dev Box」，还推出Project Solara，亮相联发科桌面终端、高通可穿戴工牌两类新型Agent硬件，软件层落地带细粒度权限的OpenClaw套件，同步上线多款Agent开发、管控产品与科研平台，还发布全新量子芯片Majorana 2，全方位转型AI平台服务商。

参考：刚刚，Windows「梦中神机」来了，把你的 PC 变成 Agent 工位

Google DeepMind开源「Gemma 4 12B」多模态模型

6月4日，Google DeepMind开源「Gemma 4 12B」多模态模型，填补Gemma产品梯队空白、是系列首个原生支持音频输入的中体量模型，凭借摒弃传统独立编码器、改用轻量化嵌入模块的统一架构搭配MTP提速技术，实现性能对标26B MoE大模型、内存占用减半，仅需16G内存的普通笔记本即可离线本地运行，具备全模态理解与Agent智能体工作流能力；模型采用Apache 2.0开源协议，权重可在Hugging Face、Kaggle免费下载，兼容多款主流推理与微调框架，官方同步上线配套技能库与开发文档，助力开发者落地各类本地AI项目。

参考：重磅！谷歌开源Gemma 4 12B：统一的、无编码器的多模态模型，16G内存笔记本就可以跑

AI Agent

阿里云上线MuleRun Enterprise版的AI协作IM产品「Messages」

6月2日，阿里云上线MuleRun Enterprise版的AI协作IM产品「Messages」，打破过往AI仅服务个人的局限，实现人与Agent、不同Agent在同一工作群内共同协作，用户可按需自定义市场、技术、数据等不同职能的专业Agent，依托独立项目线程实现全场景上下文共享，支持人人、人跟AI、AI互访三类交互，在单一线程里完成需求下发、任务执行、反馈修改到定稿的全流程闭环，还能开设多条并行线程分头推进不同业务，依托新品完成营销推广、项目设计等跨部门协作落地，目前该功能已面向MuleRun企业版用户开放试用。

参考：MuleRun Messages上线！Agent从个人工具走进团队协作

Kimi上线面向知识工作者的通用本地Agent产品「Kimi Work」Beta版

6月3日，Kimi官宣上线面向知识工作者的通用本地Agent产品「Kimi Work」Beta版，同步推出适配苹果芯片Mac（macOS12及以上）、Win10及以上系统的客户端，产品以Kimi Code为内核、依托Kimi K2.6模型打造，继承在线Kimi的各类专业技能与多领域数据库，搭配可自主操控浏览器的WebBridge，最高可组建300个子Agent集群协同作业，用户仅需自然语言下达指令，就能让其在本地拆解任务、操作文件与浏览器、自动产出文档、PPT等成果，可落地金融投研、科研数据分析、跨境电商等多类办公场景；该产品超九成代码由AI自主生成、工程师一周完成客户端开发，目前处于内测迭代阶段。

参考：Kimi Work (Beta版)邀你体验：你的工作，分我一半

NVIDIA发布Hermes Agent企业方案：本地自主进化，安全可控

6月3日，NVIDIA推出基于开源Hermes Agent框架、搭配NemoClaw部署方案与OpenShell安全沙箱、底层搭载Nemotron3Super模型的企业级智能体方案，整套架构全本地部署，依托Hermes自带的自主学习闭环可沉淀固化工作技能、实现智能体自我进化，即便重置沙箱技能也能留存；方案通过凭证隔离、网络白名单、内网Agent断外网等多重机制保障数据安全，支持对接GitHub、办公软件等多类数据源，提供一键部署命令，此前NVIDIA已逐步完成Hermes在RTX、DGX全系列硬件适配，意在抢占Agent部署入口。

参考：老黄也来养马了！英伟达版Hermes Agent发布

OpenClaw 2026.6.1重磅更新，实现Windows原生节点接入

6月4日，OpenClaw 2026.6.1重磅更新，实现Windows原生节点接入，海量Windows设备可直接作为分布式算力节点；新增Skill Workshop支持智能体自主提交技能提案、人工审核管控迭代，Workboard实现多Agent可视化任务协同，同时接入MiniMax M3等多款主流模型，优化底层存储架构提升运行效率，依托庞大Windows设备资源拓展了Agent落地场景。

参考：OpenClaw终于拿下Windows！全球龙虾党狂欢

AI 工具

字节跳动「Coze 3.0」全平台上线，三端互通赋能全场景AI办公

6月1日，字节跳动扣子「Coze 3.0」全平台上线，打通手机、桌面、网页三端，支持接入OpenClaw、Claude Code等各类本地Agent，可自建云端智能体并依托行业模板、技能商店快速生成专业AI助手，依托项目空间实现多Agent与人协同分工，新增编程、视频专项协作项目，还能远程操控电脑处理本地文件，官方同步开启直播与线下落地活动助力用户体验AI团队协作。

参考：扣子 3.0 正式上线：新一代 AI 团队，从扣子开始

Anthropic推出Claude官方CLI命令行工具「ant」

6月3日消息，Anthropic推出Claude官方CLI命令行工具「ant」，可在终端直接调用Claude全量API，支持OAuth免密钥登录、多工作区配置切换，采用资源+动作的标准化命令格式，覆盖消息交互、模型、文件及Beta版智能体/会话等资源管理，支持三种参数传参方式、多格式输出与字段提取，能依托YAML配置文件以GitOps模式托管Claude Agent并结合CI流程自动化部署，原生适配Claude Code实现自然语言调用自动化操作，提供Homebrew、curl、源码编译三种安装途径，兼容主流Shell环境并附带命令补全与调试功能。

参考：Anthropic突然上线全新CLI：一行命令操控Claude全部API

Netflix工程师开源Token压缩工具「Headroom」

6月4日消息，Netflix工程师开源Token压缩工具「Headroom」，依托缓存对齐、分类压缩、可逆CCR存取等机制，可剔除最高90%无效Token，上线数月已帮使用者节省70万美元成本、盘活2000亿Token资源，区别于同类工具可还原原始数据，还能优化模型推理速度与算力能耗，当下不少企业因AI高额调用费用正广泛落地该工具。

参考：5个月“救回”2000亿Token！被AI账单吓到，Netflix大佬开源「Token瘦身器」：砍掉90%无效Token，狂省70万美元！

「秒云Tokens管家」模型上新，接入字节豆包Seedance 2.0视频生成模型

6月5日，「秒云Tokens管家」模型上新，最新接入字节豆包Seedance 2.0视频生成模型，目前平台已全面接入以下AI大模型：字节豆包Seedance 2.0视频生成模型；深度求索最新旗舰级MoE模型DeepSeek-V4系列，含Pro、Flash版本、V3、V3.1、V3.2、R1系列；月之暗面原生多模态模型Kimi-K2.6、K2.5系列；智谱最新旗舰模型GLM-5.1、GLM-5；阿里通义千问Qwen3-max-2026-01-23、Qwen3.5、3.6系列；稀宇科技MiniMax-M2.7、M2.5及海外顶级大模型等。

市场动态

从「Tokenmaxxing」到严控开销，硅谷大厂严控AI使用降本

6月1日消息，此前硅谷盛行以消耗Token多少考核员工的「Tokenmaxxing」风潮，近期微软、Meta、Uber等企业因AI开销暴涨、隐性修复成本高企、AI难落地创收，陆续管控员工AI权限、停用用量排行榜，行业开始推出AI成本管控工具，服务商也从按Token计费转向按实际成果收费，行业回归理性，但多数企业仍欠缺清晰的AI投入回报衡量标准。

参考：疯狂烧了数十亿美元 Token 之后，硅谷大厂开始限制员工 Token 用量了

全球前十Agnes全模态API永久免费，打破AI高额调用成本壁垒

6月1日，位列全球AI Lab前十的Agnes AI宣布面向全球开发者、创作者无限期免费开放旗下文本Agnes-2.0-Flash、图像Agnes-Image-2.0-Flash、视频Agnes-Video-V2.0三款全模态核心模型API，实测验证三款模型性能过硬：文本模型可依据自然语言快速完成地图App、3D交互网页、复杂粒子系统等完整代码开发，图像模型能精准还原各类图文细节，产出赛博朋克场景、电商主图、排版教程图等高品质素材，视频模型可制作电影级奇幻短片、同步音画、承接多风格镜头创作；开发者既可在官方平台注册生成Key调用接口，也能对接Workbuddy、Hermes等工具快速集成落地。

参考：今天起，无限期免费！全球首个全模态API开放，Top 10 AI Lab出手

NVIDIA发布全新消费级芯片「RTX Spark」

6月1日，NVIDIA于台北GTC大会发布全新消费级芯片「RTX Spark」，搭载20核CPU、6144个GPU核心、最高128GB LPDDR5X统一内存、FP4算力达1PFLOP，凭借统一内存搭配成熟完整的CUDA生态，打破传统PC CPU与GPU内存割裂、数据传输缓慢的痛点，可在轻薄本、迷你主机等设备本地流畅运行120B大模型，还能完成超大3D场景渲染、12K视频剪辑、高帧率3A游戏运行；NVIDIA携手微软重构Windows系统，通过系统安全基元与OpenShell打造本地Agent安全运行环境，Adobe也针对该芯片深度优化旗下设计软件，联想、惠普等厂商将推出配套终端产品，这款产品被NVIDIA视作重新定义诞生四十余年的个人PC、迈入本地AI与智能体时代的关键硬件。

参考：英伟达发布全新RTX Spark - 个人PC的新时代。

Anthropic抢先递交IPO招股书，三大AI巨头齐聚2026美股上市潮

6月2日，Anthropic抢先竞品OpenAI向美国SEC秘密递交S-1招股书、开启IPO进程，最快今年10月挂牌上市；就在递交前一周，它刚完成650亿美元H轮融资，投后估值达9650亿美元，首度反超估值8520亿美元的OpenAI，其年化营收从2025年末90亿美元暴涨至470亿美元，增长核心依托Claude Code编程产品，公司放弃全品类业务扩张、深耕代码领域，但面临算力紧缺、与五角大楼博弈两大难题。2026年华尔街迎来巨型IPO盛宴，SpaceX、OpenAI、Anthropic三家巨头扎堆冲刺上市，SpaceX即将开启路演、估值1.25万亿，OpenAI计划9月上市，这场集体上市意味着AGI与超级智能正式进入资本市场定价阶段。

参考：刚刚，Anthropic抢先交表！冲击AI史上最大IPO

ChatGPT与Codex合体，三大功能落地，OpenAI正面迎战Anthropic

6月3日，OpenAI在Intelligence at Work发布会上官宣未来几周将把Codex整合进ChatGPT，坐拥近10亿用户的两款产品实现能力合体，同步落地Agent插件、精准批注、Sites一键生成交互式应用三大重磅更新，依托高性价比的GPT-5.5底层模型，Codex周活已突破500万且非研发类知识工作者用户快速增长，此次升级对标Anthropic的Claude Code产品，不仅让普通用户在ChatGPT内直接拥有全能AI办公分身、打通Excel、PPT等主流办公软件，OpenAI还同步将全线模型入驻AWS Bedrock，正式在企业办公与云服务市场和Anthropic展开正面竞争。

参考：今天，ChatGPT与Codex官宣合体！10亿人喜提「超级Agent」