MIAOYUN | 模型上新及AI新鲜事儿 260605
本周国内外AI领域集中上新:秒云Tokens管家上新Seedance 2.0,国内阶跃、MiniMax、阿里等接连发布多款落地型大模型,字节上线Coze 3.0;海外NVIDIA、Google、微软、OpenAI等推出世界模型、轻量化模型、Agent工具与新型硬件;多款AI协作与Token降本工具密集落地;行业迎来转变,企业严控AI使用成本,头部AI企业扎堆筹备IPO,行业迈入精细化落地阶段,一起来回顾本周发生的AI新鲜事儿吧!
AI 大模型
阶跃星辰发布并开源面向生产级智能体的「Step 3.7 Flash」模型
5月29日,阶跃星辰发布并开源面向生产级智能体的「Step 3.7 Flash」模型,采用196B语言参数+1.8B视觉编码器的稀疏MoE架构,推理仅激活11B参数、最高生成速率达400Tokens/s,围绕智能体、代码、检索、多模态四大场景优化,具备原生多模态解析界面文档并生成任务代码、联网视觉交叉检索、长链路稳定调用多类工具、兼容多款主流Agent开发框架四项核心能力,在多项权威评测中表现优异,经实操验证可解析软件界面并输出操作步骤、搭建并行智能体集群,支持云端与本地多环境部署,现已上线多大模型开源平台与官方API、体验站点,后续还将持续完善技术内容并拓展生态合作。
参考:阶跃发布 Step 3.7 Flash,面向生产级 Agent 的高效率 Flash 模型
MiniMax稀宇科技发布旗舰开源大模型「MiniMax M3」
6月1日,MiniMax稀宇科技发布旗舰开源大模型「MiniMax M3」,依托自研MSA稀疏注意力架构,集齐百万(1M)超长上下文、顶尖代码与智能体能力、原生多模态三大前沿能力,是国内首个同时具备三项能力的开源模型;多项权威评测中,其代码、SVG生成、多模态、自主智能体成绩对标甚至超越GPT、Gemini、Opus等海外头部闭源模型,官方通过复现学术论文、优化CUDA算子、自主训练小模型三类实测验证了M3长程自主作业实力;配套升级可操控电脑桌面的「MiniMax Code」智能体产品,上线分三档定价、性价比突出的Token订阅套餐与支持双推理模式的API,限时5折,还将在10日内放出技术报告与模型权重。
参考:MiniMax M3:前沿 Coding 能力、1M 上下文、原生多模态,一个模型全给你
VAST官宣完成A+、A++融资,同步发布全新世界模型「Project Eden」
6月1日,通用AI企业VAST官宣完成合计近2亿美元A+、A++两轮融资,同步发布全新世界模型「Project Eden」,该产品跳出行业主流视频生成、静态3D建模路线,采用结构化状态层、条件接口层、生成渲染层三层解耦架构,将世界状态推演与画面渲染分开设计,成为全球首个可自主维护、确定性管控世界状态的世界模型,依托独创架构实现环境状态长效留存、场景可存档复用、多用户与多智能体原生并发交互三大独有能力,配套采用互联网视频拆解+引擎合成的双轨数据方案保障模型物理逻辑与泛化效果;依托此前Tripo系列3D大模型技术积淀,「Project Eden」不仅能落地沉浸式互动内容创作,还可作为具身智能、多智能体仿真训练的底层基座,推动世界模型行业从单纯生成画面转向可持续运转的虚拟世界搭建。
参考:世界模型第一次有了「存档」!VAST发布Project Eden
NVIDIA推出面向物理AI的全开放基础模型「NVIDIA Cosmos™ 3」
6月1日,NVIDIA正式推出面向物理AI的全开放基础模型「NVIDIA Cosmos™ 3」,采用混合Transformer架构,集成视觉推理、世界生成与动作预测能力,可高精度实现文本、图像、视频、环境音、动作的理解与生成,大幅把物理AI训练评估周期由数月压缩至数天,还能破解物理AI因数据短缺、仿真碎片化难以落地现实的痛点;NVIDIA同步联合多家行业企业成立Cosmos Coalition全球协作组织,黄仁勋称该模型将助力机器人、智能汽车、视觉AI研发实现跨越式升级,推动物理AI行业发展。
参考:NVIDIA 正式推出 Cosmos 3:面向物理 AI 的开放前沿基础模型
阿里通义实验室发布多模态智能体大模型「Qwen3.7-Plus」
6月2日,阿里通义实验室发布多模态智能体大模型「Qwen3.7-Plus」,在Qwen3.7文本与智能体能力基础上,深度融合视觉与语言,构建一体化智能体基座,能看懂画面、思考推理、编写代码、操控界面、结果校验的全链路闭环,在屏幕理解、代码工程、多模态问答等12项权威基准测评中多项成绩优于GPT、Gemini、Claude等主流海外模型;实测中可连续十多小时自主完成英语APP全流程开发、复刻macOS股票软件,还支持视觉转SVG代码、浏览器自动化运维、识图查资料、解析复杂线路图,同时优化了视频与自动驾驶场景感知能力,目前模型已登陆阿里云百炼平台,支持多类协议API调用,可通过多款智能体工具接入使用。
深度原理团队发布「MPA」材料基座模型,递归AI加速迈向AGI
6月2日,深度原理团队发布了「MPA」(Materials Property Axiom)材料基座模型,依托自研MIRA平台,通过递归自训练,自主完成代码重构、数据清洗、训练框架设计,在40项材料实验预测任务全面刷新SOTA,平均MAE降低10%,最高降幅达51%,多项指标优于Suiren等老牌模型,凭借独创三阶段训练与双分支混合预测头大幅降低预测误差、提升陌生分子泛化能力;当下全球多家机构发力递归自进化智能体研发,AI自主迭代优化模型的闭环落地,加速向AGI迈进。
参考:AGI将至!40项实验全面SOTA,超级递归智能体自主打造最强材料基座模型
微软发布「MAI」七款自研模型+软硬协同,构筑自主AI生态
6月3日,在Build2026发布会上,微软发布全栈AI布局,推出七款「MAI」自研大模型,覆盖推理、代码、图像、语音和转录等方向,适配自研Maia芯片并推出企业微调工具「Frontier Tuning」;硬件端联手NVIDIA推出基于RTX Spark架构开发主机「Surface RTX Spark Dev Box」,还推出Project Solara,亮相联发科桌面终端、高通可穿戴工牌两类新型Agent硬件,软件层落地带细粒度权限的OpenClaw套件,同步上线多款Agent开发、管控产品与科研平台,还发布全新量子芯片Majorana 2,全方位转型AI平台服务商。
参考:刚刚,Windows「梦中神机」来了,把你的 PC 变成 Agent 工位
Google DeepMind开源「Gemma 4 12B」多模态模型
6月4日,Google DeepMind开源「Gemma 4 12B」多模态模型,填补Gemma产品梯队空白、是系列首个原生支持音频输入的中体量模型,凭借摒弃传统独立编码器、改用轻量化嵌入模块的统一架构搭配MTP提速技术,实现性能对标26B MoE大模型、内存占用减半,仅需16G内存的普通笔记本即可离线本地运行,具备全模态理解与Agent智能体工作流能力;模型采用Apache 2.0开源协议,权重可在Hugging Face、Kaggle免费下载,兼容多款主流推理与微调框架,官方同步上线配套技能库与开发文档,助力开发者落地各类本地AI项目。
参考:重磅!谷歌开源Gemma 4 12B:统一的、无编码器的多模态模型,16G内存笔记本就可以跑
AI Agent
阿里云上线MuleRun Enterprise版的AI协作IM产品「Messages」
6月2日,阿里云上线MuleRun Enterprise版的AI协作IM产品「Messages」,打破过往AI仅服务个人的局限,实现人与Agent、不同Agent在同一工作群内共同协作,用户可按需自定义市场、技术、数据等不同职能的专业Agent,依托独立项目线程实现全场景上下文共享,支持人人、人跟AI、AI互访三类交互,在单一线程里完成需求下发、任务执行、反馈修改到定稿的全流程闭环,还能开设多条并行线程分头推进不同业务,依托新品完成营销推广、项目设计等跨部门协作落地,目前该功能已面向MuleRun企业版用户开放试用。
参考:MuleRun Messages上线!Agent从个人工具走进团队协作
Kimi上线面向知识工作者的通用本地Agent产品「Kimi Work」Beta版
6月3日,Kimi官宣上线面向知识工作者的通用本地Agent产品「Kimi Work」Beta版,同步推出适配苹果芯片Mac(macOS12及以上)、Win10及以上系统的客户端,产品以Kimi Code为内核、依托Kimi K2.6模型打造,继承在线Kimi的各类专业技能与多领域数据库,搭配可自主操控浏览器的WebBridge,最高可组建300个子Agent集群协同作业,用户仅需自然语言下达指令,就能让其在本地拆解任务、操作文件与浏览器、自动产出文档、PPT等成果,可落地金融投研、科研数据分析、跨境电商等多类办公场景;该产品超九成代码由AI自主生成、工程师一周完成客户端开发,目前处于内测迭代阶段。
参考:Kimi Work (Beta版)邀你体验:你的工作,分我一半
NVIDIA发布Hermes Agent企业方案:本地自主进化,安全可控
6月3日,NVIDIA推出基于开源Hermes Agent框架、搭配NemoClaw部署方案与OpenShell安全沙箱、底层搭载Nemotron3Super模型的企业级智能体方案,整套架构全本地部署,依托Hermes自带的自主学习闭环可沉淀固化工作技能、实现智能体自我进化,即便重置沙箱技能也能留存;方案通过凭证隔离、网络白名单、内网Agent断外网等多重机制保障数据安全,支持对接GitHub、办公软件等多类数据源,提供一键部署命令,此前NVIDIA已逐步完成Hermes在RTX、DGX全系列硬件适配,意在抢占Agent部署入口。
OpenClaw 2026.6.1重磅更新,实现Windows原生节点接入
6月4日,OpenClaw 2026.6.1重磅更新,实现Windows原生节点接入,海量Windows设备可直接作为分布式算力节点;新增Skill Workshop支持智能体自主提交技能提案、人工审核管控迭代,Workboard实现多Agent可视化任务协同,同时接入MiniMax M3等多款主流模型,优化底层存储架构提升运行效率,依托庞大Windows设备资源拓展了Agent落地场景。
参考:OpenClaw终于拿下Windows!全球龙虾党狂欢
AI 工具
字节跳动「Coze 3.0」全平台上线,三端互通赋能全场景AI办公
6月1日,字节跳动扣子「Coze 3.0」全平台上线,打通手机、桌面、网页三端,支持接入OpenClaw、Claude Code等各类本地Agent,可自建云端智能体并依托行业模板、技能商店快速生成专业AI助手,依托项目空间实现多Agent与人协同分工,新增编程、视频专项协作项目,还能远程操控电脑处理本地文件,官方同步开启直播与线下落地活动助力用户体验AI团队协作。
参考:扣子 3.0 正式上线:新一代 AI 团队,从扣子开始
Anthropic推出Claude官方CLI命令行工具「ant」
6月3日消息,Anthropic推出Claude官方CLI命令行工具「ant」,可在终端直接调用Claude全量API,支持OAuth免密钥登录、多工作区配置切换,采用资源+动作的标准化命令格式,覆盖消息交互、模型、文件及Beta版智能体/会话等资源管理,支持三种参数传参方式、多格式输出与字段提取,能依托YAML配置文件以GitOps模式托管Claude Agent并结合CI流程自动化部署,原生适配Claude Code实现自然语言调用自动化操作,提供Homebrew、curl、源码编译三种安装途径,兼容主流Shell环境并附带命令补全与调试功能。
参考:Anthropic突然上线全新CLI:一行命令操控Claude全部API
Netflix工程师开源Token压缩工具「Headroom」
6月4日消息,Netflix工程师开源Token压缩工具「Headroom」,依托缓存对齐、分类压缩、可逆CCR存取等机制,可剔除最高90%无效Token,上线数月已帮使用者节省70万美元成本、盘活2000亿Token资源,区别于同类工具可还原原始数据,还能优化模型推理速度与算力能耗,当下不少企业因AI高额调用费用正广泛落地该工具。
参考:5个月“救回”2000亿Token!被AI账单吓到,Netflix大佬开源「Token瘦身器」:砍掉90%无效Token,狂省70万美元!
「秒云Tokens管家」模型上新,接入字节豆包Seedance 2.0视频生成模型
6月5日,「秒云Tokens管家」模型上新,最新接入字节豆包Seedance 2.0视频生成模型,目前平台已全面接入以下AI大模型:字节豆包Seedance 2.0视频生成模型;深度求索最新旗舰级MoE模型DeepSeek-V4系列,含Pro、Flash版本、V3、V3.1、V3.2、R1系列;月之暗面原生多模态模型Kimi-K2.6、K2.5系列;智谱最新旗舰模型GLM-5.1、GLM-5;阿里通义千问Qwen3-max-2026-01-23、Qwen3.5、3.6系列;稀宇科技MiniMax-M2.7、M2.5及海外顶级大模型等。
市场动态
从「Tokenmaxxing」到严控开销,硅谷大厂严控AI使用降本
6月1日消息,此前硅谷盛行以消耗Token多少考核员工的「Tokenmaxxing」风潮,近期微软、Meta、Uber等企业因AI开销暴涨、隐性修复成本高企、AI难落地创收,陆续管控员工AI权限、停用用量排行榜,行业开始推出AI成本管控工具,服务商也从按Token计费转向按实际成果收费,行业回归理性,但多数企业仍欠缺清晰的AI投入回报衡量标准。
参考:疯狂烧了数十亿美元 Token 之后,硅谷大厂开始限制员工 Token 用量了
全球前十Agnes全模态API永久免费,打破AI高额调用成本壁垒
6月1日,位列全球AI Lab前十的Agnes AI宣布面向全球开发者、创作者无限期免费开放旗下文本Agnes-2.0-Flash、图像Agnes-Image-2.0-Flash、视频Agnes-Video-V2.0三款全模态核心模型API,实测验证三款模型性能过硬:文本模型可依据自然语言快速完成地图App、3D交互网页、复杂粒子系统等完整代码开发,图像模型能精准还原各类图文细节,产出赛博朋克场景、电商主图、排版教程图等高品质素材,视频模型可制作电影级奇幻短片、同步音画、承接多风格镜头创作;开发者既可在官方平台注册生成Key调用接口,也能对接Workbuddy、Hermes等工具快速集成落地。
参考:今天起,无限期免费!全球首个全模态API开放,Top 10 AI Lab出手
NVIDIA发布全新消费级芯片「RTX Spark」
6月1日,NVIDIA于台北GTC大会发布全新消费级芯片「RTX Spark」,搭载20核CPU、6144个GPU核心、最高128GB LPDDR5X统一内存、FP4算力达1PFLOP,凭借统一内存搭配成熟完整的CUDA生态,打破传统PC CPU与GPU内存割裂、数据传输缓慢的痛点,可在轻薄本、迷你主机等设备本地流畅运行120B大模型,还能完成超大3D场景渲染、12K视频剪辑、高帧率3A游戏运行;NVIDIA携手微软重构Windows系统,通过系统安全基元与OpenShell打造本地Agent安全运行环境,Adobe也针对该芯片深度优化旗下设计软件,联想、惠普等厂商将推出配套终端产品,这款产品被NVIDIA视作重新定义诞生四十余年的个人PC、迈入本地AI与智能体时代的关键硬件。
参考:英伟达发布全新RTX Spark - 个人PC的新时代。
Anthropic抢先递交IPO招股书,三大AI巨头齐聚2026美股上市潮
6月2日,Anthropic抢先竞品OpenAI向美国SEC秘密递交S-1招股书、开启IPO进程,最快今年10月挂牌上市;就在递交前一周,它刚完成650亿美元H轮融资,投后估值达9650亿美元,首度反超估值8520亿美元的OpenAI,其年化营收从2025年末90亿美元暴涨至470亿美元,增长核心依托Claude Code编程产品,公司放弃全品类业务扩张、深耕代码领域,但面临算力紧缺、与五角大楼博弈两大难题。2026年华尔街迎来巨型IPO盛宴,SpaceX、OpenAI、Anthropic三家巨头扎堆冲刺上市,SpaceX即将开启路演、估值1.25万亿,OpenAI计划9月上市,这场集体上市意味着AGI与超级智能正式进入资本市场定价阶段。
参考:刚刚,Anthropic抢先交表!冲击AI史上最大IPO
ChatGPT与Codex合体,三大功能落地,OpenAI正面迎战Anthropic
6月3日,OpenAI在Intelligence at Work发布会上官宣未来几周将把Codex整合进ChatGPT,坐拥近10亿用户的两款产品实现能力合体,同步落地Agent插件、精准批注、Sites一键生成交互式应用三大重磅更新,依托高性价比的GPT-5.5底层模型,Codex周活已突破500万且非研发类知识工作者用户快速增长,此次升级对标Anthropic的Claude Code产品,不仅让普通用户在ChatGPT内直接拥有全能AI办公分身、打通Excel、PPT等主流办公软件,OpenAI还同步将全线模型入驻AWS Bedrock,正式在企业办公与云服务市场和Anthropic展开正面竞争。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)