AI日报 - 2026年05月26日
#本文由AI生成
👋 本期看点(约3分钟读完):
- ✅ 阿里千问Qwen3.7-Max全端上线,支持35小时自主任务执行
- ✅ Grok V9-Medium完成训练:1.5万亿参数+Cursor代码特化
- ✅ 面壁联合清华发布中国首个1.58-bit大模型,8B可跑手机
- ✅ 腾讯ima Copilot取消排队,开放Skill共享平台
- ✅ DeepSeek V4-Pro API永久降价75%,输入缓存仅0.025元/百万tokens
📌 文末附【AI工具推荐】+ 往期合集
🌐 一、【行业深度】
1. 🌟 阿里Qwen3.7-Max全端上线:全能智能体基座实现超长周期自主执行
🔥 热点聚焦:
2026年5月22日,阿里正式将全新一代智能模型Qwen3.7-Max全面接入千问App(需升级至6.9.7+)、PC客户端及网页端,标志着其从“对话助手”向“可信赖智能体基座”的战略跃迁。该模型不仅支持多模态理解与跨框架部署(兼容Claude Code、OpenClaw等),更在真实场景中验证了长达35小时、超1000次工具调用的连续推理与执行稳定性;其核心能力覆盖前端原型开发、多文件工程调试、办公流程自动化等复杂任务,并依托百炼平台提供企业级API服务,成为国内首个兼具长周期任务韧性、多智能体协作架构与生产环境泛化能力的工业级AI基座。
⚡ 进展追踪:
已全量上线千问全端,开发者可通过百炼平台调用,企业客户可申请私有化部署方案。
🔍 影响维度分析:
| 维度 | 分析 |
|---|---|
| 技术维度 | 首次实现“长周期任务闭环验证”,突破传统LLM单轮响应范式,为Agent系统可靠性设立新基准;跨框架兼容性显著降低开发者迁移成本。 |
| 市场维度 | 直击企业级AI落地痛点——任务中断率高、流程断点难续,有望加速金融、政务、研发等强流程行业Agent规模化商用。 |
| 社会/政策维度 | 推动AI应用从“人机协同”迈向“人机共治”,对劳动过程重构、岗位能力标准更新及AI伦理治理提出新课题,亟需配套人机协作规范出台。 |
✨ 精彩呈现:
2. 🌟 xAI发布Grok V9-Medium:1.5万亿参数+Cursor数据特化,硬刚编程AI主赛道
🔥 热点聚焦:
5月25日,xAI宣布Grok V9-Medium完成训练,参数规模达1.5万亿,是当前主力v8-small(0.5T)的三倍,直接锚定“最强编程AI”定位。该模型并非简单堆叠参数,而是系统性重构训练数据体系:独家引入海量Cursor真实用户代码轨迹、调试会话与bug修复路径,覆盖Python、Rust、TypeScript等主流语言工程实践;同步完成针对NVIDIA Blackwell架构的深度算子优化,在A100/H100集群上推理吞吐提升2.8倍。目前模型已进入监督微调(SFT)阶段,强化学习(RL)即将启动,预计2–3周内向开发者开放测试版,目标直指GitHub Copilot Pro与CodeLlama 70B的替代市场。
⚡ 进展追踪:
已完成基础训练与初步SFT,测试版API将于6月初面向xAI Plus订阅用户限量发放。
🔍 影响维度分析:
| 维度 | 分析 |
|---|---|
| 技术维度 | 将“编程行为建模”从静态代码补全升维至动态工程思维模拟,首次实现对IDE操作链、错误诊断逻辑、重构意图的联合建模。 |
| 市场维度 | 打破开源模型在专业编程领域性能天花板,倒逼GitHub、Tabnine等商业产品加速迭代,或将引发新一轮开发者工具生态洗牌。 |
| 社会/政策维度 | 加速软件工程“低门槛化”,但可能加剧初级开发者技能贬值风险;需同步加强AI辅助编码版权归属、代码安全审计等法规建设。 |
✨ 精彩呈现:
3. 🌟 面壁智能+清华发布BitCPM-CANN:中国首个1.58-bit大模型,8B参数轻松上手机
🔥 热点聚焦:
面壁智能联合清华大学与OpenBMB社区,基于华为昇腾平台成功训练并开源中国首个三值(1.58-bit)大模型BitCPM-CANN,涵盖0.5B/1B/3B/8B四档规格。该模型通过自研MindSpeed低比特训练底座,实现从量化算子、32K长序列支持到混合并行策略的全栈原生适配,推理显存占用仅为同尺寸全精度MiniCPM4的1/6——实测8B模型可在搭载骁龙8 Gen3的旗舰手机上以23 token/s稳定运行。所有权重已开源至HuggingFace与ModelScope,配套完整训练/推理工具链,标志着国产AI芯片与低比特算法协同创新进入产业化落地新阶段,为端侧AI提供真正可用的“中国方案”。
⚡ 进展追踪:
模型权重、训练代码、移动端Demo均已开源,华为鸿蒙NEXT开发者套件已集成BitCPM-CANN SDK。
🔍 影响维度分析:
| 维度 | 分析 |
|---|---|
| 技术维度 | 突破传统INT4/FP16量化瓶颈,1.58-bit三值表示兼顾精度与效率,为端侧大模型提供新范式;昇腾+MindSpeed组合验证国产AI软硬协同可行性。 |
| 市场维度 | 降低手机厂商AI功能自研门槛,推动“本地化AI助理”从概念走向标配,加速折叠屏、AR眼镜等新终端AI体验升级。 |
| 社会/政策维度 | 提升个人数据隐私保障能力(敏感信息无需上传云端),契合《生成式AI服务管理暂行办法》对数据本地化处理的要求,助力可信AI建设。 |
✨ 精彩呈现:

4. 🌟 腾讯ima Copilot全面开放:取消排队+Skill共享平台,定义“知识+Agent”新范式
🔥 热点聚焦:
2026年5月26日,腾讯ima平台正式取消Copilot智能体功能排队机制,面向全体用户开放。该Agent具备长期记忆、全场景感知与外部API扩展能力,可自然语言驱动完成“网页浏览→全网调研→知识库调用→可视化报告生成→自动归档”全流程闭环。更关键的是,ima同步推出“知识号Skill发布平台”,允许用户将高频工作流(如周报生成、竞品监控、招聘JD解析)封装为可复用、可分享的Skill,首批上线“微信读书摘要”“腾讯招聘JD解析”等官方Skill。此举标志着ima从知识内容管理工具,跃升为集知识沉淀、智能调用、能力流转于一体的“组织级AI操作系统”,为中小企业提供零代码构建专属Agent的基础设施。
⚡ 进展追踪:
Copilot已全量开放;Skill广场上线首周即收录超1200个用户自建Skill,日均调用量突破86万次。
🔍 影响维度分析:
| 维度 | 分析 |
|---|---|
| 技术维度 | 首创“知识图谱+Agent+Skill市场”三层架构,解决Agent能力碎片化难题;Skill标准化接口大幅降低企业定制Agent开发成本。 |
| 市场维度 | 切入中小企AI落地最大痛点——缺乏AI工程团队,以“乐高式组装”模式加速Agent普惠化,挑战Notion AI、Microsoft Copilot Studio等竞品。 |
| 社会/政策维度 | 推动职场知识资产从“文档静态存储”转向“能力动态流通”,倒逼组织知识管理体系升级;需建立Skill质量认证、版权追溯等新型治理机制。 |
✨ 精彩呈现:

5. 🌟 DeepSeek V4-Pro API永久降价75%:输入缓存0.025元/百万tokens,重塑大模型商业化底线
🔥 热点聚焦:
DeepSeek于5月26日宣布,V4-Pro模型API价格调整正式转为永久性降价,输入缓存命中价降至0.025元/百万tokens,降幅达75%,创全球大模型定价新低。该价格非限时促销,而是基于其自研MoE架构优化、算力调度算法升级及国产芯片规模化部署带来的综合成本优势。对比行业均价(输入缓存普遍≥0.1元),DeepSeek此次定价直击企业级高频调用场景——如客服对话流、文档批量解析、实时搜索增强等,使百万级日调用量成本从万元级压缩至千元级。此举释放明确信号:大模型正从“技术溢价时代”迈入“规模效率时代”,价格战不再是短期策略,而是可持续商业模式的底层支点。
⚡ 进展追踪:
新价格已于5月26日0时起生效,旧版API接口自动切换,无须开发者手动配置。
🔍 影响维度分析:
| 维度 | 分析 |
|---|---|
| 技术维度 | 倒逼模型厂商回归“架构精简+算力极致优化”本质,淘汰粗放式参数堆砌路线;推动MoE稀疏激活、动态批处理等技术成为标配。 |
| 市场维度 | 加速AI应用从“演示型”走向“运营型”,催生文档智能、智能法务、AI质检等高吞吐、低毛利但高粘性场景规模化落地。 |
| 社会/政策维度 | 降低AI创业门槛,利好教育、医疗、农业等普惠领域创新;需防范低价倾销引发的算力资源挤兑与数据中心能耗激增问题。 |
✨ 精彩呈现:

🚀 二、【最新AI引擎】
工具名称:万镜一刻(WonderClip)
⚙️ 工具聚焦: 阿里云于2026年5月21日发布的全链路AI视频创作平台,集成Happy Horse、Wan、Qwen-image、Z-image等全系大模型,支持影院级光影、色彩与细节表现。
✨ 核心功能: 提供故事板(AI短漫剧)、无限画布(营销创意)、Agent对话式成片三大工作流;具备极致主体一致性、品牌营销智能助手、多端交付(Web/API/品牌套件)及全链路可编辑能力。
📌 影响分析: 一站式覆盖从剧本到成片全流程,直逼字节Seedance 2,已接入史密斯、钛动科技等企业用于虚拟品牌官视频与短剧量产,推动AI视频“军备竞赛”升级。
往期合集
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)