AI科技圈最近一周又发生了啥新鲜事

Anthropic发布Claude Opus 4.7

Claude Opus 4.7将核心升级聚焦于复杂任务执行、高清视觉理解及长链路工作流稳定性。该模型在ScreenSpot-Pro测试中视觉得分从57.7%跃升至87.6%,在SWE-bench Multilingual编程测试中修复真实GitHub issue的能力提升至80.5%,并在1M token长上下文基准GraphWalks中将BFS搜索准确率从41.2%大幅提升至58.6%。此外,其在模拟经营任务中比前代多赚36%收益,OfficeQA Pro企业级推理基准得分高达80.6%(前代为57.1%),生物分子推理能力更是实现2.4倍的跃升。尽管在Agentic搜索能力上略有下降,且Token消耗可能增加1.0至1.35倍,但其在指令遵循、图像处理及成品交付质量上的显著进步,使其在GDPval-AA评估中以1753分超越GPT-5.4(1674分)和Gemini 3.1 Pro(1314分),成为当前复杂工程与专业场景下的强力竞争者

https://www.anthropic.com/news/claude-opus-4-7

Anthropic强制刷脸VS智谱Coding Plan被疯抢,海外开发者涌入中国买模型

Anthropic突然要求Claude用户强制进行“真人+证件”双重身份验证,引发大量海外用户不满;与此同时,智谱GLM Coding Plan因性价比优势在海外爆火,尽管官方将海外版Max套餐价格上调至160美元(约合国内价格的2.3倍),仍阻挡不了海外开发者涌入中国平台。这导致国内每日10点的限量抢购演变为全球性“秒杀大战”,不仅催生了闲鱼“代抢”生意,甚至有海外用户专门研究中文验证码和支付流程以获取服务。Hugging Face产品负责人等开发者反馈,GLM-5.1在代码生成等任务上的实际表现已超越Claude Opus 4.6,推动了这股“反向代购”的热潮

https://mp.weixin.qq.com/s/6775y7U04h_UC6bDSMmoKw

DeepSeek拟融资3亿美元估值超100亿,核心人才出走引发行业震荡

据The Information与路透社援引知情人士消息,国内AI独角兽DeepSeek正与投资者洽谈,计划以超100亿美元估值筹集至少3亿美元资金,这将是该公司首次接受外部融资。作为脱胎于幻方量化的初创企业,DeepSeek此前一直依赖内部资金支持研发,此次融资旨在应对下一代模型V4研发及自建数据中心带来的巨额资金需求,同时维持其在AI价格战中的竞争优势。值得注意的是,尽管开启融资,创始团队仍计划通过极少的股权出让保持绝对控股权,保持技术路线的独立性。然而在商业化转型的关键期,DeepSeek也面临核心人才流失的挑战,V3核心贡献者罗福莉已加盟小米,研究员郭达雅转投字节跳动Seed团队担任Agent负责人,虽字节方面澄清未有亿元年薪员工,但行业对顶尖AI人才的争夺已进入白热化阶段

https://mp.weixin.qq.com/s/vdaIgZZ5E1gnIlseRs4hjg

阿里云开源Qwen3.6-35B-A3B

Qwen3.6-35B-A3B模型总参数350亿、激活参数仅30亿的混合专家模型,凭借轻量高效的设计在智能体编程与多模态推理上表现出色,性能超越前代Qwen3.5-35B-A3B,并可与Qwen3.5-27B、Gemma4-31B等稠密模型一较高下。该模型原生支持多模态思考与非思考模式,在多项编程基准上超越更大规模模型,视觉语言任务表现媲美Claude Sonnet 4.5,且具备RefCOCO 92.0、ODInW13 50.8等卓越空间智能指标

https://huggingface.co/Qwen/Qwen3.6-35B-A3B

腾讯混元发布HY-World 2.0

腾讯混元发布并开源混元3D世界模型2.0(HY-World 2.0),支持文、图、视频等多种模态输入,不仅能自动生成包含人、物、景的完整3D世界,还能输出Mesh、3DGS及点云等多格式资产文件,直接无缝对接Unity、UE等游戏引擎及具身仿真平台。其核心升级在于引入WorldMirror 2.0架构,支持复刻真实空间并构建高精度数字孪生,配合空间Agent技术可实现角色在街道建筑中的自由探索与物理碰撞交互;技术层面,模型通过精确的相机控制、细粒度视觉保持及空间一致性记忆机制,确保了全景图生成与新视角扩展的高质量与连贯性,目前用户已可通过官网申请体验或访问GitHub获取开源代码

https://github.com/Tencent-Hunyuan/HY-World-2.0

百度文心开源文生图模型 ERNIE-Image

ERNIE-Image模型基于单流Diffusion Transformer架构,仅用8B参数量便在复杂指令跟随、多语言文字渲染及结构化图像生成上达到开源模型领先水平,被视作NanoBanana的强力平替。其创新性地配备轻量级Prompt Enhancer以丰富简短输入,并针对消费级硬件优化,仅需24GB显存即可流畅运行,显著降低高精度生成模型的研究与部署门槛。在国际基准测试中,ERNIE-Image不仅在GenEval和OneIG等通用榜单表现优异,更在LongText-Bench的文字渲染任务中斩获开源SOTA,支持海报排版、学术图表及多风格动漫创作,目前模型权重、推理代码已全网发布并支持ComfyUI与GGUF量化方案

https://github.com/baidu/ernie-image

李飞飞团队开源Spark 2.0

World Labs团队开源了其内部研发的3D高斯溅射渲染引擎Spark 2.0,旨在解决传统Web渲染引擎在处理大规模3D场景时的性能瓶颈。该引擎基于Three.js构建,利用WebGL2技术实现了跨平台兼容性,并创新性地融合了细节层次技术、渐进式流式加载与虚拟内存管理三大核心技术,成功将包含超1亿个Splats(3D高斯点)的超大规模3D世界带入浏览器与移动设备。Spark 2.0通过构建层级化LoD高斯泼溅树实现平滑的细节过渡,采用全新的.RAD文件格式支持从粗到精的渐进式数据加载,并利用GPU内存池与页表映射机制实现海量数据的高效置换与跨对象共享,目前已在GitHub上线

https://www.worldlabs.ai/blog/spark-2.0#lod-splat-tree

Meta与博通续签五年,投入超1GW算力

Meta宣布与芯片巨头博通将定制AI芯片合作延长至2029年,初始承诺投入超过1GW算力基础设施,旨在为数十亿人构建“个人超级智能”。该合作基于Meta自研的MTIA(Meta Training and Inference Accelerator)芯片家族,采用台积电工艺与博通设计支持,计划在两年内推出四代芯片,通过模块化设计将升级周期压缩至六个月;同时,扎克伯格重组成立Meta超级智能实验室,整合Llama模型团队与外部收购资源,试图通过专用芯片与定制网络技术,打造类似“贾维斯”的个人AI助理生态

https://www.reuters.com/business/meta-inks-deal-with-broadcom-custom-ai-chips-2026-04-14/

MiniMax Agent 桌面端重磅更新

MiniMax Agent 桌面端重大更新,推出支持飞书、微信、企业微信及 Slack 等主流即时通讯软件接入的 Pocket 功能,并上线 Computer Use 能力,使智能体能够像人类一样通过视觉感知屏幕、操作鼠标键盘直接控制本地软件与图形界面。该更新将 Agent 的工作范围从命令行扩展至真实桌面环境,支持远程文件查找、跨应用数据处理及系统设置调整等复杂任务;技术层面,其将桌面操作拆解为 Desktop Control、Window Manager 等 4 个独立工具域及 60 多个具体工具,结合相对坐标定位与自适应截图技术解决多分辨率适配难题,并引入“截图-验证-行动”循环机制以确保多步任务的执行可靠性,同时在 IM 端提供细粒度的权限授权与过程控制,保障用户数据安全

https://mp.weixin.qq.com/s/dmF0PRj6OMQ-TWAIoc-kqg

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐