海外开发者疯狂涌入中国买模型。。。

啥都生

392人浏览 · 2026-04-20 08:45:00

啥都生 · 2026-04-20 08:45:00 发布

B站：啥都会一点的研究生
公众号：啥都会一点的研究生

AI科技圈最近一周又发生了啥新鲜事

Anthropic发布Claude Opus 4.7

Claude Opus 4.7将核心升级聚焦于复杂任务执行、高清视觉理解及长链路工作流稳定性。该模型在ScreenSpot-Pro测试中视觉得分从57.7%跃升至87.6%，在SWE-bench Multilingual编程测试中修复真实GitHub issue的能力提升至80.5%，并在1M token长上下文基准GraphWalks中将BFS搜索准确率从41.2%大幅提升至58.6%。此外，其在模拟经营任务中比前代多赚36%收益，OfficeQA Pro企业级推理基准得分高达80.6%（前代为57.1%），生物分子推理能力更是实现2.4倍的跃升。尽管在Agentic搜索能力上略有下降，且Token消耗可能增加1.0至1.35倍，但其在指令遵循、图像处理及成品交付质量上的显著进步，使其在GDPval-AA评估中以1753分超越GPT-5.4（1674分）和Gemini 3.1 Pro（1314分），成为当前复杂工程与专业场景下的强力竞争者

https://www.anthropic.com/news/claude-opus-4-7

Anthropic强制刷脸VS智谱Coding Plan被疯抢，海外开发者涌入中国买模型

Anthropic突然要求Claude用户强制进行“真人+证件”双重身份验证，引发大量海外用户不满；与此同时，智谱GLM Coding Plan因性价比优势在海外爆火，尽管官方将海外版Max套餐价格上调至160美元（约合国内价格的2.3倍），仍阻挡不了海外开发者涌入中国平台。这导致国内每日10点的限量抢购演变为全球性“秒杀大战”，不仅催生了闲鱼“代抢”生意，甚至有海外用户专门研究中文验证码和支付流程以获取服务。Hugging Face产品负责人等开发者反馈，GLM-5.1在代码生成等任务上的实际表现已超越Claude Opus 4.6，推动了这股“反向代购”的热潮

https://mp.weixin.qq.com/s/6775y7U04h_UC6bDSMmoKw

DeepSeek拟融资3亿美元估值超100亿，核心人才出走引发行业震荡

据The Information与路透社援引知情人士消息，国内AI独角兽DeepSeek正与投资者洽谈，计划以超100亿美元估值筹集至少3亿美元资金，这将是该公司首次接受外部融资。作为脱胎于幻方量化的初创企业，DeepSeek此前一直依赖内部资金支持研发，此次融资旨在应对下一代模型V4研发及自建数据中心带来的巨额资金需求，同时维持其在AI价格战中的竞争优势。值得注意的是，尽管开启融资，创始团队仍计划通过极少的股权出让保持绝对控股权，保持技术路线的独立性。然而在商业化转型的关键期，DeepSeek也面临核心人才流失的挑战，V3核心贡献者罗福莉已加盟小米，研究员郭达雅转投字节跳动Seed团队担任Agent负责人，虽字节方面澄清未有亿元年薪员工，但行业对顶尖AI人才的争夺已进入白热化阶段

https://mp.weixin.qq.com/s/vdaIgZZ5E1gnIlseRs4hjg

阿里云开源Qwen3.6-35B-A3B

Qwen3.6-35B-A3B模型总参数350亿、激活参数仅30亿的混合专家模型，凭借轻量高效的设计在智能体编程与多模态推理上表现出色，性能超越前代Qwen3.5-35B-A3B，并可与Qwen3.5-27B、Gemma4-31B等稠密模型一较高下。该模型原生支持多模态思考与非思考模式，在多项编程基准上超越更大规模模型，视觉语言任务表现媲美Claude Sonnet 4.5，且具备RefCOCO 92.0、ODInW13 50.8等卓越空间智能指标

https://huggingface.co/Qwen/Qwen3.6-35B-A3B

腾讯混元发布HY-World 2.0

腾讯混元发布并开源混元3D世界模型2.0（HY-World 2.0），支持文、图、视频等多种模态输入，不仅能自动生成包含人、物、景的完整3D世界，还能输出Mesh、3DGS及点云等多格式资产文件，直接无缝对接Unity、UE等游戏引擎及具身仿真平台。其核心升级在于引入WorldMirror 2.0架构，支持复刻真实空间并构建高精度数字孪生，配合空间Agent技术可实现角色在街道建筑中的自由探索与物理碰撞交互；技术层面，模型通过精确的相机控制、细粒度视觉保持及空间一致性记忆机制，确保了全景图生成与新视角扩展的高质量与连贯性，目前用户已可通过官网申请体验或访问GitHub获取开源代码

https://github.com/Tencent-Hunyuan/HY-World-2.0

百度文心开源文生图模型 ERNIE-Image

ERNIE-Image模型基于单流Diffusion Transformer架构，仅用8B参数量便在复杂指令跟随、多语言文字渲染及结构化图像生成上达到开源模型领先水平，被视作NanoBanana的强力平替。其创新性地配备轻量级Prompt Enhancer以丰富简短输入，并针对消费级硬件优化，仅需24GB显存即可流畅运行，显著降低高精度生成模型的研究与部署门槛。在国际基准测试中，ERNIE-Image不仅在GenEval和OneIG等通用榜单表现优异，更在LongText-Bench的文字渲染任务中斩获开源SOTA，支持海报排版、学术图表及多风格动漫创作，目前模型权重、推理代码已全网发布并支持ComfyUI与GGUF量化方案

https://github.com/baidu/ernie-image

李飞飞团队开源Spark 2.0

World Labs团队开源了其内部研发的3D高斯溅射渲染引擎Spark 2.0，旨在解决传统Web渲染引擎在处理大规模3D场景时的性能瓶颈。该引擎基于Three.js构建，利用WebGL2技术实现了跨平台兼容性，并创新性地融合了细节层次技术、渐进式流式加载与虚拟内存管理三大核心技术，成功将包含超1亿个Splats（3D高斯点）的超大规模3D世界带入浏览器与移动设备。Spark 2.0通过构建层级化LoD高斯泼溅树实现平滑的细节过渡，采用全新的.RAD文件格式支持从粗到精的渐进式数据加载，并利用GPU内存池与页表映射机制实现海量数据的高效置换与跨对象共享，目前已在GitHub上线

https://www.worldlabs.ai/blog/spark-2.0#lod-splat-tree

Meta与博通续签五年，投入超1GW算力

Meta宣布与芯片巨头博通将定制AI芯片合作延长至2029年，初始承诺投入超过1GW算力基础设施，旨在为数十亿人构建“个人超级智能”。该合作基于Meta自研的MTIA（Meta Training and Inference Accelerator）芯片家族，采用台积电工艺与博通设计支持，计划在两年内推出四代芯片，通过模块化设计将升级周期压缩至六个月；同时，扎克伯格重组成立Meta超级智能实验室，整合Llama模型团队与外部收购资源，试图通过专用芯片与定制网络技术，打造类似“贾维斯”的个人AI助理生态

https://www.reuters.com/business/meta-inks-deal-with-broadcom-custom-ai-chips-2026-04-14/

MiniMax Agent 桌面端重磅更新

MiniMax Agent 桌面端重大更新，推出支持飞书、微信、企业微信及 Slack 等主流即时通讯软件接入的 Pocket 功能，并上线 Computer Use 能力，使智能体能够像人类一样通过视觉感知屏幕、操作鼠标键盘直接控制本地软件与图形界面。该更新将 Agent 的工作范围从命令行扩展至真实桌面环境，支持远程文件查找、跨应用数据处理及系统设置调整等复杂任务；技术层面，其将桌面操作拆解为 Desktop Control、Window Manager 等 4 个独立工具域及 60 多个具体工具，结合相对坐标定位与自适应截图技术解决多分辨率适配难题，并引入“截图-验证-行动”循环机制以确保多步任务的执行可靠性，同时在 IM 端提供细粒度的权限授权与过程控制，保障用户数据安全

https://mp.weixin.qq.com/s/dmF0PRj6OMQ-TWAIoc-kqg

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

发SCI心态崩了？来试试1区天菜PINN机器学习！简单好学易上手！

AtomGit开源社区

深兰科技与中国移动上海公司签署合作协议，共建5G+AI数智生态

AtomGit开源社区

2026全景透视：双轨内容生态下的电商AI创意工具选型与落地逻辑

在内容驱动流量转化的2026年，电商数字资产的消耗速度正在逼近企业传统人工摄制的极限。国内以抖音千川为主的高频付费投放，与海外以TikTok为主的多语种矩阵起号，每天都在吞噬海量的短视频与视觉海报。如何将AI算法的前端渲染能力，转化为能够与电商商品流、合规链条深度咬合的确定性增长工具，成为企业控制内容供应链成本的核心矛盾。很多商家和服务商在转型过程中，经常在两个核心卡点上寻找解法：“”以及“