最近一周AI圈神仙打架。DeepSeek-V4秀肌肉,OpenAI拉着英伟达甩出GPT-5.5和图片设计神器,阿里腾讯则在开源战场闷声干大事,字节跳动大幅优化3D建模。最魔幻的是马斯克,眼看自家xAI代码不行,竟想豪掷600亿“抄底”Cursor。。。

DeepSeek-V4 预览版发布

DeepSeek推出全新系列模型 DeepSeek-V4,包含 Pro 与 Flash 两个版本,全面支持 100 万 Token 超长上下文。采用创新注意力机制与稀疏架构,其中 DeepSeek-V4-Pro 拥有 1.6 万亿总参数(激活 490 亿),在世界知识、推理及 Agent 能力上比肩顶尖闭源模型,数学与代码竞赛表现尤为突出;DeepSeek-V4-Flash 则以更小参数提供高性价比的推理服务。目前模型已同步开源并上线 API,官方服务全面标配百万级上下文

https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

联合英伟达,OpenAI发布GPT-5.5

OpenAI正式发布GPT-5.5,一款面向实际工作和智能体的新型智能模型,由OpenAI与英伟达联合设计,深度适配GB200及GB300 NVL72系统。该模型打破了“更强即更慢”的铁律,在真实生产环境中实现了逐Token延迟持平GPT-5.4的同时,通过模型自主优化推理基础设施使生成速度提升超20%,且完成相同任务所需的Token数量更少;其上下文窗口升级至400K,API定价为输入5美元/百万Token、输出30美元/百万Token。在性能表现上,GPT-5.5在编程领域通过Terminal-Bench 2.0测试获得82.7%的高分,显著优于GPT-5.4(75.1%)和Claude Opus 4.7(69.4%),并在FrontierMath Tier 4数学基准测试中以39.6%的成绩接近竞品的一倍水平,同时在知识工作基准GDPval上达到84.9%的优异表现。此外,模型已集成至Codex,支持从代码生成、文档整理到复杂科学研究的全流程自动化任务,被内测用户形容为“失去它就像被截肢”般的生产力工具

https://openai.com/index/introducing-gpt-5-5/

阿里开源Qwen3.6-27B稠密模型

Qwen3.6-27B是拥有270亿参数的稠密多模态模型,该支持多模态思考与非思考模式,在智能体编程基准上实现了重大突破,全面超越了参数量高达其15倍的前代开源旗舰Qwen3.5-397B-A17B(总参数397B),并在SWE-bench Verified(77.2分)、SWE-bench Pro及Terminal-Bench 2.0等核心编程指标上达到旗舰级表现。同时,它在GPQA Diamond推理测试中取得87.8分,性能可媲美数倍规模的模型。Qwen3.6-27B现已在Hugging Face和ModelScope发布开源权重,支持本地部署,其API即将登陆阿里云百炼平台,并可无缝集成至OpenClaw、Claude Code等第三方编程助手

https://mp.weixin.qq.com/s/qLG4WWORyIKUvnewmBlqzA

字节跳动Seed3D 2.0重磅升级

Seed3D 2.0通过架构革新在几何精度与纹理材质两大核心维度上均取得了SOTA表现。在几何生成方面,Seed3D 2.0创新性地引入Coarse-to-Fine两阶段生成策略,将“整体结构”与“几何细节”解耦优化,并结合局部感知先验与体素化位置编码,有效解决了锐利边缘与薄壁结构的还原难题;在纹理生成方面,模型简化为统一的PBR(物理渲染)生成架构,并采用MoE提升高分辨率细节,同时引入VLM先验以增强材质分解的稳定性。基于60名具有3D建模经验的人类打分员对约200个测试用例的盲评,Seed3D 2.0在几何形状生成上的偏好率显著优于Hunyuan3D、Tripo等主流模型,且在纹理生成任务中相比基线模型的偏好率也超过69%。此外,新模型还拓展了部件级生成、关节化建模及场景组合等下游任务能力,支持将物体拆解为功能性部件并生成带有完整关节信息的URDF格式3D内容

Seed3D 2.0 几何生成的完整流程

https://research.doubao.com/zh/seed3d_2_0

腾讯混元发布Hy3 preview

Hy3 preview是团队从底层推倒重建后的首个成果,采用快慢思考融合的混合专家架构,拥有2950亿总参数但仅激活210亿参数,兼顾高性能与高效率,并支持256K上下文窗口。主打全面实用性,在复杂推理、代码生成及Agent任务执行方面大幅提升,不仅在FrontierScience-Olympiad等高难度榜单及清华大学求真书院数学博资考等真实考场中取得优异成绩,更能通过自然语言直接生成微信小程序代码、制作PPT或完成多步骤信息查找。目前,Hy3 preview已全面接入腾讯元宝、CodeBuddy、WorkBuddy、ima等内部工具及腾讯文档、QQ浏览器等C端产品,并在GitHub与Hugging Face上开源模型权重

https://mp.weixin.qq.com/s/J_39b28YKuYDLnOEXZBdhg

OpenAI 发布 ChatGPT Images 2.0

ChatGPT Images 2.0标志着图像生成从单纯的“渲染”迈向了“策略性设计”。该模型引入了革命性的“思考”能力,能够在生成前通过推理规划场景、联网获取实时信息并进行自我复核,从而处理复杂的视觉任务。在技术表现上,其在文本渲染(特别是中、日、韩等多语言环境)、高密度构图及遵循复杂指令方面实现了质的飞跃,支持从 3:1 到 1:3 的灵活宽高比及最高 2K 分辨率输出。此外,它还支持一次生成多张保持角色与风格一致的连续图像(如漫画分镜),并已深度集成至 ChatGPT、Codex 及 API 中,旨在通过端到端的智能视觉工作流,帮助用户将抽象想法转化为精确、可直接使用的视觉成果

https://mp.weixin.qq.com/s/NBwR2nrY3cQeqVJeD-yK0w

马斯克拟600亿美元收购Cursor

马斯克旗下SpaceX宣布拟以600亿美元(约合人民币4093亿元)收购明星AI编程独角兽Cursor,或支付100亿美元作为双方合作费用,Cursor CEO Michael Truell已证实正在与SpaceX紧密合作扩展Composer产品。Cursor由4位00后麻省理工学院学生创立,近期估值已达500亿美元,正计划融资超20亿美元。此次收购背后,源于马斯克意识到xAI在编程领域落后于行业领导者,且xAI经历重组与人员流失,因此急需Cursor的顶尖代码能力;目前Cursor已计划使用xAI的数万个GPU训练最新模型Composer 2.5

https://mp.weixin.qq.com/s/jSXgl9W1w66t9X5QmXF63w

Kimi K2.6 发布并开源

Kimi K2.6在代码、长程任务执行及 Agent 集群能力上实现显著突破。K2.6 在博士级难度的 Humanity’s Last Exam、SWE-Bench Pro 等基准测试中成绩持平或优于 GPT-5.4 和 Claude Opus 4.6,其长程编码能力大幅提升,可不间断编码 13 小时并处理超过 4000 行代码。新版本 Agent 集群架构支持最多 300 个子 Agent 并行完成 4000 个协作步骤,任务完成度与交付质量显著提升;同时针对 OpenClaw、Hermes Agent 等框架,支持长达 5 天的持续自主运行。目前该模型已上线 kimi.com、Kimi 应用、Kimi API 及 Kimi Code 编程助手,面向所有用户开放使用

https://mp.weixin.qq.com/s/6jfSSCcq7HMg-qXrsc4OVg

代号为 Elephant Alpha 的匿名模型被揭晓

匿名模型为蚂蚁百灵推出的 Ling-2.6-flash,总参数 104B、激活参数仅 7.4B 的 MoE架构 Instruct 模型,专为解决 Agent 场景下的高 Token 消耗与推理算力压力而设计。该模型采用混合线性注意力机制,经算子级深度优化,在 4 卡 H20 环境下推理速度可达 340 tokens/s,Prefill 吞吐为 Nemotron-3-Super 的 2.2 倍;在 Artificial Analysis 评测中,其实现 26 分 Intelligence Index 仅消耗 15M tokens,约为同类竞品模型的 1/10,显著提升了“智效比”。Ling-2.6-flash 在 BFCL-V4、SWE-bench Verified 等核心 Agent 基准测试中达到同尺寸 SOTA 水平,支持 256k 上下文,现已在 OpenRouter 及官方平台开放 API 调用,并计划近期开源 BF16、FP8 及 INT4 版本

https://mp.weixin.qq.com/s/84MbxoQR7GOjOb-ekV8e-w

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐