国产编程大模型破局者来了:Qwen3.6-Plus 对标 Claude Opus
深度融合推理、记忆与执行能力,千问新一代旗舰以更小参数撬动顶级编程智能体基准,正式向全球一线模型发起挑战。

一句话读懂这次发布
阿里千问团队正式推出 Qwen3.6 系列首款模型 Qwen3.6-Plus。与上一代相比,这次更新几乎是全方位的:编程 Agent 能力、通用智能体能力、工具调用能力三线并进,全部实现跃升。更重要的是,它默认配备 100 万 token 的超长上下文窗口,同时已向开发者开放 API 调用。
核心数据一览

三大核心升级
- 代码智能体(Agentic Coding)
— 不只是写代码,而是像真正的工程师一样理解需求、拆分任务、调用工具、执行验证、修复错误,全流程自主完成。在 SWE-bench、Terminal-Bench 2、NL2Repo 等业界主流编程基准上紧追 Claude Opus 4.5,部分测试甚至超越。
- 通用智能体与工具调用
— 在 Claw-Eval、QwenClawBench 等真实世界 Agent 评测中,Qwen3.6-Plus 实现了对多款国产模型的全面超越,与 Claude Opus 4.5 处于同一梯队,在多个长程规划任务中甚至取得最优成绩。
- 原生多模态升级
— 视觉推理、文档理解、OCR、物体识别、视觉编程等能力全面提升,可基于截图或设计稿直接生成前端代码,打通从「看懂界面」到「写出代码」再到「调用工具完成修改」的完整链路。

基准测试:与顶级模型的距离
以下数据来自官方披露的对比基准,Qwen3.6-Plus 在多项测试中已与 Claude Opus 4.5 相当,超越参数量为其 2-3 倍的同类模型。

较上一代显著提升

开发者最关心的几件事
框架兼容性:官方深度适配 OpenClaw、Qwen Code、Claude Code、Kilo Code、Cline、OpenCode 六大主流 Agent 框架,支持 Anthropic API 协议,理论上可以直接接入已有 Claude Code 工作流。
新功能 preserve_thinking:API 新增该参数,可保留多轮对话中所有历史思维链内容,在 Agent 任务中尤其有用,让模型在复杂长程任务中维持更连贯的推理上下文。
定价:阿里云百炼标准价 4元/百万输入 tokens,12元/百万输出 tokens,限时五折优惠期间低至 2元起。Preview 阶段在 OpenRouter 上曾提供免费试用,上线首日调用量跻身平台日榜第二。

「氛围编程」真的可用了吗?
Vibe Coding——用一句大白话让 AI 写出整个应用——曾被认为是噱头多于实用。Qwen3.6-Plus 的发布让这个概念更接近现实。有媒体实测,用一条自然语言提示词,模型在约 2 分钟内生成了具备完整日历视图与详情页跳转逻辑的 AI 资讯网站;另一项测试中,它在不到 8 分钟完成了一个完整独立站页面的搭建,消耗约 2.5 万 tokens,成本不到两角。
我们相信,多模态 AI 的未来不在于孤立的任务性能,而在于为面向工作流的操作提供整体支持。
—— 千问团队
后续还有什么?
Qwen3.6-Plus 只是 Qwen3.6 系列的起点。千问团队已明确预告:更强性能的旗舰款 Qwen3.6-Max 将在近期发布,同时还将开源多种尺寸的小模型版本,面向本地部署和边缘侧场景进一步释放生态潜力。
更多transformer,VIT,swin tranformer
参考头条号:人工智能研究所
v号:人工智能研究Suo, 启示AI科技
动画详解transformer 在线视频教程


AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)