深度融合推理、记忆与执行能力,千问新一代旗舰以更小参数撬动顶级编程智能体基准,正式向全球一线模型发起挑战。

图片

一句话读懂这次发布

阿里千问团队正式推出 Qwen3.6 系列首款模型 Qwen3.6-Plus。与上一代相比,这次更新几乎是全方位的:编程 Agent 能力、通用智能体能力、工具调用能力三线并进,全部实现跃升。更重要的是,它默认配备 100 万 token 的超长上下文窗口,同时已向开发者开放 API 调用。

核心数据一览

图片

三大核心升级

  • 代码智能体(Agentic Coding)

     — 不只是写代码,而是像真正的工程师一样理解需求、拆分任务、调用工具、执行验证、修复错误,全流程自主完成。在 SWE-bench、Terminal-Bench 2、NL2Repo 等业界主流编程基准上紧追 Claude Opus 4.5,部分测试甚至超越。

  • 通用智能体与工具调用

     — 在 Claw-Eval、QwenClawBench 等真实世界 Agent 评测中,Qwen3.6-Plus 实现了对多款国产模型的全面超越,与 Claude Opus 4.5 处于同一梯队,在多个长程规划任务中甚至取得最优成绩。

  • 原生多模态升级

     — 视觉推理、文档理解、OCR、物体识别、视觉编程等能力全面提升,可基于截图或设计稿直接生成前端代码,打通从「看懂界面」到「写出代码」再到「调用工具完成修改」的完整链路。

图片

基准测试:与顶级模型的距离

以下数据来自官方披露的对比基准,Qwen3.6-Plus 在多项测试中已与 Claude Opus 4.5 相当,超越参数量为其 2-3 倍的同类模型。

图片

较上一代显著提升

图片

开发者最关心的几件事

框架兼容性:官方深度适配 OpenClaw、Qwen Code、Claude Code、Kilo Code、Cline、OpenCode 六大主流 Agent 框架,支持 Anthropic API 协议,理论上可以直接接入已有 Claude Code 工作流。

新功能 preserve_thinking:API 新增该参数,可保留多轮对话中所有历史思维链内容,在 Agent 任务中尤其有用,让模型在复杂长程任务中维持更连贯的推理上下文。

定价:阿里云百炼标准价 4元/百万输入 tokens,12元/百万输出 tokens,限时五折优惠期间低至 2元起。Preview 阶段在 OpenRouter 上曾提供免费试用,上线首日调用量跻身平台日榜第二。

图片

「氛围编程」真的可用了吗?

Vibe Coding——用一句大白话让 AI 写出整个应用——曾被认为是噱头多于实用。Qwen3.6-Plus 的发布让这个概念更接近现实。有媒体实测,用一条自然语言提示词,模型在约 2 分钟内生成了具备完整日历视图与详情页跳转逻辑的 AI 资讯网站;另一项测试中,它在不到 8 分钟完成了一个完整独立站页面的搭建,消耗约 2.5 万 tokens,成本不到两角。

我们相信,多模态 AI 的未来不在于孤立的任务性能,而在于为面向工作流的操作提供整体支持。
—— 千问团队

后续还有什么?

Qwen3.6-Plus 只是 Qwen3.6 系列的起点。千问团队已明确预告:更强性能的旗舰款 Qwen3.6-Max 将在近期发布,同时还将开源多种尺寸的小模型版本,面向本地部署和边缘侧场景进一步释放生态潜力。

更多transformer,VIT,swin tranformer
参考头条号:人工智能研究所
v号:人工智能研究Suo, 启示AI科技

 动画详解transformer  在线视频教程 

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐