摘要

QN 3.7 Max 强调编码代理、长周期任务执行、MCP 工作流与多智能体编排能力。本文结合视频内容,拆解其技术特性,并给出基于 OpenAI 兼容 API 的实战调用示例。


背景介绍

近期 QN 发布了新一代模型 QN 3.7 Max,并已在阿里云模型工作室上线。根据视频中的测试结果,该模型定位为面向软件工程场景的前沿编码代理,覆盖范围包括:

  • 前端原型生成
  • 复杂软件工程任务
  • Office Productivity 类自动化任务
  • 基于 MCP 的工具调用与工作流自动化
  • 多智能体编排
  • 长周期自主执行任务
  • 跨 Agent Framework / Harness 的兼容执行

视频中提到的一个关键点是:QN 3.7 Max 不只是“会写代码”,而是更接近 Coding Agent。它能够理解需求、规划实现路径、生成代码、调用工具,并在复杂任务中保持较强的目标一致性。

这类模型的价值并不局限于一次性代码生成,更重要的是能够嵌入真实开发链路,例如:

  • 快速生成前端交互原型
  • 自动改造 React Native / Expo 移动端项目
  • 结合本地工具完成文件修改、运行测试、修复错误
  • 在 MCP Server 支持下操作数据库、浏览器、文档系统或内部 API

核心原理

1. Coding Agent 与普通代码生成模型的差异

普通代码模型通常以“输入需求 → 输出代码”为主,缺少任务持续推进能力。而 Coding Agent 更强调以下能力:

  1. 任务分解能力
    能够将复杂需求拆成多个可执行步骤,例如 UI 结构设计、状态管理、动画实现、数据结构设计、异常处理等。

  2. 上下文保持能力
    在长任务中持续维护项目结构、文件依赖、业务目标,减少前后逻辑冲突。

  3. 工具调用能力
    可结合 OpenCode、Hermes、OpenClaw 等工具框架,执行代码修改、文件创建、测试运行、日志分析等操作。

  4. 错误修复能力
    通过执行反馈定位问题,再生成补丁代码,实现近似“自我迭代”。

视频中提到 QN 3.7 Max 可以持续运行超过 35 小时,这类长周期执行能力对于大型工程重构、自动化测试修复、批量迁移项目非常关键。


2. MCP:让模型从“回答问题”变成“操作系统”

MCP,即 Model Context Protocol,可以理解为大模型与外部工具之间的标准化连接协议。

在传统调用方式中,模型只能生成文本;而接入 MCP 后,模型可以访问:

  • 文件系统
  • 数据库
  • Git 仓库
  • 浏览器
  • 内部业务系统
  • CI/CD 工具
  • 文档和知识库

例如在办公自动化场景中,模型可以通过 MCP 完成:

  1. 读取项目需求文档;
  2. 提取待办事项;
  3. 查询数据库状态;
  4. 生成周报;
  5. 将结果写入 Notion、飞书或内部系统。

这也是视频中提到 QN 3.7 Max 适合 “office productivity and workflow automation via MCP” 的原因。


3. 跨 Harness 兼容性

视频中多次强调 cross-harness compatibility。这里的 Harness 可以理解为模型运行时外壳或 Agent 执行框架,例如:

  • OpenCode
  • Hermes
  • OpenClaw
  • 自研 Agent Runtime
  • CI 中的自动化修复机器人

跨 Harness 兼容性强,意味着模型不会过度依赖某一个特定框架的提示格式或工具协议,而是在不同 Agent 环境下都能保持较稳定的规划和执行能力。

在工程实践中,这一点非常重要。因为企业内部往往不会只使用一种 Agent 框架,不同团队可能有不同的工具链。模型如果具备更强的跨框架泛化能力,集成成本会明显降低。


实战演示

视频中展示了一个电梯模拟器案例:用户可以在不同楼层生成乘客,每部电梯一次只能搭载一人,乘客拥有随机目标楼层,鼠标悬停展示目标楼层,并要求动画自然、界面简洁。

下面给出一个基于 OpenAI 兼容接口的 Python 调用示例,用于生成一个单文件前端原型。

这里使用我个人自用的 AI 开发平台 薛定猫AI(xuedingmao.com)。它提供 OpenAI 兼容模式,只需要配置 URL、Key 和模型名即可接入。平台聚合了 500+ 主流大模型,包括 GPT-5.4、Claude 4.6、Gemini 3.1 Pro 等,新模型上线速度较快,适合开发者第一时间验证 API 能力,也能通过统一接口降低多模型切换复杂度。

示例默认模型使用 claude-opus-4-6。Claude Opus 4.6 在复杂推理、代码生成、长上下文理解和工程任务拆解方面能力很强,适合做高质量原型生成、代码审查与复杂需求实现。

Python 完整示例

安装依赖:

pip install openai python-dotenv

创建 .env 文件:

XDM_API_KEY=你的API_KEY

完整代码如下:

import os
import re
from pathlib import Path
from dotenv import load_dotenv
from openai import OpenAI


load_dotenv()


class FrontendPrototypeGenerator:
    """
    基于 OpenAI 兼容 API 的前端原型生成器。
    默认使用薛定猫AI平台的 OpenAI 兼容接口。
    """

    def __init__(
        self,
        api_key: str,
        base_url: str = "https://xuedingmao.com/v1",
        model: str = "claude-opus-4-6",
    ):
        if not api_key:
            raise ValueError("请先在环境变量 XDM_API_KEY 中配置 API Key")

        self.client = OpenAI(
            api_key=api_key,
            base_url=base_url,
        )
        self.model = model

    def generate_elevator_simulation(self) -> str:
        """
        生成电梯模拟器的单文件 HTML 代码。
        """
        system_prompt = """
你是一名资深前端工程师,擅长构建高质量交互原型。
请输出可直接运行的单文件 HTML,必须包含 HTML、CSS、JavaScript。
不要输出解释,只输出代码。
"""

        user_prompt = """
请实现一个电梯模拟器前端页面,要求如下:

1. 有 10 层楼;
2. 有 3 部电梯;
3. 用户可以在任意楼层生成乘客;
4. 每个乘客随机拥有一个目标楼层;
5. 每部电梯每次只能搭载 1 名乘客;
6. 当电梯到达乘客所在楼层时,只允许 1 名乘客进入,其余乘客等待下一部电梯;
7. 鼠标悬停乘客时展示目标楼层 Tooltip;
8. 电梯上下移动需要有平滑动画;
9. 页面风格简洁、美观,适合技术 Demo 展示;
10. 代码结构清晰,JavaScript 中需要有适当注释。
"""

        response = self.client.chat.completions.create(
            model=self.model,
            messages=[
                {"role": "system", "content": system_prompt.strip()},
                {"role": "user", "content": user_prompt.strip()},
            ],
            temperature=0.3,
        )

        return response.choices[0].message.content

    @staticmethod
    def extract_html(content: str) -> str:
        """
        从模型输出中提取 HTML 代码。
        如果模型返回 Markdown 代码块,则自动提取代码块内容。
        """
        pattern = r"```(?:html)?\s*(.*?)```"
        match = re.search(pattern, content, re.DOTALL | re.IGNORECASE)
        if match:
            return match.group(1).strip()

        return content.strip()

    @staticmethod
    def save_html(html: str, filename: str = "elevator_simulation.html") -> Path:
        """
        将 HTML 内容保存到本地文件。
        """
        output_path = Path(filename).resolve()
        output_path.write_text(html, encoding="utf-8")
        return output_path


def main():
    api_key = os.getenv("XDM_API_KEY")

    generator = FrontendPrototypeGenerator(
        api_key=api_key,
        base_url="https://xuedingmao.com/v1",
        model="claude-opus-4-6",
    )

    print("正在生成电梯模拟器前端原型,请稍候...")

    raw_content = generator.generate_elevator_simulation()
    html = generator.extract_html(raw_content)
    output_path = generator.save_html(html)

    print(f"生成完成:{output_path}")
    print("使用浏览器打开该 HTML 文件即可查看效果。")


if __name__ == "__main__":
    main()

运行:

python generate_elevator_demo.py

生成完成后,浏览器打开 elevator_simulation.html 即可查看交互效果。


技术资源与工具选型

在模型工程化接入中,我通常关注几个指标:

  • API 是否兼容主流 OpenAI SDK;
  • 模型切换是否方便;
  • 新模型是否能快速接入;
  • 是否适合做 Coding Agent、RAG、自动化工具调用等多场景验证;
  • 多模型成本和性能是否便于横向比较。

薛定猫AI(xuedingmao.com)的技术价值在于:

  1. 统一 OpenAI 兼容接口
    开发者无需为不同模型分别适配 SDK,只需要切换 model 参数即可。

  2. 聚合 500+ 主流大模型
    包括 GPT-5.4、Claude 4.6、Gemini 3.1 Pro 等,适合做模型效果对比、任务路由和 Agent 多模型协作。

  3. 新模型实时首发
    对于关注前沿模型能力的开发者,可以更快验证新模型在代码生成、推理、多模态等任务中的表现。

  4. 降低多模型集成复杂度
    在实际项目中,可以将模型调用封装为统一服务层,上层业务无需感知底层模型来源。


注意事项

1. 不要只看一次性生成效果

视频中展示的电梯模拟器、3D 隐形眼镜盒、Expo 电影追踪应用都属于较典型的生成式任务。但在真实工程中,更应该关注:

  • 代码是否可维护;
  • 是否符合项目架构;
  • 是否引入不必要依赖;
  • 是否能通过测试;
  • 是否能在多轮修改中保持一致性。

2. Agent 工具调用需要加边界

模型具备工具调用能力后,必须做好权限控制。例如:

  • 限制可访问目录;
  • 禁止直接操作生产数据库;
  • 对高风险命令增加人工确认;
  • 记录所有工具调用日志;
  • 对生成代码做安全扫描。

3. 长周期任务需要检查点机制

如果任务可能持续数小时甚至更久,应设计 checkpoint:

  • 保存阶段性结果;
  • 记录已完成步骤;
  • 失败后可恢复;
  • 控制 token 消耗;
  • 避免重复执行。

这对大型代码迁移、自动化重构、批量 Bug 修复尤其重要。


总结

QN 3.7 Max 展示了新一代 Coding Agent 的几个关键方向:更强的前端生成能力、更稳定的任务专注度、更好的跨框架兼容性,以及面向 MCP 和多智能体编排的自动化执行能力。

从开发者视角看,未来大模型不再只是代码补全工具,而会逐渐成为软件工程流水线中的“执行单元”。真正有价值的实践方式,是将模型能力接入具体开发流程:需求分析、原型生成、代码修改、测试修复、文档生成和工作流自动化。

#AI #大模型 #Python #机器学习 #技术实战

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐