面试官皱眉：“你懂 Claude Code 主循环 Query 流程吗？” 我说：“就是一个 while 循环，调模型、跑工具、再调模型”，他：就这？？

菜菜的tunning

133人浏览 · 2026-06-10 17:32:39

菜菜的tunning · 2026-06-10 17:32:39 发布

面试被问：通义Code主循环Query架构？只答while循环直接挂科！

2026-06-04 15:10
大家好，我是JIA YOU。

前段时间不少粉丝反馈面试踩坑，面试官深挖通义Code主循环Query完整流程，求职者随口回答：无非while循环，调模型、执行工具往复循环。面试官当即摇头：就这？基础demo水平，不符合工程落地要求。

这道面试题核心不是考察通义Code使用，而是甄别候选人有没有落地过工业化AI Agent架构。只懂表层循环逻辑，不懂异常兜底、流式调度、状态管控、容错修复，很难通过中高级AI开发面试。

今天拆解通义Code源码核心queryLoop主循环架构，从调用链路、五步运行逻辑、工具调度、异常容错四大维度拆解，看完面试可以完整流畅作答，文章干货偏多，建议收藏留存。

一、终端输入指令回车后，通义Code内部全链路发生了什么？

日常在终端输入：帮我修复项目报错代码，等待片刻代码自动修改完毕。外行以为只是请求大模型返回答案，实际内部是多轮Agent循环调度。

模型首轮回复大概率是：需要读取目标报错源码文件；框架调取文件工具，读取内容回传模型；模型再次下发运行单元测试指令，框架执行测试、回传报错日志；反复多轮交互后，模型确认bug根源，输出最终修改代码，本轮对话终止。

这套反复调用模型→执行工具→回填结果的闭环，就是Query Loop主循环，是整个代码Agent的核心心脏。

很多人手写简易Agent：

while(true){
    调用大模型();
    if(存在工具调用){执行工具();}else break;
}

代码看似没问题，仅能跑通玩具Demo。工业化场景里要处理用户终止、工具崩溃、上下文超限、输出截断、循环死跑等数十类异常，通义Code主循环源码超1600行，正常业务逻辑仅占两成，剩余八成全是异常边界处理逻辑。

二、四层调用链路：从用户输入ask到底层queryLoop

通义Code采用分层解耦设计，四层链式调用依次：ask → QueryEngine → query → queryLoop，依靠异步生成器yield实现事件逐层透传，类比自来水供给：水龙头(ask)→小区储水(QueryEngine)→输水管道(query)→水厂处理(queryLoop)。

精简伪代码：

//第一层：ask，对外简易调用入口
async function* ask(params){
  const engine = new QueryEngine(config)
  yield* engine.submitMessage(params.prompt)
}
//第二层：QueryEngine，全权维护会话状态
class QueryEngine{
  async *submitMessage(prompt){
    //预处理指令、拼装系统提示词、挂载项目上下文
    yield* query({messages,systemPrompt,tools})
  }
}
//第三层：query流式转发包装层
async function* query(params){
  yield* queryLoop(params)
}
//第四层：主循环核心本体
async function* queryLoop(params){
  while(true){
    //消息预处理、模型调用、工具解析、任务执行、结果回填
  }
}

分层作用详解

ask：SDK对外最简调用入口，使用者一行代码即可发起对话，屏蔽内部复杂逻辑。
QueryEngine：会话管家，统一保管全量历史消息、文件缓存、权限记录，所有会话数据统一归集。
query：异步生成器载体，区别于普通函数整段返回结果，边执行边向外推送实时数据，实现终端打字流式输出效果。
queryLoop：循环执行主体，负责全轮次逻辑流转。

异步生成器是流式打字的关键：普通函数=装满一桶水再交付；生成器=水龙头实时流水，模型每输出一个字符，立刻推送前端展示。

三、主循环queryLoop五大固定执行步骤

整个循环骨架依托while死循环，单次迭代固定5步：消息预处理→流式请求模型→判断终止条件→批量运行工具→结果并入上下文开启新一轮。

async function* queryLoop(params) {
  let state = { messages: [], turnCount:1 }
  while(true){
    //1.按需压缩上下文
    const reqMsg = maybeCompact(state.messages)
    let toolBlocks = [], needNext = false
    //2.流式接收模型返回内容
    for await(const chunk of callModel(reqMsg)){
      yield chunk
      if(chunk为tool_call){
        toolBlocks.push(chunk)
        needNext = true
      }
    }
    //3.判定是否结束对话
    if(!needNext) return {reason:"completed"}
    //4.批量执行全部工具指令
    const toolRes = await runTools(toolBlocks)
    //5.更新上下文状态，开启下一轮循环
    state = {...state,messages:[...reqMsg,...assistantMsg,...toolRes],turnCount:state.turnCount+1}
  }
}

分步拆解

消息预处理：被动式上下文压缩
不会每轮主动压缩历史消息节省token，优先直接请求模型；只有接口返回上下文超限报错后，才触发消息摘要压缩，同一轮循环仅允许压缩1次，通过hasAttemptedReactiveCompact状态位防重复压缩浪费token。压缩后仍超限则直接终止会话。
流式调用大模型，区分文本/工具调用
模型返回内容分为两类：普通自然文本、结构化tool_call工具指令。

文本内容实时向上抛出，终端实时打字展示；
工具调用内容统一缓存，等待后续调度执行。

终止判定：依靠tool_call有无做决策
核心规则：本轮存在工具调用→继续循环执行工具；无工具调用→任务完结，正常退出。
但实际退出场景不止正常完成，通义Code内置十余种终止枚举：

completed：任务正常完成
max_turns：轮次达到上限强制止损，避免无限循环高额计费
aborted_streaming：用户Ctrl+C打断模型输出
aborted_tools：工具运行中途被手动终止
prompt_too_long：上下文压缩后依旧超出模型窗口
max_output_truncated：模型输出超长多次续写失败

流式并行工具执行（核心优化亮点）
摒弃传统「等模型全量输出完毕再启动工具」串行方案，采用StreamingToolExecutor流式执行器：识别到单条完整tool_call立刻后台异步启动工具，不用等待模型输出结束。
类比点菜：刚报完红烧肉，后厨立刻开工，继续报剩下菜品，全部点菜结束时部分菜品已经烹饪完毕，大幅压缩整体耗时。

工具并行约束规则

只读工具（读取文件、检索目录、关键词搜索）：全并行执行，无资源冲突；
变更类工具（修改代码、写入文件、运行shell）：强制串行执行，避免并发修改导致文件覆盖错乱；
未标注读写属性的工具，默认串行兜底，优先保证稳定性。

工具结果回填上下文
工具执行结果统一封装成tool_result结构并入消息列表，迭代轮次计数+1，进入下一轮循环。历史消息持续累积，也是上下文压缩机制存在的底层原因。

四、三大隐形工业级容错设计（面试高频考点）

1.全量状态集中托管，统一State对象

所有跨轮次变量（消息列表、循环轮数、续写失败次数、本轮压缩标记）统一收纳在State结构体，摒弃零散全局/闭包变量。
优势：每一轮状态数据可追溯，调试排查问题直观，从根源规避变量忘记重置引发死循环、逻辑错乱。

type State={
  messages:Message[];
  turnCount:number;
  resumeFailCount:number;
  compacted:boolean;
}

2.工具异常空结果兜底补全，防止接口校验报错

接口强制约束：每一条tool_call必须绑定对应tool_result结果，缺失配对会直接拦截请求。
遇到工具崩溃、手动中断、进程异常导致无返回数据时，框架自动生成错误标记的伪tool_result消息，标注异常原因与对应工具ID补齐配对，模型收到报错信息后自主调整后续方案，不会单次故障直接卡死整轮对话。

3.模型输出超限自动续写修复

模型受单次输出token上限限制，内容过长会被截断，通义Code两段式静默修复：
1.首次截断自动上调输出token上限重试，用户无感知；
2.上调上限仍截断，在下轮prompt附加续写指令，引导模型从断点接续输出；
最多允许3次续写尝试，超限后终止会话并返回截断异常。

五、总结：面试高分作答思路

再次被问到通义Code主循环架构，避开简易while浅层回答，按照这套逻辑表述：
整体采用四层分层调用+异步生成器流式输出，主循环五大执行步骤，依托有无tool_call判定循环启停；工具采用边解析边执行的流式并行方案区分读写权限调度；通过集中式State管理全量跨轮状态，配套缺失结果补全、输出截断续写、上下文被动压缩三类容错机制，同时预置十几种异常退出逻辑完成工业级兜底。

弄懂这套逻辑，不止吃透通义Code，市面上绝大多数代码Agent架构设计思路一通百通。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

Java SpringBoot+Vue3+MyBatis 社区养老服务系统系统源码｜前后端分离+MySQL数据库

AtomGit开源社区

发电机故障暂态仿真模型，仿真分析发电机产生故障时，电压电流的变化情况研究（Simulink仿真实现）

发电机作为电力系统的核心发电设备，其运行稳定性直接决定整个电网的安全可靠水平。电网运行过程中各类突发故障会引发发电机电磁暂态过程，造成机端电压、定子电流、转子电流等电气参数剧烈波动，严重时会导致设备损坏、机组脱网甚至系统性停电事故。为精准掌握发电机故障状态下的电气量变化规律，本文依托电力系统电磁暂态仿真平台搭建标准发电机仿真模型，模拟三相短路、单相接地短路、两相短路等典型电网故障场景，系统分析不同

AtomGit开源社区

单相逆变器滑模控制模型仿真滑膜控制研究（Simulink仿真实现）

单相逆变器作为电能转换的核心装置，广泛应用于分布式光伏发电、储能系统、民用供电设备等领域，其输出电压的稳定性、波形质量与动态响应性能直接决定供电系统的可靠性。传统PI控制、PID控制策略在逆变器参数摄动、负载突变、外界干扰工况下，存在抗干扰能力弱、动态响应滞后、稳态波形畸变率高等缺陷。滑模变结构控制作为一种非线性鲁棒控制策略，具备参数不敏感、抗干扰能力强、响应速度快的突出优势，能够有效适配单相逆变