前言

很多人在部署 Qwen3.5、Qwen3.6 时都会遇到一个问题:

明明用户输入是中文,但模型 <think> 里的思考过程却是英文。

典型现象:

用户:请分析水泥熟料强度下降原因

<think>
The user asks about clinker strength reduction...
Need to analyze possible factors...
</think>

最终回答虽然是中文,但内部 reasoning 却大量使用英文。

在:

  • Agent
  • Tool Calling
  • Deep Research
  • 自动规划
  • 多步推理

场景下,这会带来明显问题:

  • 中文 reasoning 不稳定
  • Tool reasoning 可读性差
  • 中文 Agent 效果下降
  • 企业日志难审计
  • Prompt 调试困难

本文会系统分析:

  1. 为什么 Qwen 会英文思考
  2. Qwen3.5 / Qwen3.6 的 reasoning 机制
  3. vLLM / SGLang / Ollama 下如何强制中文思考
  4. Tool Calling 为什么更容易英文
  5. 企业级最稳定方案

一、为什么 Qwen 会英文思考

很多人误以为:

用户输入中文,模型就一定中文思考。

实际上并不是。

大模型内部 reasoning 语言主要受以下因素影响:

因素 影响程度
System Prompt 极高
Chat Template 极高
Tool Calling 模板
RLHF 数据
模型训练语料
User Query
推理 Parser

1. RLHF 与 CoT 数据偏英文

目前主流 reasoning 数据:

  • OpenAI 风格 CoT
  • Hermes
  • DeepSeek-R1 数据
  • ToolUse 数据

大部分都偏英文。

因此模型在:

  • 长链推理
  • Tool planning
  • Agent reasoning

时,会自然切换到英文。

尤其 coder 模型更明显。


2. Tool Calling 模板通常是英文

例如很多框架默认:

You are a helpful assistant.
You can use tools.
Think step by step.

这会直接诱导模型:

  • 英文 planning
  • 英文 reasoning
  • 英文 tool chain

即使用户说中文。


3. Hermes Parser 会放大英文倾向

很多人启动:

--tool-call-parser hermes

Hermes 的 tool calling 风格本身偏英文生态。

因此:

  • reasoning 更容易英文
  • tool 参数分析更容易英文
  • agent planning 更容易英文

这是很多人忽略的问题。


二、Qwen3.5 / Qwen3.6 的 reasoning 机制

Qwen3.5 和 Qwen3.6 的 reasoning 本质:

用户输入
→ Chat Template
→ System Prompt
→ CoT / Reasoning
→ Tool Planning
→ Final Answer

其中:

  • <think> 并不是独立模型
  • reasoning language 没有单独参数
  • reasoning 语言由上下文诱导

也就是说:

“思考语言”本质是 Prompt Engineering 问题。


三、最有效方案:System Prompt 强制中文思考

这是最核心方案。

推荐:

你是中文AI助手。

要求:
1. 所有思考过程必须使用中文
2. 所有tool reasoning必须使用中文
3. 所有规划必须使用中文
4. 即使用户使用英文提问,也必须中文推理
5. 最终输出使用中文

效果远比:

请用中文回答

强。

因为:

“中文回答” ≠ “中文思考”。


推荐加强版 Prompt

企业环境建议:

你是企业级中文AI Agent。

规则:
- 所有 reasoning 必须使用中文
- 所有 chain-of-thought 必须使用中文
- 所有 tool planning 必须使用中文
- 所有工具参数分析必须使用中文
- 禁止使用英文进行中间推理
- 即使用户英文提问,也必须中文思考

这个版本稳定性明显更高。


四、Few-shot 是真正的大杀器

很多人只写:

请使用中文思考

其实不够稳定。

最强方法是:

给模型示范中文 CoT

例如:

用户:什么是Transformer

思考:
Transformer是一种基于自注意力机制的神经网络结构。

回答:
Transformer由编码器和解码器组成...

模型会模仿:

  • reasoning 风格
  • thinking 语言
  • tool planning 语言

Few-shot 对 Qwen 非常有效。


五、vLLM 下如何彻底解决

很多人部署:

vllm serve Qwen/Qwen3.6

然后发现:

  • 中文回答
  • 英文 thinking

原因:

vLLM 不控制 reasoning language。

它只负责:

  • 推理
  • token 调度
  • KV Cache
  • parser

正确做法

方案一:应用层 System Prompt

例如:

messages = [
    {
        "role": "system",
        "content": "所有思考过程必须使用中文。"
    },
    {
        "role": "user",
        "content": "解释 MoE"
    }
]

方案二:修改 Chat Template(推荐)

修改:

tokenizer_config.json

在 chat_template 中加入:

<|im_start|>system
你必须始终使用中文思考。
<|im_end|>

这是企业级最佳方案。

因为:

所有应用统一生效:

  • OneAPI
  • Dify
  • RagFlow
  • FastGPT
  • OpenWebUI
  • LangChain
  • 企业 Agent

六、Qwen3.6 为什么比 Qwen3.5 更容易英文思考

这是很多人实际观察到的。

原因通常有:

原因 说明
ToolUse 数据更多 更偏英文 Agent
Coder 能力增强 英文 coding CoT 更多
RLHF 更新 英文推理数据增加
更强 reasoning 能力 更倾向标准英文 CoT

尤其:

Qwen3.6 Coder 系列。

英文 reasoning 倾向会更明显。


七、Tool Calling 场景为什么最严重

很多人发现:

普通聊天没问题。

但:

  • Agent
  • MCP
  • Function Calling

突然全变英文。

原因:

Tool Calling Prompt 通常是英文

例如:

You can call tools.
Think carefully before calling tools.

模型会直接切换英文 reasoning。


八、Hermes vs qwen3_coder

很多人:

--tool-call-parser hermes

实际上:

Hermes 更适合:

  • OpenHermes
  • Llama
  • 英文 Agent

而:

--tool-call-parser qwen3_coder

更适合:

  • 中文 reasoning
  • 中文 tool planning
  • 中文 agent
  • Qwen 原生风格

推荐配置

vllm serve Qwen/Qwen3.6 \
  --enable-auto-tool-choice \
  --tool-call-parser qwen3_coder \
  --reasoning-parser qwen3

效果通常明显优于:

--tool-call-parser hermes

九、企业级稳定方案(推荐)

生产环境建议:

方案组合

中文 System Prompt
+
中文 Chat Template
+
Few-shot 中文 CoT
+
qwen3_coder parser

这是目前最稳定方案。


十、最终推荐架构

推荐等级 S

System Prompt 强制中文
+
Few-shot 中文 CoT
+
修改 Chat Template
+
qwen3_coder parser

适合:

  • 企业 AI Agent
  • 中文 MCP
  • DeepResearch
  • 自动规划
  • 水泥行业知识 Agent
  • 中文代码助手

十一、最终总结

Qwen3.5 / Qwen3.6 英文思考,本质并不是 Bug。

而是:

  • 英文 CoT 数据诱导
  • 英文 Tool Prompt
  • 英文 Agent 生态
  • Hermes 英文风格
  • RLHF 偏英文

共同导致。

真正有效的方法并不是:

请用中文回答

而是:

控制:
- system prompt
- chat template
- few-shot
- tool parser

尤其:

Few-shot 中文 reasoning + 中文 chat template

才是最稳定方案。


附录:推荐 Prompt 模板

你是中文AI Agent。

规则:
1. 所有 reasoning 必须使用中文
2. 所有 chain-of-thought 必须使用中文
3. 所有 tool planning 必须使用中文
4. 所有工具调用分析必须使用中文
5. 即使用户英文提问,也必须中文思考
6. 所有输出使用中文
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐