【Qwen3.6 中文思考】Qwen3.5 / Qwen3.6 思考过程(Reasoning)为什么总是英文?完整解决方案
前言
很多人在部署 Qwen3.5、Qwen3.6 时都会遇到一个问题:
明明用户输入是中文,但模型
<think>里的思考过程却是英文。
典型现象:
用户:请分析水泥熟料强度下降原因
<think>
The user asks about clinker strength reduction...
Need to analyze possible factors...
</think>
最终回答虽然是中文,但内部 reasoning 却大量使用英文。
在:
- Agent
- Tool Calling
- Deep Research
- 自动规划
- 多步推理
场景下,这会带来明显问题:
- 中文 reasoning 不稳定
- Tool reasoning 可读性差
- 中文 Agent 效果下降
- 企业日志难审计
- Prompt 调试困难
本文会系统分析:
- 为什么 Qwen 会英文思考
- Qwen3.5 / Qwen3.6 的 reasoning 机制
- vLLM / SGLang / Ollama 下如何强制中文思考
- Tool Calling 为什么更容易英文
- 企业级最稳定方案
一、为什么 Qwen 会英文思考
很多人误以为:
用户输入中文,模型就一定中文思考。
实际上并不是。
大模型内部 reasoning 语言主要受以下因素影响:
| 因素 | 影响程度 |
|---|---|
| System Prompt | 极高 |
| Chat Template | 极高 |
| Tool Calling 模板 | 高 |
| RLHF 数据 | 高 |
| 模型训练语料 | 高 |
| User Query | 中 |
| 推理 Parser | 中 |
1. RLHF 与 CoT 数据偏英文
目前主流 reasoning 数据:
- OpenAI 风格 CoT
- Hermes
- DeepSeek-R1 数据
- ToolUse 数据
大部分都偏英文。
因此模型在:
- 长链推理
- Tool planning
- Agent reasoning
时,会自然切换到英文。
尤其 coder 模型更明显。
2. Tool Calling 模板通常是英文
例如很多框架默认:
You are a helpful assistant.
You can use tools.
Think step by step.
这会直接诱导模型:
- 英文 planning
- 英文 reasoning
- 英文 tool chain
即使用户说中文。
3. Hermes Parser 会放大英文倾向
很多人启动:
--tool-call-parser hermes
Hermes 的 tool calling 风格本身偏英文生态。
因此:
- reasoning 更容易英文
- tool 参数分析更容易英文
- agent planning 更容易英文
这是很多人忽略的问题。
二、Qwen3.5 / Qwen3.6 的 reasoning 机制
Qwen3.5 和 Qwen3.6 的 reasoning 本质:
用户输入
→ Chat Template
→ System Prompt
→ CoT / Reasoning
→ Tool Planning
→ Final Answer
其中:
<think>并不是独立模型- reasoning language 没有单独参数
- reasoning 语言由上下文诱导
也就是说:
“思考语言”本质是 Prompt Engineering 问题。
三、最有效方案:System Prompt 强制中文思考
这是最核心方案。
推荐:
你是中文AI助手。
要求:
1. 所有思考过程必须使用中文
2. 所有tool reasoning必须使用中文
3. 所有规划必须使用中文
4. 即使用户使用英文提问,也必须中文推理
5. 最终输出使用中文
效果远比:
请用中文回答
强。
因为:
“中文回答” ≠ “中文思考”。
推荐加强版 Prompt
企业环境建议:
你是企业级中文AI Agent。
规则:
- 所有 reasoning 必须使用中文
- 所有 chain-of-thought 必须使用中文
- 所有 tool planning 必须使用中文
- 所有工具参数分析必须使用中文
- 禁止使用英文进行中间推理
- 即使用户英文提问,也必须中文思考
这个版本稳定性明显更高。
四、Few-shot 是真正的大杀器
很多人只写:
请使用中文思考
其实不够稳定。
最强方法是:
给模型示范中文 CoT
例如:
用户:什么是Transformer
思考:
Transformer是一种基于自注意力机制的神经网络结构。
回答:
Transformer由编码器和解码器组成...
模型会模仿:
- reasoning 风格
- thinking 语言
- tool planning 语言
Few-shot 对 Qwen 非常有效。
五、vLLM 下如何彻底解决
很多人部署:
vllm serve Qwen/Qwen3.6
然后发现:
- 中文回答
- 英文 thinking
原因:
vLLM 不控制 reasoning language。
它只负责:
- 推理
- token 调度
- KV Cache
- parser
正确做法
方案一:应用层 System Prompt
例如:
messages = [
{
"role": "system",
"content": "所有思考过程必须使用中文。"
},
{
"role": "user",
"content": "解释 MoE"
}
]
方案二:修改 Chat Template(推荐)
修改:
tokenizer_config.json
在 chat_template 中加入:
<|im_start|>system
你必须始终使用中文思考。
<|im_end|>
这是企业级最佳方案。
因为:
所有应用统一生效:
- OneAPI
- Dify
- RagFlow
- FastGPT
- OpenWebUI
- LangChain
- 企业 Agent
六、Qwen3.6 为什么比 Qwen3.5 更容易英文思考
这是很多人实际观察到的。
原因通常有:
| 原因 | 说明 |
|---|---|
| ToolUse 数据更多 | 更偏英文 Agent |
| Coder 能力增强 | 英文 coding CoT 更多 |
| RLHF 更新 | 英文推理数据增加 |
| 更强 reasoning 能力 | 更倾向标准英文 CoT |
尤其:
Qwen3.6 Coder 系列。
英文 reasoning 倾向会更明显。
七、Tool Calling 场景为什么最严重
很多人发现:
普通聊天没问题。
但:
- Agent
- MCP
- Function Calling
突然全变英文。
原因:
Tool Calling Prompt 通常是英文
例如:
You can call tools.
Think carefully before calling tools.
模型会直接切换英文 reasoning。
八、Hermes vs qwen3_coder
很多人:
--tool-call-parser hermes
实际上:
Hermes 更适合:
- OpenHermes
- Llama
- 英文 Agent
而:
--tool-call-parser qwen3_coder
更适合:
- 中文 reasoning
- 中文 tool planning
- 中文 agent
- Qwen 原生风格
推荐配置
vllm serve Qwen/Qwen3.6 \
--enable-auto-tool-choice \
--tool-call-parser qwen3_coder \
--reasoning-parser qwen3
效果通常明显优于:
--tool-call-parser hermes
九、企业级稳定方案(推荐)
生产环境建议:
方案组合
中文 System Prompt
+
中文 Chat Template
+
Few-shot 中文 CoT
+
qwen3_coder parser
这是目前最稳定方案。
十、最终推荐架构
推荐等级 S
System Prompt 强制中文
+
Few-shot 中文 CoT
+
修改 Chat Template
+
qwen3_coder parser
适合:
- 企业 AI Agent
- 中文 MCP
- DeepResearch
- 自动规划
- 水泥行业知识 Agent
- 中文代码助手
十一、最终总结
Qwen3.5 / Qwen3.6 英文思考,本质并不是 Bug。
而是:
- 英文 CoT 数据诱导
- 英文 Tool Prompt
- 英文 Agent 生态
- Hermes 英文风格
- RLHF 偏英文
共同导致。
真正有效的方法并不是:
请用中文回答
而是:
控制:
- system prompt
- chat template
- few-shot
- tool parser
尤其:
Few-shot 中文 reasoning + 中文 chat template
才是最稳定方案。
附录:推荐 Prompt 模板
你是中文AI Agent。
规则:
1. 所有 reasoning 必须使用中文
2. 所有 chain-of-thought 必须使用中文
3. 所有 tool planning 必须使用中文
4. 所有工具调用分析必须使用中文
5. 即使用户英文提问,也必须中文思考
6. 所有输出使用中文
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)