【Qwen3.6 中文思考】Qwen3.5 / Qwen3.6 思考过程（Reasoning）为什么总是英文？完整解决方案

东华果汁哥

371人浏览 · 2026-05-28 10:56:04

东华果汁哥 · 2026-05-28 10:56:04 发布

前言

很多人在部署 Qwen3.5、Qwen3.6 时都会遇到一个问题：

明明用户输入是中文，但模型 <think> 里的思考过程却是英文。

典型现象：

用户：请分析水泥熟料强度下降原因

<think>
The user asks about clinker strength reduction...
Need to analyze possible factors...
</think>

最终回答虽然是中文，但内部 reasoning 却大量使用英文。

在：

Agent
Tool Calling
Deep Research
自动规划
多步推理

场景下，这会带来明显问题：

中文 reasoning 不稳定
Tool reasoning 可读性差
中文 Agent 效果下降
企业日志难审计
Prompt 调试困难

本文会系统分析：

为什么 Qwen 会英文思考
Qwen3.5 / Qwen3.6 的 reasoning 机制
vLLM / SGLang / Ollama 下如何强制中文思考
Tool Calling 为什么更容易英文
企业级最稳定方案

一、为什么 Qwen 会英文思考

很多人误以为：

用户输入中文，模型就一定中文思考。

实际上并不是。

大模型内部 reasoning 语言主要受以下因素影响：

因素	影响程度
System Prompt	极高
Chat Template	极高
Tool Calling 模板	高
RLHF 数据	高
模型训练语料	高
User Query	中
推理 Parser	中

1. RLHF 与 CoT 数据偏英文

目前主流 reasoning 数据：

OpenAI 风格 CoT
Hermes
DeepSeek-R1 数据
ToolUse 数据

大部分都偏英文。

因此模型在：

长链推理
Tool planning
Agent reasoning

时，会自然切换到英文。

尤其 coder 模型更明显。

2. Tool Calling 模板通常是英文

例如很多框架默认：

You are a helpful assistant.
You can use tools.
Think step by step.

这会直接诱导模型：

英文 planning
英文 reasoning
英文 tool chain

即使用户说中文。

3. Hermes Parser 会放大英文倾向

很多人启动：

--tool-call-parser hermes

Hermes 的 tool calling 风格本身偏英文生态。

因此：

reasoning 更容易英文
tool 参数分析更容易英文
agent planning 更容易英文

这是很多人忽略的问题。

二、Qwen3.5 / Qwen3.6 的 reasoning 机制

Qwen3.5 和 Qwen3.6 的 reasoning 本质：

用户输入
→ Chat Template
→ System Prompt
→ CoT / Reasoning
→ Tool Planning
→ Final Answer

其中：

<think> 并不是独立模型
reasoning language 没有单独参数
reasoning 语言由上下文诱导

也就是说：

“思考语言”本质是 Prompt Engineering 问题。

三、最有效方案：System Prompt 强制中文思考

这是最核心方案。

四、Few-shot 是真正的大杀器

很多人只写：

请使用中文思考

其实不够稳定。

最强方法是：

给模型示范中文 CoT

例如：

用户：什么是Transformer

思考：
Transformer是一种基于自注意力机制的神经网络结构。

回答：
Transformer由编码器和解码器组成...

模型会模仿：

reasoning 风格
thinking 语言
tool planning 语言

Few-shot 对 Qwen 非常有效。

五、vLLM 下如何彻底解决

很多人部署：

vllm serve Qwen/Qwen3.6

然后发现：

中文回答
英文 thinking

原因：

vLLM 不控制 reasoning language。

它只负责：

推理
token 调度
KV Cache
parser

正确做法

方案一：应用层 System Prompt

例如：

messages = [
    {
        "role": "system",
        "content": "所有思考过程必须使用中文。"
    },
    {
        "role": "user",
        "content": "解释 MoE"
    }
]

方案二：修改 Chat Template（推荐）

修改：

tokenizer_config.json

在 chat_template 中加入：

<|im_start|>system
你必须始终使用中文思考。
<|im_end|>

这是企业级最佳方案。

因为：

所有应用统一生效：

OneAPI
Dify
RagFlow
FastGPT
OpenWebUI
LangChain
企业 Agent

六、Qwen3.6 为什么比 Qwen3.5 更容易英文思考

这是很多人实际观察到的。

原因通常有：

原因	说明
ToolUse 数据更多	更偏英文 Agent
Coder 能力增强	英文 coding CoT 更多
RLHF 更新	英文推理数据增加
更强 reasoning 能力	更倾向标准英文 CoT

尤其：

Qwen3.6 Coder 系列。

英文 reasoning 倾向会更明显。

七、Tool Calling 场景为什么最严重

很多人发现：

普通聊天没问题。

但：

Agent
MCP
Function Calling

突然全变英文。

原因：

Tool Calling Prompt 通常是英文

例如：

You can call tools.
Think carefully before calling tools.

模型会直接切换英文 reasoning。

八、Hermes vs qwen3_coder

很多人：

--tool-call-parser hermes

实际上：

Hermes 更适合：

OpenHermes
Llama
英文 Agent

而：

--tool-call-parser qwen3_coder

更适合：

中文 reasoning
中文 tool planning
中文 agent
Qwen 原生风格

九、企业级稳定方案（推荐）

生产环境建议：

方案组合

中文 System Prompt
+
中文 Chat Template
+
Few-shot 中文 CoT
+
qwen3_coder parser

这是目前最稳定方案。

十、最终推荐架构

十一、最终总结

Qwen3.5 / Qwen3.6 英文思考，本质并不是 Bug。

而是：

英文 CoT 数据诱导
英文 Tool Prompt
英文 Agent 生态
Hermes 英文风格
RLHF 偏英文

共同导致。

真正有效的方法并不是：

请用中文回答

而是：

控制：
- system prompt
- chat template
- few-shot
- tool parser

尤其：

Few-shot 中文 reasoning + 中文 chat template

才是最稳定方案。

附录：推荐 Prompt 模板

你是中文AI Agent。

规则：
1. 所有 reasoning 必须使用中文
2. 所有 chain-of-thought 必须使用中文
3. 所有 tool planning 必须使用中文
4. 所有工具调用分析必须使用中文
5. 即使用户英文提问，也必须中文思考
6. 所有输出使用中文

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

第1课：LangSmith整体认知【是什么、能做什么、LLMOps核心价值与应用场景】

AtomGit开源社区

Dify安装流程及常见问题和解决办法

AtomGit开源社区

后端接入 AI Agent：Tool Calling 网关、幂等与审计日志实战

AtomGit开源社区

所有评论(0)

查看更多评论

东华果汁哥

@u013421629

已为社区贡献1条内容

【Qwen3.6 中文思考】Qwen3.5 / Qwen3.6 思考过程（Reasoning）为什么总是英文？完整解决方案

东华果汁哥

前言

一、为什么 Qwen 会英文思考

1. RLHF 与 CoT 数据偏英文

2. Tool Calling 模板通常是英文

3. Hermes Parser 会放大英文倾向

二、Qwen3.5 / Qwen3.6 的 reasoning 机制

三、最有效方案：System Prompt 强制中文思考

推荐加强版 Prompt

四、Few-shot 是真正的大杀器

给模型示范中文 CoT

五、vLLM 下如何彻底解决

正确做法

方案一：应用层 System Prompt

方案二：修改 Chat Template（推荐）

六、Qwen3.6 为什么比 Qwen3.5 更容易英文思考

七、Tool Calling 场景为什么最严重

Tool Calling Prompt 通常是英文

八、Hermes vs qwen3_coder

推荐配置

九、企业级稳定方案（推荐）

方案组合

十、最终推荐架构

推荐等级 S

十一、最终总结

附录：推荐 Prompt 模板

所有评论(0)

东华果汁哥

【Qwen3.6 中文思考】Qwen3.5 / Qwen3.6 思考过程（Reasoning）为什么总是英文？完整解决方案

东华果汁哥

前言

一、为什么 Qwen 会英文思考

1. RLHF 与 CoT 数据偏英文

2. Tool Calling 模板通常是英文

3. Hermes Parser 会放大英文倾向

二、Qwen3.5 / Qwen3.6 的 reasoning 机制

三、最有效方案：System Prompt 强制中文思考

推荐加强版 Prompt

四、Few-shot 是真正的大杀器

给模型示范中文 CoT

五、vLLM 下如何彻底解决

正确做法

方案一：应用层 System Prompt

方案二：修改 Chat Template（推荐）

六、Qwen3.6 为什么比 Qwen3.5 更容易英文思考

七、Tool Calling 场景为什么最严重

Tool Calling Prompt 通常是英文

八、Hermes vs qwen3_coder

推荐配置

九、企业级稳定方案（推荐）

方案组合

十、最终推荐架构

推荐等级 S

十一、最终总结

附录：推荐 Prompt 模板

所有评论(0)

温馨提示：您尚未绑定手机号

东华果汁哥