## 第一步:诊断,不急着动手

一开始我没有直接改任何东西,先跑了几个命令看清现状:

```bash
# 1. 看模型在不在
ollama list                    # qwen3.5:9b ✅ 已安装
curl localhost:11434           # Ollama 服务 ✅ 在运行

# 2. 看 GPU 有没有用
journalctl -u ollama | grep GPU   # RTX 3070 ✅ 已识别

# 3. 看 OpenClaw 认不认识这个模型
openclaw models list           # ollama/qwen3.5:9b ✅ 在列表里
openclaw models status         # 发现:模型在列表里,但没配置为可用
```

**关键发现:** 模型在插件扫描列表里,但 `models.json` 里 `providers` 是空的。

## 第二步:让它"可用"

之前所有失败的尝试都是直接改 JSON 文件,然后就被 Gateway 重启覆盖了。

这次换了方法——**用 CLI 命令,不动 JSON 文件**:

```bash
# 把本地模型加到 agent 可用列表,不改默认模型
openclaw config set agents.defaults.models \
  '{"deepseek/deepseek-v4-flash":{"alias":"DeepSeek"},
    "ollama/qwen3.5:9b":{"alias":"Qwen本地"}}' \
  --strict-json --merge
```

这条命令的魔力:**`--merge` 合并模式**,只加不删,DeepSeek 不受影响。

## 第三步:解决回复截断问题

模型能用了但回复只有几个字,查 Ollama 日志发现:

```
truncated = 1  → 输出被截断
maxTokens = 4096  → 思考过程就把预算吃光了
```

做了两个改动:

```bash
# 1. 关掉 thinking(思考过程太占 token)
# 2. 增大 num_ctx 到 65536(64K 上下文)
openclaw config set agents.defaults.models \
  '{"ollama/qwen3.5:9b":{
    "alias":"Qwen本地",
    "params":{"num_ctx":65536,"thinking":false}
  }}' \
  --strict-json --merge
```

## 第四步:解决说明书太重的问题

即使模型能回完整了,在 Dashboard 里聊还是会越聊越差。查日志发现每次请求都带 ~19K 的系统提示(说明书),小模型读累了就不好好回。

```bash
openclaw config set agents.defaults.experimental.localModelLean true
```

把说明书从 19K 砍到 12K,模型轻松了。

## 核心方法总结

| 以前失败的做法 | 这次成功的做法 |
|---|---|
| 直接编辑 openclaw.json | **用 `openclaw config set` CLI 命令** |
| 改完重启被覆盖 | CLI 命令改的不会被覆盖 |
| 想一口气全搞定 | **每改一步验证一步** |
| 改了不确认效果 | 每次改完重启,马上测 |
| 一次性动了太多东西 | **不动 DeepSeek,只加不删** |

**最关键的一步其实就是:不用手改 JSON,用 CLI 命令。** 之前所有失败都是因为那一条。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐