本地跑大模型没有好用的界面？试试这个 Ollama GUI 中文版

卡布鲁大怪兽

409人浏览 · 2026-05-21 11:37:26

卡布鲁大怪兽 · 2026-05-21 11:37:26 发布

# Ollama GUI 中文版：一款自带推理监控的本地大模型聊天界面，还能对接 Trae IDE

## 前言

最近在本地跑 Ollama 大模型时，一直在找一个好用的图形界面。原版 [Ollama GUI](https://github.com/HelgeSverre/ollama-gui) 是英文的，而且缺少一些实用功能。于是我基于它做了一个中文增强版，主要新增了 **推理服务监控** 和 **OpenAI 兼容代理**，可以实时追踪 Trae IDE、Continue 等 AI 工具调用本地大模型的情况。

项目已开源：**[https://github.com/yangwenyu-ck/ollama-gui-zh)**

## 这个项目能做什么？

简单来说，它是一个运行在浏览器中的本地大模型聊天界面，但和普通聊天工具不同的是，它还内置了一个 **AI 推理网关**。

### 核心功能

- **多模型聊天** — 自动加载本地已安装的 Ollama 模型，每个对话可绑定不同模型

- **推理服务监控** — 实时查看所有 API 调用日志、推理速度、VRAM 占用

- **用量分析面板** — 统计 Web 聊天的 Token 消耗、对话次数、响应速度

- **系统提示词配置** — 支持全局默认提示和按模型自定义提示

- **对话导入导出** — JSON 格式，方便数据备份

- **深色/浅色主题** — 一键切换

- **Markdown 渲染 + 代码高亮** — AI 回复完美展示

### 最大的亮点：推理服务监控

这是我最想分享的功能。当你用 Trae IDE、Continue、Cursor 等工具调用本地大模型时，你根本不知道：

- 模型被调用了多少次？

- 每次推理花了多长时间？

- Token 的输入输出比例是多少？

- 推理速度是 tok/s 还是更慢？

这个监控面板可以帮你回答所有这些问题。

## 工作原理

项目运行后会提供两个端口：

| 服务 | 地址 | 用途 |

|---|---|---|

| Ollama 原生 API | http://localhost:11434 | Web 聊天界面直接调用 |

| 代理服务 | http://localhost:11435 | 外部工具（Trae、Continue 等）通过此端口调用 |

只需要把 Trae IDE 等工具的 API 地址从 `localhost:11434` 改为 `localhost:11435`，所有调用就会被自动记录，然后在 Web 界面的「推理服务监控」面板中实时查看。

```

┌─────────────────┐ ┌──────────────────┐ ┌─────────────┐

│ Trae IDE │ │ Ollama GUI 中文版 │ │ Ollama │

│ Continue │────▶│ (代理 11435) │────▶│ (11434) │

│ 其他 AI 工具 │ │ 📊 推理监控 │ │ 本地大模型 │

└─────────────────┘ └──────────────────┘ └─────────────┘

```

监控面板能看到什么

- **总调用次数、平均推理速度、总 Token、平均耗时**

- **推理速度趋势图** — 实时折线图

- **按模型统计** — 各模型的调用次数、速度、耗时对比

- **调用日志明细** — 每次调用的模型、输入输出 Token、速度、耗时

- **运行中模型状态** — VRAM 占用、上下文长度、量化级别

## 快速开始

### 环境准备

1. 安装 [Ollama](https://ollama.ai/download)

2. 安装 [Node.js](https://nodejs.org/)（v18+）

### 启动步骤

```bash

# 1. 启动 Ollama

ollama pull qwen2.5-coder:1.5b # 拉取一个模型

ollama serve

# 2. 克隆项目

git clone https://github.com/yangwenyu-ck/ollama-gui-zh.git

cd ollama-gui-zh

yarn install / npm install

# 3. 启动 Web 界面

yarn dev / npm run dev

# 4. 启动代理服务（用于监控外部工具调用）

npm run proxy

```

### 对接 Trae IDE

1. 打开 Trae IDE → 设置 → 模型配置

2. 将 API Base URL 改为 `http://localhost:11435`

3. 正常使用，所有调用会自动被记录

## 也支持 Docker 部署

```bash

docker compose up -d

# 访问 http://localhost:8080

```

## 与其他 Ollama GUI 的对比

| 功能 | 原版 Ollama GUI | Ollama GUI 中文版（本项目） |

|---|---|---|

| 中文界面 | ❌ | ✅ |

| 推理服务监控 | ❌ | ✅ |

| 用量分析 | ❌ | ✅ |

| OpenAI 兼容代理 | ❌ | ✅ |

| 对话导入导出 | ❌ | ✅ |

| 系统提示词配置 | 基础 | 按模型自定义 |

## 写在最后

这个项目是在 [HelgeSverre/ollama-gui](https://github.com/HelgeSverre/ollama-gui) 的基础上二次开发的，原作者做了一个很棒的基础框架，在此表示感谢。

如果你也在本地跑 Ollama，特别是同时用 Trae IDE、Continue 等工具调用本地模型，推荐试试这个中文版，监控面板会让你对本地推理的性能有更清晰的了解。

GitHub 地址：**[https://github.com/yangwenyu-ck/ollama-gui-zh](https://github.com/yangwenyu-ck/ollama-gui-zh)**

欢迎 Star ⭐ 和 Issue 反馈！

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

AtomGit 6 月：AtomCode CodingPlan 上线 GLM-5.2！

AtomGit开源社区

行业 Agent 黑客松圆满收官：打通行业落地“最后一公里”

AtomGit开源社区

openJiuwen 总 Star 突破 3.3 万，与 AtomGit 携手构筑 AI Agent 的开源“生态飞轮”

AtomGit开源社区

所有评论(0)

查看更多评论

卡布鲁大怪兽

@YangWenYu_lala

已为社区贡献1条内容

本地跑大模型没有好用的界面？试试这个 Ollama GUI 中文版

卡布鲁大怪兽

所有评论(0)

温馨提示：您尚未绑定手机号

卡布鲁大怪兽