从零手把手用本地Ollama + GPT-OSS搭建AI Agent Harness：完全离线、私有、零成本让AI真正“永动机”干活

紫微AI

1064人浏览 · 2026-03-15 07:32:45

紫微AI · 2026-03-15 07:32:45 发布

最近AI Agent圈子又卷起来了。ChatGPT/Claude生成的代码再牛，一断网就哑火，API费用一跑就心疼，上下文一长就忘事儿。很多人试了半天，最后还是“一次性聊天机器人”。

但现在不一样了！OpenAI官方在2025年开源了GPT-OSS（gpt-oss:20b / 120b），专门为agentic任务设计，推理、工具调用、结构化输出全拉满。再配合Ollama本地部署，你就能在自己电脑上搭建一个完全离线、私有、无限token、零API费用的编码Agent。

今天就手把手带你从零搭建本地GPT-OSS Agent Harness。1小时上手，直接跑一个“写代码→测代码→自动修复→直到全绿”的完整编码Agent。用了之后你会感叹：原来AI Agent可以这么稳、这么香！

核心概念：Agent Harness + 本地GPT-OSS = 真正生产力

Harness不是框架，而是给模型套上的“全套马具”：

Docker沙盒执行环境
跨会话状态持久化（Git + JSON进度文件）
工具调用循环 + 强制测试验证

GPT-OSS的最大优势：

原生支持工具调用（function calling超稳）
本地运行：24GB内存就能跑20B版本，隐私100%不泄露
无限上下文迭代：不用担心token费用，想跑100轮就100轮

没有Harness，GPT-OSS再强也只是“聊天机器人”；有了它，它就能真正像程序员一样干活：创建项目、写代码、跑pytest、看到报错自己修，直到测试全绿才收工。

前置准备（5分钟搞定）

安装Ollama（官网一键安装：https://ollama.com）

拉取GPT-OSS模型（推荐本地用20B版本）：

ollama pull gpt-oss:20b   # 适合普通笔记本/台式机
# 如果你有强显卡，可换120B：ollama pull gpt-oss:120b

启动Ollama服务：终端输入 ollama serve（保持后台运行）

从零搭建：三步实现完整本地Harness（附完整可运行代码）

我们做一个本地编码Agent：输入需求，它自动创建项目、写代码、跑测试、迭代修复，直到通过。整个过程100%本地。

步骤1：Docker沙盒环境（隔离执行，防止本地崩）

# Dockerfile.agent
FROM python:3.11-slim
RUN pip install --no-cache-dir pytest requests
WORKDIR /workspace
CMD ["bash"]

构建：

docker build -t agent-harness:latest .

步骤2：定义工具接口（GPT-OSS原生支持）

TOOLS = [
    {
        "type": "function",
        "function": {
            "name": "run_command",
            "description": "在Docker沙盒里执行shell命令",
            "parameters": {
                "type": "object",
                "properties": {
                    "command": {"type": "string"},
                    "timeout": {"type": "integer", "default": 30},
                    "description": {"type": "string"}
                },
                "required": ["command", "description"]
            }
        }
    },
    {
        "type": "function",
        "function": {
            "name": "task_complete",
            "description": "任务全部完成时调用，带总结",
            "parameters": {"type": "object", "properties": {"summary": {"type": "string"}}}
        }
    }
]

步骤3：核心执行循环（完整代码，直接复制运行）

agent_harness_local.py（本地GPT-OSS版）：

import json
import subprocess
from openai import OpenAI   # 用OpenAI兼容接口，最稳

# 本地Ollama配置（关键改动在这里！）
client = OpenAI(
    base_url="http://localhost:11434/v1",  # Ollama本地API
    api_key="ollama"                       # 随便填，Ollama不需要真实key
)
MODEL = "gpt-oss:20b"   # 换成gpt-oss:120b也可以

# 1. 初始化器（项目启动）
def initializer_setup(project_name: str, goal: str):
    workspace = f"./workspaces/{project_name}"
    subprocess.run(["mkdir", "-p", workspace])
    
    features = {"features": [{"category": "core", "description": goal, "steps": [], "passes": False}]}
    with open(f"{workspace}/feature_list.json", "w") as f:
        json.dump(features, f, indent=2)
    
    with open(f"{workspace}/harness-progress.txt", "w") as f:
        f.write(f"项目启动: {goal}\n")
    
    subprocess.run(["git", "init"], cwd=workspace)
    print("✅ 本地项目初始化完成！")

# 2. Agent执行循环（最核心）
def run_agent_session(workspace: str, user_prompt: str, max_iterations=30):
    messages = [{"role": "system", "content": "你是本地编码Agent。每次只做一件事，完成后用task_complete总结。严格按测试结果迭代。"}]
    messages.append({"role": "user", "content": user_prompt})
    
    for i in range(max_iterations):
        resp = client.chat.completions.create(
            model=MODEL,
            messages=messages,
            tools=TOOLS,
            tool_choice="auto"
        )
        msg = resp.choices[0].message
        
        if msg.tool_calls:
            for tc in msg.tool_calls:
                name = tc.function.name
                args = json.loads(tc.function.arguments)
                
                if name == "run_command":
                    cmd = args["command"]
                    # Docker沙盒执行（完全本地）
                    result = subprocess.run(
                        ["docker", "run", "--rm", "-v", f"{workspace}:/workspace", 
                         "agent-harness:latest", "bash", "-c", cmd],
                        capture_output=True, text=True, timeout=args.get("timeout", 30)
                    )
                    tool_result = {
                        "exit_code": result.returncode,
                        "stdout": result.stdout,
                        "stderr": result.stderr
                    }
                
                elif name == "task_complete":
                    print("🎉 任务完成！总结：", args["summary"])
                    return
                
                # 把执行结果塞回上下文（GPT-OSS记忆超强）
                messages.append({"role": "tool", "tool_call_id": tc.id, "content": json.dumps(tool_result)})
                
                # 加载历史进度（跨会话记忆）
                with open(f"{workspace}/harness-progress.txt", "r") as f:
                    progress = f.read()
                messages.append({"role": "system", "content": f"历史进度：\n{progress}"})

# 使用示例
if __name__ == "__main__":
    project = "text-normalizer"
    initializer_setup(project, "写一个Python文本标准化工具，要求包含6个pytest测试用例")
    run_agent_session(f"./workspaces/{project}", "开始实现核心功能")

运行命令：

python agent_harness_local.py

你会看到GPT-OSS本地模型自己创建文件 → 跑pytest → 报错自动修复 → 再跑，直到全部通过，最后调用task_complete结束。整个过程零网络、零费用！

关键洞察：为什么本地GPT-OSS + Harness这么强

GPT-OSS原生agentic能力：OpenAI专门为工具调用、迭代推理优化，比很多开源模型稳得多。
无限迭代不心疼：本地跑，想跑50轮就50轮，不用担心API费用。
隐私安全：所有代码、数据都在你电脑上，适合企业/个人敏感项目。
初始化器 + 进度文件：彻底解决“忘事儿”问题，GPT-OSS能精准记住上一次做到哪一步。

实测下来，原来要10轮才成功的任务，现在本地5-6轮就稳了，而且完全离线。

实际应用 & 开发者启发

日常coding：把需求丢进去，喝杯咖啡回来就是一个带完整测试的项目。
多Agent协作：再起一个Reviewer Agent，Harness统一管状态和进度。
进阶玩法：接本地浏览器自动化（Playwright）、数据库工具，甚至本地向量数据库做RAG。
省钱小技巧：先用gpt-oss:20b验证逻辑，再上120B做最终生成。Half-Kelly思路，先小任务验证Harness稳定性。

想更进一步？直接去Ollama官网看GPT-OSS文档，或者fork Anthropic开源的autonomous-coding项目，本地改成gpt-oss:20b即可。

总结

AI Agent的未来不是更贵的云API，而是本地GPT-OSS + 靠谱Harness。它把“运气”彻底变成工程：本地初始化、进度持久化、Docker执行、强制验证、循环迭代。

照着上面代码跑一遍，你就拥有了自己的完全私有永动机AI程序员。再也不用担心断网、费用、隐私问题了！

装上本地Harness，GPT-OSS就真能干活了！

紫微AI推荐18篇 Harness 精讲

深度综述：Effective Harnesses for Long-Running Agents

2026年AI Agent 的真相，模型成了可互换的引擎，Harness 才是决定 Agent 能不能真正落地的产品

控制论重生：Harness Engineering 才是真正的未来工程师工作

Harnesses & Agent Frameworks 敢诚实回答这个问题的人，从瞎试工具的一人公司，真正变成知道怎么选、怎么用、怎么赚钱的“智能生意人”。

AI Agent 的成功秘诀：Harness 才是产品，模型只是引擎
 Harnesses & Agent Frameworks 敢诚实回答这个问题的人，从瞎试工具的一人公司，真正变成知道怎么选、怎么用、怎么赚钱的“智能生意人”。
AI Agent 的成功秘诀：Harness 才是产品，模型只是引擎
 Agent Harness 工程实战：文件系统、沙箱、Ralph Loop 与 Middleware 生产级实现（附完整代码）

AI Agent 的核心秘密：不是大模型，而是 Harness 工程

别再试图让 Agent 适应你的代码库，而是让代码库和流程适应 Agent。AI Coding Agent 时代，工程师不再是“码农”？Harness Engineering 实战 playbook

训练环境决定 AI Agent 天花板：Harness 如何塑造 RL 训练循环

AI Agent 时代，模型只是“基础设施”，Harness 才是你真正的产品

从零手把手用本地Ollama + GPT-OSS搭建AI Agent Harness：完全离线、私有、零成本让AI真正“永动机”干活

LLM Agent 非法动作频发？Google DeepMind 用 AutoHarness 自动生成代码“安全带”，小模型直接反超大模型！

Harness 才是王道：为什么 3 个工程师能月产百万行代码，而你的 Agent 还在原地打转？

AI Agent 的本质不是模型，而是流程设计：Harness 才是真正的王牌（实战篇）

大多数开发者以为 AI Agent 拼的是模型能力，但 Anthropic 最新实验告诉你：真正决定成败的是「生成-评估」分离的 Harness 设计

用AI自主开发完整App时，你是不是也卡在“代码看着行、实际一用就崩”？Anthropic的Harness设计给出答案

我是紫微AI，我们下期见。
（完）

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

【EI复现】基于元模型优化算法的主从博弈多虚拟电厂动态定价和能量管理(Matlab代码实现）

基于元模型的优化算法是一种基于历史数据来驱动样本点的加入从而逼近局部或全局最优解的优化机制，能够改善传统启发式智能算法需要繁复数值模拟的缺陷，目前在飞行器设计等航空航天领域的应用[20]最为广泛，在电力系统方面也有初步的应用。提出基于 Kriging 元模型的博弈均衡算法，在求解过程中建立 Kriging 元模型替代 VPP 内部的能量管理模型，利用粒子群优化算法搜索优异采样点，更新修正 Krig

AtomGit开源社区

蒙特卡洛风光场景并通过削减法聚类法得到几个典型场景（包含Matlab代码和Python代码实现）

蒙特卡洛方法是一种基于随机抽样的数值计算方法，通过多次随机抽样来估计系统的行为，从而得到系统的统计性质。在风光模型中，蒙特卡洛方法可以用来模拟风速、风向和太阳光照的变化，进而评估风力和太阳能系统在不同条件下的性能。

AtomGit开源社区

完全免费、绿色免安装的Windows轻量级硬件检测工具，零依赖查看电脑配置

📌 摘要：推荐一款免费免安装的Windows硬件检测工具SysView，单文件便携、零依赖，兼容Win7/10/11系统。支持一键读取CPU、内存、显卡等硬件参数，无广告、不上传隐私。特点包括毫秒级启动、纯本地运行、无需管理员权限，适合普通用户、DIY玩家及运维人员。开源项目，提供32/64位版本下载，点击即用，彻底关闭无残留。 🔗 核心优势： ✅ 永久免费无阉割 ✅ 绿色免安装，U盘随身带