推荐搞 Agent 的把这个 4 万 Star 的 GitHub 项目研究透

小马不会过河

467人浏览 · 2026-04-28 21:51:04

小马不会过河 · 2026-04-28 21:51:04 发布

2026 年了，人人都想造一个自己的 AI Agent。

不需要从零开始踩坑，不需要从头造轮子。

今天推荐的开源项目已经把 Agent 底层架构打磨得非常干净了。如果你想开发属于自己的 Agent，这个项目值得研究透彻。

它就是 pi-mono。

OpenClaw 的核心运行时，就是基于 Pi 的 SDK 构建的。

OpenClaw 的 README 里直接写了：特别感谢 Mario Zechner 的支持以及 pi-mono。

Pi-mono 也借 OpenClaw 的成功一路冲到了 4 万 GitHub Star。

对于一个底层工具链项目来说已经很猛了。

那 OpenClaw 为什么选 Pi 做底层？

因为 Pi 做到了一件极难的事：极致极简，却又不失强大。今天就来拆解一下，它到底做对了什么。

项目简介

pi-mono 是一个 TypeScript 单仓项目，专门用来构建 AI Agent 和管理 LLM 部署。

核心产品叫 Pi，是一个跑在终端里的编程 Agent，你可以在项目目录里直接用它读文件、写文件、编辑代码、执行命令。

它的作者是 Mario Zechner，网名 badlogic，libGDX 游戏框架的作者。他在 AI Engineer London 上做过一个演讲。

标题就叫：我讨厌每一个 Coding Agent，所以我自己写了一个。

挺霸气的。

开源地址：github.com/badlogic/pi-mono

Pi 的极简哲学

Pi 和其他 Coding Agent 最大的区别，在于它的设计哲学。

大多数 Agent 工具恨不得把所有功能都塞进去：MCP 支持、子 Agent、Plan 模式、权限弹窗、内置 Todo。

功能列表越来越长，但你用的可能不到三分之一。

Pi 反着来。

它的核心只有四个工具：read、write、edit、bash。系统提示词不到 1000 个 token，是所有主流 Agent 里最短的。

它刻意没有内置这些：

没有 MCP
没有子 Agent
没有权限弹窗
没有 Plan 模式
没有内置 Todo
没有后台 Bash

这些功能不是做不了，而是让你通过 Extensions、Skills、Packages 按需扩展。

Pi 的理念是：让工具适应你的工作流，而不是让你适应工具。

说白了，Pi 给你一个干净的内核，剩下的你自己搭。不想搭也行，装别人做好的包就行。

这也是为什么 OpenClaw 选了它，底层足够干净，上面才能搭出足够复杂的东西。

架构拆解，七个包各司其职

pi-mono 把 Agent 开发需要的每一层都拆成了独立的 npm 包，你需要哪层用哪层：

pi-ai：统一的多提供商 LLM API。

一个接口对接 20 多个 LLM 提供商，包括 OpenAI、Anthropic、Google、Azure、Kimi、MiniMax、Hugging Face 等等。

你不需要关心每个提供商的 API 差异，pi-ai 帮你抹平了。

这个包完全可以单独拿出来用。

pi-agent-core：Agent 运行时。

负责工具调用循环、状态管理、上下文维护这些核心逻辑。只依赖 pi-ai，非常轻量。

pi-coding-agent：终端编程 Agent 主产品。

就是那个 pi 命令行工具，包含完整的会话管理、扩展系统、UI 渲染。

它也暴露了 SDK，OpenClaw 就是通过这个 SDK 把 Pi 嵌入到自己的网关里的。

pi-tui：终端 UI 库，差分渲染引擎。你在终端里看到的那些漂亮的界面就是它画的。

pi-web-ui：Web 端的聊天组件。如果你想在浏览器里做一个 AI 对话界面，直接用就行。

pi-mom：Slack 机器人。把 Pi 接到 Slack 里，频道消息自动委托给 Pi Agent 处理。

pi-pods：管理 vLLM 在 GPU Pod 上的部署。如果你要跑自己的模型，这个包帮你在远程 GPU 上管理推理服务。

重点来了，这七个包每一个都可以独立使用。

你不需要用整个 Pi，只用 pi-ai 来统一 LLM 调用也行，只用 pi-agent-core 来搭自己的 Agent 运行时也行。这就是模块化设计的威力。

有几个特性

① 20+ LLM 提供商统一接入

一个 API 对接 20 多个提供商，支持两种认证方式：API Key 和 OAuth 订阅登录。

你可以直接用 Anthropic Claude Pro/Max、OpenAI ChatGPT Plus、GitHub Copilot 的订阅来跑 Pi，不用单独买 API 额度。

切换模型也很方便，Ctrl+L 直接呼出模型选择器，Ctrl+P 在多个模型之间快速轮换。

② Sessions 树状分支

Pi 的会话是用 JSONL 文件存的，每个条目有 id 和 parentId，形成树状结构。

你可以在对话中的任意历史节点分叉出去探索新方向，所有历史都保留在一个文件里。

输入 /tree 可以看到完整的对话树，折叠、展开、搜索、跳转都支持。像 Git 一样管理对话历史，这个设计真的挺巧妙的。

③ Extensions 扩展机制

用 TypeScript 写扩展，可以自定义工具、命令、快捷键、UI 组件，甚至可以替换内置工具。

你还可以通过扩展添加自定义的 LLM Provider。

社区里有人做了一个 Doom 扩展，在等待 Agent 回复的时候可以在终端里打 Doom，非常离谱但确实能跑。

④ Skills 技能系统

遵循 Agent Skills 标准，一个 Markdown 文件就是一个技能。零代码就能扩展 Agent 的能力。

⑤ Pi Packages 生态

把你的扩展、技能、提示词模板、主题打包成 npm 包，一行命令安装：

pi install npm:@foo/pi-tools
pi install git:github.com/user/repo

还有 pi.dev/packages 画廊页面展示社区包。

⑥ 四种运行模式

除了默认的交互式终端模式，Pi 还支持 Print/JSON 模式，非交互输出、RPC 模式，通过 stdin/stdout 做 JSON-RPC 通信，方便其他进程集成、以及 SDK 模式，

SDK 模式就是作为库嵌入到你自己的应用里，OpenClaw 就是这么用的。

⑦ 上下文压缩

长会话会把上下文窗口撑爆。

Pi 支持自动和手动两种压缩方式，把旧消息总结精简，最近的对话保持原样。

完整历史还在文件里，随时可以通过 /tree 回溯。

5 分钟上手

安装就一行命令：

npm install -g @mariozechner/pi-coding-agent

然后设置 API Key：

export ANTHROPIC_API_KEY=sk-ant-...pi

或者直接用订阅登录：

pi# 输入 /login，选择提供商，浏览器里完成授权

启动后就是一个交互式终端界面。直接打字对话就行，输入 @ 可以模糊搜索项目文件引用，输入 ! 加命令可以直接跑 bash 并把结果发给 LLM。

几个常用快捷键：

Ctrl+L：切换模型
Ctrl+P：在多个模型间轮换
Shift+Tab：切换思考等级
Escape 按两次：打开对话树

想装社区包的话：

pi install npm:包名

想写自己的扩展，在 ~/.pi/agent/extensions/ 目录下创建一个 .ts 文件就行。

快去试试

和 Claude Code 比，Pi 更极简更可定制。它是终端原生工具，不是 IDE 插件。

更轻量，也更透明，Pi 不会背着你偷偷往系统提示词里塞东西。

如果你是一个 Agent 开发者，想基于成熟的底层搭自己的产品，那 Pi 的 SDK 和 pi-ai 包就是为你准备的。

OpenClaw 已经证明这条路走得通。

如果你就是追求透明、不想用黑箱工具，Pi 的系统提示词不到 1000 token，所有行为你都能看到。

4 万 Star 不是白来的。

Pi 的社区有几个挺有意思的地方：

贡献机制很独特，新贡献者的 Issue 和 PR 默认自动关闭，维护者每天审核后重新打开有价值的。

通过 lgtmi 和 lgtm 两个等级晋升，拿到 lgtm 才能提交 PR。

唯一的规则就一条：你必须理解你的代码。用 AI 写代码可以，但不理解就提交不行。

还有 OSS Session 分享计划。

Mario 鼓励用户把真实的编程会话数据发布到 Hugging Face，包含完整的工具调用、失败和修复过程。

他认为这种真实数据比玩具基准测试有价值得多。

他自己也在 Hugging Face 上公开了 627 条以上的 pi-mono 工作会话。

Pi-mono 把核心做到极致精简，然后通过扩展机制让生态自然生长。

OpenClaw 的成功就是最好的证明。

最简洁的底层，支撑起了最复杂的应用。

如果你 2026 年想造自己的 Agent，不要从零开始。

先把 pi-mono 吃透，看看别人是怎么把 Agent 的每一层抽象做干净的，然后再决定自己要在哪一层创新。

站在巨人的肩膀上，比从地上爬起来快多了。

学AI大模型的正确顺序，千万不要搞错了

🤔2026年AI风口已来！各行各业的AI渗透肉眼可见，超多公司要么转型做AI相关产品，要么高薪挖AI技术人才，机遇直接摆在眼前！

有往AI方向发展，或者本身有后端编程基础的朋友，直接冲AI大模型应用开发转岗超合适！

就算暂时不打算转岗，了解大模型、RAG、Prompt、Agent这些热门概念，能上手做简单项目，也绝对是求职加分王🔋

在这里插入图片描述

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料，手把手帮你快速入门！👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型（GPT、文心一言等）特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架（LangChain等）实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块，看似清晰好上手，实则每个部分都有扎实的核心内容需要吃透！

我把大模型的学习全流程已经整理📚好了！抓住AI时代风口，轻松解锁职业新可能，希望大家都能把握机遇，实现薪资/职业跃迁～

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

在这里插入图片描述

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

【切负荷】计及切负荷和直流潮流(DC-OPF)风-火-储经济调度模型研究【IEEE24节点】(Python代码实现)

【切负荷】计及切负荷和直流潮流(DC-OPF)风-火-储经济调度模型研究【IEEE24节点】

AtomGit开源社区

Prompt工程2026进化论：从提示词到系统设计的完整跃迁

检索增强补充A/B测试框架AI系统的接口设计工程。

AtomGit开源社区

C++20新特性之ranges::sort的使用小结

除了逆序排序，有时我们还需要按照自定义的规则排序。传统方式可能是这样：123456789101112131415161718boolintintb) {// 自定义排序规则returnintmain() {// 传统自定义排序方式// 其他操作...return0;使用 ranges::sort，自定义排序更加直观:1234567891011121314151617intmain() {