揭秘YC总裁开源的顶级Claude工作流：给你的项目做一套 MBTI 测试

Imd11

439人浏览 · 2026-03-20 06:12:58

Imd11 · 2026-03-20 06:12:58 发布

YC 总裁 Garry Tan 最近开源了自己的 Claude Code 工作流仓库 gstack。这个项目的核心，在于把产品讨论、工程评审、浏览器测试、发版和复盘整理成了一套可重复调用的 skill 流程。到 3 月 20 日，仓库在 GitHub 上已经来到约 27.4k stars、3.3k forks，采用 MIT 许可。

r/machinelearningnews - Garry Tan Releases gstack: An Open-Source Claude Code System for Planning, Code Review, QA, and Shipping

gstack 文档里给出的完整生命周期是：

office-hours → plan → implement → review → QA → ship → retro

从结构上看，它大致可以分成四层：

第一层，确定要做什么：/office-hours、/plan-ceo-review。第二层，确定怎么做：/plan-eng-review、/plan-design-review、/design-consultation。第三层，检查有没有问题：/review、/browse、/qa、/qa-only、/design-review、/investigate。第四层，收尾和沉淀：/ship、/document-release、/retro。

1. `/office-hours`：项目起点

/office-hours 放在整个流程的最前面。skills 文档中提到，每个项目都应该从这里开始。它的作用是在进入编码前，先把项目方向、用户、需求、切入口讲清楚，并把讨论结果写成 design doc，保存到 ~/.gstack/projects/ 供后续命令继续使用。

这个命令有两种模式。 Startup mode 面向创业项目和商业化产品，更关注需求强度、替代方案、切口和趋势。 Builder mode 面向 side project、开源和实验项目，更关注什么版本最适合快速展示和验证。

它适合放在项目一开始，用来完成方向收敛。

2. `/plan-ceo-review`：从功能描述推进到产品任务

/plan-ceo-review 对应 founder / CEO 视角。它处理的问题，是“功能描述”和“真实产品任务”之间的差距。文档中列出了四种 review 模式：Scope Expansion、Selective Expansion、Hold Scope、Scope Reduction。

这个命令的重点是继续追问功能背后的目标。例如一个看起来普通的功能需求，在这里会被重新理解为更完整的产品任务，再决定应该扩展、收缩还是保持当前范围。

它适合放在产品定义阶段，用来提高需求表达的质量。

3. `/plan-eng-review`：工程可行性收敛

当产品目标已经明确，下一步就是工程 review。/plan-eng-review 对应 Eng Manager 视角，重点检查 Architecture、Code Quality、Tests、Performance 等内容。相关 skill 文档提到，它会控制每个部分的高优先级问题数量，避免 review 失控。

它主要处理这些问题：

架构边界
同步与异步流程
错误处理与重试
状态持久化
性能瓶颈
测试覆盖路径

这一层的作用，是把“可以想象”变成“可以落地”。

4. `/plan-design-review` 与 `/design-consultation`：设计方案审查与方向咨询

这两个命令都属于设计阶段，但用途不同。

/plan-design-review 面向已有 plan。它会从设计师视角审查方案，检查信息架构、关键状态、交互路径、文案层级和视觉完整性，并推动 plan 进一步完善。

/design-consultation 更适合项目早期，用来讨论整体视觉方向、产品气质和设计语言。它适合那些还没有明确风格、需要先定设计方向的项目。

前者偏“审方案”，后者偏“定方向”。

5. `/review`：上线前的工程风险检查

/review 是 gstack 里很重要的一个命令。README 建议用户在有代码变更的分支上优先运行它。

它关注的是一些开发阶段不一定明显、但线上代价很高的问题，例如：

N+1 查询
race conditions
stale reads
trust boundary 问题
缺索引
escaping 问题
错误恢复逻辑
关键故障模式缺少测试覆盖

对于已经完成编码、准备提 PR 或上线的分支，这一步非常关键。

6. `/browse`：浏览器能力

/browse 为 agent 提供真实浏览器能力。顶层 SKILL.md 将其描述为一个快速 headless browser，CLAUDE.md 也建议在浏览器交互相关任务中优先使用它。

它可以完成：

打开页面
点击和填表单
截图
检查控制台
走完整个用户路径

文档显示，它底层基于持久化 Chromium daemon 和 Playwright，目标是让浏览器交互更快、更稳定，同时保留 session 状态。

对 Web 项目来说，这一步很重要，因为它让 agent 能直接看到页面，而不是依赖猜测。

7. `/qa` 与 `/qa-only`：测试阶段

/qa 基于浏览器能力对 Web 应用做系统化测试，并可在发现问题后进入修复循环。qa/SKILL.md 里写到，它支持 Quick、Standard、Exhaustive 三档深度。

它适合处理：

页面流程测试
表单与交互验证
bug 发现与重新验证
staging 环境测试

/qa-only 则更保守一些，只输出 bug 报告，不自动改代码。README 中将它单独列为一个可用 skill。

如果希望先获得问题列表，再决定是否修复，/qa-only 更合适。

8. `/design-review`：上线后的视觉审查

/design-review 面向 live site，重点检查真实页面的布局、层级、间距、状态覆盖和交互细节。它处理的是“功能已经出来，但页面质感还不够稳定”的问题。

这一步适合放在功能完成之后，用来补齐视觉和体验层面的细节。

9. `/setup-browser-cookies` 与 `/investigate`：测试登录态与问题调查

/setup-browser-cookies 的作用比较直接：把真实浏览器里的登录态导给测试浏览器，方便后续执行 /browse 和 /qa，尤其适合后台、会员和多权限页面。

/investigate 则面向问题调查阶段。它适合在 bug 已经出现、根因尚不明确时使用，帮助 agent 从“发现异常”进入“定位原因”。

10. `/ship`、`/document-release`、`/retro`：收尾与沉淀

/ship 负责发版流程，包括测试、分支检查、PR 更新等最后一公里动作。文档还提到，如果项目缺少成型的测试体系，它还会尝试补充基础测试和 CI。

/document-release 用来同步更新文档，例如 README、命令说明和项目结构，减少代码变了而文档没有跟上的情况。

/retro 则面向周度复盘。它会分析提交、节奏、测试变化和热点区域，把开发过程沉淀为可回看的记录。

结语

从命令设计上看，gstack 的重点不是增加更多“能力点”，而是把开发过程拆成多个阶段，让模型在不同阶段承担不同职责。产品定义、工程审查、浏览器测试、设计检查、发版和复盘，这些以前常常分散在个人经验里的动作，在这里被写成了一套明确的工作流。

如果只是快速浏览这个仓库，最值得优先理解的，是它的命令分工和整条链路。把每个命令放回到对应阶段，再去试用，理解成本会低很多。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

【EI复现】梯级水光互补系统最大化可消纳电量期望短期优化调度模型（Matlab代码实现）

文献来源：摘要：充分发挥流域梯级水电的调节作用，实现梯级水光系统的互补联合发电是促进清洁能源消纳的重要途径。文中考虑光伏出力不确定性，以整体可消纳电量期望最大为目标，提出了梯级水光互补系统的短期优化调度模型。该模型以机组为最小调度单位，精细化建模了电站约束、机组约束以及电网约束，通过梯级负荷在电站和时段间的合理调配，挖掘梯级水电的电网供电支撑和光伏互补协调双重作用，提升互补系统整体消纳水平。