AI 原生创业四阶段 Playbook：Claude《The Founder’s Playbook》的可执行读法

Joseph Cooper

431人浏览 · 2026-05-16 18:34:57

Joseph Cooper · 2026-05-16 18:34:57 发布

AI 原生创业四阶段 Playbook：Claude《The Founder’s Playbook》的可执行读法

AI 原生创业四阶段 Playbook 封面

文章目录

AI 原生创业四阶段 Playbook：Claude《The Founder’s Playbook》的可执行读法

摘要：AI 把执行门槛降下来了，但创业仍然要一关一关交证据。

我读 Claude 这份 Playbook 时，最想保留的不是工具清单，而是它对创始人角色的提醒：AI 可以把研究、写代码、文档和运营往前推很多，但每个阶段该交的证据一点没少。

所以我先放下融资、创始人故事和资源链接，只拆一个问题：AI 原生创业到底怎么避免把“能做出来”误读成“值得继续做”。中文读者很容易把 AI-native startup 理解成“创业流程自动化”：让 AI 调研、写代码、做 deck、跑运营，创始人像调度员一样坐在旁边。Claude 这份 Playbook 的价值，恰恰是把创始人拉回证据、上下文和判断。

以前一个想法到产品之间隔着工程、预算、招人、工具链和时间。现在，Claude Code 可以辅助写代码、改代码和维护代码上下文；Claude Cowork 可以围绕文件、系统和连接器辅助完成较长周期的知识工作；Chat 可以帮你快速推演、改写和反驳假设。门槛下来了，坏想法也会跑得更远。

脑子里可以先放一个画面：创始人站在几道门前，看着一堆 AI 产物问同一个问题：到现在为止，我们到底证明了什么？还没有证明什么？

四阶段证据门：从能不能做到该不该做

四阶段看成四道证据门

Claude Playbook 把 AI 原生创业拆成 Idea、MVP、Launch、Scale 四个阶段。把它读成流程图也可以，但我觉得不够狠。流程图关心“下一步做什么”，证据门关心“凭什么进入下一步”。

阶段	要回答的问题	通过这道门的证据	不能拿来充数的东西
Idea	这件事值得做吗？	真实人群反复遇到具体问题；方案对准访谈后暴露出来的问题，达到 problem-solution fit	原型能跑、AI 说市场很大、朋友觉得有意思
MVP	第一版是否产生复用价值？	明确用户群回来用、付费或推荐；可结合留存、收入、推荐、Sean Ellis 测试等信号判断	发布当天流量、创始人朋友圈转发、一次性试用
Launch	增长和运营能重复吗？	渠道驱动增长可解释，CAC/LTV/回本周期有依据；产品可靠性、安全、合规和流程能承受生产要求	融资新闻、单个大客户、创始人亲自救火
Scale	创始人不在时还转吗？	组织、GTM、企业支持、专有数据和深度集成能支撑持续业务	人更多、会议更多、自动化更多但没人敢放手

这个表不追求把每个阶段都写满。它只想提醒一件事：AI 最擅长制造“看起来已经够了”的东西。漂亮竞品分析、完整 PRD、一堆代码、销售话术、运营周报，都可能只是形式完整。创始人要问的是，形式背后的证据有没有变硬。

执行变便宜以后，误判会变贵

PDF 里有一条主线很值得单独拎出来：传统创业路径常常是 validate -> raise -> hire -> build -> raise again -> grow -> hire more -> repeat。AI-native startup 不再默认每进入一阶段就要扩大团队、换技能组合、再融一轮钱。一个小团队甚至一个创始人，可以把研究、工程、文档、数据整理、运营流程都往前推很多。

这当然是优势。一个非技术创始人可以更快把领域经验变成可运行软件；技术创始人也能借助 AI 补市场、财务、文档和运营的短板。

麻烦也从这里来。过去工程时间贵，需求会被迫排队，错误会死在纸面上。现在每个功能看起来都“顺手加一下”，每份调研都能很快写得像样，每个 dashboard 都能被包装成公司操作系统。错误不一定会早死，它可能会长成一个很完整、很忙、很像公司的东西。

所以我建议读这份 Playbook 时把注意力放在三件事上：

当前阶段要证明的事情是什么，证明对象不要飘。
AI 产物只辅助判断，不能替代判断。
进入下一阶段前，哪些上下文、范围和度量要沉淀下来，避免下一次会话重新发明一遍。

Chat、Cowork、Code：别把工具选择想成模型排位

根据 2026-05-06/07 PDF，Chat、Claude Cowork、Claude Code 的差异主要在工作空间。

Chat 适合短回合思考：把一个问题说清楚，改写一段话，找反方观点，拆一个模糊假设。Claude Cowork 更适合长一点的知识工作：在授权文件、系统和连接器范围内，整理访谈、竞品资料、指标表、周报、流程草案，或者配置某些周期性知识工作。Claude Code 面对的是代码库、diff、git 和开发环境，适合实现、测试、重构、审计和修复。

Chat、Claude Cowork、Claude Code 选择矩阵

我的用法通常是这样的：先用 Chat 把问题压窄，把反证问出来；再用 Cowork 汇总资料和业务上下文；最后让 Code 在明确范围和架构约束内动手。如果一开始就进代码库，工程上也许很快成立，商业上可能还悬在半空。

这不是说三者必须线性串起来。真实工作经常来回跳。关键是别让工具替你决定问题边界，尤其别让一个很会生成产物的工作空间，掩盖了你还没想清楚的商业问题。

Idea：不要急着证明你会造东西

Idea 阶段最容易被 AI 改写成“快速原型阶段”。这很危险。Claude Playbook 对 Idea 的要求更克制：先做研究型验证，回答“这是否值得构建”。退出标准是 problem-solution fit，而且主要来自真实人的对话和外部证据。

这里的重点在于让 AI 增加你的怀疑，而不是帮你把观点说圆。你可以让 Chat 把模糊想法改成可测试假设，让它用最强反方身份攻击这个假设；让 Claude Cowork 在授权资料范围内整理竞品评论、替代方案、访谈记录和市场材料；等问题被验证以后，再让 Claude Code 做一个单核心交互的轻量原型。

假设例子： 一个做 B2B SaaS 的团队，两天做出了一个“自动生成审批表单”的 demo。演示很好看，用户也说“挺有用”。但访谈追问最近一次审批卡在哪里时，答案不是“表单写得慢”，而是“权限链不清楚、跨部门审批顺序没人敢定、旧系统里字段口径不一致”。如果团队把 demo 的好反馈当成需求验证，就会继续优化生成表单；如果按证据门读法，它应该先回到问题定义：痛点也许在审批/权限/工作流，不在表单功能本身。

Idea 阶段建议留下几份轻文档：问题假设、反证清单、访谈提纲、竞争地图、原型范围。它们不需要漂亮，甚至不需要很长，但要能让下一周的你看出：哪些是用户说过的，哪些只是我们猜的。

访谈也要小心。类似“如果有这样一个工具你会用吗”这种问题，多半只会换来礼貌性鼓励。更好的问题是追最近一次真实行为：上次什么时候发生？谁参与？怎么绕过去？花了多少钱或多少时间？最后为什么没有换工具？

MVP：别让功能完整性假装成产品市场匹配

MVP 阶段不是把 Idea 阶段的 demo 修好看一点。它仍然是证据收集，只是证据从“问题是否存在”变成“这个方案是否让特定用户反复回来”。

PDF 对 MVP 的要求有两个方向：一边要快，把验证后的问题变成最小可用产品；一边要有上下文纪律，避免 AI 编码会话把技术债滚大。Claude Code 很适合在明确约束下实现、测试、重构，但它不会天然知道你上一轮为什么砍掉某个功能，也不会自动继承团队对架构、边界、安全和度量的共识。CLAUDE.md、mvp_scope.md、会话日志模板这些东西看起来琐碎，实际上是在给 AI 合作留下轨道。

退出标准也要提前写清楚。PDF 提到 Sean Ellis 测试可以作为 PMF 信号：超过 40% 的活跃用户表示如果失去产品会“非常失望”，这是值得关注的指标。但它不能单独判案。还要看留存、收入、推荐，以及信号是否来自一个能说清楚的用户群。

假设例子： 一个 AI 客服工具首周注册很多，创始人很兴奋。拆开数据后发现，用户多数来自朋友转发，只有少数完成接入，D7 回访几乎没有；付费用户愿意掏钱，是因为创始人亲自帮他们写了知识库和回复规则。这不是 PMF，只是创始人服务能力被产品界面包装了一层。下一步不该继续加“更智能的回复”，而要先验证用户能不能在没有创始人手工介入的情况下完成接入、看到效果、愿意继续用。

MVP 阶段的几个风险要盯紧：

Agentic technical debt：每次会话都能推进一点，但架构决策、命名、测试边界在漂。
虚假 PMF：发布热度、朋友圈导流、投资人网络，被误读成长期需求。
零摩擦范围蔓延：每个功能都只要半天，于是都被“顺手”加进来。
可运行但不安全：功能测试过了，不等于鉴权、会话、输入校验、数据暴露、依赖风险过了。

我的做法会偏保守：发布前先写清楚“虚假 PMF 长什么样”，比如只注册不激活、只试用不复用、只付费不留存。安全审查也先让 Claude/Claude Code 做一轮辅助筛查和修复建议，但高风险项必须进正式工具或专家复核。AI 的第一轮审查很有价值，前提是你知道它只是第一轮。

Launch：创始人要从手工系统里退出来

Launch 阶段有早期牵引了，产品也有真实用户了。问题变成：这门生意能不能重复增长，能不能承受生产负载，能不能离开创始人的记忆和手速。

这里我不建议继续堆一串“建议产物”。更直接的检查方式是看创始人的日历和聊天记录：哪些客户问题必须你亲自回？哪些发布前检查只在你脑子里？哪些安全、合规、可靠性工作被推到“企业客户来了再说”？哪些增长动作只有你知道为什么有效？

创始人瓶颈地图：哪些工作必须退出手工模式

Claude Code 可以辅助做架构审计、测试缺口识别、重构候选排序；Chat/Claude 可以把审计结果改成几个 sprint 的修复顺序；Claude Cowork 可以在接入相应系统和权限后，帮助盘点 recurring tasks、支持请求、bug 分流、周指标简报和产品管理节奏。但凡涉及客户承诺、安全合规、重大例外决策，都要保留清晰责任人和人工复核边界。

我很喜欢一个简单问题：如果创始人下周完全不上线，公司哪些流程会停？停下来的地方，多半说明系统还没长出来。

Scale：护城河要长在专有上下文里

Scale 阶段不能只理解成“人更多、自动化更多、客户更多”。PDF 给出的方向更像一次公司体检：技术基础设施、组织职能、GTM、企业支持、合规、安全、专有数据和工作流深度，都要能支撑一个可持续业务。退出条件也不再是单个里程碑，而是公司在创始人不亲自跑日常时仍能系统增长，并且对外部审查者有说服力，可能体现为可持续盈利、IPO 准备度或并购准备度。

这时“我们用了 AI”已经没有防御力。更能留下差异的是多年积累下来的领域测试案例、异常处理经验、集成深度、客户行为数据、团队工作流和切换成本。竞争对手可以复制界面，也可以换同类模型；很难复制一家公司在具体行业里反复吃亏后留下的上下文。

Scale 阶段可以让 Claude 做 founder-unavailable simulation：创始人离线一周，哪些流程会断。可以让 Cowork 在授权系统里维护支持升级路径、文档更新、续约追踪、周报节奏。可以让 Claude Code 扩展日志、监控、事件响应、API、webhook、SDK、demo 环境。这里最需要防的是把“自动化覆盖率”错当成“组织成熟度”。有些判断要下放，有些要委派，有些要保留复核；三者分不清，AI 会把混乱跑得更快。

常见误判，我会这样修

先做 demo 再验证，是最常见的一种。修法不是禁止 demo，而是在 demo 前写下假设和访谈框架：这个原型只服务哪个问题，只验证哪个核心交互。否则 demo 很容易变成推销道具。

让 AI 支持你的观点，也很常见。修法是固定要求反证：失败案例、替代解释、用户为什么不换、现有方案为什么已经足够。提示词里只要已经写了结论，输出就很可能只是帮你装订证据。

没有持久上下文，是 AI 编码里最容易被低估的坑。修法是把架构约定、测试命令、禁止事项、范围边界写进 CLAUDE.md 和 scope 文档。不要指望每次会话都靠临场解释。

用发布热度当 PMF，也要提前防。修法是在发布前定义 D7/D30、激活、付费、推荐，以及哪些数据属于虚假阳性。等数字冲起来以后再定义标准，人会本能地偏向好消息。

还有一种更隐蔽：把创始人判断自动化。Cowork 可以帮你跑流程，但流程里哪些地方需要责任人、哪些地方必须人工复核、哪些例外不能自动处理，要先写清楚。

一套我会保留的练习

下面这张表是作者建议，不是 Claude 官方 Playbook 的固定作业清单。耗时也只是粗略估算，目的是给读者一个启动尺度，不是承诺完成质量。

#	练习	推荐阶段	作者建议耗时
1	把创业想法改写成可测试假设：谁、多久一次、痛到什么程度、现在怎么解决。	Idea	30 分钟
2	让 Chat 用最强反方身份攻击假设，并列出必须验证的前三个前提。	Idea	20 分钟
3	用 Claude Cowork 在已授权资料范围内抽取 10-20 条竞品差评或替代方案评论，按真实痛点、偏好差异、无效噪音归类。	Idea	1-2 小时
4	手写访谈问题，再让 Claude 标出诱导式、未来式、过宽问题。	Idea	45 分钟
5	在写第一行 MVP 代码前，产出 `CLAUDE.md` 和 `mvp_scope.md`。	MVP	1-2 小时
6	发布前写清楚“虚假 PMF 长什么样”：只注册不激活、只试用不复用、只付费不留存。	MVP/Launch	45 分钟
7	让 Claude Code 做一次架构和安全第一轮审查，按“本周必须修 / 下个 sprint / 可接受债务”排序，再用正式工具或专家复核高风险项。	MVP/Launch	半天
8	做一次创始人运营盘点：所有只有你知道、只有你记得、只有你会处理的工作。	Launch/Scale	1 小时