AI 原生创业四阶段 Playbook:Claude《The Founder’s Playbook》的可执行读法

AI 原生创业四阶段 Playbook 封面

摘要:AI 把执行门槛降下来了,但创业仍然要一关一关交证据。

我读 Claude 这份 Playbook 时,最想保留的不是工具清单,而是它对创始人角色的提醒:AI 可以把研究、写代码、文档和运营往前推很多,但每个阶段该交的证据一点没少。

所以我先放下融资、创始人故事和资源链接,只拆一个问题:AI 原生创业到底怎么避免把“能做出来”误读成“值得继续做”。中文读者很容易把 AI-native startup 理解成“创业流程自动化”:让 AI 调研、写代码、做 deck、跑运营,创始人像调度员一样坐在旁边。Claude 这份 Playbook 的价值,恰恰是把创始人拉回证据、上下文和判断。

以前一个想法到产品之间隔着工程、预算、招人、工具链和时间。现在,Claude Code 可以辅助写代码、改代码和维护代码上下文;Claude Cowork 可以围绕文件、系统和连接器辅助完成较长周期的知识工作;Chat 可以帮你快速推演、改写和反驳假设。门槛下来了,坏想法也会跑得更远。

脑子里可以先放一个画面:创始人站在几道门前,看着一堆 AI 产物问同一个问题:到现在为止,我们到底证明了什么?还没有证明什么?

四阶段证据门:从能不能做到该不该做

四阶段看成四道证据门

Claude Playbook 把 AI 原生创业拆成 Idea、MVP、Launch、Scale 四个阶段。把它读成流程图也可以,但我觉得不够狠。流程图关心“下一步做什么”,证据门关心“凭什么进入下一步”。

阶段 要回答的问题 通过这道门的证据 不能拿来充数的东西
Idea 这件事值得做吗? 真实人群反复遇到具体问题;方案对准访谈后暴露出来的问题,达到 problem-solution fit 原型能跑、AI 说市场很大、朋友觉得有意思
MVP 第一版是否产生复用价值? 明确用户群回来用、付费或推荐;可结合留存、收入、推荐、Sean Ellis 测试等信号判断 发布当天流量、创始人朋友圈转发、一次性试用
Launch 增长和运营能重复吗? 渠道驱动增长可解释,CAC/LTV/回本周期有依据;产品可靠性、安全、合规和流程能承受生产要求 融资新闻、单个大客户、创始人亲自救火
Scale 创始人不在时还转吗? 组织、GTM、企业支持、专有数据和深度集成能支撑持续业务 人更多、会议更多、自动化更多但没人敢放手

这个表不追求把每个阶段都写满。它只想提醒一件事:AI 最擅长制造“看起来已经够了”的东西。漂亮竞品分析、完整 PRD、一堆代码、销售话术、运营周报,都可能只是形式完整。创始人要问的是,形式背后的证据有没有变硬。

执行变便宜以后,误判会变贵

PDF 里有一条主线很值得单独拎出来:传统创业路径常常是 validate -> raise -> hire -> build -> raise again -> grow -> hire more -> repeat。AI-native startup 不再默认每进入一阶段就要扩大团队、换技能组合、再融一轮钱。一个小团队甚至一个创始人,可以把研究、工程、文档、数据整理、运营流程都往前推很多。

这当然是优势。一个非技术创始人可以更快把领域经验变成可运行软件;技术创始人也能借助 AI 补市场、财务、文档和运营的短板。

麻烦也从这里来。过去工程时间贵,需求会被迫排队,错误会死在纸面上。现在每个功能看起来都“顺手加一下”,每份调研都能很快写得像样,每个 dashboard 都能被包装成公司操作系统。错误不一定会早死,它可能会长成一个很完整、很忙、很像公司的东西。

所以我建议读这份 Playbook 时把注意力放在三件事上:

  • 当前阶段要证明的事情是什么,证明对象不要飘。
  • AI 产物只辅助判断,不能替代判断。
  • 进入下一阶段前,哪些上下文、范围和度量要沉淀下来,避免下一次会话重新发明一遍。

Chat、Cowork、Code:别把工具选择想成模型排位

根据 2026-05-06/07 PDF,Chat、Claude Cowork、Claude Code 的差异主要在工作空间。

Chat 适合短回合思考:把一个问题说清楚,改写一段话,找反方观点,拆一个模糊假设。Claude Cowork 更适合长一点的知识工作:在授权文件、系统和连接器范围内,整理访谈、竞品资料、指标表、周报、流程草案,或者配置某些周期性知识工作。Claude Code 面对的是代码库、diff、git 和开发环境,适合实现、测试、重构、审计和修复。

Chat、Claude Cowork、Claude Code 选择矩阵

我的用法通常是这样的:先用 Chat 把问题压窄,把反证问出来;再用 Cowork 汇总资料和业务上下文;最后让 Code 在明确范围和架构约束内动手。如果一开始就进代码库,工程上也许很快成立,商业上可能还悬在半空。

这不是说三者必须线性串起来。真实工作经常来回跳。关键是别让工具替你决定问题边界,尤其别让一个很会生成产物的工作空间,掩盖了你还没想清楚的商业问题。

Idea:不要急着证明你会造东西

Idea 阶段最容易被 AI 改写成“快速原型阶段”。这很危险。Claude Playbook 对 Idea 的要求更克制:先做研究型验证,回答“这是否值得构建”。退出标准是 problem-solution fit,而且主要来自真实人的对话和外部证据。

这里的重点在于让 AI 增加你的怀疑,而不是帮你把观点说圆。你可以让 Chat 把模糊想法改成可测试假设,让它用最强反方身份攻击这个假设;让 Claude Cowork 在授权资料范围内整理竞品评论、替代方案、访谈记录和市场材料;等问题被验证以后,再让 Claude Code 做一个单核心交互的轻量原型。

假设例子: 一个做 B2B SaaS 的团队,两天做出了一个“自动生成审批表单”的 demo。演示很好看,用户也说“挺有用”。但访谈追问最近一次审批卡在哪里时,答案不是“表单写得慢”,而是“权限链不清楚、跨部门审批顺序没人敢定、旧系统里字段口径不一致”。如果团队把 demo 的好反馈当成需求验证,就会继续优化生成表单;如果按证据门读法,它应该先回到问题定义:痛点也许在审批/权限/工作流,不在表单功能本身。

Idea 阶段建议留下几份轻文档:问题假设、反证清单、访谈提纲、竞争地图、原型范围。它们不需要漂亮,甚至不需要很长,但要能让下一周的你看出:哪些是用户说过的,哪些只是我们猜的。

访谈也要小心。类似“如果有这样一个工具你会用吗”这种问题,多半只会换来礼貌性鼓励。更好的问题是追最近一次真实行为:上次什么时候发生?谁参与?怎么绕过去?花了多少钱或多少时间?最后为什么没有换工具?

MVP:别让功能完整性假装成产品市场匹配

MVP 阶段不是把 Idea 阶段的 demo 修好看一点。它仍然是证据收集,只是证据从“问题是否存在”变成“这个方案是否让特定用户反复回来”。

PDF 对 MVP 的要求有两个方向:一边要快,把验证后的问题变成最小可用产品;一边要有上下文纪律,避免 AI 编码会话把技术债滚大。Claude Code 很适合在明确约束下实现、测试、重构,但它不会天然知道你上一轮为什么砍掉某个功能,也不会自动继承团队对架构、边界、安全和度量的共识。CLAUDE.mdmvp_scope.md、会话日志模板这些东西看起来琐碎,实际上是在给 AI 合作留下轨道。

退出标准也要提前写清楚。PDF 提到 Sean Ellis 测试可以作为 PMF 信号:超过 40% 的活跃用户表示如果失去产品会“非常失望”,这是值得关注的指标。但它不能单独判案。还要看留存、收入、推荐,以及信号是否来自一个能说清楚的用户群。

假设例子: 一个 AI 客服工具首周注册很多,创始人很兴奋。拆开数据后发现,用户多数来自朋友转发,只有少数完成接入,D7 回访几乎没有;付费用户愿意掏钱,是因为创始人亲自帮他们写了知识库和回复规则。这不是 PMF,只是创始人服务能力被产品界面包装了一层。下一步不该继续加“更智能的回复”,而要先验证用户能不能在没有创始人手工介入的情况下完成接入、看到效果、愿意继续用。

MVP 阶段的几个风险要盯紧:

  • Agentic technical debt:每次会话都能推进一点,但架构决策、命名、测试边界在漂。
  • 虚假 PMF:发布热度、朋友圈导流、投资人网络,被误读成长期需求。
  • 零摩擦范围蔓延:每个功能都只要半天,于是都被“顺手”加进来。
  • 可运行但不安全:功能测试过了,不等于鉴权、会话、输入校验、数据暴露、依赖风险过了。

我的做法会偏保守:发布前先写清楚“虚假 PMF 长什么样”,比如只注册不激活、只试用不复用、只付费不留存。安全审查也先让 Claude/Claude Code 做一轮辅助筛查和修复建议,但高风险项必须进正式工具或专家复核。AI 的第一轮审查很有价值,前提是你知道它只是第一轮。

Launch:创始人要从手工系统里退出来

Launch 阶段有早期牵引了,产品也有真实用户了。问题变成:这门生意能不能重复增长,能不能承受生产负载,能不能离开创始人的记忆和手速。

这里我不建议继续堆一串“建议产物”。更直接的检查方式是看创始人的日历和聊天记录:哪些客户问题必须你亲自回?哪些发布前检查只在你脑子里?哪些安全、合规、可靠性工作被推到“企业客户来了再说”?哪些增长动作只有你知道为什么有效?

创始人瓶颈地图:哪些工作必须退出手工模式

Claude Code 可以辅助做架构审计、测试缺口识别、重构候选排序;Chat/Claude 可以把审计结果改成几个 sprint 的修复顺序;Claude Cowork 可以在接入相应系统和权限后,帮助盘点 recurring tasks、支持请求、bug 分流、周指标简报和产品管理节奏。但凡涉及客户承诺、安全合规、重大例外决策,都要保留清晰责任人和人工复核边界。

我很喜欢一个简单问题:如果创始人下周完全不上线,公司哪些流程会停?停下来的地方,多半说明系统还没长出来。

Scale:护城河要长在专有上下文里

Scale 阶段不能只理解成“人更多、自动化更多、客户更多”。PDF 给出的方向更像一次公司体检:技术基础设施、组织职能、GTM、企业支持、合规、安全、专有数据和工作流深度,都要能支撑一个可持续业务。退出条件也不再是单个里程碑,而是公司在创始人不亲自跑日常时仍能系统增长,并且对外部审查者有说服力,可能体现为可持续盈利、IPO 准备度或并购准备度。

这时“我们用了 AI”已经没有防御力。更能留下差异的是多年积累下来的领域测试案例、异常处理经验、集成深度、客户行为数据、团队工作流和切换成本。竞争对手可以复制界面,也可以换同类模型;很难复制一家公司在具体行业里反复吃亏后留下的上下文。

Scale 阶段可以让 Claude 做 founder-unavailable simulation:创始人离线一周,哪些流程会断。可以让 Cowork 在授权系统里维护支持升级路径、文档更新、续约追踪、周报节奏。可以让 Claude Code 扩展日志、监控、事件响应、API、webhook、SDK、demo 环境。这里最需要防的是把“自动化覆盖率”错当成“组织成熟度”。有些判断要下放,有些要委派,有些要保留复核;三者分不清,AI 会把混乱跑得更快。

常见误判,我会这样修

先做 demo 再验证,是最常见的一种。修法不是禁止 demo,而是在 demo 前写下假设和访谈框架:这个原型只服务哪个问题,只验证哪个核心交互。否则 demo 很容易变成推销道具。

让 AI 支持你的观点,也很常见。修法是固定要求反证:失败案例、替代解释、用户为什么不换、现有方案为什么已经足够。提示词里只要已经写了结论,输出就很可能只是帮你装订证据。

没有持久上下文,是 AI 编码里最容易被低估的坑。修法是把架构约定、测试命令、禁止事项、范围边界写进 CLAUDE.md 和 scope 文档。不要指望每次会话都靠临场解释。

用发布热度当 PMF,也要提前防。修法是在发布前定义 D7/D30、激活、付费、推荐,以及哪些数据属于虚假阳性。等数字冲起来以后再定义标准,人会本能地偏向好消息。

还有一种更隐蔽:把创始人判断自动化。Cowork 可以帮你跑流程,但流程里哪些地方需要责任人、哪些地方必须人工复核、哪些例外不能自动处理,要先写清楚。

一套我会保留的练习

下面这张表是作者建议,不是 Claude 官方 Playbook 的固定作业清单。耗时也只是粗略估算,目的是给读者一个启动尺度,不是承诺完成质量。

# 练习 推荐阶段 作者建议耗时
1 把创业想法改写成可测试假设:谁、多久一次、痛到什么程度、现在怎么解决。 Idea 30 分钟
2 让 Chat 用最强反方身份攻击假设,并列出必须验证的前三个前提。 Idea 20 分钟
3 用 Claude Cowork 在已授权资料范围内抽取 10-20 条竞品差评或替代方案评论,按真实痛点、偏好差异、无效噪音归类。 Idea 1-2 小时
4 手写访谈问题,再让 Claude 标出诱导式、未来式、过宽问题。 Idea 45 分钟
5 在写第一行 MVP 代码前,产出 CLAUDE.mdmvp_scope.md MVP 1-2 小时
6 发布前写清楚“虚假 PMF 长什么样”:只注册不激活、只试用不复用、只付费不留存。 MVP/Launch 45 分钟
7 让 Claude Code 做一次架构和安全第一轮审查,按“本周必须修 / 下个 sprint / 可接受债务”排序,再用正式工具或专家复核高风险项。 MVP/Launch 半天
8 做一次创始人运营盘点:所有只有你知道、只有你记得、只有你会处理的工作。 Launch/Scale 1 小时

收尾

Claude 的 Playbook 值得读,因为它没有把创业讲得更轻松。它提醒创始人:AI 会放大执行,也会放大错觉。

Idea 阶段,别急着把想法做出来,先证明问题存在。MVP 阶段,别把功能完整当成价值成立,先证明特定人群会反复回来。Launch 阶段,别把创始人的手工运营包装成公司能力,先找出哪些流程离开你就停。Scale 阶段,别把模型接入当护城河,去沉淀用户行为、领域边界、集成深度和工作流上下文。

如果只带走一个动作,我会建议你在每个阶段写一句退出标准。这句话写给自己,不给投资人,也不写进漂亮 deck:到了什么证据,我才允许团队进入下一阶段。

参考

延伸阅读

下面几篇是 Playbook 资源页里提到的延伸阅读,适合继续看工具用法和团队案例。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐