来源: Lenny’s Podcast / YouTube
嘉宾: Cat Wu(Anthropic Claude Code & Co-work 产品负责人)
主持人: Lenny Rachitsky
时长: 1小时25分34秒
日期: 2026年4月23日

📌 内容摘要

Anthropic Claude Code与Co-work的产品负责人Cat Wu分享:为什么团队功能交付周期从6个月压缩到1天、AI原生产品需要什么心智模型、源码泄露与Open Claude政策调整的真实原因。核心洞察包括"拐杖功能"方法论(模型弱时加tool辅助→模型强后拆掉)、“有产品品味的工程师"成为最高效交付单元、所有角色(PM/工程师/设计师)边界消融、以及AI时代PM必备的三项技能——evals、product taste、first-principles thinking。Cat强调"95%自动化几乎没有价值”,唯有100%跑通的自动化才释放认知资源。


一、Cat Wu在Claude Code团队的角色(00:00-01:29)【中等密度】

1.1 与Boris Cherny的分工

关键知识点:

  • Boris是技术负责人和产品远见者,设定"3-6个月后产品应该是什么样"的AGI-pilled版本愿景
  • Cat负责从现状到愿景的路径规划,以及跨职能协作(市场、销售、财务、容量规划)
  • 协作模式:80%判断重合+20%各自驱动,界限非常模糊

    “大约80%的判断是重合的。剩下20%我更在乎的事我来推,20%他更在乎的他来推,界限其实非常模糊。”

  • 核心目标:一旦功能ready,发布路径上没有任何阻碍

二、Anthropic招PM时看重什么(01:29-04:29)

2.1 AI时代PM面试的致命信号

关键知识点:

  • 致命信号:带着6-12个月路线图来面试的PM

    “很多来面试的PM会带着一份6到12个月的路线图。这在AI时代是错误的心智模型。”

  • 正确姿态:接受不确定性,拥抱快速变化,用实验替代计划
  • 产品品味的稀缺性

    “产品品味仍然是稀缺技能,只要有人展现出强烈的产品品味,我们几乎都会招。”

2.2 为什么招"有产品品味的工程师"

关键知识点:

  • 端到端交付:从Twitter上看到用户反馈→周末前发布产品,几乎不需要PM参与

    “我们团队里有很多工程师能从’在Twitter上看到用户反馈’到’周末前把产品发出去’——几乎不需要PM参与。这其实是最高效的发布方式。”

  • Cat的背景:多年工程师→短暂VC→2024年8月加入Anthropic
  • 团队几乎所有PM要么以前是工程师,要么现在在Claude Code上写代码;设计师也都是前端工程师出身

💡 思考点:当工程师拥有产品品味后,传统PM的"翻译"角色是否正在消失?PM的未来价值,是在于"比工程师更懂业务",还是"比业务更懂AI可能性"?

🔗 关联点:这与Stripe的"工程师即PM"文化相似——Patrick Collison长期主张,最好的产品决策应该由离代码最近的人做。


三、Anthropic如何做到每周发版(04:29-08:58)

3.1 极速交付的三个秘密

关键知识点:

  • 秘密一:清晰目标+自主决策

    “Boris设定3-6个月的愿景,我的工作是确保团队知道这个方向,然后让大家自主决定怎么走过去。”

    • 每周stand-up不是汇报进度,而是分享新demo,看哪些有engagement
  • 秘密二:Research Preview流程
    • 不是等"产品完成"才发布,以research preview形式快速放出,用户反馈驱动下一周迭代
    • 内部用户先试,有engagement的功能再polish扩大范围
  • 秘密三:工程×文档×PMM的紧密管道

    “我们的团队已经largely用prototype-first thinking替代了documentation-first thinking。”

    • 传统:PRD→评审→开发→测试→发布(数月)
    • Anthropic:spec→Claude Code写原型→demo→发布(数天)

3.2 交付周期的压缩

关键知识点:

  • 从6个月缩到1个月,有时甚至一天

    “我们很多功能的交付周期从6个月缩到1个月,有时甚至一天。”

  • Side Quest文化:鼓励工程师/PM/设计师用一个下午做原型、测试超出范围的能力

    “我们鼓励团队里的每个人去承担side quest——一个下午花在做原型上、测试一个你以为超出范围的能力。”

  • 成功案例:Claude Code on Desktop、AskUserQuestion tool、todo lists均来自side quest

3.3 evals over docs(反馈优先于书面)

关键知识点:

  • Stand-up形式是分享新idea的demo,wrong bets are cheap因为原型可在一下午搭出来
  • 真实案例:Noah分享plugins spec给Claude Code,返回的原型接近production ready,锚定了最终产品

    “那个原型锚定了团队最终发布的产品,因为它让团队能快速验证UX。”

  • Pro-tip:写完spec后直接发给Claude Code看能不能build出来

四、PRD和路线图在Anthropic的演变(08:58-10:28)

4.1 长期路线图的终结

关键知识点:

  • 传统PM思维:探索→研究→写PRD→交给工程团队build
  • Anthropic模式:没有长期路线图,鼓励side quest,prototype-first→demo→engagement驱动决策
  • 核心逻辑:

    “指数级提升的模型打破了传统假设——项目开始时技术上可能的事,到项目结束时可能已经完全不同。”

  • PM的新工作:在模型快速进步带来的模糊中创造清晰度,push团队想得更远,clear shipping path

4.2 PRD的新写法

关键知识点:

  • PRD不再是"给工程团队的详细说明书",更像"愿景描述+约束条件"——让Claude Code去fill in the blanks
  • 工作流程:Cat写spec→发给Claude Code看能不能build→返回原型成为conversation anchor→团队围绕原型快速迭代

五、Mythos模型与Anthropic的发布节奏(10:28-16:25)

5.1 模型进步的速度

关键知识点:

  • Excalidraw table tool测试
    • Sonnet 3.5(new) 2024年10月:Claude尝试但失败
    • Opus 4 2025年6月:偶尔成功,成为pre-recorded demo
    • Opus 4.6 2026年3月:one-shot完成,敢在thousands of developers面前live demo
  • 41倍提升:METR测量,16个月内模型能完成的软件任务时长从21分钟到12小时

    “METR measured that Sonnet 3.5 (new) could do tasks that would take a human around 21 minutes. Opus 4.6: almost 12 hours. That’s a roughly 41x jump in 16 months.”
    METR的测试显示,Sonnet 3.5(新版)完成某项任务所需的时间约为人类的21分钟。而Opus 4.6则需要近12小时。这意味着在16个月内,性能提升了约41倍。

5.2 "拐杖功能"模式(重点方法论)

关键知识点:

  • 核心循环:模型还做不到→加tool/crutch帮助它→模型变强→拆掉crutch让模型自然做
  • 经典案例:todo list
    • 早期Claude Code改5个call sites就停了→Sid加了todo list tool→Claude能改完20个
    • Opus 4以后模型自然能做到→todo list de-emphasized→变成optional UI

    “今天to-do list仍然是给用户看Claude在做什么的好工具,但已经被弱化——模型用不用它都行。”

  • 节奏总结

    “你要同时追踪两件事:AI如何改变你工作的方式,以及AI如何改变你产品中可能实现的事。做好这一点,当table tool终于work的时候,你不是surprised的那个——你是预见它到来的那个。”

💡 思考点:"拐杖功能"的添加和拆除,本质上是对模型能力的精确判断。什么时候该加crutch(加速当前交付),什么时候该拆crutch(让模型接管),这个timing的把握是否是AI产品管理的核心技能?

🔗 关联点:这与Paul Graham的"Do Things That Don’t Scale"形成有趣对照——Anthropic做的是"Build Things That Models Can’t Do Yet"(打造模型目前还无法实现的功能),然后等模型追上。


六、Claude Code源码泄露与Open Claude政策(16:25-20:30)

6.1 源码泄露事件

关键知识点:

  • 泄露内容:部分Claude Code源码出现在GitHub上
  • 根因:人为失误——一位同事和Claude一起写PR(package发布流程更新),PR经过两轮human review仍出错

    “这是人为失误的结果。最重要的是从中学习、加上更多安全栅栏,避免再次发生。”

  • 该同事仍在Anthropic,process failure不是individual blame;大部分hardening changes已上线

6.2 Open Claude政策调整

关键知识点:

  • 真实原因:订阅不是为第三方产品设计,第三方使用模式与第一方差别很大

    “订阅本身不是为第三方产品设计的,第三方产品的使用模式和第一方产品差别很大。”

  • 决策逻辑:Claude需求激增→基础设施扩容+harness token效率优化→优先保障第一方产品+API
  • 过渡方案:每个订阅用户额外获得credits

七、PM团队结构与"角色融合"(20:30-28:31)

7.1 PM团队组织架构

关键知识点:

  • 总规模30-40个PM,五大团队:
    • Research PM(Diane负责):客户反馈→research团队,主持模型发布
    • Claude Developer Platform(CDP):API + Managed Agents
    • Claude Code(Cat Wu):Claude Code + Co-work核心产品
    • Enterprise:成本控制、RBAC、安全
    • Growth:全产品线增长

7.2 所有角色都在融合

关键知识点:

  • 融合趋势

    “所有角色都在互相融合。PM开始做一点工程,工程师在做PM的事,设计师既做PM又写代码。”

  • Anthropic的选择:招更多有产品品味的工程师,而非更多PM

    “你可以选择招更多有产品品味的工程师,或者保持工程编制不变、招更多PM来引导工程师的工作。我们团队的选择是:招更多有产品品味的工程师。”

  • 端到端交付

    “我们团队里有很多工程师能从’在Twitter上看到用户反馈’到’周末前把产品发出去’——几乎不需要PM参与。”

  • 有效的原因:clear strategy and goals(明确的战略和目标)→autonomously prioritize(每个人能自主排序);Claude Code让cross-functional handoffs(跨职能交接)消失

💡 思考点:如果"工程师+产品品味"成为最高效的交付单元,传统PM的value prop是什么?可能是:在model progress带来的模糊中创造清晰度、定义non-negotiables、管理stakeholder expectations。

🔗 关联点:这与Basecamp的"Shape Up"方法论有共鸣——小团队、模糊边界、以demo和prototype而非文档驱动决策。


八、Claude的"性格"设计(28:31-33:36)

8.1 personality as product feature(个性作为产品特性)

关键知识点:

  • 用户对Claude的感情:轻松有趣+非常能干+低ego+积极行动导向

    “人们对Claude也是这种感觉:喜欢它轻松有趣,同时又非常能干。喜欢它低架子——你说’你这件事做错了’,它会说’啊糟糕,谢谢告诉我,我来修,我们一起处理。'”

  • 好的同事品质:positivity、bias toward action、earnest feedback(真诚反馈而非一味附和)
  • 设计意图:

    “我们刻意把这些东西注入Claude,因为它让一起工作这件事变得愉悦很多。”


九、Claude Code vs Desktop vs Co-work(33:36-38:52)

9.1 产品使用切分

关键知识点:

工具 场景 原因
Claude Code (CLI) 一次性编码任务,要最新功能 CLI最先拿到新feature,most powerful
Desktop 前端工作、非技术用户 Preview pane实时看到app变化;one-stop control plane
Web/Mobile 路上临时开启任务 不用laptop+phone hotspot
Co-work 输出不是代码的工作 邮件、slide deck、doc、launch plan

9.2 Co-work的意想不到用法

关键知识点:

  • Conference talk准备:Cat准备"Code with Claude"大会演讲,Co-work遍历Twitter/evergreen launch room/announce channel,合成20-page polished deck(符合Anthropic design system)
  • Applied AI客户简报:前晚用Co-work总结明日所有客户会议,主动搜索Slack找最新ETA,开会时手上有absolute latest info

💡 思考点:Co-work的真正价值不在"自动化单个任务",而在"跨数据源的上下文整合"。当Google Calendar + Slack + Gmail + Drive的信息被合成为一份brief时,信息的价值从"可查"变成了"可用"。

🔗 关联点:这与Clayton Christensen的"Jobs to be Done"理论一致——用户不是想买工具,而是想完成工作。Co-work完成的"job"不是"写邮件"或"做PPT",而是"让我知道明天开会前我需要知道的一切"。


十、人类大脑在哪些地方不可替代(38:52-41:30)

10.1 模型没有的"常识"

关键知识点:

  • 人类仍提供模型没有的tacit common-sense EQ knowledge(隐含的常识性EQ)

    “人类仍然提供模型没有的那种’常识’。任何一次产品发布背后都有上千个活动的小部件——每个都很小,但每个都可能出错。”

  • 模型的盲区:利益相关者都有谁、他们之间是什么关系、各自偏好是什么、用什么渠道沟通最合适
  • 这些隐性知识现在仍然很值钱,模型会在这方面变得更好,但当下还有空隙

💡 思考点:如果模型的盲区是"tacit common-sense EQ knowledge",这是否意味着产品经理的核心竞争力正在从"逻辑分析"转向"组织情商"?当AI接管了理性决策,人类的比较优势是不是在于理解"谁在意什么、为什么在意"?

🔗 关联点:这与Daniel Kahneman的"快思考vs慢思考"形成对照——AI擅长系统2的理性分析,人类在系统1的直觉和社交智慧上仍有优势。


十一、如何在龙卷风中保持理智(41:30-47:31)

11.1 面对持续混乱的组织文化

关键知识点:

  • 团队特质:"往混乱里冲"的人,用微笑面对每一个挑战
  • 招聘标准:看到挑战能说"这会很难,但我很兴奋去啃。我不会做得完美,但我晚上能睡得着"
  • P0级联的现实

    “很多周:周日晚上出现一个P0,周一又是一个P0,周一下午又来一个P00000——你会心想:‘我居然为周日那个P0紧张过。’”

  • 生存策略:承认能做的有限、必须睡好才能做决策、残忍排优先级、允许放下一些东西
  • 产品哲学

    “我们发出去的一些产品没有我希望的那么打磨好,但我们的最高目标是赋能专业开发者;一个产品如果不成功,只要它没有阻碍核心用例,我们听到反馈就会在下一个版本修掉。”


十二、AI时代PM的三项关键技能(47:31-52:00)

12.1 evals(用户反馈)

关键知识点:

  • 系统性地测量模型在特定任务上的表现

    “模型在变强,但不是在所有维度上均匀变强。evals告诉你哪些任务变好了、哪些没有。”

  • Cat Wu的做法:用Claude Code建立Streamlit apps分析大规模用户反馈,跑evals帮公司找到新的可信benchmarks
  • evals让PM预知未来:

    “你不再被surprised——你是预见table tool会work的那个人。”

12.2 product taste(品味)

关键知识点:

  • 在模糊中知道"什么是好的"的能力;大多数PM用process掩盖judgment deficiency
  • Anthropic筛选标准:“只要有人展现出强烈的产品品味,我们几乎都会招。”

12.3 first-principles thinking(第一性原理思维)

关键知识点:

  • Cat的座右铭:

    “Just do things. If you know what you’re optimizing for and have strong first principles, you can usually deduce the right action.”
    直接行动就好。只要你清楚优化目标,并且具备扎实的第一性原理,通常就能推导出正确的行动方案。

  • “岗位是假的”:

    “Jobs are fake. If you understand the constraints, you can figure out what you can do, and try to do it quickly.”
    工作都是虚的。只要你明白其中的限制,就能弄清楚自己能做什么,并尽快付诸行动。

12.4 最被低估的AI技能

关键知识点:

  • 让模型反思(introspect)自己的错误

    “When Claude makes a mistake, I ask it to introspect on what went wrong. This is surprisingly powerful.”
    每当Claude犯错时,我都会让它反思哪里出了问题。这种方法的效果出乎意料地好

💡 思考点:evals + product taste + first-principles thinking,这三项技能的共同点是什么?它们都是在"不确定性中做判断"的能力。传统PM依赖data和process来消除不确定性,AI时代的PM需要在data到来之前就有判断。

🔗 关联点:这与Ray Dalio的"Principles"理念一致——在高度不确定的环境中,清晰的principles比详细的plans更有价值。


十三、自动化从95%到100%(52:00-57:30)

13.1 95%自动化几乎没有价值

关键知识点:

  • 核心观点:

    “如果一个自动化不是100%跑通,它就几乎没有价值。一个95%的自动化有almost no value。”

  • 原因:95%意味着你still need to babysit it,babysitting的成本>自动化的收益
  • 如何做到100%:pick one automation(尝试一个可以自动化的功能)→teach Claude your preferences(给Claude注入你的偏好)→get it to 100%(100%完成功能自动化)→then rely on it(然后依赖它)
  • 整个组织都在加速:数据科学、财务、市场、法律、设计团队都自己pick up了这些工具

💡 思考点:"95%自动化没有价值"是一个强论断。对于personal automation(个人工作流),100%是必要条件;对于systemic automation(系统性产品),95%可能已经足够。个人automation的SLO应该是99.9%+,因为cognitive switching cost(认知转换成本)太高。


十四、闪电问答(57:30-85:34)

14.1 书籍

关键知识点:

  • How Asia Works:经济发展与长期成功经济体
  • The Technology Trap:过去技术革命对劳动者的影响
  • The Paper Menagerie:关于成长、AI、自我探索的短篇故事集

14.2 影视

关键知识点:

  • Drive to Survive:对单一工程目标的极度执迷
  • Free Solo:Alex Honnold无保护攀登El Capitan的心理专注

14.3 产品

关键知识点:

  • Waymo:每天两次,愿付2x溢价

    “我以前以为Waymo得比Uber、Lyft便宜才行——事实上我愿意为它付2倍的价钱。”

14.4 座右铭

关键知识点:

“Just do things.” 理解约束→看出自己能做什么→尽快去做→从错误里学→做错了就道歉或修

14.5 AGI之后

关键知识点:

  • 短期:帮助世界跟上这场变革
  • 长期:搬去Fontainebleau攀岩+一周读1-2本书(物理、机器人、航空航天)

    “就算我知道AI已经全都懂,我还是想自己学。”


核心观点总结

关键数据

  • 41倍:16个月内模型能力提升(21分钟→12小时human-equivalent tasks)
  • 30-40人:Anthropic PM团队总规模
  • 6个月→1天:功能交付周期压缩幅度
  • $200/月:Claude订阅价格,补贴unlimited usage
  • 2x溢价:Cat愿意为Waymo支付的溢价

核心判断

  1. 6个月路线图是AI时代的错误心智模型——接受不确定性、拥抱快速变化
  2. "有产品品味的工程师"是最高效的交付单元——end-to-end从反馈到发布
  3. 所有角色都在融合——PM写代码、工程师做产品决策、设计师发PR
  4. 拐杖功能模式:模型弱时加tool→模型强后拆掉
  5. 95%自动化几乎没有价值——只有100%的自动化才真正释放认知资源
  6. AI时代PM三项技能:evals、product taste、first-principles thinking
  7. 人类大脑不可替代的是tacit common-sense EQ knowledge
  8. “Just do things”——理解约束、快速行动、从错误中学习

关键方法论

  • 极速交付三秘密:清晰目标 + Research Preview + 工程×文档×PMM紧密管道
  • Side Quest文化:自驱短实验,afternoons prototyping ideas
  • Prototype-first over Docs(优先考虑原型,而非文档):demo和evals驱动决策
  • 拐杖功能模式:add crutch→model catches up→remove crutch(添加辅助工具→模型跟上→移除辅助工具)
  • 个人自动化100%法则:pick one→teach Claude→get to 100%→rely on it
  • 龙卷风生存策略:承认有限、睡好觉、残忍排优先级、允许放下

分析时间:2026-04-27
分析人员:有一只肥罗
Hey🌺我是一只肥罗,坚持做一些有意思的事情

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐