揭秘Anthropic 的产品团队快人一步的原因
来源: Lenny’s Podcast / YouTube
嘉宾: Cat Wu(Anthropic Claude Code & Co-work 产品负责人)
主持人: Lenny Rachitsky
时长: 1小时25分34秒
日期: 2026年4月23日
📌 内容摘要
Anthropic Claude Code与Co-work的产品负责人Cat Wu分享:为什么团队功能交付周期从6个月压缩到1天、AI原生产品需要什么心智模型、源码泄露与Open Claude政策调整的真实原因。核心洞察包括"拐杖功能"方法论(模型弱时加tool辅助→模型强后拆掉)、“有产品品味的工程师"成为最高效交付单元、所有角色(PM/工程师/设计师)边界消融、以及AI时代PM必备的三项技能——evals、product taste、first-principles thinking。Cat强调"95%自动化几乎没有价值”,唯有100%跑通的自动化才释放认知资源。
一、Cat Wu在Claude Code团队的角色(00:00-01:29)【中等密度】
1.1 与Boris Cherny的分工
关键知识点:
- Boris是技术负责人和产品远见者,设定"3-6个月后产品应该是什么样"的AGI-pilled版本愿景
- Cat负责从现状到愿景的路径规划,以及跨职能协作(市场、销售、财务、容量规划)
- 协作模式:80%判断重合+20%各自驱动,界限非常模糊
“大约80%的判断是重合的。剩下20%我更在乎的事我来推,20%他更在乎的他来推,界限其实非常模糊。”
- 核心目标:一旦功能ready,发布路径上没有任何阻碍
二、Anthropic招PM时看重什么(01:29-04:29)
2.1 AI时代PM面试的致命信号
关键知识点:
- 致命信号:带着6-12个月路线图来面试的PM
“很多来面试的PM会带着一份6到12个月的路线图。这在AI时代是错误的心智模型。”
- 正确姿态:接受不确定性,拥抱快速变化,用实验替代计划
- 产品品味的稀缺性:
“产品品味仍然是稀缺技能,只要有人展现出强烈的产品品味,我们几乎都会招。”
2.2 为什么招"有产品品味的工程师"
关键知识点:
- 端到端交付:从Twitter上看到用户反馈→周末前发布产品,几乎不需要PM参与
“我们团队里有很多工程师能从’在Twitter上看到用户反馈’到’周末前把产品发出去’——几乎不需要PM参与。这其实是最高效的发布方式。”
- Cat的背景:多年工程师→短暂VC→2024年8月加入Anthropic
- 团队几乎所有PM要么以前是工程师,要么现在在Claude Code上写代码;设计师也都是前端工程师出身
💡 思考点:当工程师拥有产品品味后,传统PM的"翻译"角色是否正在消失?PM的未来价值,是在于"比工程师更懂业务",还是"比业务更懂AI可能性"?
🔗 关联点:这与Stripe的"工程师即PM"文化相似——Patrick Collison长期主张,最好的产品决策应该由离代码最近的人做。
三、Anthropic如何做到每周发版(04:29-08:58)
3.1 极速交付的三个秘密
关键知识点:
- 秘密一:清晰目标+自主决策
“Boris设定3-6个月的愿景,我的工作是确保团队知道这个方向,然后让大家自主决定怎么走过去。”
- 每周stand-up不是汇报进度,而是分享新demo,看哪些有engagement
- 秘密二:Research Preview流程
- 不是等"产品完成"才发布,以research preview形式快速放出,用户反馈驱动下一周迭代
- 内部用户先试,有engagement的功能再polish扩大范围
- 秘密三:工程×文档×PMM的紧密管道
“我们的团队已经largely用prototype-first thinking替代了documentation-first thinking。”
- 传统:PRD→评审→开发→测试→发布(数月)
- Anthropic:spec→Claude Code写原型→demo→发布(数天)
3.2 交付周期的压缩
关键知识点:
- 从6个月缩到1个月,有时甚至一天
“我们很多功能的交付周期从6个月缩到1个月,有时甚至一天。”
- Side Quest文化:鼓励工程师/PM/设计师用一个下午做原型、测试超出范围的能力
“我们鼓励团队里的每个人去承担side quest——一个下午花在做原型上、测试一个你以为超出范围的能力。”
- 成功案例:Claude Code on Desktop、AskUserQuestion tool、todo lists均来自side quest
3.3 evals over docs(反馈优先于书面)
关键知识点:
- Stand-up形式是分享新idea的demo,wrong bets are cheap因为原型可在一下午搭出来
- 真实案例:Noah分享plugins spec给Claude Code,返回的原型接近production ready,锚定了最终产品
“那个原型锚定了团队最终发布的产品,因为它让团队能快速验证UX。”
- Pro-tip:写完spec后直接发给Claude Code看能不能build出来
四、PRD和路线图在Anthropic的演变(08:58-10:28)
4.1 长期路线图的终结
关键知识点:
- 传统PM思维:探索→研究→写PRD→交给工程团队build
- Anthropic模式:没有长期路线图,鼓励side quest,prototype-first→demo→engagement驱动决策
- 核心逻辑:
“指数级提升的模型打破了传统假设——项目开始时技术上可能的事,到项目结束时可能已经完全不同。”
- PM的新工作:在模型快速进步带来的模糊中创造清晰度,push团队想得更远,clear shipping path
4.2 PRD的新写法
关键知识点:
- PRD不再是"给工程团队的详细说明书",更像"愿景描述+约束条件"——让Claude Code去fill in the blanks
- 工作流程:Cat写spec→发给Claude Code看能不能build→返回原型成为conversation anchor→团队围绕原型快速迭代
五、Mythos模型与Anthropic的发布节奏(10:28-16:25)
5.1 模型进步的速度
关键知识点:
- Excalidraw table tool测试:
- Sonnet 3.5(new) 2024年10月:Claude尝试但失败
- Opus 4 2025年6月:偶尔成功,成为pre-recorded demo
- Opus 4.6 2026年3月:one-shot完成,敢在thousands of developers面前live demo
- 41倍提升:METR测量,16个月内模型能完成的软件任务时长从21分钟到12小时
“METR measured that Sonnet 3.5 (new) could do tasks that would take a human around 21 minutes. Opus 4.6: almost 12 hours. That’s a roughly 41x jump in 16 months.”
METR的测试显示,Sonnet 3.5(新版)完成某项任务所需的时间约为人类的21分钟。而Opus 4.6则需要近12小时。这意味着在16个月内,性能提升了约41倍。
5.2 "拐杖功能"模式(重点方法论)
关键知识点:
- 核心循环:模型还做不到→加tool/crutch帮助它→模型变强→拆掉crutch让模型自然做
- 经典案例:todo list
- 早期Claude Code改5个call sites就停了→Sid加了todo list tool→Claude能改完20个
- Opus 4以后模型自然能做到→todo list de-emphasized→变成optional UI
“今天to-do list仍然是给用户看Claude在做什么的好工具,但已经被弱化——模型用不用它都行。”
- 节奏总结:
“你要同时追踪两件事:AI如何改变你工作的方式,以及AI如何改变你产品中可能实现的事。做好这一点,当table tool终于work的时候,你不是surprised的那个——你是预见它到来的那个。”
💡 思考点:"拐杖功能"的添加和拆除,本质上是对模型能力的精确判断。什么时候该加crutch(加速当前交付),什么时候该拆crutch(让模型接管),这个timing的把握是否是AI产品管理的核心技能?
🔗 关联点:这与Paul Graham的"Do Things That Don’t Scale"形成有趣对照——Anthropic做的是"Build Things That Models Can’t Do Yet"(打造模型目前还无法实现的功能),然后等模型追上。
六、Claude Code源码泄露与Open Claude政策(16:25-20:30)
6.1 源码泄露事件
关键知识点:
- 泄露内容:部分Claude Code源码出现在GitHub上
- 根因:人为失误——一位同事和Claude一起写PR(package发布流程更新),PR经过两轮human review仍出错
“这是人为失误的结果。最重要的是从中学习、加上更多安全栅栏,避免再次发生。”
- 该同事仍在Anthropic,process failure不是individual blame;大部分hardening changes已上线
6.2 Open Claude政策调整
关键知识点:
- 真实原因:订阅不是为第三方产品设计,第三方使用模式与第一方差别很大
“订阅本身不是为第三方产品设计的,第三方产品的使用模式和第一方产品差别很大。”
- 决策逻辑:Claude需求激增→基础设施扩容+harness token效率优化→优先保障第一方产品+API
- 过渡方案:每个订阅用户额外获得credits
七、PM团队结构与"角色融合"(20:30-28:31)
7.1 PM团队组织架构
关键知识点:
- 总规模30-40个PM,五大团队:
- Research PM(Diane负责):客户反馈→research团队,主持模型发布
- Claude Developer Platform(CDP):API + Managed Agents
- Claude Code(Cat Wu):Claude Code + Co-work核心产品
- Enterprise:成本控制、RBAC、安全
- Growth:全产品线增长
7.2 所有角色都在融合
关键知识点:
- 融合趋势:
“所有角色都在互相融合。PM开始做一点工程,工程师在做PM的事,设计师既做PM又写代码。”
- Anthropic的选择:招更多有产品品味的工程师,而非更多PM
“你可以选择招更多有产品品味的工程师,或者保持工程编制不变、招更多PM来引导工程师的工作。我们团队的选择是:招更多有产品品味的工程师。”
- 端到端交付:
“我们团队里有很多工程师能从’在Twitter上看到用户反馈’到’周末前把产品发出去’——几乎不需要PM参与。”
- 有效的原因:clear strategy and goals(明确的战略和目标)→autonomously prioritize(每个人能自主排序);Claude Code让cross-functional handoffs(跨职能交接)消失
💡 思考点:如果"工程师+产品品味"成为最高效的交付单元,传统PM的value prop是什么?可能是:在model progress带来的模糊中创造清晰度、定义non-negotiables、管理stakeholder expectations。
🔗 关联点:这与Basecamp的"Shape Up"方法论有共鸣——小团队、模糊边界、以demo和prototype而非文档驱动决策。
八、Claude的"性格"设计(28:31-33:36)
8.1 personality as product feature(个性作为产品特性)
关键知识点:
- 用户对Claude的感情:轻松有趣+非常能干+低ego+积极行动导向
“人们对Claude也是这种感觉:喜欢它轻松有趣,同时又非常能干。喜欢它低架子——你说’你这件事做错了’,它会说’啊糟糕,谢谢告诉我,我来修,我们一起处理。'”
- 好的同事品质:positivity、bias toward action、earnest feedback(真诚反馈而非一味附和)
- 设计意图:
“我们刻意把这些东西注入Claude,因为它让一起工作这件事变得愉悦很多。”
九、Claude Code vs Desktop vs Co-work(33:36-38:52)
9.1 产品使用切分
关键知识点:
| 工具 | 场景 | 原因 |
|---|---|---|
| Claude Code (CLI) | 一次性编码任务,要最新功能 | CLI最先拿到新feature,most powerful |
| Desktop | 前端工作、非技术用户 | Preview pane实时看到app变化;one-stop control plane |
| Web/Mobile | 路上临时开启任务 | 不用laptop+phone hotspot |
| Co-work | 输出不是代码的工作 | 邮件、slide deck、doc、launch plan |
9.2 Co-work的意想不到用法
关键知识点:
- Conference talk准备:Cat准备"Code with Claude"大会演讲,Co-work遍历Twitter/evergreen launch room/announce channel,合成20-page polished deck(符合Anthropic design system)
- Applied AI客户简报:前晚用Co-work总结明日所有客户会议,主动搜索Slack找最新ETA,开会时手上有absolute latest info
💡 思考点:Co-work的真正价值不在"自动化单个任务",而在"跨数据源的上下文整合"。当Google Calendar + Slack + Gmail + Drive的信息被合成为一份brief时,信息的价值从"可查"变成了"可用"。
🔗 关联点:这与Clayton Christensen的"Jobs to be Done"理论一致——用户不是想买工具,而是想完成工作。Co-work完成的"job"不是"写邮件"或"做PPT",而是"让我知道明天开会前我需要知道的一切"。
十、人类大脑在哪些地方不可替代(38:52-41:30)
10.1 模型没有的"常识"
关键知识点:
- 人类仍提供模型没有的tacit common-sense EQ knowledge(隐含的常识性EQ)
“人类仍然提供模型没有的那种’常识’。任何一次产品发布背后都有上千个活动的小部件——每个都很小,但每个都可能出错。”
- 模型的盲区:利益相关者都有谁、他们之间是什么关系、各自偏好是什么、用什么渠道沟通最合适
- 这些隐性知识现在仍然很值钱,模型会在这方面变得更好,但当下还有空隙
💡 思考点:如果模型的盲区是"tacit common-sense EQ knowledge",这是否意味着产品经理的核心竞争力正在从"逻辑分析"转向"组织情商"?当AI接管了理性决策,人类的比较优势是不是在于理解"谁在意什么、为什么在意"?
🔗 关联点:这与Daniel Kahneman的"快思考vs慢思考"形成对照——AI擅长系统2的理性分析,人类在系统1的直觉和社交智慧上仍有优势。
十一、如何在龙卷风中保持理智(41:30-47:31)
11.1 面对持续混乱的组织文化
关键知识点:
- 团队特质:"往混乱里冲"的人,用微笑面对每一个挑战
- 招聘标准:看到挑战能说"这会很难,但我很兴奋去啃。我不会做得完美,但我晚上能睡得着"
- P0级联的现实:
“很多周:周日晚上出现一个P0,周一又是一个P0,周一下午又来一个P00000——你会心想:‘我居然为周日那个P0紧张过。’”
- 生存策略:承认能做的有限、必须睡好才能做决策、残忍排优先级、允许放下一些东西
- 产品哲学:
“我们发出去的一些产品没有我希望的那么打磨好,但我们的最高目标是赋能专业开发者;一个产品如果不成功,只要它没有阻碍核心用例,我们听到反馈就会在下一个版本修掉。”
十二、AI时代PM的三项关键技能(47:31-52:00)
12.1 evals(用户反馈)
关键知识点:
- 系统性地测量模型在特定任务上的表现
“模型在变强,但不是在所有维度上均匀变强。evals告诉你哪些任务变好了、哪些没有。”
- Cat Wu的做法:用Claude Code建立Streamlit apps分析大规模用户反馈,跑evals帮公司找到新的可信benchmarks
- evals让PM预知未来:
“你不再被surprised——你是预见table tool会work的那个人。”
12.2 product taste(品味)
关键知识点:
- 在模糊中知道"什么是好的"的能力;大多数PM用process掩盖judgment deficiency
- Anthropic筛选标准:“只要有人展现出强烈的产品品味,我们几乎都会招。”
12.3 first-principles thinking(第一性原理思维)
关键知识点:
- Cat的座右铭:
“Just do things. If you know what you’re optimizing for and have strong first principles, you can usually deduce the right action.”
直接行动就好。只要你清楚优化目标,并且具备扎实的第一性原理,通常就能推导出正确的行动方案。 - “岗位是假的”:
“Jobs are fake. If you understand the constraints, you can figure out what you can do, and try to do it quickly.”
工作都是虚的。只要你明白其中的限制,就能弄清楚自己能做什么,并尽快付诸行动。
12.4 最被低估的AI技能
关键知识点:
- 让模型反思(introspect)自己的错误
“When Claude makes a mistake, I ask it to introspect on what went wrong. This is surprisingly powerful.”
每当Claude犯错时,我都会让它反思哪里出了问题。这种方法的效果出乎意料地好
💡 思考点:evals + product taste + first-principles thinking,这三项技能的共同点是什么?它们都是在"不确定性中做判断"的能力。传统PM依赖data和process来消除不确定性,AI时代的PM需要在data到来之前就有判断。
🔗 关联点:这与Ray Dalio的"Principles"理念一致——在高度不确定的环境中,清晰的principles比详细的plans更有价值。
十三、自动化从95%到100%(52:00-57:30)
13.1 95%自动化几乎没有价值
关键知识点:
- 核心观点:
“如果一个自动化不是100%跑通,它就几乎没有价值。一个95%的自动化有almost no value。”
- 原因:95%意味着你still need to babysit it,babysitting的成本>自动化的收益
- 如何做到100%:pick one automation(尝试一个可以自动化的功能)→teach Claude your preferences(给Claude注入你的偏好)→get it to 100%(100%完成功能自动化)→then rely on it(然后依赖它)
- 整个组织都在加速:数据科学、财务、市场、法律、设计团队都自己pick up了这些工具
💡 思考点:"95%自动化没有价值"是一个强论断。对于personal automation(个人工作流),100%是必要条件;对于systemic automation(系统性产品),95%可能已经足够。个人automation的SLO应该是99.9%+,因为cognitive switching cost(认知转换成本)太高。
十四、闪电问答(57:30-85:34)
14.1 书籍
关键知识点:
- How Asia Works:经济发展与长期成功经济体
- The Technology Trap:过去技术革命对劳动者的影响
- The Paper Menagerie:关于成长、AI、自我探索的短篇故事集
14.2 影视
关键知识点:
- Drive to Survive:对单一工程目标的极度执迷
- Free Solo:Alex Honnold无保护攀登El Capitan的心理专注
14.3 产品
关键知识点:
- Waymo:每天两次,愿付2x溢价
“我以前以为Waymo得比Uber、Lyft便宜才行——事实上我愿意为它付2倍的价钱。”
14.4 座右铭
关键知识点:
“Just do things.” 理解约束→看出自己能做什么→尽快去做→从错误里学→做错了就道歉或修
14.5 AGI之后
关键知识点:
- 短期:帮助世界跟上这场变革
- 长期:搬去Fontainebleau攀岩+一周读1-2本书(物理、机器人、航空航天)
“就算我知道AI已经全都懂,我还是想自己学。”
核心观点总结
关键数据
- 41倍:16个月内模型能力提升(21分钟→12小时human-equivalent tasks)
- 30-40人:Anthropic PM团队总规模
- 6个月→1天:功能交付周期压缩幅度
- $200/月:Claude订阅价格,补贴unlimited usage
- 2x溢价:Cat愿意为Waymo支付的溢价
核心判断
- 6个月路线图是AI时代的错误心智模型——接受不确定性、拥抱快速变化
- "有产品品味的工程师"是最高效的交付单元——end-to-end从反馈到发布
- 所有角色都在融合——PM写代码、工程师做产品决策、设计师发PR
- 拐杖功能模式:模型弱时加tool→模型强后拆掉
- 95%自动化几乎没有价值——只有100%的自动化才真正释放认知资源
- AI时代PM三项技能:evals、product taste、first-principles thinking
- 人类大脑不可替代的是tacit common-sense EQ knowledge
- “Just do things”——理解约束、快速行动、从错误中学习
关键方法论
- 极速交付三秘密:清晰目标 + Research Preview + 工程×文档×PMM紧密管道
- Side Quest文化:自驱短实验,afternoons prototyping ideas
- Prototype-first over Docs(优先考虑原型,而非文档):demo和evals驱动决策
- 拐杖功能模式:add crutch→model catches up→remove crutch(添加辅助工具→模型跟上→移除辅助工具)
- 个人自动化100%法则:pick one→teach Claude→get to 100%→rely on it
- 龙卷风生存策略:承认有限、睡好觉、残忍排优先级、允许放下
分析时间:2026-04-27
分析人员:有一只肥罗
Hey🌺我是一只肥罗,坚持做一些有意思的事情
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)