揭秘Anthropic 的产品团队快人一步的原因

FILOMENA

419人浏览 · 2026-04-29 08:00:00

FILOMENA · 2026-04-29 08:00:00 发布

来源： Lenny’s Podcast / YouTube
嘉宾： Cat Wu（Anthropic Claude Code & Co-work 产品负责人）
主持人： Lenny Rachitsky
时长： 1小时25分34秒
日期： 2026年4月23日

📌 内容摘要

Anthropic Claude Code与Co-work的产品负责人Cat Wu分享：为什么团队功能交付周期从6个月压缩到1天、AI原生产品需要什么心智模型、源码泄露与Open Claude政策调整的真实原因。核心洞察包括"拐杖功能"方法论（模型弱时加tool辅助→模型强后拆掉）、“有产品品味的工程师"成为最高效交付单元、所有角色（PM/工程师/设计师）边界消融、以及AI时代PM必备的三项技能——evals、product taste、first-principles thinking。Cat强调"95%自动化几乎没有价值”，唯有100%跑通的自动化才释放认知资源。

一、Cat Wu在Claude Code团队的角色（00:00-01:29）【中等密度】

1.1 与Boris Cherny的分工

关键知识点：

Boris是技术负责人和产品远见者，设定"3-6个月后产品应该是什么样"的AGI-pilled版本愿景
Cat负责从现状到愿景的路径规划，以及跨职能协作（市场、销售、财务、容量规划）
协作模式：80%判断重合+20%各自驱动，界限非常模糊

“大约80%的判断是重合的。剩下20%我更在乎的事我来推，20%他更在乎的他来推，界限其实非常模糊。”
核心目标：一旦功能ready，发布路径上没有任何阻碍

二、Anthropic招PM时看重什么（01:29-04:29）

2.1 AI时代PM面试的致命信号

关键知识点：

致命信号：带着6-12个月路线图来面试的PM

“很多来面试的PM会带着一份6到12个月的路线图。这在AI时代是错误的心智模型。”
正确姿态：接受不确定性，拥抱快速变化，用实验替代计划
产品品味的稀缺性：

“产品品味仍然是稀缺技能，只要有人展现出强烈的产品品味，我们几乎都会招。”

2.2 为什么招"有产品品味的工程师"

关键知识点：

端到端交付：从Twitter上看到用户反馈→周末前发布产品，几乎不需要PM参与

“我们团队里有很多工程师能从’在Twitter上看到用户反馈’到’周末前把产品发出去’——几乎不需要PM参与。这其实是最高效的发布方式。”
Cat的背景：多年工程师→短暂VC→2024年8月加入Anthropic
团队几乎所有PM要么以前是工程师，要么现在在Claude Code上写代码；设计师也都是前端工程师出身

💡 思考点：当工程师拥有产品品味后，传统PM的"翻译"角色是否正在消失？PM的未来价值，是在于"比工程师更懂业务"，还是"比业务更懂AI可能性"？

🔗 关联点：这与Stripe的"工程师即PM"文化相似——Patrick Collison长期主张，最好的产品决策应该由离代码最近的人做。

三、Anthropic如何做到每周发版（04:29-08:58）

3.1 极速交付的三个秘密

关键知识点：

秘密一：清晰目标+自主决策

“Boris设定3-6个月的愿景，我的工作是确保团队知道这个方向，然后让大家自主决定怎么走过去。”
- 每周stand-up不是汇报进度，而是分享新demo，看哪些有engagement
秘密二：Research Preview流程
- 不是等"产品完成"才发布，以research preview形式快速放出，用户反馈驱动下一周迭代
- 内部用户先试，有engagement的功能再polish扩大范围
秘密三：工程×文档×PMM的紧密管道

“我们的团队已经largely用prototype-first thinking替代了documentation-first thinking。”
- 传统：PRD→评审→开发→测试→发布（数月）
- Anthropic：spec→Claude Code写原型→demo→发布（数天）

3.2 交付周期的压缩

关键知识点：

从6个月缩到1个月，有时甚至一天

“我们很多功能的交付周期从6个月缩到1个月，有时甚至一天。”
Side Quest文化：鼓励工程师/PM/设计师用一个下午做原型、测试超出范围的能力

“我们鼓励团队里的每个人去承担side quest——一个下午花在做原型上、测试一个你以为超出范围的能力。”
成功案例：Claude Code on Desktop、AskUserQuestion tool、todo lists均来自side quest

3.3 evals over docs（反馈优先于书面）

关键知识点：

Stand-up形式是分享新idea的demo，wrong bets are cheap因为原型可在一下午搭出来
真实案例：Noah分享plugins spec给Claude Code，返回的原型接近production ready，锚定了最终产品

“那个原型锚定了团队最终发布的产品，因为它让团队能快速验证UX。”
Pro-tip：写完spec后直接发给Claude Code看能不能build出来

四、PRD和路线图在Anthropic的演变（08:58-10:28）

4.1 长期路线图的终结

关键知识点：

传统PM思维：探索→研究→写PRD→交给工程团队build
Anthropic模式：没有长期路线图，鼓励side quest，prototype-first→demo→engagement驱动决策
核心逻辑：

“指数级提升的模型打破了传统假设——项目开始时技术上可能的事，到项目结束时可能已经完全不同。”
PM的新工作：在模型快速进步带来的模糊中创造清晰度，push团队想得更远，clear shipping path

4.2 PRD的新写法

关键知识点：

PRD不再是"给工程团队的详细说明书"，更像"愿景描述+约束条件"——让Claude Code去fill in the blanks
工作流程：Cat写spec→发给Claude Code看能不能build→返回原型成为conversation anchor→团队围绕原型快速迭代

五、Mythos模型与Anthropic的发布节奏（10:28-16:25）

5.1 模型进步的速度

关键知识点：

Excalidraw table tool测试：
- Sonnet 3.5(new) 2024年10月：Claude尝试但失败
- Opus 4 2025年6月：偶尔成功，成为pre-recorded demo
- Opus 4.6 2026年3月：one-shot完成，敢在thousands of developers面前live demo
41倍提升：METR测量，16个月内模型能完成的软件任务时长从21分钟到12小时

“METR measured that Sonnet 3.5 (new) could do tasks that would take a human around 21 minutes. Opus 4.6: almost 12 hours. That’s a roughly 41x jump in 16 months.”
METR的测试显示，Sonnet 3.5（新版）完成某项任务所需的时间约为人类的21分钟。而Opus 4.6则需要近12小时。这意味着在16个月内，性能提升了约41倍。

5.2 "拐杖功能"模式（重点方法论）

关键知识点：

核心循环：模型还做不到→加tool/crutch帮助它→模型变强→拆掉crutch让模型自然做
经典案例：todo list
- 早期Claude Code改5个call sites就停了→Sid加了todo list tool→Claude能改完20个
- Opus 4以后模型自然能做到→todo list de-emphasized→变成optional UI
“今天to-do list仍然是给用户看Claude在做什么的好工具，但已经被弱化——模型用不用它都行。”
节奏总结：

“你要同时追踪两件事：AI如何改变你工作的方式，以及AI如何改变你产品中可能实现的事。做好这一点，当table tool终于work的时候，你不是surprised的那个——你是预见它到来的那个。”

💡 思考点："拐杖功能"的添加和拆除，本质上是对模型能力的精确判断。什么时候该加crutch（加速当前交付），什么时候该拆crutch（让模型接管），这个timing的把握是否是AI产品管理的核心技能？

🔗 关联点：这与Paul Graham的"Do Things That Don’t Scale"形成有趣对照——Anthropic做的是"Build Things That Models Can’t Do Yet"(打造模型目前还无法实现的功能)，然后等模型追上。

六、Claude Code源码泄露与Open Claude政策（16:25-20:30）

6.1 源码泄露事件

关键知识点：

泄露内容：部分Claude Code源码出现在GitHub上
根因：人为失误——一位同事和Claude一起写PR（package发布流程更新），PR经过两轮human review仍出错

“这是人为失误的结果。最重要的是从中学习、加上更多安全栅栏，避免再次发生。”
该同事仍在Anthropic，process failure不是individual blame；大部分hardening changes已上线

6.2 Open Claude政策调整

关键知识点：

真实原因：订阅不是为第三方产品设计，第三方使用模式与第一方差别很大

“订阅本身不是为第三方产品设计的，第三方产品的使用模式和第一方产品差别很大。”
决策逻辑：Claude需求激增→基础设施扩容+harness token效率优化→优先保障第一方产品+API
过渡方案：每个订阅用户额外获得credits

七、PM团队结构与"角色融合"（20:30-28:31）

7.1 PM团队组织架构

关键知识点：

总规模30-40个PM，五大团队：
- Research PM（Diane负责）：客户反馈→research团队，主持模型发布
- Claude Developer Platform（CDP）：API + Managed Agents
- Claude Code（Cat Wu）：Claude Code + Co-work核心产品
- Enterprise：成本控制、RBAC、安全
- Growth：全产品线增长

7.2 所有角色都在融合

关键知识点：

融合趋势：

“所有角色都在互相融合。PM开始做一点工程，工程师在做PM的事，设计师既做PM又写代码。”
Anthropic的选择：招更多有产品品味的工程师，而非更多PM

“你可以选择招更多有产品品味的工程师，或者保持工程编制不变、招更多PM来引导工程师的工作。我们团队的选择是：招更多有产品品味的工程师。”
端到端交付：

“我们团队里有很多工程师能从’在Twitter上看到用户反馈’到’周末前把产品发出去’——几乎不需要PM参与。”
有效的原因：clear strategy and goals（明确的战略和目标）→autonomously prioritize（每个人能自主排序）；Claude Code让cross-functional handoffs（跨职能交接）消失

💡 思考点：如果"工程师+产品品味"成为最高效的交付单元，传统PM的value prop是什么？可能是：在model progress带来的模糊中创造清晰度、定义non-negotiables、管理stakeholder expectations。

🔗 关联点：这与Basecamp的"Shape Up"方法论有共鸣——小团队、模糊边界、以demo和prototype而非文档驱动决策。

八、Claude的"性格"设计（28:31-33:36）

8.1 personality as product feature（个性作为产品特性）

关键知识点：

用户对Claude的感情：轻松有趣+非常能干+低ego+积极行动导向

“人们对Claude也是这种感觉：喜欢它轻松有趣，同时又非常能干。喜欢它低架子——你说’你这件事做错了’，它会说’啊糟糕，谢谢告诉我，我来修，我们一起处理。'”
好的同事品质：positivity、bias toward action、earnest feedback（真诚反馈而非一味附和）
设计意图：

“我们刻意把这些东西注入Claude，因为它让一起工作这件事变得愉悦很多。”

九、Claude Code vs Desktop vs Co-work（33:36-38:52）

9.1 产品使用切分

关键知识点：

工具	场景	原因
Claude Code (CLI)	一次性编码任务，要最新功能	CLI最先拿到新feature，most powerful
Desktop	前端工作、非技术用户	Preview pane实时看到app变化；one-stop control plane
Web/Mobile	路上临时开启任务	不用laptop+phone hotspot
Co-work	输出不是代码的工作	邮件、slide deck、doc、launch plan

9.2 Co-work的意想不到用法

关键知识点：

Conference talk准备：Cat准备"Code with Claude"大会演讲，Co-work遍历Twitter/evergreen launch room/announce channel，合成20-page polished deck（符合Anthropic design system）
Applied AI客户简报：前晚用Co-work总结明日所有客户会议，主动搜索Slack找最新ETA，开会时手上有absolute latest info

💡 思考点：Co-work的真正价值不在"自动化单个任务"，而在"跨数据源的上下文整合"。当Google Calendar + Slack + Gmail + Drive的信息被合成为一份brief时，信息的价值从"可查"变成了"可用"。

🔗 关联点：这与Clayton Christensen的"Jobs to be Done"理论一致——用户不是想买工具，而是想完成工作。Co-work完成的"job"不是"写邮件"或"做PPT"，而是"让我知道明天开会前我需要知道的一切"。

十、人类大脑在哪些地方不可替代（38:52-41:30）

10.1 模型没有的"常识"

关键知识点：

人类仍提供模型没有的tacit common-sense EQ knowledge（隐含的常识性EQ）

“人类仍然提供模型没有的那种’常识’。任何一次产品发布背后都有上千个活动的小部件——每个都很小，但每个都可能出错。”
模型的盲区：利益相关者都有谁、他们之间是什么关系、各自偏好是什么、用什么渠道沟通最合适
这些隐性知识现在仍然很值钱，模型会在这方面变得更好，但当下还有空隙

💡 思考点：如果模型的盲区是"tacit common-sense EQ knowledge"，这是否意味着产品经理的核心竞争力正在从"逻辑分析"转向"组织情商"？当AI接管了理性决策，人类的比较优势是不是在于理解"谁在意什么、为什么在意"？

🔗 关联点：这与Daniel Kahneman的"快思考vs慢思考"形成对照——AI擅长系统2的理性分析，人类在系统1的直觉和社交智慧上仍有优势。

十一、如何在龙卷风中保持理智（41:30-47:31）

11.1 面对持续混乱的组织文化

关键知识点：

团队特质："往混乱里冲"的人，用微笑面对每一个挑战
招聘标准：看到挑战能说"这会很难，但我很兴奋去啃。我不会做得完美，但我晚上能睡得着"
P0级联的现实：

“很多周：周日晚上出现一个P0，周一又是一个P0，周一下午又来一个P00000——你会心想：‘我居然为周日那个P0紧张过。’”
生存策略：承认能做的有限、必须睡好才能做决策、残忍排优先级、允许放下一些东西
产品哲学：

“我们发出去的一些产品没有我希望的那么打磨好，但我们的最高目标是赋能专业开发者；一个产品如果不成功，只要它没有阻碍核心用例，我们听到反馈就会在下一个版本修掉。”

十二、AI时代PM的三项关键技能（47:31-52:00）

12.1 evals（用户反馈）

关键知识点：

系统性地测量模型在特定任务上的表现

“模型在变强，但不是在所有维度上均匀变强。evals告诉你哪些任务变好了、哪些没有。”
Cat Wu的做法：用Claude Code建立Streamlit apps分析大规模用户反馈，跑evals帮公司找到新的可信benchmarks
evals让PM预知未来：

“你不再被surprised——你是预见table tool会work的那个人。”

12.2 product taste（品味）

关键知识点：

在模糊中知道"什么是好的"的能力；大多数PM用process掩盖judgment deficiency
Anthropic筛选标准：“只要有人展现出强烈的产品品味，我们几乎都会招。”

12.3 first-principles thinking（第一性原理思维）

关键知识点：

Cat的座右铭：

“Just do things. If you know what you’re optimizing for and have strong first principles, you can usually deduce the right action.”
直接行动就好。只要你清楚优化目标，并且具备扎实的第一性原理，通常就能推导出正确的行动方案。
“岗位是假的”：

“Jobs are fake. If you understand the constraints, you can figure out what you can do, and try to do it quickly.”
工作都是虚的。只要你明白其中的限制，就能弄清楚自己能做什么，并尽快付诸行动。

12.4 最被低估的AI技能

关键知识点：

让模型反思（introspect）自己的错误

“When Claude makes a mistake, I ask it to introspect on what went wrong. This is surprisingly powerful.”
每当Claude犯错时，我都会让它反思哪里出了问题。这种方法的效果出乎意料地好

💡 思考点：evals + product taste + first-principles thinking，这三项技能的共同点是什么？它们都是在"不确定性中做判断"的能力。传统PM依赖data和process来消除不确定性，AI时代的PM需要在data到来之前就有判断。

🔗 关联点：这与Ray Dalio的"Principles"理念一致——在高度不确定的环境中，清晰的principles比详细的plans更有价值。

十三、自动化从95%到100%（52:00-57:30）

13.1 95%自动化几乎没有价值

关键知识点：

核心观点：

“如果一个自动化不是100%跑通，它就几乎没有价值。一个95%的自动化有almost no value。”
原因：95%意味着你still need to babysit it，babysitting的成本>自动化的收益
如何做到100%：pick one automation（尝试一个可以自动化的功能）→teach Claude your preferences（给Claude注入你的偏好）→get it to 100%（100%完成功能自动化）→then rely on it（然后依赖它）
整个组织都在加速：数据科学、财务、市场、法律、设计团队都自己pick up了这些工具

💡 思考点："95%自动化没有价值"是一个强论断。对于personal automation（个人工作流），100%是必要条件；对于systemic automation（系统性产品），95%可能已经足够。个人automation的SLO应该是99.9%+，因为cognitive switching cost（认知转换成本）太高。

十四、闪电问答（57:30-85:34）

14.1 书籍

关键知识点：

How Asia Works：经济发展与长期成功经济体
The Technology Trap：过去技术革命对劳动者的影响
The Paper Menagerie：关于成长、AI、自我探索的短篇故事集

14.2 影视

关键知识点：

Drive to Survive：对单一工程目标的极度执迷
Free Solo：Alex Honnold无保护攀登El Capitan的心理专注

14.3 产品

关键知识点：

Waymo：每天两次，愿付2x溢价

“我以前以为Waymo得比Uber、Lyft便宜才行——事实上我愿意为它付2倍的价钱。”

14.4 座右铭

关键知识点：

“Just do things.” 理解约束→看出自己能做什么→尽快去做→从错误里学→做错了就道歉或修

14.5 AGI之后

关键知识点：

短期：帮助世界跟上这场变革
长期：搬去Fontainebleau攀岩+一周读1-2本书（物理、机器人、航空航天）

“就算我知道AI已经全都懂，我还是想自己学。”

核心观点总结

关键数据

41倍：16个月内模型能力提升（21分钟→12小时human-equivalent tasks）
30-40人：Anthropic PM团队总规模
6个月→1天：功能交付周期压缩幅度
$200/月：Claude订阅价格，补贴unlimited usage
2x溢价：Cat愿意为Waymo支付的溢价

核心判断

6个月路线图是AI时代的错误心智模型——接受不确定性、拥抱快速变化
"有产品品味的工程师"是最高效的交付单元——end-to-end从反馈到发布
所有角色都在融合——PM写代码、工程师做产品决策、设计师发PR
拐杖功能模式：模型弱时加tool→模型强后拆掉
95%自动化几乎没有价值——只有100%的自动化才真正释放认知资源
AI时代PM三项技能：evals、product taste、first-principles thinking
人类大脑不可替代的是tacit common-sense EQ knowledge
“Just do things”——理解约束、快速行动、从错误中学习

关键方法论

极速交付三秘密：清晰目标 + Research Preview + 工程×文档×PMM紧密管道
Side Quest文化：自驱短实验，afternoons prototyping ideas
Prototype-first over Docs（优先考虑原型，而非文档）：demo和evals驱动决策
拐杖功能模式：add crutch→model catches up→remove crutch（添加辅助工具→模型跟上→移除辅助工具）
个人自动化100%法则：pick one→teach Claude→get to 100%→rely on it
龙卷风生存策略：承认有限、睡好觉、残忍排优先级、允许放下

分析时间：2026-04-27
分析人员：有一只肥罗
Hey🌺我是一只肥罗，坚持做一些有意思的事情

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

[Dify x EdgeOne] 哄睡童话机——用 Dify + EdgeOne Pages 给娃造一个会现挂的 AI 睡前故事神器

AtomGit开源社区

PP-OCRv5 ONNX部署但使用OnnxOCR

AtomGit开源社区

MCP（Model Context Protocol）技术深度解析：AI Agent的标准化接口革命

AI技术的发展路径清晰展现了从对话机器人(Chatbot)→辅助决策助手(Copilot)→自主执行Agent的演进轨迹。随着AI在任务中参与度的不断提升，对**丰富的任务上下文(Context)和执行行动所需的工具(Tool)**的需求也日益增长。平台依赖性强：OpenAI、Google等不同LLM平台的Function Call API实现差异巨大开发耦合度高：工具开发者需要深入了解Agent

AtomGit开源社区

所有评论(0)

查看更多评论

FILOMENA

@FILOMENA

已为社区贡献9条内容

揭秘Anthropic 的产品团队快人一步的原因

FILOMENA

📌 内容摘要

一、Cat Wu在Claude Code团队的角色（00:00-01:29）【中等密度】

1.1 与Boris Cherny的分工

二、Anthropic招PM时看重什么（01:29-04:29）

2.1 AI时代PM面试的致命信号

2.2 为什么招"有产品品味的工程师"

三、Anthropic如何做到每周发版（04:29-08:58）

3.1 极速交付的三个秘密

3.2 交付周期的压缩

3.3 evals over docs（反馈优先于书面）

四、PRD和路线图在Anthropic的演变（08:58-10:28）

4.1 长期路线图的终结

4.2 PRD的新写法

五、Mythos模型与Anthropic的发布节奏（10:28-16:25）

5.1 模型进步的速度

5.2 "拐杖功能"模式（重点方法论）

六、Claude Code源码泄露与Open Claude政策（16:25-20:30）

6.1 源码泄露事件

6.2 Open Claude政策调整

七、PM团队结构与"角色融合"（20:30-28:31）

7.1 PM团队组织架构

7.2 所有角色都在融合

八、Claude的"性格"设计（28:31-33:36）

8.1 personality as product feature（个性作为产品特性）

九、Claude Code vs Desktop vs Co-work（33:36-38:52）

9.1 产品使用切分

9.2 Co-work的意想不到用法

十、人类大脑在哪些地方不可替代（38:52-41:30）

10.1 模型没有的"常识"

十一、如何在龙卷风中保持理智（41:30-47:31）

11.1 面对持续混乱的组织文化

十二、AI时代PM的三项关键技能（47:31-52:00）

12.1 evals（用户反馈）

12.2 product taste（品味）

12.3 first-principles thinking（第一性原理思维）

12.4 最被低估的AI技能

十三、自动化从95%到100%（52:00-57:30）

13.1 95%自动化几乎没有价值

十四、闪电问答（57:30-85:34）

14.1 书籍

14.2 影视

14.3 产品

14.4 座右铭

14.5 AGI之后

核心观点总结

关键数据

核心判断

关键方法论

所有评论(0)

温馨提示：您尚未绑定手机号

FILOMENA