从理论物理到 Google DeepMind：姚顺宇万字访谈核心解析

蒜香味可乐

657人浏览 · 2026-05-14 23:29:33

蒜香味可乐 · 2026-05-14 23:29:33 发布

从理论物理到 Google DeepMind：姚顺宇万字访谈核心解析

AI 已经不再担心“能不能做到”，而是在焦虑“到底该做什么”

最近，一场关于 AI 研究、模型竞争、程序员未来与组织文化的深度访谈，在中文 AI 圈引发了非常大的讨论。
访谈主角是现任 Google DeepMind 研究员姚顺宇——一个从理论物理转向大模型研究的人。

这场对谈的信息密度非常高。

它不仅涉及：

大模型是否撞墙
OpenAI / Anthropic / Google 的真实差异
AI Coding 为什么率先爆发
程序员会不会被替代
中国 AI 和美国 AI 的差距
Long Context 与 Agent 的未来

更重要的是，它透露出一个行业内部越来越明显的信号：

AI 行业已经从“技术能力突破期”，进入了“产品定义焦虑期”。

这篇文章，我会把整场访谈拆成几个核心主题，系统讲透。

一、两位“姚顺宇”：为什么很多人会认错？

访谈一开始，姚顺宇先澄清了一件很有意思的事情：

AI 圈其实有两位“姚顺宇”。

另一位是：

清华姚班
普林斯顿
前 OpenAI
现腾讯首席 AI 科学家

而这次访谈中的姚顺宇则是：

清华理论物理本科
斯坦福理论高能物理博士
伯克利短暂博士后
曾在 Anthropic 工作
后加入 Google DeepMind

他自己调侃：

“最大的区别就是，另一个姚顺宇一开始就是学计算机的。”

但真正有意思的，其实不是“同名”。

而是：

这代表了 AI 行业正在吸引越来越多“非传统 CS 背景”的顶级人才。

尤其是：

物理
数学
统计
复杂系统
控制论

这些学科正在大量流入 AI。

二、AI 已经进入“下半场”了吗？

很多人最近喜欢说：

“AI 进入下半场了。”

但姚顺宇的回答非常值得思考：

他认为：

现在行业已经不太担心：

“AI 能不能做到。”

真正的问题变成：

“这件事到底应该怎么定义。”

这是一个非常关键的变化。

2024 年以前：能力焦虑

当时大家最担心的是：

Agent 能不能实现
GPT-4 会不会是天花板
多步推理能不能稳定
长上下文能不能做

行业核心矛盾是：

“模型到底行不行？”

2025-2026：产品定义焦虑

而现在：

Meta
OpenAI
Google

已经没人真的担心“追不上”。

大家都能：

做 Agent
做推理
做 Coding
做长上下文
做多模态

于是问题变成：

“那我们到底要拿 AI 做什么？”

这是整个 AI 行业最核心的变化。

也是为什么现在：

模型进步依旧很快，但很多产品却开始越来越同质化。

三、为什么现在的大模型越来越像？

姚顺宇提到一个非常重要的现象：

现在模型的 benchmark 分数已经越来越接近。

他说：

“80% 附近高一点低一点，很多时候已经是 noise，而不是 signal。”

这其实意味着：

Scaling 仍然有效

但“公开指标”开始失效。

大家开始比拼的不是：

数学题高 2 分
MMLU 高 1%

而是：

实际 Agent 能力
Coding 工作流
Tool Use
长任务稳定性
用户体验

四、三家模型公司的真实差异

这段是整场访谈最有价值的部分之一。

姚顺宇对几个主流模型做了非常真实的评价：

Claude：最强 Agent

他认为：

Anthropic 的 Claude 目前依然是：

“通用工具使用类 Agent 表现最好的。”

这其实非常符合大量开发者体验。

Claude 的特点：

超长上下文稳定
Tool Use 很强
代码修改能力强
长任务一致性高

所以 Cursor 为什么偏爱 Claude，不是偶然。

OpenAI：推理最强

关于 OpenAI 的 o3，他认为：

“纯 reasoning 上最近追上来了一点。”

也就是说：

OpenAI 的优势仍然是：

推理
复杂链式思考
数学
规划

Gemini：Coding 与日常场景强

他认为：

Google 的 Gemini：

“在 coding 和日常使用环境下可能目前还是比较好的。”

这其实透露一个重要趋势：

Google 开始真正进入自己的“舒适区”：

工程化
Infra
数据体系
大规模训练

Google 的优势终于开始被真正释放。

五、为什么 AI Coding 会率先爆发？

这一部分极其重要。

姚顺宇给出了三个核心原因。

1. Reward Signal 极其清晰

Coding 的奖励机制太明确了：

能运行 = 对
不能运行 = 错

这比：

写文案
做设计
创作内容

容易太多。

因为这些任务：

“好不好”是模糊的。

但代码不是。

2. GitHub 是天然训练金矿

他说得非常直接：

Coding 有一个天然基础，那就是 GitHub。

这是整个 AI Coding 爆发的根本。

因为：

互联网最大的高质量结构化数据源之一：

就是代码。

3. 好代码有共识

优秀程序员写代码：

其实风格差异没有大家想象得那么大。

所以：

模型特别容易学会“平均优秀”。

这导致：

AI Coding 的天花板非常高。

六、“90% 代码都是 AI 写的”

姚顺宇提到：

现在他自己：

“保守估计 90% 的代码是模型产生的。”

更恐怖的是：

他说：

自己的研究效率相比一年半以前：

提升了 20 到 50 倍。

这已经不是“辅助工具”。

而是：

整个研发范式都被重构了。

七、程序员会不会被替代？

他的观点非常现实。

答案是：

会。

但不会“一瞬间消失”。

而是渐进式替代。

AI 会带来“极化”

他说了一句特别狠的话：

“AI 会让少部分人变得更强，但让大部分人失去独特价值。”

这其实已经发生了。

未来最值钱的人：

不是“会写代码的人”。

而是：

能拆解复杂系统的人

也就是：

能定义问题
能规划任务
能协调多个 AI
能做系统设计
能理解业务结构

的人。

未来：

“写代码”会越来越像：

今天的“打字”。

八、最震撼的一句话：AI 研究可能并不需要“天才”

姚顺宇有一个特别反直觉的观点：

“AI 这个行业最重要的特质是靠谱。”

他说：

相比物理：

AI 最大的特点是：

实验太容易了

做物理：

你可能缺：

粒子加速器
实验设备
数据

但 AI：

只要有算力。

理论和实验几乎可以一起做。

所以：

AI 行业真正重要的能力：

是：

系统性
工程能力
持续试错
排查 bug
执行力

而不是：

“灵光一现”。

这其实和很多顶级 AI 研究员的说法越来越一致。

九、“Scaling Law 没有撞墙”

关于现在最热门的问题：

大模型是不是到头了？

姚顺宇的判断非常明确：

“没有。”

而且：

未来几个月他也没看到撞墙迹象。

他认为：

很多人所谓“撞墙”，其实是：

有 bug

这句话其实非常有研究员气质。

因为：

在复杂系统里：

“趋势失效”和“系统出 bug”

经常很难区分。

十、2026 最大方向：Infinite Context

他提出了一个特别重要的概念：

“train with finite text, use as infinite context”

意思是：

模型训练时仍然是有限文本。

但使用时：

可以拥有接近无限上下文。

这意味着什么？

意味着：

真正的个人 AI 助手可能出现

因为模型会：

长期记住你
持续理解你
累积你的行为
理解你的偏好
跟踪你的长期目标

这其实就是：

Agent 的终极形态。

十一、他为什么离开 Anthropic？

这部分也非常真实。

他说：

离开的原因很多。

包括：

对 CEO 某些政治表达不认同
公司文化变化
Slack 文化过重
想学习更多不同方向

但更关键的是：

他想去看：

多模态生成
不同组织模式
Google 的工程体系

这其实也是很多顶级研究员的共同特点：

不断寻找新的“认知增量”。

十二、最值得深思的一句话

访谈最后。

他说：

“大家都是冲浪的人，本质上是那个浪，而不是你。”

这句话非常深。

很多人会把 AI 的成功：

归因于：

某个天才
某家公司
某个模型

但实际上：

真正推动行业的：

是整个技术浪潮本身。

没有人能真正“控制”它。

所有人都只是：

站在浪上的冲浪者。

结语

这场访谈最有价值的地方在于：

它不是“AI 乐观主义”。

也不是“AI 焦虑”。

而是一个真正身处一线的大模型研究员，对行业现状非常冷静的拆解。

整场对话透露出的核心信息其实只有一句：

AI 已经进入了“能力不再稀缺”的时代。

接下来真正稀缺的：

是：

问题定义能力
产品想象力
系统组织能力
长任务规划能力
多 Agent 协调能力

未来真正厉害的人：

可能不是最会写 Prompt 的人。

而是：

最懂得如何组织 AI 的人。

信息来源：Bilibili《对姚顺宇的4小时访谈：请允许我小疯一下！在Anthropic和Gemini训模型、技术预测、英雄主义已过去》Ai好记转写（2026年5月14日）

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

开源端侧 AI Agent 全栈架构解析：Mano-P 模型 + Cider 推理加速 + AFK 自动构建

AtomGit开源社区

网络流量分析（NTA）：企业安全运营的“数字听诊器“

AtomGit开源社区

《流畅的Python》读书笔记04(补充01): 字典和集合 - Python 3 中字典与集合类型全解析

构建复杂的数据结构，利用字典和集合的高效查找特性实现全文搜索功能。倒排索引是搜索引擎的核心数据结构，充分体现了字典在构建映射关系方面的优势。注：ChainMap查找时间复杂度为O(k)，k为链中映射数量[ref_1]使用dict.get或setdefault。这个综合示例展示了如何结合使用。Python 映射类型架构。使用defaultdict。使用OrderedDict。考虑list或tuple