从理论物理到 Google DeepMind:姚顺宇万字访谈核心解析
从理论物理到 Google DeepMind:姚顺宇万字访谈核心解析
AI 已经不再担心“能不能做到”,而是在焦虑“到底该做什么”
最近,一场关于 AI 研究、模型竞争、程序员未来与组织文化的深度访谈,在中文 AI 圈引发了非常大的讨论。
访谈主角是现任 Google DeepMind 研究员姚顺宇——一个从理论物理转向大模型研究的人。
这场对谈的信息密度非常高。
它不仅涉及:
-
大模型是否撞墙
-
OpenAI / Anthropic / Google 的真实差异
-
AI Coding 为什么率先爆发
-
程序员会不会被替代
-
中国 AI 和美国 AI 的差距
-
Long Context 与 Agent 的未来
更重要的是,它透露出一个行业内部越来越明显的信号:
AI 行业已经从“技术能力突破期”,进入了“产品定义焦虑期”。
这篇文章,我会把整场访谈拆成几个核心主题,系统讲透。
一、两位“姚顺宇”:为什么很多人会认错?
访谈一开始,姚顺宇先澄清了一件很有意思的事情:
AI 圈其实有两位“姚顺宇”。
另一位是:
-
清华姚班
-
普林斯顿
-
前 OpenAI
-
现腾讯首席 AI 科学家
而这次访谈中的姚顺宇则是:
-
清华理论物理本科
-
斯坦福理论高能物理博士
-
伯克利短暂博士后
-
曾在 Anthropic 工作
-
后加入 Google DeepMind
他自己调侃:
“最大的区别就是,另一个姚顺宇一开始就是学计算机的。”
但真正有意思的,其实不是“同名”。
而是:
这代表了 AI 行业正在吸引越来越多“非传统 CS 背景”的顶级人才。
尤其是:
-
物理
-
数学
-
统计
-
复杂系统
-
控制论
这些学科正在大量流入 AI。
二、AI 已经进入“下半场”了吗?
很多人最近喜欢说:
“AI 进入下半场了。”
但姚顺宇的回答非常值得思考:
他认为:
现在行业已经不太担心:
“AI 能不能做到。”
真正的问题变成:
“这件事到底应该怎么定义。”
这是一个非常关键的变化。
2024 年以前:能力焦虑
当时大家最担心的是:
-
Agent 能不能实现
-
GPT-4 会不会是天花板
-
多步推理能不能稳定
-
长上下文能不能做
行业核心矛盾是:
“模型到底行不行?”
2025-2026:产品定义焦虑
而现在:
-
Meta
-
OpenAI
-
Google
已经没人真的担心“追不上”。
大家都能:
-
做 Agent
-
做推理
-
做 Coding
-
做长上下文
-
做多模态
于是问题变成:
“那我们到底要拿 AI 做什么?”
这是整个 AI 行业最核心的变化。
也是为什么现在:
模型进步依旧很快,但很多产品却开始越来越同质化。
三、为什么现在的大模型越来越像?
姚顺宇提到一个非常重要的现象:
现在模型的 benchmark 分数已经越来越接近。
他说:
“80% 附近高一点低一点,很多时候已经是 noise,而不是 signal。”
这其实意味着:
Scaling 仍然有效
但“公开指标”开始失效。
大家开始比拼的不是:
-
数学题高 2 分
-
MMLU 高 1%
而是:
-
实际 Agent 能力
-
Coding 工作流
-
Tool Use
-
长任务稳定性
-
用户体验
四、三家模型公司的真实差异
这段是整场访谈最有价值的部分之一。
姚顺宇对几个主流模型做了非常真实的评价:
Claude:最强 Agent
他认为:
Anthropic 的 Claude 目前依然是:
“通用工具使用类 Agent 表现最好的。”
这其实非常符合大量开发者体验。
Claude 的特点:
-
超长上下文稳定
-
Tool Use 很强
-
代码修改能力强
-
长任务一致性高
所以 Cursor 为什么偏爱 Claude,不是偶然。
OpenAI:推理最强
关于 OpenAI 的 o3,他认为:
“纯 reasoning 上最近追上来了一点。”
也就是说:
OpenAI 的优势仍然是:
-
推理
-
复杂链式思考
-
数学
-
规划
Gemini:Coding 与日常场景强
他认为:
Google 的 Gemini:

“在 coding 和日常使用环境下可能目前还是比较好的。”
这其实透露一个重要趋势:
Google 开始真正进入自己的“舒适区”:
-
工程化
-
Infra
-
数据体系
-
大规模训练
Google 的优势终于开始被真正释放。
五、为什么 AI Coding 会率先爆发?
这一部分极其重要。
姚顺宇给出了三个核心原因。
1. Reward Signal 极其清晰
Coding 的奖励机制太明确了:
-
能运行 = 对
-
不能运行 = 错
这比:
-
写文案
-
做设计
-
创作内容
容易太多。
因为这些任务:
“好不好”是模糊的。
但代码不是。
2. GitHub 是天然训练金矿
他说得非常直接:
Coding 有一个天然基础,那就是 GitHub。
这是整个 AI Coding 爆发的根本。
因为:
互联网最大的高质量结构化数据源之一:
就是代码。
3. 好代码有共识
优秀程序员写代码:
其实风格差异没有大家想象得那么大。
所以:
模型特别容易学会“平均优秀”。
这导致:
AI Coding 的天花板非常高。
六、“90% 代码都是 AI 写的”
姚顺宇提到:
现在他自己:
“保守估计 90% 的代码是模型产生的。”
更恐怖的是:
他说:
自己的研究效率相比一年半以前:
提升了 20 到 50 倍。
这已经不是“辅助工具”。
而是:
整个研发范式都被重构了。
七、程序员会不会被替代?
他的观点非常现实。
答案是:
会。
但不会“一瞬间消失”。
而是渐进式替代。
AI 会带来“极化”
他说了一句特别狠的话:
“AI 会让少部分人变得更强,但让大部分人失去独特价值。”
这其实已经发生了。
未来最值钱的人:
不是“会写代码的人”。
而是:
能拆解复杂系统的人

也就是:
-
能定义问题
-
能规划任务
-
能协调多个 AI
-
能做系统设计
-
能理解业务结构
的人。
未来:
“写代码”会越来越像:
今天的“打字”。
八、最震撼的一句话:AI 研究可能并不需要“天才”
姚顺宇有一个特别反直觉的观点:
“AI 这个行业最重要的特质是靠谱。”
他说:
相比物理:
AI 最大的特点是:
实验太容易了
做物理:
你可能缺:
-
粒子加速器
-
实验设备
-
数据
但 AI:
只要有算力。
理论和实验几乎可以一起做。
所以:
AI 行业真正重要的能力:
是:
-
系统性
-
工程能力
-
持续试错
-
排查 bug
-
执行力
而不是:
“灵光一现”。
这其实和很多顶级 AI 研究员的说法越来越一致。
九、“Scaling Law 没有撞墙”
关于现在最热门的问题:
大模型是不是到头了?
姚顺宇的判断非常明确:
“没有。”
而且:
未来几个月他也没看到撞墙迹象。
他认为:
很多人所谓“撞墙”,其实是:
有 bug
这句话其实非常有研究员气质。
因为:
在复杂系统里:
“趋势失效”和“系统出 bug”
经常很难区分。
十、2026 最大方向:Infinite Context
他提出了一个特别重要的概念:
“train with finite text, use as infinite context”
意思是:
模型训练时仍然是有限文本。
但使用时:
可以拥有接近无限上下文。
这意味着什么?
意味着:
真正的个人 AI 助手可能出现
因为模型会:
-
长期记住你
-
持续理解你
-
累积你的行为
-
理解你的偏好
-
跟踪你的长期目标
这其实就是:
Agent 的终极形态。
十一、他为什么离开 Anthropic?
这部分也非常真实。
他说:
离开的原因很多。
包括:
-
对 CEO 某些政治表达不认同
-
公司文化变化
-
Slack 文化过重
-
想学习更多不同方向
但更关键的是:
他想去看:
-
多模态生成
-
不同组织模式
-
Google 的工程体系
这其实也是很多顶级研究员的共同特点:
不断寻找新的“认知增量”。
十二、最值得深思的一句话
访谈最后。
他说:
“大家都是冲浪的人,本质上是那个浪,而不是你。”
这句话非常深。
很多人会把 AI 的成功:
归因于:
-
某个天才
-
某家公司
-
某个模型
但实际上:
真正推动行业的:
是整个技术浪潮本身。
没有人能真正“控制”它。
所有人都只是:
站在浪上的冲浪者。
结语
这场访谈最有价值的地方在于:
它不是“AI 乐观主义”。
也不是“AI 焦虑”。
而是一个真正身处一线的大模型研究员,对行业现状非常冷静的拆解。
整场对话透露出的核心信息其实只有一句:
AI 已经进入了“能力不再稀缺”的时代。
接下来真正稀缺的:
是:
-
问题定义能力
-
产品想象力
-
系统组织能力
-
长任务规划能力
-
多 Agent 协调能力
未来真正厉害的人:
可能不是最会写 Prompt 的人。
而是:
最懂得如何组织 AI 的人。
信息来源:Bilibili《对姚顺宇的4小时访谈:请允许我小疯一下!在Anthropic和Gemini训模型、技术预测、英雄主义已过去》Ai好记转写(2026年5月14日)
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)