2026年5月16日,广州。Hunter Bown站在这里,这是他中国行的第一站

Hunter在现场受到热捧

中国的开发者亲切地叫他鲸鱼哥

让Hunter出圈的推文(原文即是中文)

他开发的DeepSeek-TUI在GitHub(全球最大的开源软件项目托管社区)上获得了大量关注,截止发文之际已经有3w颗星。但如果你问他是什么人,他不会说自己是程序员。他会说自己是一个乐队指挥

TUI是文本用户界面‌。DeepSeek-TUI的创新在于专为DeepSeek V4系列模型在缓存、输入/输出、长时任务执行、模型路由和启动速度等方面进行了优化,释放其超长上下文与中间补齐(Fill-in-Middle, 无需从头读取代码,直接在缺失处补全,这在智能体场景中非常重要)能力

他当过音乐老师,带过高中乐队,后来去读了 MBA,又上了法学院,再后来成了一个独立开发者。他自己也说,他不像是一个传统意义上的软件开发者。

我在现场跟他聊了聊,也听了他完整的演讲,想跟大家谈谈他讲的AI新故事:智能体即音乐。

温度的故事

Hunter上来没有讲代码。他讲了一件发生在音乐教室里的事。

他让一个学生吹一个音。学生吹了。Hunter说,再试一次,这次更紧一些、更干脆一些。学生又吹了一次。声音完全不同。干净、饱满、没有杂音。

Hunter 说:「我刚才做的事情,就是实时调整了我学生的Temperature。然后得到了一个完全不同的输出。」

Temperature,温度。在 AI 领域,温度是通过调整模型选择下一个字的概率分布,来控制模型输出随机性和创造性的参数。但Hunter用这个概念讲了一个更本质的事情:

那个学生的 prompt 其实很疯狂。Hunter的要求是:你必须这样做,你必须那样做,你必须永远这样做,否则就完蛋。我们给模型的提示词也是一样的,写满了「必须」「永远不能」「否则就死」。

给模型一个「温度」

「然后我们还奇怪,为什么输出的结果不符合预期。」

每把乐器都有自己的脾气

Hunter说,他不是在用乐队做比喻。乐队和 AI 本质上是同一件事。都是在和「可用智能」打交道。

高中乐队里的学生不拿工资。他们每天来上课、排练、回家,没有额外的激励机制。这和开源模型很像。你付钱给一家公司,获得一个服务,但模型本身并不欠你什么。

「关键是,你要学会和你手上实际拥有的智能合作,而不是和你希望拥有的智能合作。」

他把几个主流模型比作不同的乐器:

小号,你让它做什么,它就做什么,会一直试一直试,你能看到它在思考过程中自言自语

法国号更怪一点,它有两个键,像是一种原始的混合专家模型,意味着一把乐器上同时有多个东西在运转。

长号和小号几乎一样,但低了一个八度,而且有一个滑管。这是物理环境带来的不同问题。

每个模型都有自己的「惯有倾向」。这是训练数据、公司文化、技术路线共同塑造的。你不能要求法国号发出小号的声音。你也不应该这样要求

模型就像乐器各有特点

他还讲了一个更深层的东西。智能从来不是抽象的。

一个小号手面对的不只是乐器。他要处理呼吸、嘴型、阀门、信心、音域、发音方式、疲劳感,还有他所在的房间。AI 模型也一样:上下文是什么、工具有多少、工具的命名是否一致、延迟、成本、内存、检索、权限、用户界面。每一个因素都在影响输出。

其中他特别强调了「社会期望」。如果你让一个前沿模型去解千禧年数学问题,解出来就赢一百万美元的那种。它会直接说「不行,我解不了」。

「我们不知道它能不能解。它不肯试。它身上有一种社会期望,让它觉得自己不该去尝试。」

Jason是那个最差的小号手

这是整个演讲中最打动我的部分。

Hunter回到他带过的高中乐队。乐队里有个学生叫Jason。Jason入学时在学校的第四梯队。一共五个梯队,第五梯队没有小号,所以他大概是全校最差的小号手

「如果你只看 Jason 的演奏水平,你会错过他的整个故事。」

Jason在高四那年找到Hunter说,我发现乐队的后勤很乱,我想管起来。一个 17 岁的孩子,主动请缨,成了乐队历史上第一个后勤负责人。

他写了足足80页的手册。

不是演奏手册。是出勤、装备、图书馆、精神面貌、制服、后勤资源。一共七大类。每个学生干部都要用在线文档做检查清单:黑长袜穿了没有、头发对不对、制服齐了没有、水带了没有。Jason把这些事情一件一件地管了起来。

四五十个不拿工资的学生,每年都在确保乐队在横向和纵向上保持对齐

这本手册至今仍在使用

「这个孩子知道自己的演奏不是最好的。但这种觉察反而让他想去帮助更多人。」

Hunter用Jason讲AI。

他说,我们对待模型的方式,应该是「你行,你先上」。先告诉模型它是有能力的,让它从被信任的位置出发。如果它做不到,你再调整。而不是一开始就把它框死

脆弱的智能需要正确的结构

Jason可能就是那个 DeepSeek 之前版本的模型。不是最前沿的,但如果你只用前沿模型的标准去衡量它,你会错过它能带来的东西。它可能彻底改变你的工作方式

「没有任何一个模型早上醒来就想着要把事情搞砸。它们都想做好。它们都想让用户满意。我们要学会了解它们实际能做什么,然后你就能做很多很多事。」

指挥不发出声音

Hunter 在这里放了一段视频。波士顿音乐学院指挥Benjamin Zander的话

「一个交响乐团的指挥不发出声音。我的照片印在 CD 封面上,但指挥不发出声音。他的力量在于,让别人变得有力量。」

Hunter 说,这句话改变了他的一切。

我的工作,是唤醒别人的可能性。你怎么知道你做到了?你看他们的眼睛。如果他们的眼睛在发光,你就做对了。如果眼睛没有发光,你就得问自己:我是谁?我做了什么,让我的乐手的眼睛没有发光?

播放Zander的原视频

然后他说了一段让我停下笔的话。

我们现在还看不到 AI 的眼睛。但我觉得有很多东西可以从中学到。你有没有和 AI 一起工作过,看到它开心的时候?它在思考过程中处理一个问题,你能看到它写着这真的很令人兴奋。通常那就是我得到最好输出的时候。当模型本身在这个过程中感到开心。」

Harness是搭建乐器的人

Hunter讲到了Harness Engineering(一般译为「驾驭工程」)。

Harness是业界的一个术语。Hunter的DeepSeek-TUI本身就是一个Harness。一个包裹在 AI 模型外面的工具层、约束层和反馈层,让模型能可靠地工作。

他说,Harness本身就是一件乐器。乐器做什么?它用特定的灵敏度来转化输入和输出。

「你得想,这个Harness现在有多敏感?我改了什么,它会怎么反应?」

他讲了自己在开发DeepSeek-TUI时的教训。有一次,他给模型加了太多文件和规则,结果模型变得完全不敏感了。他给三个不同的提示,得到几乎相同的回答。

信息过载了。模型在读完那些文件之后,已经对我的提示不敏感了。」

这不是他想要的。他想要的是一个放大器,把用户的意图放大成输出

「灵敏度,才是让调整成为可能的东西。改变温度,改变提示,改变交互方式。我们要学会用足够的细心去触碰这个系统,让它能够表达,而不是只会说是或不是。」

他在开发DeepSeek-TUI时,最核心的工作方式是:和模型对话。不是给它下指令,是问它。

DeepSeek TUI界面

「嘿,DeepSeek,里面发生了什么?你还好吗?这些工具用得怎么样?你成功了吗?」

他说他会问模型:我把任务列表放在右边,这对你有帮助吗?你能想到空间感吗?

模型回答说:「有一点用,不完全是这样,但我可以为自己构建这个空间。」

「在这个时候,我们发展出了一种共享语言。产品背后有了一个超越我自己的想法。我在想,我怎么能让这个模型在这个部分发挥出最好的水平。」

答案并不总是他预期的。「很多时候我们试图创造最好的Harness。有时候,最好的做法就是移除东西。别那么自作聪明,让模型自己来。」

他特别强调了一件事:你必须用你正在搭建Harness的那个模型来搭Harness。因为那个模型才是整个过程中最重要的。有时候,一个智能留下来的结构,比它本身的输出更重要。它为下一个版本铺了路,让后者能完成前一个版本做不到的事。

「但这需要你去问模型:你在哪里挣扎?

工具调用也是一大挑战。当模型面对一堆工具时,帮它搞清楚哪个工具最适合哪个任务,是非常困难的事。最好的做法就是开一个专门的对话,问模型:什么没起作用?

他还提到了一个容易被忽视的问题:模型不知道自己在什么环境里,就像一条鱼不知道什么是水。它不知道自己是在命令行(CLI)里、在一个图形界面(GUI)里、还是在一个网页应用(WEB)里。它只知道提示词告诉它的东西。所以我们做Harness工程,本质上是在给这条鱼「造水」,让它能感知到自己与周围环境的关系。

所以你怎么和它交互,比它的基础能力本身更能决定输出的质量

调音的哲学

Hunter 讲了一段关于调音的比喻,我觉得特别精妙。

调音是音乐中最难的事情之一。它是一个非常物理的东西。你必须让声音达到精确的频率。但如果你直接盯着调音器,告诉自己「我必须吹出这个音」,几乎不可能做到。太难了,细节太多。

那老师们怎么教?他们教学生听「拍频」,即两个频率之间的干涉波纹。不是去死盯目标,而是去听偏差。

「AI模型有一种天然的倾向,就是取悦用户。所以与其说对了或错了,不如帮它们学会听自己的偏差,学会自己调整。创造一个环境,让模型自己判断自己有没有偏离目标。」

关注AI的拍频

他还提到了一个信任问题。如果你太执着地要求模型给你某个特定答案,它可能会给你那个答案——即使那不是真的。

「你得培养一种觉察力:去看模型的思考过程。它是在说我必须取悦用户,还是在说我必须完成这段文本?这两者并不总是一回事。」

给模型「A」

Hunter 提到了一本改变他人生的书。波士顿音乐学院指挥 Ben Zander 写的《可能性的艺术》。

Zander 在每学期第一节课给所有学生打A。不是因为他们已经做到了,而是让他们写一封信告诉未来的自己,为什么他们值得这个A

「这样做改变了学生看待事情的方式。他们从被信任的位置出发。」

打A的艺术

Hunter 把这个理念用到了 AI 上。他甚至会问模型:「如果你要测试另一个模型是不是通用人工智能,你会给它什么提示?」

他说这听起来可能很疯狂,但这本质上是在 AI 眼中重新审视可能性

可能性不是天真。可能性不是说你什么都能做。可能性是在问:你能做什么?你想做什么?对你来说什么是可能的?

他说,很重要的一点是,我们在给模型自主权

允许模型不成功。当你告诉一个人,失败是可以的,是不是反而会让你更愿意去尝试?因为你知道即使做不好也没关系。但你可以得到更有趣的输出。当你学会把Harness当作一件乐器来使用,它是用来投射你正在做的事情的。」

分布式智能

Hunter 讲到了一个他觉得很有趣的研究。大约两年前的,关于「你越骂模型,它表现越好」。他说这可能有道理,但他不认为这是可持续的,也不认为你能在此基础上实时调整并获得新颖的输出

然后他把话题拉到了更大的图景。

「未来,只用一个模型已经不是标准了。我们在所有的Harness里都看到,多个智能体是标准。递归语言模型,有那么多不同的方式来利用不同的模型。朝着分布式智能的方向发展,是至关重要的。

这让我想起来不少多智能体架构或者说多模型的开源项目,例如,Multica,由前TikTok工程师Jiayuan创立的多智能体看板软件,可以把人和多个智能体放到同一平台上工作,分配任务、追踪进度,支持 Issue 创建、状态流转和评论互动,实现多个数字员工协同。

Multica项目

他有一个疯狂的理论:「我们会在未来为旧模型定义新的用途。五年后,我们可能会把一个老版本的模型再翻出来,所有人都会对它能做的事情感到惊讶。我认为这完全可能。」

分布式智能网络为旧模型带来新希望

Jason的故事在这里又回来了。Jason不是最优秀的小号手,但他一直在场,一直在尝试,一直在成长。社区里最好的成员,不是最聪明的,而是最坚持的。

他用了一个词来总结这一切:脆弱的智能

AI 的智能是非常「尖锐」的。某些方面极其擅长,但其他方面就不行了。这种不均匀,本质上就是脆弱。而我们和它交互的方式,比它的基础能力本身更能决定输出的质量。

「Harness的实践,就是把脆弱的、非常脆弱的智能,转化为可重复的可能性。」

一个乐队指挥的谢幕

演讲最后,有提问时间,有人问他被CCTV报道的感受(可能是误读,截至发稿我并没有在官媒上搜索到他的报道,但我们可以听听如果是真的,他怎么说)。

Hunter回答开发者提问

Hunter 说,他很感激有一个媒体环境在关注这件事。因为他的家人到现在还是不理解他。对他们来说,他就是那个乐队指挥,后来读了 MBA,又上了法学院,现在又加了一个新东西,实在太多了

「但如果人们因为害怕或者紧张,连试都不试 AI,那对我来说是最糟糕的事情。所以我很感激他们把注意力放在一个独立开发者身上。我不像是一个软件开发者该有的样子。但最重要的是,我希望别人看到我的采访后想:他都能做到,我肯定也行。因为我向你保证,你可以。」

他说他现在比以前忙得多,但他热爱这些东西,热爱它能帮助人。

「AI 很了不起,因为它给了我们改变世界的力量。我觉得记住这一点很重要,并且把它教给别人。」

广州是他的第一站。他还在筹建一个基金会,想把社区在中国做得更大更活跃。

从乐队指挥到独立开发者,从教高中孩子吹小号到教 AI 模型「你行你先上」。Hunter Bown走了一条不寻常的路。但也许正因为不寻常,他讲出的东西才让人停不下来。

你手里那把法国号,还是你以为的那把法国号吗?

如果你也对Hunter和开源社区的故事感兴趣,可以关注这个号,我会持续追踪那些被时间验证的选择。不追热点,只讲那些需要时间才能看懂的事。

你觉得Hunter这次活动会引起中国AI圈的新涟漪吗?评论区聊聊。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐