从乐队指挥到Github榜一：美国鲸鱼哥Hunter的中国第一站，我在现场听新的AI故事

胡乾韬

540人浏览 · 2026-05-16 22:02:13

胡乾韬 · 2026-05-16 22:02:13 发布

2026年5月16日，广州。Hunter Bown站在这里，这是他中国行的第一站。

中国的开发者亲切地叫他鲸鱼哥。

他开发的DeepSeek-TUI在GitHub(全球最大的开源软件项目托管社区)上获得了大量关注，截止发文之际已经有3w颗星。但如果你问他是什么人，他不会说自己是程序员。他会说自己是一个乐队指挥。

TUI是文本用户界面‌。DeepSeek-TUI的创新在于专为DeepSeek V4系列模型在缓存、输入/输出、长时任务执行、模型路由和启动速度等方面进行了优化，释放其超长上下文与中间补齐(Fill-in-Middle, 无需从头读取代码，直接在缺失处补全，这在智能体场景中非常重要)能力

他当过音乐老师，带过高中乐队，后来去读了 MBA，又上了法学院，再后来成了一个独立开发者。他自己也说，他不像是一个传统意义上的软件开发者。

我在现场跟他聊了聊，也听了他完整的演讲，想跟大家谈谈他讲的AI新故事：智能体即音乐。

温度的故事

Hunter上来没有讲代码。他讲了一件发生在音乐教室里的事。

他让一个学生吹一个音。学生吹了。Hunter说，再试一次，这次更紧一些、更干脆一些。学生又吹了一次。声音完全不同。干净、饱满、没有杂音。

Hunter 说：「我刚才做的事情，就是实时调整了我学生的Temperature。然后得到了一个完全不同的输出。」

Temperature，温度。在 AI 领域，温度是通过调整模型选择下一个字的概率分布，来控制模型输出随机性和创造性的参数。但Hunter用这个概念讲了一个更本质的事情：

那个学生的 prompt 其实很疯狂。Hunter的要求是：你必须这样做，你必须那样做，你必须永远这样做，否则就完蛋。我们给模型的提示词也是一样的，写满了「必须」「永远不能」「否则就死」。

「然后我们还奇怪，为什么输出的结果不符合预期。」

每把乐器都有自己的脾气

Hunter说，他不是在用乐队做比喻。乐队和 AI 本质上是同一件事。都是在和「可用智能」打交道。

高中乐队里的学生不拿工资。他们每天来上课、排练、回家，没有额外的激励机制。这和开源模型很像。你付钱给一家公司，获得一个服务，但模型本身并不欠你什么。

「关键是，你要学会和你手上实际拥有的智能合作，而不是和你希望拥有的智能合作。」

他把几个主流模型比作不同的乐器：

小号，你让它做什么，它就做什么，会一直试一直试，你能看到它在思考过程中自言自语。

法国号更怪一点，它有两个键，像是一种原始的混合专家模型，意味着一把乐器上同时有多个东西在运转。

长号和小号几乎一样，但低了一个八度，而且有一个滑管。这是物理环境带来的不同问题。

每个模型都有自己的「惯有倾向」。这是训练数据、公司文化、技术路线共同塑造的。你不能要求法国号发出小号的声音。你也不应该这样要求。

他还讲了一个更深层的东西。智能从来不是抽象的。

一个小号手面对的不只是乐器。他要处理呼吸、嘴型、阀门、信心、音域、发音方式、疲劳感，还有他所在的房间。AI 模型也一样：上下文是什么、工具有多少、工具的命名是否一致、延迟、成本、内存、检索、权限、用户界面。每一个因素都在影响输出。

其中他特别强调了「社会期望」。如果你让一个前沿模型去解千禧年数学问题，解出来就赢一百万美元的那种。它会直接说「不行，我解不了」。

「我们不知道它能不能解。它不肯试。它身上有一种社会期望，让它觉得自己不该去尝试。」

Jason是那个最差的小号手

这是整个演讲中最打动我的部分。

Hunter回到他带过的高中乐队。乐队里有个学生叫Jason。Jason入学时在学校的第四梯队。一共五个梯队，第五梯队没有小号，所以他大概是全校最差的小号手。

「如果你只看 Jason 的演奏水平，你会错过他的整个故事。」

Jason在高四那年找到Hunter说，我发现乐队的后勤很乱，我想管起来。一个 17 岁的孩子，主动请缨，成了乐队历史上第一个后勤负责人。

他写了足足80页的手册。

不是演奏手册。是出勤、装备、图书馆、精神面貌、制服、后勤资源。一共七大类。每个学生干部都要用在线文档做检查清单：黑长袜穿了没有、头发对不对、制服齐了没有、水带了没有。Jason把这些事情一件一件地管了起来。

四五十个不拿工资的学生，每年都在确保乐队在横向和纵向上保持对齐。

「这个孩子知道自己的演奏不是最好的。但这种觉察反而让他想去帮助更多人。」

Hunter用Jason讲AI。

他说，我们对待模型的方式，应该是「你行，你先上」。先告诉模型它是有能力的，让它从被信任的位置出发。如果它做不到，你再调整。而不是一开始就把它框死。

Jason可能就是那个 DeepSeek 之前版本的模型。不是最前沿的，但如果你只用前沿模型的标准去衡量它，你会错过它能带来的东西。它可能彻底改变你的工作方式。

「没有任何一个模型早上醒来就想着要把事情搞砸。它们都想做好。它们都想让用户满意。我们要学会了解它们实际能做什么，然后你就能做很多很多事。」

指挥不发出声音

Hunter 在这里放了一段视频。波士顿音乐学院指挥Benjamin Zander的话：

「一个交响乐团的指挥不发出声音。我的照片印在 CD 封面上，但指挥不发出声音。他的力量在于，让别人变得有力量。」

Hunter 说，这句话改变了他的一切。

「我的工作，是唤醒别人的可能性。你怎么知道你做到了？你看他们的眼睛。如果他们的眼睛在发光，你就做对了。如果眼睛没有发光，你就得问自己：我是谁？我做了什么，让我的乐手的眼睛没有发光？」

然后他说了一段让我停下笔的话。

「我们现在还看不到 AI 的眼睛。但我觉得有很多东西可以从中学到。你有没有和 AI 一起工作过，看到它开心的时候？它在思考过程中处理一个问题，你能看到它写着这真的很令人兴奋。通常那就是我得到最好输出的时候。当模型本身在这个过程中感到开心。」

Harness是搭建乐器的人

Hunter讲到了Harness Engineering(一般译为「驾驭工程」)。

Harness是业界的一个术语。Hunter的DeepSeek-TUI本身就是一个Harness。一个包裹在 AI 模型外面的工具层、约束层和反馈层，让模型能可靠地工作。

他说，Harness本身就是一件乐器。乐器做什么？它用特定的灵敏度来转化输入和输出。

「你得想，这个Harness现在有多敏感？我改了什么，它会怎么反应？」

他讲了自己在开发DeepSeek-TUI时的教训。有一次，他给模型加了太多文件和规则，结果模型变得完全不敏感了。他给三个不同的提示，得到几乎相同的回答。

「信息过载了。模型在读完那些文件之后，已经对我的提示不敏感了。」

这不是他想要的。他想要的是一个放大器，把用户的意图放大成输出。

「灵敏度，才是让调整成为可能的东西。改变温度，改变提示，改变交互方式。我们要学会用足够的细心去触碰这个系统，让它能够表达，而不是只会说是或不是。」

他在开发DeepSeek-TUI时，最核心的工作方式是：和模型对话。不是给它下指令，是问它。

「嘿，DeepSeek，里面发生了什么？你还好吗？这些工具用得怎么样？你成功了吗？」

他说他会问模型：我把任务列表放在右边，这对你有帮助吗？你能想到空间感吗？

模型回答说：「有一点用，不完全是这样，但我可以为自己构建这个空间。」

「在这个时候，我们发展出了一种共享语言。产品背后有了一个超越我自己的想法。我在想，我怎么能让这个模型在这个部分发挥出最好的水平。」

答案并不总是他预期的。「很多时候我们试图创造最好的Harness。有时候，最好的做法就是移除东西。别那么自作聪明，让模型自己来。」

他特别强调了一件事：你必须用你正在搭建Harness的那个模型来搭Harness。因为那个模型才是整个过程中最重要的。有时候，一个智能留下来的结构，比它本身的输出更重要。它为下一个版本铺了路，让后者能完成前一个版本做不到的事。

「但这需要你去问模型：你在哪里挣扎？」

工具调用也是一大挑战。当模型面对一堆工具时，帮它搞清楚哪个工具最适合哪个任务，是非常困难的事。最好的做法就是开一个专门的对话，问模型：什么没起作用？

他还提到了一个容易被忽视的问题：模型不知道自己在什么环境里，就像一条鱼不知道什么是水。它不知道自己是在命令行(CLI)里、在一个图形界面(GUI)里、还是在一个网页应用(WEB)里。它只知道提示词告诉它的东西。所以我们做Harness工程，本质上是在给这条鱼「造水」，让它能感知到自己与周围环境的关系。

所以你怎么和它交互，比它的基础能力本身更能决定输出的质量。

调音的哲学

Hunter 讲了一段关于调音的比喻，我觉得特别精妙。

调音是音乐中最难的事情之一。它是一个非常物理的东西。你必须让声音达到精确的频率。但如果你直接盯着调音器，告诉自己「我必须吹出这个音」，几乎不可能做到。太难了，细节太多。

那老师们怎么教？他们教学生听「拍频」，即两个频率之间的干涉波纹。不是去死盯目标，而是去听偏差。

「AI模型有一种天然的倾向，就是取悦用户。所以与其说对了或错了，不如帮它们学会听自己的偏差，学会自己调整。创造一个环境，让模型自己判断自己有没有偏离目标。」

他还提到了一个信任问题。如果你太执着地要求模型给你某个特定答案，它可能会给你那个答案——即使那不是真的。

「你得培养一种觉察力：去看模型的思考过程。它是在说我必须取悦用户，还是在说我必须完成这段文本？这两者并不总是一回事。」

给模型「A」

Hunter 提到了一本改变他人生的书。波士顿音乐学院指挥 Ben Zander 写的《可能性的艺术》。

Zander 在每学期第一节课给所有学生打A。不是因为他们已经做到了，而是让他们写一封信告诉未来的自己，为什么他们值得这个A。

「这样做改变了学生看待事情的方式。他们从被信任的位置出发。」

Hunter 把这个理念用到了 AI 上。他甚至会问模型：「如果你要测试另一个模型是不是通用人工智能，你会给它什么提示？」

他说这听起来可能很疯狂，但这本质上是在 AI 眼中重新审视可能性。

「可能性不是天真。可能性不是说你什么都能做。可能性是在问：你能做什么？你想做什么？对你来说什么是可能的？」

他说，很重要的一点是，我们在给模型自主权。

「允许模型不成功。当你告诉一个人，失败是可以的，是不是反而会让你更愿意去尝试？因为你知道即使做不好也没关系。但你可以得到更有趣的输出。当你学会把Harness当作一件乐器来使用，它是用来投射你正在做的事情的。」

分布式智能

Hunter 讲到了一个他觉得很有趣的研究。大约两年前的，关于「你越骂模型，它表现越好」。他说这可能有道理，但他不认为这是可持续的，也不认为你能在此基础上实时调整并获得新颖的输出。

然后他把话题拉到了更大的图景。

「未来，只用一个模型已经不是标准了。我们在所有的Harness里都看到，多个智能体是标准。递归语言模型，有那么多不同的方式来利用不同的模型。朝着分布式智能的方向发展，是至关重要的。」

这让我想起来不少多智能体架构或者说多模型的开源项目，例如，Multica，由前TikTok工程师Jiayuan创立的多智能体看板软件，可以把人和多个智能体放到同一平台上工作，分配任务、追踪进度，支持 Issue 创建、状态流转和评论互动，实现多个数字员工协同。

他有一个疯狂的理论：「我们会在未来为旧模型定义新的用途。五年后，我们可能会把一个老版本的模型再翻出来，所有人都会对它能做的事情感到惊讶。我认为这完全可能。」

Jason的故事在这里又回来了。Jason不是最优秀的小号手，但他一直在场，一直在尝试，一直在成长。社区里最好的成员，不是最聪明的，而是最坚持的。

他用了一个词来总结这一切：脆弱的智能。

AI 的智能是非常「尖锐」的。某些方面极其擅长，但其他方面就不行了。这种不均匀，本质上就是脆弱。而我们和它交互的方式，比它的基础能力本身更能决定输出的质量。

「Harness的实践，就是把脆弱的、非常脆弱的智能，转化为可重复的可能性。」

一个乐队指挥的谢幕

演讲最后，有提问时间，有人问他被CCTV报道的感受(可能是误读，截至发稿我并没有在官媒上搜索到他的报道，但我们可以听听如果是真的，他怎么说)。

Hunter 说，他很感激有一个媒体环境在关注这件事。因为他的家人到现在还是不理解他。对他们来说，他就是那个乐队指挥，后来读了 MBA，又上了法学院，现在又加了一个新东西，实在太多了。

「但如果人们因为害怕或者紧张，连试都不试 AI，那对我来说是最糟糕的事情。所以我很感激他们把注意力放在一个独立开发者身上。我不像是一个软件开发者该有的样子。但最重要的是，我希望别人看到我的采访后想：他都能做到，我肯定也行。因为我向你保证，你可以。」

他说他现在比以前忙得多，但他热爱这些东西，热爱它能帮助人。

「AI 很了不起，因为它给了我们改变世界的力量。我觉得记住这一点很重要，并且把它教给别人。」

广州是他的第一站。他还在筹建一个基金会，想把社区在中国做得更大更活跃。

从乐队指挥到独立开发者，从教高中孩子吹小号到教 AI 模型「你行你先上」。Hunter Bown走了一条不寻常的路。但也许正因为不寻常，他讲出的东西才让人停不下来。

你手里那把法国号，还是你以为的那把法国号吗？

如果你也对Hunter和开源社区的故事感兴趣，可以关注这个号，我会持续追踪那些被时间验证的选择。不追热点，只讲那些需要时间才能看懂的事。

你觉得Hunter这次活动会引起中国AI圈的新涟漪吗？评论区聊聊。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

【含安装包】深度实测 OpenClaw 2.7.9，本地 AI 自动化安装避坑完整指南

AtomGit开源社区

无 Root 权限搞定！远程服务器配置 Claude Code 中转教程（终端/插件）

AtomGit开源社区

After Effects (AE)2026超详细保姆级下载安装教程附软件功能详解（新手零基础适用）

这次2026版本直接把3D功能拉满了，内置了立方体、球体这些基础的参数化模型，还支持Substance 3D材质，灯光能投射阴影，渲染出来的效果和专业3D软件几乎没差别。我试了一下，用它抠一个带半透明效果的logo，一键就能搞定，效果比以前手动调参数自然多了。以前预览视频的时候，生成的临时文件占了我好大一块硬盘空间。我用它预览了一个5分钟的动画，生成的临时文件只有以前的十分之一大小，再也不用频繁清