我是否已经跟不上人工智能时代的步伐了？

王小纤

594人浏览 · 2026-06-04 10:58:14

王小纤 · 2026-06-04 10:58:14 发布

人工智能领域充斥着带有随机器官的陈旧基础设施。

这句话或许比任何解释都更能说明我最近为何感觉速度变慢。并非因为我不再关注人工智能，也并非因为我无法再进行开发，更不是因为工具已经超越了我的能力。恰恰相反，工具的发展方向恰恰相反：它们让我能够更快地生成代码、更快地制作原型、更快地触及那些我通常需要逐层处理的各个层面。

然而，在工作中，我却感觉自己慢了下来。

这才是最让人不舒服的地方。人工智能给我的感觉是所有事情都应该进展得更快，但我越是认真地使用它，就越会发现自己把时间浪费在那些进展缓慢的部分。代码很快就出现了，草稿很快就出现了，工作流程也很快就出现了。但接下来，我需要理解它究竟在做什么。我需要测试各个组件之间的边界。我需要验证结果不仅合情合理，而且足够正确，能够经受住现实的考验。

这或许是人工智能发展中的第一个真正陷阱：

创建成本变得低廉，但验证成本却并非如此。

这听起来很简单，几乎显而易见，但我认为这正是我们许多人感到速度与疲惫之间奇怪不匹配的原因。我们现在能够生成的内容远超我们能够轻松检查的范围。过去需要几天才能勾勒出的功能，现在几个小时就能完成。后端路由、前端组件、提示链、测试、部署脚本、工作流程图：所有这些都可以快速生成，从而造成整个流程被压缩的错觉。

但整个过程并没有被压缩。

贵重物品搬走了。

你仍然需要理解系统。你仍然需要验证假设。你仍然需要测试端到端的行为。你仍然需要问自己，这套系统是否稳定、可维护、安全、可观察，以及是否符合最初的设想。人工智能降低了初稿的成本，但也使得一次性在更多层面上生成初稿变得更加容易。因此，最终的负担往往会变得更重，而不是更轻。

在人工智能出现之前，开发过程中存在着一种天然的摩擦。编写速度较慢，因此产品开发和理解之间的距离更近。而现在，产品开发的速度可能远远超过理解速度。开发速度可能超过理解速度。一旦这种情况发生，瓶颈就显而易见了。

这不是在打字。

这甚至算不上编程。

这是审判。

这就是我感到迟缓的原因。我并不像人工智能那样擅长加速，而是在加速之后的关键环节上迟缓。当我需要判断一个生成的事物是否值得存在于系统中时，我就会感到迟缓。当我需要从“这能运行一次”过渡到“这足够可靠，可以成为基础设施”时，我也会感到迟缓。

在嘈杂的田野里，这种缓慢的速度看起来并不好。

人工智能领域奖励行动。它奖励那些反应迅速、快速重命名、快速打包、快速评论，并在概念尚未冷却之前就发布的人。每周都会出现新的模型、新的基准测试、新的代理框架、新的“颠覆一切”的时刻，以及看似将取代半个行业的新工具，然后两周后又消失在GitHub的归档文件中。

后来，我渐渐厌倦了追逐它。

不完全是这样。我仍然关注这个领域，仍然关心那些真正重要的事情。但我不再有精力去认真对待每一个版本发布、每一个演示、每一个讨论帖，以及每一个带有渐变背景的AI产品。概念验证不是产品，提示链不是认知，封装器不是基础设施，仪表盘也不是智能操作系统，仅仅因为有人在首页写了“智能体”这个词，它就不是智能操作系统。

一段时间后，噪音就会变得代价高昂。

当我不再追逐每一个更新时，一件奇怪的事情发生了。我并没有对人工智能失去兴趣，反而对一些古老的事物更感兴趣了。

分布式系统。权限。控制回路。网络优化。关注点分离。路由。握手。反馈。生物系统。蚁群。病毒。进化。复杂自适应系统。

我对人工智能研究得越多，就越发现老问题以新的形式重现。它们并非完美复制，也并非自动解决，但它们确实存在。同样的问题类型不断以新的语言出现。各个部分如何协调？谁有权访问哪些资源？决策在哪里做出？当某个组件静默失效时会发生什么？如何防止局部不确定性演变为全局问题？当系统的某些部分以概率形式表达时，如何保持系统的可观测性？

这就是为什么我一直说，人工智能基础设施常常感觉像是有着随机器官的旧基础设施。身体结构是熟悉的，但各个器官的运作方式却截然不同。

而这正是我需要更精准阐述的地方，因为泛泛而谈太过简单。仅仅说“旧原则回归”是不够的，它很容易沦为一句华丽的辞藻，却回避了真正解决问题的本质。

以管弦乐编曲为例。

现在人们所说的AI编排，很多概念其实并不新颖。我们早就有了协调、路由、权限、队列、重试、回退、握手、关注点分离和验证边界等机制。这些机制并非因为LLM的出现才出现，它们原本就是软件、分布式系统、自动化和基础设施工程的一部分。

但是组件发生了变化。

确定性服务出现故障的方式通常可以预见。例如，请求超时、模式出错、权限检查拒绝访问、队列阻塞或依赖项返回错误。虽然故障可能令人头疼，但至少它通常会发出警报。

生成组件可能出现故障，但听起来却很成功。

它可以返回一个干净的布尔值，但结果仍然是错误的。它可以在返回类型本身存在不确定性的情况下通过检查。它可以生成看似完整的答案，但实际上是推论。它可以自信地回答“是”，因为提示、模型和输入分布都指向同一个盲点。

正是这一点改变了编排问题。

旧原则依然重要：边界有用，检查有用，关注点分离有用，权限有用。但边界下的错误模型有所不同。包含随机成分的握手与包含确定性成分的握手截然不同。接口可能看起来很简洁，但不确定性并未消失，只是被压缩了。

这就是为什么我认为正确的做法并非简单地“使用人工智能，然后检验人工智能”。这种做法过于简单。它听起来很负责，但却掩盖了一个重要的问题：采用何种检验方法？在何种误差模型下？在何种独立性假设下？

想象一下这样的管道：

A > B > C > final check

如果最终检查通过，系统继续运行。如果检查失败，系统会跳转到其他路径。这很简单，但也存在风险，因为早期出现的幻觉信息可能会在被检查之前就沿着整个流程传播下去。

因此，我们将流程细化得更细致：

A > check > B > check > C > check > evaluate checks

这样感觉更好，而且在很多情况下确实更好。粒度越高，系统采样率越高，问题就越容易累积，也更容易及早发现问题。由于系统在更多点上变得可观测和可中断，因此单个局部故障的影响也更小。

但这并不会神奇地降低模型的不确定性。

它降低了不确定性的传播，缩小了爆炸半径，降低了一个错误步骤污染下游所有环节的可能性。这些都是实实在在的好处。

但原子能的不确定性依然存在。

我认为，比通常的人工智能安全口号更重要的是：如果所有检查都存在同一个盲点，那么更多的检查也无济于事。

传统的重试逻辑默认了一定程度的独立性。如果服务调用因瞬态网络问题而失败，再次尝试可能有效。如果工作进程因临时负载过高而崩溃，在其他地方重试可能有效。同样的理念经常未经审查就被直接移植到人工智能工作流程中：再次询问、再次检查、再次验证、再添加一个验证门。

但生成错误往往是相互关联的。

同一个模型，使用相同的提示词，读取相同的输入，可能会多次得出相同的错误结论。一条流水线可能会收集到许多看似正确的结果，而这些结果都存在同一个缺陷。此时，粒度并不能带来安全性，反而会造成高分辨率的虚假自信。

这就是方差和偏差的区别。

细粒度的检查有助于控制偏差。它们可以发现随机的、局部的、一次性的偏差。它们能降低系统因孤立错误而导致的脆弱性。

它们并不能消除偏见。如果检查员系统性地出错，增加同一检查员的次数只会成倍放大错误。这会造成一连串对同一错误的确认。

旧的基础设施比喻在这里开始失效，而另一种比喻则变得有用起来。

修复并非简单的重试。

修复方法是去相关。

不同的模型。不同的提示。不同的评估角度。对同一任务的不同表述。不同的失败假设。有时甚至采用不同的检查方式，其中一个组件评估结构，另一个检查事实依据，另一个验证约束条件，还有一个查找矛盾之处。

那已经不是传统意义上的重试了。

这更接近于物种形成。

重复使用相同的生物体并不能使系统变得稳健。真正使系统稳健的是引入足够的变异，从而避免一个盲点演变成群体范围内的疾病。生物系统之所以能够生存，并非因为每个单元都完美无缺，而是因为多样性改变了故障的传播方式。

这就是我多年来一直在研究的旧工程学和旧生物学资料之间不断发现的桥梁。

我花了将近三年时间才读完《蚂蚁奇遇记》。并非因为这本书读起来太慢，而是因为每一页都与其他内容紧密相连。对蚂蚁的细微观察，不再仅仅局限于蚂蚁本身，而是引申出关于局部决策、全局行为、任务分配、分布式协调，以及一个系统如何在没有单一权威机构掌控所有决策的情况下保持稳定等问题。

现在我正在阅读关于病毒作为复杂适应系统的文章，同样的事情再次发生。一页内容引发了一周的思考。适应、持久性、变异、失效、压力下的生存、局部变异、全局行为。突然间，这不再仅仅是生物学的问题。它成为了一种思考人工智能系统的方式，这些系统不能依赖完美的确定性组件，但仍然需要产生可靠的行为。

与人工智能世界的节奏相比，这看起来慢得离谱。

人们在午饭前就发表了五篇关于五种新工具的文章，而我还在纠结一本甚至与人工智能无关的书里的一个生物学类比。

但也许“卡住”这个词用得不太恰当。

也许这不是阅读，也许这只是汇编。

页面并非被消费，而是被链接。它进入一个由旧作品、未完成的想法、技术痕迹、软件架构、生物学好奇心以及对浅薄人工智能产品的失望所构成的语境。其结果并非速度，而是压缩。少量输入引发巨大的内部重组。

这很有价值，但它存在一个严重的问题。

它是看不见的。

或许，这才是“我反应慢吗？”这个问题背后真正的恐惧。并非我真的慢，也不完全是。恐惧的是，当我还在努力连接各个点时，这个领域却早已发展到白热化阶段，而我却对此视而不见。恐惧的是，缺乏可见成果的深度最终会与缺失无异。恐惧的是，人工智能的世界如此喧嚣、如此飞速，如此沉迷于新鲜词汇，以至于如果我不能持续产出可见的成果，就会淹没在这喧嚣之中。

这种恐惧并非毫无道理。

这个领域奖励的是对当周流行语的熟练掌握。如果流行语是“代理”，那么每个人都在构建代理。如果流行语是“推理”，那么一切都变成了推理。如果流行语是“内存”，那么每个缓存都变成了内存。如果流行语是“工作流”，那么每一系列 API 调用都变成了一个平台。

我明白为什么会这样。注意力很宝贵，时机很重要。如果你来晚了，谈话内容可能已经转移到其他话题了。

但始终保持这种节奏是有代价的。你可能会变得与噪音同步。你会开始追求迎合潮流，而不是追求正确。你学习新词汇的速度比理解其背后旧问题的速度还要快。你会变得反应迅速，但未必会深思熟虑。

我不想那样。

与此同时，我不能永远以深度为借口。

这是最令人不舒服的部分，我不应该用一句漂亮话来逃避。

有时候我并不慢，我只是在筛选信息。有时候我并不慢，我只是在建立联系。有时候我并不慢，我只是拒绝把精力浪费在两周后就会消失的炒作上。

但有时我会隐藏在深邃的表象之下。

理论上并非如此。这并非作家普遍面临的问题。就我而言，我现在就处于这种模式之中。

我能感觉到，当一段关系被保密的时间过长时，它就会隐瞒。我能感觉到，当一个想法在我脑海中变得越来越复杂，因为一旦公开，它就会变得狭隘、暴露，更容易受到批评。我能感觉到，“我还在考虑”这句话最初是为了约束自己，但慢慢地却变成了一种庇护。

这就是我需要发现的故障模式。