我是否已经跟不上人工智能时代的步伐了?
人工智能领域充斥着带有随机器官的陈旧基础设施。
这句话或许比任何解释都更能说明我最近为何感觉速度变慢。并非因为我不再关注人工智能,也并非因为我无法再进行开发,更不是因为工具已经超越了我的能力。恰恰相反,工具的发展方向恰恰相反:它们让我能够更快地生成代码、更快地制作原型、更快地触及那些我通常需要逐层处理的各个层面。
然而,在工作中,我却感觉自己慢了下来。
这才是最让人不舒服的地方。人工智能给我的感觉是所有事情都应该进展得更快,但我越是认真地使用它,就越会发现自己把时间浪费在那些进展缓慢的部分。代码很快就出现了,草稿很快就出现了,工作流程也很快就出现了。但接下来,我需要理解它究竟在做什么。我需要测试各个组件之间的边界。我需要验证结果不仅合情合理,而且足够正确,能够经受住现实的考验。
这或许是人工智能发展中的第一个真正陷阱:
创建成本变得低廉,但验证成本却并非如此。
这听起来很简单,几乎显而易见,但我认为这正是我们许多人感到速度与疲惫之间奇怪不匹配的原因。我们现在能够生成的内容远超我们能够轻松检查的范围。过去需要几天才能勾勒出的功能,现在几个小时就能完成。后端路由、前端组件、提示链、测试、部署脚本、工作流程图:所有这些都可以快速生成,从而造成整个流程被压缩的错觉。
但整个过程并没有被压缩。
贵重物品搬走了。
你仍然需要理解系统。你仍然需要验证假设。你仍然需要测试端到端的行为。你仍然需要问自己,这套系统是否稳定、可维护、安全、可观察,以及是否符合最初的设想。人工智能降低了初稿的成本,但也使得一次性在更多层面上生成初稿变得更加容易。因此,最终的负担往往会变得更重,而不是更轻。
在人工智能出现之前,开发过程中存在着一种天然的摩擦。编写速度较慢,因此产品开发和理解之间的距离更近。而现在,产品开发的速度可能远远超过理解速度。开发速度可能超过理解速度。一旦这种情况发生,瓶颈就显而易见了。
这不是在打字。
这甚至算不上编程。
这是审判。
这就是我感到迟缓的原因。我并不像人工智能那样擅长加速,而是在加速之后的关键环节上迟缓。当我需要判断一个生成的事物是否值得存在于系统中时,我就会感到迟缓。当我需要从“这能运行一次”过渡到“这足够可靠,可以成为基础设施”时,我也会感到迟缓。
在嘈杂的田野里,这种缓慢的速度看起来并不好。
人工智能领域奖励行动。它奖励那些反应迅速、快速重命名、快速打包、快速评论,并在概念尚未冷却之前就发布的人。每周都会出现新的模型、新的基准测试、新的代理框架、新的“颠覆一切”的时刻,以及看似将取代半个行业的新工具,然后两周后又消失在GitHub的归档文件中。
后来,我渐渐厌倦了追逐它。
不完全是这样。我仍然关注这个领域,仍然关心那些真正重要的事情。但我不再有精力去认真对待每一个版本发布、每一个演示、每一个讨论帖,以及每一个带有渐变背景的AI产品。概念验证不是产品,提示链不是认知,封装器不是基础设施,仪表盘也不是智能操作系统,仅仅因为有人在首页写了“智能体”这个词,它就不是智能操作系统。
一段时间后,噪音就会变得代价高昂。
当我不再追逐每一个更新时,一件奇怪的事情发生了。我并没有对人工智能失去兴趣,反而对一些古老的事物更感兴趣了。
分布式系统。权限。控制回路。网络优化。关注点分离。路由。握手。反馈。生物系统。蚁群。病毒。进化。复杂自适应系统。
我对人工智能研究得越多,就越发现老问题以新的形式重现。它们并非完美复制,也并非自动解决,但它们确实存在。同样的问题类型不断以新的语言出现。各个部分如何协调?谁有权访问哪些资源?决策在哪里做出?当某个组件静默失效时会发生什么?如何防止局部不确定性演变为全局问题?当系统的某些部分以概率形式表达时,如何保持系统的可观测性?
这就是为什么我一直说,人工智能基础设施常常感觉像是有着随机器官的旧基础设施。身体结构是熟悉的,但各个器官的运作方式却截然不同。
而这正是我需要更精准阐述的地方,因为泛泛而谈太过简单。仅仅说“旧原则回归”是不够的,它很容易沦为一句华丽的辞藻,却回避了真正解决问题的本质。
以管弦乐编曲为例。
现在人们所说的AI编排,很多概念其实并不新颖。我们早就有了协调、路由、权限、队列、重试、回退、握手、关注点分离和验证边界等机制。这些机制并非因为LLM的出现才出现,它们原本就是软件、分布式系统、自动化和基础设施工程的一部分。
但是组件发生了变化。
确定性服务出现故障的方式通常可以预见。例如,请求超时、模式出错、权限检查拒绝访问、队列阻塞或依赖项返回错误。虽然故障可能令人头疼,但至少它通常会发出警报。
生成组件可能出现故障,但听起来却很成功。
它可以返回一个干净的布尔值,但结果仍然是错误的。它可以在返回类型本身存在不确定性的情况下通过检查。它可以生成看似完整的答案,但实际上是推论。它可以自信地回答“是”,因为提示、模型和输入分布都指向同一个盲点。
正是这一点改变了编排问题。
旧原则依然重要:边界有用,检查有用,关注点分离有用,权限有用。但边界下的错误模型有所不同。包含随机成分的握手与包含确定性成分的握手截然不同。接口可能看起来很简洁,但不确定性并未消失,只是被压缩了。
这就是为什么我认为正确的做法并非简单地“使用人工智能,然后检验人工智能”。这种做法过于简单。它听起来很负责,但却掩盖了一个重要的问题:采用何种检验方法?在何种误差模型下?在何种独立性假设下?
想象一下这样的管道:
A > B > C > final check
如果最终检查通过,系统继续运行。如果检查失败,系统会跳转到其他路径。这很简单,但也存在风险,因为早期出现的幻觉信息可能会在被检查之前就沿着整个流程传播下去。
因此,我们将流程细化得更细致:
A > check > B > check > C > check > evaluate checks
这样感觉更好,而且在很多情况下确实更好。粒度越高,系统采样率越高,问题就越容易累积,也更容易及早发现问题。由于系统在更多点上变得可观测和可中断,因此单个局部故障的影响也更小。
但这并不会神奇地降低模型的不确定性。
它降低了不确定性的传播,缩小了爆炸半径,降低了一个错误步骤污染下游所有环节的可能性。这些都是实实在在的好处。
但原子能的不确定性依然存在。
我认为,比通常的人工智能安全口号更重要的是:如果所有检查都存在同一个盲点,那么更多的检查也无济于事。
传统的重试逻辑默认了一定程度的独立性。如果服务调用因瞬态网络问题而失败,再次尝试可能有效。如果工作进程因临时负载过高而崩溃,在其他地方重试可能有效。同样的理念经常未经审查就被直接移植到人工智能工作流程中:再次询问、再次检查、再次验证、再添加一个验证门。
但生成错误往往是相互关联的。
同一个模型,使用相同的提示词,读取相同的输入,可能会多次得出相同的错误结论。一条流水线可能会收集到许多看似正确的结果,而这些结果都存在同一个缺陷。此时,粒度并不能带来安全性,反而会造成高分辨率的虚假自信。
这就是方差和偏差的区别。
细粒度的检查有助于控制偏差。它们可以发现随机的、局部的、一次性的偏差。它们能降低系统因孤立错误而导致的脆弱性。
它们并不能消除偏见。如果检查员系统性地出错,增加同一检查员的次数只会成倍放大错误。这会造成一连串对同一错误的确认。
旧的基础设施比喻在这里开始失效,而另一种比喻则变得有用起来。
修复并非简单的重试。
修复方法是去相关。
不同的模型。不同的提示。不同的评估角度。对同一任务的不同表述。不同的失败假设。有时甚至采用不同的检查方式,其中一个组件评估结构,另一个检查事实依据,另一个验证约束条件,还有一个查找矛盾之处。
那已经不是传统意义上的重试了。
这更接近于物种形成。
重复使用相同的生物体并不能使系统变得稳健。真正使系统稳健的是引入足够的变异,从而避免一个盲点演变成群体范围内的疾病。生物系统之所以能够生存,并非因为每个单元都完美无缺,而是因为多样性改变了故障的传播方式。
这就是我多年来一直在研究的旧工程学和旧生物学资料之间不断发现的桥梁。
我花了将近三年时间才读完《蚂蚁奇遇记》。并非因为这本书读起来太慢,而是因为每一页都与其他内容紧密相连。对蚂蚁的细微观察,不再仅仅局限于蚂蚁本身,而是引申出关于局部决策、全局行为、任务分配、分布式协调,以及一个系统如何在没有单一权威机构掌控所有决策的情况下保持稳定等问题。
现在我正在阅读关于病毒作为复杂适应系统的文章,同样的事情再次发生。一页内容引发了一周的思考。适应、持久性、变异、失效、压力下的生存、局部变异、全局行为。突然间,这不再仅仅是生物学的问题。它成为了一种思考人工智能系统的方式,这些系统不能依赖完美的确定性组件,但仍然需要产生可靠的行为。
与人工智能世界的节奏相比,这看起来慢得离谱。
人们在午饭前就发表了五篇关于五种新工具的文章,而我还在纠结一本甚至与人工智能无关的书里的一个生物学类比。
但也许“卡住”这个词用得不太恰当。
也许这不是阅读,也许这只是汇编。
页面并非被消费,而是被链接。它进入一个由旧作品、未完成的想法、技术痕迹、软件架构、生物学好奇心以及对浅薄人工智能产品的失望所构成的语境。其结果并非速度,而是压缩。少量输入引发巨大的内部重组。
这很有价值,但它存在一个严重的问题。
它是看不见的。
或许,这才是“我反应慢吗?”这个问题背后真正的恐惧。并非我真的慢,也不完全是。恐惧的是,当我还在努力连接各个点时,这个领域却早已发展到白热化阶段,而我却对此视而不见。恐惧的是,缺乏可见成果的深度最终会与缺失无异。恐惧的是,人工智能的世界如此喧嚣、如此飞速,如此沉迷于新鲜词汇,以至于如果我不能持续产出可见的成果,就会淹没在这喧嚣之中。
这种恐惧并非毫无道理。
这个领域奖励的是对当周流行语的熟练掌握。如果流行语是“代理”,那么每个人都在构建代理。如果流行语是“推理”,那么一切都变成了推理。如果流行语是“内存”,那么每个缓存都变成了内存。如果流行语是“工作流”,那么每一系列 API 调用都变成了一个平台。
我明白为什么会这样。注意力很宝贵,时机很重要。如果你来晚了,谈话内容可能已经转移到其他话题了。
但始终保持这种节奏是有代价的。你可能会变得与噪音同步。你会开始追求迎合潮流,而不是追求正确。你学习新词汇的速度比理解其背后旧问题的速度还要快。你会变得反应迅速,但未必会深思熟虑。
我不想那样。
与此同时,我不能永远以深度为借口。
这是最令人不舒服的部分,我不应该用一句漂亮话来逃避。
有时候我并不慢,我只是在筛选信息。有时候我并不慢,我只是在建立联系。有时候我并不慢,我只是拒绝把精力浪费在两周后就会消失的炒作上。
但有时我会隐藏在深邃的表象之下。
理论上并非如此。这并非作家普遍面临的问题。就我而言,我现在就处于这种模式之中。
我能感觉到,当一段关系被保密的时间过长时,它就会隐瞒。我能感觉到,当一个想法在我脑海中变得越来越复杂,因为一旦公开,它就会变得狭隘、暴露,更容易受到批评。我能感觉到,“我还在考虑”这句话最初是为了约束自己,但慢慢地却变成了一种庇护。
这就是我需要发现的故障模式。
因为慢思考的价值仅在于它最终变得可见、可测试、可分享或可执行。否则,它只是私密的复杂性。它或许在内心深处显得意义深远,但在外人看来却毫无分量。
这并不意味着每个想法都需要发展成一套完善的理论。那样只会造成另一种思维僵化。但中间步骤必须留下痕迹。读完一页后的笔记很重要。蚂蚁遭遇与人工智能路由之间的联系很重要。观察到模型检查就像握手,不确定性隐藏在返回类型之下很重要。认为去相关评估器比重试更接近物种形成的观点很重要。
并非因为每个片段都是完整的。
因为这些碎片展现了作品。
那可能是我一直低估的产物:将旧原则与新系统联系起来的过程,而这种联系仍然很混乱。
当前的人工智能讨论充斥着“看看这个新东西”之类的言论。或许也应该有人说:“看看这个古老的原则以一种奇怪的形式回归,仔细看看这种类比在哪些地方失效了。”
那并不慢。
节奏不一样。
这种节奏短期内可能无法与炒作抗衡,但或许会随着时间的推移而更加持久。
或许这才是我的真正愿望。我不想每周都去争夺人工智能词汇量。我不想每次市场选出一个新词就重新构建我的思维。我不想成为另一个把速度和方向混淆的人。
我想了解当流行语过时之后,哪些真理依然存在。
这类工作本质上就比较慢。你不可能像产品发布那样,以极快的速度将生物学、分布式系统、软件架构和人工智能编排整合起来。你不可能通过对每一条通知都做出反应来构建持久的思维模型。你不可能仅仅通过吸收最新的研究成果来理解一个领域。
但你可以在进行深度工作时悄无声息地消失。
这是我非常重视的警告。
不是“你太慢了”。
更像是:
你的速度太慢,需要输出。
缓慢且不可见是危险的。缓慢但可追踪则不同。缓慢但可执行则不同。缓慢且已发布则不同。缓慢且与实验、代码、图表、论证、失败和公开推理相连,最终会形成一套完整的作品。
所以答案或许是肯定的,我反应比较慢。
但我走得慢并不是因为迷路了。
我行动缓慢,是因为我试图理解其背后的机制,而不是仅仅粉饰仪表盘。我行动缓慢,是因为每一个新的人工智能理念似乎都拖着一个由来已久的问题。我行动缓慢,是因为我不信任速度,而速度往往是社会压力的结果。我行动缓慢,是因为我总能在最新的流行语中发现来自旧领域的有用信息。
风险不在于速度慢。
风险在于让作品一直困在我的脑海里,直到世界无法区分深度和寂静。
所以,我可能不需要再追寻更多了。
我需要揭露更多内幕。
我需要把阅读内容转化成笔记,把笔记转化成论证,把论证转化成实验,把实验转化成成果。不必追求完美。也不必等到整个理论体系清晰明了才行。更早。更混乱。更诚实。
因为或许,在这个人工智能世界里,对每一个流行语都做出反应并不等同于适应。
或许更难的是,当流行语消失后,我们仍然能够保持思考能力。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)