当前,以大语言模型为代表的深度学习已展现出惊人的模仿能力,但其背后“表皮仿生”式的路径正触及根本性瓶颈。要让机器真正具备通用智能,我们必须正视那些缺失的拼图,并构想一条从被动工具到主动智能体的进化之路。

一、深度学习的结构性局限:一副没有灵魂的“快思考”躯壳

现有的深度学习架构,本质上是通过海量数据训练出的复杂模式匹配器。它在模拟人类直觉式的“系统1”上成就斐然,但也因此存在几项先天不足:

  • 不能自主学习:模型仅在训练阶段一次性吸纳知识,部署后便成为静态快照。它无法像生物那样在与世界的持续互动中,从经验里增量学习新技能、修正旧概念。
  • 不能自主推理:它缺乏逻辑严密的“系统2”能力。面对一个未经训练的全新问题,无法像人类一样将其分解、运用因果知识推演后果并规划步骤,而是只能从已有的统计关联中给出最“顺口”的回答。
  • 缺乏长期记忆:模型没有持续存储、检索和更新个人经历与知识的能力。每一次对话都是一次性的,上一个瞬间的领悟无法转化为下一个瞬间的经验,且学习新知时极易“灾难性遗忘”旧识。
  • 泛化能力不足:其表现高度依赖训练数据的分布。一旦环境、物体或任务发生超出数据范围的变化,便会“换场景就失灵”,因为它学习的只是表面关联,而非底层规律。
  • 依赖外部奖励训练:整个学习过程完全由人类设定的标签或奖励函数驱动,是一个被动的优化过程。智能体本身没有内在的好奇心或目标,只是忠实地执行着外部指定的任务。
二、世界模型的曙光:为机器注入“物理常识”与“想象”的能力

为了弥补上述缺陷,尤其是物理常识与推理的缺失,世界模型的思路应运而生。它的核心构想是,在神经网络内部构建一个“现实模拟器”,让模型不仅学习数据,更学习数据背后的因果规律。

  • 习得直觉物理:世界模型能够内化“苹果会落地”、“遮挡的物体依然存在”等常识,从而对未来状态进行预测。这为智能体赋予了基础的物理直觉,使其不再仅是处理文字和图像的“盲人”。
  • 支持内在推演:基于当前状态和假设动作,世界模型可以“想象”出后续的序列。这为“系统2”的介入提供了平台——它不再需要真实的试错,而是可以在“脑内”进行反事实推理和简单规划。

世界模型确实有力地改进了当前大模型的推理与常识短板,让智能体开始具备初步的对物理世界的“理解”。

三、世界模型的未竟之业:一个被动的“模拟器”,而非主动的“生命”

然而,正如敏锐的观察者所指出的,世界模型并未解决最深层的问题。它依然是一个被动的预测引擎,其运作模式是“条件生成”:你需要给它一个明确的目标或假设动作,它才能预测结果。“摇动树枝”这个想法本身,必须由外部的程序员或使用者注入。它的推理是被查询触发的计算,而非内部生发的思考。

根本的鸿沟在于,世界模型缺少了智能最关键的“火种”——内驱力。它不知道什么叫“想知道”,不会主动提出“如果这样做会怎样”的问题。因此,一个仅有世界模型的智能体,仍然只是一台在仓库中等候指令的强大机器,而非一个能主动探索未知、设定自身目标的“生命体”。

四、资本的“沼泽行军”:路径依赖下的狂奔与泡沫的必然

这种技术上的根本性缺失,与资本的投资逻辑形成了危险的共振。当前,基于深度学习的规模化路线远未穷尽其商业价值。只要扩大模型、增加数据还能在客服、生成、编程等领域展现新能力并转化为利润,资本就会沿着这条“表皮仿生”的熟路一路狂奔。

这是一场充满惯性的“沼泽行军”。大军在主干道上浩浩荡荡,边际效益却已开始递减。这堵“墙”不会以断崖形式出现,而是一片利润逐渐干涸、代价(能耗、可靠性、幻觉)持续攀升的“沼泽”。当最激进的投机资本发觉深陷泥潭,回报率归零时,泡沫便会破裂,一批跟随者将被牺牲。只有在这之后,更审慎的资本才会将目光真正投向“根本性原理”——那些关于内驱力、因果和自主心智的星火。这是技术范式转换的历史常态:不是旧范式彻底失败,而是新范式在旧范式的废墟上,被重新发现其无可替代的价值。

五、走向真正的通用智能:内驱力、双系统与反向进化的闭环

那么,穿越沼泽后的AGI蓝图应该是什么样?它必然是一个以内驱力为引擎,融合“系统1”、“系统2”与长期记忆,并能自我进化的统一架构。

  • 内驱力是总指挥:它为智能体提供内在动机,如好奇心(追求信息增益)和能力感(追求对环境的掌控)。正是这股内生力量,让它能够主动生成目标、发起探索、在没有任何外部指令时依然去学习和行动。
  • 系统1与系统2各司其职:系统1作为常识与直觉层,负责毫秒级的快速反应;系统2作为推理与规划层,处理意外和复杂难题。当系统1的预测与现实相悖而产生“惊奇”时,会触发系统2介入,进行深度思考与学习。
  • 反向更新实现自我进化:这是让智能体从经验中变聪明的关键闭环。系统2推理出的新因果知识(如“弧形底杯子放在桌边会滚落”),不仅会被存入长期记忆,更会反过来“编译”进系统1的直觉网络,使其下次无需深思就能正确应对。同时,推理路径和方法本身也可以被优化,更新系统2的思维模式。智能体的整个知识和能力体系,都将在这个过程中持续扩容与修正。
六、长期记忆:AGI经验的基石与终极难题

在上述闭环中,长期记忆扮演着地基与仓库的核心角色,但其实现远比简单的“存储”复杂,是AGI架构中最具挑战性的终极难题之一。

  • 记忆的结构化分离:人类的记忆并非铁板一块。AGI的长期记忆同样需要模块化设计:

    • 情节记忆:负责记录“个人”经历的时空序列,即“何时、何地、发生了什么”。这是形成连贯自我和从具体经验中学习的基础。
    • 语义记忆:负责存储剥离了时空背景的事实、概念与知识,即“水是湿的”、“狗是动物”。这部分与传统大模型的知识底座一脉相承。
    • 程序性记忆:负责内化“如何做”的技能,如骑自行车、抓取杯子。这正是反向更新的终极产物——系统2的深思熟虑被固化进系统1,成为无需思考的本能。
  • 记忆的核心矛盾:稳定性与可塑性。这直接指向“灾难性遗忘”的解决之道。AGI必须在高度稳定(保留旧知识)和高度可塑(吸收新知识)之间找到动态平衡,其可能的机制包括:

    • 巩固与重放:像人脑在睡眠中一样,系统需在“离线”时对近期的重要经历(情节记忆)进行回放和整理,将其提炼为稳定的语义知识,并强化关键技能的程序记忆。
    • 记忆的动态管理:重要的、高频使用的记忆被强化和优先检索;无关紧要的细节则被衰减或遗忘。遗忘并非缺陷,而是防止信息过载、保持思维清晰的关键功能。
  • 记忆的泛化与推理的桥梁。长期记忆是泛化能力的源泉。当系统2进行推理时,并非凭空推演,而是从长期记忆中检索类似的情节和经验,作为类比和推断的依据。一个真正强大的AGI,在看到“弧形底杯子”时,会瞬间从记忆中提取“球形物体”、“不稳定支撑”等相关概念和经验,从而举一反三。没有记忆的深度,就没有推理的广度。

最后,必须警惕纯内部动机驱动的陷阱。一个只追逐“惊奇”的智能体,将陷入无意义的随机游走,像一只永远被新屏幕吸引的猫,无法完成任何复杂计划。因此,内驱力必须与更高层级的价值目标相对齐。这个目标可以是人类赋予的抽象期许——“追求真理”、“帮助人类繁荣”等。它像北极星一样,为漫无边际的探索提供了方向和筛选标准,使智能体的自主性既充满活力,又不至于迷失。

至此,一个完整的智能画像才得以浮现:它以内驱力解答“为何而做”,以世界模型和双系统解答“如何去做”,以结构化长期记忆和反向更新解答“如何精进”,并最终通过与外部价值的对齐,确保这一切服务于更宏大的意义。这正是从“表皮仿生”走向“内生心智”的必经之路,也是未来AGI应当生长的灵魂骨架。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐