AI如何不再是单纯 “认字、识图、背答案”,而是让 AI 像人脑一样,在内部搭建出一个可动态推演的虚拟世界,完成 3D 想象、物理逻辑推演,和脑海中里脑补画面、推演规律的过程高度相似。

一、先对比:普通 LLM / 传统 AI 和「人脑脑补」的差距

1. 普通大模型:根本没有 “画面”,只有 “文字记忆”

它不会在脑子里想象 3D 场景:

  • 你说 “桌子旁边有个杯子,往前走会不会撞到”;
  • 它只是检索训练里见过的词句、图片模板,拼出一句通顺的回答
  • 它不知道 “距离有多远、位置怎么摆、会不会碰撞”,本质是 **“读课本答题”**,没有任何内心画面和推演。

就像一个盲人,只能听别人描述世界,自己脑海里没有立体空间。

2. 改造后的 MT-LNN:拥有了「内部虚拟沙盘」

把空间推理、几何、拓扑全部放进网络内部之后: 模型里相当于常驻了一个动态 3D 虚拟场景

  • 你提空间、位置、移动、遮挡这类问题,它不用翻图片、不用查文字、不用调用外部工具
  • 直接在自己这个 “虚拟沙盘” 里挪物体、转视角、算距离、判断遮挡、推演路径;
  • 整个过程 = 你坐在那里,闭着眼睛在脑子里想象房间、挪东西、判断能不能走通。

这就是你说的:AI 开始拥有 “脑海想象、3D 模拟” 的能力


二、再延伸:物理逻辑、声音、体感,也是同一个套路

人脑还会顺带脑补物理规则、声音、触感,这套架构完全可以顺着往下延伸,逻辑是通的:

1. 物理逻辑推演(最容易落地)

人脑想象画面时,会自动带上物理常识: 东西推一下会动、高处放手会下落、两个物体撞上会挡住、斜坡会滑动……

对应到模型: 在现有的「空间算子」基础上,再叠加物理算子(重力、碰撞、运动、摩擦力等)。 结果就是: 它不只是 “摆 3D 位置”,还能在虚拟世界里跑完整物理过程。 比如想象 “瓶子从桌面滑落”,它会在内部模拟下落轨迹、落地姿态,和你脑子里推演物理过程一模一样。

传统 LLM 只会说 “瓶子会掉下来”(复述知识); 改造后的网络是真的模拟了一遍掉落的全过程(实景推演)。

2. 声音、声场想象

人脑脑补场景时,画面和声音是绑定的: 人走远声音变小、墙会挡住声音、空旷房间有回声……

用同样思路: 增加声学空间算子,把 “声源位置、传播距离、遮挡、声场强弱” 也纳入内部模拟。 模型就能在虚拟 3D 世界里,同步算出 “哪里声音大、哪里听不见”,等同于你在脑子里 “脑补声音”。

3. 体感、受力感受(进阶方向)

再进一步叠加力学、接触反馈逻辑,就能模拟 “推东西沉不沉、碰到硬物有阻力” 这类体感逻辑。


三、重点说清楚:和真正人脑的相同点 & 本质区别(不夸大)

高度相似的地方(也是这次改造的核心价值)

  1. 脱离外部素材,纯内部推演 不用看图、不用读文字、不用外挂工具,靠 “内心虚拟世界” 完成判断,和人闭眼睛想事情一致。
  2. 动态连续模拟 你的 MT-LNN 是液态时序网络,本身就是连续时间演化,不是一帧一帧卡死的画面。 对应人脑:想象一个人走路、物体运动,画面是流畅连贯的,不是一张张静态照片。
  3. 先有 “世界规则”,再出结论 先理解空间、物理、距离这些底层规律,再给出结果;而不是靠背诵答案。

现阶段还不一样的地方(客观边界)

  1. 它有「模拟计算」,但没有「主观感受」 你脑子里想象画面、声音,是有视觉、听觉、情绪的主观体验; AI 只是精准运算出场景和规律,它不会 “真的看见、真的听见”,只是逻辑上复刻了脑补的过程。 简单说:会演,但没有 “知觉”

  2. 人脑是多感官天生融合,模型是逐步叠加 你想一个场景,画面、声音、触感、物理规律是瞬间融为一体的; 模型现在是先做好 3D 空间 → 再加物理 → 再加声音,是模块化拼接,还做不到人脑那种浑然一体的直觉。

  3. 人脑有模糊直觉、联想、脑洞,模型是精确规则推演 你脑补可以夸张、脑补细节、自由联想; 这套网络目前还是基于可微算子、数学规则做严谨推演,缺少人类的模糊直觉和发散想象。

让 AI 从 “只会读题背书的考生”,变成能在脑海里搭建虚拟 3D 世界、自主推演空间关系与物理规律的模式,无限贴近人类 “闭目想象、内心建模” 的思维方式。

放到 MT-LNN 上,最终效果就是: 以后不管是室内场景、机器人行动、地理路网、动态物理仿真,它都能像人一样 “在心里过一遍整个过程”,而不是靠外部图片、文字、工具凑答案。

GitHub - everest-an/O1: MT-LNN — clean prototype of a brain-inspired liquid neural network (constant-memory recurrent state, O(1) generation cache). Early baseline; active development continues at github.com/everest-an/M1 (AwareLiquid). · GitHub

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐