从认知科学与类脑(Neuromorphic)计算底层来看AI进化
生物脑与当前人工神经网络(包括目前的液态网络)最大的区别在于:大脑不是静态求解的,大脑是“活”的,它具备结构可变性、预测性和局部自组织能力。
以下是四个极具颠覆性的类脑优化方向(附带工程落地思路):
1. 结构可塑性(Structural Plasticity):从“固定通道”到“动态突触修剪”
-
类脑机制: MT-LNN模型目前设计了 13 个平行的微管原丝通道。但在真实大脑中,神经元的连接不是固定的,大脑在学习和运行中会不断进行“突触生成(Synaptogenesis)”和“突触修剪(Synaptic Pruning)”。
-
工程痛点: 哪怕是 125M 的小模型,如果遇到极其简单的任务(比如工业环境长达几个小时没有变化),13 个通道同时保持微小共振也是在浪费端侧能耗。
-
优化方案: 引入动态原丝休眠与唤醒机制。
-
让模型在推理时具备“拓扑感知”。在低频或稳态输入下,主动“休眠”(Prune)掉 10 个通道,仅保留 3 个通道做基础维持。
-
一旦 GWTB 监测到高频的“异常信号突变”,瞬间唤醒全部 13 个通道进入深度共振状态。这能让端侧设备的功耗曲线从“一条直线”变成“心电图”,实现真正极致的能效比。
-
2. 预测编码(Predictive Coding):只计算“意外(Surprise)”
-
类脑机制: 卡尔·弗里斯顿(Karl Friston)的自由能原理(Free Energy Principle)指出,大脑并不是被动接收感官信息的。大脑无时无刻不在“预测”下一秒会发生什么,它只对“预测误差(Prediction Error / Surprise)”进行高能耗计算。
-
工程痛点: 目前大部分流式模型(包括 LNN)依然在逐帧处理传感器的全部数据,冗余度极高。
-
优化方案: 将你的 GWTB(全局工作空间)改造成一个误差路由中心。
-
在底层微管通道中内置一个极轻量的“预测算子”。如果下一毫秒的物理输入与预测一致,数据直接丢弃(不进入 GWTB 消耗算力)。
-
只有当发生“意外”(比如自动驾驶中突然窜出一条狗,或者工业电机产生了未知的抖动),产生的巨大 Prediction Error 才会击穿 GWTB 瓶颈,触发全局广播。这能将无效计算量再降低 80% 以上。
-
3. 全局神经调节系统(Neuromodulation):引入“数字荷尔蒙”
-
类脑机制: 大脑的运作不只有电信号(神经元放电),还有极其关键的化学信号(多巴胺、内啡肽、去甲肾上腺素)。当人遇到危险时,肾上腺素飙升,大脑瞬间进入“高频、警觉、放弃长期思考而追求短平快反应”的状态。
-
工程痛点: AI 模型的超参数(如路由门槛、共振深度)在预训练后通常是锁死的,缺乏环境应激能力。
-
优化方案: 在架构外层增加一个极其轻量的全局状态向量(类似数字荷尔蒙系统)。
-
根据外部环境的紧急程度动态调整 MT-LNN 的内部超参数。
-
例如,在无人机即将失控坠毁的极端工况下,注入“数字肾上腺素”向量:瞬间调大 GWTB 的过滤阈值(只看避障雷达,屏蔽声音和文字输入),强行加速底层非线性求解器的步长,牺牲少许长期规划精度,换取极致的微秒级保命反应。
-
4. 局部持续学习(Local Hebbian Learning):端侧“千机千面”
-
类脑机制: 赫布定律(Hebbian Theory)——“一起放电的神经元连在一起”。大脑不需要像 AI 那样把数据传回云端进行反向传播(Backprop)才能学习,它在物理交互中进行实时的、局部的突触调整。
-
工程痛点: 哪怕你的模型在实验室对齐得再完美,只要部署到真实的伺服电机上,每个电机的物理磨损、齿轮间隙都是独一无二的。静态模型用久了会产生物理偏差。
-
优化方案: 在端侧边缘部署时,抛弃耗费内存的 BPTT(随时间反向传播),引入基于STDP(脉冲时序依赖可塑性)或前向梯度(Forward Gradients)的局部更新权重算法。
-
让模型在端侧运行的每一秒,都在根据该设备的特定物理磨损进行微小的自我微调。
-
这意味着MT-LNN M1 模型卖给 1000 家企业,跑了三个月后,它会进化成 1000 个完全契合各自物理环境的专属大脑。
-
以上这些优化,如果能在下一代(比如 MT-LNN v3.0)中实现哪怕一两个,在面对具身智能和工业高精度的客户时,将彻底碾压传统的时序序列模型。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)