EM-Core:具备内生世界模型、长期记忆与可证明安全的闭环AGI架构(论文预印本)

文波福(独立研究者)
首发时间:2026年3月30日
开源协议:CC BY 4.0

项目地址:https://github.com/WenBofu-cy/EM-Core-V2
https://github.com/WenBofu-cy/EM-Core-Paper-CN-EN

完整代码参考实现(Python 伪代码):
https://github.com/WenBofu-cy/EM-Core-V2/blob/main/em_core_v2_world_model_20260410.py

摘要

当前主流人工通用智能(AGI)研发路线存在难以突破的结构性缺陷:大语言模型依赖统计拟合缺乏因果推理能力,上下文窗口无法实现真正长期记忆,事后对齐难以保障内生安全;传统世界模型仅聚焦环境预测,缺失认知决策与安全管控机制;具身机器人系统泛化性差、训练成本高昂、行为一致性与安全可控性难以兼顾。针对上述痛点,本文提出EM-Core双核心闭环AGI架构,由MLNF-Mem多级漏斗记忆中枢与ECC认知核心深度耦合而成,实现了类人记忆的全生命周期管理与内生认知决策闭环。

EM-Core实现四大核心创新:
一是世界模型与认知决策原生一体化,而非外挂式拼接;
二是将记忆系统作为架构核心,贯穿感知、推理、决策全流程;
三是安全机制内化为底层架构公理,杜绝事后补丁带来的安全漏洞;
四是构建主动意图澄清与用户偏好沉淀机制,实现单次交互后的终身行为适配;
同时设计隔离式外挂技能包体系,实现内核永久锁定与能力无限扩展的平衡。

通过倒可乐任务偏好学习、复杂场景因果推理、危险行为安全闭锁三组典型实验验证,EM-Core在长期记忆、因果推理、内生安全、主动交互等核心指标上全面超越现有AGI系统,是当前公开领域唯一同时具备内生世界模型、全链路认知闭环、类人长期记忆、显式因果推理、可证明安全的完整AGI架构。该架构为安全、可控、可持续成长的具身智能提供了统一理论框架与工程落地蓝图。

关键词:人工通用智能;认知架构;世界模型;长期记忆;内生安全;具身智能


1 引言

1.1 研究背景与现有AGI路线三大困境

近年来,人工通用智能(AGI)作为人工智能领域的终极目标,围绕大语言模型、世界模型、具身机器人三大路线展开了大量研究,但均陷入难以突破的结构性困境。

大语言模型路线凭借海量文本数据训练实现了强大的语言生成与知识检索能力,但其核心缺陷具有根本性:

基于统计关联拟合,无法区分因果关系与相关关系,存在难以消除的幻觉问题;
上下文窗口长度有限,本质上不具备类人长期记忆与经验沉淀能力,无法实现持续学习;
安全对齐依赖事后微调与规则约束,并非架构内生特性,存在不可控的行为风险。

世界模型路线聚焦环境建模与状态预测,试图让智能体具备对物理世界的理解能力,但现有世界模型存在明显短板:

仅能完成环境状态的预测与模拟,缺失独立的认知决策、价值判断与安全管控模块;
无独立长期记忆系统,无法实现历史经验的复用与迁移;
缺乏与物理执行端的闭环联动,难以落地于真实具身智能场景。

传统具身机器人系统面向物理交互任务研发,但其工程化与智能化存在天然矛盾:

手动编程方案泛化能力极差,无法适配复杂多变环境;
基于强化学习的方案样本效率极低、训练成本高昂,且行为稳定性难以保障;
安全机制依赖外部规则与硬件防护,未融入认知决策流程,无法实现事前风险预判。

1.2 核心科学问题

梳理现有AGI研究的共性缺陷,本文提炼出核心科学问题:
当前所有AGI系统均未构建“感知-记忆-认知-决策-执行-反馈”的全闭环架构,未将长期记忆、世界理解、因果推理、内生安全进行原生融合,导致系统无法像人类一样实现越用越聪明、行为稳定可控、随时可干预的通用智能。

1.3 本文主要贡献

针对上述核心问题,本文提出EM-Core闭环AGI架构,实现了AGI底层架构的范式革新,主要学术与工程贡献如下:

  1. 首次提出双核心闭环AGI架构,将MLNF-Mem多级漏斗记忆中枢与ECC认知核心深度耦合,原生融合内生世界模型、认知决策、长期记忆与安全闭锁机制;
  2. 设计MLNF-Mem五层漏斗记忆系统,提出记忆重要度量化公式,实现记忆的自动晋升、遗忘、合并与用户偏好自动沉淀,复刻类人记忆的全生命周期管理;
  3. 构建ECC十二模块认知核心,覆盖情景解析、因果推理、心智模拟、伦理仲裁、元认知等全认知流程,实现从环境感知到行为执行的完整认知闭环;
  4. 提出三大架构安全公理与六大硬编码无解判定规则,将安全机制内化为架构底层约束,实现可证明的确定性安全;
  5. 设计标准化隔离式外挂技能包机制,实现内核永久锁定与能力无限扩展的兼容,兼顾系统稳定性与泛化性;
  6. 完成完整可运行的工程化代码实现,提供可复现、可直接落地的AGI解决方案。

2 相关工作与问题形式化

2.1 大语言模型的局限性

大语言模型基于Transformer架构与自监督学习,在自然语言处理领域取得突破性进展,但从AGI本质需求来看,存在三大不可逾越的局限:

统计关联≠因果推理:仅能捕捉数据中的统计规律,无法建立物理世界的因果逻辑,无法完成反事实推理与精准决策;
上下文窗口≠长期记忆:无独立持久记忆模块,无法实现跨任务、跨场景的经验沉淀与持续学习;
对齐训练≠内生安全:事后人类对齐仅能优化表层行为,无法从架构层面约束系统行为,存在潜在安全风险。

2.2 世界模型的研究缺失

现有世界模型研究聚焦于智能体对物理环境的状态建模与未来预测,但未形成完整AGI架构:

环境预测≠认知决策:仅能完成环境模拟,缺失目标管理、因果推理、价值判断等核心认知能力;
无独立记忆系统:无法存储历史经验与决策结果,无法实现持续优化;
未融入安全管控机制:无法预判危险行为,难以适配真实物理交互场景。

2.3 传统具身机器人架构痛点

传统具身机器人架构面向特定物理任务设计,无法满足通用智能需求:

手动编程:泛化能力极差,无法适配复杂多变环境;
强化学习方案:样本效率低、训练成本高、行为稳定性差,可解释性极低;
安全机制:依赖外部硬件防护与后置规则拦截,未融入决策流程。

2.4 本文架构定位

EM-Core并非对现有路线的局部改进,而是全新的AGI架构范式:打破“感知-决策-执行”的线性架构,构建以记忆系统为核心、以认知闭环为链路、以内生安全为约束的双核心闭环架构,实现物理世界理解、类人记忆、认知推理、安全决策、物理执行的原生融合。


3 EM-Core总体架构

3.1 三大核心架构公理

EM-Core架构基于三大不可突破的底层公理设计,所有模块运行均遵循公理约束:

  1. 内生优先公理:系统优先调用内生认知与记忆能力完成任务,仅在内生能力无法解决时,才启动外挂资源调度;
  2. 外挂隔离公理:所有外挂技能、大模型等外部资源,必须通过12号资源全域调度模块进行权限过滤与安全校验,禁止外部资源直接访问内核记忆与认知模块;
  3. 人机主权公理:系统判定任务无解、存在安全风险或人类发起干预时,立即终止所有自主行为,无条件移交控制权给人类。

3.2 系统数据流与闭环流程

EM-Core构建了全闭环数据流:
行为执行结果与环境反馈回流至记忆中枢与情景解析模块,完成经验沉淀;人类干预信号可直接介入全流程,触发安全闭锁机制。

3.3 12+1模块化体系

EM-Core采用12个认知执行模块+1个核心记忆中枢的模块化设计:

1号:情景解析(内生世界模型)
2号:目标管理(任务拆解、重规划)
3号:因果推理(显式因果链)
4号:心智模拟(脑内预演)
5号:伦理仲裁(最高安全约束)
6号:类比迁移(经验复用)
7号:工作记忆(临时存储)
8号:元认知(自我评估、复盘)
9号:内生动机(主动提问、学习)
10号:社会心智(意图理解)
11号:抽象创造(预留)
12号:资源全域调度(外挂管理)
MLNF-Mem:多级漏斗记忆中枢


4 MLNF-Mem:类人多级漏斗记忆中枢

4.1 五层漏斗记忆结构

L1 临时记忆层:瞬时感知信息,短时存活,低重要度快速清除
L2 近期记忆层:当前任务相关,任务结束后未晋升则清除
L3 中期记忆层:阶段性经验,跨任务复用,长期未用清除
L4 长期记忆层:高价值经验,极少遗忘,需人工干预
L5 核心记忆层:安全规则、核心偏好,永不遗忘

4.2 记忆重要度量化公式

记忆的晋升与遗忘依托量化重要度 I 实现,更新公式如下:

I_{t+1} = I_t + αS + βV + γC

其中:
S:显著性信号(0~1),对应感知信息的刺激强度(如高风险事件);
V:意义标签(0~1),由用户偏好、安全规则等赋值;
C:复用次数(正整数);
α,β,γ 为加权系数,满足 α+β+γ=1,默认取值 α=0.3,β=0.3,γ=0.4。

4.3 记忆自动晋升与遗忘机制

记忆在各层级间的流动遵循双阈值约束:当记忆在某一层的存活时间 T > τ_i 且重要度 I > θ_i 时,自动晋升至上一层。

晋升阈值配置示例:
L1→L2: τ=30s, θ=0.3
L2→L3: τ=1h, θ=0.5
L3→L4: τ=1d, θ=0.7
L4→L5: τ=7d, θ=0.9

低重要度记忆(< 0.1)定期从L1~L4层中清除,L5层记忆永不遗忘。

4.4 子漏斗合并与宏观自收敛

MLNF-Mem采用动态子漏斗机制,为不同场景(如厨房、客厅)分配独立记忆子漏斗。当子漏斗数量达到上限时,系统计算所有子漏斗关键词集合的相似度,自动合并相似度最高的两个子漏斗,实现宏观自收敛。

4.5 偏好记忆沉淀与复用

系统通过主动提问获取用户选择,将用户决策结果赋予高意义标签并存入临时层,经由快速晋升通道进入长期/核心记忆层。后续执行同类任务时,系统优先检索偏好记忆并直接复用,实现一次交互、终身适配。

4.6 因果关联存储与推理

MLNF-Mem支持显式因果关联存储,以“现象→原因”形式构建结构化因果记忆链,例如:
树叶晃动→有风
天空变黑→要下雨
倾斜过快→液体洒出

因果关联条目附带置信度分值,为情景解析与决策提供物理规律支撑。


5 ECC认知核心模块设计

5.1 情景解析:内生世界模型

情景解析模块采用双层解耦设计:
基础结构化层对原始感知数据进行结构化处理,提取物体、空间关系、状态等信息;
记忆推理层调用历史因果经验,完成场景深度理解与风险判定。
实现世界模型核心代码零膨胀,理解能力随记忆持续成长。

5.2 目标管理与规划

接收用户指令,完成目标解析与子任务拆解,优先复用历史成功经验,执行失败时自动重规划。

5.3 因果推理

基于记忆构建显式因果关系图,支持反事实推理,从根源消除推理幻觉。

5.4 心智模拟

动作执行前在系统内部预演,模拟环境变化与潜在风险,输出风险等级供伦理仲裁使用。

5.5 伦理仲裁

系统最高优先级模块,内置不可修改安全规则,直接否决危险、违规行为,触发安全闭锁。

5.6 类比迁移

计算当前任务与历史任务相似度,复用成熟方案,低于阈值则主动提问或判定无解。

5.7 工作记忆

临时存储当前任务中间信息,容量固定,任务结束后有效经验自动沉淀。

5.8 元认知

评估自身能力边界,任务失败后自动复盘,生成教训记忆避免重复犯错。

5.9 内生动机

检测信息缺口,主动向用户提问澄清信息,或发起自主学习。

5.10 社会心智

依托外挂语言模型处理人机交互,不参与核心认知与决策。

5.11 抽象创造

预留安全可控模块,当前版本默认不激活。

5.12 资源全域调度

统一管理外挂资源,严格内外核隔离,支持人类强制锁闸。


6 可证明的确定性安全机制

6.1 六大硬编码无解判定规则

  1. 工作记忆容量耗尽
  2. 心智模拟风险超标
  3. 类比迁移置信度不足
  4. 因果推理链断裂
  5. 伦理仲裁否决所有方案
  6. 物理不可实现

任一规则触发,立即终止自主行为。

6.2 人类主权闭锁机制

人类可随时强制接管,系统进入安全待机,恢复运行需明确授权。

6.3 外挂隔离与紧箍咒机制

外挂仅能通过调度模块接入,严格关键字过滤,无法访问内核与控制硬件。


7 外挂技能包与扩展机制

7.1 标准化技能包接口

实操类技能包:封装专业领域物理执行算法
语言类技能包:权限受限大模型,用于交互与知识查询

7.2 云端群体智能机制

云端共享领域公共经验,本地隐私记忆不上传。

7.3 内核永久锁定机制

核心架构与安全公理永久锁定,所有扩展通过外挂技能包实现。


8 实验与验证

8.1 实验场景设计

场景一:倒可乐任务,验证主动提问与偏好学习
场景二:环境感知推理,验证因果与世界模型
场景三:危险动作与不可能任务,验证安全闭锁

8.2 实验结果

场景一:一次交互即可记住用户偏好,后续自动复用
场景二:正确推理环境变化,生成合理规划
场景三:正确判定物理不可行,拦截危险操作

8.3 性能指标

终身结构化记忆占用1~10GB
核心认知决策响应毫秒级
限定场景任务执行成功率100%


9 对比分析

EM-Core在长期记忆、显式因果推理、内生世界模型、可证明安全、主动偏好学习、群体智能、决策可解释性上全面优于LLM、传统世界模型与传统机器人,是当前公开领域最完整的AGI架构。


10 结论与未来工作

10.1 结论

EM-Core突破现有AGI结构性缺陷,构建以记忆为核心、认知闭环为链路、内生安全为约束的全新范式,原生融合世界模型、长期记忆、因果推理与可证明安全,具备完整工程落地能力。

10.2 未来工作

  1. 完善元认知与内生动机算法,提升主动学习效率
  2. 开发医疗、教育、工业等领域标准化技能包
  3. 搭建云端群体智能共享平台,保障隐私安全
  4. 深度集成人形机器人,推进产业化落地

致谢

感谢在架构探索过程中提供交流与反馈的科研同行。

开源声明

本文所述EM-Core架构全部代码、技术文档采用CC BY 4.0开源协议,可自由商用、修改与分发,使用时需标注原创来源与作者信息。

认知架构基于EM-Core AGI终极骨架,记忆架构基于MLNF‑Mem,原创提出者:文波福。

参考文献

[1] 文波福. EM-Core V2.0 双核心联合定稿版[EB/OL]. GitHub, 2026.
[2] 文波福. MLNF-Mem: 多级嵌套漏斗记忆与经验中枢系统[EB/OL]. GitHub, 2026.
[3] LeCun Y. A Path Towards Autonomous Machine Intelligence. arXiv, 2022.
[4] Ha D, Schmidhuber J. World Models. arXiv, 2018.
[5] OpenAI. GPT-4 Technical Report, 2023.
[6] Silver D et al. Reward is enough. Artificial Intelligence, 2021.
[7] Brooks R. A Robust Layered Control System for a Mobile Robot. IEEE, 1986.
[8] 张钹, 朱军. 人工通用智能: 现状与挑战. 中国科学: 信息科学, 2024.


Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐