手把手带你读懂MemBrain（极其详细）：Agent实体树记忆到底怎么实现的？

Python_金钱豹

462人浏览 · 2026-04-09 21:23:22

Python_金钱豹 · 2026-04-09 21:23:22 发布

继续看Agent记忆上的事情，看看基于实体-主题-时序-版本控制的Agent记忆方案，很常规的组合方案，不算太创新。

另一个看看两个开源模型进展：语言大模型GLM-5.1和检测大模型 WildDet3D。

一、基于实体-主题-时序-版本控制的Agent记忆方案

继续看Agent记忆方案，看MemBrain，打的点是以实体（entity）为核心构建自适应语义树，核心点是通过多Agent工作流将非结构化对话转化为以实体（entity）为中心、按语义方面(aspect)（如职业、旅行）层级聚类的结构化记忆树，技术报告在https://github.com/feelingai-team/MemBrain/blob/main/docs/tech_blog.md，核心点起就是树结构、加时序、加版本控制。

看核心几个点：

1、几种方式的对比

现有LLM外部记忆分为两类一种是文本中心记忆（如 OpenClaw，保留完整语义，但无显式关联、信息分散），另一种是图中心记忆（如 Graphiti等，实体（entity）关系清晰，但语义丢失）。

比如，对话是：

“Caroline 上周入职了 Feeling-AI。” “Caroline 上周去了上海。”

直接存储就是里面的文本中心。

图结构记忆，就是变成(Caroline, 入职，Feeling-AI)+(Caroline, 去，上海)，丢了 “上周” 这个时间【但是这个其实加上时间就行了】

实际上，这个说的不够，还有基于树的，比如memTree的方案【早已有】

2、基于实体（entity）为中心的记忆

首先是这个结构设计：

三层实体（entity）树，根节点：实体（entity）；中间节点：维度（主题聚类）；叶子节点：事实（fact）；支持动态维护：过载聚类拆分、稀疏聚类合并；

实体（entity）与事实（fact）结构，采用多对多映射：一个事实（fact）关联多实体（entity），一个实体（entity）对应多事实（fact）【一个事实（fact）可引用多个 entity，一个 entity 可关联多个事实（fact）】；事实（fact）以自然语言存储，带规范化时序，别名动态解析；实体（entity）版本化历史，更新不覆盖旧数据【版本回滚，例如旧版本：Caroline = 学生，新版本：Caroline = Feeling-AI 员工，历史不覆盖，随时可追溯。】

其次，构建方式上，如下：

step1.原始对话输入→分批处理+会话摘要：

例如，给定：Caroline started working at Feeling-AI last week. She traveled to Shanghai last week.

->step2.实体（entity）提取（两轮消歧义）事实（fact）-时序提取；

实体（entity）提取：[Caroline], [Feeling-AI], [Shanghai

事实（fact） - 时间提取（原文标注格式）：

[Caroline] started working at [Feeling-AI] [last week::2026-03-30 to 2026-04-05] [Caroline] traveled to [Shanghai] [last week::2026-03-30 to 2026-04-05]

->step3.实体（entity）解析与融合（匹配/合并/新建）；

如果出现 “Carrie”，Agent 判断 = Caroline，自动合并。

实体（entity）消歧、合并、更新，实体（entity）保留规范名 + 描述，并版本化历史，不覆盖旧信息。

->step4.构建并维护层级树。

实体（entity）：Caroline；方面：职业、出行；事实（fact）：放在对应叶子节点，形成这个：

3、看检索方式

检索结合全文搜索、嵌入检索、结构遍历，分成Standard Retrieval（三路并行）：

给定，查询示例：Where does Caroline work now?

一路BM25 匹配：关键词检索事实（fact）文本；

一路Embedding 语义检索：向量相似度；

一路Structure-aware 检索：遍历实体（entity）树 → 定位 Caroline → 定位 Employment 方面；

最后，结果合并、去重、重排序，输出结构化事实（fact）。

此外，也可以再加入一个Agent-augmented retrieval（可选增强），例如，对于查询示例：What changed in Caroline’s career recently?

第一轮检索：获取 career 相关事实（fact），Agent 检查信息充足性，生成补充查询（如限定时间）->第二轮检索，补全信息

最后，做Context assembly（原文输出结构），会话摘要，按 Entity → Aspect → Fact 组织的事实（fact），原始消息作为支撑证据。

这也是典型的多路RAG召回思路，整体来看不是太有新意。

二、几个大模型开源进展

1、语言大模型GLM-5.1

7540亿参数，并以MIT License 开源，支持文本输入输出、200K 上下文窗口及 128K 最大输出，https://docs.bigmodel.cn/cn/guide/models/text/glm-5.1，https://huggingface.co/zai-org/GLM-5.1

2、检测大模型 WildDet3D

3D目标检测模型 WildDet3D 及其配套数据集 WildDet3D-Data开源。在从单张RGB图像中预测开放世界物体在三维空间中的位置、尺寸和方向，全面支持文本、视觉点及2D边界框等多种提示方式，参数量约为 12亿，采用模块化架构设计，https://allenai.org/blog/wilddet3d，https://github.com/allenai/WildDet3D，https://huggingface.co/allenai/WildDet3D

学AI大模型的正确顺序，千万不要搞错了

🤔2026年AI风口已来！各行各业的AI渗透肉眼可见，超多公司要么转型做AI相关产品，要么高薪挖AI技术人才，机遇直接摆在眼前！

有往AI方向发展，或者本身有后端编程基础的朋友，直接冲AI大模型应用开发转岗超合适！

就算暂时不打算转岗，了解大模型、RAG、Prompt、Agent这些热门概念，能上手做简单项目，也绝对是求职加分王🔋

在这里插入图片描述

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料，手把手帮你快速入门！👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型（GPT、文心一言等）特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架（LangChain等）实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块，看似清晰好上手，实则每个部分都有扎实的核心内容需要吃透！

我把大模型的学习全流程已经整理📚好了！抓住AI时代风口，轻松解锁职业新可能，希望大家都能把握机遇，实现薪资/职业跃迁～