手把手带你读懂MemBrain(极其详细):Agent实体树记忆到底怎么实现的?
继续看Agent记忆上的事情,看看基于实体-主题-时序-版本控制的Agent记忆方案,很常规的组合方案,不算太创新。
另一个看看两个开源模型进展:语言大模型GLM-5.1和检测大模型 WildDet3D。
一、基于实体-主题-时序-版本控制的Agent记忆方案
继续看Agent记忆方案,看MemBrain,打的点是以实体(entity)为核心构建自适应语义树,核心点是通过多Agent工作流将非结构化对话转化为以实体(entity)为中心、按语义方面(aspect)(如职业、旅行)层级聚类的结构化记忆树,技术报告在https://github.com/feelingai-team/MemBrain/blob/main/docs/tech_blog.md,核心点起就是树结构、加时序、加版本控制。
看核心几个点:
1、几种方式的对比
现有LLM外部记忆分为两类一种是文本中心记忆(如 OpenClaw,保留完整语义,但无显式关联、信息分散),另一种是图中心记忆(如 Graphiti等,实体(entity)关系清晰,但语义丢失)。

比如,对话是:
“Caroline 上周入职了 Feeling-AI。” “Caroline 上周去了上海。”
直接存储就是里面的文本中心。
图结构记忆,就是变成(Caroline, 入职,Feeling-AI)+(Caroline, 去,上海),丢了 “上周” 这个时间【但是这个其实加上时间就行了】
实际上,这个说的不够,还有基于树的,比如memTree的方案【早已有】
2、基于实体(entity)为中心的记忆
首先是这个结构设计:
三层实体(entity)树,根节点:实体(entity);中间节点:维度(主题聚类);叶子节点:事实(fact);支持动态维护:过载聚类拆分、稀疏聚类合并;

实体(entity)与事实(fact)结构,采用多对多映射:一个事实(fact)关联多实体(entity),一个实体(entity)对应多事实(fact)【一个事实(fact)可引用多个 entity,一个 entity 可关联多个 事实(fact)】;事实(fact)以自然语言存储,带规范化时序,别名动态解析;实体(entity)版本化历史,更新不覆盖旧数据【版本回滚,例如旧版本:Caroline = 学生,新版本:Caroline = Feeling-AI 员工,历史不覆盖,随时可追溯。】
其次,构建方式上,如下:

step1.原始对话输入→分批处理+会话摘要:
例如,给定:Caroline started working at Feeling-AI last week. She traveled to Shanghai last week.
->step2.实体(entity)提取(两轮消歧义)事实(fact)-时序提取;
实体(entity)提取:[Caroline], [Feeling-AI], [Shanghai
事实(fact) - 时间提取(原文标注格式):
[Caroline] started working at [Feeling-AI] [last week::2026-03-30 to 2026-04-05] [Caroline] traveled to [Shanghai] [last week::2026-03-30 to 2026-04-05]
->step3.实体(entity)解析与融合(匹配/合并/新建);
如果出现 “Carrie”,Agent 判断 = Caroline,自动合并。
实体(entity)消歧、合并、更新,实体(entity)保留规范名 + 描述,并版本化历史,不覆盖旧信息。
->step4.构建并维护层级树。
实体(entity):Caroline;方面:职业、出行;事实(fact):放在对应叶子节点,形成这个:

3、看检索方式
检索结合全文搜索、嵌入检索、结构遍历,分成Standard Retrieval(三路并行):

给定,查询示例:Where does Caroline work now?
一路BM25 匹配:关键词检索 事实(fact) 文本;
一路Embedding 语义检索:向量相似度;
一路Structure-aware 检索:遍历实体(entity)树 → 定位 Caroline → 定位 Employment 方面;
最后,结果合并、去重、重排序,输出结构化事实(fact)。
此外,也可以再加入一个Agent-augmented retrieval(可选增强),例如,对于查询示例:What changed in Caroline’s career recently?
第一轮检索:获取 career 相关事实(fact),Agent 检查信息充足性,生成补充查询(如限定时间)->第二轮检索,补全信息
最后,做Context assembly(原文输出结构),会话摘要,按 Entity → Aspect → Fact 组织的事实(fact),原始消息作为支撑证据。
这也是典型的多路RAG召回思路,整体来看不是太有新意。
二、几个大模型开源进展
1、语言大模型GLM-5.1
7540亿参数,并以MIT License 开源,支持文本输入输出、200K 上下文窗口及 128K 最大输出,https://docs.bigmodel.cn/cn/guide/models/text/glm-5.1,https://huggingface.co/zai-org/GLM-5.1
2、检测大模型 WildDet3D
3D目标检测模型 WildDet3D 及其配套数据集 WildDet3D-Data开源。在从单张RGB图像中预测开放世界物体在三维空间中的位置、尺寸和方向,全面支持文本、视觉点及2D边界框等多种提示方式,参数量约为 12亿,采用模块化架构设计,https://allenai.org/blog/wilddet3d,https://github.com/allenai/WildDet3D,https://huggingface.co/allenai/WildDet3D

学AI大模型的正确顺序,千万不要搞错了
🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!
有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!
就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇
学习路线:
✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经
以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!
我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)