数据库管理-第424期 数据库实战落地,文本存储再见(20260509)

作者:胖头鱼的鱼缸(尹海文)
Oracle ACE Pro: Database
PostgreSQL ACE

10年数据库行业经验
拥有OCM 11g/12c/19c、MySQL 8.0 OCP、Exadata、CDP等认证
墨天轮MVP,ITPUB认证专家
圈内拥有“总监”称号,非著名社恐(社交恐怖分子)

WX:胖头鱼的鱼缸
CSDN:胖头鱼的鱼缸(尹海文)
墨天轮:胖头鱼的鱼缸
ITPUB:yhw1809
IFClub:胖头鱼的鱼缸
除授权转载并标明出处外,均为“非法”抄袭

914fcc7ad57defa7868c3be1ca7fb4f5.jpg

近期更新博客的频次有所减少,一方面是恰逢五一假期占用了不少时间,另一方面则是我全身心投入到多数据库架构下AI Agent记忆系统的研发与落地工作中。

此前在数据库管理-第418期 从想法落地工程:Oracle DB构建AI Agent三位一体记忆体(20260403)一文中,我已初步基于 Oracle AI Database 26ai 搭建了AI Agent基础记忆框架。历经一个多月的深度开发、性能调优、功能扩展与版本迭代,目前项目最新版本已迭代至 v0.5.1,整体能力已具备生产环境落地条件。下文将对这套记忆系统项目进行完整、系统性的重新介绍。

项目初衷

AI Agent记忆的痛点

撰写前文时,我仍在使用OpenClaw框架,当时便深受记忆机制混乱、复杂任务执行效率低下等问题困扰。后续切换至Hermes Agent后,相关体验虽有一定改善,但长期实践下来发现,其记忆系统仍存在纯文本记录模式固有的底层缺陷。

事实上,AI Agent的记忆并非简单的文本信息堆砌,还涵盖上下文关联、元数据属性等多维信息;且单条记忆并非孤立存在,而是嵌套在完整的记忆链路与知识图谱体系之中。传统纯文本存储架构,会衍生出以下核心问题:

  • 容量与维护瓶颈:当单条记忆文本容量过大,或记忆文件数量累积到一定规模后,AI Agent难以快速检索匹配有效信息,同时记忆文件的日常管理与维护成本也会大幅攀升。
  • 关联检索能力薄弱:无法建立标准化索引体系,难以实现关联记忆的高效精准检索。
  • Token资源消耗过高:冗余繁杂的记忆读写操作会直接增加Token消耗量,同时频繁的记忆调度还会挤占上下文窗口资源,造成上下文信息冗余与污染。
  • 规模化场景适配性不足:在多Agent协同、企业级落地场景中,记忆来源维度更多样、读写调用频次更高,纯文本文件的存储与调用架构,无法承载高并发、高负载的记忆存取需求。

我的想法

引入数据库架构重构AI Agent 记忆存储体系,是解决纯文本记忆短板的最优路径,核心优势体现在以下几方面:

  • 多模态一体化存储:现代多模数据库不仅支持传统关系型标量数据存储,还可兼容 AI Agent 所需的长文本、JSON 结构化数据,并能依托图数据能力,基于基础记忆数据搭建完整的记忆链路与知识图谱。
  • 多维度数据互补增强:借助标量业务数据为向量检索做辅助标注,弥补向量检索精准度不足的短板,进一步提升记忆匹配的准确率。
  • 统一接口与混合查询能力:通过SQL语句实现多模态数据联合混合查询,以最简操作流程高效调取所需记忆数据。
  • 高性能与高可用保障:数据库原生支持高并发读写能力,搭配成熟的集群高可用架构,可为AI Agent记忆系统提供稳定、高效的底层支撑。

基于以上考量,我在搭建自研数据库架构AI Agent系统之初,便选用了功能体系最为完备的Oracle AI Database 26ai作为底层支撑。

项目介绍

oracle-memory-by-yhw是一款基于Oracle生态打造的通用型AI Agent长期记忆系统。

项目依托Oracle新一代AI原生数据库Oracle AI Database 26ai构建,深度整合数据库向量搜索、属性图、JSON、关系型等多类数据引擎,可为各类AI Agent提供企业级持久化记忆能力。这也契合Oracle 26ai的核心定位:让数据原生具备AI能力,直接在数据存储层完成智能体逻辑的构建与运行。

本项目打造了完整的「标量数据+向量数据+属性图三位一体记忆存储方案,覆盖记忆存储、多智能体协作、任务计划管理、断点续跑、语义去重融合、企业级权限安全等全链路功能栈。

版本演进

特性\版本 v0.3.x v0.4.0 v0.4.1 v0.5.0 v0.5.1
核心记忆存储
JRD视图层
属性图(PGQ) ✅原生SQL/PGQ
任务计划 ✅增强 ✅增强
断点恢复
多智能体架构
Memory Fusion Engine ✅新增
Agent权限管理 ✅新增
增强清理框架 ✅增强

核心特性

1. 记忆存储核心

  • 记忆图谱:以memory_nodes 节点表、memory_edges关系表及通用记忆主表为核心架构,支撑结构化知识存储与记忆关联关系表达。
  • 向量检索:基于Oracle 26ai原生VECTOR数据类型,实现高精度语义检索;依托Oracle Elastic Vector Memory机制,数据库可自动弹性调整内存容量以适配HNSW向量索引,持续保障检索性能稳定。
  • JRD(JSON关系二元性)视图层:通过memory_nodes_jdv、memory_graph_v等标准化视图提供JSON格式调用接口,实现底层结构化存储与上层AI Agent业务调用的解耦隔离。
  • 属性图(Property Graph):基于Oracle 26ai原生SQL/PGQ能力,通过MEMORY_PROPERTY_GRAPH实现记忆关系的深度图遍历与关联查询,适配复杂场景的知识推理诉求。

2. 多智能体架构

系统内置标准化多智能体管理框架,有效解决多AI Agent共享同一记忆库时的资源隔离、协作调度与权限协调问题。

3. 任务计划与断点恢复

该模块赋予AI Agent跨会话、长周期任务的持久化执行能力:

  • 任务计划持久化:通过TASK_PLANS完整记录任务目标、任务类型、优先级等核心信息,实现跨会话全生命周期任务追踪。
  • 断点恢复:TASK_CONTEXT_SNAPSHOTS自动快照保存Agent运行状态、对话历史、下一步执行动作及关联记忆节点ID;任务异常中断后,可通过 resume_task() 接口从最新快照位置续跑,无需从头执行。
  • 历史模式学习:提供search_completed_tasks()能力,支持Agent复盘历史已完成任务,沉淀成功与失败执行范式,实现经验复用与自主策略优化。

4. Memory Fusion Engine

全新自研语义融合引擎,专项解决多Agent协同场景下的记忆碎片化、冗余重复问题:

  • 语义相似检测:利用数据库原生VECTOR_DISTANCE向量距离函数,精准识别语义高度重合的冗余记忆条目。
  • 智能合并策略:内置多种合并规则,支持保留最新内容、保留内容完整性等择优合并逻辑。
  • 内容智能补全:自动关联语义相近记忆进行信息补充整合,生成完整、连贯的知识碎片。
  • 操作全链路溯源:完整记录每一次记忆融合操作日志,支持行为审计与版本回滚。

5. Agent权限管理与企业级安全

面向企业落地场景,新增Agent权限自动降级与定时恢复机制:

  • 禁用Agent自动降级:当Agent被标记禁用时,系统自动打上 PENDING_RECOVERY 待恢复标识,自动识别其协作类记忆数据,从访问权限列表中剔除该Agent身份,并全量记录至权限操作日志表。
  • 定时恢复巡检:配置小时级定时调度任务,自动巡检并批量处理待恢复权限事项。
  • 增强清理框架:通过统一配置表 cleanup_config 实现分级清理策略:每日镜像轻量化清理+每周全周期深度清理,同时支持会话TTL生命周期管理与过期资源监控。

系统架构

┌────────────────────────────────────────────────────┐
│            Oracle AI Database Memory System        │
├────────────────────────────────────────────────────┤
│  ┌──────────────────┐                              │
│  │   All AI Agents  │                              │
│  │  (via MCP/API)   │                              │
│  └────────┬─────────┘                              │
│           ▼                                        │
│  ┌──────────────────┐  ┌──────────────────┐        │
│  │ SQLcl MCP        │◄─│ Memory System    │        │
│  │ Interface Layer  │  │ (Python/PLSQL)   │        │
│  └────────┬─────────┘  └──────────────────┘        │
│           ▼                                        │
│  ┌─────────────────────────────────────────────┐   │
│  │ JRD View Layer (JSON 接口) 		         │   │
│  ├─────────────────────────────────────────────┤   │
│  │ Relationship Tables (结构化关系) 	         │   │
│  ├─────────────────────────────────────────────┤   │
│  │ Core Tables (节点/边/记忆/向量)	             │   │
│  ├─────────────────────────────────────────────┤   │
│  │ Enhanced Task Plans (任务计划与快照)	     │   │
│  ├─────────────────────────────────────────────┤   │
│  │ Property Graph (SQL/PGQ)	                 │   │
│  └─────────────────────────────────────────────┘   │
│                                                    │
│  优势:					                         │
│  ✅ RPO≈0零数据丢失保护(ADG)	 	                 │
│  ✅ 读写分离,查询性能提升3-5倍			             │
│  ✅ 结构化存储,无JSON冗余	                         │
│  ✅ 任务计划持久化与断点恢复	                     │
└────────────────────────────────────────────────────┘

整套记忆系统采用分层架构设计,将Oracle底层数据库能力向上封装为统一标准化API。AI Agent可通过SQLcl MCP或Python接口快速接入,无感调用向量检索、图遍历、关系存储、任务管理等全量数据引擎能力。

适用场景

  • Agent-as-a-Service多租户平台:可为多租户AI Agent提供隔离式持久记忆服务,省去各Agent单独搭建维护记忆系统的重复成本。
  • 企业级智能体业务系统:依托Oracle强事务一致性、高安全隔离特性,可在私密业务数据环境中,为流程化AI业务智能体提供高可靠记忆支撑。
  • 多Agent协同作业场景:适配代码审查、文档撰写、自动化部署等多角色流转链路,多智能体可通过共享记忆图谱无缝传递上下文信息与任务进度。
  • 复杂长周期研究分析链路:任务计划体系可对多步骤、长耗时的研究任务实现跨会话追踪、断点续跑与历史范式复用,尤其适配夜间离线运行、资源受限环境下的长任务执行。

技能生态扩展

除基于Oracle AI Database 26ai的记忆系统外,我同时基于多款主流数据库完成了配套记忆系统及生态组件开发:

名称 类型 介绍 最新版本 开源地址
oracle-memory-by-yhw Skill 基于Oracle 26ai的数据库记忆系统 v0.5.1 https://github.com/Haiwen-Yin/oracle-memory-by-yhw
memory-pg18-by-yhw Skill 基于PostgreSQL 18.3的数据库记忆系统 v0.3.3 https://github.com/Haiwen-Yin/memory-pg18-by-yhw
memory-ob4-ce-by-yhw Skill 基于OceanBase社区版4.5.0的数据库记忆系统 v0.1.2 https://github.com/Haiwen-Yin/memory-ob4-ce-by-yhw
memory-tidb8-ce-by-yhw Skill 基于TiDB社区版8.5.6的数据库记忆系统 v0.1.2 https://github.com/Haiwen-Yin/memory-tidb8-ce-by-yhw
pg-embedding-gen-by-yhw PG Extension 用于PG(18)数据库内直接调用外部Embedding模型 v0.1.0 https://github.com/Haiwen-Yin/pg-embedding-gen-by-yhw

目前基于Oracle架构的记忆系统迭代成熟度、功能完整性最优;待该版本迭代完善后,我会同步加速推进PostgreSQL、OceanBase、TiDB等其他数据库版本记忆系统的功能迭代与能力对齐。

总结

基于Oracle 26ai的记忆系统,目标是解决纯文本存储的记忆痛点,通过三位一体存储架构,实现了稳定可扩展、支持多Agent协同、断点续跑的企业级记忆能力,后续将持续优化并同步迭代多数据库生态版本。

老规矩,知道写了些啥。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐