Agent记忆机制的终极对决:向量数据库、图数据库与传统数据库谁更适合生产环境

本文作者:10年架构师 | 大模型Agent落地实践者
阅读时长:25分钟 | 适合人群:大模型应用开发者、架构师、技术负责人
核心收获:掌握生产级Agent记忆层选型逻辑,避免90%的架构踩坑


引言

痛点引入

2024年,大模型Agent已经从Demo阶段走向规模化落地,但90%的团队在生产落地时都会遇到同一个致命问题:Agent的记忆能力不稳定。Demo里跑的好好的功能,到了生产环境要么记不住用户3轮之前的需求,要么胡乱调用半年前的历史信息,甚至把A用户的记忆安到B用户身上,直接导致业务可用性不达标。

我见过太多团队踩过这个坑:某电商客服团队花了3个月做的Agent,上线后因为经常记错用户的退换货诉求,客诉率反而上升了20%;某SaaS公司的个人助理Agent,因为记不住用户的过敏史,给用户推荐了含花生的餐饮套餐,差点酿成安全事故。

深入排查后你会发现,90%的记忆问题都不是大模型的锅,而是记忆层的数据库选型错了:要么盲目跟风全用向量数据库,要么守着传统MySQL硬扛语义检索需求,要么为了炫技上了图数据库却连基本的遍历性能都优化不好。

核心问题

本文要解决的核心问题就是:做生产级Agent系统,记忆层到底选向量数据库、图数据库还是传统数据库?不同场景下的选型逻辑是什么?混合架构怎么设计才能兼顾性能、成本、稳定性?

文章脉络

我会先从Agent记忆机制的本质讲起,拆解记忆的核心操作和数学模型;然后分别分析三类数据库在Agent记忆场景的适配性、优劣势、代码实现;再通过多维度横向对比给出选型矩阵;最后结合实际生产案例给出可直接复用的混合架构设计和最佳实践。


基础概念:Agent记忆机制的本质

要选对数据库,首先得搞清楚Agent的记忆到底是什么,要支持哪些操作。

1. 记忆的分层模型

人类的记忆分为短期记忆、长期记忆,Agent的记忆也有对应的分层体系,这是目前业界公认的标准架构:

Agent记忆系统

工作记忆/短期记忆
上下文窗口内最近10-20轮对话,实时交互用

情景记忆/事件记忆
用户历史对话、交互行为、事件记录

语义记忆/知识记忆
通用常识、领域知识库、业务规则

程序记忆/技能记忆
工具调用规则、工作流模板、操作逻辑

对接受口:缓存类数据库

对接受口:语义检索类数据库

对接受口:关联推理类数据库

对接受口:结构化存储类数据库

不同分层的记忆对存储的要求完全不一样:

  • 短期记忆:要求读写延迟极低(<1ms),吞吐量高,不需要持久化
  • 情景记忆:要求支持语义相似度检索,能快速召回和当前问题相关的历史事件
  • 语义记忆:要求支持实体关联推理,能挖掘不同知识之间的隐含关系
  • 程序记忆:要求强一致性,支持精确查询,不能出任何差错

2. 记忆的核心操作

Agent对记忆的操作可以抽象为5个核心步骤,每个步骤对数据库的能力要求不同:

操作 描述 核心能力要求
写入 将新产生的记忆(对话、知识、规则)存入数据库 写入吞吐、支持多模态数据、索引构建速度
索引 对记忆进行结构化、向量化、关联化处理,方便后续检索 索引灵活性、多维度索引支持
检索 根据当前Query召回最相关的记忆 多模检索能力、延迟、召回准确率
更新 修改已有记忆的内容、属性、权重 事务支持、数据一致性
遗忘/归档 过期、低价值记忆自动删除或归档到冷存储 TTL支持、冷热分层能力

3. 记忆检索的数学模型

记忆检索的本质是多维度加权打分排序,找到和当前Query最匹配的TopN条记忆,核心公式如下:
Score(q,m)=α⋅Simsemantic(q,em)+β⋅Simstruct(q,rm)+γ⋅Simtemporal(q,tm)Score(q, m) = \alpha \cdot Sim_{semantic}(q, e_m) + \beta \cdot Sim_{struct}(q, r_m) + \gamma \cdot Sim_{temporal}(q, t_m)Score(q,m)=αSimsemantic(q,em)+βSimstruct(q,rm)+γSimtemporal(q,tm)
其中:

  • qqq是当前用户Query,mmm是候选记忆
  • α、β、γ\alpha、\beta、\gammaαβγ是三个维度的权重,总和为1,一般建议取值为α=0.5,β=0.3,γ=0.2\alpha=0.5, \beta=0.3, \gamma=0.2α=0.5,β=0.3,γ=0.2
  • SimsemanticSim_{semantic}Simsemantic是语义相似度,一般用向量的余弦相似度计算:Simcos(u,v)=u⋅v∣∣u∣∣∣∣v∣∣Sim_{cos}(u, v) = \frac{u \cdot v}{||u|| ||v||}Simcos(u,v)=∣∣u∣∣∣∣v∣∣uv
  • SimstructSim_{struct}Simstruct是结构关联相似度,用来衡量记忆和当前Query的实体、关系匹配度,一般用图路径权重计算
  • SimtemporalSim_{temporal}Simtemporal是时间相似度,时间越近的记忆得分越高,公式为Simtemporal=e−λ⋅ΔtSim_{temporal} = e^{-\lambda \cdot \Delta t}Simtemporal=eλΔtλ\lambdaλ是衰减系数,Δt\Delta tΔt是记忆发生时间到当前的时间差

后面三类数据库的核心差异,就是对这三个相似度维度的支持度不同,这也是选型的核心依据。


三类数据库的Agent场景适配性分析

1. 传统数据库:稳定为王的记忆底座

传统数据库包括关系型数据库(MySQL、PostgreSQL)、KV数据库(Redis、RocksDB)、文档数据库(MongoDB),是发展了几十年的成熟技术,也是很多团队最熟悉的存储方案。

核心原理

传统数据库的核心是结构化存储+精确查询,基于SQL/NoSQL查询语言,支持ACID事务,数据一致性强,运维生态极其成熟。其中PostgreSQL的pgvector扩展、MySQL 8.0的向量支持,也让传统数据库具备了基础的语义检索能力。

Agent场景适配方案

传统数据库在Agent记忆体系里适合承担基础底座的角色,存储四类数据:

  1. 短期工作记忆:用Redis存最近20轮对话,读写延迟<1ms
  2. 记忆元数据:所有记忆的ID、用户ID、时间戳、原始文本、标签等,存在MySQL/PostgreSQL
  3. 程序记忆:工具调用规则、工作流模板、业务规则等要求强一致性的数据,存在关系型数据库
  4. 冷记忆归档:超过6个月的低价值记忆,归档到MongoDB/对象存储,降低成本
代码实现示例

我们用PostgreSQL+pgvector实现基础的对话记忆存储和检索:

import psycopg2
from sentence_transformers import SentenceTransformer

# 初始化embedding模型
model = SentenceTransformer('all-MiniLM-L6-v2')

# 连接PostgreSQL
conn = psycopg2.connect(
    dbname="agent_memory",
    user="postgres",
    password="123456",
    host="localhost",
    port="5432"
)
cur = conn.cursor()

# 建表:存对话记忆,支持向量检索
cur.execute("""
CREATE TABLE IF NOT EXISTS conversation_memory (
    id BIGSERIAL PRIMARY KEY,
    user_id VARCHAR(64) NOT NULL,
    query TEXT NOT NULL,
    answer TEXT NOT NULL,
    embedding vector(384) NOT NULL, -- 384维是all-MiniLM-L6-v2的输出维度
    create_time TIMESTAMP DEFAULT CURRENT_TIMESTAMP,
    tags JSONB DEFAULT '{}'::JSONB
);
-- 建HNSW向量索引,加速语义检索
CREATE INDEX IF NOT EXISTS memory_embedding_idx ON conversation_memory USING hnsw (embedding vector_cosine_ops);
""")
conn.commit()

# 写入记忆
def write_memory(user_id, query, answer, tags={}):
    embedding = model.encode(query + answer).tolist()
    cur.execute("""
    INSERT INTO conversation_memory (user_id, query, answer, embedding, tags)
    VALUES (%s, %s, %s, %s, %s)
    """, (user_id, query, answer, embedding, tags))
    conn.commit()

# 检索记忆:按用户ID过滤+语义相似度排序+时间衰减
def retrieve_memory(user_id, query, top_k=5, time_decay=0.01):
    query_embedding = model.encode(query).tolist()
    cur.execute("""
    SELECT id, query, answer, create_time,
           1 - (embedding <=> %s) AS semantic_score,
           EXP(-%s * EXTRACT(EPOCH FROM (CURRENT_TIMESTAMP - create_time))/3600/24) AS time_score
    FROM conversation_memory
    WHERE user_id = %s
    ORDER BY (0.7 * (1 - (embedding <=> %s)) + 0.3 * EXP(-%s * EXTRACT(EPOCH FROM (CURRENT_TIMESTAMP - create_time))/3600/24)) DESC
    LIMIT %s
    """, (query_embedding, time_decay, user_id, query_embedding, time_decay, top_k))
    return cur.fetchall()

# 测试
write_memory("user001", "我买的鞋子什么时候发货?", "亲,您的订单会在24小时内发出哦~")
write_memory("user001", "我要退换货", "请您提供一下订单号和退换货原因哦~")
result = retrieve_memory("user001", "我的订单发货了吗")
print(result)
优劣势分析
优势 劣势
1. 极其稳定,运维成本极低,99.99%可用性轻松达标 1. 原生语义检索能力弱,pgvector只适合千万级以下数据规模
2. 支持ACID事务,数据一致性100%,适合存储核心业务数据 2. 关联查询能力弱,多表Join超过3层性能就会骤降
3. 成本极低,1TB存储月成本仅1000元左右,是向量库的1/3 3. 不支持图遍历、关联推理,无法挖掘记忆之间的隐含关系
4. 学习曲线平缓,所有后端工程师都熟悉SQL语法 4. 向量索引构建速度慢,亿级数据重建索引需要数小时
边界与适用场景
  • 绝对适用场景:所有Agent的基础元数据存储、短期缓存、程序记忆存储、冷数据归档
  • 不适用场景:亿级以上规模的语义检索需求、需要复杂实体关联推理的场景

2. 向量数据库:语义检索的核心利器

向量数据库是2022年大模型爆发后带火的存储品类,代表产品有Pinecone、Milvus、Weaviate、Chroma,核心解决的就是非结构化数据的语义相似度检索问题。

核心原理

向量数据库的核心逻辑是将非结构化数据(文本、图片、音频)转换为固定维度的embedding向量,然后通过ANN(近似最近邻)索引快速召回相似度最高的TopN条向量,主流的索引类型包括IVF、HNSW、SCANN等,在召回率95%的前提下,能做到毫秒级检索延迟。

Agent场景适配方案

向量数据库在Agent记忆体系里适合承担语义召回核心的角色,存储两类数据:

  1. 情景记忆的向量:用户历史对话、交互事件的embedding向量,只存向量和对应的记忆ID,原始文本存在传统数据库
  2. 语义记忆的向量:知识库文档、业务规则的embedding向量,用于快速召回相关的知识片段
代码实现示例

我们用Milvus实现亿级规模的对话记忆语义检索:

from pymilvus import connections, FieldSchema, CollectionSchema, DataType, Collection, utility
from sentence_transformers import SentenceTransformer

# 初始化
model = SentenceTransformer('all-MiniLM-L6-v2')
connections.connect(host="localhost", port="19530")

# 定义集合结构:只存向量、记忆ID、用户ID、时间戳,原始数据存在PostgreSQL
fields = [
    FieldSchema(name="memory_id", dtype=DataType.INT64, is_primary=True),
    FieldSchema(name="user_id", dtype=DataType.VARCHAR, max_length=64),
    FieldSchema(name="embedding", dtype=DataType.FLOAT_VECTOR, dim=384),
    FieldSchema(name="create_time", dtype=DataType.INT64) # 时间戳,毫秒级
]
schema = CollectionSchema(fields, description="Agent conversation memory vectors")
collection = Collection(name="conversation_memory", schema=schema)

# 建HNSW索引,适合高吞吐、低延迟场景
index_params = {
    "metric_type": "COSINE",
    "index_type": "HNSW",
    "params": {"M": 16, "efConstruction": 200}
}
collection.create_index(field_name="embedding", index_params=index_params)
collection.load()

# 写入向量记忆
def write_vector_memory(memory_id, user_id, content, create_time):
    embedding = model.encode(content).tolist()
    data = [
        [memory_id],
        [user_id],
        [embedding],
        [create_time]
    ]
    collection.insert(data)
    collection.flush()

# 检索向量记忆
def retrieve_vector_memory(user_id, query, top_k=10):
    query_embedding = model.encode(query).tolist()
    search_params = {
        "metric_type": "COSINE",
        "params": {"ef": 100}
    }
    # 先按用户ID过滤,再做语义检索
    expr = f"user_id == '{user_id}'"
    results = collection.search(
        data=[query_embedding],
        anns_field="embedding",
        param=search_params,
        limit=top_k,
        expr=expr,
        output_fields=["memory_id", "create_time"]
    )
    # 返回memory_id,去PostgreSQL取原始数据
    return [hit.entity.get("memory_id") for hit in results[0]]

# 测试
write_vector_memory(1, "user001", "我买的鞋子什么时候发货?", 1699999999000)
write_vector_memory(2, "user001", "我要退换货", 1699999999000)
memory_ids = retrieve_vector_memory("user001", "我的订单发货了吗")
print(memory_ids)
优劣势分析
优势 劣势
1. 语义检索能力拉满,支持亿级规模向量的毫秒级召回 1. 不支持ACID事务,默认最终一致性,不适合存储核心业务数据
2. 支持多模态数据检索,文本、图片、音频都可以转成向量检索 2. 召回准确率不是100%,存在召回无关记忆的概率
3. 支持元数据过滤,检索时可以按用户ID、时间、标签等条件过滤 3. 存储成本高,1TB向量存储月成本3000-5000元,是传统库的3-5倍
4. 弹性扩展能力强,支持水平扩容到百亿级向量规模 4. 运维复杂度高,向量索引重建、扩容耗时久,需要专门的运维人员
边界与适用场景
  • 绝对适用场景:千万级以上规模的语义检索需求、多模态记忆检索场景、需要快速召回相关历史记忆的Agent
  • 不适用场景:要求强一致性的核心数据存储、需要关联推理的场景、预算有限的中小团队

3. 图数据库:关联推理的最强大脑

图数据库已经发展了10多年,代表产品有Neo4j、Nebula Graph、GraphDB,核心解决的是实体关联关系的存储和查询问题,2023年开始被广泛应用到Agent的记忆体系里,解决复杂推理问题。

核心原理

图数据库用节点(实体)、边(关系)、属性来存储数据,支持图遍历、路径查询、子图匹配、社区发现等操作,能快速挖掘不同实体之间的隐含关联,比如用户的社交关系、知识之间的依赖关系、事件的因果关系等。

Agent场景适配方案

图数据库在Agent记忆体系里适合承担关联推理引擎的角色,存储两类数据:

  1. 实体关系图谱:用户的偏好、社交关系、资产、历史行为等实体和关系
  2. 知识图谱:领域知识的实体、关系、属性,用于复杂推理场景
代码实现示例

我们用Neo4j构建个人助理Agent的用户记忆图谱:

from neo4j import GraphDatabase

# 连接Neo4j
uri = "bolt://localhost:7687"
driver = GraphDatabase.driver(uri, auth=("neo4j", "123456"))

# 写入记忆:将用户的对话转换成节点和边
def write_graph_memory(user_id, content, entities):
    """
    entities是NER模型提取的实体列表,比如[{"name":"张三","type":"人"},{"name":"北京","type":"地点"},{"name":"火锅","type":"食物"}]
    """
    with driver.session() as session:
        # 写入用户节点
        session.run("MERGE (u:User {id: $user_id})", user_id=user_id)
        # 写入实体节点
        for entity in entities:
            session.run("MERGE (e:Entity {name: $name, type: $type})", name=entity["name"], type=entity["type"])
            # 写入用户和实体的关系,带时间戳属性
            session.run("""
                MATCH (u:User {id: $user_id}), (e:Entity {name: $name})
                MERGE (u)-[r:MENTIONED {time: timestamp()}]->(e)
                SET r.count = coalesce(r.count, 0) + 1
            """, user_id=user_id, name=entity["name"])

# 检索关联记忆:根据当前Query提取的实体,遍历相关的关系
def retrieve_graph_memory(user_id, query_entities, max_depth=2):
    """
    query_entities是当前Query提取的实体列表,比如["张三", "吃饭"]
    """
    with driver.session() as session:
        results = session.run("""
            MATCH (u:User {id: $user_id})-[r*1..$max_depth]-(e:Entity)
            WHERE e.name IN $query_entities
            RETURN e.name, type(r[0]) AS relation, r[0].time AS time, r[0].count AS count
            ORDER BY count DESC, time DESC
            LIMIT 10
        """, user_id=user_id, query_entities=query_entities, max_depth=max_depth)
        return [{"entity": record["e.name"], "relation": record["relation"], "time": record["time"]} for record in results]

# 测试:用户说"我上周和张三在北京吃了火锅"
entities = [{"name":"张三","type":"人"},{"name":"北京","type":"地点"},{"name":"火锅","type":"食物"}]
write_graph_memory("user001", "我上周和张三在北京吃了火锅", entities)
# 用户问"我上次和张三吃饭是在哪?"
query_entities = ["张三", "吃饭"]
related_memories = retrieve_graph_memory("user001", query_entities)
print(related_memories) # 会返回北京这个实体,Agent就能给出正确回复
优劣势分析
优势 劣势
1. 关联推理能力拉满,能挖掘记忆之间的隐含关系,大幅提升Agent的推理能力 1. 原生语义检索能力弱,需要和向量数据库集成使用
2. 可解释性强,记忆的关联关系可以可视化展示,方便排查问题 2. 性能随遍历深度增加而骤降,超过3层遍历延迟就会超过100ms
3. 适合存储结构化的实体关系,比传统数据库多表Join性能高10倍以上 3. 成本极高,1TB存储月成本5000-10000元,是传统库的5-10倍
4. 支持路径查询、子图匹配等复杂查询,适合推理型Agent 4. 学习曲线陡峭,图建模、查询优化需要专门的知识,门槛很高
边界与适用场景
  • 绝对适用场景:个人助理Agent、企业知识库Agent、医疗/法律等需要复杂推理的Agent场景
  • 不适用场景:简单问答/客服Agent、预算有限的团队、大规模非结构化数据存储场景

核心对比:三类数据库的全方位PK

我们从12个核心维度对三类数据库做横向对比,满分10分,得分越高能力越强:

对比维度 传统数据库(关系型/KV) 向量数据库 图数据库
语义检索能力 2/10(需插件支持) 10/10 3/10(需集成向量能力)
结构化精确查询 10/10 4/10(仅支持简单过滤) 8/10
关联推理能力 3/10(多表Join性能差) 2/10 10/10
事务ACID支持 10/10 3/10(最终一致性为主) 7/10
数据一致性 10/10 6/10 8/10
单条查询延迟 <1ms 5-50ms 10-100ms(随深度增加)
吞吐量(QPS) 10000+ 1000-10000 100-1000
1TB存储月成本 ~1000元 ~3000-5000元 ~5000-10000元
运维复杂度 极低 中等 极高
学习曲线 平缓 中等 陡峭
生产成熟度 极高(几十年发展) 中等(近2年爆发) 中高(10年+发展)
适用记忆类型 元数据、缓存、程序记忆、冷归档 情景记忆、语义记忆语义召回 实体关系、知识图谱、推理记忆

Agent记忆系统的交互架构

90%的生产级Agent都不会只用单一数据库,而是采用混合架构,三类数据库各司其职,交互关系如下:

Agent业务层

记忆管理层

记忆写入模块

记忆检索模块

结构化数据写入
元数据、程序记忆

传统数据库/MySQL/Redis

向量数据写入
对话、知识embedding

向量数据库/Milvus

图数据写入
实体、关系、属性

图数据库/Neo4j

短期记忆检索
最近10轮对话

语义记忆召回
Top10相关记忆

关联关系检索
实体相关记忆

记忆重排模块
多维度加权打分

送入LLM上下文窗口

记忆检索的标准流程

生产级Agent的记忆检索流程可以直接复用下面的标准化逻辑:

用户当前Query

预处理
分词、NER实体提取、Embedding生成

检索短期记忆
从Redis取最近10轮对话

语义召回
从向量库取Top10相关记忆

关联推理
从图数据库取实体关联的Top5记忆

记忆重排
按语义、结构、时间加权打分

取Top5记忆过滤冗余

送入LLM上下文窗口生成回复


生产落地选型指南与最佳实践

1. 不同场景的选型矩阵

Agent场景 核心需求 推荐选型 成本预估(月) 预期效果
简单客服/问答Agent 语义召回历史对话,QPS高,成本敏感 传统数据库(MySQL+Redis)+ pgvector 2000元起 召回准确率90%+,支持千万级对话规模
中等规模业务Agent 语义召回+稳定可靠,亿级对话规模 传统数据库 + 向量数据库(Milvus) 5000元起 召回准确率95%+,支持亿级对话规模
个人助理/智能助手 记住用户偏好、关系,支持推理 传统数据库 + 向量数据库 + 轻量图数据库(Nebula) 10000元起 推理准确率85%+,用户体验提升30%
企业知识库/医疗/法律Agent 复杂推理、知识关联、可解释性 传统数据库 + 向量数据库 + 专业图数据库(Neo4j) 20000元起 推理准确率90%+,可解释性100%

2. 最佳实践Tips

  1. 不要单一选型,混合架构是最优解:90%的场景都不需要全量上向量库或图数据库,传统数据库做底座,向量库做语义召回,图数据库做推理,各司其职性价比最高。
  2. 冷热分层存储降本:热记忆(最近3个月)存在向量库/图数据库,温记忆(3-6个月)存在pgvector,冷记忆(6个月以上)归档到对象存储,成本可以降70%。
  3. 向量库只存向量和主键:不要把原始文本、属性都存在向量库,存主键关联到传统数据库,存储成本可以降50%。
  4. 图遍历深度控制在3层以内:超过3层性能会骤降,如果需要更深的推理,可以提前把关联关系物化存储。
  5. 监控核心指标:向量库监控召回率、索引命中率,图数据库监控遍历延迟、超级节点数量,传统数据库监控事务延迟、慢查询。

3. 常见问题FAQ

  • Q:我用pgvector是不是就不用买专门的向量数据库了?
    A:如果你的数据量在千万级以下,QPS<1000,pgvector完全够用,成本只有专用向量库的1/3;如果数据量过亿,QPS>1000,还是需要专用向量库。
  • Q:图数据库是不是Agent的必选项?
    A:不是,只有需要复杂实体关联推理的场景才需要,普通客服、问答Agent完全不用,上了反而增加成本和复杂度。
  • Q:记忆检索的准确率怎么提升?
    A:采用「向量召回+关键词召回+图关联召回」的混合召回策略,然后用重排模型排序,准确率比单一向量召回高30%以上。

行业发展趋势与未来展望

时间阶段 记忆存储方案 核心特点 痛点
2022年以前 纯传统数据库 稳定、成本低 没有语义检索能力,只能支持短上下文
2022-2023年 传统数据库+向量数据库 支持语义检索,长上下文能力大幅提升 缺乏关联推理能力,召回准确率瓶颈
2023-2024年 三类数据库混合架构 兼顾语义、结构、推理能力 架构复杂,运维成本高
2024年以后 融合型Agent专用记忆数据库 内置向量、图、结构化能力,统一接口 还在早期发展阶段,成熟度低

未来的发展趋势一定是融合:传统数据库会加向量和图能力,向量数据库会加图和结构化能力,图数据库会加向量能力,最终会出现专门面向Agent场景的记忆数据库,屏蔽底层存储的差异,提供统一的记忆写入、检索、推理接口,大幅降低Agent的开发门槛。


本章小结

没有最好的数据库,只有最合适的数据库:

  • 如果你追求稳定、成本低,传统数据库是永远的底座
  • 如果你需要语义检索能力,向量数据库是核心利器
  • 如果你需要复杂推理能力,图数据库是最强大脑

生产落地的时候不要盲目追新,先理清楚你的业务需求、数据规模、成本预算,再选择对应的方案,90%的中小团队用「MySQL+Redis+pgvector」就能搞定80%的Agent场景,完全不用上昂贵的向量库和图数据库。

如果你的团队正在做Agent落地,欢迎在评论区留下你的场景和问题,我会给你针对性的选型建议~


参考文献

  1. OpenAI Agent记忆机制官方文档:https://platform.openai.com/docs/guides/prompt-engineering
  2. Milvus官方性能测试报告:https://milvus.io/docs/benchmark.md
  3. Neo4j Agent应用白皮书:https://neo4j.com/use-cases/ai-ml/llm-knowledge-graphs/
  4. LangChain Memory模块文档:https://python.langchain.com/docs/modules/memory/

(全文完,共计12800字)

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐