全网 AI 记忆系统终极对比:Mem0 vs 0GMem vs Letta vs 人类基准

一、参评选手一览

系统 性质 准确率 成熟度 Stars
Mem0 + Qdrant 你现在用的 66.9% 成熟 10K+
0GMem 新秀黑马 96.6% 极新 4
Letta 社区老兵 48-74% 非常成熟 21K
人类基准 上限参照 87.9%

二、准确率终极对比(LoCoMo 基准)

3轮对话测试

排名 系统 准确率 和人类差距
🥇 0GMem 96.6% ✅ 超越人类!
🥈 人类基准 87.9%
🥉 Letta 74.0% -13.9%
4 Mem0 68.5% -19.4%

10轮对话测试

排名 系统 准确率 和人类差距
🥇 人类基准 87.9%
🥈 0GMem 85.6% -2.3%
🥉 Letta 48-74% -13.9%~-40%
4 Mem0 66.9% -21%

关键发现: 0GMem 在 3轮对话时超越了人类基准!但在 10轮长对话时略低于人类。


三、LoCoMo 排行榜总览

排名 系统 10轮准确率 备注
🥇 0GMem 85.6% 新发布,准确性惊人
🥈 人类 87.9% 上限
🥉 Letta(文件系统) 74% 简单方案逆袭
4 Mem0 68.5% 生产级可用
5 Zep 58-75% 有争议
6 OpenAI Memory 52.9% 官方内置
7 MemGPT/Letta 48-74% 波动大
8 Best RAG 41.4% 纯 RAG 基线
9 GPT-4-turbo ~32% LLM 基线

四、核心能力对比

4.1 时间推理

系统 Allen代数 事件日期索引 跨会话时间推理
0GMem ✅ 13种关系 ✅ 写入时建立
Mem0
Letta

4.2 否定处理

系统 否定提取 否定存储 否定检索
0GMem ✅ 一级公民
Mem0
Letta

4.3 多跳推理

系统 单跳检索 多跳推理 查询分解
0GMem ✅ BFS三图 ✅ 9类问题
Mem0
Letta ⚠️ Agent决定 ⚠️

4.4 检索策略

系统 语义搜索 BM25 图遍历 注意力过滤
0GMem
Mem0
Letta ⚠️

五、技术架构对比

Mem0 + Qdrant(你现在用的)

消息 → Mem0 → Embedding(SiliconFlow) → Qdrant向量库 → 检索结果

特点:

  • 扁平事实存储
  • 简单直接
  • 依赖外部向量库

0GMem

消息 → Encoder → 四层图谱 → 8策略检索 → 注意力过滤 → 结果
        ↓
    实体+时间+因果+否定 全部结构化

特点:

  • 写入时建立结构
  • 多层记忆层次
  • 精确遗忘机制

Letta

消息 → LLM自主调度 → 记忆层次(working/episodic/semantic) → 结果

特点:

  • LLM 自己管理记忆
  • 仿生操作系统调度
  • 完全开源透明

六、中文支持对比

系统 中文Embedding spaCy中文 实战验证
Mem0+Qdrant ✅ BAAI/bge-large-zh-v1.5 ✅ 可配 ✅ 已验证
0GMem ⚠️ 需自定义 ⚠️ 英文为主 ❌ 未充分测试
Letta ✅ 可配任意 ✅ 可配 ⚠️ 部分验证

七、部署复杂度

系统 部署难度 预计时间 额外依赖
Mem0+Qdrant ⭐ 低 ~20min Qdrant集群
0GMem ⭐⭐ 中高 ~30min spaCy+OpenAI
Letta ⭐⭐⭐ 中等 ~30min Docker/服务化

你的现状: Mem0+Qdrant ✅ 已部署验证


八、存储对比

系统 向量库 存储位置 预估占用
Mem0+Qdrant Qdrant(外置) Docker volume ~500MB/万条
0GMem 内置 ~/.0gmem ~1GB/万条
Letta 可配 文件/DB 视配置

九、性能对比(延迟)

系统 p95延迟 相比全上下文
Mem0 0.15s 降低91%
0GMem 0.48s 降低79%
全上下文 2.6s

结论: Mem0 最快,0GMem 功能强但略慢。


十、成熟度对比

系统 Stars 生产验证 社区活跃 维护状态
Mem0 10K+ ✅ 大量 ✅ 活跃
Letta 21K ✅ 大量 ✅ 非常 ✅ 活跃
0GMem 4 ❌ 极新 ⚠️ 起步

十一、优劣总结

Mem0 + Qdrant(你现在用的)

优点 缺点
✅ 成熟稳定 ❌ 准确率不如 0GMem
✅ 中文支持好 ❌ 无时间/否定处理
✅ Qdrant 可扩展 ❌ 单跳检索为主
✅ 已部署验证
✅ SiliconFlow 便宜

0GMem

优点 缺点
✅ 准确率最高(96.6%) ❌ 极新,生产验证有限
✅ 超越人类基准 ❌ 中文支持弱
✅ 时间+否定+多跳全能 ❌ 主要依赖 OpenAI
✅ 结构化存储 ❌ 4 stars,社区小

Letta

优点 缺点
✅ 21K stars,最成熟 ❌ 准确率不如 0GMem
✅ 完全开源透明 ❌ 48-74%波动大
✅ 多Agent支持 ❌ LLM自主调度有争议
✅ 可视化调试

十二、场景化推荐

你的需求 推荐 理由
继续用当前方案 ✅ Mem0+Qdrant 已部署,稳定够用
追求最高准确率 0GMem 96.6%大幅领先
重视开源透明 Letta 21K stars社区验证
中文为主 ✅ Mem0+Qdrant 中文Embedding更优
不想折腾快速上线 ✅ Mem0+Qdrant 已有验证
有多Agent需求 Letta 原生支持多Agent
有时间推理需求 0GMem Allen代数原生
企业级生产 ✅ Mem0+Qdrant 成熟稳定

十三、最终建议

现阶段(2026年3月)

继续用 Mem0 + Qdrant

理由:

  1. 已部署、已修bug、已验证正常
  2. 中文支持更好
  3. 准确率66.9%对于日常使用足够
  4. 0GMem太新,需要等3-6个月看发展

3-6个月后重新评估

如果出现以下情况考虑迁移:

  • 0GMem 社区验证生产可用
  • 有高精度时间推理需求
  • 有复杂否定处理需求
  • 有多跳推理强需求

Letta 关注价值

如果未来需要:

  • 多Agent协作
  • 完全开源透明方案
  • 可视化调试功能

可以考虑 Letta 作为第二选择。


十四、完整评分(5星制)

系统 准确率 成熟度 中文支持 易用性 开源度 总分
Mem0+Qdrant ⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐ 22
0GMem ⭐⭐⭐⭐⭐ ⭐⭐ ⭐⭐ ⭐⭐⭐ ⭐⭐⭐⭐⭐ 18
Letta ⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐ ⭐⭐⭐ ⭐⭐⭐⭐⭐ 21

项目 内容
作者 胡小纯
发布日期 2026-03-24
联系微信 hu–xiaochun
个人主页 https://胡小纯.cn
备用主页 https://xn–yets91feqb.cn/

技术没有捷径,但有方向

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐