全网 AI 记忆系统终极对比:Mem0 vs 0GMem vs Letta vs 人类基准
一、参评选手一览
| 系统 |
性质 |
准确率 |
成熟度 |
Stars |
| Mem0 + Qdrant |
你现在用的 |
66.9% |
成熟 |
10K+ |
| 0GMem |
新秀黑马 |
96.6% |
极新 |
4 |
| Letta |
社区老兵 |
48-74% |
非常成熟 |
21K |
| 人类基准 |
上限参照 |
87.9% |
— |
— |
二、准确率终极对比(LoCoMo 基准)
3轮对话测试
| 排名 |
系统 |
准确率 |
和人类差距 |
| 🥇 |
0GMem |
96.6% |
✅ 超越人类! |
| 🥈 |
人类基准 |
87.9% |
— |
| 🥉 |
Letta |
74.0% |
-13.9% |
| 4 |
Mem0 |
68.5% |
-19.4% |
10轮对话测试
| 排名 |
系统 |
准确率 |
和人类差距 |
| 🥇 |
人类基准 |
87.9% |
— |
| 🥈 |
0GMem |
85.6% |
-2.3% |
| 🥉 |
Letta |
48-74% |
-13.9%~-40% |
| 4 |
Mem0 |
66.9% |
-21% |
关键发现: 0GMem 在 3轮对话时超越了人类基准!但在 10轮长对话时略低于人类。
三、LoCoMo 排行榜总览
| 排名 |
系统 |
10轮准确率 |
备注 |
| 🥇 |
0GMem |
85.6% |
新发布,准确性惊人 |
| 🥈 |
人类 |
87.9% |
上限 |
| 🥉 |
Letta(文件系统) |
74% |
简单方案逆袭 |
| 4 |
Mem0 |
68.5% |
生产级可用 |
| 5 |
Zep |
58-75% |
有争议 |
| 6 |
OpenAI Memory |
52.9% |
官方内置 |
| 7 |
MemGPT/Letta |
48-74% |
波动大 |
| 8 |
Best RAG |
41.4% |
纯 RAG 基线 |
| 9 |
GPT-4-turbo |
~32% |
LLM 基线 |
四、核心能力对比
4.1 时间推理
| 系统 |
Allen代数 |
事件日期索引 |
跨会话时间推理 |
| 0GMem |
✅ 13种关系 |
✅ 写入时建立 |
✅ |
| Mem0 |
❌ |
❌ |
❌ |
| Letta |
❌ |
❌ |
❌ |
4.2 否定处理
| 系统 |
否定提取 |
否定存储 |
否定检索 |
| 0GMem |
✅ |
✅ 一级公民 |
✅ |
| Mem0 |
❌ |
❌ |
❌ |
| Letta |
❌ |
❌ |
❌ |
4.3 多跳推理
| 系统 |
单跳检索 |
多跳推理 |
查询分解 |
| 0GMem |
✅ |
✅ BFS三图 |
✅ 9类问题 |
| Mem0 |
✅ |
❌ |
❌ |
| Letta |
✅ |
⚠️ Agent决定 |
⚠️ |
4.4 检索策略
| 系统 |
语义搜索 |
BM25 |
图遍历 |
注意力过滤 |
| 0GMem |
✅ |
✅ |
✅ |
✅ |
| Mem0 |
✅ |
❌ |
❌ |
❌ |
| Letta |
✅ |
❌ |
⚠️ |
❌ |
五、技术架构对比
Mem0 + Qdrant(你现在用的)
消息 → Mem0 → Embedding(SiliconFlow) → Qdrant向量库 → 检索结果
特点:
0GMem
消息 → Encoder → 四层图谱 → 8策略检索 → 注意力过滤 → 结果
↓
实体+时间+因果+否定 全部结构化
特点:
Letta
消息 → LLM自主调度 → 记忆层次(working/episodic/semantic) → 结果
特点:
- LLM 自己管理记忆
- 仿生操作系统调度
- 完全开源透明
六、中文支持对比
| 系统 |
中文Embedding |
spaCy中文 |
实战验证 |
| Mem0+Qdrant |
✅ BAAI/bge-large-zh-v1.5 |
✅ 可配 |
✅ 已验证 |
| 0GMem |
⚠️ 需自定义 |
⚠️ 英文为主 |
❌ 未充分测试 |
| Letta |
✅ 可配任意 |
✅ 可配 |
⚠️ 部分验证 |
七、部署复杂度
| 系统 |
部署难度 |
预计时间 |
额外依赖 |
| Mem0+Qdrant |
⭐ 低 |
~20min |
Qdrant集群 |
| 0GMem |
⭐⭐ 中高 |
~30min |
spaCy+OpenAI |
| Letta |
⭐⭐⭐ 中等 |
~30min |
Docker/服务化 |
你的现状: Mem0+Qdrant ✅ 已部署验证
八、存储对比
| 系统 |
向量库 |
存储位置 |
预估占用 |
| Mem0+Qdrant |
Qdrant(外置) |
Docker volume |
~500MB/万条 |
| 0GMem |
内置 |
~/.0gmem |
~1GB/万条 |
| Letta |
可配 |
文件/DB |
视配置 |
九、性能对比(延迟)
| 系统 |
p95延迟 |
相比全上下文 |
| Mem0 |
0.15s |
降低91% |
| 0GMem |
0.48s |
降低79% |
| 全上下文 |
2.6s |
— |
结论: Mem0 最快,0GMem 功能强但略慢。
十、成熟度对比
| 系统 |
Stars |
生产验证 |
社区活跃 |
维护状态 |
| Mem0 |
10K+ |
✅ 大量 |
✅ |
✅ 活跃 |
| Letta |
21K |
✅ 大量 |
✅ 非常 |
✅ 活跃 |
| 0GMem |
4 |
❌ 极新 |
❌ |
⚠️ 起步 |
十一、优劣总结
Mem0 + Qdrant(你现在用的)
| 优点 |
缺点 |
| ✅ 成熟稳定 |
❌ 准确率不如 0GMem |
| ✅ 中文支持好 |
❌ 无时间/否定处理 |
| ✅ Qdrant 可扩展 |
❌ 单跳检索为主 |
| ✅ 已部署验证 |
|
| ✅ SiliconFlow 便宜 |
|
0GMem
| 优点 |
缺点 |
| ✅ 准确率最高(96.6%) |
❌ 极新,生产验证有限 |
| ✅ 超越人类基准 |
❌ 中文支持弱 |
| ✅ 时间+否定+多跳全能 |
❌ 主要依赖 OpenAI |
| ✅ 结构化存储 |
❌ 4 stars,社区小 |
Letta
| 优点 |
缺点 |
| ✅ 21K stars,最成熟 |
❌ 准确率不如 0GMem |
| ✅ 完全开源透明 |
❌ 48-74%波动大 |
| ✅ 多Agent支持 |
❌ LLM自主调度有争议 |
| ✅ 可视化调试 |
|
十二、场景化推荐
| 你的需求 |
推荐 |
理由 |
| 继续用当前方案 |
✅ Mem0+Qdrant |
已部署,稳定够用 |
| 追求最高准确率 |
0GMem |
96.6%大幅领先 |
| 重视开源透明 |
Letta |
21K stars社区验证 |
| 中文为主 |
✅ Mem0+Qdrant |
中文Embedding更优 |
| 不想折腾快速上线 |
✅ Mem0+Qdrant |
已有验证 |
| 有多Agent需求 |
Letta |
原生支持多Agent |
| 有时间推理需求 |
0GMem |
Allen代数原生 |
| 企业级生产 |
✅ Mem0+Qdrant |
成熟稳定 |
十三、最终建议
现阶段(2026年3月)
继续用 Mem0 + Qdrant ✅
理由:
- 已部署、已修bug、已验证正常
- 中文支持更好
- 准确率66.9%对于日常使用足够
- 0GMem太新,需要等3-6个月看发展
3-6个月后重新评估
如果出现以下情况考虑迁移:
- 0GMem 社区验证生产可用
- 有高精度时间推理需求
- 有复杂否定处理需求
- 有多跳推理强需求
Letta 关注价值
如果未来需要:
- 多Agent协作
- 完全开源透明方案
- 可视化调试功能
可以考虑 Letta 作为第二选择。
十四、完整评分(5星制)
| 系统 |
准确率 |
成熟度 |
中文支持 |
易用性 |
开源度 |
总分 |
| Mem0+Qdrant |
⭐⭐⭐ |
⭐⭐⭐⭐⭐ |
⭐⭐⭐⭐⭐ |
⭐⭐⭐⭐⭐ |
⭐⭐⭐ |
22 |
| 0GMem |
⭐⭐⭐⭐⭐ |
⭐⭐ |
⭐⭐ |
⭐⭐⭐ |
⭐⭐⭐⭐⭐ |
18 |
| Letta |
⭐⭐⭐ |
⭐⭐⭐⭐⭐ |
⭐⭐⭐ |
⭐⭐⭐ |
⭐⭐⭐⭐⭐ |
21 |
| 项目 |
内容 |
| 作者 |
胡小纯 |
| 发布日期 |
2026-03-24 |
| 联系微信 |
hu–xiaochun |
| 个人主页 |
https://胡小纯.cn |
| 备用主页 |
https://xn–yets91feqb.cn/ |
技术没有捷径,但有方向
所有评论(0)