全网 AI 记忆系统终极对比：Mem0 vs 0GMem vs Letta vs 人类基准

胡单纯

457人浏览 · 2026-03-24 15:23:24

胡单纯 · 2026-03-24 15:23:24 发布

全网 AI 记忆系统终极对比：Mem0 vs 0GMem vs Letta vs 人类基准

一、参评选手一览

系统	性质	准确率	成熟度	Stars
Mem0 + Qdrant	你现在用的	66.9%	成熟	10K+
0GMem	新秀黑马	96.6%	极新	4
Letta	社区老兵	48-74%	非常成熟	21K
人类基准	上限参照	87.9%	—	—

二、准确率终极对比（LoCoMo 基准）

3轮对话测试

排名	系统	准确率	和人类差距
🥇	0GMem	96.6%	✅ 超越人类！
🥈	人类基准	87.9%	—
🥉	Letta	74.0%	-13.9%
4	Mem0	68.5%	-19.4%

10轮对话测试

排名	系统	准确率	和人类差距
🥇	人类基准	87.9%	—
🥈	0GMem	85.6%	-2.3%
🥉	Letta	48-74%	-13.9%~-40%
4	Mem0	66.9%	-21%

关键发现： 0GMem 在 3轮对话时超越了人类基准！但在 10轮长对话时略低于人类。

三、LoCoMo 排行榜总览

排名	系统	10轮准确率	备注
🥇	0GMem	85.6%	新发布，准确性惊人
🥈	人类	87.9%	上限
🥉	Letta（文件系统）	74%	简单方案逆袭
4	Mem0	68.5%	生产级可用
5	Zep	58-75%	有争议
6	OpenAI Memory	52.9%	官方内置
7	MemGPT/Letta	48-74%	波动大
8	Best RAG	41.4%	纯 RAG 基线
9	GPT-4-turbo	~32%	LLM 基线

四、核心能力对比

4.1 时间推理

系统	Allen代数	事件日期索引	跨会话时间推理
0GMem	✅ 13种关系	✅ 写入时建立	✅
Mem0	❌	❌	❌
Letta	❌	❌	❌

4.2 否定处理

系统	否定提取	否定存储	否定检索
0GMem	✅	✅ 一级公民	✅
Mem0	❌	❌	❌
Letta	❌	❌	❌

4.3 多跳推理

系统	单跳检索	多跳推理	查询分解
0GMem	✅	✅ BFS三图	✅ 9类问题
Mem0	✅	❌	❌
Letta	✅	⚠️ Agent决定	⚠️

4.4 检索策略

系统	语义搜索	BM25	图遍历	注意力过滤
0GMem	✅	✅	✅	✅
Mem0	✅	❌	❌	❌
Letta	✅	❌	⚠️	❌

五、技术架构对比

Mem0 + Qdrant（你现在用的）

消息 → Mem0 → Embedding(SiliconFlow) → Qdrant向量库 → 检索结果

特点：

扁平事实存储
简单直接
依赖外部向量库

0GMem

消息 → Encoder → 四层图谱 → 8策略检索 → 注意力过滤 → 结果
        ↓
    实体+时间+因果+否定 全部结构化

特点：

写入时建立结构
多层记忆层次
精确遗忘机制

Letta

消息 → LLM自主调度 → 记忆层次(working/episodic/semantic) → 结果

特点：

LLM 自己管理记忆
仿生操作系统调度
完全开源透明

六、中文支持对比

系统	中文Embedding	spaCy中文	实战验证
Mem0+Qdrant	✅ BAAI/bge-large-zh-v1.5	✅ 可配	✅ 已验证
0GMem	⚠️ 需自定义	⚠️ 英文为主	❌ 未充分测试
Letta	✅ 可配任意	✅ 可配	⚠️ 部分验证

七、部署复杂度

系统	部署难度	预计时间	额外依赖
Mem0+Qdrant	⭐ 低	~20min	Qdrant集群
0GMem	⭐⭐ 中高	~30min	spaCy+OpenAI
Letta	⭐⭐⭐ 中等	~30min	Docker/服务化

你的现状： Mem0+Qdrant ✅ 已部署验证

八、存储对比

系统	向量库	存储位置	预估占用
Mem0+Qdrant	Qdrant（外置）	Docker volume	~500MB/万条
0GMem	内置	`~/.0gmem`	~1GB/万条
Letta	可配	文件/DB	视配置

九、性能对比（延迟）

系统	p95延迟	相比全上下文
Mem0	0.15s	降低91%
0GMem	0.48s	降低79%
全上下文	2.6s	—

结论： Mem0 最快，0GMem 功能强但略慢。

十、成熟度对比

系统	Stars	生产验证	社区活跃	维护状态
Mem0	10K+	✅ 大量	✅	✅ 活跃
Letta	21K	✅ 大量	✅ 非常	✅ 活跃
0GMem	4	❌ 极新	❌	⚠️ 起步

十一、优劣总结

Mem0 + Qdrant（你现在用的）

优点	缺点
✅ 成熟稳定	❌ 准确率不如 0GMem
✅ 中文支持好	❌ 无时间/否定处理
✅ Qdrant 可扩展	❌ 单跳检索为主
✅ 已部署验证
✅ SiliconFlow 便宜

0GMem

优点	缺点
✅ 准确率最高（96.6%）	❌ 极新，生产验证有限
✅ 超越人类基准	❌ 中文支持弱
✅ 时间+否定+多跳全能	❌ 主要依赖 OpenAI
✅ 结构化存储	❌ 4 stars，社区小

Letta

优点	缺点
✅ 21K stars，最成熟	❌ 准确率不如 0GMem
✅ 完全开源透明	❌ 48-74%波动大
✅ 多Agent支持	❌ LLM自主调度有争议
✅ 可视化调试

十二、场景化推荐

你的需求	推荐	理由
继续用当前方案	✅ Mem0+Qdrant	已部署，稳定够用
追求最高准确率	0GMem	96.6%大幅领先
重视开源透明	Letta	21K stars社区验证
中文为主	✅ Mem0+Qdrant	中文Embedding更优
不想折腾快速上线	✅ Mem0+Qdrant	已有验证
有多Agent需求	Letta	原生支持多Agent
有时间推理需求	0GMem	Allen代数原生
企业级生产	✅ Mem0+Qdrant	成熟稳定

十三、最终建议

现阶段（2026年3月）

继续用 Mem0 + Qdrant ✅

理由：

已部署、已修bug、已验证正常
中文支持更好
准确率66.9%对于日常使用足够
0GMem太新，需要等3-6个月看发展

3-6个月后重新评估

如果出现以下情况考虑迁移：

0GMem 社区验证生产可用
有高精度时间推理需求
有复杂否定处理需求
有多跳推理强需求

Letta 关注价值

如果未来需要：

多Agent协作
完全开源透明方案
可视化调试功能

可以考虑 Letta 作为第二选择。

十四、完整评分（5星制）

系统	准确率	成熟度	中文支持	易用性	开源度	总分
Mem0+Qdrant	⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐	22
0GMem	⭐⭐⭐⭐⭐	⭐⭐	⭐⭐	⭐⭐⭐	⭐⭐⭐⭐⭐	18
Letta	⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐	⭐⭐⭐⭐⭐	21

项目	内容
作者	胡小纯
发布日期	2026-03-24
联系微信	hu–xiaochun
个人主页	https://胡小纯.cn
备用主页	https://xn–yets91feqb.cn/

技术没有捷径，但有方向

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

Claude 大模型新手入门与实战指南

摘要：本文为零基础用户提供大模型入门指南，从环境准备到实战应用，涵盖账号注册、核心概念解析、网页交互操作、API调用、提示词优化等关键环节。通过具体案例（如制定Python学习计划）演示迭代对话技巧，强调任务拆解与安全规范。文章指出大模型适合生成类任务，需注意数据隐私和内容核实，建议采用"AI生成+人工校验"的协作模式，帮助读者快速掌握智能工具的核心使用方法。

AtomGit开源社区

使用Koopman理论识别机器人动力学的非线性系统（Matlab代码实现）

实际中的大多数系统均为非线性系统，而Koopman算子可以描述非线性系统的可观测状态量在高维空间中的线性演化过程，可以将非线性问题转化为线性问题，对于非线性系统的研究有较大的价值。利用Koopman算子理论，可以仅依靠实验数据或系统仿真数据建立非线性系统的线性模型，基于该模型可实现对非线性系统的分析、预测和控制[6]。为了识别杜宾汽车模型的非线性动力学，我们使用Koopman算子理论首先从系统的仿