RAG真被“替换”了？Mintlify造出ChromaFs假文件系统：冷启动46秒砍到100ms！

大靠山

386人浏览 · 2026-04-23 21:16:02

大靠山 · 2026-04-23 21:16:02 发布

导读
【导读】Mintlify在官方工程博客披露：为了让AI文档助手像开发者读代码仓库一样“逛文档”，他们用ChromaFs给模型“造”了一个虚拟文件系统，把会话创建p90从约46秒压到约100毫秒，还宣称边际计算成本接近0——这套“幻觉文件系统”，可能会把RAG的玩法彻底改写。

💥 用户盯着转圈46秒：真沙箱太强，也太贵

做文档助手最尴尬的场景是什么？

你问一个跨多页的配置问题，答案散在几篇文档里；或者你要的是某个精确字符串/精确语法。传统“检索Top-K chunks → 拼上下文”的路子，很容易漏掉关键段落。

Mintlify在官方博客里写得很直白：

“Our assistant could only retrieve chunks of text that matched a query. If the answer lived across multiple pages, or the user needed exact syntax that didn’t land in a top-K result, it was stuck.”

「我们的助手只能取回与查询匹配的文本块。答案如果分散在多个页面，或用户需要的精确语法没有进入top-K结果，它就会卡住。」

那就给agent一个“真实文件系统”让它自己grep/cat/ls/find？

他们确实这么干过：起隔离sandbox、clone仓库、准备环境。

结果：前台用户等不起。

“Our p90 session creation time (including GitHub clone and other setup) was ~46 seconds.”

「p90会话创建时间（含clone与setup）约46秒。」

更离谱的是账单：官方按“850,000次/月对话”的量级估算，即使最小配置也会逼近每年7万美元以上的沙箱成本（还不算更长会话、warm pool等）。

🪄 关键一句话：Agent不需要真文件系统，只要“足够逼真的幻觉”

Mintlify把这次的灵魂结论写成了金句：

“The agent doesn’t need a real filesystem; it just needs the illusion of one.”

「Agent不需要一个真实的文件系统，它只需要一个像真的一样的幻觉。」

于是他们反其道而行：

文档本来就已经被索引、切chunk，并存进Chroma数据库（给搜索用）
那就把ls/cat/grep/find/cd这些命令“截获”下来
把命令翻译成对Chroma的查询 + 缓存拼装

这套东西他们起了个名字：ChromaFs。

🔧 ChromaFs到底做了什么：让模型以为在敲命令，其实在查数据库

Mintlify的实现堆栈很清晰：

上层：LLM Agent（以为自己在跑shell）
中间：Vercel Labs 的just-bash（TypeScript版bash子集，负责解析/管道/flags）
底层：ChromaFs实现just-bash暴露的IFileSystem接口，把“文件系统调用”翻译成Chroma查询

官方给出的结果也很炸：

“Session creation dropped from ~46 seconds to ~100 milliseconds … the marginal per-conversation compute cost is zero.”

「会话创建从约46秒降到约100毫秒……由于复用了既有基础设施，边际每次对话的计算成本为0。」

▲ Mintlify工程作者Dens Sumesh发的架构图：上面是agent，下面是Chroma/Redis/S3，中间用just-bash把命令“翻译”成查询

▲ Vercel CTO @cramforce：Mintlify assistant由just-bash驱动，并带自定义文件系统

📦 最狠的不是“快”，而是这套把文档变成“可探索”的结构

官方博客里，ChromaFs把“文档网站”硬生生映射成了一个只读文件系统：

1）先把全站目录树塞进数据库：\_\_path\_tree\_\_

他们把整个文件树做成gzip的JSON，用\_\_path\_tree\_\_作为标识存进Chroma。初始化时取出并解压到内存：

Set<string>：所有路径
Map<string, string[]>：目录 → 子项

于是ls/cd/find几乎都能在本地内存完成，后续会话还会命中缓存。

2）RBAC顺手解决：先剪枝路径树，agent连“路径名”都看不到

路径树里带着isPublic和groups字段。

Mintlify的做法是：在构建文件树之前，根据用户session token把没有权限的路径剪掉；后续所有Chroma查询也再做过滤。

这带来一个产品层面的狠招：越权风险不是靠“容器里chmod配到头秃”去堵，而是在‘目录树这张地图’上直接抹掉禁区。

3）cat读整页：按chunk\_index把碎片拼回“完整文件”

文档页在Chroma里是chunk化的。

当agent跑cat /auth/oauth.mdx，ChromaFs会：

查出同一page slug的所有chunks
按chunk\_index排序
join成完整页面
缓存结果，避免重复读取

4）写操作一律报错：EROFS（只读）

官方写得很绝对：所有写操作直接抛EROFS（Read-Only File System）。

好处也很工程：无状态、不用清理session、不会互相污染。

⚡ grep才是地狱模式：他们用“粗筛+预取+内存精筛”硬把它拉回毫秒级

在“文件系统隐喻”里，grep是最容易炸的：递归扫文件、跨网络拉内容，慢到离谱。

Mintlify的做法是三段式：

1)粗筛：截获just-bash的grep，用yargs-parser解析flags，把查询翻译成Chroma过滤：固定字符串用$contains，模式用$regex

2)预取：把可能命中的chunks bulk prefetch进Redis cache

3)精筛：把grep改写成只针对命中文件，在内存里做最终匹配

官方结论：大型递归grep可以跑到毫秒级。

▲ Chroma官方账号：ChromaFs把Chroma变成agent的虚拟文件系统，取代有状态sandbox

🔥 HN吵翻了：RAG里的“R”，很多人其实一直理解错了？

这篇文章在Hacker News的讨论区引爆了一个老话题：

很多人把RAG默认等同“向量检索+Top-K chunk”。

但HN评论区有人直接把定义掰正：

“R in RAG stands for retrieval … Nothing in RAG implies vector search and text embeddings …”

「RAG里的R是Retrieval（检索）。它可以是网页搜索、SQL查询、grep、目录遍历……并不天然绑定向量检索与embedding。」

还有人给出一个更尖锐的洞察：

“The directory hierarchy is already a human-curated knowledge graph.”

「目录层级本身就是人类预先整理过的知识图谱。」

换句话说，Mintlify真正“替换”的并非Retrieval，而是把检索锁死在某一种实现上的那条窄路。

🧯 100ms别被带跑偏：快的是“会话创建/启动”，不是回答速度开了外挂

这里有个特别容易被误读的点：

46秒 → 100ms

指的是“会话创建/启动”层面的冷启动（clone、setup、起sandbox）被移走了
模型推理、数据库查询、缓存命中等依然有成本
官方说的“边际成本为0”，更多是指：不再为每次对话额外起一套沙箱/微型VM

把这层说清楚，文章更抗挑刺。

🚪 下一波文档助手的分水岭：从“喂chunks”到“给工具，让它自己探索”

Mintlify这套ChromaFs让人后背发凉的地方在于：

它把“文档”从一堆碎片，重新变成了一个可遍历的结构世界。

对agent来说，最自然的交互层可能会持续向这些“可组合工具”收敛：

ls先看地图
find定位范围
grep锁定线索
cat读全页
再用LLM把线索组织成答案

当工具链变得足够便宜、足够快，很多团队会开始问同一个问题：

我们还要不要为“每个对话起一个真实sandbox”买单？

学AI大模型的正确顺序，千万不要搞错了

🤔2026年AI风口已来！各行各业的AI渗透肉眼可见，超多公司要么转型做AI相关产品，要么高薪挖AI技术人才，机遇直接摆在眼前！

有往AI方向发展，或者本身有后端编程基础的朋友，直接冲AI大模型应用开发转岗超合适！

就算暂时不打算转岗，了解大模型、RAG、Prompt、Agent这些热门概念，能上手做简单项目，也绝对是求职加分王🔋

在这里插入图片描述

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料，手把手帮你快速入门！👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型（GPT、文心一言等）特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架（LangChain等）实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块，看似清晰好上手，实则每个部分都有扎实的核心内容需要吃透！

我把大模型的学习全流程已经整理📚好了！抓住AI时代风口，轻松解锁职业新可能，希望大家都能把握机遇，实现薪资/职业跃迁～