导读
【导读】Mintlify在官方工程博客披露:为了让AI文档助手像开发者读代码仓库一样“逛文档”,他们用ChromaFs给模型“造”了一个虚拟文件系统,把会话创建p90从约46秒压到约100毫秒,还宣称边际计算成本接近0——这套“幻觉文件系统”,可能会把RAG的玩法彻底改写。

💥 用户盯着转圈46秒:真沙箱太强,也太贵

做文档助手最尴尬的场景是什么?

你问一个跨多页的配置问题,答案散在几篇文档里;或者你要的是某个精确字符串/精确语法。传统“检索Top-K chunks → 拼上下文”的路子,很容易漏掉关键段落。

Mintlify在官方博客里写得很直白:

“Our assistant could only retrieve chunks of text that matched a query. If the answer lived across multiple pages, or the user needed exact syntax that didn’t land in a top-K result, it was stuck.”

「我们的助手只能取回与查询匹配的文本块。答案如果分散在多个页面,或用户需要的精确语法没有进入top-K结果,它就会卡住。」

那就给agent一个“真实文件系统”让它自己grep/cat/ls/find?

他们确实这么干过:起隔离sandbox、clone仓库、准备环境。

结果:前台用户等不起。

“Our p90 session creation time (including GitHub clone and other setup) was ~46 seconds.”

「p90会话创建时间(含clone与setup)约46秒。」

更离谱的是账单:官方按“850,000次/月对话”的量级估算,即使最小配置也会逼近每年7万美元以上的沙箱成本(还不算更长会话、warm pool等)。

🪄 关键一句话:Agent不需要真文件系统,只要“足够逼真的幻觉”

Mintlify把这次的灵魂结论写成了金句:

“The agent doesn’t need a real filesystem; it just needs the illusion of one.”

「Agent不需要一个真实的文件系统,它只需要一个像真的一样的幻觉。」

于是他们反其道而行:

  • 文档本来就已经被索引、切chunk,并存进Chroma数据库(给搜索用)
  • 那就把ls/cat/grep/find/cd这些命令“截获”下来
  • 把命令翻译成对Chroma的查询 + 缓存拼装

这套东西他们起了个名字:ChromaFs

🔧 ChromaFs到底做了什么:让模型以为在敲命令,其实在查数据库

Mintlify的实现堆栈很清晰:

  • 上层:LLM Agent(以为自己在跑shell)
  • 中间:Vercel Labs 的just-bash(TypeScript版bash子集,负责解析/管道/flags)
  • 底层:ChromaFs实现just-bash暴露的IFileSystem接口,把“文件系统调用”翻译成Chroma查询

官方给出的结果也很炸:

“Session creation dropped from ~46 seconds to ~100 milliseconds … the marginal per-conversation compute cost is zero.”

「会话创建从约46秒降到约100毫秒……由于复用了既有基础设施,边际每次对话的计算成本为0。」

▲ Mintlify工程作者Dens Sumesh发的架构图:上面是agent,下面是Chroma/Redis/S3,中间用just-bash把命令“翻译”成查询

▲ Vercel CTO @cramforce:Mintlify assistant由just-bash驱动,并带自定义文件系统

📦 最狠的不是“快”,而是这套把文档变成“可探索”的结构

官方博客里,ChromaFs把“文档网站”硬生生映射成了一个只读文件系统:

1)先把全站目录树塞进数据库:\_\_path\_tree\_\_

他们把整个文件树做成gzip的JSON,用\_\_path\_tree\_\_作为标识存进Chroma。初始化时取出并解压到内存:

  • Set<string>:所有路径
  • Map<string, string[]>:目录 → 子项

于是ls/cd/find几乎都能在本地内存完成,后续会话还会命中缓存。

2)RBAC顺手解决:先剪枝路径树,agent连“路径名”都看不到

路径树里带着isPublicgroups字段。

Mintlify的做法是:在构建文件树之前,根据用户session token把没有权限的路径剪掉;后续所有Chroma查询也再做过滤。

这带来一个产品层面的狠招:越权风险不是靠“容器里chmod配到头秃”去堵,而是在‘目录树这张地图’上直接抹掉禁区

3)cat读整页:按chunk\_index把碎片拼回“完整文件”

文档页在Chroma里是chunk化的。

当agent跑cat /auth/oauth.mdx,ChromaFs会:

  • 查出同一page slug的所有chunks
  • chunk\_index排序
  • join成完整页面
  • 缓存结果,避免重复读取

4)写操作一律报错:EROFS(只读)

官方写得很绝对:所有写操作直接抛EROFS(Read-Only File System)

好处也很工程:无状态、不用清理session、不会互相污染。

⚡ grep才是地狱模式:他们用“粗筛+预取+内存精筛”硬把它拉回毫秒级

在“文件系统隐喻”里,grep是最容易炸的:递归扫文件、跨网络拉内容,慢到离谱。

Mintlify的做法是三段式:

1)粗筛:截获just-bash的grep,用yargs-parser解析flags,把查询翻译成Chroma过滤:固定字符串用$contains,模式用$regex

2)预取:把可能命中的chunks bulk prefetch进Redis cache

3)精筛:把grep改写成只针对命中文件,在内存里做最终匹配

官方结论:大型递归grep可以跑到毫秒级

▲ Chroma官方账号:ChromaFs把Chroma变成agent的虚拟文件系统,取代有状态sandbox

🔥 HN吵翻了:RAG里的“R”,很多人其实一直理解错了?

这篇文章在Hacker News的讨论区引爆了一个老话题:

很多人把RAG默认等同“向量检索+Top-K chunk”。

但HN评论区有人直接把定义掰正:

“R in RAG stands for retrieval … Nothing in RAG implies vector search and text embeddings …”

「RAG里的R是Retrieval(检索)。它可以是网页搜索、SQL查询、grep、目录遍历……并不天然绑定向量检索与embedding。」

还有人给出一个更尖锐的洞察:

“The directory hierarchy is already a human-curated knowledge graph.”

「目录层级本身就是人类预先整理过的知识图谱。」

换句话说,Mintlify真正“替换”的并非Retrieval,而是把检索锁死在某一种实现上的那条窄路。

🧯 100ms别被带跑偏:快的是“会话创建/启动”,不是回答速度开了外挂

这里有个特别容易被误读的点:

  • 46秒 → 100ms

    指的是“会话创建/启动”层面的冷启动(clone、setup、起sandbox)被移走了

  • 模型推理、数据库查询、缓存命中等依然有成本

  • 官方说的“边际成本为0”,更多是指:不再为每次对话额外起一套沙箱/微型VM

把这层说清楚,文章更抗挑刺。

🚪 下一波文档助手的分水岭:从“喂chunks”到“给工具,让它自己探索”

Mintlify这套ChromaFs让人后背发凉的地方在于:

它把“文档”从一堆碎片,重新变成了一个可遍历的结构世界。

对agent来说,最自然的交互层可能会持续向这些“可组合工具”收敛:

  • ls先看地图
  • find定位范围
  • grep锁定线索
  • cat读全页
  • 再用LLM把线索组织成答案

当工具链变得足够便宜、足够快,很多团队会开始问同一个问题:

我们还要不要为“每个对话起一个真实sandbox”买单?

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

在这里插入图片描述

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐