本文为你介绍一套双层系统,能让你运行的每一个 AI 智能体都变得更聪明。20 分钟即可搭建完成,效果会逐日提升,且完全开源。

安德烈・卡帕西近期提到,他现在把大部分 Token 开销从代码转向了知识管理。

这篇帖子引发了广泛共鸣,因为它点出了所有人都能感受到的问题:你的 AI 智能体根本不了解你。每次对话都从零开始,你要反复解释你的业务、你的风格、你的目标、你的上下文,而输出内容千篇一律,因为输入没有记忆。

我借鉴了他的思路,在两周内测试了多种方案,最终精简出最有效的一种,并导入了我自己的数据:笔记、想法、推文、文章、书签。AI 智能体据此整理出230 多个结构化维基页面,对概念、实体和来源进行交叉关联,我可以随时查询。

本文会讲解什么是知识层,如何为内容创作、企业运营以及个人生活搭建专属知识层。这套框架开源,搭建仅需 20 分钟。

安德烈・卡帕西
@karpathy ・ 4 月 3 日 大语言模型知识库
我最近发现一个非常实用的方法:用大语言模型为各类研究方向搭建个人知识库。这样一来,我近期消耗的 Token 中,用于处理代码的比例大幅下降,更多被用于处理…… (展开更多)

什么是 AI 知识层

AI 知识层是架设在你与 AI 智能体之间的基础架构。智能体在执行任何操作前,都会先读取这一层的信息。 没有它,智能体只能靠猜测;有了它,智能体才能真正 “了解” 你。

它由两部分组成:

  1. 知识库层(KBL)—— 动态层
    你把原始素材扔进一个文件夹:推文、文章、书签、PDF、笔记、语音备忘录。 AI 智能体读取所有内容,按类型分类,生成带交叉引用的结构化维基页面,并维护一份总索引,每条内容附带一句话摘要,方便快速浏览。 你提出的每一个问题,都会被归档为新页面。维基库会随时间不断丰富。
  2. 品牌基础层(BF)—— 静态层

这一层仅由你手动编辑,包含你的语言风格、视觉调性、品牌定位、受众定义,以及你绝对不会使用的词汇。 智能体在生成内容前会读取这一层,但永远不会改写它。即便由 AI 代劳,这一层也能保证所有输出都带有你的个人风格。

两层系统结构如下:

+-------------------------------------------------------+
|                    你的AI智能体                         |
| (文案、调研、策略、分析)                             |
+---------------------------+---------------------------+
      |  读取                          |  读取
      v                              v
+------------------+   +-------------------+
|   知识库层      |   |    品牌基础层     |
|  KNOWLEDGE BASE |   |  BRAND FOUNDATION |
|  LAYER (KBL)    |   |  (BF)             |
|                  |   |                   |
|  动态维护       |   |  静态固定         |
|  AI智能体维护   |   |  人工编辑         |
|  持续迭代丰富   |   |  你的风格、规则、定位 |
|  维基页、来源、索引| |                   |
+--------+---------+   +-------------------+
      |
      整合自
      |
+--------+---------+
|     原始素材箱    |
|  推文、文章、书签 |
|  PDF、笔记、想法  |
+-------------------+

为什么不用传统 RAG?

传统 RAG 是在查询时对文档分块、检索并实时推导答案。 而知识层一次性编译完成,自动交叉关联并保持更新。

卡帕西发现,当素材达到约 100 篇文章时,编译式方案的问答效果优于 RAG。 Graphify 测算,相比检索原始文件,该方案单次查询 Token 消耗减少 71.5 倍。

技术演进分为三个阶段:

  • 单次 RAG(2020–2023)

  • 多跳检索的智能体 RAG(2023–2024)

  • 上下文工程:智能体从多源信息自主构建上下文(2025+)

知识层正是第三阶段的核心基础设施。

为什么大多数人不会搭建?

原因和大多数人不在周日备餐一样:前期花 1 小时,能为一周省下 10 小时,但很少人愿意做。 多数人宁愿抱怨 AI 输出糟糕,也不愿花 20 分钟搭建一套能解决问题的系统。

90% 使用 AI 的人都在做同一件事:写提示词、接受结果、直接发布,毫无判断、毫无审美。 知识层能让你跳出这 90% 的人群。它把你的审美、数据、思维模式编码进去,让 AI 输出的内容像你亲手写的,而非千篇一律的 AI 垃圾。

但门槛确实存在:你需要筛选输入内容。与你工作相关度不足 80% 的内容,直接舍弃。高价值输入才有高质量输出,喂进去噪音,得到的只会是噪音。

面向内容创作者与个人品牌

这是我最初的应用场景。我运营着一个 AI 营销账号和一家代理机构,需要 AI 智能体了解我过往的作品、爆款规律和语言风格。

我搭建了一套名为LLM Wikid的框架并开源(后文会讲解部署方法)。导入个人数据后效果如下:

  • 先把脑中所有想法写下来:项目笔记、半成品产品思路、行业观察、AI 营销趋势判断,无需刻意结构化

  • 导入 6 周内的 87 条 X 平台推文存档、3 篇已发布文章和所有书签

  • AI 智能体处理后生成:15 个主题来源页、14 个概念页、11 个实体页,内含 100 + 条交叉链接

  • 再通过 X API 导入 197 个书签,AI 下载 81 张图片、转录 49 条视频,分析视觉内容并整合进维基库

我的笔记、想法、推文、书签、文章全部关联、可检索。

双层系统实际应用

知识库层(KBL):存放所有动态增长的内容,按类型分类(转录稿、文章、推文、论文),维基链接交叉引用,附带精简摘要索引

写作时输入/wiki-query,即可从个人数据中获得带引用的答案,答案会自动归档为新页面,让后续查询更丰富

文件夹结构示例:

my-wiki/
    raw/                # 原始素材箱
      clippings/        # Obsidian网页剪藏
      ideas/            # 想法、头脑风暴
      bookmarks/        # 收藏的推文、工具
      articles/         # 个人原创文章
      papers/           # 研究论文、PDF
      x-archive/        # X平台导出内容
      assets/images/    # 媒体素材
    wiki/
      index.md          # 总索引
      concepts/          # 概念、框架
      entities/          # 人物、公司、工具
      sources/           # 原始素材摘要
      outputs/           # 查询答案归档
    templates/           # 页面模板
    CLAUDE.md            # 总规则schema

日常浏览时一键剪藏,夜间执行/wiki-ingest自动处理,醒来就能获得更丰富的知识库。

品牌基础层(BF):固定不变的规则,包括 AI 禁用词清单、视觉风格指南、语言风格档案。所有 AI 智能体生成内容前都会先读取。

AI 智能体如何接入

  • 文案智能体:读取风格规范,查询维基库做选题研究,结合数据选择合适格式

  • 调研智能体:监测社交平台新信息,导入原始素材,扩充维基库

  • 策略智能体:交叉对比行业爆款与现有内容,找出空白赛道

知识层越丰富,智能体输出越优质。 同样的智能体,单薄知识库只能产出垃圾;读取 200 + 结构化页面后,输出完全贴合你的风格与数据。

对应 AI 的 5 个等级

这与我此前提出的 AI 营销 5 个层级完全契合:

  1. 自定义提示词(无知识层)
  2. 手动技能(浅层知识层)
  3. 技能 + 品牌基础层(新增 BF)
  4. 智能体从编译知识库读取信息(KBL+BF 协同)
  5. 具备完整复利知识层的自主智能体团队

多数人停留在 1、2 级,知识层能让你直接迈入 4、5 级。

分发与商业价值

低代码让开发变得简单,人人都能 48 小时做出产品,但分发依然困难。 知识层能让分发能力持续复利:每一条内容洞察、每一份书签分析、每一项数据追踪,都会让下一篇内容定位更精准。

设置定时任务,每日自动处理前一天剪藏的内容,分发能力在夜间持续进化。

同时可提供商业服务:为他人搭建知识层,收费1500–3000 美元,月服务费300–500 美元。 10 位客户首年收入可达 5.68 万美元,对创作者或机构而言是可产品化的核心技能。

面向企业与项目

这套架构同样适用于企业级场景。 区别在于:多人智能体共用同一知识层,层内不仅包含内容知识,更有运营知识。

我在 @EspressioAI 和 @LunarStrategy 均落地使用:

  • Espressio:存放客户交付模式、智能体架构模板、内部标准流程

  • Lunar Strategy:存放营销方案、客户调研、内容框架

新员工的智能体接入知识库后,入职即具备生产力,无需花费数周摸索无文档的工作方式。

埃里克・奥修在全公司推行类似系统:每位员工配备适配岗位的 AI 智能体,共享中央大脑。 他的总结:

“私人助理有上限,真正的突破是岗位定制智能体通过中央大脑共享上下文。”

销售成交后,客户运营智能体自动获取交接信息;内容爆款后,销售智能体自动调整触达策略。

信息不会遗漏,因为知识层会留存一切。

规模化路径

个人维基 → 小团队共享知识库(5–10 人)→ 企业级岗位智能体(50 + 人) 模式完全一致:

  1. 导入原始素材
  2. 智能体生成结构化页面
  3. 自动建立交叉关联
  4. 人工审核确认
  5. Git 版本控制,可回滚

科迪・施耐德为本地服务商搭建了具备 10 项能力的营销智能体集群,核心正是承载全部业务数据的数据仓库。 他称之为数据仓库,埃里克称之为共享大脑,卡帕西称之为大模型维基。 名字不重要,关键是:智能体需要编译后的结构化知识,才能完成有价值的工作。

极致形态是格雷格・艾森伯格所说的“环境型企业”:主要由 AI 智能体运营,创始人只需数日检查一次。 Medvi 就是例证:年收入 18 亿美元,仅 2 名员工,无风险投资。AI 负责代码、创意、风格、客服,而知识层是前提。没有它,智能体需要持续人工指令;有了它,智能体依托组织知识自主运行。

面向个人生活

这是最被低估的用途。 这套系统既能追踪内容数据,也能追踪你的思考: 日记、读书笔记、播客精华、健康数据、目标复盘、凌晨突发灵感…… 全部导入原始文件夹,AI 整理为结构化页面。

当你提问:

  • “我的精力水平有什么规律?”

  • “上季度我在效率方面学到了什么?”

会得到基于个人数据的带引用答案,答案自动归档,让下一次提问更智能。

复利循环:每一次提问都让系统更丰富,每一份素材都建立新关联,你的好奇心直接提升答案质量。

这里的质量控制尤为重要,盲目信任 AI 风险极高:

  • 偏差检查:每页自动生成对立观点与数据缺口

  • 审核机制:AI 生成页面默认未审核,仅人工可标记确认

  • 置信度标签:高 / 中 / 低 / 不确定,AI 如实标注知识可靠性

  • 遵循 80/20 原则:让 AI 完成 80% 的整理、编译、关联工作,你把控最后 20% 的筛选、审核、独有洞察。知识层会持续优化这 80% 的质量。

20分钟搭建指南

方案完全开源,部署极速:

克隆仓库(2 分钟)

git clone https://github.com/shannhk/llm-wikid.git my-wiki
cd my-wiki
用 Obsidian 打开该文件夹作为库。

运行智能体(3 分钟)

在文件夹中打开 Claude Code(或支持 Markdown 与 bash 的智能体),它会读取总规则文件CLAUDE.md,自动理解架构并搭建维基结构。

填充素材(10 分钟)

导出 X 平台存档

安装 Obsidian 网页剪藏,收藏优质推文、文章

花 10 分钟写下脑中所有想法

导入书签,相关度≥80% 的内容放入raw/

执行导入(5 分钟)

/wiki-ingest
AI 自动分类、抓取全文、下载分析图片、生成交叉引用页面、标注对立观点与数据缺口、更新总索引。
查询示例:
/wiki-query 哪种内容格式收藏量最高?
AI 会检索索引与相关页面,给出带引用的结论,并自动归档为新页面。

打开图谱视图

在 Obsidian 中打开图谱,你的想法、关注人物、使用工具、核心概念会形成可视化关联网络,开始用/wiki-query探索。

后续可执行:

  • 查看近月收藏最多的主题
  • 查找核心观点的对立论据
  • 汇总对某一竞品 / 工具 / 话题的全部认知
  • 定位知识薄弱的概念

后续优化

  • 设置定时任务,每日自动执行/wiki-ingest

  • 每 1–2 周运行/wiki-lint,检查矛盾、过期内容、孤立页面、重复概念

  • 页面超 300 后,安装 qmd 实现本地混合检索

  • 接入更多智能体:文案、调研、策略,知识层作为共享大脑

时间窗口

卡帕西的帖子收获 9.9 万 + 收藏,Graphify 48 小时上线再获 2.7 万 + 收藏,同期多款实现方案爆红,需求显而易见。

大多数人会收藏、赞叹,却从不动手搭建。 今天花 20 分钟行动的人,下月就会拥有无法被搜索引擎和通用提示词复制的复利知识库,它懂你的风格、数据、模式与审美。

每拖延一周,就错失一周的复利机会。

普通人如何抓住AI大模型的风口?

领取方式在文末

为什么要学习大模型?

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。

目前,开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景,其中,应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。
在这里插入图片描述

随着AI大模型技术的迅速发展,相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业:
在这里插入图片描述

人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!

最后

只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!

在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。

真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】
在这里插入图片描述

大模型全套学习资料展示

自我们与MoPaaS魔泊云合作以来,我们不断打磨课程体系与技术内容,在细节上精益求精,同时在技术层面也新增了许多前沿且实用的内容,力求为大家带来更系统、更实战、更落地的大模型学习体验。

图片

希望这份系统、实用的大模型学习路径,能够帮助你从零入门,进阶到实战,真正掌握AI时代的核心技能!

01 教学内容

在这里插入图片描述

  • 从零到精通完整闭环:【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块,内容比传统教材更贴近企业实战!

  • 大量真实项目案例: 带你亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

02适学人群

应届毕业生‌: 无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌: 非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能突破瓶颈: 传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

image.png

vx扫描下方二维码即可
【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】
在这里插入图片描述

本教程比较珍贵,仅限大家自行学习,不要传播!更严禁商用!

03 入门到进阶学习路线图

大模型学习路线图,整体分为5个大的阶段:
图片

04 视频和书籍PDF合集

图片

从0到掌握主流大模型技术视频教程(涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向)

图片

新手必备的大模型学习PDF书单来了!全是硬核知识,帮你少走弯路(不吹牛,真有用)
图片

05 行业报告+白皮书合集

收集70+报告与白皮书,了解行业最新动态!
图片

06 90+份面试题/经验

AI大模型岗位面试经验总结(谁学技术不是为了赚$呢,找个好的岗位很重要)图片
在这里插入图片描述

07 deepseek部署包+技巧大全

在这里插入图片描述

由于篇幅有限

只展示部分资料

并且还在持续更新中…

真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】
在这里插入图片描述

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐