Obsidian + LLM Wiki 落地指南：从零搭建你的 AI 知识库

Python_金钱豹

273人浏览 · 2026-06-12 22:24:24

Python_金钱豹 · 2026-06-12 22:24:24 发布

这篇是实操篇：怎么用 Obsidian + LLM 把这套模式跑起来。

不需要任何编程基础，跟着做就行。

如果你想快速上手，本文所述的内容已经在我的【llm-wiki】项目中完整实现，包含开箱即用的 Skill 定义、自动化脚本和规范模板。欢迎 Star 和关注，一起让知识持续生长。

我的LLM-Wiki项目：https://github.com/guanyang/llm-wiki

为什么是 Obsidian

在 LLM Wiki 模式中，你需要一个能浏览和管理 markdown 文件的工具。理论上任何文本编辑器都行，但 Obsidian[1] 是目前最合适的选择：

• 纯本地存储：所有数据都是本地的 .md 文件，没有云端锁定，随时可以用 Git 管理版本
• 双向链接：原生支持 [[双链]] 语法，这正是 wiki 页面之间交叉引用的基础
• 图谱视图：可视化展示页面之间的关联关系，一眼看清知识结构
• 插件生态：Dataview、Web Clipper 等插件完美配合 LLM Wiki 的工作流

用 Karpathy 的比喻：Obsidian 是"IDE"，LLM 是"程序员"，wiki 是"代码库"。你在 Obsidian 里浏览和审阅，LLM 负责编写和维护。

与传统 RAG 的区别

维度	传统 RAG	LLM Wiki
知识存储	原始文档 + 向量索引	结构化、互相链接的 Markdown 页面
查询方式	每次从零检索、拼凑	基于已编译的知识综合回答
知识积累	无——每次重新推导	有——每次操作都让 wiki 更丰富
交叉引用	无	自动维护的 `[[双链]]` 网络
矛盾处理	不感知	主动标注、注明来源

LLM Wiki架构

第一步：安装 Obsidian

从 obsidian.md[1] 下载安装，支持 macOS、Windows、Linux 和移动端。

打开后选择 Create new vault，起个名字（比如 my-wiki），选一个本地文件夹。Vault 就是一个普通文件夹，没有任何私有格式。

第二步：搭建目录结构

LLM Wiki 采用四层架构，每层职责清晰。在 vault 根目录下创建以下结构：

my-wiki/├── AGENTS.md                      # Schema：LLM 的行为规范├── skills/                        # Agent Skill：工作流详细规则│   └── llm-wiki/                  # LLM Wiki skill（按需加载）├── raw/                           # 原始素材（人类写入，LLM 只读）│   ├── 00-Inbox/                  # 快速收集箱│   ├── 01-Daily/                  # 每日笔记│   ├── 10-Work/                   # 工作相关│   ├── 20-Tech/                   # 技术知识│   ├── 30-Life/                   # 生活日常│   ├── 80-Templates/              # 笔记模板│   ├── 90-Attachments/            # 图片、PDF 等附件│   └── 95-Archive/                # 归档区├── wiki/                          # LLM 编译产物（LLM 读写）│   ├── index.md                   # 全局索引（含 confidence、status）│   ├── log.md                     # 操作日志（最近 30 天）│   ├── lifecycle.md               # 【可插拔】生命周期数据│   ├── entities/                  # 实体页（工具、框架、人物）│   ├── concepts/                  # 概念页（设计模式、方法论）│   ├── summaries/                 # 素材摘要页│   ├── comparisons/               # 对比分析页│   └── synthesis/                 # 综合分析页└── output/                        # 成品输出（LLM 生成，人类审核）    ├── posts/                     # 博客文章    ├── reports/                   # 研究报告    ├── slides/                    # 演示文稿（Marp）    ├── tutorials/                 # 教程指南    └── newsletters/               # 知识简报

几个关键点：

• raw/ 是你的领地，LLM 绝不修改这里的任何文件。你的笔记、剪藏、日记都放这里。
• wiki/ 是 LLM 的领地，它负责创建和维护所有页面。你只浏览，不手动编辑。
• output/ 是协作区，LLM 生成草稿，你审核定稿。
• raw/ 下的子目录可以根据你的实际需要增减，上面只是一个参考模板。

第三步：配置 Obsidian

打开 Obsidian 设置（左下角齿轮图标），调整以下几项：

附件路径：Settings → Files & Links → Default location for new attachments → 选择 “In the folder specified below”，路径填 raw/90-Attachments。这样你粘贴的截图、拖入的文件会统一存放。

每日笔记：Settings → Core plugins → 启用 Daily notes → New file location 设为 raw/01-Daily，Date format 设为 YYYY-MM-DD。

模板（可选）：Settings → Core plugins → 启用 Templates → Template folder location 设为 raw/80-Templates。

第四步：安装推荐插件

进入 Settings → Community plugins → 点击 “Turn on community plugins” → Browse，搜索并安装以下插件：

Dataview（强烈推荐）

Dataview 可以对 wiki 页面的 YAML frontmatter 执行类 SQL 查询，动态生成表格和列表。

安装后，你可以在任意 markdown 文件中写查询。比如列出所有最近更新的 wiki 页面：

```dataviewTABLE description, updatedFROM "wiki"SORT updated DESCLIMIT 10```

或者按标签分类查看概念页：

```dataviewLIST descriptionFROM "wiki/concepts"WHERE contains(tags, "AI")```

LLM Wiki 的每个页面都有规范的 frontmatter（title、tags、category、created、updated、sources、description），这让 Dataview 的查询非常灵活。

Obsidian Web Clipper（强烈推荐）

这是 Obsidian 官方的浏览器扩展（支持 Chrome 和 Firefox），可以一键将网页文章转为 markdown 保存到 vault。

安装后，在浏览器中看到想收藏的文章，点击扩展图标，选择保存到 raw/00-Inbox/。文章会自动转为 markdown 格式。

一个小建议：剪藏后在 Obsidian 中打开文件，用"Download images locally"功能把图片下载到 raw/90-Attachments/，避免外链失效。

Excalidraw（可选）

手绘风格的图表工具，适合画架构图、流程图。如果你喜欢在笔记中画图，装上它。

Marp Slides（可选）

基于 markdown 生成幻灯片。如果你经常需要从知识库内容做汇报或分享，这个插件可以让你直接在 Obsidian 中写幻灯片，用 --- 分页，所见即所得。

第五步：编写 Schema 文件

Schema 是整个系统的灵魂——它告诉 LLM 如何维护你的 wiki。在 vault 根目录创建 AGENTS.md（通用）或 CLAUDE.md（Claude 专用），内容包括四个部分，把规则告诉LLM，让其帮忙生成Schema文件，再不断微调即可：

1. 目录结构和权限

告诉 LLM 每个文件夹的用途和读写权限。最重要的规则：raw 只读，wiki 读写，绝不修改原始素材。

2. 页面格式规范

定义每个 wiki 页面必须包含的 YAML frontmatter：

---title: 页面标题aliases: [别名1, 别名2]tags: [领域标签, 类型标签]category: entities | concepts | summaries | comparisons | synthesiscreated: YYYY-MM-DDupdated: YYYY-MM-DDsources:  - "[[raw/路径/源文件名]]"description: 一句话摘要，不超过100字---

3. 标签体系

预定义一套标签，从三个维度选取：

• 领域标签：AI、软件工程、数据库、架构、知识管理……
• 类型标签：工具、框架、模式、概念、人物、对比分析……
• 成熟度标签（可选）：成熟、新兴、实验性、已废弃

标签用中文还是英文，取决于你的偏好，但要保持一致。

4. 工作流程定义

定义三个核心操作的具体步骤：

Ingest（摄入）：读取素材 → 提取关键信息 → 与用户讨论 → 创建摘要页 → 更新实体/概念页 → 维护交叉引用 → 更新 index.md → 记录 log.md

Query（查询）：读取 index.md 定位页面 → 阅读相关页面 → 合成答案 → 提供引用 → 询问是否存档

Lint（健康检查）：矛盾检测 → 孤立页面 → 缺失概念页 → 过时声明 → 交叉引用完整性 → 生成修复建议

Publish（发布）：确认输出类型和受众 → 从 index.md 定位相关 wiki 页面 → 阅读来源页面 → 生成草稿到 output/ 对应子目录 → 将 [[双链]] 转为标准 Markdown 链接（成品必须独立可读）→ 用户审核修改 → 记录 log.md

Refresh（联网重校验）：针对怀疑过时的主题 → 联网检索最新信息 → 对比差异 → 用户确认后存为新 raw 素材 → 重新 ingest 更新 wiki

不需要一次写到完美。先写一个最小版本，用起来之后根据实际体验逐步迭代。Schema 本身就是人类和 LLM 共同演进的产物——你用着觉得哪里不顺，就改哪里。

第六步：初始化 Wiki

在 wiki/ 下创建两个基础文件：

wiki/index.md——全局索引：

# Wiki Index> 最后更新：YYYY-MM-DD | 页面总数：N | 素材总数：M## Entities- [[Obsidian]] - 基于本地 markdown 的知识管理工具 (sources: 1)## Concepts- [[RAG]] - 检索增强生成，LLM + 文档交互的主流方式 (sources: 1)## Summaries- [[raw-articles-llm-wiki]] - Karpathy 的 LLM Wiki 模式完整阐述 (2026-04-12)## Comparisons- [[LLM-Wiki-vs-RAG]] - LLM Wiki 模式与传统 RAG 的对比分析 (sources: 1)## Synthesis- [[index与log的扩展性分析]] - index.md 和 log.md 随规模增长的瓶颈及分阶段应对策略

wiki/log.md——操作日志：

# Wiki Log## [YYYY-MM-DD] ingest | 素材标题- 来源：`raw/路径/文件名`- 新建：[[页面1]]、[[页面2]]- 更新：[[页面3]]（新增xxx章节）- 更新：index.md## [YYYY-MM-DD] query | 查询问题- 查阅：[[页面1]]、[[页面2]]- 产出：[[对比分析页]]（已存入 wiki）## [YYYY-MM-DD] lint | 健康检查- 发现矛盾：[[页面A]] 与 [[页面B]] 关于xxx的描述不一致- 孤立页面：[[页面C]]（无入链）- 缺失概念页：建议创建 [[概念X]]- 已修复：N 项 | 待修复：M 项## [YYYY-MM-DD] publish | 成品标题- 类型：post | report | slides | tutorial | newsletter- 输出：`output/posts/文件名.md`- 来源：[[wiki 页面1]]、[[wiki 页面2]]、...- 状态：草稿 | 已审核

这两个文件是 LLM 的导航入口。index.md 是内容导向的目录，log.md 是时间导向的操作记录。LLM 每次操作都会更新它们。

第七步：第一次 Ingest

万事俱备，开始消化第一篇素材。

1. 把一篇你想消化的文章保存到 raw/00-Inbox/（用 Web Clipper 剪藏，或手动复制 markdown）
1. 打开你的 LLM 对话工具，把 AGENTS.md 和素材文件的内容一起给它
1. 说：“请消化这篇文章，按照 AGENTS.md 的规范执行 ingest。”

LLM 会：

• 读取全文，提取关键信息
• 向你汇报关键发现，确认重点
• 创建摘要页（wiki/summaries/）
• 创建或更新实体页（wiki/entities/）和概念页（wiki/concepts/）
• 在页面之间建立 [[双链]] 交叉引用
• 更新 wiki/index.md 和 wiki/log.md

一次 ingest 可能触发 10-15 个文件的创建或更新——这正是人类不愿意做、但 LLM 毫不费力的事情。

完成后，回到 Obsidian 刷新，你会看到新生成的 wiki 页面。点击双链可以在页面之间跳转，打开图谱视图可以看到知识结构正在成形。

日常使用节奏

跑通第一次 ingest 之后，日常使用就很自然了：

收集：碰到好文章 → Web Clipper 一键剪藏到 raw/00-Inbox/ → 有空时告诉 LLM “ingest 这篇”

查询：有问题想查 → 告诉 LLM “查一下 xxx” → LLM 查阅 wiki 已编译的知识回答 → 好答案存回 wiki（对比分析存 comparisons/，综合洞察存 synthesis/）

维护：每周或每月告诉 LLM “做一次 lint” → 检查矛盾、孤立页面、缺失引用、过时声明 → 确认后 LLM 自动修复

输出：需要写博客或做汇报 → 告诉 LLM “把 xxx 主题整理成博客” → LLM 从 wiki 提炼成品到 output/ → 你审核定稿

关键心态：不需要一次消化所有存量笔记。从今天开始，每次碰到新素材就 ingest 一篇，wiki 会自然生长。存量笔记可以在需要时按需消化。

规模增长怎么办

一个常见的担忧：wiki 越来越大，index.md 和 log.md 会不会撑不住？

实际上这个问题来得比想象中晚：

阶段	页面数	状态
起步期	< 300	单文件 index.md 完全够用，不需要任何改动
中期	300-1000	可以把 index 拆分为分类子索引（`index-entities.md`、`index-concepts.md`），主 index 保留入口
后期	1000+	引入 qmd[2] 语义搜索（支持 BM25 + 向量混合搜索，全部本地运行），index 降级为辅助导航；用 Dataview 从 frontmatter 动态生成视图

log.md 更简单：按年归档即可。年初把上一年的 log 移入 wiki/logs/log-YYYY.md，当前 log 重新开始。

而且，这些优化操作本身也可以交给 LLM 执行，几分钟就能完成。

常见问题

Q：我已经有很多 Obsidian 笔记了，怎么迁移？

把现有笔记放到 raw/ 对应的子目录下即可。不需要一次性全部 ingest，按需消化。LLM Wiki 的 raw 层本来就是为了容纳你已有的笔记。

Q：LLM 生成的 wiki 页面质量不好怎么办？

调整 Schema。Schema 是你和 LLM 之间的"合同"，如果输出不符合预期，大概率是 Schema 的描述不够清晰。迭代几次就会越来越好。

Q：多设备同步怎么办？

Obsidian vault 就是一个普通文件夹，用 Git、iCloud、Syncthing、Obsidian Sync 都可以同步。推荐 Git——既能同步，又有版本历史。

Q：能不能多人协作？

可以。多人共享同一个 Git 仓库，各自往 raw/ 放素材，通过 LLM 统一消化进 wiki。Schema 文件是共享的规范。

Q：和 NotebookLM 比有什么优势？

NotebookLM 是典型的 RAG 模式——扔文件进去就能问，但知识不会积累。LLM Wiki 需要多一步 ingest，但换来的是持续复利的知识库。判断标准：这个知识以后还会用到吗？会 → LLM Wiki；不会 → NotebookLM 问完即走。

小结

整个搭建过程大约 30 分钟：装 Obsidian、建目录、装插件、写 Schema、初始化 wiki、跑第一次 ingest。之后就是日常的收集-消化-查询-输出循环。

最重要的不是一开始就搭建完美的系统，而是开始用起来。Schema 会迭代，目录会调整，标签会演化——这些都是正常的。LLM Wiki 的核心价值在于：每一次 ingest 和 query 都让知识库变得更丰富，知识在持续复利。

开始养你的知识花园吧。

学AI大模型的正确顺序，千万不要搞错了

🤔2026年AI风口已来！各行各业的AI渗透肉眼可见，超多公司要么转型做AI相关产品，要么高薪挖AI技术人才，机遇直接摆在眼前！

有往AI方向发展，或者本身有后端编程基础的朋友，直接冲AI大模型应用开发转岗超合适！

就算暂时不打算转岗，了解大模型、RAG、Prompt、Agent这些热门概念，能上手做简单项目，也绝对是求职加分王🔋

在这里插入图片描述

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料，手把手帮你快速入门！👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型（GPT、文心一言等）特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架（LangChain等）实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块，看似清晰好上手，实则每个部分都有扎实的核心内容需要吃透！

我把大模型的学习全流程已经整理📚好了！抓住AI时代风口，轻松解锁职业新可能，希望大家都能把握机遇，实现薪资/职业跃迁～

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

在这里插入图片描述

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

程序员AI时代35岁出路指南

AtomGit开源社区

开源项目吐槽大会：一场技术人的“真心话大冒险”

**2.2 安装与依赖“地狱”** * “一行命令安装”背后的九九八十一难。* **2.5 社区响应“薛定谔的猫”** * Issue 石沉大海、PR 审核周期漫长、维护者态度高冷。## 3. 从“吐槽者”到“建设者”：心态与方法的转变 * **3.1 有效吐槽的黄金法则** * **先搜索**：你的问题可能已有答案或已知 Bug。* **3.2 技术层面的准备** * 阅读源码，定位问题根因。*