基于SpringAI开发的通用RAG脚手框架，适配各种场景

奋斗的老史

89人浏览 · 2026-05-15 10:23:36

奋斗的老史 · 2026-05-15 10:23:36 发布

RAG 业务落地开发指导

本文面向后续把这套 RAG 能力接入业务系统的开发者，重点回答三件事：

上游业务请求怎么进入 RAG。
RAG 内部各组件怎么串起来。
数据分别存到 MySQL、文件存储、向量库和搜索引擎的哪里。

1. 总体边界

独立工程保留的是一套完整 RAG 子系统，不是简单 demo。

业务系统
  -> RAG HTTP/API 层
  -> 模型/存储/知识库配置
  -> 文档入库 pipeline
  -> 检索 pipeline
  -> QA prompt + 模型调用

代码入口：

src/main/java/com/aizuda/snail/ai/ragforge/controller/RagForgeController.java

这个 controller 只负责暴露接口和参数转换。真正可复用的业务边界在这些类：

RagDocumentService        接收文件/URL，做去重、资源存储、文档元数据入库
DocumentPipeline          解析、切片、写 chunk、写向量库、写搜索引擎
RagSearchService          检索总入口
RagSearchPipeline         检索流水线编排
RagQAService              检索后拼 Prompt 并调用 Chat 模型
KnowledgeService          知识库配置管理
ModelFactory              Chat / Embedding / Rerank 模型工厂
VectorStoreFactory        向量库工厂
SearchEngineFactory       搜索引擎工厂
ResourceService           原始文件存储

2. 配置链路

业务落地前要先准备四类配置。

模型提供商 -> 模型配置 -> 存储实例 -> 知识库

2.1 模型提供商

表：snail_ai_model_provider

作用：记录提供商，如 OpenAI、Ollama、Gemini 或内部兼容 OpenAI 协议的服务。

关键字段：

id              提供商 ID
provider_name   展示名称
provider_key    代码识别用 key，如 openai
is_enabled      是否启用

2.2 模型配置

表：snail_ai_model_config

作用：记录具体模型实例。

RAG 至少需要：

EMBEDDING   文档入库写向量、向量检索时使用
CHAT        QA 阶段生成答案时使用
RERANKER    可选，检索后重排时使用

关键字段：

id             模型配置 ID，业务配置里引用它
provider_id    所属提供商
model_key      真实模型名，如 text-embedding-3-small
model_type     CHAT / EMBEDDING / RERANKER
api_key        加密后的 key
api_endpoint   模型服务地址
config_json    模型扩展参数，如 dimensions、temperature、timeoutMs

代码读取路径：

ModelFactory.getModel(modelConfigId)
-> ModelConfigHandler.getConfigInfo
-> snail_ai_model_config
-> 具体模型实现

2.3 存储实例

表：snail_ai_store_instance

作用：把外部向量库和搜索引擎的连接信息配置化，不写死在代码里。

关键字段：

id          存储实例 ID
category    1=向量库，2=搜索引擎
type        1=PG_VECTOR，2=MILVUS，3=ELASTICSEARCH，4=PG_FULLTEXT
config      连接参数 JSON
status      是否启用
is_default  是否默认

向量库由 VectorStoreFactory 读取：

snail_ai_rag.vector_store_instance_id
-> snail_ai_store_instance.config
-> PGVector / Milvus / Elasticsearch 向量适配器

搜索引擎由 SearchEngineFactory 读取：

snail_ai_rag.search_engine_instance_id
-> snail_ai_store_instance.config
-> Elasticsearch BM25 适配器

2.4 知识库配置

表：snail_ai_rag

作用：这是 RAG 的主配置表，后续所有入库和检索都以 ragId 为主线。

关键字段：

id                         知识库 ID，也就是接口里的 ragId
name                       知识库名称
embedding_model_id          入库和向量检索使用的 Embedding 模型
rerank_model_id             默认 Rerank 模型
vector_store_instance_id    向量库存储实例
search_engine_enable        是否启用 BM25 搜索引擎
search_engine_instance_id   搜索引擎实例
config                      切片、检索、问答参数 JSON
dedup_strategy              文档去重策略
dedup_action                命中去重后的动作
upload_confirm              上传前是否二次确认

config 对应代码：

src/main/java/com/aizuda/snail/ai/persistence/rag/dataobject/RagConfigDO.java

结构：

chunkParams   切片参数：mode、maxChunkTokens、chunkOverlap、regex、smart 模型等
searchParams  检索参数：resultCount、rerankEnabled、denseWeight、rrfK、threshold 等
modelParams   QA 参数：modelId、nearbySliceCount、prompt

3. 文档入库上下游串联

入口：

POST /demo/rag/document/upload-and-process
POST /demo/rag/document/import-url-and-process

业务上游只需要提供：

ragId       写入哪个知识库
file/url    文档来源
可选去重参数 dedupStrategy / dedupAction

完整调用链：

RagForgeController
-> RagDocumentService.upload / importFromUrl
-> DocumentImportFactory
-> ResourceService
-> snail_ai_resource
-> snail_ai_rag_document(PENDING)
-> DocumentPipeline.processDocument
-> ResourceService.load(resourceId)
-> DocumentParserFactory
-> DocumentChunkingService
-> snail_ai_rag_chunk
-> VectorStoreFactory
-> 外部向量库 index: rag_{ragId}
-> SearchEngineFactory
-> 外部搜索引擎 index: rag_{ragId}
-> snail_ai_rag_document.status = SUCCESS / FAILED

3.1 原始文件怎么存

原始文件不直接塞到 snail_ai_rag_document.content。

存储路径：

ResourceService.upload
-> LOCAL 或 MINIO
-> snail_ai_resource
-> snail_ai_rag_document.resource_id

核心表：snail_ai_resource

id             资源 ID
storage_key    本地相对路径或对象存储 key
original_name  原始文件名
file_size      文件大小
mime_type      MIME 类型
storage_type   LOCAL / MINIO
access_url     预览或访问 URL
biz_type       DOCUMENT
biz_id         ragId
creator_id     上传人，可为空

3.2 文档元数据怎么存

表：snail_ai_rag_document

一份上传文档对应一行。

关键字段：

id            documentId
rag_id        所属知识库
name          文件名
file_type     pdf/docx/xlsx/txt/md/html 等
source_type   UPLOAD / URL
status        0=PENDING 1=PARSING 2=PROCESSING 3=SUCCESS 4=FAILED
error_msg     失败原因
chunk_count   切片数量
content_hash  原始内容 SHA-256，用于文档级去重
resource_id   指向 snail_ai_resource.id

推荐业务用法：

上传后返回 documentId
业务系统保存 documentId 与自身业务单据的关系
前端或后台轮询 document.status 判断是否处理完成
失败时展示 error_msg 并允许重试 processDocument

3.3 切片怎么存

表：snail_ai_rag_chunk

一份文档会拆成多行 chunk。

关键字段：

id               chunkId
rag_id           所属知识库
document_id      所属文档
paragraph_index  段落序号
chunk_index      文档内切片序号
content          切片文本
token_count      估算 token 数
vector_id        外部向量库里的向量 ID
content_hash     chunk 文本 SHA-256，用于 chunk 级向量复用

为什么 MySQL 还要存 content：

向量库和搜索引擎负责召回，不负责业务主数据。
最终展示、拼 Prompt、权限过滤、来源展示，都应回到 MySQL chunk/document 做补全。

3.4 向量怎么存

向量不存 MySQL，存外部向量库。

索引命名：

rag_{ragId}

代码：

IndexNameBuilder.KNOWLEDGE.build(Map.of("ragId", ragId))

写入内容：

id        vectorId，对应 snail_ai_rag_chunk.vector_id
content   chunk 文本
metadata  ragId、documentId、chunkId
vector    embedding 后的向量

关系：

snail_ai_rag_chunk.id
  -> metadata.chunkId

snail_ai_rag_chunk.vector_id
  -> 向量库 document/vector id

3.5 搜索引擎怎么存

搜索引擎用于 BM25/关键词召回。当前实现使用 Elasticsearch。

索引命名同样是：

rag_{ragId}

写入内容：

id        chunkId
content   chunk 文本
metadata  ragId、documentId、chunkId

注意：

search_engine_enable=false 时不会写搜索引擎，也不会走 BM25。
业务对编号、术语、错误码召回敏感时，建议开启 BM25。

4. 检索上下游串联

入口：

POST /demo/rag/search

请求：

{
  "ragId": 1,
  "query": "设备报警 E32 怎么处理？",
  "debug": true
}

完整调用链：

RagForgeController.search
-> RagSearchService.search
-> RagSearchPipeline
   -> ConfigResolveHandler
   -> QueryRewriteHandler
   -> VectorSearchHandler
   -> Bm25SearchHandler
   -> HybridFusionHandler
   -> RerankHandler
   -> FinalizeHandler

4.1 ConfigResolveHandler

输入：

ragId

读取：

snail_ai_rag
snail_ai_rag.config

输出到上下文：

knowledge
searchParams
modelParams
query

4.2 VectorSearchHandler

读取：

knowledge.vector_store_instance_id
knowledge.embedding_model_id
searchParams.resultCount

下游：

VectorStoreFactory
-> 外部向量库 rag_{ragId}

输出：

vectorResults: List<SearchResult>

其中 SearchResult.chunkId 来自向量 metadata，后面用于回查 MySQL。

4.3 Bm25SearchHandler

前提：

snail_ai_rag.search_engine_enable = true

读取：

knowledge.search_engine_instance_id
searchParams.resultCount

下游：

SearchEngineFactory
-> Elasticsearch rag_{ragId}

输出：

bm25Results: List<SearchResult>

4.4 HybridFusionHandler

作用：融合向量召回和 BM25 召回。

支持策略：

RRF           默认推荐，按排名倒数融合，比较稳定
WEIGHTED_SUM  按 denseWeight 做加权，适合调参后固定业务场景

配置来源：

snail_ai_rag.config.searchParams.fusionStrategy
snail_ai_rag.config.searchParams.denseWeight
snail_ai_rag.config.searchParams.rrfK

4.5 RerankHandler

作用：用 Reranker 模型对融合后的候选重新排序。

配置来源：

rerankEnabled
rerankModelId
enterRerankCount
resultCount

成本控制点：

只有前 enterRerankCount 个候选会送入 rerank。
最终只保留 resultCount 个结果。

4.6 FinalizeHandler

作用：把召回结果变成可展示、可拼 Prompt 的最终结果。

处理：

按 chunkId 回查 snail_ai_rag_chunk
按 documentId 回查 snail_ai_rag_document
补齐 content、documentName、documentId
按 nearbySliceCount 合并相邻切片
重排结果，缓解 lost-in-the-middle

5. 问答上下游串联

入口：

POST /demo/rag/qa/stream

完整调用链：

RagForgeController.qaStream
-> RagQAService.qaStream
-> snail_ai_rag.config.modelParams
-> RagSearchService.search
-> buildDocumentsText
-> buildSystemPrompt
-> ModelFactory.getModel(modelParams.modelId)
-> ChatModel.chatStreamModel
-> ResponseBodyEmitter

Prompt 拼装规则：

modelParams.prompt 中必须保留 <Documents>
RagQAService 会把检索结果拼成 documentsText，然后替换 <Documents>

示例：

请只根据以下参考资料回答用户问题。资料不足时明确说明不足，不要编造。

<Documents>

如果没有配置 prompt，则默认使用：

请根据以下参考资料回答用户的问题：

{documentsText}

6. 最小落地表集

docs/sql/snail_ai_schema.sql 是从原项目带出的全量建表脚本，里面包含 agent、memory、skill、openapi 等外围表。

如果只落地 RAG，最小核心表是：

snail_ai_model_provider
snail_ai_model_config
snail_ai_store_instance
snail_ai_rag
snail_ai_resource
snail_ai_rag_document
snail_ai_rag_chunk

建议保留但不是 RAG 主链路强依赖：

snail_ai_user
snail_ai_model_usage_stat

可以裁剪的外围表：

snail_ai_agent*
snail_ai_mcp_server
snail_ai_skill*
snail_ai_app
snail_ai_client_node
snail_ai_openapi_user
memory 相关表

如果裁剪表，也要同步删除对应 mapper/PO 或限制 Spring 扫描范围，否则 MyBatis/Spring 仍可能加载不需要的组件。

7. 核心表关系

snail_ai_model_provider 1 ---- N snail_ai_model_config

snail_ai_store_instance 1 ---- N snail_ai_rag.vector_store_instance_id
snail_ai_store_instance 1 ---- N snail_ai_rag.search_engine_instance_id

snail_ai_model_config 1 ---- N snail_ai_rag.embedding_model_id
snail_ai_model_config 1 ---- N snail_ai_rag.rerank_model_id
snail_ai_model_config 1 ---- N snail_ai_rag.config.modelParams.modelId

snail_ai_rag 1 ---- N snail_ai_rag_document
snail_ai_rag_document 1 ---- N snail_ai_rag_chunk
snail_ai_resource 1 ---- 1 snail_ai_rag_document.resource_id

snail_ai_rag_chunk.vector_id ---- 外部向量库 rag_{ragId}
snail_ai_rag_chunk.id ---- 外部搜索引擎 rag_{ragId} 文档 ID 或 metadata.chunkId

当前 SQL 没有强制声明所有外键，主要靠代码维护关系。这样便于迁移和清理外部索引，但业务落地时要自己保证删除顺序。

8. 写入一致性和失败处理

文档状态：

0 PENDING     已创建文档行，等待处理
1 PARSING     预留状态
2 PROCESSING  解析/切片/写外部索引中
3 SUCCESS     入库完成
4 FAILED      入库失败，error_msg 保存原因

写入顺序：

1. 原始文件写 Resource
2. 文档行写 RagDocument，PENDING
3. 解析文件
4. 切片
5. 写 RagChunk
6. 写向量库，并回填 vector_id
7. 写搜索引擎
8. 更新 RagDocument 状态

注意：

向量库写入失败会导致文档处理失败。
搜索引擎写入当前是非致命失败，失败时向量检索仍可用，但 BM25 召回会缺数据。
重跑同一 documentId 前会清理旧 chunk 和不再被引用的向量。

业务落地建议：

上传接口只返回 documentId，不要立即假设可检索。
前端轮询 document.status，或后端加异步任务/消息通知。
失败时展示 error_msg，并提供重新处理入口。

9. 去重策略

文档级去重字段：

snail_ai_rag_document.rag_id
snail_ai_rag_document.name
snail_ai_rag_document.content_hash

策略：

0 NONE                不去重
1 BY_NAME             同库同名重复
2 BY_CONTENT          同库同内容重复
3 BY_NAME_OR_CONTENT  同名或同内容重复

冲突动作：

0 REJECT     拒收并报错
1 SKIP       跳过本次上传，返回旧文档
2 OVERWRITE  删除旧文档、chunk、向量和资源后重新入库

Chunk 级去重：

snail_ai_rag_chunk.content_hash

如果同一知识库里已有相同 chunk 且已有 vector_id，新 chunk 会复用旧 vector_id，避免重复 embedding。

10. 业务系统接入建议

10.1 上游业务对象和 ragId 的关系

推荐业务侧建自己的关联表，例如：

business_id
rag_id
document_id
owner_id
permission_scope
created_at

RAG 子系统只关心 ragId/documentId/chunkId，业务权限、租户、栏目、产品线建议放在业务侧或扩展 metadata。

10.2 权限过滤放哪里

可选位置：

上传前：限制谁能写某个 ragId
检索前：限制谁能查某个 ragId
FinalizeHandler：按 documentId/chunkId 做结果过滤
向量/搜索 metadata：写入 tenantId、deptId、bizId 后在检索时过滤

如果权限是强要求，建议不要只在前端控制，至少在 search/qa 入口和 FinalizeHandler 做后端校验。

10.3 同步和异步

当前 demo 的 upload-and-process 是同步处理，方便学习完整链路。

生产建议：

上传接口：只写资源和文档行，返回 documentId
后台任务：异步调用 DocumentPipeline.processDocument(documentId)
查询接口：根据 document.status 展示处理进度

这样可以避免大文件解析、embedding、外部索引写入导致 HTTP 超时。

10.4 业务可扩展点

新增文件解析器      实现 DocumentParser，并注册到 DocumentParserFactory
新增切片策略        实现 ChunkStrategy，并接入 DocumentChunkingService
新增向量库          实现 SnailAiVectorStore，并注册 VectorStoreFactory.REGISTER
新增搜索引擎        实现 SearchEngine，并注册 SearchEngineFactory.REGISTER
新增模型提供商      实现 Chat/Embedding/Rerank 对应构建逻辑
检索后权限过滤      扩展 FinalizeHandler
答案引用格式        扩展 RagQAService.buildDocumentsText 或 buildSystemPrompt

11. 落地检查清单

上线前逐项确认：

MySQL 已执行核心表 SQL
snail_ai_model_provider 已有提供商
snail_ai_model_config 已有 EMBEDDING/CHAT/RERANKER
snail_ai_store_instance 已有向量库实例
需要 BM25 时已有搜索引擎实例
snail_ai_rag 已绑定 embeddingModelId/vectorStoreInstanceId/searchEngineInstanceId
snail_ai_rag.config 已配置 searchParams/modelParams/chunkParams
原始文件存储 LOCAL/MINIO 可读写
向量库 rag_{ragId} 可写可查
搜索引擎 rag_{ragId} 可写可查
Prompt 模板保留 <Documents>
业务权限已在入口或 FinalizeHandler 处理

本项目完整源码已上传至 Gitee，需要的朋友可自行下载学习：
👉 源码地址：https://gitee.com/ww_qq_22/ragforge

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

鸿蒙 PC 构建体系详解：从 DevEco 到发布

AtomGit开源社区

从零构建嵌入式菜单库（一）：原型探索——从一段单函数代码开始

本文记录了从零构建嵌入式菜单库的初始探索过程。作者基于U8g2图形库，从一段简单的单函数菜单原型代码出发，逐步拆解设计思路。该原型实现了菜单内容回调、平滑滚动动画、垂直滑块等基础功能，采用回调函数机制实现框架与业务逻辑解耦。文章详细分析了代码中的关键设计决策，包括行模型抽象、追击算法实现平滑滚动、裁剪窗口控制显示范围等技术要点，并指出了当前实现的优缺点。这段仅300行的原型代码为后续开发完整的35

AtomGit开源社区

安全事件响应：构建企业级安全威胁应对体系

安全事件响应是企业安全防护的最后一道防线，通过系统化的流程和自动化工具，可以有效应对日益复杂的安全威胁。完善的准备：建立团队、流程和工具快速的检测：多层检测体系有效的响应：自动化编排和标准剧本彻底的恢复：备份验证和系统重建持续的改进：事后复盘和流程优化随着威胁形势的演变，安全事件响应将从被动响应向预测性响应演进，AI技术将在其中发挥核心作用。