RAG 智能问答系统开发周记(第二周):从搭建到迭代优化


一、上周回顾:基础架构已就位

在正式进入本周工作之前,先简要回顾上周的成果——这也是本周迭代的起点。

上周完成了完整 RAG(Retrieval-Augmented Generation)架构的从零搭建,整个流程覆盖:

  • 数据加载与切块:支持按固定大小进行文本分块,设置 overlap 保留上下文衔接
  • 向量化与检索:对文档 chunk 进行 embedding,基于相似度完成语义检索
  • LLM 召回生成:将检索结果注入 prompt,由大模型生成最终回答
  • 个性化问答支持:通过构建初级、中级、高级三档提示词模板,实现基于用户水平的个性化知识问答
  • 知识库管理脚本:支持 PDF、Markdown、Word 三种主流格式的自动导入
  • 学习规划模块:完成了初步前端界面原型

基础架构跑通之后,迭代优化便提上了日程。


二、借助 AI 工具规划优化路径

面对"怎么优化"这个问题,本周尝试借助 AI 编码工具 Trae 对项目进行"蓝图描绘"。向 Trae 输入的提示词如下:

在我现有 RAG 的基础上,应该怎么去优化,从数据库扩充、技术细节优化、对比 RAG 前后问答质量方面入手。另外关注一下学习路线生成模块,可以用推荐算法做因人而异的个性化推荐吗?项目截止时间是 6 月 20 日。
在这里插入图片描述

Trae 给出的优化方向与时间分配建议如下:

在这里插入图片描述

另外有高风险提示:
在这里插入图片描述

关于推荐算法的取舍思考

Trae 将推荐算法列为高风险、低优先级任务,这一结论值得深入思考。

从用户需求角度看,"因人而异的视频或推文知识推荐"确实能显著提升用户体验,满足多样化学习需求。但经过进一步调研发现,传统推荐系统(协同过滤、内容过滤等)依赖大量用户行为数据进行训练,而当前项目:

  • 用户基数有限,冷启动问题突出
  • 训练成本高,短期内难以收集足量反馈数据
  • 与项目核心目标(RAG 问答质量提升)关联度较低

结论:学习路线规划模块维持原有设计,暂不引入推荐算法,将精力聚焦于 RAG 核心链路的质量提升。

💡 这次借助 AI 工具辅助决策的体验值得记录:Trae 的建议并不是直接执行的"命令",而是需要结合项目实际情况进行评估和取舍的参考输入。AI 工具的价值在于拓宽思路、提供结构化视角,最终的判断仍需人工介入。


三、本周核心工作

参照 Trae 的优化方向,本周工作主要围绕两条主线展开:知识库扩充RAG 技术调优

3.1 知识库扩充

知识库是 RAG 系统的"粮仓",其数量和质量直接决定了检索上限,因此知识库扩充是一项贯穿项目全周期的持续性工作,而非一次性任务。

本周在知识库建设上的工作重点:

  • 补充多领域学习资料,覆盖更广泛的问答场景
  • 对已有文档进行质量筛查,清理低质量、重复性内容
  • 完善导入流程,确保不同格式文档解析的稳定性

知识库的厚度决定了 RAG 的天花板,技术优化再好,检索不到也是枉然。

3.2 构建评估测试集

没有评估的优化就是盲优化。 在开始调整任何技术参数之前,首先建立了一套可量化的评估体系,用于观察和对比实验效果。

测试集构建
  • 构建包含 30~50 个标准问题的测试集,覆盖不同难度、不同领域
  • 问题来源结合:真实用户可能提问的场景 + 知识库中有明确答案的内容
评估指标定义
指标 含义
关键词召回率 回答中包含参考答案关键词的比例,衡量信息覆盖完整度
引用准确率 检索到的文档片段与问题的相关性,衡量检索质量
回答完整度 回答是否完整覆盖问题的各个方面,避免答非所问
评估流程

建立定期回归测试机制:每次调整参数后,在同一测试集上跑一遍评估,横向对比不同配置下的效果差异,确保优化是正向的,而非"负优化"。

可行性评估:技术难度中等,但长期价值高——这是避免"感觉变好了"式优化的关键基础设施。

3.3 技术参数调优实验

在评估体系就位之后,开始对 RAG 检索链路的关键参数进行系统性调优。

调优对象

文本分块策略是本轮调优的核心,主要涉及两个参数:

  • chunk_size(切块大小):每个文本块的 token 数量
  • chunk_overlap(重叠区域):相邻块之间共享的 token 数量
实验结果(初步)

通过在标准测试集上跑不同参数组合的对比实验,观察各配置下的召回率与引用准确率变化,逐步收敛至当前阶段的最优参数区间。具体数据将在下周汇总后附上对比图表。


四、阶段性思考

本周工作带来了几点值得沉淀的思考:

1. "先评估,再优化"是正确的工程姿势

在没有评估体系之前直接调参,无法判断改动是否有效。建立测试集和评估指标,是让优化工作可观测、可复现、可比较的前提条件。

2. 工具辅助决策,但不替代判断

Trae 提供的优化建议结构清晰、思路完整,节省了大量调研时间。但"推荐算法"一项的取舍说明:AI 工具的输出需要结合项目约束(时间、数据量、核心目标)进行人工评估,不能直接照单全收。

3. 知识库质量是 RAG 的地基

技术调优是在现有知识库的基础上做乘法,但如果知识库本身质量不高,再好的检索策略也难以弥补。知识库建设的持续投入是必要的。


五、下周计划

  • 完成参数调优实验,输出对比报告(含图表)
  • 继续扩充知识库,目标新增文档 XX 篇
  • 探索混合检索策略(关键词检索 + 向量检索结合)
  • 知识图谱 / 用户画像模块:完成技术选型调研
  • 学习规划模块:推进后端接口对接

本文为项目开发周记,记录真实开发过程中的决策思路与技术探索,供后续复盘参考。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐