sdu软件学院创新实训（二）

Josephqwe

379人浏览 · 2026-04-06 23:26:56

Josephqwe · 2026-04-06 23:26:56 发布

RAG测试

在上一周学习rag的过程中，我使用python开发了一个针对“老年便秘知识”的智能ai助手的一个小型原型。
在这里测试的时候使用的是text-embedding-v4作为embedding模型以及qwen3.5-falsh
该原型系统使用的其他组件如下

文档解析 (PDF Loader)：使用 PyMuPDF 解析医学 PDF 文档。
向量数据库 (Vector Store)：利用 ChromaDB进行持久化存储。

Prompt 注入

现在构建了如下提示词，将检索到的文本块和用户问题动态注入

user_prompt = f"""请基于以下参考资料回答用户问题。
【用户问题】: {question}
【参考资料】: {context}
要求：
- 优先依据参考资料回答
- 不要编造资料中没有的信息
- 尽量使用用户容易理解的语言
- 最后列出参考来源（文件名+页码）
"""

测试结果

目前系统测试结果如下图所示，可以实现基本的文件解析向量化存储、检索、以及根据其进行回答并给出了回答的来源确保其准确性。

目前的问题在于，即使有流式输出，但从提问到结果开始输出的时间还是太长，在10秒左右，需要想办法进行优化以适应后续的语音交互。

下一步工作方向：

添加更多的知识库文件包括对原始的文件进行更加细致高效的分块处理以便于增强检索的准确性。
意图识别目前的系统会在每次回答的时候都进行rag检索，需要判断问题否需要进行检索，同时为后面的工具调用做准备。
语音交互在解决以上问题后开始集成 ASR和 TTS。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

【EI复现】基于元模型优化算法的主从博弈多虚拟电厂动态定价和能量管理(Matlab代码实现）

基于元模型的优化算法是一种基于历史数据来驱动样本点的加入从而逼近局部或全局最优解的优化机制，能够改善传统启发式智能算法需要繁复数值模拟的缺陷，目前在飞行器设计等航空航天领域的应用[20]最为广泛，在电力系统方面也有初步的应用。提出基于 Kriging 元模型的博弈均衡算法，在求解过程中建立 Kriging 元模型替代 VPP 内部的能量管理模型，利用粒子群优化算法搜索优异采样点，更新修正 Krig

AtomGit开源社区

蒙特卡洛风光场景并通过削减法聚类法得到几个典型场景（包含Matlab代码和Python代码实现）

蒙特卡洛方法是一种基于随机抽样的数值计算方法，通过多次随机抽样来估计系统的行为，从而得到系统的统计性质。在风光模型中，蒙特卡洛方法可以用来模拟风速、风向和太阳光照的变化，进而评估风力和太阳能系统在不同条件下的性能。

AtomGit开源社区

完全免费、绿色免安装的Windows轻量级硬件检测工具，零依赖查看电脑配置

📌 摘要：推荐一款免费免安装的Windows硬件检测工具SysView，单文件便携、零依赖，兼容Win7/10/11系统。支持一键读取CPU、内存、显卡等硬件参数，无广告、不上传隐私。特点包括毫秒级启动、纯本地运行、无需管理员权限，适合普通用户、DIY玩家及运维人员。开源项目，提供32/64位版本下载，点击即用，彻底关闭无残留。 🔗 核心优势： ✅ 永久免费无阉割 ✅ 绿色免安装，U盘随身带