超简RAG：像用数据库一样用大模型

是一个Bug

370人浏览 · 2026-03-25 15:26:27

是一个Bug · 2026-03-25 15:26:27 发布

超简RAG：像用数据库一样用大模型

不搞复杂向量库，不折腾深度学习框架，50行代码跑通第一个AI应用

引言

在AI应用开发的浪潮中，很多人被Transformer、Attention、向量数据库等技术名词吓退，迟迟不敢动手。其实对于应用层开发者来说，完全可以把大模型当作一种新型“数据库”来用——你不需要理解B+树索引怎么实现，也能写出高效的SQL查询。

今天，我们就用不到50行Python代码，搭建一个完整的RAG（检索增强生成）系统。整个实现只依赖openai库，核心逻辑清晰到你可以用“查表+填空”来理解。

一、整体设计：RAG就是“查表+填空”

我们先把整个代码跑起来，再拆解每个部分。最终效果如下：

# 完整代码见文末
questions = [
    "我想退货，运费谁出？",
    "白银会员需要消费多少？",
    "你们什么时候发货？"
]
for q in questions:
    print(ask_ai(q))

输出示例：

问题: 我想退货，运费谁出？
回答: 我们支持7天无理由退货，运费由买家承担。如果商品质量问题，运费由我们承担。

问题: 白银会员需要消费多少？
回答: 普通会员消费满1000元升级为白银会员。

问题: 你们什么时候发货？
回答: 现货商品24小时内发货，预售商品以页面标注时间为准。

二、代码拆解：四个步骤构建RAG

1. 知识库 —— 你的“数据表”

knowledge_base = {
    "退货政策": "我们支持7天无理由退货，运费由买家承担。如果商品质量问题，运费由我们承担。",
    "发货时间": "现货商品24小时内发货，预售商品以页面标注时间为准。",
    "会员等级": "普通会员消费满1000元升级为白银会员，满5000元升级为黄金会员。"
}

这里我们把领域知识直接写成字典，相当于一个只有三行记录的“表”。在实际项目中，这些数据可能来自文档、数据库或爬虫。

2. 检索函数 —— 你的“SQL查询”

def retrieve(query):
    keywords = {
        "退货": "退货政策",
        "发货": "发货时间",
        "会员": "会员等级"
    }
    for key, topic in keywords.items():
        if key in query:
            return knowledge_base[topic]
    return knowledge_base["退货政策"]   # 默认返回

这是超简化版的检索逻辑：根据用户问题中的关键词，直接命中对应的知识条目。真实场景中，这里会换成向量检索（如FAISS、ChromaDB），但核心思想完全一样：从知识库中找到最相关的片段。

你可以把这一步想象成 SELECT * FROM knowledge_base WHERE content LIKE '%关键词%'。

3. 提示构建 —— 你的“SQL查询优化”

def build_prompt(query, context):
    return f"""基于以下已知信息回答问题。如果无法从信息中找到答案，就说不知道。

已知信息：
{context}

问题：{query}
回答："""

这里我们把检索到的知识和用户问题“拼”成一个自然语言指令，告诉模型如何使用这些信息。这就是Prompt Engineering的本质——就像给SQL加索引提示一样，让执行引擎更高效。

4. 模型调用 —— 你的“数据库执行引擎”

from openai import OpenAI

client = OpenAI(
    api_key="your-api-key",   # 请替换为你自己的密钥
    base_url="https://api.deepseek.com"
)

def ask_ai(query):
    context = retrieve(query)
    prompt = build_prompt(query, context)
    response = client.chat.completions.create(
        model="deepseek-chat",
        messages=[
            {"role": "system", "content": "You are a helpful assistant"},
            {"role": "user", "content": prompt}
        ],
        stream=False
    )
    return response.choices[0].message.content

调用大模型API就像执行一条SQL语句：发送输入，等待返回结果。这里的 temperature 参数可以调整回答的创造性，类似SQL中的 OPTIMIZE 提示。

三、运行你的第一个RAG

环境准备

pip install openai

获取API密钥

访问 DeepSeek平台注册并获取API Key
将代码中的 "your-api-key" 替换为真实密钥（或使用环境变量）

运行脚本

保存代码为 rag_demo.py，执行：

python rag_demo.py

你会看到三条问题的自动回答。恭喜，你已经跑通了一个完整的RAG系统！

四、从玩具到工具：改进方向

这个超简版本虽然能工作，但离生产环境还有距离。你可以沿着以下路径逐步升级：

1. 向量检索替代关键词匹配

# 使用 chromadb 做真实检索
import chromadb
client = chromadb.Client()
collection = client.create_collection("my_kb")
collection.add(documents=[...], embeddings=[...])
results = collection.query(query_texts=[query], n_results=1)

2. 增加流式输出

response = client.chat.completions.create(
    stream=True,
    ...
)
for chunk in response:
    print(chunk.choices[0].delta.content, end="")

3. 添加成本监控与异常重试

def ask_ai_with_retry(query, retries=3):
    for i in range(retries):
        try:
            # 调用逻辑
            print(f"本次消耗 tokens: {response.usage}")
            return answer
        except Exception as e:
            print(f"重试 {i+1}/{retries}: {e}")
            time.sleep(2)
    return "服务暂时不可用"

4. 生产化封装

用FastAPI包装成HTTP服务
用Java/Go重写高并发路径（可选）
引入环境变量管理密钥，避免硬编码

五、总结

我们把AI应用开发比作数据库开发：

知识库 = 数据表
检索 = SQL查询
提示构建 = 查询优化
模型调用 = 执行引擎

这种类比能帮助应用开发者快速建立心智模型，避开底层的Transformer原理，专注于数据与业务逻辑。

记住：动手比看课重要100倍。花3小时跑通一个RAG，胜过花3天看理论。 现在，拿起代码，去构建你的第一个AI应用吧！

附：完整代码

import os
from openai import OpenAI

knowledge_base = {
    "退货政策": "我们支持7天无理由退货，运费由买家承担。如果商品质量问题，运费由我们承担。",
    "发货时间": "现货商品24小时内发货，预售商品以页面标注时间为准。",
    "会员等级": "普通会员消费满1000元升级为白银会员，满5000元升级为黄金会员。"
}

def retrieve(query):
    keywords = {"退货": "退货政策", "发货": "发货时间", "会员": "会员等级"}
    for key, topic in keywords.items():
        if key in query:
            return knowledge_base[topic]
    return knowledge_base["退货政策"]

def build_prompt(query, context):
    return f"""基于以下已知信息回答问题。如果无法从信息中找到答案，就说不知道。

已知信息：
{context}

问题：{query}
回答："""

client = OpenAI(
    api_key=os.environ.get("DEEPSEEK_API_KEY"),  # 建议使用环境变量
    base_url="https://api.deepseek.com"
)

def ask_ai(query):
    context = retrieve(query)
    prompt = build_prompt(query, context)
    response = client.chat.completions.create(
        model="deepseek-chat",
        messages=[
            {"role": "system", "content": "You are a helpful assistant"},
            {"role": "user", "content": prompt}
        ],
        stream=False
    )
    return response.choices[0].message.content

if __name__ == "__main__":
    questions = [
        "我想退货，运费谁出？",
        "白银会员需要消费多少？",
        "你们什么时候发货？"
    ]
    for q in questions:
        print(f"\n问题: {q}")
        print(f"回答: {ask_ai(q)}")

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

【Linux】进程控制（3）进程程序替换

代码语言：javascriptAI代码解释这是一系列/一套函数，这些函数的作用都是进行程序替换的，它们的前缀都是exec。如果程序替换成功，那么会直接执行替换后的程序的代码，不会有返回值，如果执行失败了会返回-1。所以exec系列函数只有出错的返回值，没有成功的返回值。它们的命名都很有特点，接下来会分别介绍这些exec系列函数，然后进行总结。v和l只能有一个（彼此互斥），它们代表了参数的传入方式。

AtomGit开源社区

双连杆机械臂 RBFNN+NTSM + 自适应强化学习控制（带饱和补偿）（Matlab代码实现）

针对双连杆机械臂在模型不确定性、外部扰动以及执行器饱和约束下的高精度轨迹跟踪控制难题，本文提出一种融合径向基函数神经网络、非奇异终端滑模控制与强化学习的自适应鲁棒控制方案。该方法以非奇异终端滑模为核心控制框架，保证系统状态在有限时间内收敛并避免传统滑模的奇异性问题；采用评价 - 动作双网络强化学习结构，利用径向基函数神经网络实现对系统未知动态与不确定项的在线逼近，同时完成控制策略的自适应优化；设计

AtomGit开源社区

不平衡学习的自适应合成采样方法ADASYN（Matlab代码实现）

在机器学习实际应用中，类别不平衡问题广泛存在，即数据集中某一类别的样本数量远多于另一类别（多数类与少数类），这种不平衡分布会导致模型训练偏向多数类，大幅降低少数类样本的识别精度，而少数类样本往往承载着关键信息（如欺诈检测中的欺诈样本、医疗诊断中的患病样本）。自适应合成采样方法（ADASYN）作为解决类别不平衡问题的经典过采样技术，通过自适应调整少数类样本的合成策略，重点关注难以学习的少数类样本，有