大模型应用开发框架

Lyyaoo. · 2026-05-17 21:29:29 发布

前言

直接向 ChatGPT 提问就能得到不错的回答，但这远远不够。真实的应用场景往往要求模型能够：查询实时信息、访问企业私有文档、按照严格的格式输出，甚至与外部系统交互。于是，围绕大模型的应用开发框架逐渐演化出四种经典模式：

用户直接将问题（Prompt）发送给大模型，模型仅根据其内部参数中存储的知识生成回答。没有外部信息检索，没有工具调用，也没有任何后处理。

请添加图片描述

模型本身不执行函数，只输出调用指令。可以多轮调用。需要开发者自己实现函数的具体逻辑

请添加图片描述

离线阶段：

在线阶段：

请添加图片描述

使用特定领域的数据，对预训练大模型进行有监督的进一步训练，更新模型的部分或全部参数，使模型更适合特定任务或风格。

数据准备：收集成对的（输入，期望输出）数据，例如：
- 客服对话（用户问题 → 标准回答）
- 特定格式的文本（产品描述 → 营销文案）
- 结构化输出（自然语言 → JSON）
训练：在预训练模型基础上，用较小的学习率继续训练若干轮
部署：将微调后的模型替代基础模型，用于推理

从开发成本由低到高来看，四种方案排序如下：
Prompt < Function Calling < RAG < Fine-tuning

维度	纯Prompt	Function Calling	RAG	Fine-tuning
模型参数是否改变	❌ 否	❌ 否	❌ 否	✅ 是
能否获取实时信息	❌ 否	✅ 是（通过函数）	✅ 是（检索最新知识库）	❌ 否（知识截止于训练数据）
能否调用外部系统	❌ 否	✅ 是	❌ 否（除非结合FC）	❌ 否
能否访问私有知识	❌ 否	✅ 是（需自建检索函数）	✅ 是 ✅ 是（训练进参数）
推理延迟	低	中（多轮调用）	中（检索+生成）	低
开发/维护成本	极低	中	高（检索系统）	高（数据+训练）
可解释性	低	中	（函数调用可见）	高（可显示检索片段）
典型应用	通用问答、翻译	智能助理、自动化	企业知识库、法律顾问	特定格式、风格迁移