本文深入解析了RAG(检索增强生成)技术如何帮助企业低成本、高效率地构建内部知识库问答智能体。文章以产品经理视角,详细阐述了RAG+Agent的架构设计、五层设计要点、检索策略优化及常见问题排查方法,并结合实际案例展示了从0到1搭建企业内部报销问答智能体的完整流程。强调RAG是中小企业的AI落地首选方案,因其成本最低、见效最快、风险最小,且无需大量标注数据。


上周,我那个转型AI产品经理的朋友又来找我了。

他一脸兴奋:“第五篇和第六篇我看了,智能体我懂了,思维转变我也明白了。但我现在遇到一个实际问题——公司想做一个内部知识库问答智能体,让员工问‘报销流程是什么’、‘客户投诉怎么处理’、‘某个项目的技术方案’这类问题。我用大模型直接答,它有时候瞎编;用Prompt写规则,又写不全;用微调,又没那么多标注数据。怎么办?”

我说:“你这个问题,正是RAG要解决的。而且我告诉你一个秘密——大部分公司做AI落地,第一步都是RAG。不是因为其他技术不行,而是因为RAG是成本最低、见效最快、风险最小的方案。今天这篇,我就把RAG+Agent怎么搭、怎么用、怎么优化,从产品经理的角度彻底讲透。”

一、先讲个故事:为什么把文档塞给大模型也不行?

小张是一家中型公司的产品经理。公司有5000份内部文档:员工手册、产品说明、流程规范、历史项目总结、客户案例库。老板说:“我们要用AI,让员工能快速查到这些信息。”

小张一开始的做法很简单:把所有文档内容直接塞进Prompt,然后问大模型

结果他发现几个问题:

问题1:Prompt装不下
一份员工手册就200页,全部塞进去Prompt就爆了。大模型的上下文长度有限(即使是长上下文模型,塞太多内容成本也极高)。他只能选几份关键文档塞进去,但员工问的问题五花八门,覆盖不全。

问题2:塞进去也找不到
即使他把相关文档塞进去了,大模型也不一定答对。因为大模型是“猜词”机制,不是“检索”机制。当Prompt里有5000字的内容时,大模型可能“注意”不到藏在中间的那句话。就像你给一个人一本书让他找答案,他可能翻半天找不到,或者看错行。

问题3:文档一更新就废了
公司文档经常更新。每次更新,小张都要重新整理Prompt,重新测试。改一个文档,可能要改几十个Prompt。

结果

  • 员工问“差旅报销标准”,大模型答“根据公司规定,差旅住宿标准为一线城市500元/天”——这个信息是旧版的,因为小张用的是旧文档。
  • 员工问“客户投诉处理流程”,大模型答得头头是道,但其中一步“填写投诉工单”的链接是错的——因为文档里的链接过期了,大模型照搬了错误信息。
  • 员工问“某某项目的技术方案”,大模型说“我查不到这个信息”——因为小张没把那份文档塞进去。

小张崩溃了:“我明明把文档塞给大模型了,为什么还是不行?”

老李走过来,说:“你犯了一个常见错误。你让大模型‘背’文档,但它不是人,它不会‘背’。它是猜词机器,不是检索系统。你需要的是:先让系统检索到正确的文档片段,再把片段给大模型,让它基于片段回答。这就是RAG。”

这样逻辑就通顺了:大模型不是“没读过”文档,而是“读了但读不准”。RAG解决的不是“有没有读”的问题,而是“怎么精准读、怎么低成本读、怎么实时读”的问题。

二、RAG是什么?——让AI从“闭卷考试”变成“开卷考试”

RAG(Retrieval-Augmented Generation,检索增强生成)的核心思想,用一个比喻就能讲明白:

纯大模型:闭卷考试。你问它问题,它凭“记忆”答。记忆可能过时、可能不完整、可能张冠李戴。就像你参加历史考试,但不能翻书,全靠脑子记。万一记错了,就答错了。

RAG:开卷考试。你问问题,它先翻书(检索知识库),找到相关章节,再根据这些内容回答。就像你参加历史考试,可以翻课本、翻笔记,答案有据可查,不会瞎编。

RAG+Agent:不仅开卷,还能自己决定翻哪些书、怎么翻、翻完怎么整理。而且可以持续更新知识库,越用越准。就像你不仅开卷,还配了一个图书管理员帮你找资料,一个学霸帮你总结答案,一个助教帮你检查对错。

为什么RAG是中小企业的首选?

  • 成本低:不需要标注数据,不需要训练模型
  • 见效快:一周搭好原型,两周上线
  • 可解释:答案可以溯源,用户知道“为什么是这个答案”
  • 易更新:文档改了,知识库同步改,不需要重新训练模型

三、RAG+Agent架构:五层设计(产品经理必须懂)

一个完整的企业级RAG+Agent智能体,需要设计五层。每一层我都用报销问答的例子说明:

┌─────────────────────────────────────────────────────────────────┐
│                企业知识库问答智能体(RAG+Agent)                 │
├─────────────────────────────────────────────────────────────────┤
│                                                                 │
│  ┌─────────────────────────────────────────────────────────┐   │
│  │                 第一层:感知层(硬)                      │   │
│  │  产品经理要设计:                                        │   │
│  │  • 用户怎么问?是打字?语音?选择菜单?                  │   │
│  │  • 问题怎么分类?是报销类、流程类、产品类?              │   │
│  │  • 什么时候触发检索?每个问题都查?还是先判断一下?      │   │
│  │                                                         │   │
│  │  案例:用户问“差旅住宿标准是多少?”                      │   │
│  │  智能体识别这是“报销类”问题,触发检索动作                │   │
│  └─────────────────────────────────────────────────────────┘   │
│                              ↓                                  │
│  ┌─────────────────────────────────────────────────────────┐   │
│  │                 第二层:检索层(硬)                      │   │
│  │  产品经理要设计:                                        │   │
│  │  • 知识库从哪来?哪些文档要加?哪些不要?                │   │
│  │  • 文档怎么切?多长一段合适?(太短信息不全,太长不准)  │   │
│  │  • 用什么模型转向量?(开源免费还是付费API?)           │   │
│  │  • 检索策略:相似度阈值设多少?返回几条?要不要重排序?  │   │
│  │                                                         │   │
│  │  案例:智能体在知识库中检索,找到3段相关内容:            │   │
│  │  • 《员工报销手册》第3章:“住宿标准:一线城市500元/天” │   │
│  │  • 《差旅管理规定》第2条:“住宿费需凭发票报销”          │   │
│  │  • 《常见问题FAQ》第8条:“超标住宿需提前申请”            │   │
│  └─────────────────────────────────────────────────────────┘   │
│                              ↓                                  │
│  ┌─────────────────────────────────────────────────────────┐   │
│  │                 第三层:决策层(软)                      │   │
│  │  产品经理要设计(这里是Prompt技巧的主场):              │   │
│  │  • 角色设定:“你是公司报销助手,回答要简洁、准确”       │   │
│  │  • 规则设置:“如果资料中有答案,总结后标注来源”         │   │
│  │  • 规则设置:“如果资料中没有,说‘我查不到,联系HR’”   │   │
│  │  • 思维链:“一步步分析:问题是什么→检索了什么→怎么回答”│   │
│  │  • Few-shot:给1-2个示例,教模型怎么总结、怎么标注      │   │
│  │                                                         │   │
│  │  案例:智能体用Prompt组织回答:                          │   │
│  │  “根据《员工报销手册》,一线城市住宿标准为500元/天。   │   │
│  │   请注意:需凭发票报销,超标需提前申请。”               │   │
│  │   底部标注:“来源:《员工报销手册》第3章”               │   │
│  └─────────────────────────────────────────────────────────┘   │
│                              ↓                                  │
│  ┌─────────────────────────────────────────────────────────┐   │
│  │                 第四层:执行层(硬)                      │   │
│  │  产品经理要设计:                                        │   │
│  │  • 答案怎么展示?纯文字?带链接?带图片?                │   │
│  │  • 用户不满意怎么办?加“有用/无用”按钮?                │   │
│  │  • 需要转人工怎么办?加“联系HR”按钮?                   │   │
│  │                                                         │   │
│  │  案例:用户看到答案,如果觉得有用点“有用”,觉得没用     │   │
│  │  点“无用”,还可以直接点击“联系HR”发起人工咨询          │   │
│  └─────────────────────────────────────────────────────────┘   │
│                              ↓                                  │
│  ┌─────────────────────────────────────────────────────────┐   │
│  │                 第五层:反馈层(硬)                      │   │
│  │  产品经理要设计:                                        │   │
│  │  • 怎么收集反馈?点赞点踩?满意度评分?                  │   │
│  │  • 怎么分析日志?哪些问题检索不到?哪些答案不满意?      │   │
│  │  • 怎么优化知识库?自动提示“这个文档该更新了”?         │   │
│  │                                                         │   │
│  │  案例:一周后,发现“市内交通费”相关问题的满意度很低,  │   │
│  │  管理员查看日志,发现知识库里没有相关内容,于是补充     │   │
│  │  《市内交通报销规定》到知识库,问题解决。                │   │
│  └─────────────────────────────────────────────────────────┘   │
│                                                                 │
└─────────────────────────────────────────────────────────────────┘

产品经理的核心工作

  • 第一层:定义用户怎么问、问题怎么分类
  • 第二层:决定哪些文档进知识库、怎么切、怎么检索
  • 第三层:写Prompt,让大模型把检索到的内容变成好答案
  • 第四层:设计交互界面和转人工流程
  • 第五层:设计反馈机制,让智能体越用越好

四、检索策略的5个核心要点

检索是RAG的命门。检索不准,后面大模型再聪明也没用。下面这5个要点,是你在设计RAG时必须拍板的决策点:

要点1:切片大小(Chunk Size)——文档切多长?

产品经理怎么决策

  • 先问:用户问的是“点状信息”(一个数字、一个日期)还是“面状信息”(一个流程、一个概念)?
  • 点状信息用小切片,面状信息用大切片。
  • 上线后看效果:如果答案信息不全,调大切片;如果答案太啰嗦、包含无关信息,调小切片。

要点2:Embedding模型选择——用什么模型转向量?

产品经理怎么决策

  • 有技术团队、数据敏感 → 开源免费(BGE)
  • 没技术团队、想快速验证 → 商业API
  • 追求极致效果、预算充足 → 商业高精度

要点3:相似度阈值(Similarity Threshold)——多像才算相关?

相似度分数通常在0-1之间。阈值决定了“多像的才返回”。

产品经理怎么决策

  • 场景对准确率要求高(如医疗、法律)→ 用高阈值,宁缺毋滥
  • 场景对覆盖率要求高(如知识探索)→ 用低阈值,宁可多不可漏
  • 不确定 → 先用0.7,上线后看Badcase调

要点4:Top-K——返回几条?

Top-K决定了每次检索返回多少条给大模型。

产品经理怎么决策

  • 简单问答(“标准是多少”)→ K=3
  • 复杂问题(“整个流程是什么”)→ K=5-7
  • 不确定 → 先设5,上线后看效果调

要点5:重排序(Rerank)——让最相关的排前面

第一次检索(向量相似度)可能不够准。重排序是用一个更精细的模型,对检索结果重新打分排序。

产品经理怎么决策

  • 先用向量检索跑通,如果效果不够,再加重排序
  • 重排序会显著增加延迟(从几百毫秒到1-2秒),需要权衡用户体验

五、RAG常见问题排查手册

RAG上线后,一定会遇到各种问题。下面是最常见的几类问题,以及产品经理怎么排查、怎么优化:

问题类型1:检索不到相关内容

现象:用户问的问题,知识库里明明有,但智能体说“找不到”。

排查步骤

  1. 检查问题是否被正确向量化

    :用同样的问题在知识库里手动检索,看能不能找到。如果手动能找到,说明向量化没问题;如果手动也找不到,说明问题本身和文档的表述差异太大。

  2. 检查相似度阈值是否太高

    :把阈值调低0.1,看能不能检索到。如果能,说明阈值设置过高,放低即可。

  3. 检查Top-K是否太小

    :把K调大,看能不能检索到。如果能,说明K太小,调大即可。

  4. 检查文档切片是否合理

    :如果文档切得太小,关键信息可能被切散;如果切得太大,检索可能不准。调整切片大小重新试。

产品经理解决方案

  • 调低阈值
  • 调大Top-K
  • 优化文档切片
  • 如果是表述差异问题,考虑加“同义词”或“查询改写”

问题类型2:检索到了,但内容不相关

现象:检索返回了内容,但这些内容和问题没什么关系。

排查步骤

  1. 检查相似度阈值是否太低

    :把阈值调高0.1,看结果是否更相关。如果是,说明阈值太低,混入了太多噪声。

  2. 检查Top-K是否太大

    :K太大可能把不相关的内容也捞进来。调小K,看结果是否更精准。

  3. 检查文档切片是否合理

    :如果文档切得太大,一段里包含多个主题,检索时会混入不相关内容。调小切片重试。

  4. 考虑加重排序

    :如果以上都不行,尝试加重排序模型,重新打分。

产品经理解决方案

  • 调高阈值
  • 调小Top-K
  • 优化文档切片
  • 加重排序

问题类型3:检索到了,但大模型答错了

现象:检索到了正确的内容,但大模型生成的答案不对。

排查步骤

  1. 检查检索内容是否完整

    :把检索到的内容单独拿出来,自己看能不能回答。如果自己都不能,说明检索不完整,需要优化检索。

  2. 检查Prompt是否写清楚

    :大模型可能误解了你的要求。检查Prompt有没有明确说“只基于以下内容回答”“如果不确定就说不知道”。

  3. 检查思维链是否有效

    :大模型可能跳过了推理步骤。用“请一步步分析”强制它推理。

  4. 检查Few-shot示例是否相关

    :示例和当前问题差异太大,模型可能学偏。

产品经理解决方案

  • 优化Prompt(加“只基于以下内容”)
  • 加强思维链(“一步步分析”)
  • 补充Few-shot示例
  • 如果以上都不行,考虑换更大的模型

问题类型4:答案有,但用户不满意

现象:答案技术上正确,但用户觉得“不是我要的”。

排查步骤

  1. 检查用户反馈

    :用户具体说了什么?是答案太啰嗦?还是没回答到点子上?

  2. 检查答案格式

    :是不是没有标注来源?用户需要溯源。

  3. 检查答案长度

    :是不是太长了?用户想要简洁版;是不是太短了?用户想要详细版。

产品经理解决方案

  • 调整Prompt:让答案更简洁/更详细
  • 加“来源标注”,让用户知道信息从哪来
  • 加“追问”功能,让用户可以继续问

六、RAG优化实战:一个完整案例

假设我们做了一个报销问答智能体,上线后发现三个问题:

问题1:用户问“打车能报销吗?”,智能体说“找不到”。

排查:手动检索知识库,发现《市内交通报销规定》里有答案,但文件名是“交通费管理规范”,和“打车”不匹配。

优化:加同义词映射,把“打车”“出租车”“网约车”映射到“交通费”。

问题2:用户问“住宿标准”,智能体返回了一堆内容,包括“超标需申请”“发票要求”“住宿标准500元”等,太啰嗦。

排查:Top-K=5,返回了5段内容,有些是相关的,有些是周边的。

优化:Top-K从5降到3,同时加重排序,让“住宿标准”本身排第一。

问题3:用户问“老板出差标准”,智能体说“500元/天”,但实际老板标准更高。

排查:知识库里只有普通员工标准,没有高管标准。

优化:补充高管标准到知识库,加护栏:高管问题转人工。

七、产品经理的RAG设计清单(每一步都有落地建议)

如果你要设计一个企业知识库问答智能体,下面这个清单每一步都要过:

第一步:知识库构建(决定智能体能回答什么)

第二步:检索策略(决定智能体找得准不准)

注:这里讲的是RAG的基础检索策略。如果你想进一步优化效果,还有两个进阶技巧:混合检索(向量+关键词+知识图谱)、查询改写(Query Rewriting)。我们会在后续的8.10篇《RAG检索优化实战》中详细拆解

第三步:决策层设计(决定智能体答得好不好)

这是Prompt技巧的主场,你把之前学的都用上:

角色设定

“你是公司报销助手。你的职责是帮助员工快速找到报销相关的信息。”

规则设置

  • “如果检索到的资料中有明确答案,请用简洁的语言总结,并标注来源。”
  • “如果检索到的资料中没有答案,请回答:‘我查不到相关信息,请联系HR或财务部。’”
  • “如果用户问的是敏感信息(如具体人员薪资),请回答:‘这个问题涉及隐私,请联系HR。’”

思维链

“请一步步思考:

  1. 用户问的是什么问题?
  2. 检索到的资料中,哪些是相关的?
  3. 这些资料是怎么说的?
  4. 我怎么用简洁的语言总结?”

Few-shot示例

用户问:“住宿标准是多少?”
资料:《员工报销手册》第3章:“住宿标准:一线城市500元/天,二线城市400元/天。”
回答:“根据《员工报销手册》,一线城市住宿标准为500元/天,二线城市为400元/天。需凭发票报销。”

第四步:护栏设计(防止智能体闯祸)

第五步:反馈与优化(让智能体越用越好)

八、实战案例:从0到1搭一个企业内部报销问答智能体

我用一个完整的案例,把上面所有内容串起来。

背景

某公司有2000名员工,每月有大量报销咨询。HR和财务每天被问“住宿标准是多少?”“打车能不能报销?”“发票丢了怎么办?”等问题。

第1周:准备知识库

  • 收集文档:《员工报销手册》《差旅标准》《发票规范》《报销常见问题》,共4份PDF,约200页
  • 清洗:去掉旧版内容(比如2019年的标准),统一格式
  • 切片:每份PDF切成若干段,每段约800字,共400个片段
  • 向量化:用开源的BAAI/bge-large-zh模型,将每个片段转成向量,存入Chroma向量数据库

第2周:搭建检索系统

  • 设置相似度阈值0.7,Top-K=5
  • 测试:问“住宿标准”,返回5段相关内容,包括住宿标准、差旅规定、超标申请等

第3周:设计Agent工作流

  • 用户问:“一线城市住宿标准是多少?”
  • 感知层:接收问题,识别为“报销类”
  • 检索层:将问题转成向量,检索返回3段相关内容
  • 决策层:用Prompt组织答案
你是公司报销助手。请根据以下资料回答用户问题:[检索到的内容]用户问题:一线城市住宿标准是多少?要求:简洁总结,标注来源。
  • 执行层:返回答案

“根据《员工报销手册》,一线城市住宿标准为500元/天。需凭发票报销,超标需提前申请。”
底部标注:“来源:《员工报销手册》第3章”

第4周:上线与迭代

  • 第一周:开放给10个部门试用,收集反馈
  • 发现1:“打车报销”的问题答不准,补充《市内交通报销规定》到知识库
  • 发现2:用户喜欢简洁答案,调整Prompt,去掉冗余信息
  • 发现3:有人问“老板的住宿标准是多少”,答案显示“500元/天”,但实际老板标准更高。加入护栏:高管相关问题转人工
  • 一个月后:覆盖90%的报销问题,准确率95%,HR和财务的咨询量下降70%

九、RAG+Agent vs 其他方案:产品经理怎么选?

产品经理的选择原则

  • 有知识库,没有标注数据 → 选RAG+Agent
  • 有标注数据,任务固定 → 考虑微调
  • 什么都没有 → 先用RAG+Agent跑起来,有数据再考虑微调

十、最后说一句

我那个朋友听完,说:“原来RAG+Agent就是给智能体配一个‘私家图书馆’,让它每次回答前先翻书。而且这个图书馆可以随时更新,翻书的规则可以随时调,成本还不高。这简直是中小企业的神器。”

我说对。RAG+Agent是构建企业级私有知识大脑的最佳实践,没有之一。它让AI不再依赖“死记硬背”,而是“开卷考试”。知识库是活的,答案是有据可查的,用户是信任的。

你不需要把公司所有文档都喂给模型去微调,只需要建一个向量数据库,让智能体带着它回答问题。成本低、见效快、可迭代。

这就是为什么,几乎所有公司的AI落地,第一步都是RAG。

记住:RAG不是一锤子买卖。它需要你持续观察、持续优化。检索策略的5个参数(切片、Embedding、阈值、Top-K、重排序)不是一次设好就永远不变的,而是要根据Badcase不断调优。

产品经理的核心工作

  • 上线前:定好初始参数
  • 上线后:看Badcase,定位问题是“检索不到”“检索不准”还是“答错了”
  • 根据问题类型,对症下药:调阈值、调K、优化切片、加同义词、加重排序、改Prompt

这就是RAG的“产品经理版”优化方法论。掌握了这个,你就能让智能体越用越好。

自检清单(你可以带走)

  • 我能说出RAG和纯大模型的核心区别(开卷 vs 闭卷)
  • 我知道RAG+Agent的五层架构(感知→检索→决策→执行→反馈)
  • 我能列出检索策略的5个核心参数(切片、Embedding、阈值、Top-K、重排序)
  • 我知道每种参数怎么调、什么场景用什么值
  • 我能用排查手册定位RAG的常见问题(检索不到、内容不相关、答错了、用户不满意)

  • 我能写出一个RAG场景的Prompt(角色+规则+思维链+Few-shot)

  • 我能用决策表帮团队选方案(RAG vs 微调 vs 自建)

最后

对于正在迷茫择业、想转行提升,或是刚入门的程序员、编程小白来说,有一个问题几乎人人都在问:未来10年,什么领域的职业发展潜力最大?

答案只有一个:人工智能(尤其是大模型方向)

当下,人工智能行业正处于爆发式增长期,其中大模型相关岗位更是供不应求,薪资待遇直接拉满——字节跳动作为AI领域的头部玩家,给硕士毕业的优质AI人才(含大模型相关方向)开出的月基础工资高达5万—6万元;即便是非“人才计划”的普通应聘者,月基础工资也能稳定在4万元左右

再看阿里、腾讯两大互联网大厂,非“人才计划”的AI相关岗位应聘者,月基础工资也约有3万元,远超其他行业同资历岗位的薪资水平,对于程序员、小白来说,无疑是绝佳的转型和提升赛道。

如果你还不知道从何开始,我自己整理一套全网最全最细的大模型零基础教程,我也是一路自学走过来的,很清楚小白前期学习的痛楚,你要是没有方向还没有好的资源,根本学不到东西!

下面是我整理的大模型学习资源,希望能帮到你。

👇👇扫码免费领取全部内容👇👇

在这里插入图片描述

最后

1、大模型学习路线

2、从0到进阶大模型学习视频教程

从入门到进阶这里都有,跟着老师学习事半功倍。

3、 入门必看大模型学习书籍&文档.pdf(书面上的技术书籍确实太多了,这些是我精选出来的,还有很多不在图里)

4、 AI大模型最新行业报告

2026最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

5、面试试题/经验

【大厂 AI 岗位面经分享(107 道)】

【AI 大模型面试真题(102 道)】

【LLMs 面试真题(97 道)】

6、大模型项目实战&配套源码

适用人群

四阶段学习规划(共90天,可落地执行)
第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范
第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署
第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建
第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型

  • 带你了解全球大模型

  • 使用国产大模型服务

  • 搭建 OpenAI 代理

  • 热身:基于阿里云 PAI 部署 Stable Diffusion

  • 在本地计算机运行大模型

  • 大模型的私有化部署

  • 基于 vLLM 部署大模型

  • 案例:如何优雅地在阿里云私有部署开源大模型

  • 部署一套开源 LLM 项目

  • 内容安全

  • 互联网信息服务算法备案

  • 👇👇扫码免费领取全部内容👇👇

    在这里插入图片描述

3、这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐