中小企业AI落地第一步：揭秘RAG+Agent如何低成本打造内部知识库问答智能体！

python零基础入门小白

367人浏览 · 2026-04-20 10:38:38

python零基础入门小白 · 2026-04-20 10:38:38 发布

本文深入解析了RAG（检索增强生成）技术如何帮助企业低成本、高效率地构建内部知识库问答智能体。文章以产品经理视角，详细阐述了RAG+Agent的架构设计、五层设计要点、检索策略优化及常见问题排查方法，并结合实际案例展示了从0到1搭建企业内部报销问答智能体的完整流程。强调RAG是中小企业的AI落地首选方案，因其成本最低、见效最快、风险最小，且无需大量标注数据。

上周，我那个转型AI产品经理的朋友又来找我了。

他一脸兴奋：“第五篇和第六篇我看了，智能体我懂了，思维转变我也明白了。但我现在遇到一个实际问题——公司想做一个内部知识库问答智能体，让员工问‘报销流程是什么’、‘客户投诉怎么处理’、‘某个项目的技术方案’这类问题。我用大模型直接答，它有时候瞎编；用Prompt写规则，又写不全；用微调，又没那么多标注数据。怎么办？”

我说：“你这个问题，正是RAG要解决的。而且我告诉你一个秘密——大部分公司做AI落地，第一步都是RAG。不是因为其他技术不行，而是因为RAG是成本最低、见效最快、风险最小的方案。今天这篇，我就把RAG+Agent怎么搭、怎么用、怎么优化，从产品经理的角度彻底讲透。”

一、先讲个故事：为什么把文档塞给大模型也不行？

小张是一家中型公司的产品经理。公司有5000份内部文档：员工手册、产品说明、流程规范、历史项目总结、客户案例库。老板说：“我们要用AI，让员工能快速查到这些信息。”

小张一开始的做法很简单：把所有文档内容直接塞进Prompt，然后问大模型。

结果他发现几个问题：

问题1：Prompt装不下
一份员工手册就200页，全部塞进去Prompt就爆了。大模型的上下文长度有限（即使是长上下文模型，塞太多内容成本也极高）。他只能选几份关键文档塞进去，但员工问的问题五花八门，覆盖不全。

问题2：塞进去也找不到
即使他把相关文档塞进去了，大模型也不一定答对。因为大模型是“猜词”机制，不是“检索”机制。当Prompt里有5000字的内容时，大模型可能“注意”不到藏在中间的那句话。就像你给一个人一本书让他找答案，他可能翻半天找不到，或者看错行。

问题3：文档一更新就废了
公司文档经常更新。每次更新，小张都要重新整理Prompt，重新测试。改一个文档，可能要改几十个Prompt。

结果：

员工问“差旅报销标准”，大模型答“根据公司规定，差旅住宿标准为一线城市500元/天”——这个信息是旧版的，因为小张用的是旧文档。
员工问“客户投诉处理流程”，大模型答得头头是道，但其中一步“填写投诉工单”的链接是错的——因为文档里的链接过期了，大模型照搬了错误信息。
员工问“某某项目的技术方案”，大模型说“我查不到这个信息”——因为小张没把那份文档塞进去。

小张崩溃了：“我明明把文档塞给大模型了，为什么还是不行？”

老李走过来，说：“你犯了一个常见错误。你让大模型‘背’文档，但它不是人，它不会‘背’。它是猜词机器，不是检索系统。你需要的是：先让系统检索到正确的文档片段，再把片段给大模型，让它基于片段回答。这就是RAG。”

这样逻辑就通顺了：大模型不是“没读过”文档，而是“读了但读不准”。RAG解决的不是“有没有读”的问题，而是“怎么精准读、怎么低成本读、怎么实时读”的问题。

二、RAG是什么？——让AI从“闭卷考试”变成“开卷考试”

RAG（Retrieval-Augmented Generation，检索增强生成）的核心思想，用一个比喻就能讲明白：

纯大模型：闭卷考试。你问它问题，它凭“记忆”答。记忆可能过时、可能不完整、可能张冠李戴。就像你参加历史考试，但不能翻书，全靠脑子记。万一记错了，就答错了。

RAG：开卷考试。你问问题，它先翻书（检索知识库），找到相关章节，再根据这些内容回答。就像你参加历史考试，可以翻课本、翻笔记，答案有据可查，不会瞎编。

RAG+Agent：不仅开卷，还能自己决定翻哪些书、怎么翻、翻完怎么整理。而且可以持续更新知识库，越用越准。就像你不仅开卷，还配了一个图书管理员帮你找资料，一个学霸帮你总结答案，一个助教帮你检查对错。

为什么RAG是中小企业的首选？

成本低：不需要标注数据，不需要训练模型
见效快：一周搭好原型，两周上线
可解释：答案可以溯源，用户知道“为什么是这个答案”
易更新：文档改了，知识库同步改，不需要重新训练模型

三、RAG+Agent架构：五层设计（产品经理必须懂）

一个完整的企业级RAG+Agent智能体，需要设计五层。每一层我都用报销问答的例子说明：

┌─────────────────────────────────────────────────────────────────┐
│                企业知识库问答智能体（RAG+Agent）                 │
├─────────────────────────────────────────────────────────────────┤
│                                                                 │
│  ┌─────────────────────────────────────────────────────────┐   │
│  │                 第一层：感知层（硬）                      │   │
│  │  产品经理要设计：                                        │   │
│  │  • 用户怎么问？是打字？语音？选择菜单？                  │   │
│  │  • 问题怎么分类？是报销类、流程类、产品类？              │   │
│  │  • 什么时候触发检索？每个问题都查？还是先判断一下？      │   │
│  │                                                         │   │
│  │  案例：用户问“差旅住宿标准是多少？”                      │   │
│  │  智能体识别这是“报销类”问题，触发检索动作                │   │
│  └─────────────────────────────────────────────────────────┘   │
│                              ↓                                  │
│  ┌─────────────────────────────────────────────────────────┐   │
│  │                 第二层：检索层（硬）                      │   │
│  │  产品经理要设计：                                        │   │
│  │  • 知识库从哪来？哪些文档要加？哪些不要？                │   │
│  │  • 文档怎么切？多长一段合适？（太短信息不全，太长不准）  │   │
│  │  • 用什么模型转向量？（开源免费还是付费API？）           │   │
│  │  • 检索策略：相似度阈值设多少？返回几条？要不要重排序？  │   │
│  │                                                         │   │
│  │  案例：智能体在知识库中检索，找到3段相关内容：            │   │
│  │  • 《员工报销手册》第3章：“住宿标准：一线城市500元/天” │   │
│  │  • 《差旅管理规定》第2条：“住宿费需凭发票报销”          │   │
│  │  • 《常见问题FAQ》第8条：“超标住宿需提前申请”            │   │
│  └─────────────────────────────────────────────────────────┘   │
│                              ↓                                  │
│  ┌─────────────────────────────────────────────────────────┐   │
│  │                 第三层：决策层（软）                      │   │
│  │  产品经理要设计（这里是Prompt技巧的主场）：              │   │
│  │  • 角色设定：“你是公司报销助手，回答要简洁、准确”       │   │
│  │  • 规则设置：“如果资料中有答案，总结后标注来源”         │   │
│  │  • 规则设置：“如果资料中没有，说‘我查不到，联系HR’”   │   │
│  │  • 思维链：“一步步分析：问题是什么→检索了什么→怎么回答”│   │
│  │  • Few-shot：给1-2个示例，教模型怎么总结、怎么标注      │   │
│  │                                                         │   │
│  │  案例：智能体用Prompt组织回答：                          │   │
│  │  “根据《员工报销手册》，一线城市住宿标准为500元/天。   │   │
│  │   请注意：需凭发票报销，超标需提前申请。”               │   │
│  │   底部标注：“来源：《员工报销手册》第3章”               │   │
│  └─────────────────────────────────────────────────────────┘   │
│                              ↓                                  │
│  ┌─────────────────────────────────────────────────────────┐   │
│  │                 第四层：执行层（硬）                      │   │
│  │  产品经理要设计：                                        │   │
│  │  • 答案怎么展示？纯文字？带链接？带图片？                │   │
│  │  • 用户不满意怎么办？加“有用/无用”按钮？                │   │
│  │  • 需要转人工怎么办？加“联系HR”按钮？                   │   │
│  │                                                         │   │
│  │  案例：用户看到答案，如果觉得有用点“有用”，觉得没用     │   │
│  │  点“无用”，还可以直接点击“联系HR”发起人工咨询          │   │
│  └─────────────────────────────────────────────────────────┘   │
│                              ↓                                  │
│  ┌─────────────────────────────────────────────────────────┐   │
│  │                 第五层：反馈层（硬）                      │   │
│  │  产品经理要设计：                                        │   │
│  │  • 怎么收集反馈？点赞点踩？满意度评分？                  │   │
│  │  • 怎么分析日志？哪些问题检索不到？哪些答案不满意？      │   │
│  │  • 怎么优化知识库？自动提示“这个文档该更新了”？         │   │
│  │                                                         │   │
│  │  案例：一周后，发现“市内交通费”相关问题的满意度很低，  │   │
│  │  管理员查看日志，发现知识库里没有相关内容，于是补充     │   │
│  │  《市内交通报销规定》到知识库，问题解决。                │   │
│  └─────────────────────────────────────────────────────────┘   │
│                                                                 │
└─────────────────────────────────────────────────────────────────┘

产品经理的核心工作：

第一层：定义用户怎么问、问题怎么分类
第二层：决定哪些文档进知识库、怎么切、怎么检索
第三层：写Prompt，让大模型把检索到的内容变成好答案
第四层：设计交互界面和转人工流程
第五层：设计反馈机制，让智能体越用越好

四、检索策略的5个核心要点

检索是RAG的命门。检索不准，后面大模型再聪明也没用。下面这5个要点，是你在设计RAG时必须拍板的决策点：

要点1：切片大小（Chunk Size）——文档切多长？

产品经理怎么决策：

先问：用户问的是“点状信息”（一个数字、一个日期）还是“面状信息”（一个流程、一个概念）？
点状信息用小切片，面状信息用大切片。
上线后看效果：如果答案信息不全，调大切片；如果答案太啰嗦、包含无关信息，调小切片。

要点2：Embedding模型选择——用什么模型转向量？

产品经理怎么决策：

有技术团队、数据敏感 → 开源免费（BGE）
没技术团队、想快速验证 → 商业API
追求极致效果、预算充足 → 商业高精度

要点3：相似度阈值（Similarity Threshold）——多像才算相关？

相似度分数通常在0-1之间。阈值决定了“多像的才返回”。

产品经理怎么决策：

场景对准确率要求高（如医疗、法律）→ 用高阈值，宁缺毋滥
场景对覆盖率要求高（如知识探索）→ 用低阈值，宁可多不可漏
不确定 → 先用0.7，上线后看Badcase调

要点4：Top-K——返回几条？

Top-K决定了每次检索返回多少条给大模型。

产品经理怎么决策：

简单问答（“标准是多少”）→ K=3
复杂问题（“整个流程是什么”）→ K=5-7
不确定 → 先设5，上线后看效果调

要点5：重排序（Rerank）——让最相关的排前面

第一次检索（向量相似度）可能不够准。重排序是用一个更精细的模型，对检索结果重新打分排序。

产品经理怎么决策：

先用向量检索跑通，如果效果不够，再加重排序
重排序会显著增加延迟（从几百毫秒到1-2秒），需要权衡用户体验

五、RAG常见问题排查手册

RAG上线后，一定会遇到各种问题。下面是最常见的几类问题，以及产品经理怎么排查、怎么优化：

问题类型1：检索不到相关内容

现象：用户问的问题，知识库里明明有，但智能体说“找不到”。

排查步骤：

检查问题是否被正确向量化

：用同样的问题在知识库里手动检索，看能不能找到。如果手动能找到，说明向量化没问题；如果手动也找不到，说明问题本身和文档的表述差异太大。
检查相似度阈值是否太高

：把阈值调低0.1，看能不能检索到。如果能，说明阈值设置过高，放低即可。
检查Top-K是否太小

：把K调大，看能不能检索到。如果能，说明K太小，调大即可。
检查文档切片是否合理

：如果文档切得太小，关键信息可能被切散；如果切得太大，检索可能不准。调整切片大小重新试。

产品经理解决方案：

调低阈值
调大Top-K
优化文档切片
如果是表述差异问题，考虑加“同义词”或“查询改写”

问题类型2：检索到了，但内容不相关

现象：检索返回了内容，但这些内容和问题没什么关系。

排查步骤：

检查相似度阈值是否太低

：把阈值调高0.1，看结果是否更相关。如果是，说明阈值太低，混入了太多噪声。
检查Top-K是否太大

：K太大可能把不相关的内容也捞进来。调小K，看结果是否更精准。
检查文档切片是否合理

：如果文档切得太大，一段里包含多个主题，检索时会混入不相关内容。调小切片重试。
考虑加重排序

：如果以上都不行，尝试加重排序模型，重新打分。

产品经理解决方案：

调高阈值
调小Top-K
优化文档切片
加重排序

问题类型3：检索到了，但大模型答错了

现象：检索到了正确的内容，但大模型生成的答案不对。

排查步骤：

检查检索内容是否完整

：把检索到的内容单独拿出来，自己看能不能回答。如果自己都不能，说明检索不完整，需要优化检索。
检查Prompt是否写清楚

：大模型可能误解了你的要求。检查Prompt有没有明确说“只基于以下内容回答”“如果不确定就说不知道”。
检查思维链是否有效

：大模型可能跳过了推理步骤。用“请一步步分析”强制它推理。
检查Few-shot示例是否相关

：示例和当前问题差异太大，模型可能学偏。

产品经理解决方案：

优化Prompt（加“只基于以下内容”）
加强思维链（“一步步分析”）
补充Few-shot示例
如果以上都不行，考虑换更大的模型

问题类型4：答案有，但用户不满意

现象：答案技术上正确，但用户觉得“不是我要的”。

排查步骤：

检查用户反馈

：用户具体说了什么？是答案太啰嗦？还是没回答到点子上？
检查答案格式

：是不是没有标注来源？用户需要溯源。
检查答案长度

：是不是太长了？用户想要简洁版；是不是太短了？用户想要详细版。

产品经理解决方案：

调整Prompt：让答案更简洁/更详细
加“来源标注”，让用户知道信息从哪来
加“追问”功能，让用户可以继续问

六、RAG优化实战：一个完整案例

假设我们做了一个报销问答智能体，上线后发现三个问题：

问题1：用户问“打车能报销吗？”，智能体说“找不到”。

排查：手动检索知识库，发现《市内交通报销规定》里有答案，但文件名是“交通费管理规范”，和“打车”不匹配。

优化：加同义词映射，把“打车”“出租车”“网约车”映射到“交通费”。

问题2：用户问“住宿标准”，智能体返回了一堆内容，包括“超标需申请”“发票要求”“住宿标准500元”等，太啰嗦。

排查：Top-K=5，返回了5段内容，有些是相关的，有些是周边的。

优化：Top-K从5降到3，同时加重排序，让“住宿标准”本身排第一。

问题3：用户问“老板出差标准”，智能体说“500元/天”，但实际老板标准更高。

排查：知识库里只有普通员工标准，没有高管标准。

优化：补充高管标准到知识库，加护栏：高管问题转人工。

七、产品经理的RAG设计清单（每一步都有落地建议）

如果你要设计一个企业知识库问答智能体，下面这个清单每一步都要过：

第一步：知识库构建（决定智能体能回答什么）

第二步：检索策略（决定智能体找得准不准）

注：这里讲的是RAG的基础检索策略。如果你想进一步优化效果，还有两个进阶技巧：混合检索（向量+关键词+知识图谱）、查询改写（Query Rewriting）。我们会在后续的8.10篇《RAG检索优化实战》中详细拆解

第三步：决策层设计（决定智能体答得好不好）

这是Prompt技巧的主场，你把之前学的都用上：

角色设定：

“你是公司报销助手。你的职责是帮助员工快速找到报销相关的信息。”

规则设置：

“如果检索到的资料中有明确答案，请用简洁的语言总结，并标注来源。”
“如果检索到的资料中没有答案，请回答：‘我查不到相关信息，请联系HR或财务部。’”
“如果用户问的是敏感信息（如具体人员薪资），请回答：‘这个问题涉及隐私，请联系HR。’”

思维链：

“请一步步思考：

用户问的是什么问题？
检索到的资料中，哪些是相关的？
这些资料是怎么说的？
我怎么用简洁的语言总结？”

Few-shot示例：

用户问：“住宿标准是多少？”
资料：《员工报销手册》第3章：“住宿标准：一线城市500元/天，二线城市400元/天。”
回答：“根据《员工报销手册》，一线城市住宿标准为500元/天，二线城市为400元/天。需凭发票报销。”

第四步：护栏设计（防止智能体闯祸）

第五步：反馈与优化（让智能体越用越好）

八、实战案例：从0到1搭一个企业内部报销问答智能体

我用一个完整的案例，把上面所有内容串起来。

背景

某公司有2000名员工，每月有大量报销咨询。HR和财务每天被问“住宿标准是多少？”“打车能不能报销？”“发票丢了怎么办？”等问题。

第1周：准备知识库

收集文档：《员工报销手册》《差旅标准》《发票规范》《报销常见问题》，共4份PDF，约200页
清洗：去掉旧版内容（比如2019年的标准），统一格式
切片：每份PDF切成若干段，每段约800字，共400个片段
向量化：用开源的BAAI/bge-large-zh模型，将每个片段转成向量，存入Chroma向量数据库

第2周：搭建检索系统

设置相似度阈值0.7，Top-K=5
测试：问“住宿标准”，返回5段相关内容，包括住宿标准、差旅规定、超标申请等

第3周：设计Agent工作流

用户问：“一线城市住宿标准是多少？”
感知层：接收问题，识别为“报销类”
检索层：将问题转成向量，检索返回3段相关内容
决策层：用Prompt组织答案

你是公司报销助手。请根据以下资料回答用户问题：[检索到的内容]用户问题：一线城市住宿标准是多少？要求：简洁总结，标注来源。

执行层：返回答案

“根据《员工报销手册》，一线城市住宿标准为500元/天。需凭发票报销，超标需提前申请。”
底部标注：“来源：《员工报销手册》第3章”

第4周：上线与迭代

第一周：开放给10个部门试用，收集反馈
发现1：“打车报销”的问题答不准，补充《市内交通报销规定》到知识库
发现2：用户喜欢简洁答案，调整Prompt，去掉冗余信息
发现3：有人问“老板的住宿标准是多少”，答案显示“500元/天”，但实际老板标准更高。加入护栏：高管相关问题转人工
一个月后：覆盖90%的报销问题，准确率95%，HR和财务的咨询量下降70%

九、RAG+Agent vs 其他方案：产品经理怎么选？

产品经理的选择原则：

有知识库，没有标注数据 → 选RAG+Agent
有标注数据，任务固定 → 考虑微调
什么都没有 → 先用RAG+Agent跑起来，有数据再考虑微调

十、最后说一句

我那个朋友听完，说：“原来RAG+Agent就是给智能体配一个‘私家图书馆’，让它每次回答前先翻书。而且这个图书馆可以随时更新，翻书的规则可以随时调，成本还不高。这简直是中小企业的神器。”

我说对。RAG+Agent是构建企业级私有知识大脑的最佳实践，没有之一。它让AI不再依赖“死记硬背”，而是“开卷考试”。知识库是活的，答案是有据可查的，用户是信任的。

你不需要把公司所有文档都喂给模型去微调，只需要建一个向量数据库，让智能体带着它回答问题。成本低、见效快、可迭代。

这就是为什么，几乎所有公司的AI落地，第一步都是RAG。

记住：RAG不是一锤子买卖。它需要你持续观察、持续优化。检索策略的5个参数（切片、Embedding、阈值、Top-K、重排序）不是一次设好就永远不变的，而是要根据Badcase不断调优。

产品经理的核心工作：

上线前：定好初始参数
上线后：看Badcase，定位问题是“检索不到”“检索不准”还是“答错了”
根据问题类型，对症下药：调阈值、调K、优化切片、加同义词、加重排序、改Prompt

这就是RAG的“产品经理版”优化方法论。掌握了这个，你就能让智能体越用越好。

自检清单（你可以带走）

我能说出RAG和纯大模型的核心区别（开卷 vs 闭卷）
我知道RAG+Agent的五层架构（感知→检索→决策→执行→反馈）
我能列出检索策略的5个核心参数（切片、Embedding、阈值、Top-K、重排序）
我知道每种参数怎么调、什么场景用什么值

我能用排查手册定位RAG的常见问题（检索不到、内容不相关、答错了、用户不满意）
我能写出一个RAG场景的Prompt（角色+规则+思维链+Few-shot）
我能用决策表帮团队选方案（RAG vs 微调 vs 自建）

最后

对于正在迷茫择业、想转行提升，或是刚入门的程序员、编程小白来说，有一个问题几乎人人都在问：未来10年，什么领域的职业发展潜力最大？

答案只有一个：人工智能（尤其是大模型方向）

当下，人工智能行业正处于爆发式增长期，其中大模型相关岗位更是供不应求，薪资待遇直接拉满——字节跳动作为AI领域的头部玩家，给硕士毕业的优质AI人才（含大模型相关方向）开出的月基础工资高达5万—6万元；即便是非“人才计划”的普通应聘者，月基础工资也能稳定在4万元左右。

再看阿里、腾讯两大互联网大厂，非“人才计划”的AI相关岗位应聘者，月基础工资也约有3万元，远超其他行业同资历岗位的薪资水平，对于程序员、小白来说，无疑是绝佳的转型和提升赛道。

如果你还不知道从何开始，我自己整理一套全网最全最细的大模型零基础教程，我也是一路自学走过来的，很清楚小白前期学习的痛楚，你要是没有方向还没有好的资源，根本学不到东西！

下面是我整理的大模型学习资源，希望能帮到你。

👇👇扫码免费领取全部内容👇👇

在这里插入图片描述

最后

1、大模型学习路线

2、从0到进阶大模型学习视频教程

从入门到进阶这里都有，跟着老师学习事半功倍。

3、入门必看大模型学习书籍&文档.pdf（书面上的技术书籍确实太多了，这些是我精选出来的，还有很多不在图里）

4、 AI大模型最新行业报告

2026最新行业报告，针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估，以了解哪些行业更适合引入大模型的技术和应用，以及在哪些方面可以发挥大模型的优势。

5、面试试题/经验

【大厂 AI 岗位面经分享（107 道）】

【AI 大模型面试真题（102 道）】

【LLMs 面试真题（97 道）】

6、大模型项目实战&配套源码

适用人群

四阶段学习规划（共90天，可落地执行）

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

👇👇扫码免费领取全部内容👇👇

3、这些资料真的有用吗？

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理，现任上海殷泊信息科技CEO，其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证，服务航天科工、国家电网等1000+企业，以第一作者在IEEE Transactions发表论文50+篇，获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目，无论你是小白还是有些技术基础的技术人员，这份资料都绝对能帮助你提升薪资待遇，转行大模型岗位。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

【EI复现】基于元模型优化算法的主从博弈多虚拟电厂动态定价和能量管理(Matlab代码实现）

基于元模型的优化算法是一种基于历史数据来驱动样本点的加入从而逼近局部或全局最优解的优化机制，能够改善传统启发式智能算法需要繁复数值模拟的缺陷，目前在飞行器设计等航空航天领域的应用[20]最为广泛，在电力系统方面也有初步的应用。提出基于 Kriging 元模型的博弈均衡算法，在求解过程中建立 Kriging 元模型替代 VPP 内部的能量管理模型，利用粒子群优化算法搜索优异采样点，更新修正 Krig

AtomGit开源社区

蒙特卡洛风光场景并通过削减法聚类法得到几个典型场景（包含Matlab代码和Python代码实现）

蒙特卡洛方法是一种基于随机抽样的数值计算方法，通过多次随机抽样来估计系统的行为，从而得到系统的统计性质。在风光模型中，蒙特卡洛方法可以用来模拟风速、风向和太阳光照的变化，进而评估风力和太阳能系统在不同条件下的性能。

AtomGit开源社区

完全免费、绿色免安装的Windows轻量级硬件检测工具，零依赖查看电脑配置

📌 摘要：推荐一款免费免安装的Windows硬件检测工具SysView，单文件便携、零依赖，兼容Win7/10/11系统。支持一键读取CPU、内存、显卡等硬件参数，无广告、不上传隐私。特点包括毫秒级启动、纯本地运行、无需管理员权限，适合普通用户、DIY玩家及运维人员。开源项目，提供32/64位版本下载，点击即用，彻底关闭无残留。 🔗 核心优势： ✅ 永久免费无阉割 ✅ 绿色免安装，U盘随身带

AtomGit开源社区

所有评论(0)

查看更多评论

python零基础入门小白

@2301_80239908

已为社区贡献111条内容

中小企业AI落地第一步：揭秘RAG+Agent如何低成本打造内部知识库问答智能体！

python零基础入门小白

一、先讲个故事：为什么把文档塞给大模型也不行？

二、RAG是什么？——让AI从“闭卷考试”变成“开卷考试”

三、RAG+Agent架构：五层设计（产品经理必须懂）

四、检索策略的5个核心要点

要点1：切片大小（Chunk Size）——文档切多长？

要点2：Embedding模型选择——用什么模型转向量？

要点3：相似度阈值（Similarity Threshold）——多像才算相关？

要点4：Top-K——返回几条？

要点5：重排序（Rerank）——让最相关的排前面

五、RAG常见问题排查手册

问题类型1：检索不到相关内容

问题类型2：检索到了，但内容不相关

问题类型3：检索到了，但大模型答错了

问题类型4：答案有，但用户不满意

六、RAG优化实战：一个完整案例

七、产品经理的RAG设计清单（每一步都有落地建议）

第一步：知识库构建（决定智能体能回答什么）

第二步：检索策略（决定智能体找得准不准）

第三步：决策层设计（决定智能体答得好不好）

第四步：护栏设计（防止智能体闯祸）

第五步：反馈与优化（让智能体越用越好）

八、实战案例：从0到1搭一个企业内部报销问答智能体

背景

第1周：准备知识库

第2周：搭建检索系统

第3周：设计Agent工作流

第4周：上线与迭代

九、RAG+Agent vs 其他方案：产品经理怎么选？

十、最后说一句

最后

最后

1、大模型学习路线

2、从0到进阶大模型学习视频教程

3、 入门必看大模型学习书籍&文档.pdf（书面上的技术书籍确实太多了，这些是我精选出来的，还有很多不在图里）

4、 AI大模型最新行业报告

5、面试试题/经验

【大厂 AI 岗位面经分享（107 道）】

【AI 大模型面试真题（102 道）】

【LLMs 面试真题（97 道）】

6、大模型项目实战&配套源码

适用人群

四阶段学习规划（共90天，可落地执行）

第一阶段（10天）：初阶应用

第二阶段（30天）：高阶应用

第三阶段（30天）：模型训练

第四阶段（20天）：商业闭环

3、这些资料真的有用吗？

所有评论(0)

温馨提示：您尚未绑定手机号

python零基础入门小白

3、入门必看大模型学习书籍&文档.pdf（书面上的技术书籍确实太多了，这些是我精选出来的，还有很多不在图里）