中小企业AI落地第一步:揭秘RAG+Agent如何低成本打造内部知识库问答智能体!
本文深入解析了RAG(检索增强生成)技术如何帮助企业低成本、高效率地构建内部知识库问答智能体。文章以产品经理视角,详细阐述了RAG+Agent的架构设计、五层设计要点、检索策略优化及常见问题排查方法,并结合实际案例展示了从0到1搭建企业内部报销问答智能体的完整流程。强调RAG是中小企业的AI落地首选方案,因其成本最低、见效最快、风险最小,且无需大量标注数据。

上周,我那个转型AI产品经理的朋友又来找我了。
他一脸兴奋:“第五篇和第六篇我看了,智能体我懂了,思维转变我也明白了。但我现在遇到一个实际问题——公司想做一个内部知识库问答智能体,让员工问‘报销流程是什么’、‘客户投诉怎么处理’、‘某个项目的技术方案’这类问题。我用大模型直接答,它有时候瞎编;用Prompt写规则,又写不全;用微调,又没那么多标注数据。怎么办?”
我说:“你这个问题,正是RAG要解决的。而且我告诉你一个秘密——大部分公司做AI落地,第一步都是RAG。不是因为其他技术不行,而是因为RAG是成本最低、见效最快、风险最小的方案。今天这篇,我就把RAG+Agent怎么搭、怎么用、怎么优化,从产品经理的角度彻底讲透。”
一、先讲个故事:为什么把文档塞给大模型也不行?
小张是一家中型公司的产品经理。公司有5000份内部文档:员工手册、产品说明、流程规范、历史项目总结、客户案例库。老板说:“我们要用AI,让员工能快速查到这些信息。”
小张一开始的做法很简单:把所有文档内容直接塞进Prompt,然后问大模型。

结果他发现几个问题:
问题1:Prompt装不下
一份员工手册就200页,全部塞进去Prompt就爆了。大模型的上下文长度有限(即使是长上下文模型,塞太多内容成本也极高)。他只能选几份关键文档塞进去,但员工问的问题五花八门,覆盖不全。
问题2:塞进去也找不到
即使他把相关文档塞进去了,大模型也不一定答对。因为大模型是“猜词”机制,不是“检索”机制。当Prompt里有5000字的内容时,大模型可能“注意”不到藏在中间的那句话。就像你给一个人一本书让他找答案,他可能翻半天找不到,或者看错行。
问题3:文档一更新就废了
公司文档经常更新。每次更新,小张都要重新整理Prompt,重新测试。改一个文档,可能要改几十个Prompt。
结果:
- 员工问“差旅报销标准”,大模型答“根据公司规定,差旅住宿标准为一线城市500元/天”——这个信息是旧版的,因为小张用的是旧文档。
- 员工问“客户投诉处理流程”,大模型答得头头是道,但其中一步“填写投诉工单”的链接是错的——因为文档里的链接过期了,大模型照搬了错误信息。
- 员工问“某某项目的技术方案”,大模型说“我查不到这个信息”——因为小张没把那份文档塞进去。
小张崩溃了:“我明明把文档塞给大模型了,为什么还是不行?”
老李走过来,说:“你犯了一个常见错误。你让大模型‘背’文档,但它不是人,它不会‘背’。它是猜词机器,不是检索系统。你需要的是:先让系统检索到正确的文档片段,再把片段给大模型,让它基于片段回答。这就是RAG。”

这样逻辑就通顺了:大模型不是“没读过”文档,而是“读了但读不准”。RAG解决的不是“有没有读”的问题,而是“怎么精准读、怎么低成本读、怎么实时读”的问题。
二、RAG是什么?——让AI从“闭卷考试”变成“开卷考试”
RAG(Retrieval-Augmented Generation,检索增强生成)的核心思想,用一个比喻就能讲明白:
纯大模型:闭卷考试。你问它问题,它凭“记忆”答。记忆可能过时、可能不完整、可能张冠李戴。就像你参加历史考试,但不能翻书,全靠脑子记。万一记错了,就答错了。
RAG:开卷考试。你问问题,它先翻书(检索知识库),找到相关章节,再根据这些内容回答。就像你参加历史考试,可以翻课本、翻笔记,答案有据可查,不会瞎编。
RAG+Agent:不仅开卷,还能自己决定翻哪些书、怎么翻、翻完怎么整理。而且可以持续更新知识库,越用越准。就像你不仅开卷,还配了一个图书管理员帮你找资料,一个学霸帮你总结答案,一个助教帮你检查对错。
为什么RAG是中小企业的首选?
- 成本低:不需要标注数据,不需要训练模型
- 见效快:一周搭好原型,两周上线
- 可解释:答案可以溯源,用户知道“为什么是这个答案”
- 易更新:文档改了,知识库同步改,不需要重新训练模型
三、RAG+Agent架构:五层设计(产品经理必须懂)
一个完整的企业级RAG+Agent智能体,需要设计五层。每一层我都用报销问答的例子说明:
┌─────────────────────────────────────────────────────────────────┐
│ 企业知识库问答智能体(RAG+Agent) │
├─────────────────────────────────────────────────────────────────┤
│ │
│ ┌─────────────────────────────────────────────────────────┐ │
│ │ 第一层:感知层(硬) │ │
│ │ 产品经理要设计: │ │
│ │ • 用户怎么问?是打字?语音?选择菜单? │ │
│ │ • 问题怎么分类?是报销类、流程类、产品类? │ │
│ │ • 什么时候触发检索?每个问题都查?还是先判断一下? │ │
│ │ │ │
│ │ 案例:用户问“差旅住宿标准是多少?” │ │
│ │ 智能体识别这是“报销类”问题,触发检索动作 │ │
│ └─────────────────────────────────────────────────────────┘ │
│ ↓ │
│ ┌─────────────────────────────────────────────────────────┐ │
│ │ 第二层:检索层(硬) │ │
│ │ 产品经理要设计: │ │
│ │ • 知识库从哪来?哪些文档要加?哪些不要? │ │
│ │ • 文档怎么切?多长一段合适?(太短信息不全,太长不准) │ │
│ │ • 用什么模型转向量?(开源免费还是付费API?) │ │
│ │ • 检索策略:相似度阈值设多少?返回几条?要不要重排序? │ │
│ │ │ │
│ │ 案例:智能体在知识库中检索,找到3段相关内容: │ │
│ │ • 《员工报销手册》第3章:“住宿标准:一线城市500元/天” │ │
│ │ • 《差旅管理规定》第2条:“住宿费需凭发票报销” │ │
│ │ • 《常见问题FAQ》第8条:“超标住宿需提前申请” │ │
│ └─────────────────────────────────────────────────────────┘ │
│ ↓ │
│ ┌─────────────────────────────────────────────────────────┐ │
│ │ 第三层:决策层(软) │ │
│ │ 产品经理要设计(这里是Prompt技巧的主场): │ │
│ │ • 角色设定:“你是公司报销助手,回答要简洁、准确” │ │
│ │ • 规则设置:“如果资料中有答案,总结后标注来源” │ │
│ │ • 规则设置:“如果资料中没有,说‘我查不到,联系HR’” │ │
│ │ • 思维链:“一步步分析:问题是什么→检索了什么→怎么回答”│ │
│ │ • Few-shot:给1-2个示例,教模型怎么总结、怎么标注 │ │
│ │ │ │
│ │ 案例:智能体用Prompt组织回答: │ │
│ │ “根据《员工报销手册》,一线城市住宿标准为500元/天。 │ │
│ │ 请注意:需凭发票报销,超标需提前申请。” │ │
│ │ 底部标注:“来源:《员工报销手册》第3章” │ │
│ └─────────────────────────────────────────────────────────┘ │
│ ↓ │
│ ┌─────────────────────────────────────────────────────────┐ │
│ │ 第四层:执行层(硬) │ │
│ │ 产品经理要设计: │ │
│ │ • 答案怎么展示?纯文字?带链接?带图片? │ │
│ │ • 用户不满意怎么办?加“有用/无用”按钮? │ │
│ │ • 需要转人工怎么办?加“联系HR”按钮? │ │
│ │ │ │
│ │ 案例:用户看到答案,如果觉得有用点“有用”,觉得没用 │ │
│ │ 点“无用”,还可以直接点击“联系HR”发起人工咨询 │ │
│ └─────────────────────────────────────────────────────────┘ │
│ ↓ │
│ ┌─────────────────────────────────────────────────────────┐ │
│ │ 第五层:反馈层(硬) │ │
│ │ 产品经理要设计: │ │
│ │ • 怎么收集反馈?点赞点踩?满意度评分? │ │
│ │ • 怎么分析日志?哪些问题检索不到?哪些答案不满意? │ │
│ │ • 怎么优化知识库?自动提示“这个文档该更新了”? │ │
│ │ │ │
│ │ 案例:一周后,发现“市内交通费”相关问题的满意度很低, │ │
│ │ 管理员查看日志,发现知识库里没有相关内容,于是补充 │ │
│ │ 《市内交通报销规定》到知识库,问题解决。 │ │
│ └─────────────────────────────────────────────────────────┘ │
│ │
└─────────────────────────────────────────────────────────────────┘
产品经理的核心工作:
- 第一层:定义用户怎么问、问题怎么分类
- 第二层:决定哪些文档进知识库、怎么切、怎么检索
- 第三层:写Prompt,让大模型把检索到的内容变成好答案
- 第四层:设计交互界面和转人工流程
- 第五层:设计反馈机制,让智能体越用越好
四、检索策略的5个核心要点
检索是RAG的命门。检索不准,后面大模型再聪明也没用。下面这5个要点,是你在设计RAG时必须拍板的决策点:

要点1:切片大小(Chunk Size)——文档切多长?

产品经理怎么决策:
- 先问:用户问的是“点状信息”(一个数字、一个日期)还是“面状信息”(一个流程、一个概念)?
- 点状信息用小切片,面状信息用大切片。
- 上线后看效果:如果答案信息不全,调大切片;如果答案太啰嗦、包含无关信息,调小切片。
要点2:Embedding模型选择——用什么模型转向量?

产品经理怎么决策:
- 有技术团队、数据敏感 → 开源免费(BGE)
- 没技术团队、想快速验证 → 商业API
- 追求极致效果、预算充足 → 商业高精度
要点3:相似度阈值(Similarity Threshold)——多像才算相关?
相似度分数通常在0-1之间。阈值决定了“多像的才返回”。

产品经理怎么决策:
- 场景对准确率要求高(如医疗、法律)→ 用高阈值,宁缺毋滥
- 场景对覆盖率要求高(如知识探索)→ 用低阈值,宁可多不可漏
- 不确定 → 先用0.7,上线后看Badcase调
要点4:Top-K——返回几条?
Top-K决定了每次检索返回多少条给大模型。

产品经理怎么决策:
- 简单问答(“标准是多少”)→ K=3
- 复杂问题(“整个流程是什么”)→ K=5-7
- 不确定 → 先设5,上线后看效果调
要点5:重排序(Rerank)——让最相关的排前面
第一次检索(向量相似度)可能不够准。重排序是用一个更精细的模型,对检索结果重新打分排序。

产品经理怎么决策:
- 先用向量检索跑通,如果效果不够,再加重排序
- 重排序会显著增加延迟(从几百毫秒到1-2秒),需要权衡用户体验
五、RAG常见问题排查手册
RAG上线后,一定会遇到各种问题。下面是最常见的几类问题,以及产品经理怎么排查、怎么优化:
问题类型1:检索不到相关内容
现象:用户问的问题,知识库里明明有,但智能体说“找不到”。
排查步骤:
-
检查问题是否被正确向量化
:用同样的问题在知识库里手动检索,看能不能找到。如果手动能找到,说明向量化没问题;如果手动也找不到,说明问题本身和文档的表述差异太大。
-
检查相似度阈值是否太高
:把阈值调低0.1,看能不能检索到。如果能,说明阈值设置过高,放低即可。
-
检查Top-K是否太小
:把K调大,看能不能检索到。如果能,说明K太小,调大即可。
-
检查文档切片是否合理
:如果文档切得太小,关键信息可能被切散;如果切得太大,检索可能不准。调整切片大小重新试。
产品经理解决方案:
- 调低阈值
- 调大Top-K
- 优化文档切片
- 如果是表述差异问题,考虑加“同义词”或“查询改写”
问题类型2:检索到了,但内容不相关
现象:检索返回了内容,但这些内容和问题没什么关系。
排查步骤:
-
检查相似度阈值是否太低
:把阈值调高0.1,看结果是否更相关。如果是,说明阈值太低,混入了太多噪声。
-
检查Top-K是否太大
:K太大可能把不相关的内容也捞进来。调小K,看结果是否更精准。
-
检查文档切片是否合理
:如果文档切得太大,一段里包含多个主题,检索时会混入不相关内容。调小切片重试。
-
考虑加重排序
:如果以上都不行,尝试加重排序模型,重新打分。
产品经理解决方案:
- 调高阈值
- 调小Top-K
- 优化文档切片
- 加重排序
问题类型3:检索到了,但大模型答错了
现象:检索到了正确的内容,但大模型生成的答案不对。
排查步骤:
-
检查检索内容是否完整
:把检索到的内容单独拿出来,自己看能不能回答。如果自己都不能,说明检索不完整,需要优化检索。
-
检查Prompt是否写清楚
:大模型可能误解了你的要求。检查Prompt有没有明确说“只基于以下内容回答”“如果不确定就说不知道”。
-
检查思维链是否有效
:大模型可能跳过了推理步骤。用“请一步步分析”强制它推理。
-
检查Few-shot示例是否相关
:示例和当前问题差异太大,模型可能学偏。
产品经理解决方案:
- 优化Prompt(加“只基于以下内容”)
- 加强思维链(“一步步分析”)
- 补充Few-shot示例
- 如果以上都不行,考虑换更大的模型
问题类型4:答案有,但用户不满意
现象:答案技术上正确,但用户觉得“不是我要的”。
排查步骤:
-
检查用户反馈
:用户具体说了什么?是答案太啰嗦?还是没回答到点子上?
-
检查答案格式
:是不是没有标注来源?用户需要溯源。
-
检查答案长度
:是不是太长了?用户想要简洁版;是不是太短了?用户想要详细版。
产品经理解决方案:
- 调整Prompt:让答案更简洁/更详细
- 加“来源标注”,让用户知道信息从哪来
- 加“追问”功能,让用户可以继续问
六、RAG优化实战:一个完整案例
假设我们做了一个报销问答智能体,上线后发现三个问题:
问题1:用户问“打车能报销吗?”,智能体说“找不到”。
排查:手动检索知识库,发现《市内交通报销规定》里有答案,但文件名是“交通费管理规范”,和“打车”不匹配。
优化:加同义词映射,把“打车”“出租车”“网约车”映射到“交通费”。
问题2:用户问“住宿标准”,智能体返回了一堆内容,包括“超标需申请”“发票要求”“住宿标准500元”等,太啰嗦。
排查:Top-K=5,返回了5段内容,有些是相关的,有些是周边的。
优化:Top-K从5降到3,同时加重排序,让“住宿标准”本身排第一。
问题3:用户问“老板出差标准”,智能体说“500元/天”,但实际老板标准更高。
排查:知识库里只有普通员工标准,没有高管标准。
优化:补充高管标准到知识库,加护栏:高管问题转人工。
七、产品经理的RAG设计清单(每一步都有落地建议)
如果你要设计一个企业知识库问答智能体,下面这个清单每一步都要过:
第一步:知识库构建(决定智能体能回答什么)

第二步:检索策略(决定智能体找得准不准)

注:这里讲的是RAG的基础检索策略。如果你想进一步优化效果,还有两个进阶技巧:混合检索(向量+关键词+知识图谱)、查询改写(Query Rewriting)。我们会在后续的8.10篇《RAG检索优化实战》中详细拆解
第三步:决策层设计(决定智能体答得好不好)
这是Prompt技巧的主场,你把之前学的都用上:
角色设定:
“你是公司报销助手。你的职责是帮助员工快速找到报销相关的信息。”
规则设置:
- “如果检索到的资料中有明确答案,请用简洁的语言总结,并标注来源。”
- “如果检索到的资料中没有答案,请回答:‘我查不到相关信息,请联系HR或财务部。’”
- “如果用户问的是敏感信息(如具体人员薪资),请回答:‘这个问题涉及隐私,请联系HR。’”
思维链:
“请一步步思考:
- 用户问的是什么问题?
- 检索到的资料中,哪些是相关的?
- 这些资料是怎么说的?
- 我怎么用简洁的语言总结?”
Few-shot示例:
用户问:“住宿标准是多少?”
资料:《员工报销手册》第3章:“住宿标准:一线城市500元/天,二线城市400元/天。”
回答:“根据《员工报销手册》,一线城市住宿标准为500元/天,二线城市为400元/天。需凭发票报销。”
第四步:护栏设计(防止智能体闯祸)

第五步:反馈与优化(让智能体越用越好)

八、实战案例:从0到1搭一个企业内部报销问答智能体
我用一个完整的案例,把上面所有内容串起来。
背景
某公司有2000名员工,每月有大量报销咨询。HR和财务每天被问“住宿标准是多少?”“打车能不能报销?”“发票丢了怎么办?”等问题。
第1周:准备知识库
- 收集文档:《员工报销手册》《差旅标准》《发票规范》《报销常见问题》,共4份PDF,约200页
- 清洗:去掉旧版内容(比如2019年的标准),统一格式
- 切片:每份PDF切成若干段,每段约800字,共400个片段
- 向量化:用开源的BAAI/bge-large-zh模型,将每个片段转成向量,存入Chroma向量数据库
第2周:搭建检索系统
- 设置相似度阈值0.7,Top-K=5
- 测试:问“住宿标准”,返回5段相关内容,包括住宿标准、差旅规定、超标申请等
第3周:设计Agent工作流
- 用户问:“一线城市住宿标准是多少?”
- 感知层:接收问题,识别为“报销类”
- 检索层:将问题转成向量,检索返回3段相关内容
- 决策层:用Prompt组织答案
你是公司报销助手。请根据以下资料回答用户问题:[检索到的内容]用户问题:一线城市住宿标准是多少?要求:简洁总结,标注来源。
- 执行层:返回答案
“根据《员工报销手册》,一线城市住宿标准为500元/天。需凭发票报销,超标需提前申请。”
底部标注:“来源:《员工报销手册》第3章”
第4周:上线与迭代
- 第一周:开放给10个部门试用,收集反馈
- 发现1:“打车报销”的问题答不准,补充《市内交通报销规定》到知识库
- 发现2:用户喜欢简洁答案,调整Prompt,去掉冗余信息
- 发现3:有人问“老板的住宿标准是多少”,答案显示“500元/天”,但实际老板标准更高。加入护栏:高管相关问题转人工
- 一个月后:覆盖90%的报销问题,准确率95%,HR和财务的咨询量下降70%
九、RAG+Agent vs 其他方案:产品经理怎么选?

产品经理的选择原则:
- 有知识库,没有标注数据 → 选RAG+Agent
- 有标注数据,任务固定 → 考虑微调
- 什么都没有 → 先用RAG+Agent跑起来,有数据再考虑微调
十、最后说一句
我那个朋友听完,说:“原来RAG+Agent就是给智能体配一个‘私家图书馆’,让它每次回答前先翻书。而且这个图书馆可以随时更新,翻书的规则可以随时调,成本还不高。这简直是中小企业的神器。”
我说对。RAG+Agent是构建企业级私有知识大脑的最佳实践,没有之一。它让AI不再依赖“死记硬背”,而是“开卷考试”。知识库是活的,答案是有据可查的,用户是信任的。
你不需要把公司所有文档都喂给模型去微调,只需要建一个向量数据库,让智能体带着它回答问题。成本低、见效快、可迭代。
这就是为什么,几乎所有公司的AI落地,第一步都是RAG。
记住:RAG不是一锤子买卖。它需要你持续观察、持续优化。检索策略的5个参数(切片、Embedding、阈值、Top-K、重排序)不是一次设好就永远不变的,而是要根据Badcase不断调优。
产品经理的核心工作:
- 上线前:定好初始参数
- 上线后:看Badcase,定位问题是“检索不到”“检索不准”还是“答错了”
- 根据问题类型,对症下药:调阈值、调K、优化切片、加同义词、加重排序、改Prompt
这就是RAG的“产品经理版”优化方法论。掌握了这个,你就能让智能体越用越好。
自检清单(你可以带走)

- 我能说出RAG和纯大模型的核心区别(开卷 vs 闭卷)
- 我知道RAG+Agent的五层架构(感知→检索→决策→执行→反馈)
- 我能列出检索策略的5个核心参数(切片、Embedding、阈值、Top-K、重排序)
- 我知道每种参数怎么调、什么场景用什么值
-
我能用排查手册定位RAG的常见问题(检索不到、内容不相关、答错了、用户不满意)
-
我能写出一个RAG场景的Prompt(角色+规则+思维链+Few-shot)
-
我能用决策表帮团队选方案(RAG vs 微调 vs 自建)
最后
对于正在迷茫择业、想转行提升,或是刚入门的程序员、编程小白来说,有一个问题几乎人人都在问:未来10年,什么领域的职业发展潜力最大?
答案只有一个:人工智能(尤其是大模型方向)
当下,人工智能行业正处于爆发式增长期,其中大模型相关岗位更是供不应求,薪资待遇直接拉满——字节跳动作为AI领域的头部玩家,给硕士毕业的优质AI人才(含大模型相关方向)开出的月基础工资高达5万—6万元;即便是非“人才计划”的普通应聘者,月基础工资也能稳定在4万元左右。
再看阿里、腾讯两大互联网大厂,非“人才计划”的AI相关岗位应聘者,月基础工资也约有3万元,远超其他行业同资历岗位的薪资水平,对于程序员、小白来说,无疑是绝佳的转型和提升赛道。
如果你还不知道从何开始,我自己整理一套全网最全最细的大模型零基础教程,我也是一路自学走过来的,很清楚小白前期学习的痛楚,你要是没有方向还没有好的资源,根本学不到东西!
下面是我整理的大模型学习资源,希望能帮到你。

👇👇扫码免费领取全部内容👇👇

最后
1、大模型学习路线

2、从0到进阶大模型学习视频教程
从入门到进阶这里都有,跟着老师学习事半功倍。

3、 入门必看大模型学习书籍&文档.pdf(书面上的技术书籍确实太多了,这些是我精选出来的,还有很多不在图里)

4、 AI大模型最新行业报告
2026最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

5、面试试题/经验

【大厂 AI 岗位面经分享(107 道)】

【AI 大模型面试真题(102 道)】

【LLMs 面试真题(97 道)】

6、大模型项目实战&配套源码

适用人群

四阶段学习规划(共90天,可落地执行)
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
-
硬件选型
-
带你了解全球大模型
-
使用国产大模型服务
-
搭建 OpenAI 代理
-
热身:基于阿里云 PAI 部署 Stable Diffusion
-
在本地计算机运行大模型
-
大模型的私有化部署
-
基于 vLLM 部署大模型
-
案例:如何优雅地在阿里云私有部署开源大模型
-
部署一套开源 LLM 项目
-
内容安全
-
互联网信息服务算法备案
-
…
👇👇扫码免费领取全部内容👇👇

3、这些资料真的有用吗?
这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。
资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐
所有评论(0)