AI大模型从入门到精通:LLM、Agent、RAG、Skill关系与应用(小白必看,收藏学习!)
💡 导读:本文将用最通俗的语言,带你通过图文并茂的方式,彻底理解 LLM、Agent、RAG 和 Skill 的关系与应用。
适合人群:前端开发、Python 爱好者、AI 探索者
注:本文只是做科普目前AI技术热点科普,不是专业技术分享。
前言:AI时代,不懂这些你就out了
2023年被称为"AI元年",ChatGPT的出现让大语言模型(LLM)走进了大众视野。
但很快,我们发现单纯的大模型还不够:
- ❌ 它不知道最新的新闻
- ❌ 它不能操作你的电脑
- ❌ 它无法完成复杂的多步骤任务
于是,Agent、RAG、Skill 这些技术应运而生。
今天,我们就来聊聊这四大核心技术。
一、LLM:AI的"大脑"
1.1 什么是LLM?
1.1 什么是LLM?
LLM (Large Language Model),也就是我们要说的“大模型”,比如deepseek、GPT、Gemini 等。
它是谁?
它是整个 AI 系统的 “大脑”。它读过几乎全互联网的书,上知天文下知地理,能写诗、能写代码、能陪你聊天。
它的超能力
- ✅ 理解力 Max:能听懂你在说什么。
- ✅ 生成力 Max:能快速生成高质量的文本。
- ✅ 推理力 Max:能处理复杂的逻辑问题。
1.2 常见的LLM有哪些?
| 模型 | 公司 | 特点 |
|---|---|---|
| GPT | OpenAI | 综合能力最强,多模态支持 |
| Claude | Anthropic | 代码能力强,上下文超长 |
| Gemini | 多模态原生,免费额度多 | |
| DeepSeek | DeepSeek | 国产之光,性价比超高,推理能力强 |
| Llama | Meta | 开源可商用,本地部署 |
| 文心一言 | 百度 | 中文优化,国内可用 |
| 通义千问 | 阿里 | 开源版本多,生态丰富 |
| Kimi | 月之暗面 | 长文本处理能力突出 |
1.3 LLM的局限性
虽然LLM很强大,但它有三大硬伤:

所以,光有 LLM 是不够的,我们需要帮手!这就引出了另外三个技术:RAG、Skill、Agent。
二、RAG:给LLM装上"知识外挂"
2.1 什么是RAG?
它是谁?
如果 LLM 是一个参加“开卷考试”的学生,那 RAG 就是他手边的 “教科书” 或者 “图书馆”。
为什么要用它?
当你要问 LLM 关于“你们公司最新的考勤制度”时,LLM 肯定不知道。
这时候,RAG 的作用就来了:
-
检索 (Retrieve)
:先去你们公司的文档库里,把“考勤制度”相关的段落找出来。
-
增强 (Augment)
:把这些段落和你的问题一起扔给 LLM。
-
生成 (Generate)
:LLM 看着这些资料,回答你的问题。
核心价值
- ✨ 解决幻觉:有据可查,不再瞎编。
- ✨ 数据私有化:不用把数据训练进模型,也能回答私有领域问题。
- ✨ 实时性:文档更新了,回答自然就更新了。

2.2 RAG的工作原理

2.3 RAG的实际应用
- 📚 企业知识库问答:上传公司文档,员工随时提问
- 📖 智能客服:基于产品手册自动回答用户问题
- 🔍 论文检索:上传论文库,快速找到相关内容
- 💻 代码助手:基于项目代码库回答技术问题
2.4 代码示例
# 使用LangChain实现简单RAG(新版API)
from langchain_openai import OpenAIEmbeddings, ChatOpenAI
from langchain_chroma import Chroma
from langchain_text_splitters import CharacterTextSplitter
from langchain_community.document_loaders import TextLoader
from langchain.chains import RetrievalQA
# 1. 加载文档
loader = TextLoader('公司手册.txt', encoding='utf-8')
documents = loader.load()
# 2. 切分文档
text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
texts = text_splitter.split_documents(documents)
# 3. 创建向量库
embeddings = OpenAIEmbeddings()
vectorstore = Chroma.from_documents(texts, embeddings)
# 4. 创建检索器
retriever = vectorstore.as_retriever(search_kwargs={"k": 3})
# 5. 创建问答链
qa_chain = RetrievalQA.from_chain_type(
llm=ChatOpenAI(model="gpt-4", temperature=0),
chain_type="stuff",
retriever=retriever
)
# 6. 提问
query = "公司的年假政策是什么?"
answer = qa_chain.invoke({"query": query})
print(answer["result"])
三、Skill:给LLM配备"工具箱"
3.1 什么是Skill?
它是谁?
它是 Agent 手里的 “锤子”、“扳手”、“计算器”。
为什么需要它?
LLM 虽然聪明,但它不擅长做某些具体的事情,比如:
- 精确数学计算(大模型算数很差,不如调个计算器)。
- 获取实时天气(需要调天气 API)。
- 操作 Excel(需要调 Python 脚本)。
- 画图(需要调绘图模型)。
Skill 就是把这些具体的能力封装成函数或 API,让 Agent 可以随时调用。
Skill(技能) 就是让LLM能够调用外部工具的能力。
如果说RAG是给LLM"补充知识",那Skill就是给LLM"赋予能力"。
3.2 常见的Skill类型
| 类型 | 示例 | 用途 |
|---|---|---|
| 搜索工具 | Google Search、Bing API | 获取实时信息 |
| 计算工具 | Python解释器、Wolfram Alpha | 精确计算 |
| 数据库工具 | SQL查询、MongoDB | 数据操作 |
| 文件工具 | 读写文件、处理Excel | 文档处理 |
| API工具 | 天气API、股票API | 获取外部数据 |
| 浏览器工具 | Puppeteer、Selenium | 网页操作 |
3.3 Skill的工作原理
用户:"北京今天天气怎么样?" ↓LLM分析:需要获取实时天气信息 ↓LLM决定:调用天气查询Skill ↓执行Skill:调用天气API获取数据 ↓LLM生成:"北京今天晴,25°C..."
四、Agent:让AI成为"智能体"
4.1 什么是Agent?
Agent,智能体。这是目前最让人兴奋的概念!
它是谁?
如果说 LLM 是“大脑”,RAG 是“书”,那 Agent 就是 “一个完整的人”。它不仅有大脑,还有 手(Tools) 和 耳目(Sensors)。
它能做什么?
Agent 不仅仅是“回答问题”,它的核心是 “行动 (Action)”。
它能根据你的目标,自主拆解任务,调用工具,一步步完成工作。
Agent(智能体) 是AI的终极形态。
举个栗子 🌰:
你对deepseek说:“帮我订一张明天去北京的机票。”
- 纯 LLM:只能告诉你怎么订票,或者给你写一段订票的代码。
- Agent:
- 思考:需要先查航班,再选时间,最后支付。
- 行动 1:调用“携程 API”查询航班。
- 行动 2:发现余额不足(假设),调用“提醒工具”告诉你。
- 行动 3:最终帮你下单。
它不仅能理解、能生成,还能:
- 🧠 自主规划:分解复杂任务,制定执行计划
- 🔄 循环执行:多步骤任务自动推进
- 🛠️ 工具调用:灵活使用各种Skill
- 💾 记忆管理:记住对话历史和中间结果
4.2 Agent的核心架构
一个完整的Agent通常包含四大核心模块:Planning(规划)、Memory(记忆)、Tools(工具)、Action(执行),通过ReAct模式循环迭代完成任务。

4.3 ReAct:Agent的经典范式
ReAct(Reasoning + Acting) 是Agent最常用的工作模式:
Thought(思考)→ Action(行动)→ Observation(观察)→ ... → Answer(回答)
示例:
用户:"苹果公司今年的营收是多少?"思考: 我需要搜索苹果公司最新的财务报告行动: 调用搜索工具,搜索"Apple revenue 2025"观察: 找到Apple 2025 Q4财报,营收xxx亿美元思考: 我已经找到了答案行动: 生成最终回答观察: 苹果公司2025年营收为xxx亿美元...
4.4 LangChain实现Agent
from langchain.agents import Tool, AgentExecutor, create_react_agent
from langchain_openai import ChatOpenAI
from langchain_community.utilities import SerpAPIWrapper
from langchain.chains import LLMMathChain
# 准备工具
search = SerpAPIWrapper()
llm = ChatOpenAI(model="gpt-4", temperature=0)
llm_math_chain = LLMMathChain(llm=llm)
tools = [
Tool(
name="Search",
func=search.run,
description="用于搜索实时信息"
),
Tool(
name="Calculator",
func=llm_math_chain.run,
description="用于数学计算"
)
]
# 创建Agent
agent = create_react_agent(llm, tools)
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)
# 运行
agent_executor.invoke({"input": "苹果公司CEO是谁?他今年多大了?"})
五、四者关系:一张图看懂


💡 干货总结
| 概念 | 形象比喻 | 核心作用 | 关键词 |
|---|---|---|---|
| LLM | 大脑 🧠 | 理解、推理、生成 | 通用、思考 |
| RAG | 图书馆 📚 | 提供准确、私有的知识 | 检索、上下文 |
| Skill | 工具箱 🛠️ | 执行具体操作、弥补短板 | API、函数 |
| Agent | 完整的人 🤖 | 自主规划、完成复杂任务 | 规划、行动 |
六、实际应用场景
6.1 智能客服机器人
用户:"我的订单什么时候到?"Agent分析:需要查询订单信息 ↓调用Skill:查询订单数据库 ↓获取结果:预计明天送达 ↓生成回复:"您的订单预计明天送达..."
6.2 企业知识助手
用户:"公司的报销流程是什么?"RAG检索:从知识库找到报销手册 ↓LLM理解:提取关键步骤 ↓生成回复:分步骤说明报销流程
6.3 编程助手
用户:"帮我写一个Python爬虫"Agent规划: 1. 分析需求 2. 编写代码 3. 解释代码 ↓调用Skill:代码生成 + 代码解释 ↓输出:完整代码 + 使用说明
写在最后
AI技术日新月异,LLM、Agent、RAG、Skill只是开始。
作为开发者,我们要做的是:
- 保持学习:关注最新技术动态
- 动手实践:纸上得来终觉浅
- 解决问题:用AI解决实际业务问题
普通人如何抓住AI大模型的风口?
领取方式在文末
为什么要学习大模型?
目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。
目前,开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景,其中,应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。
随着AI大模型技术的迅速发展,相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业:
人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!
最后
只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!
在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。
真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发
【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】
大模型全套学习资料展示
自我们与MoPaaS魔泊云合作以来,我们不断打磨课程体系与技术内容,在细节上精益求精,同时在技术层面也新增了许多前沿且实用的内容,力求为大家带来更系统、更实战、更落地的大模型学习体验。

希望这份系统、实用的大模型学习路径,能够帮助你从零入门,进阶到实战,真正掌握AI时代的核心技能!
01 教学内容

-
从零到精通完整闭环:【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块,内容比传统教材更贴近企业实战!
-
大量真实项目案例: 带你亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事!
02适学人群
应届毕业生: 无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。
零基础转型: 非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界。
业务赋能突破瓶颈: 传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型。

vx扫描下方二维码即可
【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】
本教程比较珍贵,仅限大家自行学习,不要传播!更严禁商用!
03 入门到进阶学习路线图
大模型学习路线图,整体分为5个大的阶段:
04 视频和书籍PDF合集

从0到掌握主流大模型技术视频教程(涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向)

新手必备的大模型学习PDF书单来了!全是硬核知识,帮你少走弯路(不吹牛,真有用)
05 行业报告+白皮书合集
收集70+报告与白皮书,了解行业最新动态!
06 90+份面试题/经验
AI大模型岗位面试经验总结(谁学技术不是为了赚$呢,找个好的岗位很重要)

07 deepseek部署包+技巧大全

由于篇幅有限
只展示部分资料
并且还在持续更新中…
真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发
【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)