💡 导读:本文将用最通俗的语言,带你通过图文并茂的方式,彻底理解 LLM、Agent、RAG 和 Skill 的关系与应用。

适合人群:前端开发、Python 爱好者、AI 探索者

注:本文只是做科普目前AI技术热点科普,不是专业技术分享。

前言:AI时代,不懂这些你就out了


2023年被称为"AI元年",ChatGPT的出现让大语言模型(LLM)走进了大众视野。

但很快,我们发现单纯的大模型还不够:

  • ❌ 它不知道最新的新闻
  • ❌ 它不能操作你的电脑
  • ❌ 它无法完成复杂的多步骤任务

于是,Agent、RAG、Skill 这些技术应运而生。

今天,我们就来聊聊这四大核心技术。


一、LLM:AI的"大脑"

1.1 什么是LLM?

1.1 什么是LLM?

LLM (Large Language Model),也就是我们要说的“大模型”,比如deepseek、GPT、Gemini 等。

它是谁?

它是整个 AI 系统的 “大脑”。它读过几乎全互联网的书,上知天文下知地理,能写诗、能写代码、能陪你聊天。

它的超能力

  • 理解力 Max:能听懂你在说什么。
  • 生成力 Max:能快速生成高质量的文本。
  • 推理力 Max:能处理复杂的逻辑问题。

1.2 常见的LLM有哪些?

模型 公司 特点
GPT OpenAI 综合能力最强,多模态支持
Claude Anthropic 代码能力强,上下文超长
Gemini Google 多模态原生,免费额度多
DeepSeek DeepSeek 国产之光,性价比超高,推理能力强
Llama Meta 开源可商用,本地部署
文心一言 百度 中文优化,国内可用
通义千问 阿里 开源版本多,生态丰富
Kimi 月之暗面 长文本处理能力突出

1.3 LLM的局限性

虽然LLM很强大,但它有三大硬伤:

在这里插入图片描述

所以,光有 LLM 是不够的,我们需要帮手!这就引出了另外三个技术:RAG、Skill、Agent。


二、RAG:给LLM装上"知识外挂"

2.1 什么是RAG?

它是谁?

如果 LLM 是一个参加“开卷考试”的学生,那 RAG 就是他手边的 “教科书” 或者 “图书馆”

为什么要用它?

当你要问 LLM 关于“你们公司最新的考勤制度”时,LLM 肯定不知道。
这时候,RAG 的作用就来了:

  1. 检索 (Retrieve)

    :先去你们公司的文档库里,把“考勤制度”相关的段落找出来。

  2. 增强 (Augment)

    :把这些段落和你的问题一起扔给 LLM。

  3. 生成 (Generate)

    :LLM 看着这些资料,回答你的问题。

核心价值
  • 解决幻觉:有据可查,不再瞎编。
  • 数据私有化:不用把数据训练进模型,也能回答私有领域问题。
  • 实时性:文档更新了,回答自然就更新了。

2.2 RAG的工作原理

在这里插入图片描述

2.3 RAG的实际应用

  • 📚 企业知识库问答:上传公司文档,员工随时提问
  • 📖 智能客服:基于产品手册自动回答用户问题
  • 🔍 论文检索:上传论文库,快速找到相关内容
  • 💻 代码助手:基于项目代码库回答技术问题

2.4 代码示例

# 使用LangChain实现简单RAG(新版API)
from langchain_openai import OpenAIEmbeddings, ChatOpenAI
from langchain_chroma import Chroma
from langchain_text_splitters import CharacterTextSplitter
from langchain_community.document_loaders import TextLoader
from langchain.chains import RetrievalQA
# 1. 加载文档
loader = TextLoader('公司手册.txt', encoding='utf-8')
documents = loader.load()
# 2. 切分文档
text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
texts = text_splitter.split_documents(documents)
# 3. 创建向量库
embeddings = OpenAIEmbeddings()
vectorstore = Chroma.from_documents(texts, embeddings)
# 4. 创建检索器
retriever = vectorstore.as_retriever(search_kwargs={"k": 3})
# 5. 创建问答链
qa_chain = RetrievalQA.from_chain_type(
llm=ChatOpenAI(model="gpt-4", temperature=0),
chain_type="stuff",
retriever=retriever
)
# 6. 提问
query = "公司的年假政策是什么?"
answer = qa_chain.invoke({"query": query})
print(answer["result"])

三、Skill:给LLM配备"工具箱"


3.1 什么是Skill?

它是谁?

它是 Agent 手里的 “锤子”、“扳手”、“计算器”

为什么需要它?

LLM 虽然聪明,但它不擅长做某些具体的事情,比如:

  • 精确数学计算(大模型算数很差,不如调个计算器)。
  • 获取实时天气(需要调天气 API)。
  • 操作 Excel(需要调 Python 脚本)。
  • 画图(需要调绘图模型)。

Skill 就是把这些具体的能力封装成函数或 API,让 Agent 可以随时调用。
Skill(技能) 就是让LLM能够调用外部工具的能力。
如果说RAG是给LLM"补充知识",那Skill就是给LLM"赋予能力"。

3.2 常见的Skill类型

类型 示例 用途
搜索工具 Google Search、Bing API 获取实时信息
计算工具 Python解释器、Wolfram Alpha 精确计算
数据库工具 SQL查询、MongoDB 数据操作
文件工具 读写文件、处理Excel 文档处理
API工具 天气API、股票API 获取外部数据
浏览器工具 Puppeteer、Selenium 网页操作

3.3 Skill的工作原理

用户:"北京今天天气怎么样?"     ↓LLM分析:需要获取实时天气信息     ↓LLM决定:调用天气查询Skill     ↓执行Skill:调用天气API获取数据     ↓LLM生成:"北京今天晴,25°C..."

四、Agent:让AI成为"智能体"


4.1 什么是Agent?

Agent,智能体。这是目前最让人兴奋的概念!

它是谁?

如果说 LLM 是“大脑”,RAG 是“书”,那 Agent 就是 “一个完整的人”。它不仅有大脑,还有 手(Tools)耳目(Sensors)

它能做什么?

Agent 不仅仅是“回答问题”,它的核心是 “行动 (Action)”
它能根据你的目标,自主拆解任务,调用工具,一步步完成工作。
Agent(智能体) 是AI的终极形态。

举个栗子 🌰
你对deepseek说:“帮我订一张明天去北京的机票。”

  • 纯 LLM:只能告诉你怎么订票,或者给你写一段订票的代码。
  • Agent:
  1. 思考:需要先查航班,再选时间,最后支付。
  2. 行动 1:调用“携程 API”查询航班。
  3. 行动 2:发现余额不足(假设),调用“提醒工具”告诉你。
  4. 行动 3:最终帮你下单。

它不仅能理解、能生成,还能:

  • 🧠 自主规划:分解复杂任务,制定执行计划
  • 🔄 循环执行:多步骤任务自动推进
  • 🛠️ 工具调用:灵活使用各种Skill
  • 💾 记忆管理:记住对话历史和中间结果

4.2 Agent的核心架构

一个完整的Agent通常包含四大核心模块:Planning(规划)、Memory(记忆)、Tools(工具)、Action(执行),通过ReAct模式循环迭代完成任务。

4.3 ReAct:Agent的经典范式

ReAct(Reasoning + Acting) 是Agent最常用的工作模式:

Thought(思考)→ Action(行动)→ Observation(观察)→ ... → Answer(回答)

示例:

用户:"苹果公司今年的营收是多少?"思考: 我需要搜索苹果公司最新的财务报告行动: 调用搜索工具,搜索"Apple revenue 2025"观察: 找到Apple 2025 Q4财报,营收xxx亿美元思考: 我已经找到了答案行动: 生成最终回答观察: 苹果公司2025年营收为xxx亿美元...

4.4 LangChain实现Agent

from langchain.agents import Tool, AgentExecutor, create_react_agent
from langchain_openai import ChatOpenAI
from langchain_community.utilities import SerpAPIWrapper
from langchain.chains import LLMMathChain
# 准备工具
search = SerpAPIWrapper()
llm = ChatOpenAI(model="gpt-4", temperature=0)
llm_math_chain = LLMMathChain(llm=llm)
tools = [
Tool(
name="Search",
func=search.run,
description="用于搜索实时信息"
),
Tool(
name="Calculator",
func=llm_math_chain.run,
description="用于数学计算"
)
]
# 创建Agent
agent = create_react_agent(llm, tools)
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)
# 运行
agent_executor.invoke({"input": "苹果公司CEO是谁?他今年多大了?"})

五、四者关系:一张图看懂


💡 干货总结

概念 形象比喻 核心作用 关键词
LLM 大脑 🧠 理解、推理、生成 通用、思考
RAG 图书馆 📚 提供准确、私有的知识 检索、上下文
Skill 工具箱 🛠️ 执行具体操作、弥补短板 API、函数
Agent 完整的人 🤖 自主规划、完成复杂任务 规划、行动

六、实际应用场景

6.1 智能客服机器人

用户:"我的订单什么时候到?"Agent分析:需要查询订单信息   ↓调用Skill:查询订单数据库   ↓获取结果:预计明天送达   ↓生成回复:"您的订单预计明天送达..."

6.2 企业知识助手

用户:"公司的报销流程是什么?"RAG检索:从知识库找到报销手册   ↓LLM理解:提取关键步骤   ↓生成回复:分步骤说明报销流程

6.3 编程助手

用户:"帮我写一个Python爬虫"Agent规划:  1. 分析需求  2. 编写代码  3. 解释代码   ↓调用Skill:代码生成 + 代码解释   ↓输出:完整代码 + 使用说明

写在最后


AI技术日新月异,LLM、Agent、RAG、Skill只是开始。

作为开发者,我们要做的是:

  1. 保持学习:关注最新技术动态
  2. 动手实践:纸上得来终觉浅
  3. 解决问题:用AI解决实际业务问题

普通人如何抓住AI大模型的风口?

领取方式在文末

为什么要学习大模型?

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。

目前,开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景,其中,应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。
在这里插入图片描述

随着AI大模型技术的迅速发展,相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业:
在这里插入图片描述

人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!

最后

只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!

在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。

真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】
在这里插入图片描述

大模型全套学习资料展示

自我们与MoPaaS魔泊云合作以来,我们不断打磨课程体系与技术内容,在细节上精益求精,同时在技术层面也新增了许多前沿且实用的内容,力求为大家带来更系统、更实战、更落地的大模型学习体验。

图片

希望这份系统、实用的大模型学习路径,能够帮助你从零入门,进阶到实战,真正掌握AI时代的核心技能!

01 教学内容

在这里插入图片描述

  • 从零到精通完整闭环:【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块,内容比传统教材更贴近企业实战!

  • 大量真实项目案例: 带你亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

02适学人群

应届毕业生‌: 无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌: 非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能突破瓶颈: 传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

image.png

vx扫描下方二维码即可
【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】
在这里插入图片描述

本教程比较珍贵,仅限大家自行学习,不要传播!更严禁商用!

03 入门到进阶学习路线图

大模型学习路线图,整体分为5个大的阶段:
图片

04 视频和书籍PDF合集

图片

从0到掌握主流大模型技术视频教程(涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向)

图片

新手必备的大模型学习PDF书单来了!全是硬核知识,帮你少走弯路(不吹牛,真有用)
图片

05 行业报告+白皮书合集

收集70+报告与白皮书,了解行业最新动态!
图片

06 90+份面试题/经验

AI大模型岗位面试经验总结(谁学技术不是为了赚$呢,找个好的岗位很重要)图片
在这里插入图片描述

07 deepseek部署包+技巧大全

在这里插入图片描述

由于篇幅有限

只展示部分资料

并且还在持续更新中…

真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发

【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】
在这里插入图片描述

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐