AI小白必看:一文搞懂Agent、LLM、Prompt等核心概念,轻松入门大模型世界(收藏版)
本文旨在帮助初学者理解AI领域的关键术语,如人工智能(AI)、大语言模型(LLM)、提示词(Prompt)、智能体(Agent)、工作流(Workflow)、技能(Skill)、检索增强生成(RAG)等。文章通过比喻和实例,解释了这些概念的定义、功能及其相互关系,并探讨了AI的当前发展方向,如AI原生产品、自主AI、多模态AI等。此外,还介绍了MVP(最小可行产品)的概念及其在AI产品开发中的应用。通过阅读本文,读者能够更好地理解AI技术,为实际应用打下基础。
01 什么是AI(人工智能)?
AI,全称 Artificial Intelligence,人工智能。
简单说:让机器表现出「类人智能」的技术总称。
包括:让机器看懂图像、听懂语音、读懂文字、做出决策……凡是原本需要人类智力才能完成的事,AI都在尝试接管。

AI不是一个单一技术,它是一个大家族,下面还有很多分支:
- 机器学习(Machine Learning):让机器从数据中自动学习规律
- 深度学习(Deep Learning):用多层神经网络模拟人脑思维
- 自然语言处理(NLP):让机器理解和生成人类语言
- 计算机视觉(CV):让机器看懂图片和视频
💡 一个比喻AI是一栋大楼,机器学习是里面的一层楼,深度学习是这层楼的一个房间,而GPT、Claude这类大语言模型,则是住在这个房间里的明星租客。
我们现在热议的AI,大多数时候指的是以大语言模型为代表的「生成式AI」——能聊天、能写作、能生成图片和代码的那种。
02 什么是LLM(大语言模型)?
LLM = Large Language Model,大语言模型。
它是当前AI浪潮的核心引擎。你每天用的ChatGPT、Claude、文心一言,本质上都是LLM。
LLM是怎么运作的?
LLM是用海量文本训练出来的。简单说,就是让模型读完了互联网上绝大多数的文字——书籍、新闻、代码、论文——然后学会了预测「下一个词应该是什么」。
训练结束后,模型就有了惊人的能力:回答问题、写代码、总结文档、翻译语言……但说到底,它做的事是**「非常高级的文字接龙」**。
几个关键概念
- Token(词元):LLM处理文字的最小单位。不是字,不是词,大约1个中文汉字 ≈ 1-2个Token。
- Context Window(上下文窗口):模型一次能「记住」的内容长度。越大越贵,也越聪明。
- Hallucination(幻觉):模型自信地说了错误信息。这是LLM的天然局限,要注意甄别。
⚠️ 关于幻觉LLM不会「承认自己不知道」,它会选择编一个听起来合理的答案。这就是为什么验证很重要,尤其是在专业领域。
03 什么是Prompt(提示词)?
Prompt,就是你给AI的指令或问题——是你和AI对话的输入内容。
听起来很简单?但Prompt的质量,直接决定AI输出的质量。
Prompt Engineering(提示工程)
围绕如何写出高质量Prompt,已经发展出了一门学问,叫「提示工程」。
核心原则:
- 清晰具体:不要说「帮我写篇文章」,要说「帮我写一篇500字的科普文章,面向中学生,介绍黑洞」
- 赋予角色:「你是一位资深产品经理,请帮我……」
- 给出示例:「按照这个格式输出:……」
- 分步引导:「先分析,再给出结论」
System Prompt(系统提示词)
这是藏在产品底层、用户看不到的Prompt。它决定了AI的角色设定、行为规则、回答风格。你用的每一个AI产品,背后都有一段精心设计的System Prompt在控制它的行为。
04 什么是Agent(智能体)?
Agent,是当前AI领域最热的概念之一。
简单定义:一个能感知环境、自主决策、并采取行动以完成目标的AI系统。
如果说LLM是一个「大脑」,那Agent就是把这个大脑装进了一个能行动的身体里。
🤖 LLM vs Agent 的核心区别
LLM:你问一个问题,它给一个答案,就结束了。
Agent:你给它一个目标,它会自己拆解任务、调用工具、循环执行,直到完成目标。

Agent有哪些核心能力?
- 感知(Perception):能读取文件、搜索网页、获取数据
- 推理(Reasoning):能分析问题、制定计划、判断下一步
- 行动(Action):能调用工具、写代码并执行、操作软件
- 记忆(Memory):能记住上下文,甚至跨会话保留信息

Multi-Agent(多智能体)
当一个任务太复杂,单个Agent搞不定时,就会出现Multi-Agent架构——多个专门的Agent分工协作,就像一支团队。
比如:一个Agent负责搜索信息,一个负责分析数据,一个负责写报告,最后一个负责审核质量。它们协作完成一个复杂任务。
05 什么是工作流(Workflow)?
工作流,是将一系列任务按逻辑顺序连接起来的执行流程。
在AI语境里,工作流通常描述AI完成一项复杂任务的步骤设计。
为什么需要工作流?
因为现实中的任务很少是一步完成的。比如「分析一份竞品报告」:
- 搜索竞品官网和最新动态
- 提取关键信息(功能、价格、用户评价)
- 与自家产品进行对比分析
- 生成结构化报告
- 发送给指定人员
把这五步串起来,就是一个AI工作流。
Workflow vs Agent 的关系
两者经常一起出现,但有所区别:
- 工作流更强调「流程的设计」,是静态的步骤规划
- Agent更强调「自主的执行」,是动态的决策过程
现代AI应用,往往是两者结合:用工作流定义大框架,在每个节点上跑一个Agent来完成具体工作。
06 什么是Skill(技能)?
Skill,指的是AI能调用的具体能力模块,也常叫 Tool(工具)。
你可以把它理解为:Agent工具箱里的每一个工具。
常见的Skill类型
- 搜索技能:让AI能实时上网搜索信息
- 代码执行:让AI能写代码并运行,处理数据
- 文件读取:让AI能读取PDF、Excel、Word等文档
- API调用:让AI能与外部系统对接,如日历、邮件、CRM
- 图像生成:让AI能生成图片
- 数据库查询:让AI能从数据库中检索信息
🔧 一个类比如果Agent是一位全能助理,那Skill就是他的技能列表。没有「联网搜索」这个Skill,他就只能从记忆里说话;有了「发邮件」这个Skill,他才能真的帮你发出去。
Function Calling 和 MCP
这是两个和Skill密切相关的技术词:
- Function Calling:OpenAI提出的标准,让LLM能准确地调用外部函数/API
- MCP(Model Context Protocol):Anthropic主导推出的开放协议,让模型能以标准方式连接各种外部工具和数据源,是未来Agent生态的重要基础
07 什么是RAG(检索增强生成)?
RAG = Retrieval-Augmented Generation,检索增强生成。
解决的问题:LLM的知识是有截止日期的,它不知道你公司的内部文件,也不知道昨天的新闻。
RAG的思路:在AI回答问题之前,先去外部知识库里搜索相关内容,再把搜到的内容塞给AI,让它基于这些内容来回答。
📚 RAG工作流程用户提问 → 系统去知识库搜索相关片段 → 将片段和问题一起交给LLM → LLM基于这些资料生成回答
RAG是企业落地AI最常用的方案之一,尤其适合:客服机器人(基于产品手册回答)、企业知识库问答、内部文件检索等场景。

相关技术词:
- Embedding(向量化):将文字转为数字向量
- Vector DB(向量数据库):存储和检索这些向量的专用数据库
08 什么是Fine-tuning(微调)?
Fine-tuning,是在一个已有的大模型基础上,用特定领域的数据进行再训练,让模型在这个领域表现更好。
通俗比喻:通用大模型就像一个「全科医生」,经过Fine-tuning,可以变成专业的「心脏科专家」。
Fine-tuning vs RAG,该怎么选?
- RAG:适合需要实时更新、内容经常变化的场景(如产品文档、新闻资讯)。成本低、实现快。
- Fine-tuning:适合需要模型学习特定风格、语气、或高度专业知识的场景(如特定行业的专业术语)。成本高、效果稳。
- 两者结合:先Fine-tuning训练专业知识,再用RAG补充实时信息——这是很多企业级AI产品的做法。
09 什么是MVP(最小可行产品)?
MVP = Minimum Viable Product,最小可行产品。
这是一个来自创业领域的经典概念,在AI产品开发中被广泛使用。
核心思想:不要追求完美,用最少的功能、最快的速度,验证你的核心假设是否成立。
🎯 **MVP不是「不完整的产品」**MVP是「最精准验证核心价值的产品」。它的目标不是上线所有功能,而是以最小成本找到答案:用户真的需要这个吗?
为什么AI产品特别需要MVP思维?
- AI功能开发成本高、周期长,错误方向代价很大
- 用户对AI能力的预期模糊,必须用真实反馈校准
- AI能力边界不清晰,需要在实际场景中迭代发现问题
MVP的三个步骤
- 定义核心假设:「如果做了X功能,用户会产生Y行为」
- 最快速度验证:砍掉一切不必要的功能,上线核心功能
- 收集真实反馈:不是问卷,而是真实使用数据和用户行为
10 这些概念的关系是什么?
读完前面这些,你可能会好奇:这些概念怎么连在一起?我用一个场景串联起来:
🏢 场景:一家公司要用AI自动处理客户投诉
① AI(技术底座):整个系统建立在AI能力之上
② LLM(大脑):选用一个大语言模型作为核心引擎
③ Prompt(指令):为客服场景精心设计系统提示词
④ RAG(知识库):接入公司产品手册,让AI能准确回答
⑤ Skill(工具箱):赋予AI查订单、发邮件、记录CRM的能力
⑥ Agent(执行者):整合以上能力,能自主完成投诉处理全流程
⑦ Workflow(流程设计):设计「收到投诉→分类→查单→回复→记录」的步骤
⑧ MVP(验证方式):先在一个城市试运行,收集数据再迭代
这些概念不是孤立的,而是像乐高积木一样,一层一层搭建出来的。
11 AI当前有哪些主要发展方向?
🤖 AI Native 产品
不是给传统产品「加个AI功能」,而是从一开始就以AI为核心来设计产品。代表:Cursor(AI代码编辑器)、Notion AI、Perplexity(AI搜索引擎)。
🦾 Autonomous AI(自主AI)
AI能在几乎不需要人工干预的情况下,独立完成长周期、复杂任务。这是Agent发展的终极形态,也是当前最热的研究和创业方向。
👁 Multimodal(多模态)
AI不再只懂文字,而是能同时处理图片、视频、语音、代码……GPT-4V、Gemini、Claude都是典型的多模态模型。
🏭 AI Ops & 企业落地
用AI优化企业内部运营:自动化流程、智能客服、数据分析助手……这是当前AI商业化最成熟的路径。
🛡 AI Alignment(对齐)与 Guardrails(护栏)
随着AI越来越强大,如何确保它按人类意图行事(对齐),如何防止它输出有害内容(护栏),成为越来越重要的研究方向。
🌐 AGI(通用人工智能)
AI的终极目标——一个能像人类一样完成任何智力任务的AI。我们还没到那一步,但OpenAI、Anthropic、DeepMind都在朝这个方向努力。

总结:一张概念速查表
| 名词 | 英文 | 一句话记住它 |
|---|---|---|
| 人工智能 | AI | 让机器模拟人类智能的技术总称 |
| 大语言模型 | LLM | 能理解和生成文字的AI核心引擎,如GPT、Claude |
| 提示词 | Prompt | 你给AI的指令,质量直接影响输出效果 |
| 智能体 | Agent | 能自主感知、决策、行动以完成目标的AI系统 |
| 多智能体 | Multi-Agent | 多个Agent分工协作完成复杂任务 |
| 工作流 | Workflow | 将多步骤任务串联起来的执行流程设计 |
| 技能/工具 | Skill / Tool | Agent能调用的具体能力模块 |
| 检索增强生成 | RAG | 先搜索知识库再回答,让AI能用最新信息 |
| 微调 | Fine-tuning | 在通用大模型上用专领域数据再训练 |
| 最小可行产品 | MVP | 用最少功能最快速度验证核心假设的产品 |
| 提示工程 | Prompt Engineering | 优化Prompt以获得更好AI输出的方法论 |
| 幻觉 | Hallucination | AI自信地说了错误信息,是LLM的天然局限 |
附录:AI领域常见专业名词速查
按方向分类整理,可作为日常参考词典。
🧠 基础概念层
| 名词 | 英文 | 简说 |
|---|---|---|
| 人工智能 | AI | 机器模拟人类智能的技术大家族 |
| 机器学习 | Machine Learning | 让机器从数据中自动学习规律 |
| 深度学习 | Deep Learning | 基于多层神经网络的机器学习方法 |
| 大语言模型 | LLM | 如GPT、Claude,能理解和生成文字的大模型 |
| 神经网络 | Neural Network | 模仿人脑神经元结构的计算模型 |
| 参数 | Parameter | 模型的「知识容量」,如「千亿参数」 |
| 词元 | Token | 模型处理文本的最小单位 |
| 训练 | Training | 用大量数据让模型学习的过程 |
| 推理 | Inference | 模型实际运行、生成输出的过程 |
🤖 Agent与应用层
| 名词 | 英文 | 简说 |
|---|---|---|
| 智能体 | Agent | 能自主感知、决策、行动的AI系统 |
| 多智能体 | Multi-Agent | 多个Agent协作完成任务的架构 |
| 工作流 | Workflow | 任务的多步骤执行流程设计 |
| 技能/工具 | Skill / Tool | Agent能调用的具体能力模块 |
| 提示词 | Prompt | 给AI的指令或输入 |
| 提示工程 | Prompt Engineering | 优化Prompt以获得更好结果的方法 |
| 检索增强生成 | RAG | 让AI结合外部知识库来回答问题 |
| 微调 | Fine-tuning | 在基础模型上针对特定场景再训练 |
| 函数调用 | Function Calling | 让LLM能准确调用外部函数/API的标准 |
| 模型上下文协议 | MCP | 模型调用外部工具的开放标准协议 |
🏗 产品与开发层
| 名词 | 英文 | 简说 |
|---|---|---|
| 最小可行产品 | MVP | 用最少功能验证核心价值的产品版本 |
| 接口 | API | 让不同系统互相调用能力的标准接口 |
| 管道 | Pipeline | 数据或任务的多步骤处理流水线 |
| 向量化 | Embedding | 将文字转化为数字向量以供模型处理 |
| 向量数据库 | Vector DB | 专门存储和检索Embedding的数据库 |
| 上下文窗口 | Context Window | 模型每次能「记住」的最大内容长度 |
| 系统提示词 | System Prompt | 给AI设定角色和规则的底层隐藏指令 |
| 幻觉 | Hallucination | AI自信地生成了看似合理但实际错误的内容 |
🌐 行业趋势层
| 名词 | 英文 | 简说 |
|---|---|---|
| 基础模型 | Foundation Model | 大规模预训练的通用AI模型,如GPT-4、deepseek |
| 多模态 | Multimodal | 同时处理文字、图片、语音等多种形式 |
| AI原生 | AI Native | 以AI为核心构建的产品或公司 |
| 副驾驶 | Copilot | 辅助人类工作的AI助手产品形态 |
| 自主AI | Autonomous AI | 无需人类干预、独立完成任务的AI |
| 通用人工智能 | AGI | 能像人一样完成所有任务的AI(未来目标) |
| AI对齐 | AI Alignment | 让AI行为符合人类价值观的研究方向 |
| 护栏 | Guardrails | 防止AI输出有害内容的限制机制 |
💼 商业与落地层
| 名词 | 英文 | 简说 |
|---|---|---|
| 用例 | Use Case | AI在具体场景中的应用案例 |
| 投入产出比 | ROI | 衡量AI项目商业价值的核心指标 |
| 人机协作 | Human-in-the-loop | 保留人工审核环节的AI执行流程 |
| 自动化 | Automation | AI替代重复性人工操作 |
| AI运营 | AI Ops | 用AI工具优化企业内部运营的实践 |
| 无代码/低代码 | No-code / Low-code | 无需编程即可搭建AI应用的工具平台 |
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】


为什么要学习大模型?
我国在A大模型领域面临人才短缺,数量与质量均落后于发达国家。2023年,人才缺口已超百万,凸显培养不足。随着AI技术飞速发展,预计到2025年,这一缺口将急剧扩大至400万,严重制约我国AI产业的创新步伐。加强人才培养,优化教育体系,国际合作并进是破解困局、推动AI发展的关键。


大模型入门到实战全套学习大礼包
1、大模型系统化学习路线
作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!

2、大模型学习书籍&文档
学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。

3、AI大模型最新行业报告
2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

4、大模型项目实战&配套源码
学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

5、大模型大厂面试真题
面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

适用人群

第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)