小白程序员必看：收藏这份 Prompt、Skills、AI Agent、MCP 核心指南，轻松入门大模型开发

不秃头de程序猿

685人浏览 · 2026-03-17 11:09:44

不秃头de程序猿 · 2026-03-17 11:09:44 发布

本文档系统介绍 Prompt、Skills、AI Agent、MCP 等核心概念，帮助读者建立清晰的能力地图，理解「会思考、能动手」的 AI Agent 是如何构成的。

一、什么是 Prompt

1.1 定义

Prompt（提示词）是用户或系统发给大语言模型（LLM）的文本输入，用于引导模型生成期望的输出。它可以是问题、指令、上下文或示例的组合。

1.2 示例

示例 1：简单问答

用户：北京今天天气怎么样？

→ 模型根据问题直接回答。

示例 2：带角色设定的 Prompt

你是一位资深 Python 工程师，擅长代码重构。请用简洁、可读的方式改写以下代码。

→ 模型按「资深工程师」角色和「简洁可读」要求输出。

示例 3：Few-shot 示例 Prompt

将以下日期转为 ISO 格式：
输入：2024年3月10日 → 输出：2024-03-10
输入：三月十五 → 输出：2024-03-15
输入：明年春节 → 输出：2025-01-29
请转换：下周五

→ 模型通过示例学习格式，再处理新输入。

示例 4：长指令 Prompt（System Prompt）

你是一个代码审查助手。审查时请：
1. 检查逻辑正确性和边界情况
2. 检查安全漏洞（SQL 注入、XSS 等）
3. 检查代码风格是否符合 PEP8
4. 输出格式：🔴 严重问题 / 🟡 建议 / 🟢 可选优化

→ 模型按结构化指令执行代码审查。

二、什么是 Skills

2.1 定义

Skills是持久化、模块化的能力文档，以 Markdown 文件（如SKILL.md）形式存储，描述 AI Agent 在特定场景下应遵循的步骤、规范、模板和领域知识。Skills 可被 Agent 按需加载，作为扩展能力使用。

2.2 示例

示例：Code Review Skill 的 SKILL.md

```markdown
---
name: code-review
description: 按团队规范进行代码审查。在用户请求 code review、审查 PR、检查代码质量时使用。
---
# Code Review
## 审查清单
- [ ] 逻辑正确，处理边界情况
- [ ] 无安全漏洞
- [ ] 符合项目代码风格
- [ ] 函数职责单一
## 输出格式
- 🔴 严重：必须修复
- 🟡 建议：建议改进
- 🟢 可选：锦上添花

当用户说「帮我 review 这段代码」时，Agent 会加载该 Skill，按清单和格式输出审查结果。

2.3 Prompt 与 Skills 的异同

维度	Prompt	Skills
本质	单次对话中的文本输入	持久化存储的能力文档
生命周期	随对话结束而消失	长期存在，可反复使用
存储位置	对话历史、内存	文件系统（`~/.cursor/skills/` 等）
复用性	每次需重新输入或复制	一次编写，多会话、多项目复用
维护	分散在对话中，难统一修改	独立文件，可版本管理、Code Review
组合	手动拼接，易冲突	多个 Skills 并存，Agent 按需选择
加载方式	用户主动输入或系统注入	Agent 根据 description 自动匹配加载
Token 消耗	每次完整注入，占用大	按需加载，节省 token
共同点	都是向 LLM 传递「如何行为」的指令	本质都是「可执行的指令集」

打比方说明：

•Prompt像口头交代：你临时跟同事说「这次报告要加图表、用蓝色主题」。说完就没了，下次要再说一遍，别人也不知道你之前怎么说的。•Skills像岗位手册：把「报告格式规范」写成文档，放在公司 wiki 里。谁需要谁查，可反复用，还能一起改、一起审。

类比	Prompt	Skills
生活	口头交代 vs 书面说明书	口头说完就忘 vs 说明书随时可查
做饭	每次临时说「少放盐」 vs 菜谱上写「盐 3 克」	菜谱可反复用、可分享
开车	乘客临时指路 vs 导航里的路线	导航可保存、可复用到其他行程

结论：Skills 是「持久化、模块化、可维护的 Prompt」，更适合作为 Agent 的长期能力扩展。

三、什么是 AI Agent

3.1 定义

AI Agent（智能体）是一个能感知环境、做出决策、执行动作的智能系统。它通常基于 LLM，具备：

•推理：分析问题、规划步骤•工具调用：读写文件、执行代码、调用 API•记忆：利用对话历史、上下文•多轮交互：根据反馈持续迭代

3.2 示例

示例 1：Cursor Agent

•用户：「帮我重构这段代码，去掉冗余」•Agent 感知：打开项目 → 定位文件 → 分析代码 → 调用编辑工具修改 → 运行测试验证•输出：重构后的代码 + 修改说明

示例 2：客服 Agent

•用户：「帮我查订单 12345 的物流」•Agent 感知：解析意图 → 调用订单 API → 调用物流 API → 组织回复•输出：订单状态 + 物流信息

示例 3：数据分析 Agent

•用户：「分析 sales.csv 的销售趋势」•Agent 感知：读取文件 → 解析数据 → 调用 Python 执行分析 → 生成图表•输出：分析报告 + 图表

3.3 AI Agent 与 Skills 的异同

维度	AI Agent	Skills
本质	可执行任务的智能体（系统）	能力描述文档（配置）
组成	LLM + 工具 + 记忆 + 编排逻辑	Markdown 文本 + 元数据
职责	感知、决策、执行、反馈	定义「如何做」的规范与步骤
关系	Agent 使用 Skills 增强能力	Skills 被 Agent 加载和应用
类比	工程师	岗位说明书、SOP、检查清单

打比方说明：

•AI Agent像会干活的工程师：能看需求、做规划、动手执行、根据结果调整。•Skills像岗位手册和 SOP：规定「这类事该怎么做」——工程师按手册执行，手册本身不会动。

类比	AI Agent	Skills
医院	医生（问诊、开药、做检查）	诊疗指南、用药规范
餐厅	厨师（做菜、摆盘、上菜）	菜谱、出品标准
工厂	工人（操作机器、质检）	操作规程、质检清单

结论：Agent 是「执行者」，Skills 是「能力扩展包」。Agent 根据任务匹配 Skills，按 Skills 中的规范执行。

3.4 AI Agent 与 LLM 的异同

维度	LLM	AI Agent
本质	大语言模型，文本输入→文本输出	智能体，可感知、决策、执行、反馈
能力	理解、生成、推理（纯文本）	理解 + 规划 + 工具调用 + 多轮交互
输入	文本 Prompt	文本 + 环境状态 + 工具返回
输出	文本	文本 + 工具调用指令 + 动作
边界	不能直接操作外部世界	可读写文件、执行代码、调用 API
核心关系	Agent 的「大脑」	以 LLM 为核心，外挂工具与记忆

打比方说明：

•LLM像只会动脑的顾问：你问问题，他给答案，但不会亲自去查资料、改文件、发邮件。•AI Agent像带助理的顾问：顾问负责思考，助理负责执行——查资料、改文件、发邮件，再把结果反馈给顾问。

类比	LLM	AI Agent
导航	只告诉你「往东走」	告诉你路线，还帮你查实时路况、订酒店
医生	只回答「可能是什么病」	开检查单、看报告、开药、安排复诊
程序员	只写代码	读需求、写代码、跑测试、修 bug

核心关系：LLM 是 Agent 的推理引擎，Agent = LLM + 规划能力 + 工具调用 + 记忆。没有 LLM，Agent 无法理解自然语言、做复杂推理；没有工具和规划，LLM 只是「会说话的模型」，不是「能行动的智能体」。

四部分重要性排序：

排名	组件	重要性	说明
1	LLM	灵魂 / 大脑	提供理解、推理、决策。没有 LLM 就没有「智能」，只是规则自动化
2	工具	四肢 / 行动力	让 Agent 能「做事」。没有工具，LLM 只是会说话的聊天机器人
3	规划	调度 / 编排	拆解任务、决定步骤。多由 LLM 完成，或由编排逻辑配合 LLM
4	记忆	上下文 / 延续性	保存对话、状态，支持多轮交互。能增强体验，但非必需

打比方：

•LLM= 灵魂：决定「会不会想、能不能懂」•工具= 双手：决定「能不能做」•规划= 做事顺序：决定「先做什么、后做什么」•记忆= 记事本：决定「记不记得住之前的事」

结论：LLM 是 Agent 的灵魂。没有 LLM，其余三者只是「无脑自动化」；有了 LLM，工具、规划、记忆才有意义。

3.5 为什么 AI Agent 一定要用 LLM？

常见误解：「把规划能力、工具调用能力组装起来，不就能形成 Agent 了吗？为什么非要 LLM？」

问题在于：谁来「规划」？谁来「决定调用什么工具」？

若不用 LLM	面临的困难
规则引擎	需要穷举所有「用户意图 → 动作」的规则，无法覆盖自然语言的千变万化
传统 NLP	意图识别、槽位填充依赖大量标注数据，难以泛化到新任务
硬编码流程	只能处理「查订单」「查物流」等固定流程，无法应对「帮我查一下 12345 的订单，顺便看看物流到哪了」这类组合、模糊需求
关键词匹配	无法理解「这个有点慢」是在抱怨性能，还是想优化代码

LLM 的不可替代作用：

1.理解自然语言：用户怎么说都能理解，不必事先定义所有说法2.泛化推理：没见过的新任务也能合理拆解、规划3.上下文理解：能结合对话历史、当前状态做决策4.灵活规划：根据工具返回结果动态调整下一步，而不是写死流程

打比方：

•纯规划 + 工具调用：像「自动售货机」——按固定流程：投币 → 选货 → 出货。流程是写死的，不能理解「我渴了想喝点凉的」。•LLM + 规划 + 工具：像「服务员」——听到「我渴了想喝点凉的」会理解意图，选择饮料、加冰、端上来，还能根据你的反馈调整。

结论：规划能力、工具调用能力是 Agent 的「四肢」，LLM 是「大脑」。没有大脑，四肢无法理解「何时、为何、如何」行动；没有大脑，Agent 只能做固定流程的自动化，无法应对开放、多变的自然语言任务。

四、什么是 MCP

4.1 定义

MCP（Model Context Protocol，模型上下文协议）是由 Anthropic 提出的开放标准，用于将 AI 应用与外部系统（数据源、工具、工作流）进行标准化连接。可将其类比为「AI 应用的 USB-C 接口」——正如 USB-C 统一了设备连接方式，MCP 统一了 AI 系统与数据库、API、文件系统等外部资源的连接方式。

4.2 核心能力

MCP 使 AI 助手（如 Claude、ChatGPT、Cursor）能够：

•连接数据源：本地文件、数据库、云存储•调用工具：搜索引擎、计算器、业务 API•访问工作流：专用 Prompt 模板、多步骤流程

典型场景：

•企业聊天机器人连接多个数据库，用户通过对话分析数据•Agent 访问 Google Calendar、Notion，成为个性化助理•开发工具（如 Cursor）通过 MCP 连接 Hologres、MaxCompute 等数据服务

4.3 MCP 与 Skills 的异同

维度	MCP	Skills
本质	连接协议 + 可执行工具/资源	能力描述文档（纯文本指令）
形式	服务端（Server）暴露 Tools、Resources、Prompts	Markdown 文件（SKILL.md）
能力类型	可执行：调用 API、查数据库、读写文件	指导性：告诉 Agent「如何做」的步骤与规范
实现方式	需编写代码（Python/TypeScript 等），实现 MCP Server	纯 Markdown 编写，无需编程
协议	基于 JSON-RPC 的标准化协议（tools/list、tools/call）	无协议，由 Cursor 等客户端解析
生态	一次开发，可接入 Claude、ChatGPT、Cursor、VS Code 等	主要面向 Cursor 等特定平台
复用性	跨平台、跨应用复用	平台内复用
共同点	都是扩展 Agent 能力的机制	都可被 Agent 按需加载使用

打比方说明：

•Skills像岗位手册：告诉 Agent「这类事该怎么做」——步骤、清单、格式。Agent 按手册思考、输出，但不会直接操作外部系统。•MCP像工具箱 + 接线规范：提供真实可调用的工具（查数据库、发邮件、调 API），并规定统一的「插口」标准，让不同 AI 应用都能接入同一套工具。

类比	Skills	MCP
医院	诊疗指南（告诉医生怎么判断）	检查仪器（心电图机、CT，真实执行检查）
餐厅	菜谱（告诉厨师步骤）	烤箱、灶台（真实执行烹饪）
开发	代码规范文档	终端、Git、数据库客户端（真实执行命令）

结论：Skills 是「指导 Agent 如何思考与输出」的文档；MCP 是「让 Agent 能真实调用外部系统」的协议与工具。二者互补：Skills 定义规范，MCP 提供执行能力。

4.4 MCP 与 Skills 的协作

在实际使用中，Agent 可同时使用 Skills 和 MCP：

•Skills：定义「查数据库时该遵循的规范」「输出格式要求」•MCP：提供「实际执行 SQL 查询」「调用 API」的工具

例如：用户说「帮我查一下 Hologres 里最近 7 天的订单趋势」——Agent 加载「数据分析」Skill 获取分析步骤与输出格式，同时通过 MCP 的 Hologres 工具执行查询，再将结果按 Skill 规范组织输出。

五、总结

概念	打比方
Prompt	口头交代——说完就忘
Skills	岗位手册——写下来随时可查、可复用
MCP	工具箱和统一插口——让 Agent 能真正动手操作外部系统
LLM	Agent 的大脑——负责理解和决策
AI Agent	带着大脑、手册和工具箱的工程师——既能想，又能按规范做，还能调用真实工具完成任务

普通人如何抓住AI大模型的风口？

领取方式在文末

为什么要学习大模型？

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用，大模型作为其中的重要组成部分，正逐渐成为推动人工智能发展的重要引擎。大模型以其强大的数据处理和模式识别能力，广泛应用于自然语言处理、计算机视觉、智能推荐等领域，为各行各业带来了革命性的改变和机遇。

目前，开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景，其中，应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。
在这里插入图片描述

随着AI大模型技术的迅速发展，相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业：
在这里插入图片描述

人工智能大潮已来，不加入就可能被淘汰。如果你是技术人，尤其是互联网从业者，现在就开始学习AI大模型技术，真的是给你的人生一个重要建议！

最后

只要你真心想学习AI大模型技术，这份精心整理的学习资料我愿意无偿分享给你，但是想学技术去乱搞的人别来找我！

在当前这个人工智能高速发展的时代，AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长，真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料，能够帮助更多有志于AI领域的朋友入门并深入学习。

真诚无偿分享！！！
vx扫描下方二维码即可
加上后会一个个给大家发
【附赠一节免费的直播讲座，技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等，欢迎大家~】
在这里插入图片描述

大模型全套学习资料展示

自我们与MoPaaS魔泊云合作以来，我们不断打磨课程体系与技术内容，在细节上精益求精，同时在技术层面也新增了许多前沿且实用的内容，力求为大家带来更系统、更实战、更落地的大模型学习体验。

希望这份系统、实用的大模型学习路径，能够帮助你从零入门，进阶到实战，真正掌握AI时代的核心技能！

01 教学内容

在这里插入图片描述

从零到精通完整闭环：【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块，内容比传统教材更贴近企业实战！
大量真实项目案例： 带你亲自上手搞数据清洗、模型调优这些硬核操作，把课本知识变成真本事‌！

02适学人群

应届毕业生‌： 无工作经验但想要系统学习AI大模型技术，期待通过实战项目掌握核心技术。

零基础转型‌： 非技术背景但关注AI应用场景，计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能突破瓶颈： 传统开发者（Java/前端等）学习Transformer架构与LangChain框架，向AI全栈工程师转型‌。

vx扫描下方二维码即可
【附赠一节免费的直播讲座，技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等，欢迎大家~】
在这里插入图片描述

本教程比较珍贵，仅限大家自行学习，不要传播！更严禁商用！

03 入门到进阶学习路线图

大模型学习路线图，整体分为5个大的阶段：

04 视频和书籍PDF合集

从0到掌握主流大模型技术视频教程（涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向）

新手必备的大模型学习PDF书单来了！全是硬核知识，帮你少走弯路（不吹牛，真有用）

05 行业报告+白皮书合集

收集70+报告与白皮书，了解行业最新动态！

06 90+份面试题/经验

AI大模型岗位面试经验总结（谁学技术不是为了赚$呢，找个好的岗位很重要）
在这里插入图片描述

07 deepseek部署包+技巧大全

在这里插入图片描述

由于篇幅有限

只展示部分资料

并且还在持续更新中…

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

深度解析BestBlogs开源项目：基于GitHub Actions自动化构建个人技术博客与内容聚合平台的实战指南

BestBlogs项目以其巧妙的架构设计，将GitHub强大的开发者工具链转化为内容创作的利器。它通过GitHub Issues实现了极简的内容管理，利用GitHub Actions达成了极致的自动化体验，让开发者能够专注于内容本身，而非繁琐的运维工作。无论你是想建立一个纯粹的技术笔记库，还是打造一个具有行业影响力的技术聚合站，BestBlogs都提供了一个低成本、高效率且极具极客精神的解决方案。

AtomGit开源社区

白嫖启智社区（OpenI）50点卡（低级卡有50卡时)的方法支持各个国产算力卡和nvidia的卡

【摘要】DeepSpark（deepspark.org.cn/GitHub）与启智社区（openi.org.cn）是两个提供国产算力资源的开源平台。启智云脑（cloud.openi.org.cn）提供天垓100等国产算力租借服务，新用户注册可获赠50卡时算力（需通过推荐链接注册）。注册地址为openi.pcl.ac.cn，推荐人yanggg1133。平台支持多种异构算力（GPU/NPU/GCU等）