本文深入解析了让AI Agent从“聊天机器人”进化为“得力干将”的关键——Skills技能包。针对Agent常见问题如规则失效、执行失控、工具迷失,文章详细阐述了Skills的概念、工作原理、设计原则及调用逻辑,并提供了官方与社区热门Skills资源推荐。通过“Spec Coding”实践案例,展示了如何利用Skills实现多角色分工协作,解决Agent混乱问题,最终让AI从“对话助手”升级为“可信赖的实干家”,实现高效精准的流程化任务处理。

1、什么是 Skills

“Skills” 这个概念最早由 Anthropic 公司提出,作为其大模型 Claude 的一种能力扩展机制。简单来说,它允许用户为 Claude 添加自定义的功能和工具。随着这套做法越来越成熟,并被社区广泛接受,Skills 如今已成为大多数 Agent 开发工具和 IDE 都支持的一种标准扩展规范。

一个 Skills 通常以一个文件夹的形式存在,里面主要装着三样东西:一份说明书(SKILL.md)、一堆操作脚本(Script)、以及一些参考资料(Reference)。

内容 作用
SKILL.md 通过自然语言描述清楚(使用场景、使用方式、使用步骤、及注意事项等上下文补充信息)
Script 脚本 Agent 可以执行的具体脚本代码
Reference 引用 参考文档,引用的模板,相关关联上下文的文件信息

你可以把一个 Skill 想象成一个打包好的“技能包”。它把完成某个特定任务所需的领域知识、操作流程、要用到的工****具、以及最佳实践全都封装在了一起。当 AI 面对相应请求时,就能像一位经验丰富的专家那样,有条不紊地自主执行。

**一句话总结:**要是把 Agent 比作一个有很大潜力的大脑,那 **Skills 就像是给这个大脑的一套套能反复用的“高级武功秘籍”。**有了它,Agent 能从一个“什么都略知一二”的通才,变成在特定领域“什么都擅长”的专家。

2、Skill 原理介绍

📚 官方解释:

https://platform.claude.com/docs/en/agents-and-tools/agent-skills/overview

Skill 的架构原理:渐进式加载

Skill 的设计很巧妙,它运行在一个沙盒环境里,这个环境允许大模型访问文件系统和执行 bash命令(可以理解为一种电脑操作指令)。在这个环境里,一个个 Skill 就像一个个文件夹。Agent 就像一个熟悉电脑操作的人,通过命令行来读取文件、执行脚本,然后利用结果去完成你交代的任务。这种“按需取用”的架构,让 Skill 成为一个既强大又高效的“工具箱”。

为了平衡效果和效率,Skill 设计了一套聪明的三层分级加载机制:

级别 加载时机 Token 消耗 内容
1 级:元数据 始终(启动时) 每个技能 约 100 Token YAML 前置元数据中的名称和描述
2 级:说明文档 技能触发时 低于 5000 Token SKILL.md 正文(包含操作指南和指导说明)
3 级及以上:资源 按需 几乎无限制 通过 bash 执行的捆绑文件(内容不加载到上下文)

Level 1:元数据(始终加载)

元数据就像是 Skill 的“名片”,里面有名称(name)和描述(description),是用 YAML 格式来定义的。Claude 在启动的时候,会把所有已经安装的 Skill 的元数据都加载进来,这样它就能知道每个 Skill 有什么用、什么时候该用。因为元数据很轻量,所以你可以安装很多 Skill,不用担心把上下文占满。

Level 2:说明文档(触发时加载)

SKILL.md文件的正文就是说明文档,里面有工作流程、最佳实践和操作指南。只有用户的请求和 Skills 元数据里的描述相符时,Claude 才会用 bash 指令读取这份文档,把内容加载到上下文里。这种“触发式加载”能保证只有相关的详细指令才会消耗 Token。

Level 3:资源与代码(按需加载)

Skills 还能打包一些更深入的资源,比如更详细的说明文档(FORMS.md)、可执行脚本(.py)或者参考资料(像 API 文档、数据库结构等)。Claude 只有在需要的时候,才会通过bash 去读取或执行这些文件,而且脚本代码本身不会进入上下文。这样一来,Skills 就能捆绑大量信息,几乎不会增加额外的上下文成本。

Skills 的调用逻辑:从理解意图到稳定执行

那么,Agent 是如何智能地选择并执行一个 Skill 的呢?整个过程就像一位经验丰富的助理在处理工作:

  1. **意图匹配(找到对的人):**Agent 首先聆听你的需求,然后快速扫一眼自己手头所有 Skill 的“名片夹”(元数据),寻找最匹配的那一张。
  2. **读取手册(看懂怎么干):**找到合适的 Skills 后,Agent 会像模像样地翻开它的“操作手册”(SKILL.md),仔细研究详细的执行步骤和注意事项。
  3. **按需执行(动手开干):**根据手册的指引,Agent 开始工作。如果需要,它会随时从“工具箱”里拿出脚本或工具来完成具体操作。
  4. **反馈结果(事毕复命):**任务完成后,Agent 向你汇报最终结果,或者在遇到困难时,及时向你请教。

3、Skills vs. 其他概念的区别

为了更清晰地理解 Skills 的独特价值,我们不妨把它和另外两个容易混淆的概念——快捷指令(Command)原子工具(MCP)——放在一起做个对比。用一个厨房的例子就很好懂了:

概念 好比是…… 核心特点 适用场景
斜杠命令 Command 微波炉上的**“指定按钮”(如:/解冻**、/爆米花 用户主动触发的、固定的、单一功能的命令。简单直接,但不够智能和灵活。 作为主动复用 prompt 的快捷方式,让用户快速复用模板 prompt
模型上下文协议 MCP 厨房里的**“单一厨具”**(如:一把刀、一个烤箱) 为 AI 提供调用外部 API或脚本的基础能力。模型知道有这个工具,但不知道具体在什么菜谱里、什么步骤下使用,以及怎么更好的使用。 通过标准协议链接外部系统获取信息或完成任务
技能 Skills 一本完整的**“菜谱”**(如:“如何制作法式焗蜗牛”) 模型根据任务自动匹配和驱动。它定义了制作这道菜(完成这个任务)需要用到哪些厨具(原子工具)、遵循哪些步骤、注意什么火候(最佳实践),是流程化、场景化的。 由模型驱动意图理解,通过渐进式加载补充上下文,并根据 SOP 完成指定任务

我们也列举了几个大家容易混淆的其他功能,一起来对比看看。

概念 核心特点 适用场景 易混淆点
rules 规则 通常通过 agent.md 或者 project_rules 文件维护,内容基本与项目绑定 主要专注于和项目强相关的场景 在无 Skills 的时候部分场景通过,在 rules 文件手动维护索引和文件 summary 的方式实现项目里的不同场景复用不同规则。
Agent 智能体 通常搭配相关 prompt 和对应的 tools use 打包使用,普遍用于多 agent 系统中 专用型场景使用 agent 可以更加符合场景需要 在 Skills + subagent 的场景中也能实现多 agent 调度的的逻辑
Memory 记忆 由模型主动或被动从用户对话中提炼关键上下文以进行记录 日常开发过程中潜移默化的记录,对用户干扰性不大 Memory 生成的内容可能类似于 rules 或者 Skills 通常明确了使用场景的 memory 可以被手动迁移到 rules 或者 Skills 中

📚 官方博客解释:

https://claude.com/blog/skills-explained

4、什么是好的 Skills:从“能用”到“好用”

Good Skills vs Bad Skills

评判维度 Good Skills Bad Skills
单一职责原则 **每个 Skill 只做一件事,且把它做好。**例如,可以分解为三个独立的 Skill:query_datagenerate_chartsend_email 一个 Skill 试图做太多事,比如“既负责数据查询,又负责图表生成,还负责邮件发送”。
描述清晰度 描述清晰、具体,使用自然语言,明确说明输入、输出和核心功能。例如:“根据用户提供的城市名和日期范围,查询并返回该城市的天气数据。” 描述模糊,充满技术术语,智能体难以理解。例如:“一个用于数据处理的工具。”
参数设计 参数精简、命名语义化(如 city_namedate_range),并为每个参数提供清晰的描述和示例。明确使用 Skill 需要的参数如何获取,以及参数如何使用。 参数过多、命名不规范(如 arg1p2),缺少详细的注释说明。
可组合性 设计时就考虑到了可组合性,其输出可以作为其他 Skill 的输入,方便构建更复杂的任务流(Workflow),可以尝试通过单一职责完成原子 Skill 的开发,并通过某项具体任务 SOP Skill 完成协调。 设计上是“一锤子买卖”,难以与其他 Skill 联动。

如何写好 Skills

  1. **原子性(Atomicity):**坚持单一职责,让每个 Skill 都像一块积木,小而美,专注于解决一个具体问题,便于日后的复用和组合。
  2. **给例子(Few-Shot Prompting):**这是最关键的一点,与其费尽口舌解释,不如直接给出几个清晰的输入输出示例。榜样的力量是无穷的,模型能通过具体例子,秒懂你想要的格式、风格和行为。
  3. 立规矩(Structured Instructions):

**1) 定角色:**给它一个明确的专家人设,比如“你现在是一个资深的市场分析师”。

**2) 拆步骤:**把任务流程拆解成一步步的具体指令,引导它“思考”。

**3) 画红线:**明确告诉它“不能做什么”,防止它天马行空地“幻觉”

  1. **造接口(Interface Design):**像设计软件 API 一样,明确定义 Skill 的输入参数和输出格式(比如固定输出 JSON 或 Markdown)。这让你的 Skill 可以被其他程序稳定调用和集成。

  2. **勤复盘(Iterative Refinement):**把 Skills 当作一个产品来迭代。在实际使用中留心那些不尽如人意的“Bad Case”,然后把它们变成新的规则或反例,补充到你的 Skills 定义里,让它持续进化,越来越聪明、越来越靠谱。

📚 一些官方最佳实践指南

https://platform.claude.com/docs/zh-CN/agents-and-tools/agent-skills/best-practices

5、社区热门 Skills 推荐

刚开始接触 Skills,不知从何下手?不妨从社区沉淀的这些热门 Skills 开始,寻找灵感,或直接在

你的工作流中复用它们。

Claude 官方提供的 Skills

📚 官方 Skills 仓库

https://github.com/anthropics/skills

学习 Claude 官方的 Skills 仓库可以帮助我们最快的了解 Skills 的最佳实践,便于我们沉淀出自己的 Skills。

如何快速使用官方 Skills?

大多数官方 Skills 都能直接下载,或者通过 Git 克隆到本地。在 TRAE 等工具里,一般只需把这些 Skills 的文件夹放到指定的 Skills 目录,接着重启或刷新 Agent,它就会自动识别并加载这些新能力。具体操作可参考工具的使用文档。

更多细节可参考下面这部分内容:如何在 TRAE 里快速用起来

Claude 官方提供的 Skills 列表

Skills 名称 Skills 说明 适用场景
algorithmic-art 使用 p5.js 创建生成艺术,支持种子随机性、流场和粒子系统。 适用于通过代码生成艺术、流场或粒子系统等场景。
artifacts-builder 使用 React、Tailwind CSS 和 shadcn/ui 等现代前端技术,构建复杂的多组件 claude.ai HTML 制品。 适用于需要状态管理、路由或复杂 UI 组件的场景。
brand-guidelines 将 Anthropic 官方品牌颜色和版式应用于各类制品。 适用于需要遵循公司品牌或设计规范的视觉格式化任务。
canvas-design 使用设计哲学创建 PNG 和 PDF 格式的视觉艺术作品,如海报或设计图。 适用于需要原创视觉设计的场景,避免版权问题。
document-Skills/docx 支持 docx 文件的创建、编辑与分析,包括追踪修订、添加评论、保留格式和文本提取。 适用于处理专业的 Word 文档。
document-Skills/pdf 提供全面的 PDF 操作工具集,支持文本与表格提取、创建新 PDF、合并/拆分文档及处理表单。 适用于需要以编程方式处理、生成或分析 PDF 的场景。
document-Skills/pptx 支持 pptx 文件的创建、编辑与分析,包括处理布局、模板、图表和自动生成幻灯片。 适用于各类演示文稿处理任务。
document-Skills/xlsx 支持 xlsx 等电子表格文件的创建、编辑与分析,包括公式、格式化、数据分析和可视化。 适用于需要处理电子表格数据的各类任务。
frontend-design 创建具有独特性和生产级别质量的前端界面。 适用于构建避免通用 AI 审美的、视觉效果突出的 Web 组件、页面或应用。
internal-comms 辅助撰写各类内部沟通文档,如状态报告、领导层更新、公司通讯和常见问题解答。 适用于需要遵循公司内部沟通规范的写作任务。
mcp-builder 指导创建高质量的 MCP (Model Context Protocol) 服务器,使语言模型能与外部服务和 API 交互。 适用于 Python (FastMCP) 或 Node/TypeScript (MCP SDK) 环境。
Skills-creator 指导创建或更新能扩展 Claude 能力的 Skills,包括添加专业知识、工作流或工具集成。 适用于为 Claude 开发新能力的场景。
slack-gif-creator 创建针对 Slack 优化的动画 GIF,提供尺寸验证和动画。 适用于为 Slack 创建符合其大小限制的动画 GIF 或表情。
template-Skills 作为一个基础模板,用于创建新 Skills 的起点。 /
theme-factory 提供 10 种预设主题或动态生成自定义主题,为各类制品(如幻灯片、文档)提供样式。 适用于需要对产出物进行专业视觉风格化的场景。
webapp-testing 使用 Playwright 与本地 Web 应用进行交互和测试,支持验证前端功能、调试 UI 行为和捕获浏览器日志。 适用于 webapp AI 自动化测试场景

社区其他最佳实践

分类 项目名称 链接
Github 社区 Awesome 一些 Skills 的最佳实践集合 * https://github.com/ComposioHQ/awesome-claude-Skills * https://github.com/travisvn/awesome-claude-Skills * https://github.com/libukai/awesome-agent-Skills
非常全面的 Skills 分发市场 Skillsmp https://Skillsmp.com/zh
使用工具将文档或网页转为 Skills Skills_Seekers https://github.com/yusufkaraaslan/Skills_Seekers
使用 Claude 进行学术创作 claude-scientific-writer https://github.com/K-Dense-AI/claude-scientific-writer
你的专家级工作伙伴 superpowers https://github.com/obra/superpowers
你的随身设计师 ui-Skillsls https://www.ui-Skills.com/
快速复刻设计风格 ui-ux-pro-max-Skills https://ui-ux-pro-max-Skills.nextlevelbuilder.io/

6、如何在 TRAE 里快速使用

理论说再多,不如亲手一试。我们先讲一下如何在 TRAE SOLO 中创建并应用一个 Skill 并以基于飞书文档的 Spec Coding 为例讲解一下如何利用 Skills 快速解决一个实际问题。

Skill 创建

方式一:设置中直接创建

TRAE 支持在设置页面可以快速创建一个 Skill

按下快捷键 Cmd +/ Ctrl + 通过快捷键打开设置面板。

在设置面板左侧找到「规则技能」选项

找到技能板块,点击右侧的「创建」按钮。

你会看到一个简洁的创建界面,包含三要素:Skill 名称、Skill 描述、Skill 主体。我们以创建一个“按规范提交 git commit”的 Skill 为例,填入相应内容后点击「确认」即可。

填入我们需要的内容「确认」即可

方式二:直接解析 SKILL.md

在当前项目目录下,新增目录.trae/Skills/xxx 导入你需要文件夹,和 TRAE 进行对话,即可使用。

可以在「设置 - 规则技能」中看到已经成功导入

方式三:在对话中创建

目前 TRAE 中内置了 Skills-creator Skills ,你可以在对话中直接和 TRAE 要求创建需要的 Skills

Skill 使用

在 TRAE 里使用技能很容易,你加载好需要的技能后,只需在对话框中用日常语言说明你的需求就行。

  • 例如,输入“帮我设计一个有科技感的登录页面”,系统就会自动调用“frontend-design”技能。
  • 例如,输入“帮我提取这个 PDF 里的所有表格”,系统会自动调用“document-Skills/pdf”技能。
  • 例如,输入“帮我把这片技术文档转为飞书文档”,系统会自动调用“using-feishu-doc”技能。

系统会自动分析你的需求,加载技能文档,还会一步步指导你完成任务!

实践场景举例

还记得引言里提到的那些问题吗?比如说,项目规则文件(project_rules)有字符数量的限制;又或者,就算你在根规则文件里明确写好了“在什么情况下读取哪个文件”,Agent 在执行任务时也不会按照要求来做。

这些问题的根本原因是,规则(Rules)对于 Agent 而言是固定不变的,它会在任务开始时就把所有规则一次性加载到上下文中,这样既占用空间,又不够灵活。而 技能(Skill)采用的是“逐步加载”的动态方式,刚好可以解决这个问题。所以,我们可以把之前那些复杂的规则场景,重新拆分成一个个独立的技能。

接下来,我们通过一个基于飞书文档的“Spec Coding”简单流程,来实际操作一下如何用技能解决问题。

什么是 Spec Coding?

Spec Coding 提倡“先思考后行动”,也就是通过详细定义可以执行的需求规范(Specification)来推动 AI 开发。它的流程包含“需求分析、技术设计、任务拆解”的文档编写过程,最后让 AI 根据规范来完成编码。这种一步步的工作流程能保证每一步都有依据,实现从需求到代码的准确转化。

让我来分析一下这个场景

上面提到将开发过程划分为四个关键阶段,所以要完成 “需求分析、技术设计、任务拆解” 的飞书文档撰写,还有最终的代码实现。为此,我们需要不同的技能来满足不同场景下的文档编写需求,并且要教会 Agent 如何使用飞书工具进行创作协同。

下面我们就一起完成上面提到的 Skills 的设计实现。

多角色专家 Skills

通过实现多角色 Skills 通过创建多个交付物过程文档,约束后续的编码,为编码提供足够且明确的上下文,每个Skill 专注完成一件事

  • 下面让我们进一步详细设计
序号 角色名称 Skills 标识 主导思维 输入 职责 交付物
1 需求分析师 requirement-analyst 产品思维 用户模糊的一句话需求、草图 * 澄清挖掘:识别模糊点,主动提问 * 边界定义:明确 Scope(做什么 / 不做什么) * 场景细化:梳理 User Stories 和 Edge Cases REQUIREMENT.md
2 技术架构师 system-architect 工程思维 REQUIREMENT.md * 技术选型:确定框架、库、工具链 * 数据建模:设计 Schema、State、API Spec * 模块设计:划分组件层级、核心类图 DESIGN.md
3 任务规划师 task-planner 项目管理思维 REQUIREMENT.md + DESIGN.md * 颗粒度控制:拆解为 < 15min 的原子任务 * 依赖排序:规划开发顺序(类型→Mock→组件) * 验证标准:设定 Definition of Done TODO.md
4 规范执行者 spec-coder 编程思维 TODO.md + DESIGN.md * 严格执行:遵循设计文档的命名与结构 * 变更管理:遇阻回滚设计,不擅自修改逻辑 * 自我验证:完成任务即进行测试 高质量代码

按照上述的表格我们就可以大致明确我们需要的 Skills 该如何实现了。

  • 本次只作为一个例子大家可以参考上面创建 Skill 的教程自己完成一下这个多角色 Skills 的创建和调试,当然正如上面所述好的 Skill 需要在实践中逐渐优化并通过场景调用不断进行优化的

飞书文档使用 Skill

飞书文档的格式是 markdown 的超集,我们 Skill 的目的则是教会 Agent 飞书文档的语法,便于 Agent 写出符合格式的 md 文件。并通过约束 Agent 行为,充分利用飞书文档的评论的读写完成多人协作审阅的过程,用户通过在飞书文档评论完成相关建议的提出,Agent 重新阅读文档和评论,根据建议进一步优化文档,实现文档协作工作流。

Spec Coding Skill

上面我们实现了多个角色 Skills 和一个功能 Skill,但实际使用时,还需要有一个能统筹全局的技能,来实现分工协作。把上述多个技能组合起来,告诉智能体(agent)整体的规格编码(spec coding)流程,完成工具技能和角色技能的组合与调度。

如此我们就能快速搭建一个规格编码工作流程,完成基础开发。当然也可以参考上面的逻辑,用技能来重新复刻社区里的规格编码实践(如 SpecKit、OpenSpec 等)。

总结

上述场景提到了两种不同风格的 Skill(角色型,工具型),利用 Skill 的动态加载机制(取代固定规则的一次性加载方式),完成了复杂场景下的任务分解;通过 不同角色技能的分工协作(避免 Agent 什么都做导致执行混乱);尝试借助飞书文档形成协作闭环(打通人机交互的最后一步),有效解决了 Agent “不听话、执行乱、工具少” 的问题,让 AI 从 “对话助手” 真正转变为 “可信赖的实干家”,实现从需求提出到代码产出的高效、精准、协作式交付。

7、Q & A | 一些常见问题

为什么我写的 Skills 不生效,或者效果不符合预期?

那十有八九是你的“名片”(Description)没写好。

记住,Agent 是通过读取 Skills 的 Description来判断“什么时候该用哪个 Skill”的。要是你的描述写得含糊不清、太专业或者太简单,Agent 就很难明白你的意思,自然在需要的时候就不会调用这个 Skill。所以,用大白话写的清晰、准确的Description**,对 Skill 能否起作用至关重要。**

使用 Skills 的效果,会受到我选择的大语言模型(LLM)的影响吗?

会有影响,不过影响的方面不一样。

  • **一个更强大的模型,主要影响“挑选”和“安排”技能的能力。**它能更准确地明白你的真实想法,然后从一堆技能里挑出最适合的一个或几个来解决问题。它的优势体现在制定策略方面。
  • **而技能本身,决定了具体任务执行的“最低水平”和“稳定性”。**一旦某个技能被选中,它里面设定好的流程和代码是固定的,会稳定地运行。所以,技能编写得好不好,直接决定了具体任务能不能出色完成。。

Skills 是不是万能的?有什么它不擅长做的事情吗?

**当然不是万能的。Skills 的主要优势是处理那些流程明确、边界清晰的任务。**在下面这些情况中,它可能就不是最好的选择了:

  • **需要高度创造力的任务:**像写一首饱含情感的诗,或者设计一个全新的品牌标志。这类工作更需要大模型本身的“灵感”。
  • **需要实时、动态做决策的复杂策略游戏:**比如在变化极快的金融市场中做交易决策。
  • **单纯的知识问答或开放式闲聊:**如果你只是想问“文艺复兴三杰是谁?”,直接问大模型就可以,不用动用 Skills 这个“大杀器”。

我发现一个社区的 Skills 很好用,但我可以修改它以适应我的特殊需求吗?

当然可以,我们强烈建议你这么做!

大多数共享的 Skill 都支持用户“Fork”(也就是“复制一份”)并进行二次开发。你可以把通用的 Skill 当作模板,在自己的工作空间里复制一份,然后修改里面的逻辑或参数,以适应你自己的业务需求。这对整个生态的共建和知识复用很重要。

结语|让 Agent 成为你真正的“行动派”

Skill 的出现,为 AI 从“对话式助手”转变为“可信赖的执行者”搭建了关键的技术桥梁。它用结构化的方法把领域知识、操作流程和工具调用逻辑封装起来,解决了 Agent 规则失效、执行失控的混乱问题,让 AI 的能力输出变得可以控制、值得信赖且高效。

Skill 的核心价值在于:

  • **精准实际痛点:**通过巧妙的三级加载机制(元数据→说明文档→资源)平衡上下文效率与功能深度,在功能深度和上下文效率之间找到了一个绝佳的平衡点,既避免了宝贵 Token 的浪费,又确保了任务执行的精准性,实现了 Agent 上下文的动态加载能力。
  • **生态赋能,降低门槛:**无论是官方还是社区,都提供了丰富的资源(如 Claude 官方仓库、SkillsMP 市场等),让普通用户也能轻松站在巨人的肩膀上,快速复用各种成熟的能力。

虽然 Skill 不是万能的,但它在“确定性流程任务”上的优势无可替代。未来,随着 AI 模型能力的提升与 Skill 生态的进一步完善,我们有望看到更多跨领域、可组合的 Skill 出现——让 AI 从“样样懂一点”的通才,真正进化为“事事做得好”的专家协作伙伴。

最后

对于正在迷茫择业、想转行提升,或是刚入门的程序员、编程小白来说,有一个问题几乎人人都在问:未来10年,什么领域的职业发展潜力最大?

答案只有一个:人工智能(尤其是大模型方向)

当下,人工智能行业正处于爆发式增长期,其中大模型相关岗位更是供不应求,薪资待遇直接拉满——字节跳动作为AI领域的头部玩家,给硕士毕业的优质AI人才(含大模型相关方向)开出的月基础工资高达5万—6万元;即便是非“人才计划”的普通应聘者,月基础工资也能稳定在4万元左右

再看阿里、腾讯两大互联网大厂,非“人才计划”的AI相关岗位应聘者,月基础工资也约有3万元,远超其他行业同资历岗位的薪资水平,对于程序员、小白来说,无疑是绝佳的转型和提升赛道。
图片
图片
对于想入局大模型、抢占未来10年行业红利的程序员和小白来说,现在正是最好的学习时机:行业缺口大、大厂需求旺、薪资天花板高,只要找准学习方向,稳步提升技能,就能轻松摆脱“低薪困境”,抓住AI时代的职业机遇。

如果你还不知道从何开始,我自己整理一套全网最全最细的大模型零基础教程,我也是一路自学走过来的,很清楚小白前期学习的痛楚,你要是没有方向还没有好的资源,根本学不到东西!

下面是我整理的大模型学习资源,希望能帮到你。

图片

👇👇扫码免费领取全部内容👇👇

在这里插入图片描述

最后

1、大模型学习路线

img

2、从0到进阶大模型学习视频教程

从入门到进阶这里都有,跟着老师学习事半功倍。

在这里插入图片描述

3、 入门必看大模型学习书籍&文档.pdf(书面上的技术书籍确实太多了,这些是我精选出来的,还有很多不在图里)

在这里插入图片描述

4、 AI大模型最新行业报告

2026最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

img

5、面试试题/经验

img

【大厂 AI 岗位面经分享(107 道)】

img

【AI 大模型面试真题(102 道)】

img

【LLMs 面试真题(97 道)】

img

6、大模型项目实战&配套源码

img

适用人群

在这里插入图片描述

四阶段学习规划(共90天,可落地执行)
第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范
第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署
第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建
第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型

  • 带你了解全球大模型

  • 使用国产大模型服务

  • 搭建 OpenAI 代理

  • 热身:基于阿里云 PAI 部署 Stable Diffusion

  • 在本地计算机运行大模型

  • 大模型的私有化部署

  • 基于 vLLM 部署大模型

  • 案例:如何优雅地在阿里云私有部署开源大模型

  • 部署一套开源 LLM 项目

  • 内容安全

  • 互联网信息服务算法备案

  • 👇👇扫码免费领取全部内容👇👇

    在这里插入图片描述

3、这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。
在这里插入图片描述
在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐