这篇文章提供了一份为期六个月的AI实战路线图,旨在帮助初学者从零开始,逐步掌握构建和部署AI应用所需的技能。文章涵盖了编程基础、大语言模型应用开发、检索增强生成(RAG)、智能体、工作流编排、业务流程自动化等多个方面,并提供了丰富的学习资源和实践项目。通过遵循这份路线图,读者可以在六个月内具备独立交付AI产品的能力,并为进入AI工程师这一高薪职业领域打开大门。

你是不是也在学AI的路上越走越迷茫?

收藏了很多AI教程,也下载并使用了很多AI的工具。

但是你仍然不知道自己该干什么,该怎么学,这些能够帮我找到工作,对接项目或者做一些有用的东西吗?

如果你现在的学习路径是"先学所有理论,再考虑应用",那你正在走一条大多数人走不通的路。

这篇文章是一份6个月AI实战路线图,超过10000字,每一个技能点都配有具体资源和行动步骤。

六个月后,你会拥有三个能展示的作品,一套完整的生产级技能,以及进入这个薪资区间的入场券。

(文章比较长,字数超2W字,涵盖大量资料,建议先收藏)

AI工程已经迅速成为科技领域最有价值的技能之一

问题是,大多数初学者完全不清楚自己该学什么

有人一上来就啃机器学习理论

有人陷入教程地狱, 没完没了地看教程

还有人连API、后端基础、真实产品怎么构建都没搞懂,就直接跳进提示词和智能体的世界

结果通常都一样:一头雾水,实际技能几乎为零

如果你的目标是成为AI工程师,你不需要精通人工智能的每一个领域

你需要学会的是:如何在现实世界中构建有用的AI系统

这意味着你要学会:

• 用大语言模型(LLM)构建端到端应用

• 调用OpenAI、Anthropic等模型API

• 正确设计提示词(Prompt)和上下文

• 使用结构化输出和工具调用

• 在需要时加入检索能力

• 部署项目,让真正的人能用上

这份指南就是为了给你一个实用的6个月路线图

这篇文章超过10000字,读完可能需要几个小时甚至更久

但它的真正价值在于:每一个你需要学习的技能,都有配套资源和清晰的行动说明

这样,你可以在6个月内达到AI工程师的水平,而且在第1-2个月就能开始动手实践

写这篇文章花了超过40小时,我和我的朋友@andy_ai0一起完成的

他刚开始在X上建立个人品牌,但对AI理解很深,帮了很大忙

我觉得他值得你的关注和支持

现在开始阅读 ⬇️

AI工程师到底是做什么的

很多人听到"AI工程师"这个词,就想象有人从零开始训练巨型模型

实际上,大多数现代AI工程师做的是更务实的事

他们在现有模型之上构建产品和系统

通常包括:

• 连接大语言模型API

• 设计提示词和上下文流程

• 构建聊天、搜索或自动化系统

• 集成工具、数据库和外部API

• 处理结构化输出

• 提升可靠性、降低成本和延迟

• 将AI功能部署到真实应用中

所以在实践中,AI工程师通常介于以下几个角色之间:

• 软件工程

• 产品工程

• 自动化

• 应用AI

这就是为什么这个岗位增长如此之快

公司不仅需要研究人员,他们更需要能把模型变成有用产品的人

这也是为什么这份路线图更侧重实际执行,而非厚重理论

如果你能构建真实的大语言模型应用、检索系统、自动化流程和生产级工作流,你已经比大多数初学者更接近就业水平了

⏩------------------------------------------------------------------------⏪

第1个月:打好编程和基础功

这个月的目标:成为一个能写代码的Python开发者

你不需要成为专家,只需要不再为基础语法Google,能自信地写出简单程序

AI工程首先是软件工程

后面每个月都假设你能写干净的Python、用终端、调用API、管理代码库。这个月是你的地基

学什么

  1. Python

Python是AI工程的语言。句号。接下来六个月你遇到的几乎所有库、API和教程都是Python的

怎么学:

从一门强迫你写代码的结构化课程开始,不要只看视频

初学者最常见的错误是被动消费内容:边看边点头,从不开代码编辑器

克服这个问题的方法:边学边敲每一个示例

资源:

1. Python for Everybody(Coursera,可免费旁听)

链接:https://www.coursera.org/specializations/python

绝对初学者的最佳起点。Dr. Chuck是互联网上最友好的Python老师之一

2. freeCodeCamp Python课程(YouTube,免费)

链接:https://www.youtube.com/watch?v=rfscVS0vtbw

4小时的综合视频,涵盖所有基础

3. CS50P:Python编程入门(哈佛,免费)

链接:https://cs50.harvard.edu/python/

更严格。包含问题集和期末项目。如果你想要结构化的学习,选这个

4. Python官方文档(教程部分)

链接:https://docs.python.org/3/tutorial/

枯燥但权威,当作参考用

重点掌握:

• 变量、数据类型、循环、条件、函数

• 列表、字典、集合、元组

• 文件读写和JSON处理

• 类和基础面向对象(能看懂就行)

• 用try/except做错误处理

• 虚拟环境(venv)和pip

• 包管理——理解requirements.txt

练习项目:用Python写一个简单的命令行工具。比如一个个人记账工具,读写JSON文件,或者一个调用公开API(比如天气API)并格式化输出的脚本

  1. Git和GitHub

Git是专业开发者保存和分享代码的方式。你会一直用到它——版本控制项目、协作、在GitHub上展示作品集

怎么学:

Git一开始很让人困惑,因为它的思维模型不直观

不要死记命令,先理解Git在解决什么问题
(追踪变更、支持协作、让你能撤销错误),命令自然就懂了

资源:

1. GitHub Skills(免费,交互式)

**链接:**https://skills.github.com/

GitHub官方交互课程,直接在GitHub里完成。从这里开始

2. Learn Git Branching(免费,交互式)

**链接:**https://learngitbranching.js.org/

理解分支和合并的最佳可视化工具,没有之一

3. Pro Git(免费在线书)

**链接:**https://git-scm.com/book/en/v2

全面的参考。挑你需要的章节看

重点掌握:

• git init, add, commit, push, pull

• 分支和合并

• 理解.gitignore

• 在GitHub创建仓库并推送本地项目

• 读写基本的README文件

练习: 从现在开始,你写的每一个项目,哪怕是小脚本,都应该放在GitHub仓库里。这养成习惯,也给你积累作品集

  1. 命令行/终端基础

作为AI工程师,你会运行脚本、安装包、管理服务器、在命令行里导航文件

在终端里慢或怕,是真实的瓶颈

资源:

1. 50个最常用的Linux和终端命令(初学者完整课程)

**链接:**https://www.youtube.com/watch?v=ZtqBQ68cfJc

Linux/Mac绝对初学者的好资源

2. 计算机科学教育中缺失的一学期(MIT,免费)

**链接:**https://missing.csail.mit.edu/

涵盖shell脚本、终端工具,以及大多数CS课程跳过的命令行熟练度

重点掌握:

• 导航:cd, ls, pwd, mkdir, rm

• 读文件:cat, less, grep

• 从终端运行Python脚本

• 环境变量

• 基础理解PATH

  1. JSON、API、HTTP和异步基础

从第2个月第一天起,你就要调用大语言模型API

这意味着在碰OpenAI或Anthropic的SDK之前,你得先理解Web API是怎么工作的

资源:

1. HTTP基础——MDN Web文档(免费)

**链接:**https://developer.mozilla.org/en-US/docs/Web/HTTP/Overview

最清晰的HTTP请求和响应原理解释

2. REST API教程

**链接:**https://restfulapi.net/

简短实用

3. Python requests库文档

**链接:**https://requests.readthedocs.io/en/latest/

学会用Python调用任何Web API

4. Python async/await(免费)

链接:https://realpython.com/async-io-python/

理解异步对后面处理流式大语言模型响应至关重要

重点掌握:

• GET、POST请求——是什么,怎么用Python发

• 读写JSON

• HTTP状态码(200、400、401、404、500——每个什么意思)

• API key是什么,基础认证模式

• async def和await是做什么的,为什么存在

练习项目: 写一个Python脚本,调用一个免费公开API(试试Open-Meteo获取天气数据——不需要API key),把结果格式化成干净的JSON输出

  1. 基础SQL和Pandas

你不需要成为数据科学家,但你会经常需要查看、查询和操作数据

SQL基础和Pandas熟练度会不断救你

资源:

1. SQLBolt(免费,交互式)

**链接:**https://sqlbolt.com/

从零学SQL最快的方式。20节短课,浏览器内练习

2. Pandas官方入门指南

**链接:**https://pandas.pydata.org/docs/getting_started/index.html

跟着"10分钟入门Pandas"教程做一遍

3. Kaggle Pandas课程(免费)

**链接:**https://www.kaggle.com/learn/pandas

动手实践,短平快

重点掌握:

• SQL:SELECT、WHERE、GROUP BY、JOIN、ORDER BY

• Pandas:加载CSV、筛选行、选择列、基础聚合

  1. FastAPI

资源:

1. FastAPI官方教程(免费)

链接:https://fastapi.tiangolo.com/tutorial/

genuinely 有史以来最好的框架文档之一

从头到尾做一遍。涵盖路径参数、请求体、Pydantic验证、运行开发服务器

2. Python API开发(19小时课程,freeCodeCamp,YouTube,免费)

**链接:**https://www.youtube.com/watch?v=ZtqBQ68cfJc

涵盖API设计基础,包括路由、序列化、schema验证和SQL数据库集成。从零构建一个完整的社交媒体风格API

重点掌握: 创建GET和POST端点、路径和查询参数、用Pydantic处理请求体、运行uvicorn、用FastAPI内置的/docs界面测试API,不用写客户端

第1个月里程碑

到这个月底,你应该能够:

• 写Python程序:读写文件、调用API、处理错误

• 用Git管理代码版本,把项目推送到GitHub

• 在终端里自如导航

• 理解HTTP请求是什么,能用Python发一个

• 用基础SQL查询SQLite数据库

• 在本地构建并运行一个简单的FastAPI应用

⏩------------------------------------------------------------------------⏪

第2个月:掌握大语言模型应用开发

这个月的目标:用OpenAI和Anthropic的API构建真正的AI驱动应用

到月底,你应该能舒服地写出可靠工作的提示词、从模型拿到结构化数据、让它们调用你的函数,并处理所有可能出错的情况

这是AI工程的核心。路线图里其他所有内容都建立在这个月的基础上

学什么

  1. 提示工程(Prompt Engineering)基础

提示工程不只是礼貌地提问。它是一门手艺:给本质上概率性的模型写指令,让它们产出一致、可靠的输出

作为AI工程师,你会在这里花 surprisingly 多的时间

怎么学:

从Anthropic的交互式教程开始,因为它最动手

然后读OpenAI的官方指南。之后,Prompt Engineering Guide把所有内容整合起来

按顺序做完这三个——每一个都在强化其他的

资源:

1. Anthropic交互式提示工程教程(免费,GitHub)

**链接:**https://github.com/anthropics/prompt-eng-interactive-tutorial

分9章的逐步课程,带练习,给你大量机会自己写提示词和排查问题

用Claude API作为Jupyter notebook运行

2. Anthropic提示工程文档(免费)

**链接:**https://docs.anthropic.com/en/docs/build-with-claude/prompt-engineering/overview

官方参考。从基础清晰度到XML结构化和智能体系统,全覆盖

3. OpenAI提示工程指南(免费)

**链接:**https://platform.openai.com/docs/guides/prompt-engineering

OpenAI的官方指南,涵盖在他们模型上效果好的提示词格式,让输出更有用

4.PromptingGuide.ai(免费)

**链接:**https://www.promptingguide.ai/

从基础提示到高级策略,加上函数调用、工具集成和智能体系统

重点掌握: system消息和user消息的区别、为什么具体性很重要、思维链提示(一步一步想)、在提示里用示例(few-shot)、以及措辞的微小变化如何 dramatically 改变输出质量

练习: 拿一个真实任务——总结文档、从文本提取关键信息、分类一条反馈——为它写5个不同的提示词。比较输出。你会立刻看到提示词设计对可靠性的影响有多大

  1. 结构化输出 / JSON Schema

在真实应用中,你几乎从不想要大语言模型的原始文本。你想要能解析、存储和在代码里用的结构化数据

结构化输出通过强制模型匹配你定义的schema来解决这个问题

资源:

1. OpenAI结构化输出指南(官方文档,免费)

**链接:**https://platform.openai.com/docs/guides/structured-outputs

涵盖确保模型始终生成符合你JSON Schema的响应的功能,这样你不用担心缺失的key或幻觉值

2. Instructor库(免费,开源)

**链接:**https://python.useinstructor.com/

用Pydantic模型从任何大语言模型提供商获取结构化输出的最干净方式

支持OpenAI、Anthropic、Google等15+提供商,用同样的代码接口,验证失败时自动重试

这是大多数生产环境AI工程师实际在用的

3. OpenAI Cookbook:结构化输出入门(免费)

**链接:**https://developers.openai.com/cookbook/examples/structured_outputs_intro/

实用示例,涵盖思维链输出、结构化数据提取和UI生成,帮助理解真实用例

重点掌握: 为数据定义Pydantic模型、把schema传给API、理解结构化输出和JSON模式的区别、优雅地处理拒绝

练习项目: 构建一个发票或收据解析器。给它原始文本(比如"发票#123,3个小部件$45.99,3月30日到期"),让它返回一个结构化Python对象,字段包括invoice_number、amount、items、due_date

  1. 函数 / 工具调用(Function / Tool Calling)

工具调用是把大语言模型从文本生成器变成能采取行动的东西的关键——搜索网页、查询数据库、调用你的API、运行代码。这是整份指南里最重要的技能之一

怎么理解: 模型实际上并不执行你的函数

它检查提示词,当它决定该用某个工具时,返回一个结构化的调用,包含函数名和参数

你的代码然后执行这个调用,把结果发回去

资源:

1. OpenAI函数调用指南(官方文档,免费)

**链接:**https://platform.openai.com/docs/guides/function-calling

权威参考。涵盖定义工具、5步调用流程、并行调用和最佳实践

2. Anthropic工具使用文档(免费)

**链接:**https://docs.anthropic.com/en/docs/build-with-claude/tool-use

Anthropic给Claude的等效指南。概念一样,语法略有不同

3. OpenAI Cookbook:如何用聊天模型调用函数(免费,GitHub)

**链接:**https://github.com/openai/openai-cookbook/blob/main/examples/How_to_call_functions_with_chat_models.ipynb

完整的可运行notebook,用真实示例走完整个工具调用循环

重点掌握: 用JSON Schema清晰描述函数、解析工具调用响应、执行函数并反馈结果、处理不需要工具调用的情况、以及tool_choice: "auto"的概念

练习项目: 构建一个简单的助手,有三个工具:get_weather(city)、calculate(expression)、search_notes(query)(就搜索一个硬编码的字典)。把它们都接起来,看着模型根据你问什么来决定调用哪个

  1. 流式响应(Streaming Responses)

流式意味着在模型生成输出的同时就显示出来——逐字逐字——而不是等完整响应。这让你的应用感觉 dramatically 更快、更有生命力

资源:

1. OpenAI流式文档(官方,免费)

**链接:**https://platform.openai.com/docs/api-reference/streaming

给请求加stream=True并遍历chunk的参考

2. Anthropic流式文档(官方,免费)

**链接:**https://docs.anthropic.com/en/api/messages-streaming

Anthropic的流式API参考,带Python示例

3. 流式大语言模型API如何工作——Simon Willison(免费)

**链接:**https://til.simonwillison.net/llms/streaming-llm-apis

清晰的技术拆解,讲OpenAI、Anthropic和Google底层Server-Sent Events是怎么工作的,有助于理解HTTP层面实际发生了什么

重点掌握: 设置stream=True、遍历delta chunk、从部分组装完整响应、把流式接入FastAPI端点用StreamingResponse

提示: 流式几乎总是面向用户的应用的正确选择。没人想盯着加载转圈10秒,等完整响应一次性出现

  1. 对话状态管理(Conversation State)

大语言模型是无状态的——它们在调用之间没有记忆。对话历史是你通过每次请求发送完整消息列表来管理的。理解这一点是基础

资源:

1. OpenAI聊天补全指南,管理对话(官方,免费)

**链接:**https://platform.openai.com/docs/guides/conversation-state

关于messages数组如何工作、如何管理多轮对话的权威解释

2. Anthropic Messages API文档(官方,免费)

**链接:**https://docs.anthropic.com/en/api/messages

Anthropic的等效文档。概念一样,值得两个都看看它们哪里不同

重点掌握: messages数组结构、为什么你要追加user和assistant消息、上下文窗口限制和超限时会发生什么、基础截断策略(丢弃最旧消息、总结历史)

练习项目: 在终端里构建一个简单的多轮聊天机器人。每一轮都追加到messages列表。加一个/reset命令清空历史,每次交换后打印当前token数

  1. 成本、延迟和Token基础

不懂成本和token就上线AI应用,你就会收到意外账单和应用变慢。这很无聊但至关重要

资源:

1. OpenAI定价页面(官方)

**链接:**https://openai.com/api/pricing

知道每个模型的输入和输出token多少钱。收藏这个,每次选模型时都看看

2. Anthropic定价页面(官方)

**链接:**https://www.anthropic.com/pricing

Claude模型同理

3. OpenAI Tokenizer工具(免费,交互式)

**链接:**https://platform.openai.com/tokenizer

粘贴任何文本,看它是多少token。学习期间一直用这个

4. Tiktoken(Python库,免费)

**链接:**https://github.com/openai/tiktoken

OpenAI的tokenizer库,在发请求前用代码数token

重点掌握: token是什么(大约4个字符/3/4个词)、输入和输出token定价怎么不同、上下文窗口大小如何影响你能做什么、以及小快模型和大聪明模型之间的延迟权衡

还有:别什么事都用GPT-4/Opus——便宜模型对简单任务往往够用了

  1. 失败处理(Failure Handling)

大语言模型API会失败。速率限制会触发、响应会超时、模型会返回畸形JSON。优雅地处理失败,是demo和生产应用的分水岭

资源:

1. OpenAI错误码参考(官方,免费)

**链接:**https://platform.openai.com/docs/guides/error-codes

你会遇到的每种错误类型,以及怎么处理

2. Anthropic错误处理文档(官方,免费)

**链接:**https://docs.anthropic.com/en/api/errors

Claude同理

3. Tenacity(Python库,免费)

**链接:**https://tenacity.readthedocs.io/

一个干净的库,给任何Python函数加带指数退避的重试逻辑。一个装饰器,重试就搞定了

重点掌握: 速率限制错误(429)和指数退避、用httpx/requests处理超时、在使用前验证模型输出、回退策略(用不同模型重试、返回缓存响应)、以及永远不要因为大语言模型返回意外输出就让你的应用崩溃

  1. 提示注入(Prompt Injection)意识

提示注入是大语言模型应用的#1安全风险

它发生在不受信任的用户输入和系统指令结合时,允许用户修改、覆盖或注入新行为到提示词中——导致系统执行非预期操作或生成被操纵的输出

你不需要成为安全专家,但在发布任何东西之前,你需要知道这存在

资源:

1. OWASP大语言模型应用Top 10——LLM01:提示注入(免费)

**链接:**https://genai.owasp.org/llmrisk/llm01-prompt-injection/

权威分类,涵盖直接注入(越狱)、通过文档或网站等外部内容的间接注入,以及真实攻击场景

2. OWASP提示注入预防速查表(免费)

**链接:**https://cheatsheetseries.owasp.org/cheatsheets/LLM_Prompt_Injection_Prevention_Cheat_Sheet.html

实用防御模式:输入验证、权限控制和输出验证

3. Evidently AI:什么是提示注入(免费)

**链接:**https://www.evidentlyai.com/llm-guide/prompt-injection-llm

面向开发者的清晰解释,讲攻击类型、风险和缓解设计模式

重点掌握: 直接注入和间接注入的区别、为什么系统提示词不是真正"安全"的、工具访问的最小权限原则、以及永远不要信任未经验证的大语言模型输出来自动做重要决定

第2个月里程碑

到这个月底,你应该能够:

• 为给定任务写出一致、可靠输出的提示词

• 用Pydantic + Instructor从任何模型获取结构化JSON数据

• 接好工具调用,让模型能调用你的Python函数

• 通过FastAPI端点实时流式响应

• 正确管理多轮对话历史

• 在发请求前估算token成本

  1. 元数据过滤(Metadata Filtering)

仅靠原始相似度搜索对真实应用来说是不够的。元数据过滤让你能把检索约束到相关子集——按日期、来源、文档类型、用户、分类,或任何你随每个chunk一起存储的属性

资源:

1. Pinecone:元数据过滤指南(免费)

**链接:**https://docs.pinecone.io/guides/data/filter-with-metadata

清晰解释如何在相似度搜索之前或期间按元数据字段过滤向量,带代码示例

2. LlamaIndex:元数据过滤器指南(官方文档,免费)

**链接:**https://docs.llamaindex.ai/en/stable/module_guides/querying/node_postprocessors/node_postprocessors/

解释如何在LlamaIndex管道中在查询时应用过滤器

重点掌握: 在摄入时为每个chunk打相关元数据标签(来源文件名、页码、章节、日期、分类),并在查询时用这些字段过滤结果。这就是玩具demo和生产系统的区别——用户能问"只给我看2025年Q4到2026年Q1报告的结果"

  1. 重排序(Reranking)

重排序是一种给任何关键词或向量搜索系统的搜索质量增加语义提升的技术

第一阶段检索返回候选集后,重排序器基于与查询的真实上下文相关性重新评分这些结果——不只是向量接近度

两阶段模式是:嵌入并搜索(快,近似)→ 对top-k重排序(慢,更准)。结果是检索质量dramatically提升,延迟成本只 modestly 增加

资源:

1. Cohere重排序文档(官方,免费)

**链接:**https://docs.cohere.com/docs/reranking-with-cohere

最佳起点。涵盖完整重排序工作流,包括半结构化数据如邮件和JSON文档。只需一行代码就能加到现有检索管道

2. LangChain:Cohere重排序器集成(官方文档,免费)

**链接:**https://python.langchain.com/docs/integrations/retrievers/cohere-reranker/

解释如何用ContextualCompressionRetriever把Cohere重排序接入LangChain检索器

重点掌握: 两阶段检索-然后-重排序模式、双编码器(用于第一阶段嵌入搜索)和交叉编码器(用于重排序)的区别、以及重排序top-20 vs top-5的实用延迟/质量权衡

  1. 检索质量问题

大多数RAG失败不是模型失败,是检索失败。理解检索可能出错的方式对调试真实系统至关重要

常见问题:

语义漂移: 查询嵌入不匹配相关chunk嵌入,即使信息在那里。修复:尝试查询重写或HyDE(假设文档嵌入)

Chunk边界问题: 相关信息被拆到两个chunk里。修复:增加重叠或使用语义分块

缺失元数据上下文: Chunks语义上相似于查询但属于错误的文档、日期或用户。修复:使用元数据过滤

Top-k太小: 正确的chunk存在但不在检索到的top 5里。修复:检索时增加top_k,重排序后减少

资源:

1. LangChain:查询转换(免费)

**链接:**https://python.langchain.com/docs/how_to/#query-analysis

涵盖查询重写、后退提示和HyDE

2. Pinecone:提升检索质量(免费)

**链接:**https://www.pinecone.io/learn/retrieval-augmented-generation/#retrieval-quality

常见失败模式的实用排查指南和修复方法

  1. 减少幻觉(Hallucination Reduction)

相比原始大语言模型,RAG能dramatically减少幻觉,但不能消除

通过在运行时给模型提供检索到的事实,RAG把响应锚定到真实来源而非仅依赖训练数据,模型输出甚至可以引用这些来源,增加透明度和信任

但检索失败、糟糕的chunk和冲突信息仍可能导致模型编造

资源:

1. Zep:减少大语言模型幻觉——开发者指南(免费)

**链接:**https://www.getzep.com/ai-agents/reducing-llm-hallucinations/

面向开发者的实用指南,涵盖提示词锚定策略、事实任务思维链和输出验证模式

2. Voiceflow:5种减少大语言模型幻觉的方法(免费)

**链接:**https://www.voiceflow.com/blog/prevent-llm-hallucinations

综合策略的好概述:RAG + 思维链 + 护栏(Guardrails)一起优于任何单一方法

重点掌握:提示模型只从提供的上下文回答(答案不在时说"我不知道")、在展示响应前加置信度阈值、以及永远先验证检索质量再责怪大语言模型

  1. 引用与事实锚定(Citations and Grounding)

一个经过事实锚定的RAG系统不只是回答——它告诉你答案从哪里来。这对用户信任和调试都至关重要

资源:

1. Anthropic:给Claude来源(文档,免费)

**链接:**https://docs.anthropic.com/en/docs/build-with-claude/citations

解释如何提示Claude生成带来源引用的响应

2. LangChain:带来源的RAG(免费)

**链接:**https://python.langchain.com/docs/how_to/qa_sources/

解释如何在LangChain RAG管道中返回来源文档和答案

重点掌握: 把chunk元数据(来源文件名、页码、URL)传入提示词上下文、指示模型在答案中引用来源、在UI或API响应中展示这些来源

  1. 你的RAG框架:LangChain还是LlamaIndex

你不需要从零构建RAG管道。两个框架主导了这个领域,都值得了解:

LlamaIndex优化了搜索和索引优先——它把摄入、分块、嵌入和查询抽象成几行代码,让你一个下午就能搭出能工作的原型

LangChain在应用更像编排引擎时发光——它擅长多智能体工作流、工具调用和条件链,在生成答案前查询多个大语言模型或外部API

第3个月,从LlamaIndex开始学RAG。到第4个月做智能体工作时再转LangChain

资源:

1. LlamaIndex:RAG介绍(官方文档,免费)

**链接:**https://developers.llamaindex.ai/python/framework/understanding/rag/

涵盖RAG五个关键阶段:加载、索引、存储、查询和评估——以及LlamaIndex如何处理每一个

2. LlamaIndex入门教程(官方文档,免费)

**链接:**https://developers.llamaindex.ai/python/framework/getting_started/starter_example/

官方快速入门。30行以内构建一个能工作的RAG系统

3. LangChain:构建RAG智能体(官方文档,免费)

**链接:**https://docs.langchain.com/oss/python/langchain/rag

展示如何用RAG智能体在非结构化文本上构建Q&A应用,从40行最小版本到带重排序的完整检索管道

练习项目: 构建一个"和你的文档聊天"应用。摄入10-20个PDF或文本文件(你自己的笔记、教科书章节、产品文档——什么都行)。构建一个FastAPI端点,接受问题,检索top 5最相关chunk(带重排序),返回来自Claude或OpenAI的带引用答案。这是一个真正的作品集项目

第3个月里程碑

到这个月底,你应该能够:

• 解释什么是嵌入,为什么相似文本产生相似向量

• 用适当策略智能分块任何文档

• 在向量数据库中存储和查询嵌入,带元数据过滤

• 加重排序步骤提升检索质量

• 系统性地调试常见检索失败

• 用LlamaIndex或LangChain构建完整的端到端RAG管道:摄入文档、检索相关chunk、返回经过事实锚定的带引用答案

⏩------------------------------------------------------------------------⏪

第4个月:智能体、工具、工作流和评估

这个月的目标:构建能自主采取一系列行动的AI系统,把多步工作流接起来,并批判性地评估它们是否在工作

到月底,你应该能从零构建一个真正的智能体,理解什么时候智能体是错误选择,并衡量你构建的任何系统的性能

这是AI工程真正变复杂的地方。第4个月的技能区分初级AI工程师和能端到端拥有整个AI功能的人

  1. 智能体循环(Agent Loops)

智能体不是魔法,它是一个surprisingly简单的模式

把智能体看作目标驱动的系统,不断循环观察、推理和行动

这个循环让它们能处理超越简单问答的任务,进入真正的自动化、工具使用和实时适应

"思考"发生在提示词里,"分支"是智能体在可用工具间选择时,"执行"是我们调用外部函数时。其他都是管道

一旦你内化这个,即使最复杂的智能体框架也变得可读

资源:

1. Anthropic:构建有效智能体(官方,免费)

**链接:**https://www.anthropic.com/research/building-effective-agents

关于生产环境智能体的最佳文章。写一行智能体代码之前先读这个

2. OpenAI:构建智能体实用指南(官方PDF,免费)

**链接:**https://cdn.openai.com/business-guides-and-resources/a-practical-guide-to-building-agents.pdf

OpenAI的补充指南,涵盖智能体模式、护栏和生产环境安全模式

3. freeCodeCamp:开源大语言模型智能体手册(免费)

**链接:**https://www.freecodecamp.org/news/the-open-source-llm-agent-handbook/

全面实用指南,涵盖智能体循环、LangGraph、CrewAI、规划、记忆和工具使用。快速上手的好资源

4. LangChain学院:LangGraph入门(免费课程)

**链接:**https://academy.langchain.com/courses/intro-to-langgraph

LangGraph的官方免费课程,最广泛使用的智能体编排框架。涵盖状态、记忆、人工介入等

重点掌握: 感知→规划→行动→观察循环、智能体循环如何终止、循环内工具调用失败时发生什么、以及为什么智能体只是while循环,由大语言模型做分支决策

练习: 不用任何框架,从零构建一个智能体——直接用OpenAI或Anthropic API。给它3个工具、一个目标和一个循环。这是理解框架到底在抽象什么的最有价值的事

  1. 工具选择(Tool Selection)

写好工具是一半工作。工具描述和参数是大语言模型的用户手册。如果手册模糊,大语言模型会误用工具。要痛苦地、不懈地明确

描述糟糕的工具会被错误调用、在错误时间调用,或被完全忽略。描述良好的工具行为可预测,在广泛输入范围内被正确选择

资源:

1. OpenAI:函数调用最佳实践(官方文档,免费)

**链接:**https://platform.openai.com/docs/guides/function-calling/best-practices

编写可靠工作工具描述的权威指南,含命名约定和参数文档模式

2. Anthropic:工具使用最佳实践(官方文档,免费)

**链接:**https://docs.anthropic.com/en/docs/build-with-claude/tool-use/implement-tool-use#best-practices-for-tool-definitions

Anthropic的等效指南。特别注意关于让模型选择vs强制特定工具的指导

重点掌握: 写自解释的动词式工具名、写描述时解释什么时候调用工具(不只是做什么)、保持参数最小且类型良好、以及设计工具时把大语言模型当作调用者

初学者提示: 测试每个工具描述时问自己:"如果我没有文档,只有这个JSON schema,我能准确知道什么时候、怎么调用它吗?"如果不能,还需要改进

  1. 状态管理(State Management)

在LangGraph中,状态是流经图的共享内存对象。它存储所有相关信息——消息、变量、中间结果和决策历史——并在执行期间自动管理

理解状态是构建能处理多轮任务、从失败恢复、并在组件间干净交接的智能体的关键

资源:

1. LangGraph官方文档:状态管理(免费)

**链接:**https://langchain-ai.github.io/langgraph/concepts/low_level/#state

权威参考。涵盖状态schema、reducer以及状态如何流经节点和边

2. DataCamp:LangGraph智能体教程(免费)

**链接:**https://www.datacamp.com/tutorial/langgraph-agents

涵盖状态、节点和边的基础,带动手代码,逐步构建到跨会话持久记忆的状态化智能体

3. Real Python:Python中的LangGraph(免费)

**链接:**https://realpython.com/langgraph-python/

thorough 教程,构建完整的状态化LangGraph智能体,详细解释状态图和条件边

重点掌握: 用TypedDict定义状态schema、reducer如何工作以合并并行更新、内存中状态和持久化检查点的区别、以及人工介入暂停如何通过检查和修改执行中的状态来工作

  1. 智能体中的重试和失败处理

智能体失败与普通大语言模型调用不同。循环中的一次糟糕工具调用可能损坏状态、导致无限循环、或静默产生错误答案。你需要对所有这些情况有明确策略

资源:

1. LangGraph:错误处理和重试(官方文档,免费)

**链接:**https://langchain-ai.github.io/langgraph/how-tos/autofill-tool-errors/

解释如何在LangGraph的工具节点级别添加自动错误处理和重试逻辑

2. OpenAI实用智能体指南:护栏部分(免费)

**链接:**https://cdn.openai.com/business-guides-and-resources/a-practical-guide-to-building-agents.pdf

涵盖护栏作为分层防御,结合基于大语言模型的检查、基于规则的过滤器如正则、以及审核API,在智能体循环的每个阶段审查输入和输出

重点掌握: 最大迭代限制防止无限循环、每个工具带指数退避的重试、在工具执行层捕获和记录异常而不让智能体崩溃、以及什么时候把失败暴露给用户vs静默重试

  1. 什么时候不用智能体

这是AI工程中最重要、最被忽视的技能之一。智能体令人兴奋,但它们也慢、贵、不可预测、难调试。知道什么时候该用更简单的东西,是良好判断的标志

Anthropic建议找到最简单的解决方案,只在需要时增加复杂度——这可能意味着根本不构建智能体系统

智能体系统用延迟和成本换取更好的任务性能,你应该仔细考虑这个权衡什么时候有意义

决策框架:

• 如果任务能用正确的上下文在一个提示词里解决,用单次大语言模型调用

• 如果步骤固定且可预测,用工作流

• 只有当步骤数量真正不可预测且需要动态决策时,才用智能体

资源:

1. Anthropic:构建有效智能体,什么时候用智能体(官方,免费)

**链接:**https://www.anthropic.com/research/building-effective-agents

关于这个问题最权威的答案,直接来自构建模型的团队

2. Simon Willison:设计智能体循环(免费)

**链接:**https://simonwillison.net/2025/Sep/30/designing-agentic-loops/

资深工程师关于什么时候智能体复杂度是合理的,以及如何思考智能体循环设计的实用观点

记住: 3个固定大语言模型调用的链永远比可能做3次调用的智能体更快、更便宜、更可调试。把智能体留给真正开放性的任务

  1. 多步工作流(Multi-Step Workflows)

在"单次提示词"和"完整智能体"之间有一个广阔的高产中间地带:工作流。工作流在任务能被干净分解成固定子任务时理想——通过让每个单独的大语言模型调用更简单、更聚焦,来用延迟换取更高准确率

常见模式包括提示词链(一次调用的输出是下一次的输入)、路由(分类输入并发送给专门处理器)、并行化(同时运行多个调用并聚合)、以及编排器-子智能体(一个大语言模型规划,其他执行)

资源:

1. Anthropic:工作流模式(官方,免费)

**链接:**https://www.anthropic.com/research/building-effective-agents#workflow-patterns

涵盖所有主要模式,带图表和代码示例。并行化和编排部分特别有用

2. LangGraph:多智能体网络(官方文档,免费)

**链接:**https://langchain-ai.github.io/langgraph/concepts/multi_agent/

解释如何把多个智能体连接成网络,含监督者和交接模式

练习项目: 构建一个3步内容管道:

第1步——一个大语言模型从文章中提取关键事实

第2步——另一个大语言模型调用用这些事实并行生成一条推文、一个LinkedIn帖子和一个摘要

第3步——最后一个大语言模型调用给三个打分并选最好的

不需要智能体,纯工作流

  1. 评估框架(Evaluation Harnesses)

评估是你知道AI系统是否真正在工作的方式——不只是在你手工测试的示例上,而是系统地在数百个输入上

AI智能体强大但部署复杂,因为它们的概率性、多步行为引入了许多失败点

智能体的不同部分——大语言模型、工具、检索器和工作流——每个都需要自己的评估方法

资源:

1. DeepEval(开源,免费)

**链接:**https://deepeval.com/docs/getting-started

受pytest启发的开源大语言模型评估框架。写带输入和预期输出的测试用例,用50+内置指标运行,包括幻觉、答案相关性、事实一致性,并在版本间捕获回归

**2.**Promptfoo(开源,免费)

**链接:**https://github.com/promptfoo/promptfoo

测试和评估大语言模型应用的CLI和库,带自动化测试套件。支持多提示词跨多模型的并排比较、CI/CD集成、以及安全漏洞红队测试

3. LangSmith(免费版)

**链接:**https://smith.langchain.com/

LangChain和LangGraph应用的追踪、调试和评估。免费版很慷慨,追踪UI让调试智能体循环dramatically更容易

4. Ragas(开源,免费)

**链接:**https://docs.ragas.io/

RAG管道的专门评估框架。衡量忠实度、答案相关性、上下文精确度和上下文召回率。如果你评估第3个月的RAG系统,这是必不可少的

重点掌握: 构建20-50个代表性输入的黄金测试集,带预期输出或评分标准;写确定性评分输出的评估函数(字符串匹配、JSON schema验证)或用LLM-as-judge;以及在改变提示词或换模型时自动运行评估

关键心态: 评估不是可选的润色。你做的每个提示词更改、模型替换或检索调整,如果不运行评估就是在赌博。能交付可靠AI产品的工程师 constantly 运行评估

  1. 任务成功指标(Task Success Metrics)

超越自动化评估,你需要指标告诉你智能体是否真正完成了它的实际目标

资源:

1. Hamel Husain:你的AI产品需要评估(免费)

**链接:**https://hamel.dev/blog/posts/evals/

关于为真实生产AI系统构建评估管道的最实用文章之一,作者有大规模实践经验

2. OpenAI Evals框架(开源,免费)

**链接:**https://github.com/openai/evals

OpenAI自己的评估框架,有大量社区贡献的评估模式可以适配

重点掌握: 过程指标(智能体调用了正确的工具吗?)和结果指标(任务成功了吗?)的区别、在构建任何东西前定义清晰的成功标准、以及用LLM-as-judge评估抵抗精确匹配的输出(如长篇答案或多步推理轨迹)

练习项目: 拿你第3个月的RAG管道,围绕它构建一个适当的评估框架。从文档创建30个问答对,通过管道运行,用DeepEval给每个答案的相关性、忠实度和完整性打分。然后改变一个东西(chunk大小、模型、top-k)重新运行,看是否改善了

第4个月里程碑

到这个月底,你应该能够:

• 解释什么是智能体循环,不用框架从零实现一个

• 写能被正确可靠选择的工具描述

• 用LangGraph或等效工具正确管理智能体状态

• 在智能体循环内处理失败而不崩溃

• 自信地决定一个任务需要智能体、工作流还是单次提示词

• 构建能链式、路由和并行化大语言模型调用的多步工作流

• 写自动化评估,在改变提示词或模型时捕获回归

• 为你构建的任何AI系统定义和衡量任务成功指标

⏩------------------------------------------------------------------------⏪

第5个月:部署、产品思维和可靠性

这个月的目标:把你构建的所有东西变成生产就绪的

到月底,你应该能部署一个处理真实用户、真实流量和真实失败的AI应用,不会在凌晨2点崩溃

这是大多数AI工程师卡住的地方。他们能构建很棒的demo,但无法交付能在真实世界生存的产品

这里的技能是公司真正付钱的:可靠性、安全、成本控制,以及当某些东西不可避免地坏掉时保持运行的能力

  1. FastAPI生产模式

第1个月你已经知道怎么构建FastAPI应用。现在你需要让它在生产流量下生存

开发和生产的区别是残酷的。单个uvicorn进程带–reload对构建来说很好。在生产环境,真实流量一到它就变成瓶颈

你真正需要的:多worker ASGI配置、适当的错误处理中间件、健康检查端点和CORS策略

资源:

1. FastAPI部署文档(官方,免费)

**链接:**https://fastapi.tiangolo.com/deployment/

官方指南,涵盖Uvicorn worker、Gunicorn和Docker部署。先做其他任何事之前从这里开始

2. FastAPI生产部署指南(CYS文档,免费)

**链接:**https://craftyourstartup.com/cys-docs/fastapi-production-deployment/

全面的生产模式:Gunicorn配置、Nginx反向代理、健康检查、速率限制。包含你能适配的真实配置文件

3. FastAPI生产最佳实践(FastLaunchAPI,免费)

**链接:**https://fastlaunchapi.dev/blog/fastapi-best-practices-production-2026

涵盖异步数据库连接池、Redis缓存、JWT认证和后台任务。来自100+开发者使用的真实模板的生产测试模式

重点掌握: 用Uvicorn worker运行Gunicorn(不是裸Uvicorn)、设置健康检查端点、加CORS中间件、实现适当的异步数据库会话、以及对任何不需要阻塞响应的东西使用后台任务

  1. Docker

Docker是你停止说"在我机器上能跑",开始交付一致部署的方式

如果你构建AI应用,Docker解决依赖冲突、确保环境一致、让扩展变得简单

你不需要成为Docker专家。你需要能把FastAPI + 大语言模型应用容器化,并部署到任何地方

资源:

1. Docker官方入门指南(免费)

**链接:**https://docs.docker.com/get-started/

标准起点。涵盖镜像、容器、Dockerfile和Docker Compose

2. freeCodeCamp:如何用Python和Docker构建部署多智能体AI系统(免费)

**链接:**https://www.freecodecamp.org/news/build-and-deploy-multi-agent-ai-with-python-and-docker/

实用端到端教程,用Docker Compose构建真实的多智能体管道。涵盖关注点分离、cron调度和安全考虑

3. DataCamp:使用Docker部署大语言模型应用(免费)

**链接:**https://www.datacamp.com/tutorial/deploy-llm-applications-using-docker

专门针对带RAG管道的大语言模型应用的分步指南。涵盖Dockerfile创建、环境管理和部署

4. 大语言模型应用的Docker容器化(ApXML,免费)

**链接:**https://apxml.com/courses/python-llm-workflows/chapter-10-deployment-operational-practices/containerization-docker-llm-apps

涵盖基础镜像选择、依赖管理、多阶段构建和Docker Compose多服务大语言模型部署

重点掌握: 为Python/FastAPI应用写Dockerfile、用多阶段构建保持镜像小巧、Docker Compose多服务设置(应用+数据库+Redis)、环境变量管理密钥、以及.dockerignore避免泄露敏感文件

练习项目: 把你第3个月的RAG应用容器化。创建一个docker-compose.yml,运行你的FastAPI应用、向量数据库(Chroma或Qdrant)和Redis缓存。部署它,让docker compose up启动一切

  1. 后台任务和队列

大语言模型调用很慢。如果用户让你的应用处理文档,你让他们等30秒响应,他们会离开

后台任务让你立即接受请求,异步处理,完成后通知用户

资源:

1. Celery官方入门指南(免费)

**链接:**https://docs.celeryq.dev/en/stable/getting-started/introduction.html

标准Python任务队列。涵盖基础设置、任务定义和worker管理

2. FastAPI后台任务文档(官方,免费)

**链接:**https://fastapi.tiangolo.com/tutorial/background-tasks/

内置轻量级后台任务,用于简单场景。快速fire-and-forget任务用这个,更重的用Celery

重点掌握:什么时候用FastAPI内置BackgroundTasks vs proper 任务队列如Celery、设置Redis作为消息代理、处理任务失败和重试、以及向用户返回任务状态

  1. 认证和API密钥安全

如果你的AI应用有API,它需要认证。没有的话,任何人都能用你的端点,烧光你的大语言模型额度,你会醒来看到5000美元账单

资源:

1. FastAPI安全文档(官方,免费)

**链接:**https://fastapi.tiangolo.com/tutorial/security/

涵盖OAuth2、JWT token、API key和基于依赖的认证模式。官方参考,完整做一遍教程

2. OWASP API安全Top 10(免费)

**链接:**https://owasp.org/API-Security/

API安全风险的权威列表。在发布任何东西前理解破损认证、注入和批量分配

3. Auth0:API认证最佳实践(免费)

**链接:**https://auth0.com/docs/get-started/authentication-and-authorization

在API中实现认证和授权的实用指南

重点掌握: 用户认证用JWT token、服务间通信用API key管理、每个用户/key的速率限制、永远不把密钥存在代码里(用环境变量)、以及理解认证(你是谁)和授权(你能做什么)的区别

  1. 日志和可观测性

在生产环境,如果你看不到发生了什么,你就无法修复坏掉的东西

大语言模型应用有一个独特挑战:模型可以返回200状态码,但仍产生无用或幻觉的答案。传统监控抓不到这个。你需要大语言模型特定的可观测性

资源:

1. Langfuse(开源,免费版)

**链接:**https://langfuse.com/docs/observability/overview

开源大语言模型可观测性平台。追踪每个请求:发送的提示词、收到的响应、token使用、延迟、工具调用。支持提示词版本管理、评估和LLM-as-judge评分。集成OpenAI、Anthropic、LangChain、LlamaIndex

2. LangSmith(免费版)

**链接:**https://smith.langchain.com/

LangChain团队出品。如果你用LangChain/LangGraph,设置就是一个环境变量。追踪、调试、监控面板和在线评估。免费版对开发和小规模生产很慷慨

3. Python Structlog(免费)

**链接:**https://www.structlog.org/

Python结构化日志。产生实际可搜索和可解析的JSON日志。对生产应用远优于print()或基础日志

重点掌握: 追踪每个大语言模型调用(输入提示词、输出、token、延迟、成本)、用JSON输出的结构化日志、设置显示请求量、错误率和每日成本的面板、以及当某些东西坏掉或成本飙升时告警

  1. 提示词管理与版本控制

在生产环境里,提示词(Prompt)就是你的代码。它们需要版本管理、测试覆盖,以及随时回滚的能力。

在生产环境修改提示词却不记录变更内容——这是搞崩系统还找不到原因的典型做法。

学习资源:

1. Langfuse 提示词管理(免费)

**链接:**https://langfuse.com/docs/prompts

集中式的提示词版本管理,内置测试沙盒。将提示词的版本控制与应用代码解耦,无需重新部署应用即可上线新的提示词版本。

2. Anthropic 提示词管理最佳实践(免费)

**链接:**https://docs.anthropic.com/en/docs/build-with-claude/prompt-engineering/overview

大规模场景下组织、迭代和管理提示词的实战经验。

重点掌握: 将提示词抽离出应用代码单独存放;每次修改都记录版本;在生产环境对提示词变体进行 A/B 测试;当新版本表现不佳时,要有快速回滚的预案。


  1. 成本监控与速率限制

大语言模型(LLM)的 API 按 Token 计费。如果没有成本管控,一次流量洪峰或者提示词里的一个 bug,几分钟就能烧掉几百美元。

学习资源:

1. OpenAI 用量仪表盘(官方)

**链接:**https://platform.openai.com/usage

按模型、按天追踪支出,并设置用量上限。

2. Anthropic 用量仪表盘(官方)

**链接:**https://console.anthropic.com/ 用于监控 Claude API 的用量。

3. Helicone(免费版)

**链接:**https://www.helicone.ai/

基于代理的可观测性平台,自动捕获每一次 LLM 调用并追踪成本。接入方式极其简单:只需修改一行 base URL 即可。

4. LiteLLM(开源,免费)

**链接:**https://github.com/BerriAI/litellm

统一封装了 100 多家 LLM 提供商的接口。内置预算管理、速率限制和跨平台支出追踪功能。

重点掌握: 设置每日/每月的硬性支出上限;在 API 层面为每个用户配置速率限制;简单任务用便宜的模型(别什么事都上 GPT-4/Opus);用 Redis 缓存重复的相同请求;监控单次请求成本,及时发现那些"烧钱"的提示词。


  1. 缓存策略

如果 20% 的用户都在问相似的问题,你就是在为同一个 LLM 调用重复付费 20 次。

缓存是同时降低成本和延迟的最简单手段。

学习资源:

1. Redis 官方文档(免费)

**链接:**https://redis.io/docs/

标准的内存数据存储。速度快、使用简单,非常适合做 LLM 响应缓存。

2. GPTCache(开源,免费)

**链接:**https://github.com/zilliztech/GPTCache

专为 LLM 应用设计的语义缓存。利用嵌入(Embedding)相似度来匹配语义相近(而不仅是完全相同)的查询,直接返回缓存结果。

重点掌握: 完全匹配的精确缓存;语义相近查询的模糊缓存;缓存失效策略(TTL 过期时间是最简单的方案);统计缓存命中率,量化实际节省的成本。


第五个月里程碑

到这个月底,你应该能够:

• 用 Docker 部署配置完善的 FastAPI + LLM 应用

• 用后台任务和队列处理耗时操作

• 为 API 配置认证、速率限制和 API 密钥管理

• 用 Langfuse 或 LangSmith 追踪和调试 LLM 调用

• 对提示词进行版本控制并具备回滚能力

• 实时监控成本并设置支出上限

• 缓存 LLM 响应以降低延迟和成本

⏩------------------------------------------------------------------------⏪

第六个月:选定方向,让自己具备求职竞争力

前五个月积累的知识和技能,可以往三个方向深耕(当然,这只是我看到的方向)。

你需要选一个,然后专注实战。

虽然前面说的所有内容,最好的学习方式也都是动手做。


方向一:AI 产品工程师

适合想快速进入创业公司的人

这是最常见的路径。你构建的是真实用户会使用的 AI 驱动产品。

前五个月的技能储备已经差不多了,这个月要在产品层面继续深挖。

聚焦领域:

• LLM 应用

• 检索增强生成(RAG)

• 智能体(Agent)

• 部署运维

• 产品用户体验(UX)

本月学习内容:

1. 端到端产品构建

别再写教程 Demo 了。去做人们能真正使用的产品。

学习资源:

1. Vercel AI SDK(免费)

**链接:**https://sdk.vercel.ai/docs

构建支持流式输出(Streaming)的 AI 用户界面的最快方式。提供 React、Next.js 和 Vue 的集成方案,内置流式 UI 组件。

2. Streamlit(免费)

**链接:**https://docs.streamlit.io/

纯 Python 构建数据应用和 AI 演示工具。适合内部工具和最小可行产品(MVP),但不适合生产级用户界面。

3. Gradio(免费)

**链接:**https://www.gradio.app/docs

用最少代码快速搭建机器学习/AI 界面。特别适合模型演示和原型开发。

重点掌握: 这个月至少完成 2-3 个能拿出来演示的完整项目。比如"与你的文档对话"应用、AI 驱动的内部工具、或者能自动化真实工作流的智能体。把它们发布出来,放到 GitHub 上,部署到别人能访问的地方。

2. AI 产品的用户体验设计

AI 产品失败,往往不是因为模型不行,而是用户体验没有考虑到模型的局限性。

学习资源:

1. Google:人机交互指南(免费)

**链接:**https://pair.withgoogle.com/guidebook/

设计人机协作体验的最佳资源。涵盖预期管理、错误处理和信任建立。

2. Nielsen Norman Group:AI 用户体验准则(免费)

**链接:**https://www.nngroup.com/topic/artificial-intelligence/

基于研究的 AI 界面设计准则。

重点掌握: 流式输出时的加载状态怎么处理;模型出错时该展示什么;如何让用户提供反馈;以及最重要的一点——AI 的输出是概率性的,它有时会出错,你的设计必须为此做好准备。


方向二:应用机器学习 / 大语言模型工程师

适合想要更深入技术岗位的人

这个方向适合那些不满足于仅仅调用 API,而是想理解底层原理的工程师。

聚焦领域:

• 微调(Fine-tuning)

• 何时微调、何时用提示工程

• 模型评估

• 推理优化

• 开源模型

• 训练流水线

本月学习内容:

1. 何时微调,何时提示工程

应用机器学习中最关键的决策:你是需要改变模型本身,还是只需要改变跟它对话的方式?

学习资源:

1. Google 机器学习速成课:微调、蒸馏与提示工程(免费)

**链接:**https://developers.google.com/machine-learning/crash-course/llm/tuning

最清晰的三种方法对比,以及各自适用的场景。

2. Codecademy:提示工程 vs 微调(免费)

**链接:**https://www.codecademy.com/article/prompt-engineering-vs-fine-tuning

实用的决策框架,附带清晰的用例说明。

3. IBM:RAG vs 微调 vs 提示工程(免费)

**链接:**https://www.ibm.com/think/topics/rag-vs-fine-tuning-vs-prompt-engineering

覆盖完整的决策空间,包括何时组合使用多种方法。

决策框架(请牢记): 先从提示工程开始(最便宜、最快);如果模型需要访问特定数据,加上检索增强生成(RAG);只有当提示工程 + RAG 都无法达到所需的质量、一致性或延迟要求时,才考虑微调。

2. 微调实战

当你确实需要微调时,该怎么做。

学习资源:

1. OpenAI 微调指南(官方,免费)

**链接:**https://platform.openai.com/docs/guides/fine-tuning

最简单的微调入门方式。上传 JSONL 格式的数据集,运行任务,获得定制模型。即使后续转向开源模型,这也是学习流程的最佳起点。

2. HuggingFace Transformers 微调教程(免费)

**链接:**https://huggingface.co/docs/transformers/training

处理开源模型的标准库。涵盖训练、评估和模型保存。

3. Unsloth(开源,免费)

**链接:**https://github.com/unslothai/unsloth

微调速度提升 2 倍,显存占用减少 80%。开箱即用支持 LoRA 和 QLoRA。在消费级硬件上微调开源模型的最快路径。

4. LLaMA-Factory(开源,免费)

**链接:**https://github.com/hiyouga/LLaMA-Factory

统一框架,支持 100 多个大语言模型的微调。提供无代码的 Web UI,支持 LoRA、QLoRA、全量微调、RLHF 和 DPO。

重点掌握: 准备训练数据集(JSONL 格式);理解 LoRA 和 QLoRA(参数高效微调);在 OpenAI 或 HuggingFace 上运行一次微调任务;评估微调后的模型与基座模型的差异;以及知道什么时候微调根本不值得投入成本。

3. 开源模型

不是所有事都得走 OpenAI 或 Anthropic。开源模型给你完全的控制权、零 API 成本,以及本地部署的能力。

学习资源:

1. Ollama(免费)

**链接:**https://ollama.ai/

一条命令本地运行开源大语言模型。支持 Llama、Mistral、Gemma 等数十种模型。体验开源模型最快的方式。

2. HuggingFace 模型中心(免费)

**链接:**https://huggingface.co/models

最大的开源模型仓库。浏览、下载和部署适用于任何任务的模型。

3. vLLM(开源,免费)

**链接:**https://github.com/vllm-project/vllm

高吞吐量的大语言模型推理引擎。比原生的 HuggingFace 服务快 2-4 倍。开源模型生产部署的事实标准。

重点掌握: 用 Ollama 本地运行模型进行测试;理解量化(GGUF、GPTQ、AWQ)及其对部署的意义;针对你的具体场景,对比开源模型与 API 模型的表现;用 vLLM 在生产环境 serving 模型。

4. 推理优化

让模型在生产环境跑得更快、更便宜。

学习资源:

1. HuggingFace:大语言模型推理优化(免费)

**链接:**https://huggingface.co/docs/transformers/llm_optims

涵盖 KV-cache 优化、量化和批处理策略。

2. NVIDIA TensorRT-LLM(免费)

**链接:**https://github.com/NVIDIA/TensorRT-LLM

在 NVIDIA GPU 上实现极致推理性能。大多数大规模生产级 LLM 服务都在用它。

重点掌握: 提升吞吐量的批处理策略;降低显存和成本的量化技术;加速生成的 KV-cache 优化;以及为你的推理负载选择合适的硬件。


方向三:AI 自动化工程师

适合想立即为企业创造价值的人

这个方向聚焦于用 AI 自动化真实的业务流程。重点不是做产品,而是解决运营层面的实际问题。

聚焦领域:

• 工作流编排

• 业务流程自动化

• 多工具集成系统

• CRM、文档、邮件、客服、运维等场景

本月学习内容:

1. 工作流编排

真实的业务自动化几乎从来不是单次 LLM 调用。它是跨多个系统的动作链条。

学习资源:

1. n8n(开源,可自托管免费版)

**链接:**https://docs.n8n.io/

可视化工作流自动化,内置 AI 节点。将大语言模型连接到 400 多个集成(Slack、Gmail、Notion、CRM 等)。AI 自动化的最佳低代码/无代码方案。

2. LangGraph:多智能体工作流(免费)

**链接:**https://langchain-ai.github.io/langgraph/concepts/multi_agent/

代码优先的复杂多智能体系统编排。当 n8n 不够用,你需要完全编程化控制时的选择。

3. Temporal(开源,免费)

**链接:**https://docs.temporal.io/

持久化工作流引擎,适用于长时间运行、具备容错能力的流程。当你的自动化需要扛住崩溃、重试和超时的时候,用它。

重点掌握: 设计能优雅处理失败的工作流;将 AI 接入真实的业务工具(邮件、CRM、数据库、表格);构建需要人工审批的环节;记录每一次自动化操作,形成审计追踪。

2. 业务流程自动化

AI 自动化的真金白银,在于解决那些具体且昂贵的业务问题。

学习资源:

1. Zapier AI Actions(免费版)

**链接:**https://zapier.com/ai

无需代码将 AI 连接到 6000 多个应用。适合在构建定制化方案之前,先快速验证自动化原型。

2. Make(原 Integromat)(免费版)

**链接:**https://www.make.com/

可视化自动化平台,支持高级逻辑和 AI 集成。处理复杂工作流时比 Zapier 更强大。

重点掌握: 识别投资回报率(ROI)最高的自动化目标(通常是那些重复、耗时、规则明确的任务);构建增强人类能力而非取代人类的自动化;量化实际节省的时间和金钱。

3. CRM、文档、邮件、客服自动化

最常见、也最有价值的 AI 自动化场景。

学习资源:

1. OpenAI Cookbook:AI 驱动的邮件处理(免费)

**链接:**https://github.com/openai/openai-cookbook

用 AI 对邮件进行分类、路由和回复的实战模式。

2. LangChain:文档处理流水线(免费)

**链接:**https://python.langchain.com/docs/how_to/#document-loaders

从 80 多个来源摄取和处理文档。

重点掌握: 搭建 AI 驱动的邮件分类器和自动回复系统;构建能从文档中提取结构化数据的处理流水线;基于知识库做检索增强生成(RAG),搭建客服聊天机器人;将 AI 集成到现有的 CRM 工作流中(HubSpot、Salesforce 等)。

方向三的实战项目: 构建一个端到端的销售线索(Lead)筛选系统。它需要:

• 从某个来源抓取或导入线索(CSV、API 或表单)

• 用大语言模型(LLM)调研每条线索(公司信息、匹配度评估)

• 根据你的理想客户画像(ICP)打分和排序

• 起草个性化的 outreach 消息

• 将所有记录同步到表格或 CRM

这是一个真实可售的自动化方案,企业愿意为此付费。

⏩------------------------------------------------------------------------⏪

结语

六个月后,你能期待什么?

说实话,如果没有金山银山砸进去,这份路线图没法让你在六个月内成为资深 AI 工程师。

但它能让你成为一个能构建、发布、部署真实 AI 系统、解决真实问题的人。

而此时此刻,市场恰恰愿意为这样的人买单。

AI 工程师的需求没有放缓。招聘职位同比增长了 25%。

普华永道(PwC)发现,要求 AI 技能的岗位比同等非 AI 岗位薪资高出 56%。

只有 1% 的企业被认为"AI 成熟",意味着 99% 的企业仍需要帮助。美国劳工统计局预测,到 2034 年相关岗位将增长 26%。

这些不是炒作数字,是真实的行业数据(从 Claude 那儿搬来的,哈哈)。

如果你在美国全职工作:

初级 AI 工程师 起薪在 9 万 - 13 万美元

中级(3-5 年经验)15.5 万 - 20 万美元

资深岗位 可达 19.5 万 - 35 万美元以上

根据 Glassdoor(2026 年 3 月)的数据,平均薪资是 184,757 美元

中级岗位增长最快,年增长率 9.2%,因为企业迫切需要那些能独立交付生产级 AI、不需要时刻盯着的人。

如果你更喜欢自由职业:

AI 智能体(Agent)开发 收费 175-300 美元/小时

检索增强生成(RAG)实施****150-250 美元/小时

大语言模型(LLM)集成****125-200 美元/小时

Reddit 上有位开发者,两周时间为一家律所做了一个文档摘要工具,赚了 8000 美元。一位自由职业者每周计费 25 小时,时薪 150 美元,年收入 19.5 万美元。

如果你走咨询路线,就像我之前帖子说的,你可以收费:

为企业搭建 AI 智能体300-5000 美元

AI 内容管理500-2000 美元/月

客服自动化1000-4000 美元

冷启动外联方案500-2000 美元

服务范围还可以更广,但一旦掌握了这份路线图里的技能,你在 2026 年就已经是抢手专家了。

这些都是真实的人、做真实的事、赚真实的钱。

好了,下面是我真正想让你记住的东西:

每个月选一个项目,动手做出来。不是读一遍,不是看教程,是亲手构建它、搞崩它、修复它、部署它、放到 GitHub 上。能被录用的工程师,是那些展示了作品的人,而不是那些只展示了学习记录的人。

开始分享你学到的东西。在 X、LinkedIn 或者任何地方写下来。教别人是最快的学习方式,同时也能建立你的个人品牌。我见过最好的机会,都来自那些被人看见的人,而不是投了 500 份简历的人。

还有,别等到"感觉准备好了"才行动。你永远不会感觉准备好。"我在学习"和"我在做事"之间的鸿沟,是大多数人永远卡住的地方。

一旦你有了能跑起来的项目,就开始投递简历、开始接自由职业、开始提供服务。即使它们还不够完美。市场不奖励完美,市场奖励能交付的人。

六个月,如果你真的投入进去,足以改变一切。

我真的相信,正在读这篇文章的每一个人都能做到。

只要永远不要停止构建,永远不要停止学习。

最后

对于正在迷茫择业、想转行提升,或是刚入门的程序员、编程小白来说,有一个问题几乎人人都在问:未来10年,什么领域的职业发展潜力最大?

答案只有一个:人工智能(尤其是大模型方向)

当下,人工智能行业正处于爆发式增长期,其中大模型相关岗位更是供不应求,薪资待遇直接拉满——字节跳动作为AI领域的头部玩家,给硕士毕业的优质AI人才(含大模型相关方向)开出的月基础工资高达5万—6万元;即便是非“人才计划”的普通应聘者,月基础工资也能稳定在4万元左右

再看阿里、腾讯两大互联网大厂,非“人才计划”的AI相关岗位应聘者,月基础工资也约有3万元,远超其他行业同资历岗位的薪资水平,对于程序员、小白来说,无疑是绝佳的转型和提升赛道。
图片
图片
对于想入局大模型、抢占未来10年行业红利的程序员和小白来说,现在正是最好的学习时机:行业缺口大、大厂需求旺、薪资天花板高,只要找准学习方向,稳步提升技能,就能轻松摆脱“低薪困境”,抓住AI时代的职业机遇。

如果你还不知道从何开始,我自己整理一套全网最全最细的大模型零基础教程,我也是一路自学走过来的,很清楚小白前期学习的痛楚,你要是没有方向还没有好的资源,根本学不到东西!

下面是我整理的大模型学习资源,希望能帮到你。

请添加图片描述

👇👇扫码免费领取全部内容👇👇

在这里插入图片描述

1、大模型学习路线

img

2、从0到进阶大模型学习视频教程

从入门到进阶这里都有,跟着老师学习事半功倍。

在这里插入图片描述

3、 入门必看大模型学习书籍&文档.pdf(书面上的技术书籍确实太多了,这些是我精选出来的,还有很多不在图里)

在这里插入图片描述

4、 AI大模型最新行业报告

2026最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

img

5、面试试题/经验

img

【大厂 AI 岗位面经分享(107 道)】

img

【AI 大模型面试真题(102 道)】

img

【LLMs 面试真题(97 道)】

img

6、大模型项目实战&配套源码

img

适用人群

在这里插入图片描述

四阶段学习规划(共90天,可落地执行)
第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范
第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署
第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建
第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型

  • 带你了解全球大模型

  • 使用国产大模型服务

  • 搭建 OpenAI 代理

  • 热身:基于阿里云 PAI 部署 Stable Diffusion

  • 在本地计算机运行大模型

  • 大模型的私有化部署

  • 基于 vLLM 部署大模型

  • 案例:如何优雅地在阿里云私有部署开源大模型

  • 部署一套开源 LLM 项目

  • 内容安全

  • 互联网信息服务算法备案

  • 👇👇扫码免费领取全部内容👇👇

    在这里插入图片描述

3、这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。
在这里插入图片描述
在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐