AI 开发工程师学习路线(2026 版)
·
AI 开发工程师学习路线(2026 版)
一、先搞清楚:AI 开发工程师在做什么
常见三类岗位,学习重点不同:
| 方向 | 日常工作 | 核心能力 |
|---|---|---|
| AI 应用开发(推荐入门) | RAG、Agent、Copilot、智能客服、AI 工作流 | Python/TS、LLM API、Prompt、向量库、后端 |
| 机器学习工程师 | 训练/微调模型、特征工程、评估 | 数学、PyTorch、数据、实验 |
| MLOps / 平台 | 部署、监控、流水线、GPU 调度 | Docker、K8s、推理服务、评测体系 |
建议路径:先走 AI 应用开发 → 有基础后再补 ML / MLOps,比一上来啃论文更稳。
二、整体路线图(约 12–18 个月)
阶段 0:编程与计算机基础(1–2 个月)
目标:能独立写脚本、读文档、调试报错。
必学
- Python 3.10+:变量、函数、类、异常、文件 IO、虚拟环境(
venv/conda) - Git:
clone、commit、branch、PR 流程 - Linux 基础:常用命令、
ssh、路径、权限 - 数据结构与算法(够用版):数组、哈希表、栈队列、树、图的基本概念;LeetCode 简单题 30–50 道即可(应用岗不卷竞赛)
推荐资源
- Python 官方教程
- 廖雪峰 Python 教程 / 菜鸟教程(中文入门)
- 《流畅的 Python》选读
验收标准
- 写一个 CLI 小工具(如:批量重命名、CSV 统计)
- 代码托管到 GitHub,有 README
阶段 1:Web 与后端基础(1–2 个月)
目标:能搭 API,这是 AI 应用落地的载体。
必学
- HTTP / REST:GET/POST、JSON、状态码
- FastAPI(Python 首选)或 Flask
- 前端基础(了解即可):HTML/CSS/JS,或直接用 React/Vue 模板
- 数据库:PostgreSQL + SQL 基础;了解 Redis 缓存
- 异步编程:
async/await概念
推荐资源
- FastAPI 官方文档(质量很高)
- freeCodeCamp 后端课程
验收标准
- 做一个 Todo API + 简单前端,含用户登录(JWT)
- 部署到云(阿里云 / 腾讯云 / Railway / Render 任一)
阶段 2:机器学习与深度学习基础(2–3 个月)
目标:理解 AI 在「算什么」,不是只会调 API。
数学(够用版,别被吓退)
- 线性代数:向量、矩阵乘法、点积(为 Embedding 打基础)
- 概率统计:均值、方差、正态分布、贝叶斯直觉
- 微积分:导数、梯度下降概念即可
ML 核心
- 监督 / 无监督 / 强化学习概念
- 训练集 / 验证集 / 测试集、过拟合、正则化
- 常见算法:线性回归、逻辑回归、决策树、KNN(知道原理即可)
- scikit-learn:分类、回归、聚类实战
深度学习
- PyTorch(国内资料多,工业界主流)
- 神经网络、反向传播、损失函数、优化器
- CNN(图像)、RNN/Transformer 概念(重点在 Transformer)
- 用 Hugging Face 加载预训练模型做推理
推荐资源
- 吴恩达 Machine Learning Specialization(Coursera)
- 李沐 《动手学深度学习》 + B 站视频
- fast.ai Practical Deep Learning(偏实战)
验收标准
- 用 PyTorch 训练一个 MNIST / CIFAR-10 分类器
- 用 Hugging Face 做 文本分类 或 情感分析 微调(LoRA 即可)
阶段 3:大模型与 RAG(2–3 个月)⭐ 核心
目标:掌握当前 AI 开发工程师 80% 的工作内容。
必学概念
- Token、Context Window、Temperature、Top-p
- Prompt Engineering:系统提示、Few-shot、Chain-of-Thought
- Embedding:文本向量化、相似度(余弦)
- RAG 架构:文档切分 → Embedding → 向量检索 → 拼 Prompt → LLM 生成
- 向量数据库:Chroma、Milvus、Qdrant、pgvector 至少熟练一种
- 评估:幻觉、召回率、答案相关性(RAGAS 等框架)
工具栈
| 类别 | 推荐 |
|---|---|
| LLM 调用 | OpenAI API、Anthropic、国内:通义、文心、智谱、DeepSeek |
| 框架 | LangChain、LlamaIndex(二选一深入,都了解更好) |
| 本地模型 | Ollama + Llama / Qwen 系列 |
| 文档解析 | PyPDF、Unstructured、Markdown 切分策略 |
推荐资源
- DeepLearning.AI 短课:ChatGPT Prompt Engineering、Building Systems with ChatGPT API
- LangChain / LlamaIndex 官方文档 + 示例
- 吴恩达《Generative AI for Everyone》
验收标准(重要作品集)
做一个 「私有知识库问答系统」:
- 上传 PDF/Markdown
- 支持多轮对话 + 引用来源
- FastAPI 后端 + 简单 Web UI
- 写清楚:切分策略、Embedding 模型、检索 Top-K、Prompt 模板
阶段 4:Agent 与工程化(2–3 个月)⭐ 进阶
目标:从「聊天机器人」升级到「能做事的 AI 系统」。
必学
- Function Calling / Tool Use:让 LLM 调用搜索、数据库、代码执行
- Agent 模式:ReAct、Plan-and-Execute、多 Agent 协作
- 代码 Agent:Cursor、Devin 类产品背后的思路(工具 + 循环 + 反思)
- 结构化输出:JSON Schema、Pydantic 约束模型输出
- 流式响应:SSE / WebSocket
- 安全:Prompt 注入、权限边界、敏感数据脱敏
框架
- LangGraph(LangChain 生态,适合复杂 Agent 状态机)
- CrewAI / AutoGen(多 Agent,了解即可)
- MCP(Model Context Protocol):2025–2026 热门,Cursor 等 IDE 在用
MLOps 入门(应用岗也要会)
- Docker:容器化 AI 服务
- 模型推理:vLLM、TGI、Ollama 批量推理
- 监控:日志、Token 用量、延迟、错误率
- CI/CD:GitHub Actions 自动测试与部署
验收标准
- AI 助手 Agent:能查天气/搜网页/读写本地文件/调用你的 API(至少 3 个 Tool)
- 代码审查 Bot 或 数据分析 Agent(自然语言 → 生成 SQL/Python → 出图表)
- 全部 Docker 化,有一键启动说明
阶段 5:专项深化(按兴趣选 1–2 条)
路线 A:模型微调与算法向
- PEFT:LoRA、QLoRA
- SFT / RLHF / DPO 概念与实战
- 数据集构造、标注、评测集设计
- 读论文:Attention Is All You Need、RAG 相关、LoRA 论文
- 工具:Transformers、PEFT、TRL、Unsloth
路线 B:多模态
- 图像:CLIP、Stable Diffusion API、ComfyUI
- 语音:Whisper、TTS
- 视频理解基础
路线 C:AI 产品 / 全栈
- Next.js + Vercel AI SDK
- 支付、用量计费、多租户 SaaS 架构
- 用户体验:流式 UI、打字机效果、引用高亮
三、每周学习节奏建议(在职 / 业余)
| 时间 | 内容 |
|---|---|
| 工作日 1.5–2h | 视频/文档 + 跟着敲代码 |
| 周末 4–6h | 做小项目、写博客总结 |
| 每月 | 完成 1 个小里程碑,更新 GitHub |
原则:70% 动手写代码,30% 看理论;每学一个概念就写进项目里。
四、作品集(求职最关键)
按优先级做这 5 个项目,比证书更有用:
- RAG 知识库问答(必做)
- 多 Tool Agent 助手(必做)
- AI 代码助手 / SQL 数据分析 Agent
- 模型微调 Demo(如:垂直领域客服 LoRA)
- 开源贡献:给 LangChain/LlamaIndex 提 PR,或写高质量教程
每个项目 README 需包含:
- 架构图
- 技术选型理由
- 本地运行步骤
- Demo 截图或在线地址
- 已知局限与改进方向
五、推荐技术栈清单(2026 求职版)
语言:Python(主)+ TypeScript(可选,全栈向)
后端:FastAPI
AI:LangChain / LangGraph、LlamaIndex、OpenAI SDK
向量库:Chroma / Qdrant / pgvector
数据库:PostgreSQL、Redis
部署:Docker、Nginx、云函数或 K8s(进阶)
监控:LangSmith / Langfuse / 自建日志
本地:Ollama、vLLM
版本管理:Git、GitHub
六、学习资源汇总
中文
- 李沐《动手学深度学习》
- DataWhale 开源教程(机器学习、LLM 方向)
- B 站:跟李沐、跟各类 RAG/Agent 实战 UP 主
英文(质量高,建议逐步适应)
- DeepLearning.AI 短课系列
- Hugging Face Course
- LangChain Academy
社区
- GitHub Trending(AI 相关)
- Hugging Face Hub
- 国内:魔搭 ModelScope
七、常见误区
- 只学 Prompt,不学工程 → 面试和实际工作都会卡住
- 数学拖太久不上手 → 先会用再补数学
- 项目太散 → 围绕 RAG + Agent 做深,比做 10 个 Hello World 强
- 忽略评估与安全 → 企业很看重幻觉控制、权限、成本
- 不写文档不开源 → HR 和技术面试官都看 GitHub
八、岗位能力与时间对照(参考)
| 时间点 | 能力水平 | 可投岗位 |
|---|---|---|
| 3 个月 | Python + FastAPI + 会调 LLM API | 初级后端 / AI 实习 |
| 6 个月 | RAG 项目完整 + 基础 DL | AI 应用开发(初级) |
| 9–12 个月 | Agent + Docker 部署 + 1 个微调 | AI 应用开发(中级) |
| 12–18 个月 | 多项目 + 开源 + 系统设计 | 中级~高级应用岗 |
九、你的「第 1 周」具体任务
如果今天就开始,按这个清单执行:
Day 1–2
- 安装 Python 3.11、VS Code/Cursor、Git
- 完成 Python 基础:列表、字典、函数、类
Day 3–4
- 学 FastAPI 官方 Tutorial 前 3 章
- 写一个
/hello和/chat占位接口
Day 5–7
- 注册 OpenAI 或 DeepSeek API
- 实现:用户发问题 → 调 LLM → 返回 JSON
- 代码 push 到 GitHub 仓库
ai开发
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐

所有评论(0)