AI 开发工程师学习路线(2026 版)


一、先搞清楚:AI 开发工程师在做什么

常见三类岗位,学习重点不同:

方向 日常工作 核心能力
AI 应用开发(推荐入门) RAG、Agent、Copilot、智能客服、AI 工作流 Python/TS、LLM API、Prompt、向量库、后端
机器学习工程师 训练/微调模型、特征工程、评估 数学、PyTorch、数据、实验
MLOps / 平台 部署、监控、流水线、GPU 调度 Docker、K8s、推理服务、评测体系

建议路径:先走 AI 应用开发 → 有基础后再补 ML / MLOps,比一上来啃论文更稳。


二、整体路线图(约 12–18 个月)

阶段0
编程与CS基础
1-2月

阶段1
Python与Web
1-2月

阶段2
ML/DL基础
2-3月

阶段3
LLM与RAG
2-3月

阶段4
Agent与工程化
2-3月

阶段5
项目+求职
持续


阶段 0:编程与计算机基础(1–2 个月)

目标:能独立写脚本、读文档、调试报错。

必学

  • Python 3.10+:变量、函数、类、异常、文件 IO、虚拟环境(venv / conda
  • Gitclonecommitbranch、PR 流程
  • Linux 基础:常用命令、ssh、路径、权限
  • 数据结构与算法(够用版):数组、哈希表、栈队列、树、图的基本概念;LeetCode 简单题 30–50 道即可(应用岗不卷竞赛)

推荐资源

  • Python 官方教程
  • 廖雪峰 Python 教程 / 菜鸟教程(中文入门)
  • 《流畅的 Python》选读

验收标准

  • 写一个 CLI 小工具(如:批量重命名、CSV 统计)
  • 代码托管到 GitHub,有 README

阶段 1:Web 与后端基础(1–2 个月)

目标:能搭 API,这是 AI 应用落地的载体。

必学

  • HTTP / REST:GET/POST、JSON、状态码
  • FastAPI(Python 首选)或 Flask
  • 前端基础(了解即可):HTML/CSS/JS,或直接用 React/Vue 模板
  • 数据库:PostgreSQL + SQL 基础;了解 Redis 缓存
  • 异步编程async/await 概念

推荐资源

  • FastAPI 官方文档(质量很高)
  • freeCodeCamp 后端课程

验收标准

  • 做一个 Todo API + 简单前端,含用户登录(JWT)
  • 部署到云(阿里云 / 腾讯云 / Railway / Render 任一)

阶段 2:机器学习与深度学习基础(2–3 个月)

目标:理解 AI 在「算什么」,不是只会调 API。

数学(够用版,别被吓退)

  • 线性代数:向量、矩阵乘法、点积(为 Embedding 打基础)
  • 概率统计:均值、方差、正态分布、贝叶斯直觉
  • 微积分:导数、梯度下降概念即可

ML 核心

  • 监督 / 无监督 / 强化学习概念
  • 训练集 / 验证集 / 测试集、过拟合、正则化
  • 常见算法:线性回归、逻辑回归、决策树、KNN(知道原理即可)
  • scikit-learn:分类、回归、聚类实战

深度学习

  • PyTorch(国内资料多,工业界主流)
  • 神经网络、反向传播、损失函数、优化器
  • CNN(图像)、RNN/Transformer 概念(重点在 Transformer)
  • Hugging Face 加载预训练模型做推理

推荐资源

验收标准

  • 用 PyTorch 训练一个 MNIST / CIFAR-10 分类器
  • 用 Hugging Face 做 文本分类情感分析 微调(LoRA 即可)

阶段 3:大模型与 RAG(2–3 个月)⭐ 核心

目标:掌握当前 AI 开发工程师 80% 的工作内容。

必学概念

  • Token、Context Window、Temperature、Top-p
  • Prompt Engineering:系统提示、Few-shot、Chain-of-Thought
  • Embedding:文本向量化、相似度(余弦)
  • RAG 架构:文档切分 → Embedding → 向量检索 → 拼 Prompt → LLM 生成
  • 向量数据库:Chroma、Milvus、Qdrant、pgvector 至少熟练一种
  • 评估:幻觉、召回率、答案相关性(RAGAS 等框架)

工具栈

类别 推荐
LLM 调用 OpenAI API、Anthropic、国内:通义、文心、智谱、DeepSeek
框架 LangChainLlamaIndex(二选一深入,都了解更好)
本地模型 Ollama + Llama / Qwen 系列
文档解析 PyPDF、Unstructured、Markdown 切分策略

推荐资源

  • DeepLearning.AI 短课:ChatGPT Prompt Engineering、Building Systems with ChatGPT API
  • LangChain / LlamaIndex 官方文档 + 示例
  • 吴恩达《Generative AI for Everyone》

验收标准(重要作品集)

做一个 「私有知识库问答系统」

  • 上传 PDF/Markdown
  • 支持多轮对话 + 引用来源
  • FastAPI 后端 + 简单 Web UI
  • 写清楚:切分策略、Embedding 模型、检索 Top-K、Prompt 模板

阶段 4:Agent 与工程化(2–3 个月)⭐ 进阶

目标:从「聊天机器人」升级到「能做事的 AI 系统」。

必学

  • Function Calling / Tool Use:让 LLM 调用搜索、数据库、代码执行
  • Agent 模式:ReAct、Plan-and-Execute、多 Agent 协作
  • 代码 Agent:Cursor、Devin 类产品背后的思路(工具 + 循环 + 反思)
  • 结构化输出:JSON Schema、Pydantic 约束模型输出
  • 流式响应:SSE / WebSocket
  • 安全:Prompt 注入、权限边界、敏感数据脱敏

框架

  • LangGraph(LangChain 生态,适合复杂 Agent 状态机)
  • CrewAI / AutoGen(多 Agent,了解即可)
  • MCP(Model Context Protocol):2025–2026 热门,Cursor 等 IDE 在用

MLOps 入门(应用岗也要会)

  • Docker:容器化 AI 服务
  • 模型推理:vLLM、TGI、Ollama 批量推理
  • 监控:日志、Token 用量、延迟、错误率
  • CI/CD:GitHub Actions 自动测试与部署

验收标准

  • AI 助手 Agent:能查天气/搜网页/读写本地文件/调用你的 API(至少 3 个 Tool)
  • 代码审查 Bot数据分析 Agent(自然语言 → 生成 SQL/Python → 出图表)
  • 全部 Docker 化,有一键启动说明

阶段 5:专项深化(按兴趣选 1–2 条)

路线 A:模型微调与算法向

  • PEFT:LoRA、QLoRA
  • SFT / RLHF / DPO 概念与实战
  • 数据集构造、标注、评测集设计
  • 读论文:Attention Is All You Need、RAG 相关、LoRA 论文
  • 工具:Transformers、PEFT、TRL、Unsloth

路线 B:多模态

  • 图像:CLIP、Stable Diffusion API、ComfyUI
  • 语音:Whisper、TTS
  • 视频理解基础

路线 C:AI 产品 / 全栈

  • Next.js + Vercel AI SDK
  • 支付、用量计费、多租户 SaaS 架构
  • 用户体验:流式 UI、打字机效果、引用高亮

三、每周学习节奏建议(在职 / 业余)

时间 内容
工作日 1.5–2h 视频/文档 + 跟着敲代码
周末 4–6h 做小项目、写博客总结
每月 完成 1 个小里程碑,更新 GitHub

原则70% 动手写代码,30% 看理论;每学一个概念就写进项目里。


四、作品集(求职最关键)

按优先级做这 5 个项目,比证书更有用:

  1. RAG 知识库问答(必做)
  2. 多 Tool Agent 助手(必做)
  3. AI 代码助手 / SQL 数据分析 Agent
  4. 模型微调 Demo(如:垂直领域客服 LoRA)
  5. 开源贡献:给 LangChain/LlamaIndex 提 PR,或写高质量教程

每个项目 README 需包含:

  • 架构图
  • 技术选型理由
  • 本地运行步骤
  • Demo 截图或在线地址
  • 已知局限与改进方向

五、推荐技术栈清单(2026 求职版)

语言:Python(主)+ TypeScript(可选,全栈向)
后端:FastAPI
AI:LangChain / LangGraph、LlamaIndex、OpenAI SDK
向量库:Chroma / Qdrant / pgvector
数据库:PostgreSQL、Redis
部署:Docker、Nginx、云函数或 K8s(进阶)
监控:LangSmith / Langfuse / 自建日志
本地:Ollama、vLLM
版本管理:Git、GitHub

六、学习资源汇总

中文

  • 李沐《动手学深度学习》
  • DataWhale 开源教程(机器学习、LLM 方向)
  • B 站:跟李沐、跟各类 RAG/Agent 实战 UP 主

英文(质量高,建议逐步适应)

  • DeepLearning.AI 短课系列
  • Hugging Face Course
  • LangChain Academy

社区

  • GitHub Trending(AI 相关)
  • Hugging Face Hub
  • 国内:魔搭 ModelScope

七、常见误区

  1. 只学 Prompt,不学工程 → 面试和实际工作都会卡住
  2. 数学拖太久不上手 → 先会用再补数学
  3. 项目太散 → 围绕 RAG + Agent 做深,比做 10 个 Hello World 强
  4. 忽略评估与安全 → 企业很看重幻觉控制、权限、成本
  5. 不写文档不开源 → HR 和技术面试官都看 GitHub

八、岗位能力与时间对照(参考)

时间点 能力水平 可投岗位
3 个月 Python + FastAPI + 会调 LLM API 初级后端 / AI 实习
6 个月 RAG 项目完整 + 基础 DL AI 应用开发(初级)
9–12 个月 Agent + Docker 部署 + 1 个微调 AI 应用开发(中级)
12–18 个月 多项目 + 开源 + 系统设计 中级~高级应用岗

九、你的「第 1 周」具体任务

如果今天就开始,按这个清单执行:

Day 1–2

  • 安装 Python 3.11、VS Code/Cursor、Git
  • 完成 Python 基础:列表、字典、函数、类

Day 3–4

  • 学 FastAPI 官方 Tutorial 前 3 章
  • 写一个 /hello/chat 占位接口

Day 5–7

  • 注册 OpenAI 或 DeepSeek API
  • 实现:用户发问题 → 调 LLM → 返回 JSON
  • 代码 push 到 GitHub 仓库 ai开发

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐