最简落地学习路线

  1. 打底:Transformer + LLM 基础概念
  2. LoRA 领域微调(亲手跑通 Qwen7B 微调)
  3. 知识蒸馏基础 → MoE 蒸馏原理 + Demo
  4. INT4/INT8 量化实操
  5. KV Cache + vLLM 推理加速、显存优化
  6. Docker 模型容器化
  7. K8s 集群部署、云原生弹性服务
  8. 最终整合:私有化模型定制全流程原始基座 → 领域微调 → MoE 蒸馏 → 量化 → 推理优化 → 集群云原生部署

一、前置打底(必看,不然后面听不懂)

1. Transformer 大白话入门

2. LLM 基础概念(预训练 / SFT/RLHF/DPO)

  • 推荐:LLM 入门必看通识教程(知乎专栏)关键词搜索:大语言模型基础概念 预训练 SFT RLHF DPO 通俗讲解
  • 必懂名词:Token、上下文窗口、基座模型、对话模型、对齐

二、LoRA 微调 + 领域微调(最优先学、最实用)

1. 概念入门

搜索看这几篇即可:

  1. LoRA 低秩适配 通俗原理
  2. 全量微调 vs LoRA 区别适用场景
  3. 大模型领域微调是什么、行业私有化怎么做

2. 实操教程(手把手跑通)

首选开源框架

  • ModelScope Swift 微调教程(阿里开源,中文最友好)地址:https://github.com/modelscope/swift自带 Qwen/DeepSeek 一键 LoRA 微调脚本,不用自己搭环境

必看入门教程

  • 搜索:Swift Qwen2 7B LoRA 领域微调 实战
  • 跟着做:造问答数据集 → 一键微调 → 合并权重 → 推理对比

3. 数据集格式标准

搜索:大模型 SFT 微调数据集格式 单轮 / 多轮学会:JSON 格式、system/user/assistant 结构


三、知识蒸馏 + MoE 蒸馏

1. 蒸馏基础概念

  • 必读:知识蒸馏 软标签 硬标签 通俗讲解
  • 搞懂:教师模型 / 学生模型、温度系数、指令蒸馏

2. MoE 蒸馏专项(适配 DeepSeek/Qwen MoE)

搜索关键词:

  1. MoE 模型蒸馏成稠密模型 原理
  2. DeepSeek R1 蒸馏方案详解
  3. 大模型指令蒸馏实战教程

学习重点:

  • 为什么 MoE 不能直接部署
  • 如何用大 MoE 生成 CoT 数据
  • 用 SFT 把小模型蒸馏变强

四、量化学习(INT4/INT8/GPTQ/AWQ/GGUF)

1. 原理入门

搜索:

  • INT8 INT4 量化原理 通俗讲解
  • GPTQ AWQ GGUF 区别与适用场景

2. 实操教程

  1. AutoGPTQ 量化模型实战
  2. AWQ 量化部署教程
  3. llama.cpp GGUF 量化入门

学会:

  • 模型怎么转 INT4/INT8
  • 量化后显存占用、速度、效果取舍
  • 本地低配显卡 / CPU 跑量化模型

五、推理加速 + 显存优化

必学核心知识点

  1. KV Cache 原理(推理加速核心)搜索:KV Cache 大模型 通俗讲解
  2. PagedAttention 分页注意力
  3. vLLM 推理加速原理
  4. 大模型显存占用计算、显存碎片优化

实操工具教程

  • 看:vLLM 部署大模型 入门教程学会:
  • 一键部署支持流式、高并发
  • 调参优化吞吐、延迟、显存占用

六、集群部署 + 云原生大模型服务

1. 前置基础

  • Docker 入门:菜鸟教程 Docker 章节
  • K8s 基础:Kubernetes 入门通俗教程(只需要懂 Pod/Service/ 镜像即可)

2. 大模型云原生实战

搜索:

  1. 大模型 Docker 容器化部署
  2. vLLM + K8s 集群部署 负载均衡
  3. 大模型服务弹性扩缩容实践

学会:

  • 打包镜像、部署集群
  • 多实例负载均衡
  • 流量削峰、高并发承载

七、我给你规划「学习顺序(照着学 40 天搞定全套)」

  1. 第 1-5 天:Transformer + LLM 基础概念吃透
  2. 第 6-15 天:LoRA 领域微调,亲手跑通 Qwen2-7B 私有化微调
  3. 第 16-22 天:知识蒸馏原理 + MoE 蒸馏逻辑看懂
  4. 第 23-28 天:量化原理 + 亲手把模型转 INT4/INT8
  5. 第 29-35 天:KV Cache + vLLM 推理加速、显存优化调参
  6. 第 36-40 天:Docker 打包 + K8s 基础集群部署,懂云原生架构
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐