高考结束才是真正开始学习：给AI时代新人的一份真实学习路线图

流年似水～

421人浏览 · 2026-06-13 01:12:50

流年似水～ · 2026-06-13 01:12:50 发布

“高考结束才是真正开始学习”：给AI时代新人的一份真实学习路线图

0. 一句话背后的信号

2026年6月7日，北京人大附中考点，一位考生提前半小时走出考场。记者问高考后的打算，他说：

“高考只是这个阶段的结束，自己未来想学的专业也偏向AI，高考结束后才是真正该开始学习的时候。”

这句话火了。不是因为说得漂亮，是因为它说对了一件事：高考不是学习的终点，是真正学习的起点。

更关键的信号是：一个刚考完的高中生，第一反应是"要学AI"。这说明AI已经从"技术圈的话题"变成了"普通人的选择"。

这篇文章的目的不是励志，是给你一份从零到能干活的AI学习路线图。不谈概念，谈具体怎么学、用什么学、踩了什么坑。

1. 先说清楚：学AI不是学"怎么用ChatGPT"

很多人说"我想学AI"，但脑子里想的是"学会用AI工具提升效率"。这没错，但这不是"学AI"，这是"学使用工具"。

学AI指的是：理解模型怎么工作、能训练或微调模型、能搭建基于AI的应用、能解决模型解决不了的问题。

这两条路区别很大：

目标	适合人群	时间投入	产出
用AI提升效率	所有人	1-2周入门	工作效率提升
学AI技术	想转行/深造的人	6-12个月系统学	能搭建AI应用、做相关研究

这篇文章面向的是后者：想系统学AI技术的人。如果你只是想用AI工具，去用就行了，不需要路线图。

2. 路线图：四个阶段，从零到能干活

阶段一：数学+编程基础（4-8周）

为什么需要：AI的底层是数学（线性代数、概率统计、微积分），工具是编程（Python）。没有这两样，后面全是黑箱，出了问题不知道怎么调。

数学部分（不需要学完，够用就行）：

线性代数：矩阵运算、向量空间、特征值——深度学习的基础
- 推荐：3Blue1Brown 的线性代数可视化系列（YouTube/B站），直观不枯燥
- 书：《线性代数应该这样学》（Axler）——比国内教材直观
概率统计：贝叶斯、分布、期望方差——机器学习的核心
- 推荐：可汗学院概率统计课程（免费，讲得清楚）
- 实战：用 Python numpy 随机模拟抛硬币、蒙特卡洛方法
微积分：梯度、偏导数、链式法则——神经网络反向传播的基础
- 推荐：3Blue1Brown 微积分系列，重点看"梯度下降"那几集

编程部分（Python 是绝对主流）：

# 第一周就能写出来的"AI感觉"代码
import numpy as np

# 手动实现一个最简单的线性回归（不用任何AI框架）
def linear_regression(X, y, learning_rate=0.01, epochs=1000):
    # 初始化参数
    w = np.zeros(X.shape[1])
    b = 0

    for _ in range(epochs):
        # 前向传播
        y_pred = np.dot(X, w) + b
        # 计算损失（均方误差）
        loss = np.mean((y_pred - y) ** 2)
        # 反向传播（梯度下降）
        dw = np.dot(X.T, (y_pred - y)) / len(y)
        db = np.mean(y_pred - y)
        w -= learning_rate * dw
        b -= learning_rate * db

    return w, b, loss

这个阶段的坑：

数学书买一堆，看完前三章就放弃了——别买书，先看视频，有感觉了再翻书
Python学了两个月还在学语法——语法一周够用，剩下的在项目中练
同时学C++/Java——AI领域Python够用，别分心

阶段目标：能用手写代码实现线性回归、逻辑回归、KNN，不依赖任何框架。

阶段二：机器学习入门（6-10周）

为什么需要：深度学习是机器学习的一个子集。不理解机器学习的通用思想（过拟合、交叉验证、特征工程），直接上深度学习会一脸懵。

核心概念必须搞懂：

监督学习 vs 无监督学习 vs 强化学习
训练集/验证集/测试集的划分原则
过拟合的表现和解决方法（正则化、早停、数据增强）
特征工程：什么特征有用、怎么处理缺失值、怎么处理类别变量

推荐学习路径：

吴恩达《Machine Learning》课程（Coursera/网易云课堂）
- 经典中的经典，讲得清楚，作业用MATLAB/Octave（没关系，思想是通用的）
- 时间：6-8周，每周6-8小时
李宏毅《机器学习》课程（YouTube/B站）
- 中文，更贴近当前研究，讲深度学习和生成模型讲得好
- 适合作为吴恩达课程的补充
实战：《Hands-On Machine Learning》（Aurélien Géron）
- 这本书值100个视频课，用scikit-learn和TensorFlow实现
- 重点做：房价预测（回归）、手写数字识别（分类）、异常检测

# 阶段二结束时的"能干活"代码：用scikit-learn训练一个分类器
from sklearn.datasets import load_digits
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score

# 加载数据（手写数字识别）
digits = load_digits()
X_train, X_test, y_train, y_test = train_test_split(
    digits.data, digits.target, test_size=0.2
)

# 训练随机森林（不需要调参就能得到不错的结果）
clf = RandomForestClassifier(n_estimators=100, random_state=42)
clf.fit(X_train, y_train)

# 评估
y_pred = clf.predict(X_test)
print(f"准确率: {accuracy_score(y_test, y_pred):.3f}")

这个阶段的坑：

课程看完就完了，不动手——吴恩达的课后作业必须做，不做等于没学
一开始就上深度学习框架——先用手写代码理解原理，再上PyTorch/TensorFlow
数据集只用MNIST——MNIST是"AI的Hello World"，做完就换真实数据集

阶段目标：能说清楚监督/无监督学习的区别，能用手写代码实现逻辑回归，能用scikit-learn解决分类/回归问题。

阶段三：深度学习+LLM（8-12周）

为什么需要：当前AI的热点在深度学习，尤其是大语言模型（LLM）。这个阶段学完，你能理解ChatGPT为什么能聊天，能微调一个模型，能搭建一个基于LLM的应用。

深度学习基础：

吴恩达《Deep Learning Specialization》（Coursera）
- 神经网络、CNN、RNN、Seq2Seq全覆盖
- 作业用TensorFlow，但思想通用
PyTorch官方教程（pytorch.org/tutorials）
- 当前主流框架是PyTorch，不是TensorFlow
- 从张量操作到训练一个CNN，官方教程是最好的起点

# 用PyTorch实现一个简单的神经网络
import torch
import torch.nn as nn
import torch.optim as optim

class SimpleNet(nn.Module):
    def __init__(self):
        super().__init__()
        self.fc1 = nn.Linear(784, 128)
        self.fc2 = nn.Linear(128, 64)
        self.fc3 = nn.Linear(64, 10)
        self.relu = nn.ReLU()
        self.dropout = nn.Dropout(0.2)

    def forward(self, x):
        x = self.relu(self.fc1(x))
        x = self.dropout(x)
        x = self.relu(self.fc2(x))
        x = self.fc3(x)
        return x

# 训练循环（简化版）
model = SimpleNet()
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

for epoch in range(10):
    for batch_x, batch_y in dataloader:
        optimizer.zero_grad()
        outputs = model(batch_x)
        loss = criterion(outputs, batch_y)
        loss.backward()
        optimizer.step()

LLM专项学习：

理解Transformer架构（这是LLM的基础）
- 必读论文：《Attention Is All You Need》（2017）
- 推荐解读：The Illustrated Transformer（jalammar.github.io）
- 关键概念：Self-Attention、Multi-Head Attention、位置编码
动手微调一个LLM
- 工具：Hugging Face Transformers库
- 入门项目：用LoRA微调一个开源模型（如Qwen、Llama）
- 数据集：从Hugging Face Datasets找一个简单的分类/生成数据集

# 用Hugging Face微调一个文本分类模型（简化版）
from transformers import AutoModelForSequenceClassification, Trainer, TrainingArguments
from datasets import load_dataset

# 加载预训练模型和数据集
model = AutoModelForSequenceClassification.from_pretrained(
    "bert-base-chinese", num_labels=2
)
dataset = load_dataset("csv", data_files="my_data.csv")

# 训练参数
training_args = TrainingArguments(
    output_dir="./results",
    num_train_epochs=3,
    per_device_train_batch_size=16,
    learning_rate=2e-5,  # 微调通常用很小的学习率
)

# 开始训练
trainer = Trainer(model=model, args=training_args, train_dataset=dataset["train"])
trainer.train()

这个阶段的坑：

Transformer架构没搞懂就上LLM——Attention机制不理解，后面全是背代码
只看论文不写代码——LLM是工程，不是理论，必须动手调
一开始就用最大的模型——从BERT-base开始，别上来就Llama-405B

阶段目标：能说清楚Transformer的每个组件，能用PyTorch训练一个CNN，能微调一个开源LLM完成特定任务。

阶段四：项目实战+持续学习（持续进行）

为什么需要：学完前三个阶段，你有理论有工具，但没做过完整项目，等于没学。AI是工程学科，不动手永远停留在"知道"层面。

入门项目推荐（难度递增）：

Kaggle入门竞赛（如Titanic、House Prices）
- 目的：熟悉完整流程（数据清洗→特征工程→建模→提交）
- 时间：1-2周
克隆一个经典论文的实现
- 比如：用PyTorch从零实现Transformer（Aurélien Géron的书里有）
- 目的：验证你真的理解了架构
- 时间：2-4周
做一个端到端的AI应用
- 比如：本地文档问答系统（RAG）、AI写作助手、图像分类API
- 目的：打通从模型到产品的全链路
- 技术栈：LangChain/LLM + Vector DB + FastAPI + 前端
- 时间：4-8周

# 阶段四的"能干活"代码：一个简单的RAG系统
from langchain_community.vectorstores import Chroma
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain.chains import RetrievalQA
from langchain_community.llms import Ollama

# 1. 构建向量库（假设已有文档切分结果）
embeddings = HuggingFaceEmbeddings(model_name="BGE-small-zh")
vectorstore = Chroma.from_documents(documents, embeddings)

# 2. 搭建检索问答链
llm = Ollama(model="qwen2:7b")  # 用本地模型，不需要API Key
qa_chain = RetrievalQA.from_chain_type(
    llm, retriever=vectorstore.as_retriever()
)

# 3. 问答
answer = qa_chain.run("我们公司的年假政策是什么？")
print(answer)

持续学习的资源：

论文：arXiv.org，关注cs.AI/cs.LG/cs.CL类别
社区：Hugging Face、GitHub Trending、Reddit r/MachineLearning
博客：Andrej Karpathy的博客（karpathy.github.io），必读

这个阶段的坑：

项目做了一半就放弃——第一个项目不求完美，求完整
只看中文资料——AI的前沿论文都是英文，必须过英语关
追新技术追得迷失——先把基础打牢，新模型是旧组合的新排列

阶段目标：有一个能展示的完整项目，能读懂ACL/NeurIPS的论文，能跟上AI领域的最新进展。

3. 避坑指南：前人踩过的坑，你不必再踩

坑一：买一堆书，然后开始吃灰

AI领域的好书很多，但书是最慢的学习方式。正确的顺序是：视频→动手→书→论文。

书单推荐（但别一开始就买）：

《深度学习》（Goodfellow et al.）—— 又名"花书"，理论权威，但不适合入门
《动手学深度学习》（李沐）—— 有中文版，代码+理论结合，适合有一定基础后读
《自然语言处理入门》（何晗）—— 中文NLP入门首选

坑二：一开始就用最牛的模型

“我用Llama-405B做我的第一个项目”——这是作死。

正确的模型选择策略：

学习原理：用最小的模型（BERT-base、GPT-2 small）
做项目：用中等模型（Qwen-7B、Llama-3-8B），能跑得动
生产环境：才考虑大模型，而且要考虑成本和延迟

坑三：数学基础不够就硬上

有人问：“我数学不好，能学AI吗？”

能，但有两个前提：

至少掌握线性代数和概率统计的基础（不需要精通，够用就行）
愿意在学的过程中补数学（遇到不懂的数学再回头学，比系统学完数学再学AI效率高）

推荐的补数学方式：3Blue1Brown的视频系列，直观不枯燥，看完再翻书深化。

坑四：只学不用，永远停留在"知道"

AI是工程，不动手等于白学。每个阶段学完，必须做一个能跑的项目。

最低要求：

阶段一：手写线性回归
阶段二：用scikit-learn解决一个Kaggle入门赛
阶段三：微调一个开源模型
阶段四：做一个端到端的AI应用

坑五：英语不好，只看中文资料

坦白说：AI的前沿进展都是用英文发布的。论文、技术博客、开源项目文档，英文是绝对主流。

英语不好不是借口，是两个解决方案：

边学AI边补英语（推荐，因为AI资料太多，翻译永远滞后）
用翻译工具辅助读英文资料（可行，但效率低）

4. 资源汇总：收藏这篇就够了

课程

课程	平台	适合阶段	费用
吴恩达《Machine Learning》	Coursera/网易云课堂	阶段二	免费/付费
吴恩达《Deep Learning Specialization》	Coursera	阶段三	付费（可申请资助）
李宏毅《机器学习》	YouTube/B站	阶段二、三	免费
Fast.ai《Practical Deep Learning》	fast.ai	阶段三	免费
Hugging Face课程	huggingface.co/course	阶段三、四	免费

书籍

书名	适合阶段	特点
《动手学深度学习》（李沐）	阶段二、三	中文，代码+理论结合
《深度学习》（Goodfellow）	阶段三、四	理论权威，不适合入门
《Hands-On Machine Learning》	阶段二、三	实战导向，scikit-learn+TensorFlow
《自然语言处理入门》（何晗）	阶段三	中文NLP首选

工具/框架

工具	用途	入门难度
Python + NumPy	基础编程	⭐
scikit-learn	传统机器学习	⭐⭐
PyTorch	深度学习	⭐⭐⭐
Hugging Face Transformers	LLM微调/推理	⭐⭐⭐
LangChain	LLM应用开发	⭐⭐
Ollama	本地运行LLM	⭐