Python AI 基础：从零搭建环境与核心库安装全指南

糯米导航

204人浏览 · 2026-06-15 15:20:45

糯米导航 · 2026-06-15 15:20:45 发布

很多想学 Python AI 的新手，第一步就卡在了环境搭建上——装哪个版本？用什么工具？虚拟环境怎么搞？anaconda 和 pip 怎么选？

这篇文章帮你把环境搭建和核心库安装一次性讲透，照着做，30 分钟内跑通你的第一个 AI 脚本。

一、Python 版本选哪个？别纠结了

先说结论：装 Python 3.11 或 3.12。

Python 版本	推荐度	原因
3.12+	⭐⭐⭐⭐⭐	性能最好，官方长期维护
3.11	⭐⭐⭐⭐⭐	AI 生态兼容性最好，稳
3.9/3.10	⭐⭐⭐⭐	能用，但部分新库可能不支持
3.8 及以下	⭐⭐	别装了，TensorFlow 2.x 都要停更了

去哪下载？ 直接去 python.org 官网下，别去第三方网站下"绿色版"或"优化版"，大概率踩坑。

Windows 安装注意事项

✅ 安装时勾选「Add Python to PATH」
✅ 选「Customize installation」把 pip 勾上
❌ 别装到 C:\Program Files（路径有空格，后续各种报错）
✅ 推荐装到 C:\Python312 或 D:\Python312

Mac 安装注意事项

Mac 自带 Python，但版本通常是 3.9 甚至 3.8。推荐用 Homebrew 安装：

brew install python@3.12

装完后终端输入 python3 --version，确认版本是你刚装的 3.12+ 就行。

验证安装

python --version
# 输出：Python 3.12.x

pip --version
# 输出：pip 24.x from ...

两个命令都能正常输出版本号，说明安装成功。

二、开发工具选什么？三个选择，按需来

选项1：VS Code（推荐大多数人用）

免费、轻量、插件生态强大，Python 开发体验已经和 PyCharm 不相上下了。

必装插件：

Python（Microsoft 官方出品，装一个就够了）
Jupyter（可以在 VS Code 里直接用 Jupyter）
Pylance（代码补全和类型提示）

安装后 Ctrl+Shift+P → 输入 Python: Select Interpreter → 选择你装的 Python 版本，搞定。

选项2：PyCharm（适合做项目）

JetBrains 出品，功能最全的 Python IDE。社区版免费够用，专业版收费。

适合场景：你要做正式的 AI 项目，需要版本管理、远程调试这些高级功能。

选项3：Jupyter Notebook（适合学习探索）

一行命令安装：

pip install jupyter

然后直接运行：

jupyter notebook

浏览器会自动打开，一个格子写一行代码，回车就跑，特别适合新手学习 AI 和数据分析。

我的建议：学习阶段用 VS Code + Jupyter 插件，既灵活又能分块调试。等做正式项目了再考虑换 PyCharm。

三、虚拟环境：不装就是给自己挖坑

为什么要用虚拟环境？一句话解释：你不可能只有一个 Python 项目。项目 A 用 TensorFlow 2.10，项目 B 用 PyTorch 2.3，不同版本的库如果混装，迟早冲突。

方案1：venv（Python 自带，推荐）

# 创建虚拟环境
python -m venv myproject_env

# 激活（Windows）
myproject_env\Scripts\activate

# 激活（Mac/Linux）
source myproject_env/bin/activate

# 激活后，命令行前面会出现 (myproject_env) 标识
(myproject_env) C:\project>

激活后装的包全都装在这个虚拟环境里，不会污染全局 Python。退出环境用 deactivate 命令。

方案2：Conda（适合 AI 方向）

Conda 不只是 Python 包管理器，它还能管理 CUDA、cuDNN 这些底层依赖，做 AI 开发特别方便。

# 安装 Miniconda（轻量版，推荐）
# 下载地址：https://docs.conda.io/en/latest/miniconda.html

# 创建虚拟环境
conda create -n ai_env python=3.12

# 激活
conda activate ai_env

# 安装包
conda install numpy pandas matplotlib

venv vs Conda 怎么选？

做数据分析/Web 开发 → venv 足够

做 AI/深度学习 → Conda 更省心，因为它能装非 Python 的依赖（比如 CUDA）

方案3：uv（新锐选择，速度最快）

uv 是 Rust 写的 Python 包管理器，速度比 pip 快 10-100 倍。

# 安装 uv
pip install uv

# 创建虚拟环境
uv venv myproject_env

# 安装包（贼快）
uv pip install numpy pandas

适合对速度有执念的朋友，功能还比不上 Conda 完整，但日常用完全够了。

四、核心库安装：AI 入门必备清单

分三类装：基础科学计算、机器学习、深度学习。按需选择，别一股脑全装。

4.1 基础科学计算（必装）

pip install numpy pandas matplotlib seaborn scikit-learn

库名	用途	一句话说明
NumPy	数值计算	Python 界的 MATLAB，矩阵运算神器
Pandas	数据处理	表格数据读取/清洗/分析首选
Matplotlib	画图	最基础的可视化库，自定义能力强
Seaborn	高级画图	基于 Matplotlib，统计图表更好看
Scikit-learn	机器学习	分类/回归/聚类一站搞定

验证安装：

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import load_iris

print("NumPy:", np.__version__)
print("Pandas:", pd.__version__)
print("Scikit-learn:", sklearn.__version__)
print("✅ 基础库安装成功！")

4.2 机器学习进阶

pip install xgboost lightgbm catboost imbalanced-learn

库名	用途
XGBoost	表格数据竞赛冠军模型
LightGBM	XGBoost 的轻量替代，速度更快
CatBoost	对类别特征特别友好
imbalanced-learn	处理样本不均衡问题

4.3 深度学习（二选一，别都装）

PyTorch（推荐，学术界和工业界都在用）：

# GPU 版（需要 NVIDIA 显卡 + CUDA）
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

# CPU 版（没有显卡就用这个）
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cpu

TensorFlow（Google 出品）：

pip install tensorflow

怎么选？ 2024 年以后学深度学习，选 PyTorch。生态更好，教程更多，论文复现更方便。除非你要接手 TensorFlow 的老项目，否则没必要从 TensorFlow 入手。

4.4 大模型相关（2024-2025 热门）

pip install transformers datasets accelerate

库名	用途
Transformers	Hugging Face 出品，加载/使用各类大模型
Datasets	大模型训练数据集加载
Accelerate	简化多 GPU/TPU 训练代码

4.5 辅助工具库（建议装上）

pip install jupyter tqdm opencv-python Pillow requests

库名	用途
Jupyter	交互式编程环境
tqdm	进度条，跑循环时看着爽
OpenCV	图像处理
Pillow	图片读写
Requests	HTTP 请求，抓数据用

五、国内镜像源加速：装包不再等半天

默认 pip 源在国外，下载巨慢。换成国内镜像源，速度能提升 10 倍以上。

临时使用（单次指定）

pip install numpy -i https://pypi.tuna.tsinghua.edu.cn/simple

永久配置（推荐）

方式1：命令行配置

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

方式2：创建配置文件

在用户目录下创建 pip/pip.ini（Windows）或 pip/pip.conf（Mac/Linux）：

[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple
trusted-host = pypi.tuna.tsinghua.edu.cn

Conda 换镜像源

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch
conda config --set show_channel_urls yes

国内常用镜像源：清华源、阿里源、豆瓣源。清华源最全最稳，阿里源速度也很快。

六、第一个 AI 脚本：装完跑一下，确认没翻车

环境搭完不代表真的能跑。写一个小脚本验证所有核心库是否正常工作：

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score

# 1. 加载数据
iris = load_iris()
X, y = iris.data, iris.target

# 2. 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42
)

# 3. 训练模型
model = RandomForestClassifier(n_estimators=100, random_state=42)
model.fit(X_train, y_train)

# 4. 预测并评估
y_pred = model.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print(f"模型准确率：{accuracy:.2%}")

# 5. 可视化特征重要性
plt.figure(figsize=(8, 5))
features = iris.feature_names
importance = model.feature_importances_
bars = plt.barh(features, importance, color='#2E86AB')

plt.title('鸢尾花分类 - 特征重要性', fontsize=14)
plt.xlabel('重要性', fontsize=12)

# 在柱子上显示数值
for bar, val in zip(bars, importance):
    plt.text(val + 0.01, bar.get_y() + bar.get_height()/2,
             f'{val:.3f}', va='center', fontsize=10)

plt.tight_layout()
plt.savefig('first_ai_demo.png', dpi=150, bbox_inches='tight')
plt.show()

print("✅ 全部库工作正常，环境搭建完成！")

运行结果应该输出：模型准确率：100.00%，并弹出一张特征重要性柱状图。看到这个结果，说明你的环境完美运行。

七、常见报错与解决方案

报错信息	原因	解决方案
`'python' 不是内部或外部命令`	Python 没加 PATH	重新安装，勾选 Add to PATH
`pip: command not found`	Mac/Linux 需用 `pip3`	用 `python3 -m pip` 代替
`ERROR: Could not build wheel for xxx`	缺 C++ 编译器	Windows 装 Visual Studio Build Tools
`OSError: Unable to open file`	文件路径含中文/空格	用英文路径或加引号
`ImportError: DLL load failed`	CUDA 版本不匹配	检查 PyTorch CUDA 版本是否对应系统显卡驱动
`UnicodeDecodeError`	文件编码问题	`pd.read_csv('file.csv', encoding='gbk')`