很多想学 Python AI 的新手,第一步就卡在了环境搭建上——装哪个版本?用什么工具?虚拟环境怎么搞?anaconda 和 pip 怎么选?

这篇文章帮你把环境搭建和核心库安装一次性讲透,照着做,30 分钟内跑通你的第一个 AI 脚本。


一、Python 版本选哪个?别纠结了

先说结论:装 Python 3.11 或 3.12

Python 版本 推荐度 原因
3.12+ ⭐⭐⭐⭐⭐ 性能最好,官方长期维护
3.11 ⭐⭐⭐⭐⭐ AI 生态兼容性最好,稳
3.9/3.10 ⭐⭐⭐⭐ 能用,但部分新库可能不支持
3.8 及以下 ⭐⭐ 别装了,TensorFlow 2.x 都要停更了

去哪下载? 直接去 python.org 官网下,别去第三方网站下"绿色版"或"优化版",大概率踩坑。

Windows 安装注意事项

✅ 安装时勾选「Add Python to PATH」
✅ 选「Customize installation」把 pip 勾上
❌ 别装到 C:\Program Files(路径有空格,后续各种报错)
✅ 推荐装到 C:\Python312 或 D:\Python312

Mac 安装注意事项

Mac 自带 Python,但版本通常是 3.9 甚至 3.8。推荐用 Homebrew 安装:

brew install python@3.12

装完后终端输入 python3 --version,确认版本是你刚装的 3.12+ 就行。

验证安装

python --version
# 输出:Python 3.12.x

pip --version
# 输出:pip 24.x from ...

两个命令都能正常输出版本号,说明安装成功。


二、开发工具选什么?三个选择,按需来

选项1:VS Code(推荐大多数人用)

免费、轻量、插件生态强大,Python 开发体验已经和 PyCharm 不相上下了。

必装插件:

  • Python(Microsoft 官方出品,装一个就够了)
  • Jupyter(可以在 VS Code 里直接用 Jupyter)
  • Pylance(代码补全和类型提示)

安装后 Ctrl+Shift+P → 输入 Python: Select Interpreter → 选择你装的 Python 版本,搞定。

选项2:PyCharm(适合做项目)

JetBrains 出品,功能最全的 Python IDE。社区版免费够用,专业版收费。

适合场景:你要做正式的 AI 项目,需要版本管理、远程调试这些高级功能。

选项3:Jupyter Notebook(适合学习探索)

一行命令安装:

pip install jupyter

然后直接运行:

jupyter notebook

浏览器会自动打开,一个格子写一行代码,回车就跑,特别适合新手学习 AI 和数据分析。

我的建议:学习阶段用 VS Code + Jupyter 插件,既灵活又能分块调试。等做正式项目了再考虑换 PyCharm。


三、虚拟环境:不装就是给自己挖坑

为什么要用虚拟环境?一句话解释:你不可能只有一个 Python 项目。项目 A 用 TensorFlow 2.10,项目 B 用 PyTorch 2.3,不同版本的库如果混装,迟早冲突。

方案1:venv(Python 自带,推荐)

# 创建虚拟环境
python -m venv myproject_env

# 激活(Windows)
myproject_env\Scripts\activate

# 激活(Mac/Linux)
source myproject_env/bin/activate

# 激活后,命令行前面会出现 (myproject_env) 标识
(myproject_env) C:\project>

激活后装的包全都装在这个虚拟环境里,不会污染全局 Python。退出环境用 deactivate 命令。

方案2:Conda(适合 AI 方向)

Conda 不只是 Python 包管理器,它还能管理 CUDA、cuDNN 这些底层依赖,做 AI 开发特别方便。

# 安装 Miniconda(轻量版,推荐)
# 下载地址:https://docs.conda.io/en/latest/miniconda.html

# 创建虚拟环境
conda create -n ai_env python=3.12

# 激活
conda activate ai_env

# 安装包
conda install numpy pandas matplotlib

venv vs Conda 怎么选?

  • 做数据分析/Web 开发 → venv 足够
  • 做 AI/深度学习 → Conda 更省心,因为它能装非 Python 的依赖(比如 CUDA)

方案3:uv(新锐选择,速度最快)

uv 是 Rust 写的 Python 包管理器,速度比 pip 快 10-100 倍。

# 安装 uv
pip install uv

# 创建虚拟环境
uv venv myproject_env

# 安装包(贼快)
uv pip install numpy pandas

适合对速度有执念的朋友,功能还比不上 Conda 完整,但日常用完全够了。


四、核心库安装:AI 入门必备清单

分三类装:基础科学计算机器学习深度学习。按需选择,别一股脑全装。

4.1 基础科学计算(必装)

pip install numpy pandas matplotlib seaborn scikit-learn
库名 用途 一句话说明
NumPy 数值计算 Python 界的 MATLAB,矩阵运算神器
Pandas 数据处理 表格数据读取/清洗/分析首选
Matplotlib 画图 最基础的可视化库,自定义能力强
Seaborn 高级画图 基于 Matplotlib,统计图表更好看
Scikit-learn 机器学习 分类/回归/聚类一站搞定

验证安装:

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import load_iris

print("NumPy:", np.__version__)
print("Pandas:", pd.__version__)
print("Scikit-learn:", sklearn.__version__)
print("✅ 基础库安装成功!")

4.2 机器学习进阶

pip install xgboost lightgbm catboost imbalanced-learn
库名 用途
XGBoost 表格数据竞赛冠军模型
LightGBM XGBoost 的轻量替代,速度更快
CatBoost 对类别特征特别友好
imbalanced-learn 处理样本不均衡问题

4.3 深度学习(二选一,别都装)

PyTorch(推荐,学术界和工业界都在用):

# GPU 版(需要 NVIDIA 显卡 + CUDA)
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

# CPU 版(没有显卡就用这个)
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cpu

TensorFlow(Google 出品):

pip install tensorflow

怎么选? 2024 年以后学深度学习,选 PyTorch。生态更好,教程更多,论文复现更方便。除非你要接手 TensorFlow 的老项目,否则没必要从 TensorFlow 入手。

4.4 大模型相关(2024-2025 热门)

pip install transformers datasets accelerate
库名 用途
Transformers Hugging Face 出品,加载/使用各类大模型
Datasets 大模型训练数据集加载
Accelerate 简化多 GPU/TPU 训练代码

4.5 辅助工具库(建议装上)

pip install jupyter tqdm opencv-python Pillow requests
库名 用途
Jupyter 交互式编程环境
tqdm 进度条,跑循环时看着爽
OpenCV 图像处理
Pillow 图片读写
Requests HTTP 请求,抓数据用

五、国内镜像源加速:装包不再等半天

默认 pip 源在国外,下载巨慢。换成国内镜像源,速度能提升 10 倍以上。

临时使用(单次指定)

pip install numpy -i https://pypi.tuna.tsinghua.edu.cn/simple

永久配置(推荐)

方式1:命令行配置

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

方式2:创建配置文件

在用户目录下创建 pip/pip.ini(Windows)或 pip/pip.conf(Mac/Linux):

[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple
trusted-host = pypi.tuna.tsinghua.edu.cn

Conda 换镜像源

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch
conda config --set show_channel_urls yes

国内常用镜像源:清华源、阿里源、豆瓣源。清华源最全最稳,阿里源速度也很快。


六、第一个 AI 脚本:装完跑一下,确认没翻车

环境搭完不代表真的能跑。写一个小脚本验证所有核心库是否正常工作:

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score

# 1. 加载数据
iris = load_iris()
X, y = iris.data, iris.target

# 2. 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42
)

# 3. 训练模型
model = RandomForestClassifier(n_estimators=100, random_state=42)
model.fit(X_train, y_train)

# 4. 预测并评估
y_pred = model.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print(f"模型准确率:{accuracy:.2%}")

# 5. 可视化特征重要性
plt.figure(figsize=(8, 5))
features = iris.feature_names
importance = model.feature_importances_
bars = plt.barh(features, importance, color='#2E86AB')

plt.title('鸢尾花分类 - 特征重要性', fontsize=14)
plt.xlabel('重要性', fontsize=12)

# 在柱子上显示数值
for bar, val in zip(bars, importance):
    plt.text(val + 0.01, bar.get_y() + bar.get_height()/2,
             f'{val:.3f}', va='center', fontsize=10)

plt.tight_layout()
plt.savefig('first_ai_demo.png', dpi=150, bbox_inches='tight')
plt.show()

print("✅ 全部库工作正常,环境搭建完成!")

运行结果应该输出:模型准确率:100.00%,并弹出一张特征重要性柱状图。看到这个结果,说明你的环境完美运行。


七、常见报错与解决方案

报错信息 原因 解决方案
'python' 不是内部或外部命令 Python 没加 PATH 重新安装,勾选 Add to PATH
pip: command not found Mac/Linux 需用 pip3 python3 -m pip 代替
ERROR: Could not build wheel for xxx 缺 C++ 编译器 Windows 装 Visual Studio Build Tools
OSError: Unable to open file 文件路径含中文/空格 用英文路径或加引号
ImportError: DLL load failed CUDA 版本不匹配 检查 PyTorch CUDA 版本是否对应系统显卡驱动
UnicodeDecodeError 文件编码问题 pd.read_csv('file.csv', encoding='gbk')

遇到报错别慌,把报错信息直接复制到搜索引擎,90% 的坑都有人踩过。


环境搭建是学 AI 的第一道门槛,但很多人因为这一步太繁琐就直接放弃了。其实就那么几步:装 Python → 配工具 → 建虚拟环境 → 装库 → 跑脚本。照着这篇文章做,30 分钟内搞定。

别被环境问题劝退,真正有意思的是后面——用代码让机器学会识别猫狗、生成图片、写文章。那些才是 AI 的魅力所在。


Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐