Python AI 基础:从零搭建环境与核心库安装全指南
很多想学 Python AI 的新手,第一步就卡在了环境搭建上——装哪个版本?用什么工具?虚拟环境怎么搞?anaconda 和 pip 怎么选?
这篇文章帮你把环境搭建和核心库安装一次性讲透,照着做,30 分钟内跑通你的第一个 AI 脚本。
一、Python 版本选哪个?别纠结了
先说结论:装 Python 3.11 或 3.12。
| Python 版本 | 推荐度 | 原因 |
|---|---|---|
| 3.12+ | ⭐⭐⭐⭐⭐ | 性能最好,官方长期维护 |
| 3.11 | ⭐⭐⭐⭐⭐ | AI 生态兼容性最好,稳 |
| 3.9/3.10 | ⭐⭐⭐⭐ | 能用,但部分新库可能不支持 |
| 3.8 及以下 | ⭐⭐ | 别装了,TensorFlow 2.x 都要停更了 |
去哪下载? 直接去 python.org 官网下,别去第三方网站下"绿色版"或"优化版",大概率踩坑。
Windows 安装注意事项
✅ 安装时勾选「Add Python to PATH」
✅ 选「Customize installation」把 pip 勾上
❌ 别装到 C:\Program Files(路径有空格,后续各种报错)
✅ 推荐装到 C:\Python312 或 D:\Python312
Mac 安装注意事项
Mac 自带 Python,但版本通常是 3.9 甚至 3.8。推荐用 Homebrew 安装:
brew install python@3.12
装完后终端输入 python3 --version,确认版本是你刚装的 3.12+ 就行。
验证安装
python --version
# 输出:Python 3.12.x
pip --version
# 输出:pip 24.x from ...
两个命令都能正常输出版本号,说明安装成功。
二、开发工具选什么?三个选择,按需来
选项1:VS Code(推荐大多数人用)
免费、轻量、插件生态强大,Python 开发体验已经和 PyCharm 不相上下了。
必装插件:
- Python(Microsoft 官方出品,装一个就够了)
- Jupyter(可以在 VS Code 里直接用 Jupyter)
- Pylance(代码补全和类型提示)
安装后 Ctrl+Shift+P → 输入 Python: Select Interpreter → 选择你装的 Python 版本,搞定。
选项2:PyCharm(适合做项目)
JetBrains 出品,功能最全的 Python IDE。社区版免费够用,专业版收费。
适合场景:你要做正式的 AI 项目,需要版本管理、远程调试这些高级功能。
选项3:Jupyter Notebook(适合学习探索)
一行命令安装:
pip install jupyter
然后直接运行:
jupyter notebook
浏览器会自动打开,一个格子写一行代码,回车就跑,特别适合新手学习 AI 和数据分析。
我的建议:学习阶段用 VS Code + Jupyter 插件,既灵活又能分块调试。等做正式项目了再考虑换 PyCharm。
三、虚拟环境:不装就是给自己挖坑
为什么要用虚拟环境?一句话解释:你不可能只有一个 Python 项目。项目 A 用 TensorFlow 2.10,项目 B 用 PyTorch 2.3,不同版本的库如果混装,迟早冲突。
方案1:venv(Python 自带,推荐)
# 创建虚拟环境
python -m venv myproject_env
# 激活(Windows)
myproject_env\Scripts\activate
# 激活(Mac/Linux)
source myproject_env/bin/activate
# 激活后,命令行前面会出现 (myproject_env) 标识
(myproject_env) C:\project>
激活后装的包全都装在这个虚拟环境里,不会污染全局 Python。退出环境用
deactivate命令。
方案2:Conda(适合 AI 方向)
Conda 不只是 Python 包管理器,它还能管理 CUDA、cuDNN 这些底层依赖,做 AI 开发特别方便。
# 安装 Miniconda(轻量版,推荐)
# 下载地址:https://docs.conda.io/en/latest/miniconda.html
# 创建虚拟环境
conda create -n ai_env python=3.12
# 激活
conda activate ai_env
# 安装包
conda install numpy pandas matplotlib
venv vs Conda 怎么选?
- 做数据分析/Web 开发 → venv 足够
- 做 AI/深度学习 → Conda 更省心,因为它能装非 Python 的依赖(比如 CUDA)
方案3:uv(新锐选择,速度最快)
uv 是 Rust 写的 Python 包管理器,速度比 pip 快 10-100 倍。
# 安装 uv
pip install uv
# 创建虚拟环境
uv venv myproject_env
# 安装包(贼快)
uv pip install numpy pandas
适合对速度有执念的朋友,功能还比不上 Conda 完整,但日常用完全够了。
四、核心库安装:AI 入门必备清单
分三类装:基础科学计算、机器学习、深度学习。按需选择,别一股脑全装。
4.1 基础科学计算(必装)
pip install numpy pandas matplotlib seaborn scikit-learn
| 库名 | 用途 | 一句话说明 |
|---|---|---|
| NumPy | 数值计算 | Python 界的 MATLAB,矩阵运算神器 |
| Pandas | 数据处理 | 表格数据读取/清洗/分析首选 |
| Matplotlib | 画图 | 最基础的可视化库,自定义能力强 |
| Seaborn | 高级画图 | 基于 Matplotlib,统计图表更好看 |
| Scikit-learn | 机器学习 | 分类/回归/聚类一站搞定 |
验证安装:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import load_iris
print("NumPy:", np.__version__)
print("Pandas:", pd.__version__)
print("Scikit-learn:", sklearn.__version__)
print("✅ 基础库安装成功!")
4.2 机器学习进阶
pip install xgboost lightgbm catboost imbalanced-learn
| 库名 | 用途 |
|---|---|
| XGBoost | 表格数据竞赛冠军模型 |
| LightGBM | XGBoost 的轻量替代,速度更快 |
| CatBoost | 对类别特征特别友好 |
| imbalanced-learn | 处理样本不均衡问题 |
4.3 深度学习(二选一,别都装)
PyTorch(推荐,学术界和工业界都在用):
# GPU 版(需要 NVIDIA 显卡 + CUDA)
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
# CPU 版(没有显卡就用这个)
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cpu
TensorFlow(Google 出品):
pip install tensorflow
怎么选? 2024 年以后学深度学习,选 PyTorch。生态更好,教程更多,论文复现更方便。除非你要接手 TensorFlow 的老项目,否则没必要从 TensorFlow 入手。
4.4 大模型相关(2024-2025 热门)
pip install transformers datasets accelerate
| 库名 | 用途 |
|---|---|
| Transformers | Hugging Face 出品,加载/使用各类大模型 |
| Datasets | 大模型训练数据集加载 |
| Accelerate | 简化多 GPU/TPU 训练代码 |
4.5 辅助工具库(建议装上)
pip install jupyter tqdm opencv-python Pillow requests
| 库名 | 用途 |
|---|---|
| Jupyter | 交互式编程环境 |
| tqdm | 进度条,跑循环时看着爽 |
| OpenCV | 图像处理 |
| Pillow | 图片读写 |
| Requests | HTTP 请求,抓数据用 |
五、国内镜像源加速:装包不再等半天
默认 pip 源在国外,下载巨慢。换成国内镜像源,速度能提升 10 倍以上。
临时使用(单次指定)
pip install numpy -i https://pypi.tuna.tsinghua.edu.cn/simple
永久配置(推荐)
方式1:命令行配置
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
方式2:创建配置文件
在用户目录下创建 pip/pip.ini(Windows)或 pip/pip.conf(Mac/Linux):
[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple
trusted-host = pypi.tuna.tsinghua.edu.cn
Conda 换镜像源
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch
conda config --set show_channel_urls yes
国内常用镜像源:清华源、阿里源、豆瓣源。清华源最全最稳,阿里源速度也很快。
六、第一个 AI 脚本:装完跑一下,确认没翻车
环境搭完不代表真的能跑。写一个小脚本验证所有核心库是否正常工作:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
# 1. 加载数据
iris = load_iris()
X, y = iris.data, iris.target
# 2. 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(
X, y, test_size=0.2, random_state=42
)
# 3. 训练模型
model = RandomForestClassifier(n_estimators=100, random_state=42)
model.fit(X_train, y_train)
# 4. 预测并评估
y_pred = model.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print(f"模型准确率:{accuracy:.2%}")
# 5. 可视化特征重要性
plt.figure(figsize=(8, 5))
features = iris.feature_names
importance = model.feature_importances_
bars = plt.barh(features, importance, color='#2E86AB')
plt.title('鸢尾花分类 - 特征重要性', fontsize=14)
plt.xlabel('重要性', fontsize=12)
# 在柱子上显示数值
for bar, val in zip(bars, importance):
plt.text(val + 0.01, bar.get_y() + bar.get_height()/2,
f'{val:.3f}', va='center', fontsize=10)
plt.tight_layout()
plt.savefig('first_ai_demo.png', dpi=150, bbox_inches='tight')
plt.show()
print("✅ 全部库工作正常,环境搭建完成!")
运行结果应该输出:模型准确率:100.00%,并弹出一张特征重要性柱状图。看到这个结果,说明你的环境完美运行。
七、常见报错与解决方案
| 报错信息 | 原因 | 解决方案 |
|---|---|---|
'python' 不是内部或外部命令 |
Python 没加 PATH | 重新安装,勾选 Add to PATH |
pip: command not found |
Mac/Linux 需用 pip3 |
用 python3 -m pip 代替 |
ERROR: Could not build wheel for xxx |
缺 C++ 编译器 | Windows 装 Visual Studio Build Tools |
OSError: Unable to open file |
文件路径含中文/空格 | 用英文路径或加引号 |
ImportError: DLL load failed |
CUDA 版本不匹配 | 检查 PyTorch CUDA 版本是否对应系统显卡驱动 |
UnicodeDecodeError |
文件编码问题 | pd.read_csv('file.csv', encoding='gbk') |
遇到报错别慌,把报错信息直接复制到搜索引擎,90% 的坑都有人踩过。
环境搭建是学 AI 的第一道门槛,但很多人因为这一步太繁琐就直接放弃了。其实就那么几步:装 Python → 配工具 → 建虚拟环境 → 装库 → 跑脚本。照着这篇文章做,30 分钟内搞定。
别被环境问题劝退,真正有意思的是后面——用代码让机器学会识别猫狗、生成图片、写文章。那些才是 AI 的魅力所在。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐




所有评论(0)