OpenAI开源语音识别模型Whisper在Windows系统安装和anaconda环境使用CPU版PyTorch过程中部分报错解决

锻炼²

434人浏览 · 2026-05-07 15:09:51

锻炼² · 2026-05-07 15:09:51 发布

目录

前言

可参考

一. 安装conda环境

二. 创建Whisper文件夹进入命令窗口

三. 将路径添加到 Conda 配置文件

四. 创建python环境

五. 激活环境

六. 安装 CPU版/GPU版

七. 装 FFmpeg(anaconda环境不兼容)

7.1 先删除conda:删除所有已下载的软件包

7.2 更新conda自身到最新版

7.3 查看当前使用的所有镜像源，恢复为空配置

7.4 安装流程：

7.5 验证conda安装是否成功

7.6 看conda 的版本

7.7 修改python版本

八. 激活模型

8.1材料准备

8.2 启动模型和使用(以tiny和small为例)

九. 模型下载位置

前言

安装和使用OpenAI Whisper 遇到的问题个人自用记录。

详细使用请参考openai发布的官网：https://github.com/openai/whisper

可参考

一、OpenAI Whisper 官方网址
https://github.com/openai/whisper

二、Conda官方网址
https://anaconda.org/anaconda/conda

三、为OpenAI Whisper创建环境
1.创建专用文件夹，路径根据自己情况选择磁盘，需6个多G的空间，建议选用SSD盘，这样启动速度快。
F:\Whisper
文件夹可自己命名，但路径要记好，后面要用

2.资源管理器，打开路径文件夹
在地址栏输入 cmd 然后回车，打开命令窗口

3.将路径加入到 Conda 配置文件
conda config --add envs_dirs "D:\jjy\Software\Whisper"
将"F:\Whisper"，改成你安装的路径

4.创建环境(python=3.11其他的就不要使用了，我使用3.13后续报错)
conda create -n "whisper-env" python=3.11

5.激活环境(如果激活失败)
conda activate "whisper-env"

四、安装PyTorch
PyTorch分CPU和GPU两个版本，GPU版本需英文达GTX60系列以后的显卡，否则的话安装CPU版

1.安装 CPU版
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

2.安装GPU版
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

五、安装 FFmpeg
conda install ffmpeg -c conda-forge

六、安装Whisper
1.国外安装
pip install -U openai-whisper

2.国内清华大学镜像服务器安装
pip install -U openai-whisper -i https://pypi.tuna.tsinghua.edu.cn/simple

七、下载批处理脚本程序
https://www.toprender.com/portal.php?mod=attachment&id=575

注：可参考哔哩哔哩 MA5老师他有conda环境的详细视频

一. 安装conda环境

我电脑原来安装了anaconda里面就直接包含了conda；我这里可以直接使用

二. 创建Whisper文件夹进入命令窗口

这里创建文件夹是为了存放后面的应用

我创建的目录为：D:\jjy\Software\Whisper

进入该目录下的命令窗口

三. 将路径添加到 Conda 配置文件

conda config --add envs_dirs "D:\jjy\Software\Whisper"
这里的"文件夹路径"替换到自己的路径

四. 创建python环境

conda create -n "whisper-env" python=3.11
注意：不要使用python=3.13版本，我试了不可用，就使用3.11版本

五. 激活环境

conda activate "whisper-env"
如果激活失败报错：D:\jjy\Software\Whisper>conda activate "whisper-env" CondaError: Run 'conda init' before 'conda activate'

一.直接在命令窗口输入：conda init cmd.exe

二.接着重新打开：D:\jjy\Software\Whisper路径的cmd控制面板

三.接着再执行：conda activate whisper-env

六. 安装 CPU版/GPU版

CPU版本(清华大学镜像，我使用这个)：
pip install torch torchvision torchaudio -i https://pypi.tuna.tsinghua.edu.cn/simple
GPU版本(普通下载，我没有试)
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

七. 装 FFmpeg(anaconda环境不兼容)

报错解决：

这个报错是 conda install ffmpeg 导致的 DLL 依赖冲突，和我之前装的 conda-forge 库版本不兼容，

我这里是这样子解决的：

7.1 先删除conda:删除所有已下载的软件包

(会有好几个包需要删除，y然后回车即可)
conda clean --all
7.2 更新conda自身到最新版
conda update conda
7.3 查看当前使用的所有镜像源，恢复为空配置
# 查看当前使用的所有镜像源
conda config --show channels

# 清除所有自定义镜像源，恢复为空的配置
conda config --remove-key channels
7.4 安装流程：

推荐使用清华大学开源软件镜像站（TUNA）
# 1. 显式添加 defaults 频道（防止隐式添加警告）
conda config --add channels defaults

# 2. 添加主仓库镜像源（清华）
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/

# 3. 添加 conda-forge 社区库镜像源（清华）
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/

# 4. 设置 channel_priority 为 flexible
conda config --set channel_priority flexible

# 5. 显示每个包的来源，方便排查问题
conda config --set show_channel_urls yes
7.5 验证conda安装是否成功
conda config --show channels
7.6 看conda 的版本
conda info
7.7 修改python版本

conda info 输出的 python version : 3.13.5.final.0 并不是你当前激活环境（whisper_env）的 Python 版本，而是 Conda 这个命令行工具本身所依赖的 Python 版本。而 python --version 显示的是当前激活环境（whisper_env）中的 Python 解释器版本，也就是特意安装的 3.11.15。
# 创建名为 whisper_env 的环境，指定 Python 3.11
conda create -n whisper_env python=3.11

# 激活这个新环境
conda activate whisper_env

# 验证 Python 版本
python --version
可以看到我已经改好了

八. 激活模型

8.1材料准备

准备中文英文日语(音频或视频)，尽量短一点的测试使用；

在该文件夹进入命令窗口

8.2 启动模型和使用(以tiny和small为例)

官网链接：

https://github.com/openai/whisper

8.2.1 启动模型

我这里有两个whisper作为测试，我这里以下划线_的为例
conda activate whisper_env
中文	Chinese 或 zh
英文	English 或 en
日语	Japanese 或 ja

启动：
conda activate whisper_env

whisper 抖音.mp4 --model small --language English --output_format txt
或者
whisper 抖音.mp4 --model small --language ja --output_format txt
8.2.2 下载和使用tiny模型(音频转对应日语语言文字)生成txt文件
C:\Users\Administrator\Desktop\文件对比\test\音频测试>conda activate whisper_env

(D:\jjy\Software\Whisper\whisper_env) C:\Users\Administrator\Desktop\文件对比\test\音频测试>whisper 日语测试1.mp4 --model tiny --language ja --output_format txt
生成的txt文件

8.2.3 下载和使用small模型(音频转对应英语语言文字)生成txt文件

生成的txt文件