目录

前言

可参考

一. 安装conda环境

二. 创建Whisper文件夹进入命令窗口

三. 将路径添加到 Conda 配置文件

四. 创建python环境

五. 激活环境

六. 安装 CPU版/GPU版

七. 装 FFmpeg(anaconda环境不兼容)

7.1 先删除conda:删除所有已下载的软件包

7.2 更新conda自身到最新版

7.3 查看当前使用的所有镜像源,恢复为空配置

7.4 安装流程:

7.5 验证conda安装是否成功

7.6 看conda 的版本

7.7 修改python版本

八. 激活模型

8.1材料准备

8.2 启动模型和使用(以tiny和small为例)

九. 模型下载位置


前言

安装和使用OpenAI Whisper 遇到的问题个人自用记录。

详细使用请参考openai发布的官网:https://github.com/openai/whisper

可参考

一、OpenAI Whisper 官方网址
https://github.com/openai/whisper

二、Conda官方网址
https://anaconda.org/anaconda/conda

三、为OpenAI Whisper创建环境
1.创建专用文件夹,路径根据自己情况选择磁盘,需6个多G的空间,建议选用SSD盘,这样启动速度快。
F:\Whisper
文件夹可自己命名,但路径要记好,后面要用

2.资源管理器,打开路径文件夹
在地址栏输入 cmd 然后回车,打开命令窗口

3.将路径加入到 Conda 配置文件
conda config --add envs_dirs "D:\jjy\Software\Whisper"
将"F:\Whisper",改成你安装的路径

4.创建环境(python=3.11其他的就不要使用了,我使用3.13后续报错)
conda create -n "whisper-env" python=3.11

5.激活环境(如果激活失败)
conda activate "whisper-env"

四、安装PyTorch
PyTorch分CPU和GPU两个版本,GPU版本需英文达GTX60系列以后的显卡,否则的话安装CPU版

1.安装 CPU版
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

2.安装GPU版
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

五、安装 FFmpeg
conda install ffmpeg -c conda-forge

六、安装Whisper
1.国外安装 
pip install -U openai-whisper

2.国内清华大学镜像服务器安装 
pip install -U openai-whisper -i https://pypi.tuna.tsinghua.edu.cn/simple

七、下载批处理脚本程序 
https://www.toprender.com/portal.php?mod=attachment&id=575

注:可参考 哔哩哔哩 MA5老师 他有conda环境的详细视频

一. 安装conda环境

我电脑原来安装了anaconda里面就直接包含了conda;我这里可以直接使用

二. 创建Whisper文件夹进入命令窗口

这里创建文件夹是为了存放后面的应用

我创建的目录为:D:\jjy\Software\Whisper

进入该目录下的命令窗口

三. 将路径添加到 Conda 配置文件

conda config --add envs_dirs "D:\jjy\Software\Whisper"

这里的"文件夹路径"替换到自己的路径

四. 创建python环境

conda create -n "whisper-env" python=3.11

注意:不要使用python=3.13版本,我试了不可用,就使用3.11版本

五. 激活环境

conda activate "whisper-env"

如果激活失败报错:D:\jjy\Software\Whisper>conda activate "whisper-env" CondaError: Run 'conda init' before 'conda activate' 

一.直接在命令窗口输入:conda init cmd.exe

二.接着重新打开:D:\jjy\Software\Whisper路径的cmd控制面板

三.接着再执行:conda activate whisper-env

六. 安装 CPU版/GPU版

CPU版本(清华大学镜像,我使用这个):

pip install torch torchvision torchaudio -i https://pypi.tuna.tsinghua.edu.cn/simple

GPU版本(普通下载,我没有试)

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

七. 装 FFmpeg(anaconda环境不兼容)

报错解决:

这个报错是 conda install ffmpeg 导致的 DLL 依赖冲突,和我之前装的 conda-forge 库版本不兼容,

我这里是这样子解决的:

7.1 先删除conda:删除所有已下载的软件包

(会有好几个包需要删除,y然后回车即可)

conda clean --all

7.2 更新conda自身到最新版

conda update conda

7.3 查看当前使用的所有镜像源,恢复为空配置

# 查看当前使用的所有镜像源
conda config --show channels

# 清除所有自定义镜像源,恢复为空的配置
conda config --remove-key channels

7.4 安装流程:

推荐使用清华大学开源软件镜像站(TUNA)

# 1. 显式添加 defaults 频道(防止隐式添加警告)
conda config --add channels defaults

# 2. 添加主仓库镜像源(清华)
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/

# 3. 添加 conda-forge 社区库镜像源(清华)
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/

# 4. 设置 channel_priority 为 flexible
conda config --set channel_priority flexible

# 5. 显示每个包的来源,方便排查问题
conda config --set show_channel_urls yes

7.5 验证conda安装是否成功

conda config --show channels

7.6 看conda 的版本

conda info

7.7 修改python版本

conda info 输出的 python version : 3.13.5.final.0 并不是你当前激活环境(whisper_env)的 Python 版本,而是 Conda 这个命令行工具本身所依赖的 Python 版本。而 python --version 显示的是当前激活环境(whisper_env)中的 Python 解释器版本,也就是特意安装的 3.11.15。

# 创建名为 whisper_env 的环境,指定 Python 3.11
conda create -n whisper_env python=3.11

# 激活这个新环境
conda activate whisper_env

# 验证 Python 版本
python --version

可以看到我已经改好了

八. 激活模型

8.1材料准备

准备中文英文日语(音频或视频),尽量短一点的测试使用;

在该文件夹进入命令窗口

8.2 启动模型和使用(以tiny和small为例)

官网链接:

https://github.com/openai/whisper

8.2.1 启动模型

我这里有两个whisper作为测试,我这里以下划线_的为例

conda activate whisper_env
中文	Chinese 或 zh
英文	English 或 en
日语	Japanese 或 ja

启动:
conda activate whisper_env

whisper 抖音.mp4 --model small --language English --output_format txt
或者
whisper 抖音.mp4 --model small --language ja --output_format txt

8.2.2 下载和使用tiny模型(音频转对应日语语言文字)生成txt文件

C:\Users\Administrator\Desktop\文件对比\test\音频测试>conda activate whisper_env

(D:\jjy\Software\Whisper\whisper_env) C:\Users\Administrator\Desktop\文件对比\test\音频测试>whisper 日语测试1.mp4 --model tiny --language ja --output_format txt

生成的txt文件

8.2.3 下载和使用small模型(音频转对应英语语言文字)生成txt文件

生成的txt文件

九. 模型下载位置

使用文件资源管理器打开以下路径

%USERPROFILE%\.cache\whisper\turbo.pt

可以看到,我安装了这两个模型它位于c盘,如果不想使用了可以直接删除

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐