本地视频转文字免费工具

大蚂蚁2号 · 2026-06-04 19:04:03 发布

video2text Windows 安装指南（本地视频转文字免费工具）

关键词：video2text、Windows 安装、免费、本地视频转文字、Whisper large‑v3、Ollama、NVIDIA API、GPU 加速

video2text 是一个基于 Whisper large‑v3 的本地视频转文字工具，支持：

提示：AMD 显卡目前不支持 GPU 加速，仅能使用 CPU。

前往 123 云盘（或项目 Release 页面）下载完整压缩包 video2text_portable_windows_*.zip。
- 示例链接：https://1840674647.share.123pan.cn/123pan/7CfNTd-SE7j3?pwd=viWa（提取码 viWa）
网盘中包含 large‑v3 模型压缩包（约 3 GB）和 Ollama 预置模型（约 4.7 GB）。

建议使用高速网络，完整下载约 10 GB。

以下步骤假设解压目录为 D:\video2text，可自行替换为任意路径。

# PowerShell 示例
Expand-Archive -Path "C:\Users\YourName\Downloads\video2text_portable_windows_xxx.zip" -DestinationPath "D:\video2text"

目录结构应如下：

D:\video2text\
├─ video2text.exe
├─ video2text.bat
├─ config.ini
├─ .env (手动创建)
├─ models\
├─ output\
├─ logs\
└─ README.md

Expand-Archive -Path "C:\Users\YourName\Downloads\large-v3.zip" -DestinationPath "D:\video2text\models"

确保模型目录为 D:\video2text\models\large-v3\，内部包含 config.json、model.bin 等文件。

C:\Users\YourName\.ollama\
└─ models\
    ├─ blobs\
    └─ manifests\

首次启动 video2text.exe 时若未检测到 models\large-v3，程序会尝试从 HuggingFace 自动下载。可在 config.ini 的 [network] proxy 中配置代理。

CLI 验证示例：

.\video2text.exe transcribe "D:\sample\demo.mp4" -o output
.\video2text.exe summarize output\demo.txt -o output

若出现错误，请检查 logs/app.log 获取详细信息。

问题	解决方案
显卡不被识别	确认已安装最新 NVIDIA 驱动，运行 `nvidia-smi` 能显示 GPU 信息。
模型下载非常慢	在 `config.ini` 的 `[network]` 区块配置 HTTP/HTTPS 代理。
`NVIDIA_API_KEY` 无效	请在 NVIDIA Build 平台重新生成 API Key，确保无空格或换行。
Ollama 启动失败	检查系统防火墙是否拦截 `127.0.0.1:11434`，或重新安装 Ollama。