本地视频转文字免费工具
·
video2text Windows 安装指南(本地视频转文字免费工具)
关键词:video2text、Windows 安装、免费、本地视频转文字、Whisper large‑v3、Ollama、NVIDIA API、GPU 加速
目录
1. 项目概述
video2text 是一个基于 Whisper large‑v3 的本地视频转文字工具,支持:
- 免费、无限制 时长的转写
- GPU 加速(NVIDIA 显卡)或 CPU 兼容模式
- Ollama 与 NVIDIA 大模型摘要生成
- 绿色版(免安装)GUI 与 CLI 双界面
2. 系统与硬件要求
| 项目 | 最低要求 | 推荐配置 |
|---|---|---|
| 操作系统 | Windows 10 64 位 | Windows 11 64 位 |
| 磁盘空间 | 20 GB 可用 | 30 GB 以上(含模型) |
| 内存 | 8 GB | 16 GB+ |
| 显卡 | 任意(CPU 可用但慢) | NVIDIA GPU(6 GB+ 显存)+ CUDA 12.0+ |
提示:AMD 显卡目前不支持 GPU 加速,仅能使用 CPU。
3. 必备软件与依赖
- NVIDIA 驱动(CUDA 12.0+)并确认
nvidia-smi正常 - Ollama(本地大模型)官方下载页(可选)
4. 下载准备
- 前往 123 云盘(或项目 Release 页面)下载完整压缩包
video2text_portable_windows_*.zip。- 示例链接:
https://1840674647.share.123pan.cn/123pan/7CfNTd-SE7j3?pwd=viWa(提取码viWa)
- 示例链接:
- 网盘中包含 large‑v3 模型压缩包(约 3 GB)和 Ollama 预置模型(约 4.7 GB)。
建议使用高速网络,完整下载约 10 GB。
5. 安装步骤
以下步骤假设解压目录为
D:\video2text,可自行替换为任意路径。
5.1 解压绿色版
# PowerShell 示例
Expand-Archive -Path "C:\Users\YourName\Downloads\video2text_portable_windows_xxx.zip" -DestinationPath "D:\video2text"
目录结构应如下:
D:\video2text\
├─ video2text.exe
├─ video2text.bat
├─ config.ini
├─ .env (手动创建)
├─ models\
├─ output\
├─ logs\
└─ README.md
5.2 放入 Whisper 模型
Expand-Archive -Path "C:\Users\YourName\Downloads\large-v3.zip" -DestinationPath "D:\video2text\models"
确保模型目录为 D:\video2text\models\large-v3\,内部包含 config.json、model.bin 等文件。
5.3 配置 .env(可选)
- NVIDIA API:在
D:\video2text\.env中写入NVIDIA_API_KEY=nvapi-你的密钥
5.4 安装 Ollama(本地模型,仅在需要本地摘要时)
- 双击
OllamaSetup.exe完成安装。 - 将下载好的
models.zip解压至%USERPROFILE%\.ollama\,保持以下结构:
C:\Users\YourName\.ollama\
└─ models\
├─ blobs\
└─ manifests\
5.5 (可选)自动下载模型
首次启动 video2text.exe 时若未检测到 models\large-v3,程序会尝试从 HuggingFace 自动下载。可在 config.ini 的 [network] proxy 中配置代理。
6. 快速验证
- 启动 GUI:双击
video2text.exe(或video2text.bat)。 - 转写测试:在界面左上角选中一段短视频(10–20 秒),点击 仅转写。完成后在右侧面板查看转写文本。
- 摘要测试(已配置 NVIDIA API 或 Ollama):点击 仅总结,确认生成 Markdown 摘要。
CLI 验证示例:
.\video2text.exe transcribe "D:\sample\demo.mp4" -o output
.\video2text.exe summarize output\demo.txt -o output
若出现错误,请检查 logs/app.log 获取详细信息。
7. 主界面GUI

8. 常见问题 (FAQ)
| 问题 | 解决方案 |
|---|---|
| 显卡不被识别 | 确认已安装最新 NVIDIA 驱动,运行 nvidia-smi 能显示 GPU 信息。 |
| 模型下载非常慢 | 在 config.ini 的 [network] 区块配置 HTTP/HTTPS 代理。 |
NVIDIA_API_KEY 无效 |
请在 NVIDIA Build 平台重新生成 API Key,确保无空格或换行。 |
| Ollama 启动失败 | 检查系统防火墙是否拦截 127.0.0.1:11434,或重新安装 Ollama。 |
9. 参考资源
- GitHub 项目主页 – https://github.com/fuyouling/video2text
- Whisper large‑v3 模型 – https://huggingface.co/models/large-v3
- Ollama 官方文档 – https://docs.ollama.com/
- NVIDIA Build – https://build.nvidia.com/
本指南遵循 SEO 最佳实践,使用目标关键词、结构化标题、表格与代码块,便于搜索引擎快速索引并提升自然流量。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)