video2text Windows 安装指南(本地视频转文字免费工具)

关键词:video2text、Windows 安装、免费、本地视频转文字、Whisper large‑v3、Ollama、NVIDIA API、GPU 加速

目录

1. 项目概述

video2text 是一个基于 Whisper large‑v3 的本地视频转文字工具,支持:

  • 免费、无限制 时长的转写
  • GPU 加速(NVIDIA 显卡)或 CPU 兼容模式
  • OllamaNVIDIA 大模型摘要生成
  • 绿色版(免安装)GUI 与 CLI 双界面

2. 系统与硬件要求

项目 最低要求 推荐配置
操作系统 Windows 10 64 位 Windows 11 64 位
磁盘空间 20 GB 可用 30 GB 以上(含模型)
内存 8 GB 16 GB+
显卡 任意(CPU 可用但慢) NVIDIA GPU(6 GB+ 显存)+ CUDA 12.0+

提示:AMD 显卡目前不支持 GPU 加速,仅能使用 CPU。

3. 必备软件与依赖

  • NVIDIA 驱动(CUDA 12.0+)并确认 nvidia-smi 正常
  • Ollama(本地大模型)官方下载页(可选)

4. 下载准备

  1. 前往 123 云盘(或项目 Release 页面)下载完整压缩包 video2text_portable_windows_*.zip
    • 示例链接:https://1840674647.share.123pan.cn/123pan/7CfNTd-SE7j3?pwd=viWa(提取码 viWa
  2. 网盘中包含 large‑v3 模型压缩包(约 3 GB)和 Ollama 预置模型(约 4.7 GB)。

建议使用高速网络,完整下载约 10 GB。

5. 安装步骤

以下步骤假设解压目录为 D:\video2text,可自行替换为任意路径。

5.1 解压绿色版

# PowerShell 示例
Expand-Archive -Path "C:\Users\YourName\Downloads\video2text_portable_windows_xxx.zip" -DestinationPath "D:\video2text"

目录结构应如下:

D:\video2text\
├─ video2text.exe
├─ video2text.bat
├─ config.ini
├─ .env (手动创建)
├─ models\
├─ output\
├─ logs\
└─ README.md

5.2 放入 Whisper 模型

Expand-Archive -Path "C:\Users\YourName\Downloads\large-v3.zip" -DestinationPath "D:\video2text\models"

确保模型目录为 D:\video2text\models\large-v3\,内部包含 config.jsonmodel.bin 等文件。

5.3 配置 .env(可选)

  • NVIDIA API:在 D:\video2text\.env 中写入
    NVIDIA_API_KEY=nvapi-你的密钥
    

5.4 安装 Ollama(本地模型,仅在需要本地摘要时)

  1. 双击 OllamaSetup.exe 完成安装。
  2. 将下载好的 models.zip 解压至 %USERPROFILE%\.ollama\,保持以下结构:
C:\Users\YourName\.ollama\
└─ models\
    ├─ blobs\
    └─ manifests\

5.5 (可选)自动下载模型

首次启动 video2text.exe 时若未检测到 models\large-v3,程序会尝试从 HuggingFace 自动下载。可在 config.ini[network] proxy 中配置代理。

6. 快速验证

  1. 启动 GUI:双击 video2text.exe(或 video2text.bat)。
  2. 转写测试:在界面左上角选中一段短视频(10–20 秒),点击 仅转写。完成后在右侧面板查看转写文本。
  3. 摘要测试(已配置 NVIDIA API 或 Ollama):点击 仅总结,确认生成 Markdown 摘要。

CLI 验证示例:

.\video2text.exe transcribe "D:\sample\demo.mp4" -o output
.\video2text.exe summarize output\demo.txt -o output

若出现错误,请检查 logs/app.log 获取详细信息。

7. 主界面GUI

8. 常见问题 (FAQ)

问题 解决方案
显卡不被识别 确认已安装最新 NVIDIA 驱动,运行 nvidia-smi 能显示 GPU 信息。
模型下载非常慢 config.ini[network] 区块配置 HTTP/HTTPS 代理。
NVIDIA_API_KEY 无效 请在 NVIDIA Build 平台重新生成 API Key,确保无空格或换行。
Ollama 启动失败 检查系统防火墙是否拦截 127.0.0.1:11434,或重新安装 Ollama。

9. 参考资源


本指南遵循 SEO 最佳实践,使用目标关键词、结构化标题、表格与代码块,便于搜索引擎快速索引并提升自然流量。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐