gemini-srt-translator(开源缩写通常为 GST)是目前技术流圈子里用来翻译字幕最硬核、也是最好用的神器之一。它的一大核心亮点是支持双 API Key 轮询(用来白嫖免费额度防限流),并且能够把原视频的音频和字幕结合起来喂给 Gemini,利用声音的上下文(语气、环境音、停顿)来实现极精准的翻译。

它同时提供了 CLI 命令行流GUI 图形界面流以及 Python 脚本流。以下是针对这三种流派的完整保姆级使用指南:


🛠️ 第一步:获取免费的 Gemini API Key

  1. 登录 Google AI Studio
  2. 点击 “Generate API Key” 创建密钥(格式形如 AIzaSy...)。
  3. 极客建议: 建议直接注册生成两个 Key。因为 Gemini 的免费额度有每分钟请求频率限制(RPM),该工具原生支持配置两个 Key 自动轮替,这样翻译长视频时完全不会卡顿。

💻 方案一:CLI 命令行流(效率最高、推荐)

如果你喜欢敲命令或需要批量处理,这是最爽的路线。

1. 安装

确保电脑有 Python 环境,在终端中运行:

pip install --upgrade gemini-srt-translator

注: 如果你想用它的高级功能(比如让它提取视频音频提供翻译上下文),电脑里需要安装过 ffmpeg

2. 实战命令

① 最基础的单文件翻译

gst translate -i course.srt -l "Simplified Chinese" -k "你的第一个API_KEY"

② 终极技术流翻译(多参数拉满)
在翻译技术视频(如吴恩达老师的课程)时,我们要加入双 Key、限定模型、并给出技术语境描述:

gst translate \
  -i input.srt \
  -l "Simplified Chinese" \
  -k "第一个API_KEY" \
  -k2 "第二个API_KEY" \
  --model "gemini-2.5-flash" \
  --batch-size 40 \
  --description "This is an AI development course by Andrew Ng. Keep terms like Prompt, Bug, HTML, AI, Agent in English. Use standard tech Chinese."

  • --batch-size 40:每次打包 40 句话给 Gemini,既让它有上下文,又不容易因为单次吐字太多导致格式坍塌。
  • --description:注入灵魂,告诉 Gemini 这是什么视频,防止它瞎翻专业术语。

③ 结合音频上下文的高级翻译(音画同步流)
如果把视频文件一并传给它,它会自动分离音频提供给 Gemini 听,用来辅助理解字幕的意思,准确率会暴增:

gst translate -i input.srt -v video.mp4 -l "Simplified Chinese" -k "你的API_KEY"


🖥️ 方案二:GUI 图形界面流(不爱敲代码的选这个)

社区里有开发者专门为它做了一个极其精致的带壳版本叫 gemini-srt-translator-gui

  1. 下载解压: 无需安装环境.
    在 GitHub 搜索并进入 dane-9/gemini-srt-translator-gui 的 Releases 页面,直接下载打包好的 .exe(Windows)或对应包。这个版本已经内置了 FFmpeg,解压即用。

  2. 配置 API Key: 防限流设置.
    双击打开程序,在主界面上方的 “API Key 1”“API Key 2” 框里,把你在 AI Studio 申请的两个密钥分别粘贴进去。

  3. 导入文件: 音视频自动配对.
    点击 “Add Files”强烈建议:把 .srt 字幕文件和对应的 .mp4 视频文件同时选中导入。软件会自动把它们配对,并提示可以使用视频音频作为上下文。

  4. 添加提示词与开始: 一键输出.
    右键点击队列中的任务,选择“添加描述(Description)”,输入类似“AI开发课程,保留Prompt、Bug等行业术语”。然后在上方 Language 选择 Chinese (Simplified),点击 “Start Translating” 即可。


🐍 方案三:Python 脚本流(适合集成进你自己的工作流)

如果你正在写自己的自动化脚本,可以直接在 Python 里调用它的底层库:

import gemini_srt_translator as gst

# 1. 基础配置
gst.gemini_api_key = "你的第一个_API_KEY"
gst.gemini_api_key2 = "你的第二个_API_KEY"  # 可选,用于提升免费额度频率

# 2. 翻译核心参数设置
gst.input_file = "andrew_ng_course.srt"
gst.output_file = "andrew_ng_course_zh.srt"
gst.target_language = "Simplified Chinese"
gst.model_name = "gemini-2.5-flash"
gst.batch_size = 40

# 3. 注入IT技术课提示词
gst.description = "AI and Software Engineering course. Keep original terms like Prompt, LLM, Debug, Token unchanged."

# 4. 执行翻译
gst.translate()

💡 核心避坑与进阶技巧:

  • 遇到中断不要慌(支持断点续传): 字幕长了或者网络抖动可能会导致大模型报错中断。gemini-srt-translator 原生支持断点续传。一旦中断,你不需要做任何特殊处理,直接再次运行相同的命令,它会自动检测到已经翻译了一半的临时文件,并弹出提示问你是否 Resume(续传),输入 y 即可无缝接着翻,不浪费额度。
  • 查看 Token 消耗: 最新版本可以通过在 CLI 命令后面加上 --token-stats 标志,实时在控制台打印当前翻译消耗了多少 Prompt Token 和输出了多少字符。
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐