GST【gemini-srt-translator】的使用介绍
gemini-srt-translator(开源缩写通常为 GST)是目前技术流圈子里用来翻译字幕最硬核、也是最好用的神器之一。它的一大核心亮点是支持双 API Key 轮询(用来白嫖免费额度防限流),并且能够把原视频的音频和字幕结合起来喂给 Gemini,利用声音的上下文(语气、环境音、停顿)来实现极精准的翻译。
它同时提供了 CLI 命令行流、GUI 图形界面流以及 Python 脚本流。以下是针对这三种流派的完整保姆级使用指南:
🛠️ 第一步:获取免费的 Gemini API Key
- 登录 Google AI Studio。
- 点击 “Generate API Key” 创建密钥(格式形如
AIzaSy...)。 - 极客建议: 建议直接注册生成两个 Key。因为 Gemini 的免费额度有每分钟请求频率限制(RPM),该工具原生支持配置两个 Key 自动轮替,这样翻译长视频时完全不会卡顿。
💻 方案一:CLI 命令行流(效率最高、推荐)
如果你喜欢敲命令或需要批量处理,这是最爽的路线。
1. 安装
确保电脑有 Python 环境,在终端中运行:
pip install --upgrade gemini-srt-translator
注: 如果你想用它的高级功能(比如让它提取视频音频提供翻译上下文),电脑里需要安装过
ffmpeg。
2. 实战命令
① 最基础的单文件翻译
gst translate -i course.srt -l "Simplified Chinese" -k "你的第一个API_KEY"
② 终极技术流翻译(多参数拉满)
在翻译技术视频(如吴恩达老师的课程)时,我们要加入双 Key、限定模型、并给出技术语境描述:
gst translate \
-i input.srt \
-l "Simplified Chinese" \
-k "第一个API_KEY" \
-k2 "第二个API_KEY" \
--model "gemini-2.5-flash" \
--batch-size 40 \
--description "This is an AI development course by Andrew Ng. Keep terms like Prompt, Bug, HTML, AI, Agent in English. Use standard tech Chinese."
--batch-size 40:每次打包 40 句话给 Gemini,既让它有上下文,又不容易因为单次吐字太多导致格式坍塌。--description:注入灵魂,告诉 Gemini 这是什么视频,防止它瞎翻专业术语。
③ 结合音频上下文的高级翻译(音画同步流)
如果把视频文件一并传给它,它会自动分离音频提供给 Gemini 听,用来辅助理解字幕的意思,准确率会暴增:
gst translate -i input.srt -v video.mp4 -l "Simplified Chinese" -k "你的API_KEY"
🖥️ 方案二:GUI 图形界面流(不爱敲代码的选这个)
社区里有开发者专门为它做了一个极其精致的带壳版本叫 gemini-srt-translator-gui。
-
下载解压: 无需安装环境.
在 GitHub 搜索并进入dane-9/gemini-srt-translator-gui的 Releases 页面,直接下载打包好的.exe(Windows)或对应包。这个版本已经内置了 FFmpeg,解压即用。 -
配置 API Key: 防限流设置.
双击打开程序,在主界面上方的 “API Key 1” 和 “API Key 2” 框里,把你在 AI Studio 申请的两个密钥分别粘贴进去。 -
导入文件: 音视频自动配对.
点击 “Add Files”。强烈建议:把.srt字幕文件和对应的.mp4视频文件同时选中导入。软件会自动把它们配对,并提示可以使用视频音频作为上下文。 -
添加提示词与开始: 一键输出.
右键点击队列中的任务,选择“添加描述(Description)”,输入类似“AI开发课程,保留Prompt、Bug等行业术语”。然后在上方 Language 选择Chinese (Simplified),点击 “Start Translating” 即可。
🐍 方案三:Python 脚本流(适合集成进你自己的工作流)
如果你正在写自己的自动化脚本,可以直接在 Python 里调用它的底层库:
import gemini_srt_translator as gst
# 1. 基础配置
gst.gemini_api_key = "你的第一个_API_KEY"
gst.gemini_api_key2 = "你的第二个_API_KEY" # 可选,用于提升免费额度频率
# 2. 翻译核心参数设置
gst.input_file = "andrew_ng_course.srt"
gst.output_file = "andrew_ng_course_zh.srt"
gst.target_language = "Simplified Chinese"
gst.model_name = "gemini-2.5-flash"
gst.batch_size = 40
# 3. 注入IT技术课提示词
gst.description = "AI and Software Engineering course. Keep original terms like Prompt, LLM, Debug, Token unchanged."
# 4. 执行翻译
gst.translate()
💡 核心避坑与进阶技巧:
- 遇到中断不要慌(支持断点续传): 字幕长了或者网络抖动可能会导致大模型报错中断。
gemini-srt-translator原生支持断点续传。一旦中断,你不需要做任何特殊处理,直接再次运行相同的命令,它会自动检测到已经翻译了一半的临时文件,并弹出提示问你是否Resume(续传),输入y即可无缝接着翻,不浪费额度。 - 查看 Token 消耗: 最新版本可以通过在 CLI 命令后面加上
--token-stats标志,实时在控制台打印当前翻译消耗了多少 Prompt Token 和输出了多少字符。
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)