Gemini CLI 集成 Fish Voice MCP 全教程
Gemini CLI 集成 Fish Voice MCP 全教程
在现代开发场景中,Ace Data Cloud 提供了一套高效的多模态计算平台(MCP,Model Context Protocol),支持文本、语音、图像等模型的调用。Fish Audio 是其高保真 TTS(文本转语音)服务,支持选择音色、采样率和格式,涵盖 s1 / s2-pro 模型。通过 Gemini CLI 集成 Fish Voice MCP 后,你可以直接在命令行或对话中调用语音合成功能,无需频繁切换窗口或复制粘贴,提高开发和测试效率。
环境准备 / 前置条件
第一步:获取 API Token
- 打开 AceData Cloud 平台。
- 登录账户后,在首页复制 API Token。
- 一个 Token 可用于访问所有 AceData Cloud MCP 服务。
- 如需详细步骤,可参考官方完整指南:完整指南 →。
第二步:配置 Fish Voice MCP
方式一:命令行一键添加(推荐)
gemini mcp add fish \
--type http \
--url https://fish.mcp.acedata.cloud/mcp \
--header "Authorization: Bearer yourToken"
方式二:手动编辑配置文件
编辑 ~/.gemini/settings.json,添加 MCP 配置:
{
"mcpServers": {
"fish": {
"httpUrl": "https://fish.mcp.acedata.cloud/mcp",
"headers": { "Authorization": "Bearer yourToken" }
}
}
}
⚡ 配置完成后,下次启动 Gemini CLI 即可使用 Fish Voice 工具。
第三步:使用示例
Fish Voice MCP 提供 fish_generate_audio 工具,可进行多语言文本合成,支持选择模型、音色、采样率、格式及延迟模式。
# 合成中文文本为 mp3(默认音色)
fish_generate_audio "你好,欢迎使用 Fish Voice MCP" --output hello.mp3
# 合成英文文本为 wav,采样率 44100Hz,使用指定音色
fish_generate_audio "Hello world!" --format wav --sample-rate 44100 --voice-id xxxx --output hello.wav
# 合成播客脚本为 mp3,码率 128kbps,低延迟模式
fish_generate_audio "今天的播客内容是..." --format mp3 --bitrate 128 --low-latency --output podcast.mp3
工具功能概览
| 工具 | 功能说明 |
|---|---|
| fish_generate_audio | 文本转语音,支持 s1 / s2-pro 模型,音色、采样率、格式和延迟模式可选 |
常见问题
-
Token 无法生效
- 确认是否复制完整 Token。
- 确认 JSON 配置格式正确,避免多余逗号或引号错误。
-
生成音频不播放或报错
- 检查输出文件格式与播放器兼容性。
- 确认网络连接正常,并能访问
https://fish.mcp.acedata.cloud/mcp。
-
想切换模型或音色
- 参考命令行参数
--voice-id或--model,可自由选择 s1 / s2-pro。
- 参考命令行参数
总结
通过 Gemini CLI 集成 Fish Voice MCP,你可以在命令行中快速完成文本转语音操作,无需跳转窗口,极大提高开发与测试效率。结合 Ace Data Cloud 的 MCP 服务,你还可以扩展更多 AI 模型能力,如图像生成、数据分析等。对于初中级开发者,这是一套即学即用的高效工具链。
相关链接
标签
#AceDataCloud #GeminiCLI #TTS #MCP #开发教程
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)