Mac 上 ComfyUI + F5-TTS 语音克隆完整安装&使用教程

qq_35108994

571人浏览 · 2026-04-20 16:56:19

qq_35108994 · 2026-04-20 16:56:19 发布

前言：算力能力mps的能力只是略微大于cpu。生成克隆音频需要的时间略微稍长。

一、准备工作

1. 系统与硬件要求

• 系统：macOS 12+（推荐 Ventura/Sonoma）

• 芯片：Apple Silicon（M1/M2/M3），不支持Intel

• 内存：至少 16GB（推荐32GB）

• 磁盘：至少 20GB 可用空间（模型+环境）

2. 安装必备工具

打开「终端」执行：

# 安装Homebrew（如未安装）

/bin/bash -c “$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)”

# 安装依赖

brew install git python@3.11 ffmpeg

二、安装 ComfyUI（Mac 桌面版）

1. 下载安装包

• 访问官网：https://docs.comfy.org/installation/desktop/macos

• 下载 ComfyUI Desktop for macOS（.dmg）

2. 安装与初始化

1. 双击 .dmg，将 ComfyUI 拖入「应用程序」

2. 从 Launchpad 启动 ComfyUI

3. 首次启动：

◦ 选择 MPS（Metal）加速（Mac默认）

◦ 安装路径默认即可（全英文）

◦ 等待自动安装 Python、PyTorch 等依赖

3. 启动成功

浏览器自动打开：http://127.0.0.1:8188

三、安装 F5-TTS 插件（ComfyUI）

方法1：通过 ComfyUI Manager（推荐）

1. 打开 ComfyUI → 右侧 Manager

2. 搜索：F5-TTS 或 ComfyUI-F5-TTS

3. 找到 AIFSH/F5-TTS-ComfyUI → 点击 Install

4. 安装完成后重启 ComfyUI

方法2：手动安装（终端）

# 进入ComfyUI custom_nodes目录

cd ~/Library/Application\ Support/ComfyUI/custom_nodes

# 克隆插件

git clone https://github.com/AIFSH/F5-TTS-ComfyUI.git

# 进入目录安装依赖

cd F5-TTS-ComfyUI

pip install -r requirements.txt

# 重启ComfyUI

3. 下载模型（关键）

• 自动下载：首次使用会自动下载（约 2GB）

• 手动下载（国内）：

1. 下载模型：https://huggingface.co/SWivid/F5-TTS

2. 放入：ComfyUI/models/AIFSH/F5-TTS/

四、语音克隆使用教程

1. 准备参考音频

• 格式：WAV，24kHz，单声道

• 时长：3–15秒（人声清晰、无杂音）

• 内容：正常说话（中文/英文均可）

2. 加载工作流

1. ComfyUI → 菜单 Load → 搜索 F5-TTS

2. 选择 F5-TTS Voice Clone 工作流

3. 配置节点

• F5-TTS 节点：

◦ ref_audio：选择你的参考WAV

◦ ref_text：参考音频的文字内容

◦ gen_text：你想生成的文字

• Audio Output：输出路径（默认即可）

4. 生成语音

• 点击右上角 Queue Prompt（▶️）

• 等待生成（约10–30秒）

• 点击 Preview 播放、Save 保存

五、常见问题

1. 模型下载失败

• 终端执行：

export HF_ENDPOINT=https://hf-mirror.com

huggingface-cli download SWivid/F5-TTS --local-dir ~/Library/Application\ Support/ComfyUI/models/AIFSH/F5-TTS/

2. 报错 No module named f5_tts

• 重新安装依赖：

cd ~/Library/Application\ Support/ComfyUI/custom_nodes/F5-TTS-ComfyUI

pip install -r requirements.txt

3. 生成失败（声音奇怪）

• 检查参考音频：3–15秒、清晰无杂音、单声道

• 重启 ComfyUI

• 确认模型完整（F5-TTS 文件夹有 model.pt）

六、总结

1. 安装 ComfyUI Desktop（MPS加速）

2. 通过 Manager 安装 F5-TTS 插件

3. 准备 3–15秒清晰WAV参考音频

4. 加载工作流 → 配置节点 → 生成语音

可能出现的bug就是ffmpeg是系统安装的，comfyui桌面版有可能找不到ffmpeg的库依赖。以及各种版本问题。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

AtomGit 即将亮相 WAIC 2026｜来赴一场属于开发者的 AI Coding Party

AtomGit开源社区

G-Star 精选开源项目推荐｜第二十期

AtomGit开源社区

AtomGit AI Meetup 上海站开启报名！

AtomGit开源社区

所有评论(0)

查看更多评论

qq_35108994

@qq_35108994

已为社区贡献6条内容

Mac 上 ComfyUI + F5-TTS 语音克隆 完整安装&使用教程

qq_35108994

所有评论(0)

温馨提示：您尚未绑定手机号

qq_35108994

Mac 上 ComfyUI + F5-TTS 语音克隆完整安装&使用教程