ComfyUI集成InfiniteTalk工作流，实现宠物主播视频生成

水上冰石 · 2026-05-22 17:17:20 发布

InfiniteTalk 运行在 ComfyUI 里，工作流文件是核心。推荐用社区已经调好的版本。这里有几个获取路径：

社区整合资源：推荐这个网盘 https://pan.quark.cn/s/4ac8f9e32423?pwd=JKb6，包含模型和工作流
另一个整合包：https://pan.quark.cn/s/ef8c64027412（网盘中找 infiniteTalk工作流模型和示例文件夹）
FP8轻量化版：约 33GB，B站 UP 主提供的 242-InfiniteTalk对口型FP8版
官方工作流：可去 InfiniteTalk 官方 Hugging Face 仓库找（详见下方链接）

下载后是一个 .json 文件（或者压缩包，解压获得），先放着，后面会拖进 ComfyUI。

确保这些插件已安装，否则工作流会显示红字报错。

必需插件列表：

安装步骤：

如果之前已安装 ComfyUI-WanVideoWrapper，请更新到最新版。InfiniteTalk 的代码已合并至新版 WanVideoWrapper 中，更新后 MultiTalk 节点的名称会变成 MultiTalk / Infinite MultiTalk。

InfiniteTalk 需要下载 6 个模型文件，大小加起来约 40GB。下面是完整清单：

模型	大小	存放路径
Image-to-Video Diffusion Model	~16 GB	`ComfyUI/models/diffusion_models/`
Audio-to-Video Diffusion Model (InfiniteTalk Single)	~2.6 GB	同上
Text Encoder	~6.5 GB	`ComfyUI/models/text_encoders/`
Clip Vision Model	~1.2 GB	`ComfyUI/models/clip_vision/`
VAE	~0.25 GB	`ComfyUI/models/vae/`
Melband Row Former / wav2vec2	~0.5 GB	`diffusion_models/` (自动下载)

获取方式：

官方 Hugging Face 仓库：https://huggingface.co/MeiGen-AI/InfiniteTalk
仓库中找 ComfyUI 文件夹，里面包含 InfiniteTalk Single 和 InfiniteTalk Multi 两个 .safetensors 文件
也可以从第一步的网盘链接直接下载，包含完整的模型文件。

放置技巧：

首次运行时，wav2vec2 音频编码器可能会自动下载，耐心等待即可。

生成时间参考（参考值）：RTX 3090 上约 1 秒视频需要 33 秒生成，9 秒视频约 5 分钟。你的 RTX 5060 8G 可能会稍慢一些，但可以正常跑。

显存是这张卡的瓶颈，下面这几个设置非常关键：

1. 启动参数优化（最重要） 在启动脚本（run_nvidia_gpu.bat）中，找到 main.py 那行，在后面加上：

python main.py --lowvram --reserve-vram 1 --fp16-unet

2. 分辨率与帧数控制

3. 使用量化模型

4. 关闭无关程序 生成时关闭浏览器、Chrome 等占用显存的应用，尽可能把资源留给 ComfyUI。

问题现象	可能原因	解决方法
工作流导入后显示红字节点	缺少插件	点“Install All Missing Nodes”安装，然后重启
报 "Missing Models"	模型路径不对	检查 `models/diffusion_models/` 下是否有模型文件
`CUDA out of Memory`	显存不足	降低分辨率、减少单次输出帧数，或者使用 FP8 量化模型
音频对口型不同步	音频质量不佳	使用人声分离工具（如 UVR5）提取纯净干声
模型下载不下来	网络问题	用国内云盘资源下载，或更换 Hugging Face 镜像源
导入工作流时找不到路径	ComfyUI 版本问题	检查 `C:\Users\你的用户名\Documents\ComfyUI\models` 下是否有模型。如果没有，可以复制 `extra_model_paths.yaml.example` 并重命名，编辑路径指向正确位置