花儿不哭RVC整合包 - 优化/补充/纠错教程
想必很多人都了解过B站上一位大佬 花儿不哭 ,TA的B站签名是:
RVC变声器创始人,要让所有人都能免费享受到科技进步带来的成果。RVC唯一官方账号,无任何合作,声称官网/收费的均为诈骗
该大佬提供了 GPT-SoVITS 与 RVC训练推理整合包,并且提供了官方教程文档。
原官方教程链接
在我跟随文档进行操作时却发现,部分步骤/流程/示意图与整合包中不一致,应该是整合包版本更新而教程没有同步更新的原因。
因此,我仅以一个“幸运儿”(幸运地成功训练出自己想要的模型)的身份来写这篇补充教程,本身我自己也不太懂RVC的底层技术细节/原理
本文没有使用 AI 辅助,文字都是手敲的,如有错漏希望多多包涵,也欢迎评论区指出!
本文中的 “作者” 一词,除特殊说明外,皆指RVC整合包原作者 - 花儿不哭
本人训练电脑配置:
- CPU:Intel core i5-13450HX
- 显卡:NVIDIA GeForce RTX 4060 Laptop GPU
目录
作者提供的官方资料
在B站关注作者花儿不哭后,会默认发送一部分GPT-SoVITS的资料,回复RVC会回复关于RVC的资料,部分RVC资料链接如下:
希望多多关注作者!
整合包作者:花儿不哭 - B站个人主页
RVC宣发/教程视频:RVC变声器官方教程:10分钟克隆你的声音!一键训练,低配显卡用户福音!
开源github发布地址:Retrieval-based-Voice-Conversion-WebUI(不会编程的不要下这个,但是欢迎给作者点个STAR!)
RVC交流裙:2168060207
教程文档:RVC指南
训练推理整合包链接:
- 免费满速下载直链合集:语音克隆&变声器 整合包下载
- 度盘链接:语音克隆&变声器 整合包下载(提取码见链接末尾)
整合包有7个多G,建议确保网络与磁盘空间充足再开始下载!
RVC指南个人补充
仅根据个人经验进行补充与分享,不代表绝对正确,也不代表这是唯一正确的路线
快速开始
该部分没有补充
基础知识
这部分非常重要,非常推荐仔细阅读!
尤其是没有编程经验者,需要读完全部;对计算机非常熟悉的,可以直接对照目录按需阅读
整合包教程
在开始之前
实测,电脑在开启卡巴斯基时,对训练没有影响,可以正常完成训练。
1. 下载
实测Edge浏览器,确实有概率在下载到末尾时,进度条卡在最后无法完成下载。
2. 打开
2.1 解压
注意将程序保存至全英文路径的文件夹!
2.2 打补丁
打补丁步骤,如果是直接下载的整合包,那么补丁已经默认打好了,不需要自己手动打补丁,忽略这步即可。
3. 训练
3.1 训练集准备
这一步非常重要,我曾因为训练集数据过少而导致训练出来都模型效果不佳。
音频来源:
- 如果是想要训练游戏角色声音,建议解包获取原声,或者前往游戏官网/wiki/粉丝网站等获取高质量音频
- 上网查询是否有目标音色的训练素材
- 如果没有干净的素材,就跟着原教程一步步操作吧
声音“干净”的标准:
- 除了目标声音外,无其它人声
- 如果是音乐,确保没有伴奏、和声
- 喘气声尽可能少,尽量为干净的说话声
注意事项
非常建议将训练素材保存到一个单独的文件夹,确保文件路径中没有中文!
建议文件名也不要使用中文!
关于"一键训练"
原教程把这部分放在后面,但是我提前了
教程说一键训练容易有bug,但是经过我的实测,一键训练还是非常好用的!
注意事项:
- 一键训练前,务必先把参数调整好:按照教程中手动训练的步骤先设置好参数,一键训练会使用设定好的参数
- 一键训练确实还有bug:容易在最后一步没有生成特征索引模型
解决方法:训练完成后不要急着离开页面,先去RVC文件夹中的log文件夹,点开本次训练实验名称的文件夹,检查是否有.index后缀的文件,有就成功完成了训练,没有就去网页手动点击训练特征推理模型
3.2 生成训练集
- 采样率
原教程说:
采样率选40k(48k有大概率炸炉,反正别选)
但是我进行了多轮训练,都是使用的 48k,并没有炸炉现象,我个人猜测该问题已经被修复了
- 音高算法
原教程说:
音高提取算法无脑选rmvpe_gpu,除非你知道为什么要选别的算法否则别选别的。
我采用的是rmvpe,实测可行
3.3 训练主模型
- 三个训练选项
原教程建议:
剩下三个选项建议这样设置:
[ ] 是否仅保存最新的ckpt文件以节省硬盘空间✅
[ ] 是否缓存所有训练集至显存❌
[ ] 是否在每次保存时间点将最终小模型保存至weights文件夹✅
我进行这个设置后"炸炉"了
可以尝试的设置是:
[ ] 是否仅保存最新的ckpt文件以节省硬盘空间✅
[ ] 是否缓存所有训练集至显存❌
[ ] 是否在每次保存时间点将最终小模型保存至weights文件夹❌
当然,这个原因很复杂,我也不确定是个例还是普遍现象,建议多多尝试!
3.4 训练特征索引
虽说教程说可练可不练,但是我建议还是练一下
需要注意的是: 这一步对显卡的占用很低,几乎听不到风扇声,因此很多人会以为电脑没有开始训练,其实已经在训练了
一切信息以控制台输出为准!
4 推理
该部分无补充。
实时变声
我后续可能会再出一篇教程?
结尾
该教程仅根据个人训练经验与试错经历总结,仅代表我个人电脑的情况,提供给大家作为参考,不代表绝对正确,也不代表能够无条件复刻。
如果遇到难以解决的困难或疑惑,可以请往官方交流裙,礼貌询问大佬们。
最后祝大家都能成功训练出自己想要的模型!
封面图来源于网络,如有侵权,请联系删除!
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)