模型下载

原文档

作者:龙沅可

相信很多RVC爱好者都有一个困扰:低显存显卡是不是只能做推理,压根没法参与模型训练?答案是否定的!没有最拉的设备,只有最会做适配的开发者!本次我基于NVIDIA GTX 1050 Ti 4G显卡,全程完成了拳皇15麻宫雅典娜定制RVCv2轻量模型的训练与优化,不仅训练全程无显存溢出、无过热,模型还能高保真还原角色音色,且专为低配置设备做了深度适配,部署零门槛,今天就把这款模型开源分享,同时附上全量训练参数、部署步骤和推理最优配置,手把手教低配置玩家玩转RVC模型训练与使用!

一、模型核心基础信息

本次开源的麻宫雅典娜RVCv2模型为柴云智算轻量级系列,由龙洛工作室从零训练,属于非商用二创模型,专为小显存显卡打造,核心基础信息如下,所有参数均做了硬件适配优化:

  • 工程名:麻宫雅典娜RVCv2模型(轻量级)

  • 标准实验名:Athena Asamiya15

  • RVC版本:v2 | 训练版本:RVC1006Nvidia

  • 目标采样率:40k(音高指导:开启)

  • 最终核心模型文件:G_1530.pth

  • 模型性质:非商用二创 | 适用场景:拳皇同人配音、语音合成、非盈利二创

二、训练核心配置:GTX1050Ti的极致适配

本次模型训练全程围绕GTX1050Ti 4G小显存显卡做参数定制,从硬件分工到训练参数,每一步都为低配置设备量身打造,全程GPU温度稳定在46℃左右,无任何显存溢出、程序崩溃问题。

1. 硬件配置与分工

  • 训练硬件:NVIDIA GeForce GTX 1050 Ti(4GB专用GPU内存+4GB共享,总8GB),显卡驱动32.0.15.8180

  • 预处理硬件:Intel(R) HD Graphics 630核显,承担音频转码、切片工作,利用率仅2%,完全不占用独显资源

  • 训练平台:RVC WebUI v2 可视化界面,新手也能轻松操作

2. 关键训练参数(小显存适配核心)

针对GTX1050Ti显存限制,核心参数做了精准调优,也是低配置显卡训练RVC的关键参考:

  • CPU进程数:4 | 说话人id:0(单人训练)

  • 总训练轮数:30epoch(保证音色还原度)| 保存频率:每10epoch保存一次

  • 单卡batch_size:1(显存适配核心参数)| 不缓存训练集至显存(避免溢出)

  • 无预训练底模:从零训练 | 保留全epoch模型文件:支持不同阶段效果对比

  • 特征提取算法:pm(首相算法),兼顾提取速度与音高精度,适配语音/歌声合成

3. 数据集与预处理

数据集选用拳皇15 TV版剧情/对战纯净语音,做了轻量化处理,适配小显存训练需求:

  • 数据规格:21段单人语音,总时长约105s,转码为单声道WAV格式

  • 处理方式:自动切片为5s左右短音频,降低训练显存占用

  • 处理工具:万兴喵影,操作简单,新手可复刻

三、模型快速部署:RVC WebUI v2零门槛使用

本模型已完成Ckpt格式标准化处理,无需任何额外格式转换,直接复制文件至对应目录即可使用,步骤超简单,零基础也能上手:

1. 模型文件部署

将核心文件G_1530.pth复制至RVC WebUI根目录的weights文件夹,通用路径参考:


./weights/ E:\RVC-WebUI\weights\ D:\RVC-WebUI\weights\

2. 索引文件部署

若有配套索引文件,直接复制至RVC WebUI根目录的logs/Athena Asamiya15/ 文件夹即可。

3. 部署验证

启动RVC WebUI,在「推理」界面的「模型选择」下拉框中选择Athena Asamiya15(或G_1530.pth),索引文件会自动匹配加载,加载完成即可正常推理。

四、推理最优配置:必看!避免音色失真

想要最大程度还原麻宫雅典娜的原生音色,推理时必须严格匹配训练配置,这是低配置模型使用的关键细节,缺一不可:

  1. 采样率:固定40k,与训练配置完全一致;

  2. 音高指导:开启(true),保证语音/歌声的语调、旋律还原;

  3. 音高提取算法:使用pm(首相算法),与训练时的算法保持统一。

五、模型核心优势

这款轻量级RVCv2模型不仅实现了GTX1050Ti的训练突破,还兼顾了使用体验和效果,核心优势总结为5点:

  1. 极致低配适配:专为GTX1050Ti优化,训练/推理均无显存溢出,低配置显卡友好;

  2. 部署零门槛:标准化Ckpt格式,无需转码,直接复制文件即可使用;

  3. 硬件分工合理:核显做预处理、独显做训练,充分利用设备资源,运行效率更高;

  4. 高保真音色:30epoch全量训练+pm算法特征提取,最大程度还原角色原生音色;

  5. 文件留存完整:保留所有训练epoch模型文件,方便开发者二次调优、对比效果。

六、模型下载地址&版权使用限制

1. 模型下载

115网盘:https://115cdn.com/s/swfeop03nam?password=z996&#

访问码:z996

2. 严格版权限制(必看!)

本模型基于拳皇15语音素材制作,为非商用二创作品,开源仅用于技术交流与个人非盈利创作,使用时需遵守以下规则,违规使用需自行承担全部法律责任:

  1. 禁止将模型及生成的语音内容用于任何商业盈利场景

  2. 仅可用于个人学习、非盈利同人创作、娱乐等非商用用途;

  3. 不得利用模型合成恶意、违法、色情、暴力或侵犯他人合法权益的内容。

七、写在最后

本次GTX1050Ti训练RVC模型的尝试,证明了低配置显卡并非不能参与RVC训练,关键在于参数的精准适配数据集的轻量化处理。后续我还会持续更新低配置显卡的RVC训练技巧和定制模型,感兴趣的朋友可以关注一波!

如果大家在模型使用、低配置RVC训练过程中遇到任何问题,欢迎在评论区留言交流,我会逐一解答!也期待大家用这款麻宫雅典娜模型做出更多有趣的二创作品~

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐