一、训练自己的音色模型步骤

1、准备好要训练的数据,放在Data文件夹中,按照文件模板中的结构进行存放数据

在这里插入图片描述
在这里插入图片描述

2、双击打开go-webui.bat文件,等待页面跳转

在这里插入图片描述

3、页面打开后,开始训练自己的模型

(1)、人声伴奏分离。

点击打开人声伴奏分离批量处理界面(如果没有伴奏背景可以省略这一步)
在这里插入图片描述
在这里插入图片描述

(2)、音频切割。

在这里插入图片描述

(3)、识别语音中的文本。

在这里插入图片描述

(4)、文本语音校对。

在这里插入图片描述
在这里插入图片描述

(5)、提取训练前所需信息

在这里插入图片描述

(6)、开始训练模型

在这里插入图片描述

(7)、测试自己的模型

在这里插入图片描述
在这里插入图片描述

二、API调用

1、创建一个conda虚拟环境,安装requirements.txt所需要的库

如果需要使用gpu,安装的cuda和torch版本推荐:
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

2、安装好后,运行api.py文件,根据格式进行API调用

在这里插入图片描述

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐