uvr5的下载使用和一些常用模型(个人使用于so-vits-svc)
uvr5下载:
uvr5模型下载:
新下载的uvr5仅仅自带了很少的模型,大部分模型需要自己下载。(点开小扳手)
(点download center)
接下来分为两种情况。
1,有VPN(可以直接在uvr内下载)选好自己需要的模型,点击下载,下好的模型会自动放入对应的文件夹。
2,没有VPN(点击小钥匙下面的按钮)
选择自己要下的模型,已经有的模型不会显示,大家选自己需要的就行,我是随便选的。
选择后点击open link to model 就会自动跳转到下载连接。(如果电脑下载不了的话大家可以试试用手机下,真的很神奇,有时候电脑下不了的手机就可以)
下载好后点击open model directory 将下载好的模型放进去就好了
处理方式:
- Ensemble Mode:合奏模式
- VR Architecture:个人用于分离和声与混响
- MDX-Net:个人用于分离人声与伴奏
- Demucs:没用过
(1)VR Architecture:
2个参数:
Windews Size:越小,效果就越好,占用的资源越大。常用有3种“1024低精换”,“512平均”,“320较好”。
Aggression Setting (力度设置):设置去除声音的力度,默认10,数值超过10可能导致非人声模型的乐器声变得浑浊。
常用模型:
4_HP:分离人声与伴奏
5_HP-Karokee-UVR.pth:将人声和其他声音分离(激进)
6_HP-Karaoke-UVR.pth: 将人声和其他声音分离(温和)
UVR-DeEcho-DeReverb:去混响降噪(激进)
UVR-De-Echo-Aggressive:去混响降噪(平均)
UVR-De-Echo-Normal:去混响降噪(温和)
UVR-DeNoice:去混响杂音
还要提一嘴,这个算法在分离人声时有可能会把ASMR中的人声当成背景音
(2)MDX-Net:
具有5种模式的模型,这些模型使用混合频谱/波形进行源分离(处理高音质音频的AI算法,对人声的识别提取能力强大,就是慢一些)
常用模型:均为可以分离人声与伴奏的模型
MDX23C-InstVoc HQ :分离人声与伴奏,很强但处理时间长(大概是现存最强的模型)
BS-Roformer-Viperx-1296:2024年3月末更新,需要beta版安装(可以代替MDX23C)与它同时更新的还有2个微调版本,可以自行下载体验。
UVR_MDXNET_1.onnx:在SDR上得分9.703
UVR_MDXNET_2.onnx:在SDR上得分9.682
UVR_MDXNET_3.onnx:在SDR上得分9.662,
UVR_MDXNET_main.onnx:据说很强
更多推荐
所有评论(0)