胡桃讲编程：低配显卡训练过程之处理数据

我的世界洛天依

508人浏览 · 2026-03-28 14:11:34

我的世界洛天依 · 2026-03-28 14:11:34 发布

哟呼～各位蹲守屏幕前玩 RVC 的低配卡小伙伴！胡桃带着超重磅的异世界嘉宾来咯✨！掌声欢迎来自拳皇世界的超萌女神 ——麻宫雅典娜！

「こんにちは！私は麻宮アテナです！」（翻译：大家好！我是麻宫雅典娜！）

嘿嘿，雅典娜的日语招呼是不是超甜～今天咱特邀雅典娜全程助阵，以我 GTX1050Ti 真机实战为例，手把手教大家搞定低配显卡训练 RVC 的第一步 —— 数据处理！全程纠正实战误区、补全所有低配友好工具，连降噪环节都加了新选择，不管是做洛天依这类虚拟歌姬模型，还是雅典娜这样的拳皇角色模型，跟着我和雅典娜走，新手也能一步到位，低配机丝滑操作不踩坑！

一、素材收集：分场景实操，歌姬 / 拳皇角色各有专属妙招

做不同模型的素材收集方法完全不同，我把所有免费、GTX1050Ti 友好的工具全整理好了，都是真机实测的干货！先把两个核心误区讲透，再上具体方法，雅典娜全程围观实操，直呼低配卡玩 RVC 也太轻松啦～

✅ 场景 1：做洛天依等虚拟歌姬 / 歌手模型→三款免费工具，轻松分离纯净人声

想做歌姬模型不用费劲找纯人声素材！三款神器任选，人声分离一步到位，显存占用超低，GTX1050Ti 完全无压力，雅典娜凑过来试了试，直说操作比拳皇放技能还简单～

万兴喵影：操作最傻瓜，右键音频直接选「人声分离」，几十秒出结果，新手闭眼冲；
UVR5：开源免费神作！显存占用极度友好，人声分离精度还超高，适合想抠细节的小伙伴；
网易云音乐工作室 X Studio：国产免费软件，除了分离人声还能做简单音频编辑，一站式搞定超省心。

💡 实战小提醒：优先下载高清单曲，分离后只保留纯人声文件，音质直接拉满，后续训练效果更棒！

✅ 场景 2：做麻宫雅典娜等拳皇角色模型→咪咕快游专属收集法，低配卡狂喜！

给拳皇角色录台词，咪咕快游绝对是神器！不用下载几十 G 的游戏本体，浏览器 / 模拟器直接玩，采集台词超省事，这也是我训练雅典娜模型的核心方法，重点划清模拟器录制的关键细节，懒人必看！

咪咕快游网页版：浏览器打开就能玩拳皇，轻量级到极致！配合万兴喵影无麦克风录屏，只勾选系统音频，直接采集纯音频，录出来的台词纯净无杂音；
咪咕快游 TV 版 + 模拟器：装在雷电 / MuMu 模拟器里，懒人专属！模拟器自带录制功能是录视频，但划重点 —— 音质和万兴无麦克风直接录的一模一样好，不用额外转码、提取音轨，直接拖进剪辑软件就能剪，省去单独录音频的步骤，超省事！

✅ GTX1050Ti 真机实测（核心纠正！）万兴喵影、咪咕快游、模拟器确实会调用独显，但占用率低到离谱！低到什么程度？你可以同时开两个咪咕快游 + 模拟器录屏，电脑依旧丝滑不卡顿，GTX1050Ti 完全扛得住，雅典娜都惊呆了：「こんなに軽いなんて！」（居然这么轻量！）

💡 我的实战经验：素材贵精不贵多！我给雅典娜采集的就是 21 段日语台词，单段 5-10 秒，轻量模型训练，20-30 段就是完美数据量，多了反而增加低配卡的训练显存压力～

二、素材剪辑 + 导出：万兴喵影一站式搞定，降噪有新选，独显渲染眨眼完成！

收集好的素材，不管是万兴录的纯音频，还是模拟器录的视频素材，直接用万兴喵影一站式剪辑，全程简单无脑！核心参数刻进 DNA：单声道！WAV 格式！40k/44k (44.1k) 采样率，错一个都可能影响后续训练～重点补充降噪新工具，不想用万兴自带功能的小伙伴直接冲！

步骤 1：精准裁剪，保留纯净原声

把素材拖进万兴喵影时间轴，不管是纯音频还是视频里的音轨，用「分割」工具切成5 秒左右的短句，删掉无意义的空白、轻微杂音片段，只保留最纯净的人声 / 台词。雅典娜还帮我检查素材，把一段带轻微游戏音效的直接删掉，超严谨，直呼「綺麗な音だけ残すのが一番！」（只留下干净的声音才最好！）

步骤 2：降噪处理，万兴 / 修音软件双选择，低配卡都适配！

如果素材有一点点背景杂音，降噪环节别踩坑！轻度降噪即可，千万别拉满，不然会让角色音色失真，这里给大家两种选择，按需挑选，都是 GTX1050Ti 友好型～

万兴喵影自带降噪：懒人首选，选中音频点击「音频编辑→降噪」，直接选轻度降噪，默认参数就行，操作简单，不用额外装软件；
专业修音软件：想让降噪效果更细腻，不想用万兴自带功能的话，可选M5、WAVE、Mixxx这类修音软件，全是低配卡友好型，显存占用极低，GTX1050Ti 运行无压力，操作也不复杂，简单调参就能搞定，重点还是别过度处理，保留角色原生的语气和音色！

雅典娜也跟着提醒：「キャラクターの原音を保つのが重要です」（保留角色的原声很重要哦～），毕竟咱做的是专属角色模型，独特的音色才是灵魂！

步骤 3：极速导出，低配卡的终极惊喜！

这一步是所有低配党最爱的环节！虽然导出渲染需要调用 GTX1050Ti 独显，但速度快到眨眼就完成，完全不用漫长等待！我真机实测：5 秒的素材，不管是纯音频还是从视频里提取的音轨，导出仅需 2 秒，快到你刚点下导出，进度条就走完了，低配卡也能拥有飞一般的速度！

✅ 导出参数直接抄作业，别改！

格式：WAV（无损格式，轻量模型识别度最高，低配机处理无压力）
声道：单声道（必须！能减少一半显存占用，GTX1050Ti 的保命关键）
采样率：40k / 44k / 44.1k（三者皆可，40k 和龙洛轻量模型完美匹配，不用额外调配置）

我把处理好的素材整理进「麻宫雅典娜 - RVC 训练集」文件夹，雅典娜还帮我按台词长短分了类，超贴心～

三、重磅实战技巧！雅典娜模型多语言实测 + 标准国粤声库训练方法

这部分全是我用 GTX1050Ti 训练完雅典娜模型的压箱底干货，雅典娜听完自己的多语言语音，直接解锁三语成就，眼睛都亮了，直呼太神奇啦！

✅ 技巧 1：日语素材训练→日 / 国 / 粤三语全精通！

理论上，用纯日语台词素材训练的模型，应该只适合说日语，但我实测直接打破常识！我的雅典娜模型日语发音超标准，国语清晰不拗口，粤语还很流利，三种语言无缝切换，雅典娜拿着我的手机听了半天，直呼：「私は 3 ヶ国語を話せる！すごい！」（我会说三种语言啦！太厉害啦！）低配党如果做游戏角色模型，哪怕素材是单一语言，一定要试试让模型说其他语言，大概率会有惊喜！

✅ 技巧 2：想做标准国语 / 粤语声库？这些工具闭眼冲！

如果想做像 Vocaloid 一样的专业分语言声库（纯国语 / 纯粤语），不用费劲找海量真人素材，我实测了几款超适配低配卡的工具，分在线版和本地版，按需选择就行，全程不占太多显存～

🌟 在线版（低配党首选！零门槛）

NiceVoice 在线版、GPT-soVITS 在线版，网页直接操作，无需下载任何 TTS 模型，不占显卡，只要准备 10-15s 的参考音频（就是咱们处理好的 WAV 纯净素材），上传就能生成标准的国语 / 粤语语音，直接用来训练 RVC 超合适！

🌟 本地版（适合想深度调试的小伙伴）

GPT-soVITS 本地版、index-TTS2 本地版，选轻量版安装，别装完整版，避免占太多显存，GTX1050Ti 核显就能跑，完全不占独显资源，生成的语音风格更可控，能精准匹配角色人设！

四、胡桃 & 雅典娜低配卡实战终极总结

✨ 胡桃：拳皇素材冲咪咕快游！模拟器录视频音质和万兴录音频一样好，直接剪辑；降噪可选万兴自带或 M5/WAVE/Mixxx；所有工具占独显但极低，能双开；导出 5 秒素材仅 2 秒，低配卡也能飞！✨ 雅典娜：「素材は少なくて質が良ければ大丈夫！編集はモノラル + WAV が一番！ノイズリダクションは過度にしないで～」（素材少而精就好！剪辑一定要单声道 + WAV 才最棒！降噪别过度哦～）✨ 合：GTX1050Ti 照样玩转 RVC！找对方法和工具，低配卡也能做出超棒的专属角色模型！

今天有雅典娜助阵的数据处理实战就到这啦～接下来我就用这份处理好的雅典娜专属数据集，在 GTX1050Ti 上复刻龙洛工作室的轻量模型训练全过程，全程实战无套路、纯干货，雅典娜还会继续来助阵，一起解锁低配卡训练的更多小技巧！咱们下期训练见～✨

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

Anthropic-安装指南

AtomGit开源社区

数据挖掘、数据分析学习路线作品集

5.2 光伏功率回归预测：使用的Transformer变体-Crossformer模型，光伏功率具有很强的周期性，使用Crossformer捕捉一段时间内光伏的变化模型，引入分解将功率列分解为周期项、季节项、残差项，并对Crossformer模型输出层进行改进，使用统计DM检验验证改进模型显著优于LSTM、Transformer、Informer、Reformer。基础语法跟着b站UP学习，重点聚