ACE-Step1.5 XL 完全指南：工作流使用教程 + LoRA 模型训练全解析

2601_95544990

756人浏览 · 2026-05-06 14:18:57

2601_95544990 · 2026-05-06 14:18:57 发布

ACE-Step 从 5.0 升级至 1.5 XL 版本

支持根据需求生成多种风格的音乐

并可通过训练 LoRA 模型，精准复刻特定音乐风格与歌手音色

本期视频将带你全面掌握：

一、ACE-Step1.5 XL 工作流的使用与安装方法

二、如何训练 LoRA 模型，实现音乐风格与歌手音色的复刻

看完之后，你就能根据自己的创作需求，

轻松生成专属风格的音乐

一、ACE step1.5XL工作流的使用和安装方法

1、ACE step1.5XL工作流使用方法

1.输入音乐风格

风格描述：在指定区域输入想要生成的音乐风格描述

示例格式：如"trap-influenced beat, deep 803 bass, tight hi-hats"

详细程度：描述越详细，生成结果越接近预期效果

条件设置：可以设置曲风、歌词、拍号、调式等,用于精确控制生成方向

2.输入时长

时间单位：以秒为单位输入，60秒=1分钟

种子设置：用于采样过程的随机种子数

典型时长：可根据音乐类型设置不同时长，如流行歌曲通常3-4分钟

3.每分钟节拍数

BPM作用：表示每分钟节拍数，决定音乐速度

速度范围：

慢速(60-80BPM)：适合情歌、民谣等安静风格

中速(90-120BPM)：接近自然心率，适合流行歌曲

快速(120-180BPM)：适合舞曲、电子乐等动感风格

拍号设置：决定小节结构和律动，常见4/4拍

实用意义：

音乐制作：帮助规划节奏和段落

运动配合：跑步健身可选择120-140BPM的音乐

4.点击运行

操作步骤：所有参数设置完成后点击运行按钮

生成速度：模型运行速度很快，能快速生成音乐

效果试听：生成后可立即试听，注意调整合适音量

2、ACE step1.5XL的安装方法

1.comfyui管理大师一键自动安装

准备整合包

整合包准备：需要准备一个纯净的整合包

找到工作流并安装

工作流广场：ACE step 1.5xl音乐生成工作流

一键安装：点击后自动下载工作流文件和插件依赖

重启步骤：安装完成后需重启以生效

运行验证：重启后可在comfyui管理大师中运行验证

本地运行：安装后支持本地直接运行音乐生成工作流

2.comfyui搅拌站手动安装

点击模型广场并下载

模型下载方法：通过comfyui搅拌站进入模型广场

目标模型：ACE Step 1.5XL音乐生成模型及工作流

下载步骤：点击模型→免费网盘下载→覆盖本地comfyui models

使用流程：启动comfyui→拖入下载的工作流文件

关键文件：需替换本地的models文件夹确保兼容性

二、训练LoRA模型：复刻音乐风格+歌手音色

1、训练步骤

第一步：收集素材

第二步：配置训练

新建数据集

操作流程：

点击"新建数据集"按钮

为数据集命名（如"bigly"）

点击添加素材按钮

选择音乐素材文件（支持.mp3等格式）

自动打标

关键参数：

打标类型：选择"音频(ACE Step)"

打标语言：中英文标签

随机程度：数值越高结果越自由

最大生成词数：控制标签长度

注意事项：

音频时长影响打标速度和显存占用

建议打标后人工校验标签质量

新建训练任务

基础设置：

任务命名（如"xuwei_style"）

选择基础模型："ACE step1.5 XL base"

设置训练轮数：默认200轮

优化器类型：adamw8bit

采样设置

音频训练专用参数：

单条音频最大时长：默认240秒（4分钟）

最小音频时长：小于5秒不参与训练

过程采样：

可设置采样音频时长（如120秒）

可关闭采样以节省资源

模型训练

训练监控：

自动完成初始化操作

实时显示训练进度

可随时终止训练

输出频率：

默认每100轮保存一次模型

每1000步保存检查点

查看采样音频

采样效果评估：

按时间倒序排列采样结果

最新采样显示在顶部

支持播放120秒采样音频

典型输出：

包含训练风格的音乐片段

保留歌手音色特征

loss曲线查看

曲线类型：

按训练步数统计的loss曲线

按训练轮数统计的loss曲线

模型输出

输出管理：

按步数保存的模型文件（如20000步）

按轮数保存的模型版本

支持打开/删除操作

文件格式：

.safetensors格式

2、工作流配置

3、运行音乐生成工作流

输入要素：

音乐风格描述

歌词文本（按特定格式）

生成时长（秒）

BPM和拍号

典型输出：

保留训练风格的完整歌曲

时长匹配设置值

4、禁用LoRA节点运行

效果对比：

启用LoRA：输出训练风格音乐

禁用LoRA：随机生成普通音乐

验证方法：

同一提示词不同设置

对比生成结果差异

三、知识小结

分类维度	核心内容	技术参数	操作流程
产品功能	ACE step 1.5XL音乐生成模型	- 支持风格/歌词/时长自定义	1. 输入音乐风格描述2. 填写歌词3. 设置时长(秒)4. 配置节拍(120-180BPM)
安装方法	comfyui管理大师一键安装	- 含工作流/插件/依赖库自动配置	1. 下载整合包2. 工作流广场搜索3. 点击一键安装并重启
关键控制项	- 种子数(采样质量)- 拍号(节奏型)- 调式(音乐色彩)	参数联动影响生成效果	通过comfyui界面实时调整
输出特性	- 支持说唱类高速生成(180BPM)- 自动降噪处理	生成速度: <30秒/分钟音频	点击运行后自动保存MP3文件
进阶功能	- 节奏拉伸- 音高修正- 多轨混合	需加载额外插件包	在comfyui搅拌站模型广场下载扩展组件

步骤	操作要点	关键参数	技术亮点
数据准备	新建数据集/添加音频素材	音频时长限制	自动打标技术
模型训练	选择ACE step 1.5XL Lora模型	最大训练轮数/音频切片时长	动态显存优化
参数配置	设置音乐风格描述/歌词格式	BPM/拍号/调式	多模态参数控制
训练监控	查看loss曲线/音频采样	模型保存频率(每100轮)	实时效果预览
模型应用	加载到comfyui工作流	风格描述/歌词/时长种子	音色复刻功能
效果对比	Lora启用与禁用测试	生成时长120秒	风格控制精度