3月25日,谷歌正式推出新一代AI音乐生成模型Lyria 3 Pro,距离上一代Lyria 3发布仅一个月。该模型实现核心能力跨越式升级,最长可生成3分钟完整专业音轨,支持精细化结构定制,同步落地多平台覆盖消费级、企业级及开发者全场景,进一步巩固谷歌在AI音乐生成领域的技术优势。

核心升级:从30秒片段到3分钟完整曲目,结构把控更精准

Lyria 3 Pro的核心突破的在于彻底打破前代模型的创作局限,在时长与结构控制上实现双重升级,大幅提升AI音乐的实用性与专业性,契合当前创作者对完整作品的核心需求。

相较于仅支持30秒片段生成的Lyria 3,Lyria 3 Pro将单次生成时长上限提升至3分钟,可直接输出接近商用标准的完整曲目。更关键的是,该模型具备强大的音乐结构感知能力,能够精准识别并生成前奏、主歌、副歌、桥段及过渡段落,用户可通过结构化提示词直接指定歌曲架构,实现对不同乐段风格、节奏与情感的精细化控制。

技术层面,Lyria 3 Pro依托优化后的Transformer架构与新型注意力机制,大幅提升了音乐生成的连贯性与精准度。测试数据显示,其复杂曲式结构还原准确率达82%,文本描述与生成结果的匹配度较前代提升40%,连贯性提升47%,可轻松处理节奏变化、和声转换等复杂音乐逻辑,甚至支持“8小节钢琴前奏+16小节电子舞曲主歌”这类复合指令创作。

全场景落地:多平台部署,覆盖全用户群体

谷歌此次采用差异化布局策略,将Lyria 3 Pro全面嵌入自身产品生态,实现从普通用户到企业客户、开发者的全场景覆盖,加速AI音乐能力的规模化落地。

消费级场景:贴合日常创作需求

Lyria 3 Pro已同步登陆Gemini应用,仅限付费用户使用,支持长曲目生成功能;同时深度整合至视频创作工具Google Vids,向Google Workspace客户及Google AI Pro、Ultra订阅用户开放,方便用户为Vlog、营销视频、播客等内容快速添加定制配乐,无需额外借助专业音乐工具。

企业级场景:赋能规模化创作

面向企业用户,该模型已在Vertex AI进入公开预览阶段,支持按需大规模生成高保真音频,可广泛应用于游戏原声带定制、影视配乐、品牌声学标识生成等场景。开发者可通过Gemini API调用模型能力,实现每秒生成8秒音乐的高效处理,大幅降低企业内容创作的时间与人力成本。

专业创作场景:助力音乐人创新

谷歌上月收购的AI音乐制作平台ProducerAI,已完成与Lyria 3 Pro的整合,向全球免费及付费用户开放,为艺术家、制作人和词曲作者提供智能体式创作体验。此外,谷歌还通过Music AI Sandbox项目收集专业音乐人的反馈,持续优化模型,格莱美奖得主制作人Yung Spielburg、DJ François K等已将Lyria系列模型应用于实际创作中。

合规保障:三重机制护航,规避行业痛点

针对AI音乐领域备受关注的版权与合规问题,Lyria 3 Pro建立了完善的保障体系,兼顾创作自由与行业规范,降低用户使用风险。

其一,训练数据采用合作伙伴授权内容与YouTube可许可素材的混合模式,确保数据来源合法合规;其二,设置艺术家风格保护层,即便用户在提示词中指定某位艺术家,模型也仅提取其作品整体特征作为宽泛灵感,不直接模仿;其三,所有生成音轨均强制嵌入SynthID数字水印,该水印可抵抗音频压缩、格式转换等处理,实现AI生成内容的永久可追溯,为平台内容治理提供技术支撑。

行业影响:推动AI音乐从实验走向规模化商用

当前,AI音乐生成工具正从实验阶段加速转向规模化商用,市场研究机构MIDiA预测,2025年AI音乐市场规模将达17亿美元。Lyria 3 Pro的推出,不仅填补了AI生成完整专业音轨的市场空白,更通过“模型+平台+服务”的生态闭环,重新定义AI音乐创作范式。

业内人士分析,Lyria 3 Pro的升级的不仅为各类创作者提供了高效、便捷的创作工具,让普通用户也能轻松产出专业级音乐内容,更将推动音乐行业向“AI协同创作”转型,为中小创作者、企业提供更多发展机遇。与此同时,其合规机制也为行业树立了标杆,助力解决AI音乐版权归属、内容识别等行业痛点。

谷歌表示,后续将持续收集用户反馈,迭代优化Lyria 3 Pro的功能体验,进一步拓展应用场景,同时深化与专业音乐人的合作,推动AI技术与音乐艺术的深度融合,助力AI音乐生态持续完善。

文章来源:AITOP100

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐