谷歌Lyria 3 Pro正式发布，可生成3分钟专业级AI音轨

AITOP100

444人浏览 · 2026-03-26 11:26:55

AITOP100 · 2026-03-26 11:26:55 发布

3月25日，谷歌正式推出新一代AI音乐生成模型Lyria 3 Pro，距离上一代Lyria 3发布仅一个月。该模型实现核心能力跨越式升级，最长可生成3分钟完整专业音轨，支持精细化结构定制，同步落地多平台覆盖消费级、企业级及开发者全场景，进一步巩固谷歌在AI音乐生成领域的技术优势。

核心升级：从30秒片段到3分钟完整曲目，结构把控更精准

Lyria 3 Pro的核心突破的在于彻底打破前代模型的创作局限，在时长与结构控制上实现双重升级，大幅提升AI音乐的实用性与专业性，契合当前创作者对完整作品的核心需求。

相较于仅支持30秒片段生成的Lyria 3，Lyria 3 Pro将单次生成时长上限提升至3分钟，可直接输出接近商用标准的完整曲目。更关键的是，该模型具备强大的音乐结构感知能力，能够精准识别并生成前奏、主歌、副歌、桥段及过渡段落，用户可通过结构化提示词直接指定歌曲架构，实现对不同乐段风格、节奏与情感的精细化控制。

技术层面，Lyria 3 Pro依托优化后的Transformer架构与新型注意力机制，大幅提升了音乐生成的连贯性与精准度。测试数据显示，其复杂曲式结构还原准确率达82%，文本描述与生成结果的匹配度较前代提升40%，连贯性提升47%，可轻松处理节奏变化、和声转换等复杂音乐逻辑，甚至支持“8小节钢琴前奏+16小节电子舞曲主歌”这类复合指令创作。

全场景落地：多平台部署，覆盖全用户群体

谷歌此次采用差异化布局策略，将Lyria 3 Pro全面嵌入自身产品生态，实现从普通用户到企业客户、开发者的全场景覆盖，加速AI音乐能力的规模化落地。

消费级场景：贴合日常创作需求

Lyria 3 Pro已同步登陆Gemini应用，仅限付费用户使用，支持长曲目生成功能；同时深度整合至视频创作工具Google Vids，向Google Workspace客户及Google AI Pro、Ultra订阅用户开放，方便用户为Vlog、营销视频、播客等内容快速添加定制配乐，无需额外借助专业音乐工具。

企业级场景：赋能规模化创作

面向企业用户，该模型已在Vertex AI进入公开预览阶段，支持按需大规模生成高保真音频，可广泛应用于游戏原声带定制、影视配乐、品牌声学标识生成等场景。开发者可通过Gemini API调用模型能力，实现每秒生成8秒音乐的高效处理，大幅降低企业内容创作的时间与人力成本。

专业创作场景：助力音乐人创新

谷歌上月收购的AI音乐制作平台ProducerAI，已完成与Lyria 3 Pro的整合，向全球免费及付费用户开放，为艺术家、制作人和词曲作者提供智能体式创作体验。此外，谷歌还通过Music AI Sandbox项目收集专业音乐人的反馈，持续优化模型，格莱美奖得主制作人Yung Spielburg、DJ François K等已将Lyria系列模型应用于实际创作中。

合规保障：三重机制护航，规避行业痛点

针对AI音乐领域备受关注的版权与合规问题，Lyria 3 Pro建立了完善的保障体系，兼顾创作自由与行业规范，降低用户使用风险。

其一，训练数据采用合作伙伴授权内容与YouTube可许可素材的混合模式，确保数据来源合法合规；其二，设置艺术家风格保护层，即便用户在提示词中指定某位艺术家，模型也仅提取其作品整体特征作为宽泛灵感，不直接模仿；其三，所有生成音轨均强制嵌入SynthID数字水印，该水印可抵抗音频压缩、格式转换等处理，实现AI生成内容的永久可追溯，为平台内容治理提供技术支撑。

行业影响：推动AI音乐从实验走向规模化商用

当前，AI音乐生成工具正从实验阶段加速转向规模化商用，市场研究机构MIDiA预测，2025年AI音乐市场规模将达17亿美元。Lyria 3 Pro的推出，不仅填补了AI生成完整专业音轨的市场空白，更通过“模型+平台+服务”的生态闭环，重新定义AI音乐创作范式。

业内人士分析，Lyria 3 Pro的升级的不仅为各类创作者提供了高效、便捷的创作工具，让普通用户也能轻松产出专业级音乐内容，更将推动音乐行业向“AI协同创作”转型，为中小创作者、企业提供更多发展机遇。与此同时，其合规机制也为行业树立了标杆，助力解决AI音乐版权归属、内容识别等行业痛点。

谷歌表示，后续将持续收集用户反馈，迭代优化Lyria 3 Pro的功能体验，进一步拓展应用场景，同时深化与专业音乐人的合作，推动AI技术与音乐艺术的深度融合，助力AI音乐生态持续完善。

文章来源：AITOP100

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

Linux 音频子系统完整梳理：ALSA、ASoC、DAPM、Codec、Machine、es8389 与 rk‑multicodecs 全解析

本文深入解析了Linux音频子系统的核心架构，包括ALSA、ASoC、DAPM等关键组件。主要内容分为：整体架构：从用户空间接口ALSA到内核ASoC框架，再到DAPM电源管理，形成完整的音频处理链路。组件分工： ALSA提供用户接口（PCM播放/录音、Mixer控制） ASoC负责SoC音频系统集成（CPU DAI、Codec DAI、Machine驱动） DAPM实现动态电源管理核心实现