Amphion 集语音合成转换、歌声合成转换、音效音乐生成等多功能为一体的开源平台
香港中文大学(深圳)数据科学学院武执政副教授团队联合上海人工智能实验室 OpenMMLab 团队开源了综合音频生成项目 Amphion(安菲翁)。该系统旨在打造一个集语音合成转换、歌声合成转换、音效音乐生成等多功能为一体的开源平台。截至目前,Amphion 已经多次进入 GitHub Trending Repositories 榜单。
OpenMMLab 在 AI 领域无人不知,是目前最具国际影响力的计算机视觉开源算法体系,在 GitHub 上获得超过 9 万星标,用户遍及全球 140 个国家和地区。联合实验室兄弟团队推出了性能领先的千亿级参数大语言模型 “书生・浦语”(InternLM),并建设了首个面向大模型研发与应用的全链条开源体系。该团队的研究成果还包括社区内规模最大、覆盖领域最完整的大模型评测平台 OpenCompass,推理性能领先的大模型推理框架 LMDeploy 等。
这是 OpenMMLab 第一次涉足音频与语音领域,相信这次开源会给多模态生成带来了更多的想象空间。在没有公开宣传之前,Amphion 已经数次进入 GitHub Trending Repositories 榜单。可以说,Amphion 一出生就自带光环。
项目地址: https://github.com/open-mmlab/Amphion
论文地址:https://arxiv.org/abs/2312.09911
Amphion 在线 Demo 体验链接:
Text to Speech
HuggingFace Demo: https://huggingface.co/spaces/amphion/Text-to-Speech
OpenXLab应用: https://openxlab.org.cn/apps/detail/Amphion/Text-to-Speech
Singing Voice Conversion
HuggingFace Space: https://huggingface.co/spaces/amphion/singing_voice_conversion
OpenXLab应用: https://openxlab.org.cn/apps/detail/Amphion/singing_voice_conversion
Text to Audio
HuggingFace Demo: https://huggingface.co/spaces/amphion/Text-to-Audio
OpenXLab应用: https://openxlab.org.cn/apps/detail/Amphion/Text-to-Audio© THE END
更多推荐
所有评论(0)