香港中文大学(深圳)数据科学学院武执政副教授团队联合上海人工智能实验室 OpenMMLab 团队开源了综合音频生成项目 Amphion(安菲翁)。该系统旨在打造一个集语音合成转换、歌声合成转换、音效音乐生成等多功能为一体的开源平台。截至目前,Amphion 已经多次进入 GitHub Trending Repositories 榜单。

OpenMMLab 在 AI 领域无人不知,是目前最具国际影响力的计算机视觉开源算法体系,在 GitHub 上获得超过 9 万星标,用户遍及全球 140 个国家和地区。联合实验室兄弟团队推出了性能领先的千亿级参数大语言模型 “书生・浦语”(InternLM),并建设了首个面向大模型研发与应用的全链条开源体系。该团队的研究成果还包括社区内规模最大、覆盖领域最完整的大模型评测平台 OpenCompass,推理性能领先的大模型推理框架 LMDeploy 等。

这是 OpenMMLab 第一次涉足音频与语音领域,相信这次开源会给多模态生成带来了更多的想象空间。在没有公开宣传之前,Amphion 已经数次进入 GitHub Trending Repositories 榜单。可以说,Amphion 一出生就自带光环。

项目地址: https://github.com/open-mmlab/Amphion

论文地址:https://arxiv.org/abs/2312.09911

Amphion 在线 Demo 体验链接:

Text to Speech

HuggingFace Demo: https://huggingface.co/spaces/amphion/Text-to-Speech

OpenXLab应用: https://openxlab.org.cn/apps/detail/Amphion/Text-to-Speech

Singing Voice Conversion

HuggingFace Space: https://huggingface.co/spaces/amphion/singing_voice_conversion

OpenXLab应用: https://openxlab.org.cn/apps/detail/Amphion/singing_voice_conversion

Text to Audio

HuggingFace Demo: https://huggingface.co/spaces/amphion/Text-to-Audio

OpenXLab应用: https://openxlab.org.cn/apps/detail/Amphion/Text-to-Audio© THE END

霉霉演唱《稻香》,国内团队的Amphion音频生成火了_澎湃号·湃客_澎湃新闻-The Paper

Github 2023-12-20 开源项目日报 Top10-CSDN博客

Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐