CSLU: Voices数据集介绍,官网编号LDC2006S01
·
CSLU: Voices(LDC2006S01)是由 Alexander Kain 开发、LDC 发布的英语朗读语音数据集,核心用于高分辨率语音转换(VT)研究,含约 2 小时语音及文本、喉电图、基频标记、音素标注等配套数据。以下是详细介绍:
核心基础信息
| 项目 | 详情 |
|---|---|
| 发布机构 | 语言数据联盟(LDC),编号 LDC2006S01 |
| 开发者 | Alexander Kain,用于其博士论文中高分辨率语音转换研究 |
| 语音时长 | 约 2 小时英语朗读语音 |
| 说话人 | 共 12 位(7 男 5 女) |
| 核心内容 | 12 位说话人各朗读 50 个语音丰富的句子,含原始语音、同步喉电图信号、基频标记、音素标注及文本转录 |
| 数据格式 | 音频为 WAV 格式,标注含文本、喉电信号(LAR)、基频标记(PMV)等 |
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)