CSLU: Voices(LDC2006S01)是由 Alexander Kain 开发、LDC 发布的英语朗读语音数据集,核心用于高分辨率语音转换(VT)研究,含约 2 小时语音及文本、喉电图、基频标记、音素标注等配套数据。以下是详细介绍:

核心基础信息

项目 详情
发布机构 语言数据联盟(LDC),编号 LDC2006S01
开发者 Alexander Kain,用于其博士论文中高分辨率语音转换研究
语音时长 约 2 小时英语朗读语音
说话人 共 12 位(7 男 5 女)
核心内容 12 位说话人各朗读 50 个语音丰富的句子,含原始语音、同步喉电图信号、基频标记、音素标注及文本转录
数据格式 音频为 WAV 格式,标注含文本、喉电信号(LAR)、基频标记(PMV)等
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐