West Point Company G3 American English Speech数据集介绍,官网编号LDC2005S30
·
West Point Company G3 American English Speech(LDC96S36)是美国西点军校 G3 连队构建、LDC 于 1996 年发布的美式英语朗读语音数据集,核心为 24 名美国英语母语者(G3 连队学员)录制的约 10.5 小时高保真语音,含 6000 + 句孤立词 / 短语 / 连续句,标注含正字法转录与发音词典,适配声学模型训练、说话人识别、军事语音技术研发等场景,数据经军方场景验证,一致性与完整性高。以下从核心信息、数据构成、标注特性、应用与获取等方面展开介绍:
一、核心基础信息
| 属性 | 详情 |
|---|---|
| 数据集名称 | West Point Company G3 American English Speech |
| LDC 编号 | LDC96S36 |
| 开发 / 分发机构 | United States Military Academy (West Point)/LDC |
| 发布时间 | 1996 年 |
| 语言 | 美式英语(General American) |
| 数据规模 | 24 名说话人(男女均衡),约 10.5 小时语音,6000+ utterance |
| 数据类型 | 高保真朗读语音,含孤立词、短语、连续句子 |
| 核心用途 | 声学模型训练、说话人识别、军事语音技术研发、语音合成、语言教学 |
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)