West Point Company G3 American English Speech(LDC96S36)是美国西点军校 G3 连队构建、LDC 于 1996 年发布的美式英语朗读语音数据集,核心为 24 名美国英语母语者(G3 连队学员)录制的约 10.5 小时高保真语音,含 6000 + 句孤立词 / 短语 / 连续句,标注含正字法转录与发音词典,适配声学模型训练、说话人识别、军事语音技术研发等场景,数据经军方场景验证,一致性与完整性高。以下从核心信息、数据构成、标注特性、应用与获取等方面展开介绍:


一、核心基础信息

属性 详情
数据集名称 West Point Company G3 American English Speech
LDC 编号 LDC96S36
开发 / 分发机构 United States Military Academy (West Point)/LDC
发布时间 1996 年
语言 美式英语(General American)
数据规模 24 名说话人(男女均衡),约 10.5 小时语音,6000+ utterance
数据类型 高保真朗读语音,含孤立词、短语、连续句子
核心用途 声学模型训练、说话人识别、军事语音技术研发、语音合成、语言教学
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐