2008 NIST Speaker Recognition Evaluation Training Set Part 2(LDC2011S07) 是 NIST SRE 2008 说话人识别评测的补充训练集第二部分,与 Part 1(LDC2011S05)共同构成完整训练语料,聚焦文本无关说话人确认 / 检测,用于模型增强、大模型训练与跨信道泛化验证。

一、核心基本信息

项目    详情
官方全称    2008 NIST Speaker Recognition Evaluation Training Set Part 2
LDC 编号    LDC2011S07
发布机构    NIST(评测)、LDC(分发)
发布时间    2011 年
配套数据    训练集 Part 1(LDC2011S05)、测试集(LDC2011S08)、SRE 2008 评测方案
核心任务    文本无关说话人确认(Verification)、说话人检测(Detection)
数据来源    LDC Mixer 3、Mixer 4、Mixer 5 扩展对话 / 访谈
总时长    约 800 小时
语言    美式英语(唯一语言)
说话人规模    约 1,800+ 新增说话人(与 Part 1 无重叠)
性别分布    男女均

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐