2006 NIST Speaker Recognition Evaluation Test Set Part 1数据集介绍,官网编号LDC2011S10
LDC2011S10是 NIST 2006 年说话人识别评测(SRE 2006)的核心官方测试集(Part 1),由 LDC 于 2011 年发布,是 GMM-UBM 与 i-vector 早期声纹识别技术的关键基准测试数据。
一、核心基本信息
项目 详情
官方编号 LDC2011S10
发布机构 Linguistic Data Consortium (LDC)
发布时间 2011 年 7 月
核心用途 SRE 2006 说话人检测(Speaker Detection)任务的标准测试集
数据来源 Mixer 项目(Mixer 2/3),LDC Fishboard 平台采集,含 2005 年复用与 2006 年新增数据
语言 英语为主,含西班牙语、普通话、粤语、阿拉伯语等多语言片段
音频格式 SPHERE,8-bit μ-law,16 kHz 采样率
信道类型 电话信道(2 线 / 4 线)+ 麦克风跨信道(Cross-channel)
