2003 NIST Language Recognition Evaluation(LRE)数据集是美国国家标准与技术研究院(NIST)用于语种识别评估的数据集。
该数据集在语种识别研究领域具有重要地位,许多相关的研究和实验都基于此数据集进行。例如,有研究采用层次化支持向量机方法在该数据集上进行实验,结果表明其等错误率(EER)从 6.3% 降低到了 4.5%。还有研究针对英语、日语、汉语 3 个语种在该数据集上进行实验,在语音时长分别为 3s、10s、30s 时的等错误率分别可达到 0.14%、0.14%、0.49%