关键词:
噪声环境
语种识别
时域伽马通滤波器
Fisher比
摘要:
不同的噪声在频谱上有不同的特点,使得自动语种识别的性能在噪声环境下显著下降.针对该问题,提出一种基于改进时域伽马通滤波器倒谱系数(gammatone filter cepstral coefficient,GFCC)特征的语种识别方法.首先,提取不同噪声背景下的训练集的时域GFCC特征;然后,利用Fisher比计算特征各维对区分语种的相对贡献度大小,分析不同噪声对时域GFCC特征各维的影响,并根据分析来设计合适的权值对特征各维加权,得到语种区分性更强的特征集;最后,利用高斯混合-通用背景模型作为基线系统进行语种识别,以测试所提方法性能.实验结果表明,在单一噪声背景,信噪比为-5 dB,噪声源分别为粉红噪声、餐厅噪声的条件下,所提方法相比于传统时域GFCC特征方法的识别率分别提升了40.1、20.6个百分点,在其他噪声背景、信噪比下的识别率也有一定程度的提升.