关键词:
声纹识别
ARM
梅尔倒谱系数
线性预测系数
高斯混合模型
摘要:
随着移动互联网应用的普及,身份认证已经是信息安全性的基本要求。生物特征识别以其安全、快捷、方便的优点越来越受到重视。声纹识别是生物特征识别的一种,以其安全性、方便性和高效性的优点,广泛应用于移动金融、公安司法以及智能安防等领域。随着物联网的发展,嵌入式电子产品因其便携性和经济性的特点广泛应用于各种场合,成为人们生活中的重要组成部分,因此在嵌入式平台上实现声纹识别具有一定的现实意义。本文主要对基于高斯混合模型(Gaussian Mixture Model,GMM)的声纹识别算法进行改进与优化,提升算法的性能,并在ARM嵌入式平台上进行算法实现。主要的创新在于,通过深入研究GMM算法,针对传统GMM初始化时局部收敛问题,提出了基于距离概率的GMM初始化方法的改进方案,并在ARM嵌入式平台上进行算法实现。主要工作包括:研究了声纹识别涉及的相关算法;在特征提取方面,详细分析了梅尔倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)以及线性预测系数(Linear Prediction Coefficients,LPC),并将两种参数进行融合,形成新的融合特征参数MFCC-LPC,提高了声纹识别的准确率;在识别算法方面,针对传统GMM初始化时局部收敛问题,提出了基于距离概率的GMM初始化方法,运用距离尺度和概率思想进行初始点的选取,提高声纹识别的准确率,减少模型训练时间;将改进的声纹识别算法在ARM嵌入式平台上进行实现,并设计声纹识别的人机交互界面。通过搭建实验平台进行实验验证,结果表明,改进的声纹识别算法识别准确率提升了0.4%、训练时间缩短了10%;对于25秒的训练语音及5秒的测试语音,识别准确率为97.67%以上,识别时间为287毫秒,训练时间为14.4秒,满足了本文的设计指标。本文设计的基于ARM的声纹识别模块具有实时性、准确性、便携性及良好的用户界面等优点,为以后声纹识别的工作打下了一定的基础。