关键词:
最小值跟踪
噪声估计
神经网络
语音增强
电路设计
摘要:
语音作为信息交互的媒介,相较于其它的交互方式,其表达更直观简洁。通过语音交互传递信息更加自然、灵活且传递效率更高。在现实生活中,语音的采集和识别系统的性能与接收到的目标音频的质量有关,然而语音信号在编码、传输过程中无法避免与噪声产生混杂,导致语音采集和识别的结果较差。通常使用语音增强技术来处理带噪语音信号是为了抑制噪声对语音产生的影响。大多数语音增强算法为了降低算法的复杂度,对不同类型的噪声采取相同的处理方式。现实生活中不同场景中的噪声特性复杂多变,难以通过一种方式对所有的噪声产生相当的抑制效果。针对上述问题,本文深入研究了语音增强过程中的噪声估计、噪声分类和单芯片音频处理硬件实现等问题,主要工作如下:1)针对语音增强过程中噪声估计的时延问题,本文提出了一种基于指数加权移动平均的最小值跟踪算法,该算法对语音连续帧的噪声功率谱进行指数加权平均,对下一帧的噪声功率谱值进行预测,完成噪声估计的更新。实验结果表明,该算法有效降低了噪声估计的时延,提升了噪声估计的准确性。2)为了提高语音增强算法的自适应性,本文提出一种基于神经网络噪声分类的语音增强算法,旨在解决语音增强算法的普适性问题。该算法采用神经网络与传统的语音增强算法相结合的方式,首先采用神经网络对含噪语音中的背景噪声进行精确分类,根据分类结果采取不同的参数进行语音增强处理。实验结果表明,该算法在更多的保留了语音信号的特征的同时,对噪声的抑制效果更加明显。3)基于ATS2829芯片设计了音频录取模块,该模块充分利用主控芯片丰富的内部资源,在尽可能减少外围电路的基础上,实现了音频录取及存储功能。相较于传统的嵌入式音频模块,该模块体积小,成本低,同时使用音频编解码技术最大限度地还原了原始音频信号,并将音频数据保存在SD卡中,存储管理更加方便。