关键词:
响度补偿
助听器验配
低功耗
耳蜗听损
深度学习
摘要:
响度补偿是助听器的核心功能,如何通过响度补偿来帮助用户更好地听见并理解声音一直是助听器领域的研究重点。近几十年来,学者们关于人类听觉系统的原理和特点,听力损失的生理学机制等方面展开了持续深入的研究,并提出了各种研究成果,包括各种听力学模型,响度和语音可懂度测量方法。这些研究成果中,有一部分已经被应用于助听器验配及响度补偿之中,取得了较好的效果,但是还有很多较新的成果还没有得到应用和推广。此外,现行的助听器验配流程还存在诸多不足。例如,目前的助听器验配工作普遍根据NAL-NL1/2等通用的助听器验配处方公式给出的处方进行,而这些处方公式只能得到长时语音平均频谱(long-term average speech spectrum,LTASS)下的处方增益,而不能给出各种频谱下的目标增益。此外,由于输出声压级越高意味着功耗越高,如果能够在不降低语音可懂度的前提下降低助听器输出声压级,将具有重要意义,然而现行的验配处方公式在设计时都没有将尽可能降低输出声压级作为目标。另一方面,近年来深度学习技术在很多领域取得了成功,然而由于缺少数据等原因,尚未有将深度学习应用于助听器验配领域的有关研究。将深度学习技术应用于助听器验配是否可行,如何利用深度学习进行助听器验配,都有待于研究。针对上述情况,本文开展了一些研究。本文的主要工作如下:(1)提出了一个非线性、多通道的响度补偿模型。该模型以一个近年提出的关于耳蜗听损的听觉模型,其对耳蜗内毛细胞和外毛细胞的功能进行了科学准确的模拟,因此基于该模型进行响度补偿能够更好地适应人类的听觉特性。本文提出的响度补偿模型建立了输入信号实时频谱,患者听力图和各通道目标增益三者之间的关系,利用该模型,能够根据患者听力图和输入信号的实时频谱确定当前的目标增益,相比于传统方法,基于该模型的响度补偿能够更好地适应各种频谱,为各种频谱特点的声音信号提供更好的响度补偿。(2)提出了一个用于评估助听器响度补偿效果的指标和具体实施方法。该指标综合考虑了响度补偿后音频信号的可懂度和声压级,与输出声压级呈负相关关系,与输出信号可懂度呈正相关关系。其中,语音可懂度的度量采用助听器语音可懂度指数(HearingAid Speech Perception Index,HASPI),该指数是近年来提出的一种针对助听器响度补偿结果语音可懂度的评价指标。为了能够反应响度补偿方法对不同听损类型和不同类型声音信号的效果,本文使用聚类方法从真实的听力图数据集生成了几个在统计学上具有代表意义的典型听力图,并以一定的年龄和性别比例从公开语料库中选择了足够数量的样本用于评估该指标。(3)设计了一个优化方法,对上述响度补偿模型进行了优化,并验证了优化效果。其中,优化过程基于遗传算法,优化的对象包括模型的滤波器组频响曲线和外毛细胞模块中输入声压级与输出声压级的关系曲线(I/O曲线)表达式中的几个关键因子。为了能够使助听器能够在尽可能低的输出声压级下提供足够的语音可懂度改善,本文以第(2)条所述的评价指标作为模型的优化目标。优化之后,本文构建了一个测试数据集,用于比较其与CHENFIT-AMP方法的性能,结果表明,本文的方法整体上能够在更低声压级条件下提供更高的语音可懂度,优化过程有效。(4)提出了一个基于深度神经网络的目标增益预测模型,使用目前最为通行的验配处方程序NAL-NL2的处方结果作为该模型的训练和测试数据。经过训练,该模型的预测误差最终收敛到可接受的范围内,说明该模型结构对于预测处方增益是有效的。同时,为了研究患者身份信息(如性别和年龄)与其听力图之间潜在的相关性是否有助于改善目标增益的预测效果,本文将性别和年龄信息加入了模型的输入,比较了加入前后模型性能的变化,结果表明年龄信息的确有助于目标增益的预测。