关键词:
声学计量
图像识别
声级计
DBNet
CRNN
注意力模块
摘要:
为提高声级计校准工作效率,提出了一种基于深度学习神经网络的声级计图像读数检测与识别方法。读数检测模型以DBNet为基础模型,将ShuffleNetV2作为主干网络,显著降低模型参数量;为提高读数区域检测精度,引入高效通道注意力ECA模块,提高网络对于通道特征的提取能力,优化后的模型在保持精度的同时参数量缩减为原来的15.4%,计算量缩减为原来的67.4%。读数识别模型以CRNN为基础模型,先加入批量规范化层,提高网络训练时的稳定性;然后,引入残差块替换原有的卷积块,提高了网络对于复杂特征的提取能力;将Dropout应用于网络中,提高网络的泛化能力;此外,在合成读数数据集上对读数识别模型进行预训练,有效增加了模型准确率。改进后的方法准确率达到了99.7%,相较原方法提高了2.4%。实验结果表明,该方法对声级计图像中存在的字体多样、光照不均、模糊等影响因素具有较强的鲁棒能力,对声级计图像中的读数具有较高的识别精度。