关键词:
字符检测
多头自注意力机制
位置编码
字符识别
喷码字符
摘要:
针对漏喷,喷墨不均和字符磨损导致的喷码字符模糊和部分缺失问题,提出了一种基于多粒度注意力改进的喷码字符识别算法。首先,引入多头自注意机制改进了字符检测网络DBNet,通过建模局部特征间的空间相关性,增强了对稀疏的喷码字符特征的表达,提高了检测模型的喷码字符检测率。然后,设计了位置编码注意力机制对字符识别网络DANet进行改进,通过建模字符位置编码与全局特征的相关性,通过位置编码注意力将视觉特征与字符进行对齐,从而提高了识别模型的喷码字符识别率。实验结果表明,在喷码字符数据集RAICD上,改进的DBNet实现的喷码字符检测率F1为90.92%,相比改进前提升了5.31%,改进的DANet实现的喷码字符识别率为93.72%,相比改进前提升了3.03%;在通用字符数据集ICDAR2015上,改进的DBNet实现的字符检测率F1为86.19%,相比改进前提升了1.58%,改进的DANet实现的字符识别率为75.19%,相比改进前提升了1.0%;在喷码字符的端到端识别中,改进DBNet+改进DANet的字符检测与识别模型实现了85.19%的识别率,相比DBNet+DANet的模型提升了4.0%。实验结果表明了所提算法的有效性。