关键词:
中医舌色分类
噪声样本
样本注意力机制
重新标注机制
Boostrapping损失
摘要:
基于深度学习的中医舌色分类模型具备良好的性能,但是依赖大量正确标注的样本.由于人工标注样本费时费力,不可避免地存在错误标注,导致模型在训练过程中对噪声样本过拟合,使其泛化能力变差.为此,本文提出了一种基于噪声样本渐近修正的中医舌色分类方法.首先,根据舌色分类的特点,提出了一种全局-局部特征融合方法,将其嵌入到ResNet18骨干网络中,构建了舌色分类网络,并采用集成学习范式,提高分类模型的可靠性和稳定性;其次,针对噪声样本下的舌色分类网络训练问题,提出了样本注意力机制和噪声样本标签重新标注机制,在训练过程中对干净样本和噪声样本加以区分,赋予不同的权重,并逐步对噪声样本标签进行修正;最后,采用Boostrapping损失函数降低模型对噪声样本的关注度,抑制噪声样本对分类性能的影响.将提出的方法在两个自建的舌色分类数据集上进行了实验验证,结果表明,该方法通过渐进地对噪声标签进行校正,可以获得比现有的有噪样本下图像分类方法更高的分类精度,Acc指标分别达到了94.6%和93.65%.