关键词:
深度学习
矿物识别
图像分类
多尺度特征
通道注意力
自注意力
摘要:
黏土矿物是广泛存在于沉积盆地中的含水铝硅酸盐矿物,通过扫描电子显微镜(scanning electron microscopy,SEM)获取黏土矿物在此基础上进行识别,需要获取黏土矿物的多样性和易于分辨的特征信息,然而卷积神经网络其特征提取能力仍存在不足,特征表达能力亟须增强。底层特征通常包含了图像的基本信息和细节,高层次的特征图抽象程度较高,包含了更为抽象化的信息。因此提出了一种以Res2Net50为主干网络,引入高效通道注意力(efficient channel attention,ECA)模块使模型更关注底层特征,从而提升模型性能,最后一层采用多头注意力(multi-head self-attention,MHSA)模块学习到不同层次的特征表示。采用混合方式同时利用了CNN的特征提取能力、Transformer的内容自注意力机制提升模型的特征表达能力,取得了优于Res2Net50的性能。结果表明:提出的EM-Res2Net(ECA-MHSA-Res2Net50)对128×128像素输入的矿物识别效果更为理想,经测试识别准确率为92.85%,通过与其他模型对比分析,该研究结果证明引入ECA模块和MHSA模块后的模型能够充分提取图像的特征,具有更高的准确率和时效性。