关键词:
晶圆图
缺陷模式识别
ResNeSt50
注意力机制
决策融合
摘要:
晶圆制造是半导体行业的关键环节,晶圆生产精度要求高、工序繁琐复杂,制造中产生缺陷不可避免。晶圆缺陷因其成因而呈现不同的图像特征,且图像特征抽象多变,传统的机器学习检测效果受限。为提高晶圆图缺陷模式识别准确率,更好地识别晶圆缺陷,本文基于多注意力机制的ResNeSt方法对晶圆图缺陷模式识别进行研究。主要研究内容如下:
(1)针对晶圆缺陷图特征抽象且多变的问题,提出了一种基于改进ResNeSt50的晶圆图缺陷模式识别方法。该方法在深度残差网络Res Net50网络中引入分散注意力机制,并在分散注意力机制中改进了激活函数,设计了Hswish-ResNeSt50网络模型。该模型利用分散注意力机制强大的通道间信息交互能力,充分学习晶圆缺陷图特征,并利用H-swish激活函数,避免模型训练时产生的梯度爆炸、梯度消失等问题,提高了晶圆图缺陷模式识别准确率。为进一步提高网络对晶圆缺陷图重要信息的学习能力,在ResNeSt50网络模型残差块内嵌入注意力机制方法。该方法通过在HswishResNeSt50网络不同卷积层的残差块中添加通道注意力机制SENet、卷积注意力机制CBAM,设计了Hswish-ResNeSt50-BSE、Hswish-ResNeSt50-BC两种网络模型,以研究添加注意力机制的网络对晶圆缺陷图特征识别能力的影响。
在WM-811K晶圆图数据集上的实验结果表明,Hswish-ResNeSt50网络模型可以更好地学习晶圆缺陷特征,有更强的特征学习能力,提高了晶圆缺陷模式识别分类能力,在准确率上达到了98.09%,相比Res Ne Xt50网络模型,提高了2.81%。同时,将CBAM添加在Hswish-Res Ne Xt50网络第4卷积层内残差块的Hswish-ResNeSt50-BC4的实验效果最好,准确率有了进一步提高,达到了98.13%。
(2)针对网络无法关注晶圆图中有效信息的问题,提出了一种基于多注意力机制及决策融合的ResNeSt50晶圆图缺陷模式识别方法。该方法通过在HswishResNeSt50网络卷积层之间引入CBAM和自注意力机制,设计了Hswish-ResNeSt50-LC、Hswish-ResNeSt50-LS和Hswish-ResNeSt50-LCS三种网络模型,进一步增强网络模型对空间、通道和长距离关系的学习能力。为进一步提高网络对晶圆缺陷的识别能力,提出了基于多注意力机制决策融合的网络模型识别分类方法。该方法融合晶圆图缺陷识别效果相对较好的Hswish-ResNeSt50-LC3网络模型、Hswish-ResNeSt50-LCS3网络模型和Hswish-ResNeSt50-LCS4网络模型,充分利用各个网络模型在识别不同的晶圆缺陷类型上优势,提高对不同晶圆缺陷的特征学习能力,进一步提高网络对不同晶圆图缺陷的识别准确率。
在WM-811K晶圆图数据集上的实验结果表明,Hswish-ResNeSt50-LC、HswishResNeSt50-LS和Hswish-ResNeSt50-LCS三种网络模型能够关注晶圆图重要特征并抑制噪声特征,提高晶圆图缺陷模式识别准确率。同时得到在Hswish-ResNeSt50网络模型不同卷积层引入注意力机制后效果最佳的三种网络模型:Hswish-ResNeSt50-LC3、Hswish-ResNeSt50-LCS3和Hswish-ResNeSt50-LCS4,这三种网络模型的准确率分别达到了98.21%、98.18%、98.21%。为进一步提升网络模型缺陷识别能力,利用决策融合策略,将表现最佳的三种模型进行融合,准确率最高达到98.86%,与融合前最好的网络模型相比,提高了0.65%。