关键词:
胸部X射线检查
特征交互模块
多分支分类网络
残差神经网络
Transformer
摘要:
COVID-19是由新型冠状病毒引起的一种传染性疾病,给全球公共卫生带来了巨大的挑战。在临床实践中,胸部X射线(Chest X-ray,CXR)检查是识别COVID-19感染和其他常见肺部疾病的重要手段,然而放射科医生对COVID-19患者进行检查需要耗费大量时间和精力,而且增加医生感染的风险。因此,能够从胸部X射线的图像中,自动识别COVID-19的算法显得尤为重要。本文提出了一种基于深度学习的CXR图像分类框架,该框架能够在有限的训练数据下生成更具判别力的特征。具体而言,首先通过残差神经网络(ResNet34和ResNet50)和Transformer组成多分支分类网络,其中ResNet分支通过深度残差结构,有效地提取丰富的语义信息和细腻的纹理信息;而Transformer分支则通过自注意力机制,捕捉图像的全局语义特征。随后,利用特征交互模块将ResNet分支提取丰富的语义信息和纹理信息,与Transformer提取的全局语义特征进行特征交互。最后,再通过特征融合模块来提取图像的多尺度语义特征。该方法能够在有限训练数据的条件下提取多尺度特征表示,以对COVID-19感染区域进行特征提取和定位。实验在公开DLAI3和COVIDx数据集上与15种方法进行了比较,相比于ResNet50的模型,准确率分别提高了1.37%和0.76%。本文提出的分类方法,结合ResNet和Transformer网络在特征提取上的优点,使得网络对CXR图像的识别结果更加准确。