关键词:
语义分割
DeeplabV3+模型
EfficientNet模型
移动计算
深度学习
摘要:
语义分割是图像和视频处理领域的重要研究内容之一。随着深度学习在图像与视频处理领域的广泛应用,研究基于深度学习的语义分割方法具有现实意义。本文探讨基于DeeplabV3+的语义分割方法及其应用,并尝试搭建一个改进的语义分割模型用于移动计算等实时场景。(1)通过变换主干特征提取网络来减小语义分割模型的计算量,并扩展其应用范围。针对语义分割模型DeeplabV3+的主干特征提取网络参数量大、对硬件要求高、不适合移动场景等特点,使用参数量较少且性能较优的EfficientNet-B0网络对DeeplabV3+的主干特征提取网络进行替换。本文测试了直接替换、减少下采样次数、添加空洞卷积等多种替换方式。由于EfficientNet-B0的参数量小于DeeplabV3+的主干特征提取网络的参数量,因而所得语义分割模型的计算量减小了,从而减少了对硬件设备的性能要求,更适合于手机、树莓派等移动设备。这有助于扩展语义分割模型的应用范围。(2)通过解耦和特征融合等措施对解码网络进行改进以提高特征利用率、改进语义分割的性能。首先对DeeplabV3+模型中的输出分割图像部分进行改进,参考EfficientDet和YoloX模型中把识别物体种类和位置的网络转换为多个网络分支的思想,将DeeplabV3+模型中的浅层语义信息和深层语义信息使用不同的卷积进行处理以达到解耦的目的;然后借鉴FCN、U-Net网络的特征融合思想,在语义分割模型中加入中维度语义特征层,进一步有效利用主干特征提取网络所提取的特征以提高语义分割模型的性能。将所改进的模型在VOC2008数据集上与已有模型进行比较,实验结果表明所做工作在一定程度上提升了性能。(3)通过设计Android程序和Python程序将所搭建的网络与DeeplabV3+、PSPNet、U-Net等网络进行性能比较,验证其能否在移动设备上高效地运行。实验结果表明,所改进的语义分割模型在Android程序上的运算速度领先于DeeplabV3+、PSPNet、U-Net等,在Python程序上也有较好的性能。所做工作提升了语义分割在移动计算领域的计算性能。本文探讨了语义分割模型的改进及其在移动计算领域的应用,所做工作对于在便携式设备上添加语义分割计算模型具有一定的理论和实践意义。这对于在智能相机、智能雷达、自动驾驶等应用领域扩展语义分割模型的实际应用具有一定的促进作用。