关键词:
图像处理
语义分割
注意力机制
Transformer
高分辨率遥感影像
摘要:
针对multiattention network(MANet)算法与图像语义信息关联不足、全局特征提取不充分和分割精度较低的问题,基于Transformer与注意力机制,提出一种增强浅层网络语义信息,具有融合局部和全局上下文的双分支解码器的网络结构,即Transformer multiattention network(TransMANet)。首先,引入局部注意力嵌入机制,增强上下文信息的嵌入,并将高级特征的语义信息嵌入低级特征;然后,设计基于Transformer与卷积神经网络的双分支解码器,分别提取全局上下文信息和不同尺度的细节信息,对全局与局部信息建模;最后,改进原有的损失函数,缓解遥感数据集类别不平衡的问题,提高分割准确度。实验结果表明,TransMANet在UAVid、LoveDA、Potsdam和Vaihingen数据集上均取得了较MANet及其他有竞争力的先进方法更优的交并比指标,有较好的泛化能力。