关键词:
扩散模型
语义分割
遥感样本生成
深度学习
摘要:
当前深度学习在遥感领域已经取得了显著的发展,而大规模,高质量标注的训练数据集对深度学习的突破起着至关重要的作用。尽管遥感训练样本量在不断增加,但多样性的遥感语义分割样本仍然缺乏。针对该问题,本文提出了RS-SegDif方法,通过生成式扩散模型生成遥感影像来有效扩充遥感语义分割样本多样性,这将改变传统的数据生成过程。本方法首先根据遥感影像的文字提示,通过扩散模型生成了满足真实世界的数据分布多样化的语义标签,然后以语义分割标签为条件,通过扩散模型生成遥感影像的方式,充分地扩充了遥感语义分割样本多样性。此外,为了大幅提升生成样本的多样性,RS-SegDif整合了两个遥感数据生成策略,即通过文本生成标签再生成影像的策略以及直接通过文本和真实标签生成影像的策略。针对下游任务,对比了多种语义分割模型,当使用合成遥感数据进行训练时,本文的合成数据的高质量在下游语义分割任务中提升了模型精度约+3.25 mIoU,有效扩充了遥感样本的多样性。