关键词:
土壤有机质
高光谱
生成式对抗网络
反向传播神经网络
摘要:
土壤有机质(soil organic matter,SOM)是评价土壤肥力高低的一项重要指标,在烟草生长过程中发挥了重要的作用。本研究在采集湖北省烟田土壤样本基础上,借助生成式对抗网络(generative adversarial networks,GAN)生成伪样本扩充建模集。使用标准正态变换(standard normal variable,SNV)、多元散射校正(multiplicative scatter correction,MSC)组合一阶微分(FD)、倒数对数(LR)以及倒数对数一阶微分(LRFD)进行预处理,结合皮尔逊相关系数(Pearson correlation coefficient,PCC)筛选敏感特征波段。使用偏最小二乘回归(partial least squares regression,PLSR)、随机森林(random forest,RF)和反向传播神经网络(back propagation neural networks,BPNN)3种机器学习方法,构建烟田SOM含量估测模型。结果表明:(1)25000次训练后的GAN模型,生成的伪样本具有与真实样本相似的特征和规律;(2)经过MSC+LRFD预处理后,全波段反射率与SOM含量的相关性得到了提高,相关系数最高可达到0.66;(3)伪样本数量占比为150%时,经过特征波段筛选后,MSC+BPNN模型验证精度最优,其决定系数(coefficient of determination,R^(2))、相对分析误差(relative percent difference,RPD)和均方根误差(root mean square error,RMSE)分别为0.80、2.22和3.18。相比较原始数据集构建的最优模型,其模型精度提升了9.59%。研究证实,将GAN模型生成的伪样本添加进建模集中,可有效提高模型的估测性能,为复杂山区烟田SOM估测提供一种新的途径。