关键词:
滑坡
易发性建模
LR
SVM
编码器
摘要:
目的为了在有限样本下提升机器学习模型挖掘数据特征的能力,提高模型预测精度,方法选取四川省雅砻江和大渡河中下游省级水土流失重点预防区九龙县、康定市、泸定县和木里县为研究区,选择12个影响因子构建滑坡易发性评价指标体系,使用确定性系数(certainty factor,CF)量化评价指标,对比逻辑回归(logistic regression,LR)和支持向量机(support vector machine,SVM)模型,在表现最优的模型上添加降噪自编码器(denoising autoencoder,DAE)和卷积自编码器(convolutional auto-encoders,CAE),并对比各模型所提取数据的特征。结果结果表明:CF-SVM模型的精确率(P),F-measure、Kappa系数,总准确度(overall accuracy,OA)和ROC曲线下与坐标轴围成的面积(area under curve,AUC)相较于CF-LR模型的分别提高了31.9%,1.1%,17.1%,8.5%,8.6%;添加DAE编码器后,CF-SVM-DAE模型的召回率(R),Fmeasure,Kappa系数和总准确度(OA)相比于CF-SVM模型的分别提高了8.1%,5.8%,8.1%,4%;添加CAE编码器后,CF-SVM-CAE模型的召回率(R),F-measure,Kappa系数和总准确度(OA)相比于CF-SVM模型的分别提高了0.4%,0.2%,0.2%,0.1%。结论选用的机器学习方法中,CF-SVM模型预测精度更高。在CF-SVM模型基础上添加DAE编码器比添加CAE编码器鲁棒性更好,因此,CF-SVM-DAE模型在所有模型中表现最好,更适合滑坡易发性评价。