关键词:
农业用水量
机器学习
用水量预测
SHAP
河套灌区
摘要:
农业用水预测是区域水资源规划中的关键环节,对于实现水资源合理开发,保障粮食安全具有重要的指导意义。然而,现有农业用水预测模型普遍存在输入参数冗余、模型精度不够等问题,不利于有效地进行水资源管理和优化决策。因此,选择内蒙河套灌区作为研究对象,首先对灌区农业用水量相关驱动因子进行主成分分析(Principal Components Analysis,简称PCA),筛选出影响灌区农业用水量的关键因子;其次构建多种基于机器学习的农业用水预测模型;最后,利用Shapley加法解释方法(SHapley Additive exPlanations,SHAP)验证最优模型应用的合理性,并深入挖掘各特征值对农业用水量的贡献影响。结果表明:多层感知器神经网络(MLP)机器学习模型可以有效的预测农业用水量,其R2评价指标为0.84,相较于其他五种不同机器学习模型(最小绝对收缩和选择算子回归Lasso、岭回归Ridge、决策树DT、随机森林RF、极限梯度提升XGboost),该模型预测结果较好。采用SHAP值法对MLP机器学习模型中的输入参数进行量化分析,发现第一产业总产值与粮食产量有较高的绝对平均SHAP值,而在不同灌域中SHAP值贡献大小略有差异。构建农业用水量预测筛选模型可以准确预测农业用水量,从而实现灌区农业精准灌溉并提高水资源利用效率,对于缓解未来河套灌区水资源供需矛盾具有重要的实际意义。