关键词:
香蕉
土壤养分
产量预测
机器学习
SHAP
摘要:
基于机器学习算法对皇帝蕉产量进行预测,明确最优预测模型及产量影响因素,为海南省澄迈县皇帝蕉的养分综合管理及产量预测等提供技术支撑。结合相关性分析和逐步回归分析法对输入变量进行筛选,然后采用随机森林(RF)、支持向量机(SVM)、K近邻(KNN)和人工神经网络(ANN)4种机器学习算法建立皇帝蕉产量预测模型,利用Shapley加法解释(SHAP)法解释模型,揭示影响皇帝蕉产量的主导因素,并量化分析其对产量的影响。结果表明:ANN模型预测性能最佳,R^(2)为0.98,RMSE和MAE分别为0.16和0.10kg·株^(-1),预测值基本无偏差。ANN模型在100样本数据量左右下误差已得到收敛,更小的成本也能获得优良预测效果。虽然SVM模型预测性能只是稍差于ANN模型,但其有欠拟合风险。KNN和RF模型预测性能欠佳,有过拟合问题,且在当前样本量下误差还没收敛。SHAP法对ANN模型预测结果解释是:速效钾、碱解氮、交换性钙、交换性镁是影响皇帝蕉产量的主导因素,当蕉园速效钾含量大于100mg·kg^(-1),碱解氮含量大于100mg·kg^(-1),交换性钙含量大于600mg·kg^(-1),交换性镁含量大于60mg·kg^(-1)时对皇帝蕉产量起促进作用。在土壤交换性钙、镁缺乏时,增加土壤有效锰、有效锌的含量可能会缓解蕉园缺素胁迫。