关键词:
产量分离
时间序列
机器学习
旱地
春小麦
产量预测
摘要:
为探究机器学习算法与时间序列结合预测春小麦产量的可行性,使用HP滤波算法,将1971-2021年甘肃省定西市安定区和2014-2021年定西市渭源县的产量数据分离为气象产量和趋势产量,利用研究区的气象数据,分别基于随机森林(random forest,RF)、循环神经网络(recurrent neural network,RNN)、支持向量机(support vector machine,SVM)、反向传播神经网络(back propagation neural network,BPNN)和长短期记忆网络(long short-term memory,LSTM)5种机器学习算法实现春小麦气象产量的预测对比;构建了ARIMA时间序列模型,探究旱地春小麦趋势产量的最佳预测模型。结果表明,旱地春小麦产量中气象产量占比大,趋势产量占比小,且气象产量的变化趋势基本与总产量一致。LSTM模型对研究区内气象产量的模拟效果最佳。通过参数率定,获得最优的趋势产量预测模型为ARIMA(4,1,2)模型,其残差基本为白噪声,符合正态分布。利用LSTM和ARIMA(4,1,2)模型组合,对2014-2021年渭源县的春小麦产量进行预测,并与研究区的实际产量数据比较,预测结果与实际值接近,模型精度较高,其R^(2)为0.96,MAPE为1.22%,MAE为32.12 kg·hm^(-2),RMSE为35.32 kg·hm^(-2)。在本研究条件下,LSTM和ARIMA(4,1,2)组合模型具有良好的预测精度,可实现旱地春小麦产量的预测。