关键词:
深度学习
LSTM
SHAP
总磷
可解释性研究
骆马湖
摘要:
对湖泊总磷的变化预测和来源识别对水资源调度和流域生态治理有着重要的意义,然而复杂的生化反应和水动力条件导致的非平稳性给湖泊总磷浓度的准确预测带来极大的困难。为克服这一挑战,本文引入了基于加权回归的季节趋势分解(seasonal and trend decomposition using Loess,STL)技术和夏普利加法(SHapley additive exPlanations,SHAP)结合长短期记忆网络(long short-term memory neural network,LSTM)和门控循环单元(gated recurrent unit,GRU)构建了一个可解释的预测框架,以增强对湖泊总磷浓度演变的预测并提高其可解释性。研究表明:(1)在骆马湖总磷浓度的预测中,该框架拥有较好的预报精度(R^(2)=0.878),优于LSTM和卷积长短期记忆模型(convolutional neural networks and long short term memory network,CNN-LSTM)。当预测时间步长增加到8 h时,该框架有效提高了总磷浓度的预测精度,平均相对误差和均方根误差分别降低了47.1%和33.3%。从预测趋势来看,骆马湖在汛期的总磷平均浓度为0.158 mg/L,相较于非汛期的平均浓度,增加了202.1%。(2)运河来水是骆马湖总磷浓度最重要的影响因素,贡献权重为60.0%,并且不同断面(三湾、三场)的污染源受水动力、气象等因素的影响存在显著的时空差异。本文凸显了神经网络模型在预警水体污染方面的可实施性,并且为提高传统神经网络的学习能力和可解释性的开发与验证提供了重要方向。