关键词:
智能交通
稀疏数据修复
改进遗传算法
XGBoost
SHAP算法
摘要:
为研究拓扑路网中稀疏数据路段行程速度与其空间关联道路间的耦合影响,以路网中空间距离分布为基础,明确了道路空间关联指数(road spatial correlation index,RSCI)定义和计算方法,构建了一种面向道路行程速度稀疏数据修复和可解释性模型。首先,在传统轮盘算法基础上提出了针对选择操作和算子的改进遗传算法(improved genetic algorithm,IGA),利用自适应机制优化个体选择概率,通过设置常数λ解决后续优秀个体选择概率偏低缺陷,提高模型收敛性能。其次,利用IGA和K折交叉验证(K-fold cross validation,K-Fold CV)实现极限梯度提升算法(extreme gradient boosting,XGBoost)中n_estimators、Learning_rate、Min_child_weight、Max_depth超参数寻优。然后,利用SHAP(shapey additive explanation,SHAP)方法对XGBoost模型各特征重要性开展全局解释和个体样本溯源分析。最后,以目标道路行程速度为输出、连接道路行程速度为特征输入进行实例验证。研究结果表明:IGA-XGBoost组合算法f_(MAE)、f_(RMSE)分别为1.95、2.66,R^(2)为0.941,较GA-XGBoost提高0.4%,模型运行时间为1.532 s,较GA-XGBoost运行时间减少7.6%,组合算法预测精度更高,迭代效率有明显提升;以SHAP值标定特征重要性下,连接道路特征重要性与其RSCI呈正相关,RSCI数值越大,连接道路对预测结果贡献越高;在连接道路数量不足时,以SHAP值排名前3的连接道路对目标道路数据填补时,模型f_(MAE)、f_(RMSE)、R^(2)分别为2.53、3.30、0.905,仍能取得较好的数据修复精度,证明了方法的适用性。研究结果可为城市道路行程车速数据修复填补提供新思路。