关键词:
经验行程时间
可靠性预测
拥堵演化
无监督聚类
FGARCH
摘要:
精准可靠的行程时间预测为道路交通管控和出行服务提供了关键数据支撑。既有研究主要基于两类思路实现行程时间预测,其一为瞬时行程时间预测,其二为经验行程时间预测。相较而言,后者在建模过程中考虑了道路交通状态演化动态,通常可以获得更为精准和可靠的预测结果。现有高速公路经验行程时间预测方法主要存在两方面不足,致使其在交通管控和出行服务决策中的关键支撑作用受到局限。一方面,当前研究大多基于集计型粗粒度交通流数据和简单阈值法对高速公路走廊上的交通拥堵状态进行研判,存在研判结果不可靠的风险,致使在此基础上提取的交通拥堵演化模式与现实交通状况偏离较大,进而降低了经验行程时间预测的准确性;另一方面,当前研究聚焦于经验行程时间均值预测,在建模过程中忽略了交通流随机波动性和数据噪声等不确定性因素对预测结果的影响,从而带来了经验行程时间预测不可靠的风险,无法满足现实中交通管理者和出行者对行程时间信息的高可靠性要求。考虑上述问题,依托无监督机器学习和统计时间序列分析技术,结合高速公路高分辨率交通流数据,本文旨在构建基于高分辨率交通流时间序列聚类的交通状态辨识模型,提出基于自适应拥堵演化模式识别的经验行程时间预测方法,探究经验行程时间可靠性预测技术,从而为高速公路交通管控和出行服务提供关键决策支撑。本文的主要研究工作及结论包括以下三个方面:(1)在交通状态辨识方面,为有效捕捉细粒度交通流序列(如时间间隔为30秒、1分钟等)数据中的短时波动特征和趋势信息,建立了基于高分辨率交通流数据和时间序列聚类的高速公路交通状态辨识模型。利用动态时间规整(Dynamic Time Warping,简称DTW)算法度量细粒度交通流时间序列之间的相似性,依据高速公路走廊关键路段交通流状态确定最优路段状态聚类数目,在此基础上利用模糊C均值聚类(Fuzzy c-means,简称FCM)实现可靠的离线路段交通状态辨识;为克服在线辨识结果中出现的短时间内交通状态频繁切换问题,基于动态规划算法对在线交通状态辨识结果进行了有效平滑。利用时间间隔为1分钟的高分辨率交通流数据对所构建的模型进行了合理性评估与验证。结果表明,所构建模型能够获得可靠合理的交通状态辨识结果,从而为精准可靠的高速公路走廊交通拥堵演化模式识别奠定了良好基础。(2)在经验行程时间预测方面,提出了基于自适应拥堵演化模式识别的高速公路经验行程时间预测方法。利用变分自编码器(Variational Auto-Encoder,简称VAE)算法对交通速度时空图进行降维,以有效降低建模复杂度,利用k-means算法对降维后的速度时空图进行聚类,并设计了自适应交通拥堵演化模式识别策略,实现经验行程时间在线预测。将所提出方法与两类基准方法(瞬时行程时间预测方法和历史平均行程时间预测方法)进行对比评估,结果显示:在非拥堵情形下,所提出方法和瞬时行程时间预测方法的预测效果接近,均要优于历史平均行程时间预测方法;在拥堵情形下,所提出方法要显著优于另外两类基准方法,且与真实经验行程时间更为接近,预测的平均MAE为2.5分钟和平均MAPE为6.7%,证实了所提出方法在现实高速公路应用决策中的优良潜力。(3)在经验行程时间可靠性预测方面,提出了基于广义自回归条件异方差族模型(Family Generalized Autoregressive Conditional Heteroskedasticity,简称 FGARCH)的高速公路经验行程时间可靠性预测方法。以经验行程时间残差序列为输入,基于自回归综合移动平均(Autoregressive Integrated Moving Average,简称 ARIMA)算法构建均值方程,实现残差均值预测;基于FGARCH算法构建方差方程,对残差波动性(置信区间)进行预测,最后通过叠加预测均值和“复原后”的预测残差置信区间,获得经验行程时间的预测区间。利用置信区间无效覆盖率(KP)、平均置信区间长度(ACL)、波动性平均绝对误差(VMAE)和方向准确性(DA)四个评估指标对所提出方法进行了评估与验证。结果表明:所提出方法能够预测合理的经验行程时间波动区间,由此有效提升交通管控和出行服务决策的可靠性;在拥堵和非拥堵情形下,预测模型的平均KP低于8%,在拥堵情形下,预测模型的平均ACL值小于11.5分钟。