关键词:
承运日盈余
机器学习
特征工程
回归预测
大数据
摘要:
针对承运制清算对铁路局集团公司货物运输(简称:货运)收入及营业收入的影响,为贯彻落实“以承运盈余目标为导向”的货运经营理念,实现货运经营效益最大化,文章运用多种机器学习回归算法,针对每项货运承运费用分别构建预测模型,并根据不同算法模型在测试集上的多项评估指标的表现,选定一种最佳模型,进行货运承运运费和承运对外付费每日按票预测,从而提前掌握每日承运盈余结果。研究表明,极端森林回归(ETR,Extra Trees Regressor)算法多项评估指标均表现最好,运用其构建的模型可更为精准地实现货运承运日盈余预测。截至2024年4月,该预测模型共完成约1033万张货票相关承运费用的预测,整体预测误差率在1.7%以下,充分发挥了数据要素价值,为货运效益分析及经营决策等提供数据支撑。