关键词:
营运汽车
数据挖掘
行驶工况
主成分分析
聚类分析
摘要:
在信息社会的高速发展的今天,各个行业都会产生规模庞大的数据,利用数据挖掘手段对产生的数据进行统计分析成为了每个行业的重要课题。车辆行驶工况就是对汽车行业的数据进行统计分析的项目。
车辆行驶工况也称汽车运转循环,是针对某一类型的车辆在特定环境下的车辆行驶速度-时间历程。行驶工况是一项汽车行业非常重要的内容,它为汽车燃油经济性的测试、汽车排放标准的制定、新型汽车的研发以及当地交通状况的概况等都具有相当充分的数据参考价值。
本文将通过学习构建行驶工况的基本流程和方法以及对数据挖掘系统的研究实现一个营运汽车行驶工况数据分析处理平台,以此来完成合肥地区营运汽车工况构建工作。
本文首先采集来自辆营运客车的行车数据,再根据其规模和特点,通过对几个不同工况数据分析算法的比较,选择主成分分析聚类算法作为数据挖掘的核心算法。主成分分析聚类方法构建的行驶工况可以在保证工况代表性的前提下,通过主成分分析的降维作用减少工况运算量,又使用聚类算法来对数据进行合理分类,从而更容易通过工况来分析当地的交通道路状况。
同时由于主成分分析方法的特点,对主成分分析聚类方法的标准化过程进行改进,由传统的标准化方法改进成均值化方法,通过理论和实际数据验证,改进后的算法有效地提高了的算法性能。
经过前期基本流程的学习和数据挖掘算法的准备,运用Java相关编程语言,实现营运汽车行驶工况数据分析处理平台,完成对工况数据的存储。对工况数据进行前期的预处理,令数据可以直接进行数据挖掘分析;使用编程语言实现主成分分析聚类方法构建行驶工况,并把所构建工况合成显示出来。
在完成论文所要求的研究内容后,对营运汽车工况数据处理分析平台的相关技术进行总结归纳,找出所研究内容的优缺点;展望未来研究方向。