汪贝
哈尔滨市市政工程设计院有限公司 黑龙江省哈尔滨市 150090
摘要:随着科学技术的发展,我国的大数据技术有了很大进展,并在道路交通工程中得到了广泛的应用。本文基于当下路况信息的预测问题,设计了一种路况大数据分析平台系统。识别出当前路段的交通状态,从而证明了该系统设计的合理性和正确性。
关键词:大数据分析平台;路况分析;ApacheSpark
引言
随着汽车保有量持续增加,车与路的矛盾日益突出,由此也引发了交通拥堵问题。拥堵问题现在己严重影响了人们的日常出行,而智能交通技术和车联网技术是解决交通拥堵问题的有效途径。以此为背景,本文主要对以车联网大数据为基础的实时路况信息系统相关技术进行研究。通过车联网技术实时采集交通数据并对其进行处理分析,以获得实时准确的路况信息,从而帮助出行人员选择合理的出行路线,实现缓解交通拥堵的目的。
1城市交通大数据
城市交通大数据是指城市交通运营管理直接产生的数据(包括公交车轨迹数据、公交车客流数据、公交车调度数据等),以及公共互动提供的交通状况数据,在合理的时间内难以管理,处理和分析的数据集,表明城市交通大数据包括来自交通行业和交通行业之外的格式化和未格式化数据。随着移动互联网、大数据、云计算等新兴技术手段蓬勃发展,以及智能交通的提出,促使交通大数据成为了研究焦点。孙章等对上海市居民出行的第5次调查进行研究,并提出交通大数据概念。交通大数据包括道路定点传感器、公交车GPS、公交IC卡等。以大连市公交车统计数据为例,4000余辆公交车10秒间隔的定位数据为20G/天,公交IC卡数据为9G/天。在数据爆炸的时代,社会活动的几乎每个方面都受到丰富信息的影响。作为人类生活的一个基本要素,交通领域也面临着大数据时代带来的承诺和挑战。在过去的几十年中,智能交通系统的快速普及使交通大数据经常在广阔的地理范围内从不同来源不断收集,规模庞大且信息丰富,看似无序的数据可以大大增强人们对其系统的理解。此外,由于交通大数据的实时性,因此可以实现主动交通管理以实现更好的系统性能。
2系统总体结构设计
整个平台由应用层、数据层和基础层实现。应用层是系统的核心层,关键技术在应用层得以实现。这一层由分布式计算引擎,将数据层的数据处理。这些数据由SparkCore进行抽取、转换、加载。在这一层中还有数据的清洗,因为原始数据都是一些非结构化,含有脏数据,难以直接使用的数据。这些数据按照一定的规则,比如空数据用-1代替,无效数据删除,还要对外服务提供接口,进行数据的转存。数据层也是大数据中心。这一层提供了非结构化数据处理技术支持,本系统使用的是ApacheSpark1.6。结合Hive将数据进行ETL处理。本层是数据的存储层,采用的技术是分布式文件系统,对海量数据的管理。基础层也是获取层。该层的主要作用是结合道路卡口和电警系统对数据进行收集,对日志文件的收集。在收集过程中也会进行简单的ETL操作,本层是数据的来源层。
3系统实现
3.1数据预处理
无论是采用GPS技术、RFID技术,还是传感器来采集车辆行驶数据,均不可避免地会发生因高楼遮挡、雨雪天气、网络信号不稳定等原因造成的采集数据丢失、重复和错误等情况,从而导致对实时路况的解析发生偏差。所以在采集到数据后,需要对数据进行预处理。本文采用的预处理操作主要有两个:数据清洗和数据修复。在进行数据清洗前,需要对GPS模块采集到的数据进行标准化处理,使之拥有统一的格式,方便后续的清洗与修复操作。标准化的规则如下:(1)为每辆车分配一个唯一的数据编号,实现对车辆的区分;(2)日期和时间信息按照年月日的形式处理,即2019年1月1日,整理成20190101,时间统一换算成秒的形式;(3)行驶车辆的经纬度地理位置信息需要转换成十进制的形式;(4)车辆行驶速度的单位统一为km/h。
3.2车辆分析模块
该模块是对最可能发生事故的路段进行数据的转存,如何确定哪些路段最可能发生故障,是这个模块的关键。最有效的方法是通过机器学习算法做出一个模型,再将每个卡口收集的数据带入该算法模型,进行道路预测。而本系统没有机器学习功能,所以通过经验来确定,也就是车流量最高的路段最容易发生事故。所以经过卡口车流量分析模块分析后,得到的一系列车流量最多的卡口号。再把这些卡口的数据经过算子的清洗和切分,就能得到这些卡口所监控到的所有的车辆信息。通过ApacheSpark内部提供的JDBC接口将数据写入MySQL中。
3.3道路交通状态的识别
一般而言,道路交通状态可以分为:畅通、缓行、拥堵和严重拥堵,这几种状态具有不同的道路平均数据区间。当计算得到的平均速度位于某种状态的速度区间时,即可得出当前某段路的交通状态。
3.4车辆轨迹刻画模块
车辆轨迹刻画模块是追踪可疑车辆的最好的方法。在确定某一辆车的车牌之后,就可以根据该车辆的行动路线确定该车主是否是可疑分子。本模块先将车牌号加载至广播变量中,与所有的数据进行对比,得到一系列的卡口号。再将这些卡口的所有数据加载至内存中,根据算子将每个卡口的时间提取出来,然后按照时间的先后顺序进行二次排序。这样该车辆经过的卡口顺序就得到了,最后通过算子将每个卡口号和地域名进行字符串的拼接,得到该车辆的轨迹路线。
3.5通信架构
1)车载局域网。车载局域网主要是通过3G网络实现语音组网,从而实现车主与车主、车主与平台话务员等之间的语音通信。同时,车载局域网通过4G网络实现移动数据组网,从而实现车与车、车与路边设施、车与平台等之间的数据互联互通。本文将处于传感层的机动车辆作为本系统的一个传感单元,传感单元再通过自身的摄像头、GPS等传感器将采集的数据通过4G移动网络实时上传至系统服务器,同时传感单元中车主可以随时通过3G网络实现语音信息的上传。另外,传感单元中的车主可以通过3G和4G移动网络实时从系统服务器获取自己所需的服务。车主出行时可以通过4G移动网络从系统服务器获取实时路况,以便机动车主及时选择下一步行驶的路线。同时,车主可以通过3G移动网络与同行的车主进行语音交流,还可以拨打平台热线从交通指挥中心获取相应的服务。2)道路局域网。道路局域网主要通过光纤互联网和WLAN实现道路数据组网,从而通过道路摄像头、测速仪等传感器将路面信息及时上传至系统服务器。本文系统不仅通过道路摄像头、测速仪等传感器抓拍交通违章机动车辆,还可以实时监控机动车辆和施工道路等路面状况。同时,本文系统将道路传感器和车载传感器等采集的数据在系统服务器端汇集成车联网大数据,再经过人工智能分析,将车联网大数据分类处理,可满足车主获取违章信息、交通路况实时信息、交通路况预测信息等不同的需求。
结语
综上所述,交通路况预测系统将成为智慧交通不可或缺的一部分,它将助力城市交通管理,方便广大机动车主实时了解交通道路行驶状况,避免交通拥堵,为车主出行选择行使路线提供有效参考。
参考文献
[1]张秋霞,王凌云.基于GPS/GSM汽车跟踪定位系统的设计与实现[J].电子设计工程,2017,25(7):27-30.
[2]王龙飞.基于车牌照的车辆出行轨迹分析方法与实践研究[J].西安:长安大学,2011.
[3]吴飞.智能实时路况系统的关键技术研究[J].测绘与空间地理信息,2013,36(8):95-97.
[4]杨晓光.智能交通管理与控制及服务系统科技前沿[J].道路交通科学技术,2014(4):13-14.