南宁轨道交通集团有限责任公司运营分公司 广西南宁 530000
摘要:目前,我国的高速铁路正在飞速发展,在全球处于领先地位,但是随之而来的是不断增多的动车组故障数据,通过这些故障数据,铁路有关部门可以分析并挖掘出很多有用的信息,还有有用的规律,从而使动车组更加安全、平稳的发展。基于此,本文首先对大数据挖掘进行了简要描述,然后阐述了国内外动车组故障数据分析研究的现状,最后进行了动车组故障数据模型搭建。
关键词:大数据;动车组故障;数据挖掘;技术研究
近些年来,我国高速铁路快速发展,高速动车组制造技术也在飞速发展,随着上线运营的动车组数量越来越多,动车组在实际运用中积累了大量的故障数据,但是这些数据并未得到精准的统计分析以及深度的挖掘。在大数据的环境下,将动车组的重点故障数据进行统一规范化管理,准确、全面、有效的激励动车组故障信息,并利用数据分析技术对历史故障进行深度挖掘,找到动车组故障规律,防患于未然,是动车组运用检修中的一个重要研究方向。
1.大数据挖掘概述
大数据分析顾名思义就是对规模巨大的数据进行分析,从而获取深入、智能、有价值的信息。大数据挖掘算法就是大数据分析的理论核心内容,并且基于不同的数据类型和格式,科学地呈现出数据本身具备的特点,从而更加快速地处理大数据。数据挖掘是从大型数据中发现隐含的有价值、有用的信息的过程,如果选取的样本数据真实完整,那么所得到的信息有效性会更强。
2.国内外动车组故障数据分析研究现状
随着大数据时代的到来,数据挖掘分析技术正在不断发展,有很多行业在发展过程中都运用了数据挖掘技术,如制造业、销售业和金融业、医疗保健业等,在这里面还是有很多成功案例的。近些年来,无论是国内还是国外,都出现了许多专家学者,开始研究将数据挖掘技术应用到动车组的故障数据分析当中。
国外的数据挖掘技术开始的还是比较早的,20世纪80年代末期就有国家开始了在数据库中运用并发展数据挖掘技术,被国外学者称为数据库中知识的发现,而到今天,数据挖掘技术已经广泛运用到了多个领域。在大数据领域,美国投入了大量的人力、物力和财力,并且一直在世界范围内处于领先的地位,同时美国还将数据挖掘技术视为能够增强国家竞争力的重要手段。在2012年,美国政府发布了“大数据研发倡议”,其目的是从数据中获取有价值的信息,从而提高数据分析的处理效率,进而改革国家的人才教育模式。美国政府在发展大数据技术时,第一批项目就投入了2亿多美元,并且承诺在后续的研发工作中,还将继续投入大量的资金,但是军用大数据项目占比是很大的。有数据表明,美国军方有大概八百多个正在使用的数据分析中心,用途是收集、挖掘和分析各个类别的战场数据,从而能够及时并且准确的掌握对方的战略意图和军力配置,分析出对方的作战规律,使战场清晰化、透明化,从而取得战争的胜利。
目前,我国的大数据技市场正在快速发展着,规模也在不断扩大着。为了顺应时代的发展,我国的很多行业都在摸索和研究应用大数据技术,尤其是铁路行业。我国对动车组故障及状态的数据挖掘分析,已经获得了一定的突破,比如说北京交通大学的胡辉设计了一种新的并行算法,对动车组的运行故障数据进行急性深度挖掘分析工作,使效率提高了30%;上海铁路局高速铁路运维中心的研究人员通过对动车组中央控制单元中故障数据代码进行关联性分析,找到动车组出现故障的规律,研究故障的预研手段和预判手段。还有很多研究人员和学者,都为我国的数据挖掘分析工作做出了巨大的贡献和不断的努力,支持着我国大数据挖掘分析技术的发展。
3.动车组故障数据模型搭建
3.1动车组故障的定义及分类
故障,指的是产品,或者产品中的一部分,已经不能或者即将不能完成原本的功能,这样的事件或者状态。保障旅客的安全,将旅客准时准点地运送到目的地,并且在整个运送途中为旅客提供较为舒适的乘车环境,就是动车组运行的主要目的。为了达成这些目标,我国的铁路管理部门一直致力于我国的铁路行业发展,不断制定并完善了有关出现事故、出现故障、需要维修和管理等各项规定。在定义和分类动车组故障时,便要从安全性、运用性和舒适性这三个方面综合分析。
在进行动车组的运用和检修时,在运行途中发生的,还有在预防性检修发现的,便是动车组故障的主要来源。其中,预防性检修发现的动车组故障通常是不影响动车组正常行车的,因为有关部门会周期性的对动车进行检修,还会根据动车的状态进行维修,在动车的实际运用过程中,最重要,同时也是更加需要引起重视的是在运行途中发生的故障。在动车组长期的运用过程中,有几类故障的影响程度很重要,分别是:第一,在运行区间内非正常停车;第二,在出站时或者进站时出现晚点现象;第三,在动车正常功能受限的模式下运行动车。
虽然目前我国的铁路车辆管理部门还没有对动车组故障进行等级上的划分,但是有参考资料根据动车故障影响程度还有时间等级,将动车组故障分成了四类:第一级别是A类故障,是指动车出现故障在运行途中非正常停车时间大于20分钟且小于1小时;第二级别是B类故障,是指动车出现故障在运行途中非正常停车时间小于20分钟;第三级别是C类故障,是指动车出现故障致使出入站晚点或在功能受限模式下运行;第四级别是D类故障,是指一些其他的故障类型,这一类故障时不影响动车组正常运行的。
3.2动车组故障数据库系统构架
为了更好、更有效率的收集、记录并储存动车组故障数据,保障故障数据的完整性、规范性、可追溯性,还有可延续性,首先需要建立一个故障数据存储和故障数据处理的网络平台。故障数据库中的系统软件是利用计算机信息处理、网络和数据库等技术设计完成的。系统充分利用目前的铁路办公网络OA网资源,建立了动车组故障数据库管理系统网络,各终端服务器通过中心服务器相互关联,实现数据共享、系统网络运转,系统架构图见图1所示。
图1动车组故障管理分析总体架构图
3.3动车组故障数据库系统功能模块
动车组故障数据库系统主要有六大功能模块,分别是数据录入、故障查询、故障统计、故障跟踪、故障分析和数据字典。其中,第一类数据录入模块包括故障表单填报和故障批量导入两个主要功能;第二类故障查询包括多条件组合查询功能;第三类故障统计包含按时间统计、按里程统计、按车型统计三个主要功能;第四类故障跟踪包含待处理故障跟踪和运行观察故障跟踪两个主要功能;第五类故障分析包含车载故障数据分析、远程故障数据分析、部件平均寿命计算三个主要功能;第六类数据字典分为用户权限管理、动车部件配置、故障模式配置和计算参数设置四个主要功能。具体系统功能架构如图2所示。
图2故障数据库系统功能模块图
3.4大数据环境下动车组故障数据挖掘分析技术的发展
随着我国动车组安全性、舒适性的不断提升,越来越多的人开始选择乘坐动车出行,这为动车组在实际运用的过程中积累了大量的参考数据,其中就包含了故障数据,但是现阶段我国铁路动车组的管理部门大多数还是利用传统的人工手段统计和分析故障数据,由于工作人员的工作习惯各不同,因此对故障描述、故障原因和故障处理方法的记录也存在不同,导致铁路管理部门无法对已获取的数据进行规范化的整理工作,也很难从这样的数据资料里进行准确而又快速的统计分析工作,使深度数据挖掘工作受到阻碍。为了动车组的故障数据能够得到充分的利用,从而找到动车出现故障的规律,防患于未然,利用大数据技术是势在必行的。
结语
综上所述,目前我国的动车组故障数据挖掘技术还需要有关部门的支持和不断发展,为了动车组能够更加安全、有序地运行,保证乘客安全,动车组有关管理部门应该不断规范针对动车组故障数据的管理工作,深入研究动车组出现故障的规律,同时结合大数据分析技术,获得更多新的、高效的算法,使之应用到动车组故障数据挖掘分析工作中。
参考文献
[1]黄凌云.大数据环境下动车组故障数据挖掘分析技术研究[D].中国铁道科学研究院,2019.
[2]韩彩夏,曹炳欣,郝伟.基于大数据的高速动车组关键部件故障诊断技术研究[J].铁路计算机应用,2016(1):1-3.