关捷 马文俊
(中国铁路西安局集团有限公司,西安,710000)
摘要:车载ATP设备无线连接超时故障是CTCS-3级列控系统日常运维中最常见的故障。正确分析定位无线超时类故障,是降低车载设备故障率、提高ATP设备运用质量的重要指标。本文以各车型无线连接超时故障为例,通过车载数据、通信接口数据综合分析,准确定位故障原因并给出处理建议,为现场故障应急处理提供思路方法。
关键词:列控车载设备(ATP);无线连接超时;数据分析
Wireless Connection Timeout Problem of CTCS-3 Train Control System
Guan Jie Ma Wenjun
(China Railway Xi 'an Bureau Group Co. LTD, Xi’an 710000)
随着高速铁路高速发展,CTCS-3级列控系统在我国主要客运专线如京沪、武广、郑西等均为CTCS-3级线路广泛应用。然而,日常运维中,CTCS-3级车载列控系统(ATP)设备无线连接超时故障频繁发生。以西安局为例,2019年车载ATP设备故障中,无线连接超时类故障占比高达34%,其中,对行车造成影响的无线连接超时故障有16件。准确分析处理无线超时类故障,已成为提高ATP设备运用质量,降低高铁车载设备故障率的重要内容。
1 无线超时类故障分析基本方法
CTCS-3级列控系统主要由车载列控系统(ATP)、铁路专用移动通信网络(GSM-R)、无线闭塞中心(RBC)三部分及其他地面设备组成,整个系统中任何一个环节出现异常,大都会反映到列控车载设备上,表现为无线连接超时。
在发生C3无线连接超时后,基本处理方法为:基于车地闭环监测链,综合对比分析ATP车载数据及各接口监测数据,确定故障点,提出处理措施建议。分析流程如下:
1)查看车载ATP数据,确认对应时间点有无故障代码,故障代码是否明确指向车载设备板件;
2)分析Um、PRI接口数据的交互过程,查看车地双方是否按照规范发送相应数据包,以及对方是否正常收到所需的数据包,确定C3数据层面的拆链原因;
3)分析Abis、A接口的信令交互过程,查看拆链前的小区切换过程是否有异常,有无切换失败和乒乓切换,以及小区切换的原因;
4)通过Um、Abis接口分析电台模块测量报告,判断无线超时时的网络环境工作状态;
5)通过综合对比各个接口的数据和车载ATP数据来最终确定超时原因。
2 典型故障分析
以西安局发生的无线连接超时典型故障为例,简要对故障发生时数据分析方法及处理措施做以说明:
1)2020年4月7日20时58分, G861次运行至华山北站至渭南北站间发生无线连接超时,该车次为300T型ATP设备。
首先对车载ATP数据进行分析:
52 20-04-07 20:57:37;102 FID:ss_a_level_h LID: 7359 TID:SMGM_LogTask
042657128 ATP A 4F48R023 Preparing fallback level LSTM, NID=45. (准备降级C2级)
55 20-04-07 20:57:36;512 FID:wi_a_RBCcont LID: 894 TID:SMGM_LogTask
042656231 ATP A F682R000 1 1 1 radio service lost(连接丢失)
57 20-04-07 20:57:35;954 FID:rd_a_radio_c LID: 2422 TID:SMGM_LogTask
042655636 ATP A 9B68R000 RD R:1-2 Network resource not available(网络资源不可用)
从ATP数据可以看出,存在无线连接超时并降C2级运行的故障代码,但不能明确指出故障原因。继续分析Abis接口数据可以看到,20:56:55后,HSB-WNB11向HSB-WNB12多次小区切换失败,根据小区切换流程,HSB-WNB12基站向BSC发送HANDOver DETection后,应向ATP侧电台发送物理消息(PHYSICAL INFORMATION),但从目前的接口数据来看,未见网络侧下发物理消息(PHYSICAL INFORMATION)的记录。
综合判断:由于ATP车载电台未收到网络侧物理消息,导致小区切换失败,从而使ATP侧数据无法正确传输至RBC侧,触发无线连接超时,ATP处理逻辑正确。建议排查网络侧,确认物理消息发送失败原因。
2) 2020年4月23日14时03分,徐兰高铁线D6817次运行至西安北站至咸阳秦都站间发生无线连接超时,该车次为300S型ATP设备。?????
分析车载设备JRU数据, 13:58:21时,ATP报主系“RIM故障”,后续交路为单电台交权,在交权区均发生无线连接超时。继续查看车载DUMP数据中主系RIM单元,故障代码为:11E18(RIME模块宕机),时间戳:1438109。
分析可知,由于主系RIME宕机,导致ATP后续交路单电台交权发生无线连接超时,建议对ATP设备主系RIME模块进行更换。
3)2020年1月5日17时06分G822次13时08分在长沙南至株洲西区间发生无线连接超时,该车次由CRH380AL-2592车担当,300S型ATP车载设备。
查看ATP设备车载数据无相关故障代码,分析 Um接口监测数据,发现车地间数据交互异常,由 Um 接口系统消息和测量报告知,从 13:08:35.036开始下行方向电平值偏低,通信质量降为 5 级质差,电台按周期正常发送测量报告,基站发送的测量报告显示异常;从 13:08:32.210 开始,ATP 请求发送的 NR:6号的数据 RR 帧,一直未收到下行方向任何有效的数据回复,13:08:42.060 ATP发送 SREJ Frame : A 请求重传 NR:6,仍未收到下行方向的回复,车地间通信异常,最终导致无线超时。该次无线连接超时排除车载侧原因,建议后续排查网络侧。
3 结束语
CTCS-3级车地数据传输是个非常复杂的过程,涉及到的网元众多,包含了通信和信号两个专业,但目前各路局对于无线连接超时类故障的分析及定位,往往是通信侧和车载侧各自分析,不能做到对整个交互流程的全面梳理,导致分析过程单一化、片面化,故障点定位不够准确。因而,对于无线连接超时类故障,建议在数据分析阶段,查看对比从通信侧、到车载侧的整个交互流程,对通信、信号两方面知识进行融合,以准确分析定位无线连接超时故障原因,提出正确处理措施,有效提高ATP设备运用质量,降低故障率。
参考文献
[1]马文俊.无线连接超时故障成因析及应急处理[J].铁道通信信号,2014,50(7):66-69