华为SDH传输网两种常见业务常见告警分析

发表时间:2020/12/11   来源:《科学与技术》2020年第22期   作者:江趁娟 杨丽
[导读] 华为SDH传输网是一种多业务传送平台,承载的常见有通道业务和以太网业务。在业务的开通和维护过程中,华为SDH传输网网管系统会上报一些常见告警,这些告警信息反映了通道业务的运行情况。
        江趁娟[ 江趁娟(1989-),女,本科,中级工程师,通信网络运维。
        ],杨丽[ 杨丽(1982-  ),女,硕士研究生,高级工程师,主要研究方向为北斗及地理信息技术、通信网络技术。 ]
        中电飞华通信有限公司,北京 100070   国网思极神往位置服务(北京)有限公司,北京 102211
        【摘 要】华为SDH传输网是一种多业务传送平台,承载的常见有通道业务和以太网业务。在业务的开通和维护过程中,华为SDH传输网网管系统会上报一些常见告警,这些告警信息反映了通道业务的运行情况。
        【关键词】SDH;E1业务;以太网业务;告警;故障处理方法
0 引言
华为SDH传输网络能够支持多业务接入,满足大带宽传输,提供了可靠的通信环境。SDH传输网丰富的维护字节信息,使其具有良好的自愈能力。加上华为强大的网管系统,一般的业务故障,通过华为U2000网管系统的告警信息,就可快速定位故障,组织开展消缺。
        1 华为SDH传输网通道业务类型
本文所述业务是指SDH传输网络运行的常见且主要业务——E1业务和以太网业务。
1.1 E1业务
        SDH传输网络上的E1业务是指由E1业务接口板或者处理板承载网的通道业务。
早些年,SDH传输网络承载的业务大部分都是E1业务,1×2M或2×2M的E1业务足以满足客户的使用,最大的时候也仅为5×2M。
1.2 以太网业务
在SDH传输网上,以太网业务是指有以太网板承载的业务,业务带        宽比较自由,可根据客户的需求具体确定,从2M到千兆均可。
2 常见告警
常见告警是指SDH传输网U2000网管系统上常见的,出现频率比较        高的与E1业务和以太网业务相关的告警,且这些告警是由某些造成业务中断的故障而引发上报的。
2.1 E1业务主要告警分析
与E1业务相关的,影响客户使用的常见告警主要有:T_ALOS、UP_E1_AIS、DOWN_E1_AIS。
2.1.1 T_ALOS告警
T_ALOS告警是指E1接口信号丢失。
最常见的原因是E1接口输出端口脱落或松动。
其他可能的原因有:未接入E1业务或者对端站未发送E1业务、对端站设备出现故障、电缆等故障。
当出现多条E1业务同时产生T_ALOS告警时,通常原因为接口板发生故障或单板故障。
2.1.2 UP_E1_AIS告警
UP_E1_AIS告警是E1上行信号告警指示。
常见的原因是,对端站设备存在故障或告警,例如,对端站设备存在TU_LOP告警、T_ALOS告警或TU_SIA告警;还有可能是对端站设备单板存在的PLL_FALL、CHIP_FALL等硬件故障告警。其他原因可能有本单板故障或对端站硬件故障。
2.1.3 DOWN_E1_AIS告警
DOWN_E1_AIS告警是E1下行信号告警指示。
常见的原因是本站存在高级别告警,例如,R_LOS、R_LOC、R_LOF、MS_AIS等告警。
可能的原因有本单板存在UP_E1_AIS告警或者T_ALOS告警。
当有多条E1业务同时存在此告警时,可能的原因有本单板发生故障或者存在交叉时钟故障。
 2.1.4 TU_AIS告警
TU_AIS告警是TU告警指示。
常见的原因是业务交叉配置错误、对端站对应通道失效或系统中存在更高阶的告警,例如,R_LOS、R_LOF、HP_SLM。
多条业务同时出现此告警时原因可能是交叉板故障。
2.2 以太网业务告警分析
本文仅就常见常见告警进行分析。如ETH_LOS告警、LCAS相关告警、TU_LOP告警、TU_AIS告警等其他一些影响业务正常运行的告警。
2.2.1 ETH_LOS告警
ETH_LOS告警是网口连接丢失。
该告警的最常见原因是端口的网线或光线没有连接好。
可能的原因有网线或光纤故障。
其他可能的原因有对端发送部分告警和本端接受部分告警。


2.2.2 LCAS相关告警
1) LCAS_FOPR告警
LCAS_FOPR告警的含义是接收方向协议失效。常见原因是对端站VCG LCAS未使能。可能的原因有交叉绑定出现错误;由错误配置或者链路误码等原因使得下行VCG接收到重复的序列号;由错误配置或者链路误码等原因使得下行VCG同时接收到FIXED和其他LCAS控制字。
2) LCAS_PLCT告警
LCAS_PLCT告警的含义是发送方向带宽部分丢失。常见原因是对端下行绑定成员个数小于本端上行成员数。可能的原因有没有配置双向业务;SDH传输通道不通,如SDH交叉有问题或者物理链路没有连接好。
3) LCAS_PLCR告警
LCAS_PLCR告警的含义是接受方向带宽部分丢失。常见原因是对端上行绑定成员个数小于本端下行成员数。可能的原因有没有配置双向业务;SDH传输通道不通,如SDH交叉有问题或者物理链路没有连接好。
4) LCAS_TLCT告警
LCAS_TLCT告警的含义是发送方向带宽全部丢失。常见原因是对端下行没有绑定成员。可能的原因有SDH传输通道不通,如SDH交叉有问题或者业务存在其他的告警。
5) LCAS_TLCR告警
LCAS_TLCR告警的含义是接受方向带宽全部丢失。常见原因是对端上行没有绑定成员。可能的原因有SDH传输通道不通,如SDH交叉有问题或者业务存在其他的告警。
2.2.3 TU_LOP告警
TU_LOP告警的含义是TU指针丢失。常见的原因是对端站对应SDH传输通道失效。可能原因有SDH传输网系统中存在有更高阶的告警,例如R_LOS告警、R_LOF告警和HP_SLM告警;SDH业务交叉配置错误或者SDH业务交叉丢失;再有可能是设备交叉板发生故障。
2.2.4 TU_AIS告警
TU_AIS告警含义是TU告警指示。常见的原因有SDH业务交叉配置错误或SDH传输系统存在有更高阶的告警,例如,R_LOS告警、R_LOF告警、HP_SLM告警。其他可能的原因有对端站对应SDH通道失效、SDH业务交叉配置错误或者交叉板存在故障。
3 故障处理原则及方法
SDH传输网网管系统的显示的告警大部分都是由于某些故障引起的,会影响到业务的正常运行和使用,告警处理本质上就是故障消缺。
3.1故障处理原则
华为SDH传输网通道电路故障处理原则主要有:
1)首先根据网管监控系统告警显示或客户申告,初步判断故障原因和性质,确定是局内原因还是局外原因,是设备故障还是线路故障。
2)在初步判明故障原因和性质后,应根据电路调度制度,按客户级别对电路进行抢修和迂回处理。
3)故障消除后,在不影响客户使用的情况下恢复抢修和迂回电路至正常状态。
4)实时查看告警,做好告警记录,整理处理过程、故障原因和故障点分析。做好故障报告,向相关单位和有关部门汇报告警情况、故障处理情况及处理后总结工作。
3.2 故障处理方法
华为SDH传输网通道电路的故障的常用处理方法:
1)分析法
分析法是通过对华为SDH传输网网管上报的业务告警信息进行管理,依据告警信息对故障进行初步判断和深度分析,以采取有效的消除故障的方式和方法。
2)环回法
环回法是很多故障常用的判断故障点的方法,也是SDH传输网常用的电路故障定位的有效方法之一。环回法分为硬环法和软环法。硬环法是在SDH传输设备上或者配线架上利用自环头对线路进行环回的方法。软环法是在SDH传输网管系统上利用网管软件对线路进行端口或交叉环回的方法。通断逐段打环的方式,逐段排除,以缩小故障点的方位,最后定位出故障点。
3)仪表法
仪表法是指利用以太网表、2M表、误码仪等仪表,对SDH传输网通道电路故障进行检查。如使用2M表对故障的E1业务线路进行测试,以确定线路的质量,排查故障点;利用以太网表对以太网业务进行测试,以监测业务的使用情况,运行质量及查找故障点。
4)ping测法
ping测法主要应用于以太网业务的测试和故障处理。通过两端分别同时使用笔记本相互ping测以确定SDH传输通道的通断,根据ping测的现象,来排查以太网业务的故障类型和SDH传输通道故障的故障点。
5)经验法
经验法对工作人员的经验要求比较高,适用于突发SDH传输电路中断,而没有任何告警的情况,在此情况下,凭经验对SDH传输电路进行重新激活或对设备进行重启操作,以恢复业务。
4 结束语
虽然E1通道电路已过时,但是其积累下来的告警分析和故障处理经验仍有宝贵的价值,对新业务、SDH传输网网络的运维工作有很大的指导意义。以太网通道电路是现在的主流,其告警分析和有效的故障处理方法在不断的丰富和完善。熟悉华为SDH传输网系统和相关知识,丰富告警管理能力和经验,对提高SDH传输网业务运行非常重要。
参考文献:
[1]赵远玲,隋涛.SDH传输系统设备故障排除及处理方法[J].信息科技,2014,(124 ):23.
[2]马素芝,陈慧勇.SDH光传输设备故障处理与维护[J].技术分析,2018,(11):96.
[3]黄忠.浅谈华为SDH传输设备的故障分析[J].农业科技,2009,(4):120.
[4]华为U2000产品文档   
投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: