张少兵 惠建平
中国电子科技集团公司第34研究所,广西 桂林541004
摘要:随着SDH光传输设备使用年限的增加,设备逐年老化,设备出现各种各样的故障问题也会逐年增多。本文以马可尼SDH光传输OMS1684光传输设备Flash(闪存)卡出现存储故障问题,在不引起业务中断的情况下,替换新的Flash卡解决故障问题,就是这篇文章探讨的重点,为遇到类似故障问题提供一点参考和借鉴。
关键字:同步数字体系、在线、中央控制单元、数据、本地节点管理器
1 引言
近年来,在国家电网专网SDH光传输网络存在一些故障,这些故障有可能影响光传输网的正常运行,需要及时处理,以免带来不必要的损失。因此,需对这些故障进行处理,达到优化网络的目的,以满足光传输网的正常运行。处理故障期间,网络可能会出现瞬断,根据SNCP切换技术标准,在50毫秒以内。
2 故障现象
国网电力某站点马可尼SDH光传输OMS1684光传输设备出现Flash卡故障问题,故障如下表1所示。
3 故障分析
出现Master database failed和Backup database failed告警,是由光传输设备Flash卡存储区出现故障引起的。闪存卡出现故障可能由以下情况造成。
(1)闪存卡出厂可能错在隐患或者在制作存储卡分区时出现故障,建议闪存卡使用工业级的flash卡;
(2)机房中空气温度过高,设备长期处于高温运行条件下,加快Flash卡老化和损坏,易造成存储区数据无法正常读取或识别;
(3)机房中灰尘过多,又长期不处理,灰尘积压在设备上,使设备温度增高,长期处于此运行条件下,容易造成Flash存储区数据故障;
(4)机房中静电过大,使设备长期处于此运行条件下,容易造成Flash存储区数据故障;
(5)设备输入电压压差变化过大,设备长期处于此运行条件下,可能加剧Flash卡老化和损坏,使存储区数据无法正常读取或识别。
4 故障处理
4.1故障引起的后果
当站点设备不掉电,业务板件不出现损坏,Flash卡存储区故障不造成业务中断及及节点的正常运行,而当站点设备异常掉电或重启,因Flash卡存储区不能读取数据或识别,运行设备数据将会丢失,影响光传输网的正常运行,节点业务将会丢失或中断。
4.2处理故障试验
4.2.1试验准备工作
准备新的Flash卡2张,存在告警的Flash卡2张,准备马可尼OMS1684设备2台,板件包括CCU卡2块, 10G板卡2块, 2M 126Port2块,LTU 2M 32Port板卡2块。3m的跳纤2根,达迪DDA260型话路特性分析仪1台。
4.2.2试验测试分析
用光跳纤连接设备1和设备2,从设备1到设备2做一个2M电路,设备2的2M用2M同轴缆自环,设备1的2M接上达迪DDA260型话路特性分析仪进行测试误码。如果处理Flash卡过程中,2M误码仪有告警信息,则说明处理过程存在问题,如果处理Flash卡过程中,2M误码仪未产生告警信息,则说明处理故障方法正确,以后处理马可尼OMS1600系列光传输设备Flash卡故障可以用类似的方法完成。
测试连接如图1:
4.2.3试验测试工作步骤
测试设备步骤:
1)制作两张新的Flash卡,把2块新的Flsh卡格式化为Fat格式,分区小于2GB,在PC机上用读卡器往新的Flash卡中写入OMS1684设备与故障的Flash卡中版本相同的软件,此软件和有故障的Flash卡中软件版本完全相同。
2)给设备加电,在OMS1684设备上插入访问线,用LCT节点管理器登录设备,备份设备数据。
3)用LCT节点管理器管理设备,把设备设置为off-line状态,待CCU指示灯停止闪烁后,拔出CCU板卡,此时LCT退出访问状态。
4)拔出CCU板卡上的两张有故障的Flash卡,分别插入新制作的两块Flash卡。
5)把CCU插入OMS1684设备,待LCT可以访问设备,登录设备,此时设备处于Off-line状态,把备份在PC机上的数据恢复载入Flash卡中,载入完成后,按OK键确认,此时LCT退出访问设备。
6)等待LCT可以访问设备,登录设备,切换off-line为on-line状态。
7)此时设备上所有板件的指示灯不停闪烁,大约7、8分钟后,等待所有指示灯停止闪烁后,设备恢复正常运行。
4.2.4试验测试结论
试验处理Flash卡故障工作完成后,查看2M误码仪测试结果正常,无瞬断,无误码出现。从以上测试结果可以看出,马可尼OMS1684设备可以利用上面的操作,完全不丢失业务或者中断业务,就可以替换掉损坏的Flash卡。2M误码仪测试结果如下图2所示。
5 现场故障处理步骤
1)在PC机上用读卡器往新的Flash中拷入软件,此软件和站点OMS1684光设备的版本完全相同,制作两张新的Flash卡;
2)在OMS1684光设备上插入访问线,用LCT节点管理器登录站点的OMS1684光设备,选择菜单Status-Backup ne configuration备份设备数据、Report-cross connection电子业务表。备份节点网元数据如下图3所示:
3)记录OMS1684光设备上的所有告警,以便结束工作后比较告警情况。
4)用LCT节点管理器管理设备,选择菜单Status-off-line satus,把设备设置为非在线状态,此时拔除CCU板卡将不会丢失业务,设备还是正常运行状态。待CCU指示灯停止闪烁后,拔出CCU板卡。设置网元状态非在线状态如下图4:
5)拔出CCU板卡上的两张Flash卡,分别插入新制作的两张Flash卡。
6)把CCU插入OMS1684光设备,等待CCU指示灯停止闪烁后稳定后,在设备上插入访问线,用LCT节点管理器登录设备,此时设备还是off-line状态,设置网元设备BNAK状态,选择菜单Software-bank status设置SMC1为current,SMC2为non-current。设置网元Bank状态如下图5:
7)待CCU指示灯停止闪烁后稳定后,把备份在PC机上的数据载入Flash卡中,等待CCU指示灯停止闪烁后,切换off-line状态为on-line。设置网元状态on-line状态如下图6:
8)此时设备上的所有板件工作指示灯不停闪烁,大约7、8分钟后,等待所有指示灯停止闪烁后,设备恢复正常运行。
9)查看设备运行状态,与运行人员、调度中心确认业务恢复情况。
10)检查光端机上此时的告警情况,和前面保存的告警做以比较,看Flash卡告警是否消失,有无增加新的告警,并做记录;
11)确认业务运行无误后,收集相关资料,总结,清理现场。
6总结
从以上处理故障的结果看,马可尼OMS1600系列光传输设备的Flash卡存储区存在故障时,可以采用这种方法快速安全的处理Flash卡故障,在用误码仪测试时,还可测试一些其他的指标,看相关指标是否在一定的范围内,是否符合相关ITU-T建议,波形分析,时钟检查等。通过对故障的处理,达到优化网络、排除隐患的目的,以满足光传输网的正常运行。
参考文献:
1现代光网络技术,王鸿滨,华为技术有限公司, 2006.6
2光同步数字传输网,韦乐平,北京人民邮电出版社,1993
3LCT and LCTS Operating Procedures(Marconi OMS 1600 Release 2.0),桂林马可尼电信有限公司,2002.6