国网安徽电力信息通信分公司 安徽合肥 210000
摘要:长期以来,电力通信按照分层、分级、分区模式进行管理,各级电力企业已建综合网管系统基本上都是孤立的、非标准化的,业务和信息集成度相对较差,无法进行有效的数据共享,容易形成“资源孤岛”和“信息孤岛”。本文基于实际的状况对备调TMS(电力通信管理系统)系统建设与方案设计做了简单的探讨,以供相关人员的参考。
关键词:备调TMS;方案设计
1、当前备调TMS系统网络现状
TMS功能包括实时监视管理、运行管理、资源管理、采集平台服务、统计分析5大功能模块,系统部署了2台数据库服务器和2台应用服务器,在每台应用服务器部署4个组件,这两台服务器上的4个组件互为主备,提高各组件服务的安全性,数据库服务器通过oracle RAC实现数据库主备,同时内网人员访问TMS系统时会由负载均衡器进行自动负载,提高用户访问系统的响应速度。
2、备调TMS系统建设规模
在备调新部署一套TMS同步系统,建设完成后,在生产系统和灾备系统之间建立数据库主备关系,备调应用独立部署、配置同步更新,通过追踪生产端TMS运行状态,在生产端服务正常的情况下,备调TMS数据库处于待命状态;在生产端服务状态发生变化的第一时间启用备调TMS各服务,延续TMS的所有业务功能,确保业务系统7*24小时持续稳定运行。确保信息系统的稳定可靠,提升系统抗风险能力,有效的提高公司TMS系统的抗干扰和损坏能力。
3、备调TMS系统方案设计
3.1、技术架构
(1)接入层:在备调出口旁挂全局负载均衡设备,进行用户访问接入与流量调度。用户流量按照策略调度到各应用服务器。
(2)网络层:在备调配置汇聚交换机,并接入到现有的核心交换机上,作为TMS系统的物理汇聚交换点。备调与省公司主调使用现有的信息内网互联。省调机房网络架构保持不变。
(3)应用层:应用服务层采用与生产环境1:1硬件配比方式,使用基于操作系统的卷复制方式实现应用实时同步。
(4)数据库层:备调数据库层架构与生产端保持一致,采用RAC架构,作为备用数据库服务器,正常状态下处于mount状态。当生产端数据库出现异常或灾难事件时,可以直接切换为Open状态,作为生产库提供业务访问。
(5)数据复制层:采用数据库复制技术将省调生产库实时复制到备库。
(6)采集层:在备调配置2台采集服务器,采集的数据通过正向隔离装置将数据传到应用服务器处理。
3.2、数据同步建设
TMS数据同步复制软件功能最主要功能是冗灾、数据保护、故障恢复。保障信息系统数据级层源端、灾备端业务数据完整、一致、可用的目标。
远程数据冗灾,本地有个生产数据库,同时建立一个异地的数据系统作为应急数据库存,该系统是本地关键应用数据的一个实时复制。在本地数据及整个应用系统出现灾难时,系统至少在异地保存有一份可用的关键业务的数据。生产主机向生产数据库写数据时,通过实时复制并在应急数据库中写入相同的数据,实现数据进行增量同步。主、备系统间通过一条高速网络通道互联(数据通信网络,带宽要求200Mb/s以上)。当主用系统出现故障时,切换到备用系统。
当生产数据库由于计划中断或非计划中断而变得不可用时,通过数据库同步复制软件实现生产库与灾备库的主备切换,切换后自动建立反向复制关系。紧急运行期间数据实时同步至生产库。
自动间隔检测及其解决方案,如果主数据库与备用数据库之间的连接丢失(例如,由于网络问题),则在主数据库上生成的重做数据将无法发送到备用数据库上。一旦重新建立连接,需自动检测丢失的存档日志序列(或间隔),并将必要的存档日志自动传输到备用数据库中。
3.3、应用同步建设
使用Storage Foundation的VERITAS Volume Replicator(简称VVR)模块完成TMS应用于主备调间的实时复制。VVR既能做到完全同步的操作系统层面数据复制到备调中心,同时也能够实现异步复制。首先使用SF的VERITAS Volume Manager(简称VxVM)在物理磁盘上建立多个或一个逻辑卷(Volume)。以裸设备的方式使用卷,或在卷上建立文件系统。将数据(特别是需要进行远程复制的相关文件系统、数据库)存放在卷上。由于数据复制是基于卷的,所以,Volume是进行复制的基础。VERITASVolumeReplicator(简称VVR)负责远程数据复制。
3.4、一键式容灾切换
保证在生产中心发生灾难或者生产中心需要维护时,应用在管理员的确认下,可以实现一键式快速切换。
VCS除了行使本地应用自动切换的功能之外,还支持生产中心应用快速切换到容灾中心。VCS利用其globalclusteroption模块同时监控两个数据中心的应用系统状态,一旦发现生产中心有问题,及时提示管理员,如果管理员确认发生了灾难需要接管,通过VCS的控制台,可以指挥VCS快速地在容灾中心将应用启动。
即使对于简单的少量的应用可以手工完成在容灾中心的启动,但是不一定能够即使恢复。而对于大量的、复杂的应用环境,人工操作是极其复杂的,甚至是无法完成的,非常需要这种自动化工具的帮助。
3.5、容灾演练设计
目前在企业IT系统容灾计划中最难的步骤就是容灾演练过程,一个真正的容灾演练需要将应用切换到容灾中心运行,以确认发生灾难时容灾中心是否可用。在现实中,容灾演练发现最容易出事的环节是容灾中心的数据一致性问题,数据库根本不能运行。
如果采用SymantecVCS做HA软件,VCS的FireDrill功能可以自动地验证容灾中心的数据是否可用,它的工作原理是将容灾中心包含数据的逻辑卷做一个快照(通常需要验证的总数据容量的15%的空间),在复制不中断的情况下启动上层数据库或应用,测试是否可用,VCS记录这个过程是否有问题。如果一切正常,证明数据和应用是一致可用的;如果有问题,管理员可以及时修复,以防止时间久了,忘记了,真正灾难来临时,容灾中心不能立即投入适用。测试结束后,VCS自动停止应用,并释放快照空间。
3.6、运行场景设计
(1)日常运行阶段:TMS备调系统处于日常运行阶段只要实现以下功能:①TMS生产系统正常运行;②通过数据同步复制产品实现TMSO racle数据库向灾备端的实时复制;③初始化后,处于实时复制状态,接管时建立反向复制关系并启动至读写状态;④指导切换流程;
(2)切换阶段:当TMS生产系统故障时,将服务切换到灾备端,实现TMS系统在灾备端的临时接管运行。具体切换步骤如下:①申请切换;②使用数据库复制软件高级灾备功能实现数据库一键切换,建立反向数据复制关系;③使用VCS实现灾备端TMS系统一键启停,快速接管生产业务,用户访问灾备端的TMS服务。④根据备份策略,进行生产系统数据备份。
(3)紧急运行阶段:灾难切换后,紧急运营期间用户使用灾备端的TMS业务应用系统。
(4)回切阶段:生产中心恢复后,将TMS系统回切至生产中心。具体回切步骤如下:①生产端服务重建完成;②灾备端一键回切,紧急运行期间数据回写生产库。
总而言之,良好的备调TMS系统建设与方案设计能够有效的促进电力通信标准化工作的建设,提升通信服务电网生产和企业管理的保障能力,通过实时监视和资源管理应用的建设,为通信生产运行提供一系列智能化的辅助工具,提高了通信专业对电力通信网络的驾驭能力、通信资源配置的优化能力、通信缺陷和风险的防御能力、以及对网络和业务的调控能力;通过运行管理应用的建设,为通信运行管理提供统一的运维服务和专业管理界面,在此基础上优化通信生产管理流程,可降低运维工作压力,提升运行和管理质量。
参考文献:
[1]赵景宏,申扬,黄兴.电力通信站运维管理系统的智能化设计与实现[C].人民邮电出版社电信科学编辑部,2019:460-464.
[2]曹越.攀枝花电力通信中心设备管理系统的设计与实现[D].电子科技大学,2019.
[3]孟晓峰.电力通信网运维元数据的建模及管理系统设计[D].北京邮电大学,2019.