摘要:随着现代信息化潮流的到来,网络监控运营在一些使用部门也得到了足够的重视,其含义是指在网络信息化IT设施领域实现基本管理与维护,从而达到网络信息运行的效率。从网络监控运营的两个方面出发,一个方面是网络安全,另一个方面是降低网络故障率。传统的网络监控运营大多数是靠工程师远程操控,致使网络安全受到人为因素的威胁,不利于网络持续运营,另外,远程操控对于工程师的技术要求比较高,操作有一定的难度,网络监控运维系统能够有效的避免这些弊端,下列是针对网络监控运维系统的设计与实现进行详细的阐述,以供参考。
关键词:网络监控:运维系统:设计与实现
一、引言
网络监护运维系统的设计与实现,在一定的意义上,能够有效的提高网络的通信效率,保障网络安全,降低了设备成本,最大限度的实现了网络运维的标准化与智能化。从现阶段网络监护运维的现状出发,找出现阶段网络监护运维中存在的问题,以这些问题为基础,展开详细的分析,对系统的设置与系统的实现进行详细描述,促进网络信息化可持续稳定发展。
二、网络监护运维系统研究的基础目标
1.研究工作的背景与意义
近年来,随着云计算、物联网的兴起,给网络监护运维系统造成了不小的冲击,使得网络运维系统不得不在一定程度上发展改革与创新,并且,网络监控维系系统的改革也是适应社会发展所需,为了满足相关信息技术部门的需求与发展,网络监护运维系统在设计上加以改革,重点凸显出网络的安全性与稳定性,进而提升网络运行的效率。此外,随着社会对信息技术的所需与网络的不断变革,网络组成与结构也相对的日趋复杂化,对工程师的专业技术水平要求也不断增加,要想要实现网络技术的高效化,就要工程师面对设备的各种疑难杂症都能够有效解决,将网络故障扼杀在摇篮之中[1]。在这种背景之下,想要完善网络监控运维系统,就要发挥监控层与治理层共同的作用,实现互利共赢,两者相互衔接,从多个维度、多个方面出发,促进社会信息发展的进程。
2.网络监控运维的国内外研究历史与现状
早期的网络监控运维系统在监控运维管理与故障检测方面存在着不足,监控运维系统设计不健全,故障检测不到位,缺乏高效的检测技术,没有统一的管理机制,对网络检测运行缺乏总结,整体系统规范性不足,致使整个网络信息发展迟缓。在这些基础性问题的导向下,建立统一的网络监控运维系统是有必要的,网络监控维系系统整体包含统一的故障检测与处理平台,相关管理体制较为完善。80年代末期,英国政府部门制定出了一套主要用于IT服务管理的规范,即IT基础架构库,IT基础架构库的出现,为IT服务管理提供了一套标准化的流程与示范,从而引起了国内为各界人士的关注与重视。国内诸多信息技术企业也着重开发相关的网络监控运维系统软件,这些网络监控运维系统比较倾向与特定的网络设备,并不能对客户的业务运行进行直观的展示,并且网络安全受限,对整个网络运行状况不能通俗的反应。
三、系统需求分析
系统需求大致分为两个层面,一是对网络监控运维系统的应用介绍,二是对业务需求与系统功能的介绍。(1)网络监控运维系统是IT运维管理系统,系统监控包括面广泛,主要有主机、数据库、中间件、客户端、网路等,对这些监控对象实施系统化管理。且对其故障性问题实施监控,通过弹窗的形式进行自定义告警设置。合理有效的将业务进行层次划分,依据网络监控运维系统的主要意义对各项数据实施监控。对于大规模与跨地域的网络系统,系统课采用分布式部署方式。
图1 网络运维管理系统示意图
.png)
(2)网络监控运维系统服务于各行各业的信息技术部门,能够方便工程师对网络故障案进行维护以及对运行状况进行查看,满足客户的需求。例如:以保证网络的可行性为目标,通过网络监控运维系统,工程师可以通过部署,对网络系统可用性进行监控,旨在提高网络运行的可行性;网络性能告警,可以及时有效的掌握网络运行的安全性,对网络故障实施监控,方便服务客户更便捷的了解当前网络状况,对网络安全提前进行预警,保障客户网络安全;并且,系统包括客户对流量监测的需求、对远程诊断及修复的需求等等,极大地满足客户的需求。其系统功能包括设备监控、资产管理、事件管理、性能分析、报表管理、流量监控、权限管理、日志管理、运维工具及数据维护等等,对工程师与客户业务的使用都有效益。
四、网络监护运维系统设计
1.系统规格与性能设计
系统有硬件与软件之分,硬件配置有应用服务器与数据库服务器两种,其中CPU、内存、磁盘等型号、规格,皆因厂商、设备的不同而不同[3]。系统性能设计主要有四中设计方法,从部署方式、应用服务器、数据库服务器、指标规模、告警规模、应用服务器CPU占用、数据库服务器磁盘占用、及适用范围多个方面出发,四中设计方法在一些方面皆有不同。
2.系统部署设计
系统部署设计包括集中部署与分布式部署两种,对小规模的网络系统可采用集中部署方式,对大规模与跨地域的网络系统,可采用分布式部署方式。
图2 集中部署示意图
图2 分布式部署示意图
3.模块设计
(1)网络设备监控设置
网络设备主要功能有五个方面,一是提供对网络设备的自动发现与监控管理;二是提供对一系列网络设备的实时监控;三是除了预定义的监控指标外,用户可以自定义的对自己使用的其他指标进行监控,不需要特定的开发;四是对网络输出、导入等提供支持;五是对网络实施刷新。从发现网络设备出发,对网络设备的指标进行管理,对端口实时监控,注重网络设备性能展示,并且对网络设备的配置文件进行管理,实事求是,落实每一个设备监控环节。
(2)主机设备监控设计
能够体现主机性能的数据包括CPU利用率、DISK磁盘容量、系统内存使用状况等,主机设备监控设计是通过相关的协议与方式来设计运维的,安全性能较高。当主机设备出现安全性问题或者性能超过某一限定的阈值时,系统就会给工程师自动发出预警提示,从而体现了主机设备在各种运行业务中的应用[3]。主机设备通常在TELNET、SSH、SNMP等协议中被发现,通过WMI、PUSH-AGENT等方式被采集,有具体的主机监控脚本设置。另外,主机指标受主机模板设置,主机性能良好。
(3)数据库监控设计
数据库监控设计主要目的就是定期自动查看数据库性能指标、分析服务器可能存在的问题,并且通过某一形式对图表、报表等进行分析。其在一定范围内对数据库进行添加,满足远程登录的需求,且对数据库指标管理先设置界面,对数据库指标进行采集、告警阈值进行设置,加以展示数据库性能的设计,方便运维人员第一时间掌握数据库的相关运行情况及负载情况。
(4)中间件监控设计
中间件监控是IT运营管理的一个重要组成部分,此系统的设计目的是能够定期自动调用相关端口查看中间件各项性能指标,对存在的问题能够详细的进行图表分析。
(5)应用监控设计
应用监控设置对公共的应用实施管理,主要包含对HTTP的应用监控、SMTP服务监测、POP3服务监测、FTP服务监测、及DNS服务监测等等。
(6)端到端监控设计
端到端监控在传统的监控系统设置上无法满足条件,在此系统上突破了传统监控的限制,其存在的意义是针对不同的链路按照监控策略进行实时监控、分析与统计。
(7)告警设计
告警设置是通过多种渠道对运维人员进行网络安全、故障警示的一种系统设计,其设计形势与告警策略设计、告警查询设计、告警方式设计等,具有一定的规范化。常见的告警主要有:网络设备异常、链路通断异常、主机设备异常等。
(8)报表设计
报表是网络监控运维系统主要的数据展示方式,其报表模板有多种,可将抽象的东西直观化,方便运维人员进行分析,查看系统的实时运行情况。报表的种类有网络报表、数据库报表、主机报表、应用报表、事件报表等,按照一定的周期进行制定与刷新,有其设计的必要性。
4.数据库设计
(1)表结构设计
对监控对象进行数据库建模,建立基本字段,制定每一个吧被监控对象
(2)数据归并与压缩
网络数据随着一段时间的积累就会增加,影响网络的正常运行与储存,数据归并与压缩设计就是在一定范围内对数据进行压缩,保障系统能够稳定运行。
四、网络监护运维系统实现
网络运行实现是对功能模块的组成与代码进行分层介绍,然后被监控对象进行整合规划,同时将告警实现带入,让系统各项功能趋于健全。下列是网络监护运维系统实现的几项实现指标。
1.系统架构的实现
该系统实现包含多个方向,其中服务器、编译部署方式、后台支持、数据库等都有涵盖,并且,在一定程度上系统可分为五个部分,这五个部分相辅相成,相互衔接。对于系统平台的建造,一向指标在于能够实现网络运维的可行性,平台构架各个模板之间是依赖关系,且软件模板之间的解耦。
2.设备监控的实现
设备监控的实现一向分为采集线程的实现、端口监控实现、数据统一入库的实现、配置文件监控的实现四种[4]。采集线路实现是对所有的设备完成采集,需要保证采集的实时性与准确性,同时达到限定的采集目标。端口监控实现是端口流量与状态指标的判断及实现。数据统一入库的实现,是将数据采集好后,通过某种形式将数据与内存相互结合,实现统一入库。配置文件监控,是实现网络安全监控的过程,在系统相关协议一定是,可对网络设备配置进行下载。
3.告警实现
高警实现是当系统产生告警时,通过短信、弹幕、等自动运行的方式让运维人员接收到故障信息,运维人员通过相对应的故障排除器对故障进行排除。
4.采集实现
采集实现是要在考虑多种因素后的基础上对数据实现采集,针对某种采集手段对数据库的负载压力与系统采集进行特殊处理。
五、结束语
综上所述,一网络日常监控运维工作为背景,在了解其网络监控运维系统的现状与意义的前提下,对网络监控运维设计与实现展开分析,其分析包含对主机、数据库、中间件等组件的分析及对告警通知能力的设计研究,其主要目的在于提高网络监控运维人员的工作效率,一定程度上保障网络运行与网络业务的安全,从根本上,预防网络故障的发生。在设计方面对系统设计较为全面,具有一定的运行实现价值,基本与现代网络发展设计目标相挈合。
参考文献
[1]曾海龙. 网络运维监控系统设计与实现[J]. 建筑工程技术与设计, 2018, 001(019):4188.
[2]贺斌. 台内节目生产网络监控系统的设计与实现[J]. 影视制作, 2019, 025(001):75-81.
[3]黄慧颖. 分析调度自动化运维监管系统的设计及实施[J]. 山东工业技术, 2017(14):262-262.
[4]田小川, 刘孙俊, 郭顺森,等. 智能运维可视化集中监控平台的设计与实现[J]. 信息通信, 2017, 010(011):105-106.