“大数据运维”信息系统运行维护探讨

发表时间:2020/8/4   来源:《建筑实践》2020年39卷第7期   作者:伍叶锐,纪大伟,孙超
[导读] 现代企业发展过程中,各项业务的发展与信息
        摘要:现代企业发展过程中,各项业务的发展与信息系统之间的联系越来越紧密,从某种程度上来讲,信息系统已经逐步成为保障企业开展生产经营服务的重要基石。本文分析了现代企业信息系统建设的目标,探讨了大数据对信息系统运维的重要性,并结合信息系统运维需求对大数据运维进行了研究,仅供参考。
        关键词:大数据建设;信息系统;运维措施
       
        1企业信息系统的建设目标
        1.1自动化监控
        施行自动化的全面监控,对环境、设备、数据库等进行全面监控,形成一个可以不依靠有线连接起来的系统,无论是数字集合还是其他方面,都会是自动化的。为不同的运维人员尽量提供不同地点的统一的工作平台,促进信息系统运维平台的研究与应用的科学化管理。
        1.2 自动化操作
        自动化操作的关键是操作方案操作流程是否合理完整,我们通常会考虑运维的需要和对象的特性,然后根据这些决定如何绘制脚本、建立脚本库。实行运维操作,有一个方法就是可以通过可配置的惯性,将多个基本的运维操作连起来构成一个自动操作流程。为了完善录入的信息,我们采用客户端和非客户端这两种模式进行信息采集。对于服务器,那采集办法就是客户端了,对于储存设备,非客户端就是比较适合的选择了,利用远程访问来采集信息,这种方法受网络管理协议的保护,所以不用担心协议问题,所以选择适合的采集方法也很重要。
        2大数据运维的重要性
        (1)传统信息系统巡检质量较低,重复性工作量大。机房、设备、信息系统巡检大量依赖人工,巡检频率和准确性都有待提高,巡检历史记录大量为纸质记录或者独立文档,难以得到有效利用。(2)信息系统及软硬件平台异构性大。随着以网络、主机、存储的虚拟化为代表的云平台技术的发展,出现了传统主机存储架构和虚拟化分布式架构并行,虚拟化软件存在多种架构并存的情况,同时在信息系统建设过程中,更多的是考虑业务功能的实现,各套系统异构性很强,巡检内容、范围均有所不同,运维困难较大。(3)云环境下运行环境复杂,运维难度高,运维操作作业自动化支撑不足。云环境下,运维的设备、资源、对象等数量大、技术难度高,如按传统手工排除故障、系统更新、部署、补丁下发等工作方式,费时费力而且非常容易出错;业务系统在云环境下的全生命周期管控缺少信息化工具支撑,无法对业务应用在云环境下的一系列应用构建、部署、诊断、检修、监控、调控和优化等操作作业(服务)进行流程化、自动化和全程化管控。(4)业务连续性保障支撑不足。由于自身业务系统中断,影响本业务系统用户正常使用,另外因为业务系统间的各种关联集成关系,会受影响的其他业务系统范围未知,被影响的用户群体未知。
        3大数据时代信息系统运维的业务需求
        (1)主机利用率提升。随着现代企业资源池规模的逐步扩大,机房空间限制、虚拟化技术限制等问题日益突出,单个主机资源的利用率有待进一步提高,以满足单个主机能够运行更多的虚拟机的需要。(2)运维效率提升。现有资源池业务应用系统部署时,存在大量重复的安装部署及配置工作,业务系统的安装部署及配置过程有待简化。(3)异构环境应用部署和迁移。业界采用Docker技术有效解决了运行环境差异化问题,使配置及发布更为便捷,同时DOCKER实现了更轻量的虚拟化,节省了虚拟机的性能损耗。当前资源池虚拟化架构,业务应用系统所涉及的操作系统镜像文件大,导致系统迁移部署复杂,尤其是针对异构平台的迁移,存在技术难点。(4)业务系统拓扑关系梳理。

现代企业现有业务系统大部分已在资源池中部署运行,业务系统以多节点或单节点的方式在资源池中的虚拟机上部署,而当资源池中某业务系统节点发生故障时,运维人员无法及时掌握此节点属于那个业务系统,并且无法明确与相关业务系统的逻辑关系,不能鉴别其影响范围,无法快速对相关业务系统作出应急处理。(5)补丁分发与版本控制。由于当前没有统一的管理界面及管理手段,在补丁升级、补丁版本回溯及准入校验时,没有相应的管理规范及监督手段支撑,往往采用运维人员根据以往经验进行相关操作,一旦出现问题,在追溯问题原因及解决问题效率上都有极大难度,费时耗力。
        3大数据运维措施
        3.1统一安全管控平台
        从客户实际环境出发,对全网的安全设备、网络设备、主机设备、数据库及应用系统的日志、事件信息进行集中收集和管理,结合客户最关注的信息安全痛点问题,通过强大的关联分析引擎制定关联规则,实时对客户现网环境进行监控和分析,对网络异常情况、系统脆弱性、黑客入侵、违规操作等安全事件实时报警,并通过友好的展示界面进行展示,使得不同层次的管理人员都能从平台中查看到自己最关注的安全信息。平台由据采集层、分析处理层、安全展现层及及其对外接口组成。
        数据采集层:主要对各类安全资源、对象的安全事件、安全配置、安全漏洞、资产信息等数据进行采集,此类信息一般通过Syslog、SNMPTrap、File(FTP或SFTP)、ODBC、XML等标准协议。
        分析处理层:主要是对系统采集到的各种设备的信息进行存储和分析处理。包括信息的过滤、归并、关联分析,从海量日志中分析潜在的安全问题,产生安全告警,结合资产价值和脆弱性进行综合风险分析。
        安全呈现层:对采集分析数据进行统一呈现,提供相应的Portal登陆查看、操作界面,实现资产管理、报表管理、系统管理、安全告警管理、脆弱性管理、风险管理、知识库管理、运维管理等。并对不同的管理人员提供不同的展示界面,系统管理人员最多点击三次操作就可以定位到安全事件的根源。
        外部接口层:提供与支撑系统、专业安全系统的外部接口。
        4预期效果分析
        (1)经济效益。通过云运维自动化技术的应用,将大量的运维工作都通过软件的方式自动完成,可有效降低运维工作的复杂度及运维人员的工作量,提升工作效率的同时大大降低了运维成本。(2)管理效益。实现IT信息化运维自动化,提高业务系统性能、安全性及业务系统扩展性,提升运维工作的整体质量;将运维工作各个环节进行标准化、规范化,通过系统程序按照既定步骤自动执行,从而完成运维相关工作有利于公司建立标准化、规范化的信息化运维工作制度及工作流程。(3)社会效益。服务意识由被动运维向主动运维转变,强化面向内外部用户服务意识,加强服务运维导向,完善系统分级服务水平,提供给用户全过程体验;通过云计算、虚拟化新技术的应用,推动专业发展的同时引领驱动公司发展。
        5结束语
        随着现代企业的高速发展和革新,企业信息系统的自动化运维平台的要求越来越高。信息系统自动化运维平台的研究与应用将在日常运维工作中提高很大的工作效率,由自动化取代了手工化,不仅仅提高了效率,还节省了生产资金,而且,排除了人为的不定性因素,整体的可靠性也提高了,这种操作有利于及时的掌握信息系统和设备的运行是否正常信息。绑定运维操作标准,提高运维工作效率,为企业信息化按照所需要的要求迈进,信息自动化的优化与发展维护不仅仅只是一个维护的过程,更是一个管理提升的过程,是现代信息系统发展的必然趋势。

参考文献:
[1]赵笑航.基于大数据运维环境下探究信息系统维护[J].信息系统工程,2019(10):19-20.
[2]郭志坚.浅谈视频大数据运维管理系统的设计[J].中国新通信,2020.
[3]张亮,陈小松.浅谈视频大数据运维管理系统的设计[J].中国安全防范认证,2018,000(001):21-25.
投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: