林赫
景县供电公司053500
摘要:IT运维指的是部门制定专项制度,规范管控流程,引入先进技术对系统运行环境实施全面优化,如软件环境、硬件环境、网络环境等,基本内容包括监控系统终端、服务器、其他基础设施。经济建设的持续发展为企业运营创造了良好环境,但也难以避免会遇到阻力。
关键词:自动化;运维平台;建设
1技术方向
业界自动化运维的建设,尤其是以互联网技术为代表的自动化运维建设,发展和建设方向大致有如下几个:
(1)日常任务处理自动化:将IT日常运维工作中重复性的工作进行流程抽象,行程可自动化编排的处理流程;
(2)应用监控及故障自愈:实现应用功能级别监控,以及流程化的故障自愈和非流程化的故障智能处理;
(3)DevOps体系:实现应用开发运维一体化的标准、流程和操作实施;
(4)无人值守运维(智能运维):已经一定程度上实现了智能运维,但这仍然是下一个自动化运维阶段可期待的突破;
(5)辅助运营(运维数据深入挖掘):通过运维数据的处理与挖掘,实现运营辅助和决策辅助,为企业业务带来价值。
同时,主流的技术阵营如下:
(1)以Ansible、Chef、Saltstack、Puppet等为代表的开源阵容,集中关注在任务脚本编排,作业调度能力上;
(2)以BMC、IBM、华为等为代表的商用产品阵容,集中关注在CMDB、服务器运维自动化、巡检自动化等能力上;
(3)以腾讯蓝鲸为代表的PAAS技术平台阵容,集中关注在驱动各类IT对象,和基于PAAS的体系化建设。
在进行技术选型和产品选型过程中,有一个很关键的规划经验在于,自动化运维不应以技术和平台为驱动力,而是要以运维场景为驱动力。这也是自动化运维落地的难点所在:自动化运维需要满足且持续不断满足业务定义的运维场景,而运维场景有着变化、灵活、跟企业运维模式紧密相关的特点。
自动化运维框架建设的原则应充分考虑场景化运维的复杂性、扩展性和灵活性。
并应该具备如下几种能力:
(1)自动化运维平台应具备丰富的驱动能力,它能驱动企业各个IT组件,包括新的技术如互联网组件、大数据平台等,旧的如已有的一些各个厂商的设备,它的扩展性要比以往的要求更高,而不是局限在厂商自己软硬件产品的自动化运维工具上,要脱离工具上升到平台级别;
(2)平台能高效集成企业运维流程,将ITSM和ITOM高度联动,实现流程真正的自动化;
(3)运维应具备运维开发的能力,运维IT需要从传统产品化运维人员,走向开发运维,自己能通过运维开发的方式实现自己的个性化运维需求,并帮助业务实现敏捷交付;
2基于1+N的自动化运维建设思路
而在开始进行自动化运维落地的时候,往往会遇到先做规划再逐步建设,还是先取价值度高的场景再持续建设的选择。
先做规划再逐步建设:先规划出未来的自动化运维蓝图,包括自身具备的功能模块,与周边系统的关联,数据流等,再逐步累加进行堆积;这种方式的好处是整个建设更具备指导性和计划性,但缺点是无法持续的优化建设蓝图,找到适合落地的模式;
先取价值度高的场景再逐步累加的方式:先选取一些典型的场景,如应用发布、自动化巡检、补丁更新等场景,逐步建设,然后持续累加,在进行到一定阶段的时候探知到适合自己企业的目标和蓝图;这种方式的好处是当前做的自动化运维建设是具备实际价值的,便于价值呈现后的后续建设,缺点是缺乏理论指导,需要后续持续构思适合自己的运维蓝图;
结合以上方式的优点,建议采用的方式是基于场景的1+N的方式:组建团队牵头规划设计并负责基础技术平台的建设,具体的运维功能可以由各专业、各部门自行开发维护和发布,形成1十N的组织模式。
此模式具有如下特点:
●发挥多方积极性,各取所长
●快速形成比较完备的企业级能力
●对平台的基础功能和核心框架要求高
●要求各团队具有较强的运维开发能力
●各部门能自己选取价值度最高的场景进行建设
3信息系统自动化运维平台的应用
在实际的应用过程中,信息系统自动化运维平台在多个不同的项目中,都有十分优异的表现。
3.1数据收集自动化
对于信息系统自动化运维平台来说,如何有效对数据进行处理和运维,是其日常工作中的主要内容。根据相关领域的调查和研究可以看出,早期信息的运营和维护工作,需要借助人工手动的录入方式,对信息数据进行电子化管理。但是,在现代化科学技术不断发展的背景下,运维工作持续深入,需要综合处理的信息数据也不断增加,若仍旧采取传统的数据信息管理模式,难以满足时代发展的需求。对此,我国某地区的企业,为了更高效地进行数据信息的处理,便对信息系统自动化运维平台的功能架构进行了设计。首先,当地企业对运维监控环节进行了自动化处理,在这一过程中,充分地应用了已经部署的监控系统,并且结合了呼叫平台预警监控、BTIM、运维审计等辅助系统,对网络安全设备、数据库中间件、应用服务和主机服务器等,都进行了全面监控管理;其次,建立了网络互联环境和统一的预警机制,同时还实现了监控数据的二次利用和分析。
3.2处置维护自动化
处置维护自动化的主要内容为现场事件处置的自动化。一般情况下,在利用信息系统自动化运维平台,对现场事件进行自动化处理的过程中,主要应用的是B/S结构。但是,根据实际的调查可以看出,此种方法的灵活性较差,并且需要强大的自动信息采集策略,难以同新型技术有机的融合。对此,我国某地区的企业,根据自身的发展实际情况,对信息系统自动化运维平台进行了优化设计。比如,在座席端的设计环节,充分地考虑了异常突发事件的特征,通过自动完成软电话日志、网络配置、系统日志等基础的环境信息收集,并进行自适应截屏的方式,将座席人员的工作量减少到最低。此外,还在上传了异常事件之后,在数据服务端自动关联了展示座席人员组织、业务和空间等信息,提高了信息收集的效率。
3.3辅助决策自动化
辅助决策自动化主要是通过人工效能分析、运行方式分析、系统运行健康度分析等方法,对各项决策的制定提供辅助意见,进而有效地改善企业在日报、周报和月报等异常系统运行报告中,各项决策的科学性和系统性。在具体的操作过程中,辅助决策自动化,可以在运维数据集中管理与数据正确配置的基础上,进一步实现信息系统的改造与优化、运维的规划,并为后续的工作,提供基础数据的支撑。
信息系统自动化运维平台中,辅助决策的自动化工作目标、分析方式和统计的口径等,都会出现较为明显的差异,进而为自动化运维平台,提供更为灵活的报表和定制服务接口,完成各项数据采集和模板定制的工作。其中,模板定制可以实现MicrosoftOffice办公软件及有关文档资料的自动化定制,根据实际需求可对数据进行二次加工。
结束语
传统的IT运维模式依赖运维人员的经验与技能,随着信息化的发展,IT运维管理工作的复杂度和难度的大大增加,传统式被动、孤立、半自动式的IT运维管理模式经常让IT人员疲惫不堪,IT自动化运维迫在眉睫。
参考文献
[1]龙炜.自动化运维工具在企业信息系统管理中的应用[J].微型机与应用,2017,36(05):102-104.
[2]闫龙川,刘军.企业信息系统自动化运维工具研究与应用[J].供用电,2015,32(08):78-81+50.
[3]付林.自动化技术在电力企业IT运维中的应用[J].电子技术与软件工程,2018(08):141+179
[4]杨文静.电力系统运行中电气自动化技术的应用策略[J].绿色环保建材,2019(10):215