IT 运维管理流程体系设计与实践刘美兰

发表时间:2020/1/15   来源:《科学与技术》2019年16期   作者:刘美兰
[导读] 信息系统已成为支撑企业运作不可缺少的一部分,在企业内部建立了各种信息系统,如ERP系统、生产执行系统、办公自动化等系统。
       摘 要:信息系统已成为支撑企业运作不可缺少的一部分,在企业内部建立了各种信息系统,如ERP系统、生产执行系统、办公自动化等系统。信息系统在给企业带来便利的同时,也隐含着风险,一旦信息系统出现问题,可能将导致企业无法进行日常的业务运营,因此保障信息系统的正常稳定运行显得越来愈重要,但传统以人工为主的运维管理已不能满足企业全面管理信息系统的要求,缺乏有效的运维管理已成为影响信息系统应用效果的主要瓶颈。
        关键词:IT运维管理;运行维护;设计与实践

        对于如何进行有效的IT运维管理,很多企业和政府部门进行了长期的探索和实践,逐渐形成了一套IT运维管理方法论—IT服务管理(IT Service Management)。IT服务管理是以流程为导向,通过整合IT服务和业务需求,提高IT服务水平,让信息化资源发挥更大的效能。在IT服务管理领域中,ITIL 已成为事实上的行业标准,它是从大量企业的IT服务管理经验中总结出来的最佳实践,可以使企业在建立IT运维管理制度和流程的过程中充分吸取前人的成功经验,对改善企业运维质量具有很好的借鉴意义。

一、IT运维管理现状
        长期持续建设的惯性使企业普遍存在“重建设、轻运维”,“重技术、轻流程”等问题,导致对IT运维工作投入不足,缺乏规范化的运维管理流程。从信息系统的整个生命周期来看,实施建设只占其生命周期的20%,而其余80%的时间都是对其进行运行维护,所以运维阶段是IT生命周期中的关键阶段,如果IT的运维管理做的不好,那么这些花费大笔投资建立起来的系统将无法带来预期的效益。
        由于缺乏规范的运维管理体系,导致企业普通存在以下问题:
        ① 运维人员就像救火队员一样,处于被动的服务状态,只有当问题已经发生后,才进行紧急处理,不能预防问题的发生。
        ② 缺乏统一的服务台,用户请求随意性大,直接找有经验的信息人员,导致能干的人员成天处理无价值的琐碎事情,价值无法有效体现。
        ③ 缺乏规范的运维制度和流程。在处理问题时,没有对问题进行记录和分类,导致无法跟踪和监控问题的处理情况。
        ④ IT运维的相关经验没有积累和共享。由于缺乏对运维过程的记录,使得问题的处理方法只有当时的维护人员掌握,相关经验难以积累和共享。
        ⑤ 运维人员绩效无法量化。在运维工作中没有建立量化的考核指标,IT运维质量和运维人员的绩效无法量化,使得运维人员的工作积极性得不到提高。
        因此实现运维管理从传统被动式服务转变为主动预防服务,以流程贯穿整个运维管理过程,实现运维管理的标准化、规范化和流程化是目前企业信息化建设急需解决的问题。

二、ITIL体系框架
        ITIL确定了以流程为中心的IT服务管理方法,并定义了各个流程之间的相互关系,使人们对IT服务管理统一了思想、认清了方向。通过PDCA模型( Plan-Do-Check-Act ),可以持续不断地循环改进IT服务,从而保证IT可持续的生命活力。
        ITIL V3主要包括五个核心模块:
        (1)服务战略。该模块为制定IT服务管理的政策和指南提供指导,保证IT服务战略与业务相一致。主要包括服务战略制定、服务投资组合管理、服务财务管理和需求管理等流程。
        (2)服务设计。该模块为制定IT服务管理制度和流程等方面提供指导,帮助用户设计出合适的IT服务解决方案及流程。主要包括服务目录管理、服务级别管理、可用性管理、持续性管理和安全管理等流程。
        (3)服务转换。该模块为新增的或修改的IT服务转换到实际应用中提供指导。主要包括配置与资产管理、发布与部署管理、变更管理、知识管理和服务检验与测试等流程。
        (4)服务运营。该模块为如何达到IT服务支持和交付的效果和效率,保持服务运营稳定性提供指导。主要包括事件管理、服务台、问题管理、技术管理、应用管理和访问管理等流程。
        (5)持续服务改进。根据业务需求持续改进和提高IT服务生命周期中的每个阶段,使得IT服务能不断与业务需求的变化相适应。


        通过服务设计、服务转换和服务运营的实施,并借助持续服务改进不断完善整个过程,使IT服务管理过程整合为一个良性循环的整体。

三、运维管理流程体系设计
        运维管理流程体系的建设不是一次性就能够全部实现的,需要逐步实施和优化:
        第一阶段:咨询评估阶段。该阶段主要工作是通过对企业的IT建设和运维管理现状进行调查研究,评估企业当前的IT服务成熟度,找出运维管理存在的问题和不足,制定运维管理建设的总体目标、功能需求和实施计划等。
        第二阶段:建设实施阶段。在前期咨询评估的成果上,建设基于ITIL理念的IT运维管理系统,通过系统的建设,固化运维管理流程,本阶段主要实施ITIL中最核心的运维流程,包括服务台、服务目录、事件管理、问题管理、配置管理和知识管理等。
        第三阶段:推广提高阶段。在第二阶段的基础上,对运维流程体系进一步的深化和改进,主要实现变更管理、发布管理、服务级别管理、能力管理、可用性管理、监控系统的集成,运维KPI指标的制定。
        第四阶段:持续改进阶段。因为IT运维管理是一个不断持续满足用户需求和期望的过程,所以IT运维管理体系的建设应该是一个不断持续改进的过程,整个过程包括计划(Plan )、执行(Do)、检查(Check)和行动(Action) 4个阶段(PDCA),并按此顺序不断循环改进,通过PDCA的管理思想,定期地对运维流程进行分析,提出优化和改进建议,使运维流程随着组织内外部环境的不断变化而改进,保障运维流程动杰满足企业的最终目标。

四、解决企业IT运维管理难题的措施
        1. 人工运维巡检,遗留运维死角
        随着企业规模的不断扩大,IT资产变得越来越多,日常变更愈加频繁,每一次巡检和清点都花费大量人力、时间。但是由于工作量过大经常造成巡检工作敷衍了事,最终造成设备故障未能及时发现,设备信息不够完善等多种问题。
        2. 故障原因不明,问题无法根治
        当IT系统的某个流程出现问题时,往往因为找不到故障原因而无法从根本解决问题,成为大多数企业很难解决的问题。举个最简单的例子,当员工反映上网速度变慢时,网络运维人员查找了半天问题,也许会想到非法流量占用带宽,但网络中应用繁多,哪种应用才是罪魁祸首?无法判断哪些P2P是正常应用,哪些是非法应用?到底是外来攻击造成的安全问题还是确实应该增加带宽......问题原因不明,治标却不治本往往造成故障频发,运维人员疲于奔波,叫苦不迭。
        3. 对人过于依赖,人员变更惹祸
        当一个熟练本公司IT运维工作的人岗位发生变更,公司IT故障解决效率就会再次下降,即使会有新人继承前人的工作,但他却无法继承前人的运维经验,这也成为企业运维成本增加,重复投资的重要原因。对人的以来越大,IT运维管理中的不稳定因素越多。在企业IT系统中如何减少对人的依赖,避免出现因人员变更导致运维无法有效进行,是企业IT部门面临的重大考验。
        4. 重建设轻运维,管理认知错位
        很多管理者总是在IT建设时尽心尽力,比如花费重金建造机房等操作在国内屡见不鲜,但在日常运行维护时总显得心力不足,从而造成大量问题的滋生。而随着业务与IT融合越来越紧密,企业日常运维工作越来越多,却始终得不到业务部门的支持,导致运维工作频频受挫。如果企业自己搭建一套完整的ITSM,又可谓是一条漫漫ITIL之路,搭建到实施上线周期长、投入大、见效慢甚至无疾而终。如果还要考虑业务系统的紧密结合,渠道连接、平台开放等方面也是不能忽视的问题。
        面对各种困难,企业管理者到底应该怎么做才能将问题从根本解决呢?事实上,通过运维管理工具,可以跟踪事件的流程,实现整个IT系统的统一与协调;通过运维管理工具,帮助运维人员监控和定位问题根源;通过知识库的积累可以有效解决人员变更后的管理问题;通过运维管理工具帮助企业快速搭建ITSM。可以说,IT系统不仅仅需要人的运维,为了发挥IT系统的最大作用,利用工具来量化、标准化管理,已经成为企业网络管理的一个趋势,这已然成为一种企业IT管理发展趋势。

结束语
提高整个IT运维管理部门工作效率的最为行之有效的方式就是从整个IT系统的扩展性能、实用性能和集成性能方面出发以全局的眼光来提高整套IT设备的管理从而完成以ITIL理论为基础的全套运维管理系统的设计工作,成为当下相关信息中心研发部门进行研究和改进的重点。

参考文献
[1]张瑞冉.IT服务管理在运维管理中的研究与应用[D].首都经济贸易大学2014
[2]杨小晔.IT运维管理平台的设计与实现[D].北京邮电大学2017
[3]林碧芬.基于信息类型的信息网站设计模式研究[J].福建电脑.2018(11)
投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: