戎立民
身份证号:37148219841121****
摘要:随着信息化建设的不断推进,使得作为信息承载的主体-数据中心本身的运营管理变得越来越重要,工作量越来越大,对安全性、可用性和运维管理等要求越来越高,数据中心的运维也就逐渐经历了多次演变优化并将其概括分为四个阶段,包括基本的人工运维,以工具及流程来驱动人工的标准化运维,通过预设逻辑实现的自动化运维,通过辅助分析实现的智能化运维。
关键词:数据中心;智能化;运维
引言
伴随着移动互联网发展的热潮,超大型数据中心日益增多,如何趁势而上,领航新基建,做最智慧的数据中心值得我们不断探索。总结智能化系统在维护优化过程中的经验,探讨智能化系统围绕“自动、可靠、节能、智慧”的运维目标,在规划、建设及运维等环节需要关注的要点。
1数据中心运维目标
数据中心运维目标是通过建立规范先进的运维服务体系,充分发挥数据中心的基础服务功能,为在数据中心进行信息系统建设与部署、日常运行、及回收提供全生命周期的资源、通信及安全等服务,实现IT的业务价值,提升数据中心用户的满意度。运维体系要具有前瞻性的风险预测能力、智能动态服务能力、人工智能决策能力。为确保数据中心安全稳定的运行,数据中心的运维管理主要针对数据中心的合规性、可用性、可靠性、经济性而建立起一套完整科学的管理体系,从而使整个数据中心运维工作具备规范的管理章程,严格的管理制度,高效负责且训练有素的运维团队是数据中心运维成功关键;而从大型数据中心的长期运营角度考虑,持久改进与有效的成本控制是一个现代化数据中心科学管理的必须。
2系统架构
超大型数据中心的智能化系统一般是由基础设施管理系统(DCIM系统)及多个监控子系统组成,各监控子系统独立运行。监控子系统通常可分为动环监控系统、空调群控系统、智能配电系统、安防系统、视频系统、消防系统等。DCIM系统因数据中心大型化、规模化、智能化发展需求及客户管理需求,逐渐成为超大型数据中心的标准配置。DCIM系统数据来源与各监控子系统。各类客户自有监控平台提出的基础设施对接需求,也会通过DCIM系统统一对接,减少各监控子系统接口对接工作量。
3大型数据中心智能化系统的运维优化
3.1加强资源管理智能化及精细化建设水平
对于企业网络运维工作来讲,资源管理工作最主要难题就是资源管理数据不精确,而且也无法实现资源数据的动态管理,所以也在进行资源数据的应用时,应用效果也会大大降低。久而久之,这种恶性循环会导致参与网络运维工作中的各级作人员,对资源数据的维护工作积极性大大降低。所以也基于大数据背景,应当在智能运维体系当中增资源自动发现引擎,改变过去传统的资源数据录入模式,将人工录入转变为自动检索录入。通过这种方式使企业网络运维工作中,资源数据能够始终处于动态更新的水平,各项资源数据和网络情况能够高度吻合,企业在开展各项业务工作时能够得到更加精准的数据,而且使各项业务能够得到快速开通。在此基础之上增加生产流程,能够使运维体系所收集到的资源融入到企业所开展的各项生产运作任务当中,这样能够使数据资源的流通性以及应用效果大大提升。除此之外,需要对资源配置进行自动化实现,将资源调配及配置过程中的标准化以及自动化作业完全实现,降低人工作业以及因此而导致的人工影响因素出现。
3.2对工作环境进行优化
企业需要密切关注自身的信息运维管理模式,要对数据研究进行全面、科学、合理的详细分析,并要求有一套具有科学知识的最终决策体系,以保证后期项目的顺利进行。
平时要积极开展与数据中心运维管理的相关工作,做好数据工作环境的优化,工作人员要学会观察业务环境,然后找出环境与各种信息系统之间的关系。例如利用网管软件进行综合优化是大数据平台运维应用的关键,在各类网管软件的应用中,需要将相关的设备管理模式层和监控层有机结合起来,能在很大程度上提高信息设备管理的工作效率,实现网管应用软件的集成。在各个环节的实际操作中,数据服务器系统和应用技术能够有效地结合在一起,并显示在主用户界面上,有效实现超视距协同管理,基本保证了相关信息软件系统整体运行的高效。
3.3部署网络管理系统
企业局域网的规模会随着企业的不断发展持续扩大,而随着局域网规模的扩大,服务器、交换机等设备也会随之增多,使得网络管理工作量不断增加。为了有效地实施高效率的网络管理,在企业局域网中部署网络管理系统,就显得十分必要了。在网络管理系中,通过可视化的网络管理操控界面,能够使网络管理人员对于企业局域网中的各种设备,进行随时的监控。通过对于局域网设备的整体性监控,能够及时发现具体设中出现的各种问题以及故障,从而更加便于网络管理人员进行解决。同时,网络管理系统还能够利用自动故障排除的功能,对于企业局域网中的轻微故障,进行相应自修复,从而大大减轻了网络管理人员的管理工作量。最后,网络管理系统还能够对于企业局域网的运行状况进行科学分析,并为网络管理人员提供直观的视图,帮助络管理人员一目了然地把握企业局域网的运行质量。
3.4建立健全的信息管理制度
为了有效地保证计算机网络运维系统的可靠性和安全性,有必要建立一个相对完整的信息管理系统。信息管理系统的内容分析主要包括以下几个方面。验证用户的身份,必须使用实名系统来科学有效地验证用户身份,并且只有通过确保用户身份的可靠性和特征,才能保证运维系统的安全性。其次,有必要建立保密系统以有效防止个人生活的泄露问题,特别是对用户信息的个人保护是必要的。最后,还应有效地保证安全管理的标准化,相关负责人按照有关标准和要求严格执行运维系统的标准化运行,以改善系统的安全特性,有效防止系统漏洞,有效地保证系统的稳定运行。除了当前的计算机系统,还需要进一步改进和完善服务机制,以确保用户信息的可靠性和安全性。另外,有必要授权用户使用相关技术,以确保信息的完整性、可靠性、安全性。还必须严格检查系统上的所有类型的信息,如果发现问题信息,则必须及时解决。只有这样,运维系统才能正常、稳定、可靠地运行。
3.5完善合规运维体系,保障系统平稳运行
在集中式运维管理模式下,通过建立安全、完善的合规运维体系,创新运维技术手段,规避运维过程中的违规操作风险,逐步实现运维过程从经验式到标准化的转变,最终保障应用系统的平稳运行。通过构建运维管理一体化平台,利用其完善的监控、审计、调度等功能,有效防范运维操作风险,减少人为误操作,逐步构建系统问题快速反应、快速分析、快速处理的运维响应机制,实现系统运行风险的降低,提升系统业务连续性保障水平。
结束语
过对超大型数据中心智能化系统及组网的运维优化,提升了智能化系统使用的便利性及安全性,挖潜智能化系统的潜能。通过运维优化探讨,从运维前置的角度,帮助数据中心建设队伍更好地把握智能化系统建设要点。功能丰富、高可靠性的智能化系统,必将成为超大型数据中心运维人员重要的助手,发挥重要的作用。
参考文献
[1]杜有翔,付渲理,明丽洪.数据中心IaaS层云化架构设计和应用研究[J].中国管理信息化,2019,22(24):56-58.
[2]赵刚,杨大雷,朱献忠.设备远程智能运维平台架构设计探讨[J].宝钢技术,2019(06):27-30.
[3]陶浩.高校数据中心机房设计与实践[J].信息与电脑(理论版),2019,31(23):214-216.
[4]肖鑫.数据中心基础设施检测技术发展前景展望[J].智能建筑,2019(12):33-35.
[5]郝峻.数据中心基础设施智能运维探讨[J].电信技术,2019(11):51-55.