运维大数据和智能运维在电力行业的实践

发表时间:2021/6/25   来源:《中国电业》2021年3月7期   作者:邵艳民
[导读] 随着信息系统规模的不断扩大,各类 IT 系统的数据信息爆炸性增长
        邵艳民
        国网山东省电力公司东明县供电公司 山东 东明 274500
        摘要:随着信息系统规模的不断扩大,各类 IT 系统的数据信息爆炸性增长。如何采用最新的信息技术有效挖掘运维数据、提升运维的效率和服务质量,降低运营成本和风险是企业不变的挑战。基于所分析的数据,生成配电网差异化运维策略预案,并通过预案落实及实践反馈不断优化策略,为今后配电网精准运维管理提供了参考。
        关键词:运维;大数据;智能运维;电力行业
引言
        随着科学技术的发展,智能数据得到了人们的广泛重视。智能数据就是将物品与信息的传感设备通过互联网进行有效的结合和连接起来,在电力通信网中适当加入智能数据的相关技术,可有效地去除电力通信网中的人工阶段,促使电力通信网可以有效地使用计算机网络进行更好的交流和沟通。在电力通信运行维护中,其质量不仅关系到工程的整体质量,还对后续服务产生直接影响,影响到电力系统通信自动化系统的稳定运行。随着电网对电力通信数据要求的不断提升,必须提升运行维护质量,以促进电力通信数据的稳步发展。因此,强化电力通信运行维护质量具有非常重要的现实意义。
1配电网运行存在问题分析
        根据故障统计数据信息,以省级公司为单位,省级单位所辖供电公司,以及各地市级供电公司所辖区、县级供电公司实现年度、季度、月度与周度存在问题分析。1)通过故障设备类型、停电次数、复电时间、故障发生季节(月份)与时间、故障时气象信息、负荷波动信息等生成各种停电因素之间的关系,例如设备、停电次数与复电时间的关系曲线,搜索复电时间长的故障频发设备,并输出设备相关台账,记录设备厂家等信息,为后续线路改造、检修、针对性运维、季节性维护等策略的制定提供依据。2)通过故障产生的原因,获取所选区域常见的故障类型,例如,用户自维设备引发故障、外力破坏等,筛选问题较为严重的几种故障原因,作为后续运维策略生成的重点依据。
2配电网运维策略执行层实践反馈与策略优化
        在运维策略的执行过程中,可以根据不同区域的现状对运维策略进行进一步细化与反馈优化,以实现差异化、精准化、高效的运行维护。例如,结合配电自动化、故障指示器等信息,自动隔离故障或准确发现故障存在的线路范围,并根据负荷转供实时数据以及线路与设备台账信息综合判断能否派遣不停电作业或进行停电维修。另外,根据以往的故障信息,结合供电负荷重要程度、天气信息等,生成线路短期运维巡检方案,以便派遣巡线人员开展针对性查缺,避免故障发生。
3 数据源开源反馈实现定期预警
        随着PMS、配电网运行管理等系统中数据,特别是故障数据的更新,可以定期更新以上步骤生成新的运维策略预案,一旦发现与已经生成策略预案不同,发现了新的严重问题线路或设备,就可以进行预警,引起管理与运维人员的关注,按需进行运维策略的局部修正。
4监控数据采集
        即运维监控数据的获取,对业务质量的监控和告警。在构建立体化监控的过程中,收集数据并非最终目标,挖掘数据的价值才能体现运维价值所在,一般运维对业务质量保障的定义为几个维度。(1)监控,主要关注覆盖率、状态反馈、指标度 量。监控需要从底层硬件到上层软件应用全覆盖。(2)告警,关注告警及时性、准确性、关联性等。业务越来越复杂,每一个监控点都会产生数据指标、一个点状态异常可能造成海量重复告警。通过引入算法有效分级、追踪、关联、收敛、抑制,是智能告警的重要一环。结合CMDB中运维对象的关联关系,以面向业务的视角,将低层次的指标收敛为高层次的指标,实现技术运营数据的价值挖掘。(3)运营,根因分析、事件管理、统计报表与考核。通过事件管理机制保证 RCA 落地,通过报表和考核推动运维优化提升。


5运维作业实施
        日常运维作业实施包括运维工具箱、任务调度等功能,批量作业实现减员增效的同时降低风险。其中包括两个亮点。(1)故障自愈。根据告警事件、故障诊断的结果的输出,按规则触发标准变更自动化作业的过程,全程无须人工介入。(2)基线偏离预警。不同于传统的固化的阈值报警体系,通过对各个系统运行指标采集自动采集,动态设定系统正常运行的“基准线”,对于基线偏离主动预警、防患未然。
6运维数据分析和可视化
        数据中心大量信息系统以及各类平台、主机、服务器、网络设备、安全设备、数据库在运行过程中会产生大量的运行日志、安全日志和行为日志。因此,需要建立相对完善的数据模型以便提升分析能力,包括相对成熟的存量数据信息的统计分析技术,以及未知数据信息挖掘和学习预测技术。后者发展非常迅速,在互联网行业应用广泛,但针对电网企业数据中心运维场景还存在具体落地应用的挑战。运维数据对于专业 IT 运维有规律可循,但对于业务人员如何简洁、高效呈现数据信息的规律和价值则更为关键。数据信息的传递和沟通是数据可视化的重要目标。借助计算机图形图像处理技术,将数据转化为各类图表在大屏幕呈现是传统方式,借助最新的游戏技术甚至VR技术还可以实现人机数据交互处理。数据库中的数据项不再是冷冰冰的单个图元属性或平面的数据图像,可以多维度检索、观测、分析。
7 配电网运维策略预案落实及实践反馈
        配电网运维策略预案由市级供电公司下发到各级区域供电公司,由各级公司根据现场实际情况、年度投资计划、供电可靠性指标等因素形成各自的配电网运维策略,并反馈至市级供电公司备案。以某县域农网为例,按照运维策略要求,已经针对故障频发最多的10 kV KLM线进行了改造,对用户自维设备引起故障较多的10 kV DW线加装了用户产权分界开关,截至2020年6月,发生3次故障,同比减少62.5%。另外,原计划执行春季检修的线路,由于2020年新型冠状病毒疫情的影响没有全部开展,但按照运维策略的计划,优先开展了10 kV YD线的检修,发现5处缺陷,降低了故障风险。未完成的计划检修线路,反馈到本系统,系统将其改为针对性检修线路并提高优先处理等级。例如,10 kV KST线原计划为春节优先检修线路排序第三位,同时也是针对性检修线路中的第四位,通过本次的反馈,系统将其原来在针对性检修线路中的排序提升至第一位。
8故障预测模块
        该模块能够根据过去某一时间点到当前时间点的原始系统数据以及事先设计好的预测模型,对未来可能出现的早期故障进行预测,并且能够存储并显示早期故障信息,向运维人员发送通知[1]。为实现该模块的相关功能,设计者首先需要在该模块中进行预测配置,具体的配置内容主要包括数据的粒度、数量的量以及选取特征的数量。
9状态监测与诊断模块该模块
        负责对设备可能存在的故障进行检测,以故障参数的特定阈值为根据,对比设备经过检测后所得到的参数指标,若该参数指标超出预先设定的阈值范围,则判定该设备存在故障。在实际的检测过程中,每一项数据的走向和趋势均会一定程度上影响到最终的诊断结果,并且无法借由单一数据对系统状态进行判断[2]。因此,本次研究决定采用神经网络来对系统判断进行监测,所使用的神经网络模型为 Self - Organi-zing feature Map,在通过该模型实现阈值判断的同时,也能够实现更高可信度的故障诊断,并且可以导出故障的各类、位置等重要数据
结束语
        针对目前配电网现状情况掌控不清楚,运维效率低,可靠性提升效果不明显等问题,研发配电网运行情况分析及智能运维决策生成系统。基于配电网可靠性提升差异化实施的思路,通过长期的投入,改善网架、设备、电源等基础问题,并通过运维检修来快速改善由故障引起的停电,提高供电可靠性。

参考文献
        [1]徐小勇,李敏,王静,李刚.大数据智能运维平台[J].通信电源技术,2020,37(02):51-53.
        [2]陈建译.电务大数据智能运维平台研究与应用[J].铁道通信信号,2019,55(S1):162-166.
投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: