张雨
国网福建省电力有限公司连江县供电公司 福建福州 350500
摘要:现阶段,电网故障所表现出特点,主要是种类多且成因复杂,难以做到准确预测抢修时长。以深度学习为代表的先进技术的出现,使相关人员经由反馈工单对所需信息进行挖掘成为可能。文章便以此为背景,结合反馈工单及相关指标,利用模型对抢修时长进行了预测,预测过程可分为三步,首先是清洗故障数据,其次是分析故障数据、明确影响因素,最后是基于融合模型,通过对预测结果做加权运算的方式,得出最终结论。事实证明,将多个模型融合,可使预测准确性得到显著提升,有推广价值。
关键词:抢修时长;电网故障;融合预测模型
前言:分析并预测电网故障是推动电网智能化发展的关键。电网常见故障类型及成因较多,对故障、抢修时长进行预测的难度有目共睹。在智能电网建设完成且投入运行的当下,被赋予理想自动化水平的电网调度,为信息高效采集提供了支持,基于此,大量学者选择对预测电网故障的算法进行研究,这也使本文所研究课题具有了更坚实的理论基础。
1某地故障抢修记录
本次实验所用数据由PMS2.0平台、FPMS系统、用电采集系统、SG186系统提供,载体为反馈工单,主要记录了某地2020年至今的抢修数据。上文所提及工单的生成分两步,第一步是由抢修人员负责将数据输入系统,第二步是通过格式化处理的方式,得出最终结果。此外,研究人员还对抢修人员、故障发生时间等因素进行了采集与分析,明确上述因素与抢修时长的关系,为日后的预测提供便利。
可能使抢修时长受到影响的因素较多,研究人员出于全面掌握相关因素的考虑,决定对人为因素、环境因素及其他因素进行综合分析,既有抢修队和抢修人员等人为因素,天气和温度等环境因素,还有故障类型、出现时间及具体位置[1]。通过分析可知,气温和抢修时长的关系极为密切,当然,可给抢修时长带来影响的因素,还有气温、出现时间等,其中,最应当引起重视的因素为出现时间。研究人员以此为切入点,根据出现时间对故障进行分类并归纳,得出结论如下:白天对故障进行抢修的时长,通常较凌晨以后的抢修时长更短。在预测抢修时长时,研究人员应对此引起重视。
2抢修时长预测方法
2.1建立集成学习模型
在很长时间内,机器学习领域所用模型均为集成学习模型,该模型强调以弱学习算法为开端,通过反复学习的方式,获得大量弱分类器,随后,通过组合弱分类器的方式,得到性能理想的强分类器。
.png)
2.2建立深度学习模型
由神经网络衍生出的深度学习模型,现已被广泛应用于智能领域。前馈神经网络各层神经元为全连接,层内神经元均为独立存在,无法处理依赖性较强的序列数据。循环神经网络可被用来对序列关系进行保存,但存在训练算法有限的不足,导致问题出现的原因,主要是梯度爆炸及梯度消失。深度学习模型以循环神经网络为基础,强调利用门结构对细胞状态加以控制,随着消失梯度问题得到解决,训练算法更加稳定且可靠。
LSTM所用门结构如图1。在图1中,x代表输入数据;f代表遗忘门输出;o代表输出门输出;h代表输出结果;c代表记忆单元对应数值。由此可见,该模型输出数据和当前状态、上一个状态间,均存在着密切联系。
.png)
上述计算式分别对应遗忘门,输入门,输出门,计算式4至计算式6为更新细胞状态,计算式6对应最终输出数值。门结构基于t时刻对记忆单元上一时刻所输出ht-1、当前时刻所输入xt,结合权重矩阵w与偏置向量,确定可被用来筛选数据的函数值,该函数值的取值范围是0至1[3]。计算式1至计算式4的·,通常指代矩阵内积;计算式5、计算式6的×,指代乘法运算。本次实验计划利用LSTM预测抢修时长,在对历史数据进行学习的基础上,给出未来数据。
2.3建立融合预测模型
融合预测模型在预测抢修时长前,需要先清洗特征数据,确保异常数据可被尽数排除。随后,再利用相关数据建造特征工程,确定各模型适用数据,基于特征数据建立模型。建模期间,该模型可逐个调整模型参数,确保输出结果最优。待上述操作告一段落,方可经由加权求和运算,得出最终数据。
3预测结果分析
由抢修人员输入反馈工单数据存在明显异常,实验开始前,先要清洗异常数据,清洗结果如下:原始总数据为201012,过滤6h以上数据为193444,过滤24h以上数据为200710;时长标准差的原始数据为287.80,过滤6h以上数据为56.42,过滤24h以上数据为129.12;平均时长的原始数据为67.80,过滤6h以上数据为42.52,过滤24h以上数据为61.87;最大时长的原始数据为43617,过滤6h以上数据为43617,过滤24h以上数据为1349。
由上述数据可知,原始数据最大值约为30d,异常数据的存在,给标准差合理性带来了影响,只有将异常数据排除,才能使预测结果具有参考价值。将6h以上数据排除后,标准差明显下降,这表明清洗异常数据,可降低模型提炼数据规律的难度,使其准确率更接近预期。
研究人员出于提升预测精确度的考虑,决定将计算单位调整为15min,利用MAE重新进行计算。经过训练的模型,可基于测试集数据加以验证。训练模型的过程可分为两步,先是训练单个模型,再是进行参数调优。通过实验能够看出,单个模型所取得预测值往往与实际值存在差异,因此,在模型训练完毕后,研究人员决定以预测权重为依据,将单个模型融合。为明确各模型所具有预测性能和实际需求契合度,研究人员提出利用MAE评价预测结果的方法,现将各模型所存在误差归纳如下:
结论:在智能化、信息化水平持续提升的当下,对电网信息进行采集的系统也趋于完善。现有研究普遍以电网故障预测为主,抢修时长鲜有涉及,笔者以有关部门提供工单为依据,在对可给抢修时长带来影响的因素加以分析的基础上,借助既有模型确定可被用来预测抢修时长的模型,结合实验结果对预测数据做加权融合运算,最终结果表明,多模型融合所提供数据更符合真实情况,具有参考价值。
参考文献:
[1]张晓华,任先成,冯长有,等.交直流混联电网连锁故障特征事件智能溯源及预测方法[J].电力系统自动化:1-8.
[2]刘威.基于Ansible自动化运维的信息系统故障预测技术[J].电子技术与软件工程,2020(01):90-91.
[3]余梦天,熊炜.计及冲击风险及分布熵的电网连锁故障预测[J].电力科学与工程,2019,35(05):19-25.