基于告警信号文本挖掘的电力调度故障诊断

发表时间:2021/3/16   来源:《中国电业》2020年第30期   作者:聂倩
[导读]
        聂倩
        内蒙古电力(集团)有限责任公司锡林郭勒电业局苏尼特左旗供电分局 内蒙古自治区锡林郭勒盟 011300
        摘要:电力系统故障过程中会产生与故障相关的报警信号,电力调度需要快速响应这些报警信号。据统计,某省电力调度中心调度系统平均每天接收30万个报警信号。调度员在短时间内收到大信号量时,很容易错过重要的报警信号。调度员很难在短时间内根据经验做出准确的决策,故障处理效率低,可能会扩大故障,不利于系统恢复。如何对故障后的告警信号进行文本信息挖掘与归类,利用归类的告警信号进行快速有效的故障诊断,已经成为电力调度领域有待研究和解决的重要问题。含有大量专业词汇,并夹杂着数字与特殊符号,具有难以分词和语意模糊的问题。
        关键词:电力调度;文本挖掘;向量空间模型;支持向量机;
        电力调度系统在电力系统故障过程中会收到大量告警信号,若调度员无法在短时间内做出决策,则可能使故障扩大,为此提出基于告警信号文本挖掘的电力调度故障诊断方法,该方法包括告警信号文本预处理和故障诊断2个阶段。在第一阶段,基于隐马尔可夫模型(HMM)对告警信号文本进行分词并去除其中的停用词以构建本体词典,并采用向量空间模型(VSM)使文本向量化;在第二阶段,使用滑动时间窗读取实时告警信号,提出一种2层算法,第一层采用支持向量机(SVM)对滑窗内的告警信号进行分类,若分类结果判断为发生故障,则启动第二层后一均值聚类法提取较高可能性的故障供调度员参考。以某电力调度系统实际告警信号作为算例,验证了所提方法的可行性。
        一、电力调度告警信号与故障样本
        1.电力调度告警信号。电力调度告警信号为中文短文本,可分为发信时间、发信地点、信号内容、状态信息四部分,其中信号内容为非结构化中文短文本,包含信号中的大部分信息。
        2.电力调度故障样本。电力调度故障样本是指按故障类型分类的告警信号集合,分为故障描述和故障相关告警信号两部分,故障样本反映了某一类型的故障和相关告警信号之间的对应关系:一旦相关告警信号出现,就表示发生了此类故障。
        二、电力调度故障诊断
        1.基于告警信号文本挖掘的故障诊断流程。故障诊断阶段流程如图1所示,为了叙述方便,后文将故障样本的告警信号簇映射的向量简称为样本向量,滑动时间窗内实时告警信号映射的向量简称为实时向量,余弦相似度简称为相似度故障诊断算法分为2层进行,可以避免相似度的阈值设定问题。

        在常规诊断方案中,需要对相似度设定一个阈值,通过判断每次计算结果中的最大相似度是否超过阈值来判断是否发生故障以及发生故障的类型。然而在实际应用中,相似度的最大值随实时向量的不同而波动范围很大,使得这类设定阈值的诊断方案因不够灵活而存在一些问题。例如在某些极端情况下,电力系统同时发生较多故障,此时最大相似度很可能会低于按常规情况设定的阈值,便无法准确判断出故障发生。提出2层故障诊断算法,先根据故障和非故障情况下相似度向量在向量空间中的分布情况判断是否发生故障,再根据发生故障的相似度向量中所有相似度的分布情况判断发生的故障类型,该算法较阈值设定的方案更为准确高效。
        2.实时告警信号向量化。本故障诊断方法通过构建滑动时间窗读取电力调度系统接收到的实时告警信号,滑动时间窗随时间向前滑动,读人其中的所有实时告警信号。滑动时间窗的时间窗口为tw,滑动步长为ts,且tw,ts<tw为了保证实时性,时间窗的截止时刻t2为调度GPS对时系统确定的当前时刻,起始时刻t1=t2一tw相比于时间窗口无重叠的后移,引入滑动机制可以尽可能避免时间窗切分同一故障的实时告警信号簇,从而使故障诊断更准确。其中tw1、tw2、tw3为滑动时间窗按时间顺序滑动到的3个位置,时问轴上的字母表示各时段接收的实时告警信号。假设C、D、E、F为某一事故的实时告警信号簇,若时间窗无重叠后移,两相邻时间窗tw1、tw3,都将切割实时告警信号簇;引入滑动机制后,时间窗滑动到tw2时将读入该事故完整的告警信号簇,提高后续故障诊断的准确性。考虑到电力系统的故障发展很快,调度系统运行数据显示,同一故障的所有告警信号往往在10 S内就发送完毕,所以tw的取值不宜大于10 S;考虑到滑动时间窗内包含某一故障的实时告警信号越多,故障诊断越准确,所以ts的取值不宜过小。ts的取值应小于tw,且大于计算机运行一次故障诊断算法所用时间,ts越小故障诊断越准确,但故障诊断算法运行次数越多,消耗的计算资源越大。实时告警信号向量化是指将滑动时间窗中的实时告警信号用VSM映射到向量空间中,形成一个向量。首先读取滑动时间窗内的所有实时告警信号,需要注意的是,当有故障发生时,滑动时间窗中除了含有大量故障相关告警信号,往往还含有少量故障无关告警信号,这些故障无关告警信号所占比例较小,对故障诊断结果没有影响,因此在实时告警信号向量化时没有剔除这些信号。当算法确诊目前正在发生故障样本中的故障后,将滑动时间窗中的实时告警信号与正在发生的故障对应的故障样本中的告警信号进行比对,筛选出故障无关告警信号方便调度员查看。
        3.余弦相似度计算.设故障样本总数为m,本体词数(即向量维数)为n。定义实时向量与第i个样本向量的相似度为si,计算方法为:
        
       
        4.SVM分类.SVM在解决小样本、非线性和高维模式识别问题中表现出特有的优势。采用SVM判断当前是否发生故障,SVM的核函数采用径向基函数RBF(Radial Basis Function)。观察发现故障时的相似度向量(正样本)和无故障时的相似度向量(负样本)在较高排位处的数值存在差异,即正样本在较高的排位倾向于出现更高的相似度。故SVM的输入特征为各排位对应的相似度数值。选用200个正样本和200个负样本参与SVM的训练和测试。为评估训练效果,采用留一法进行交叉验证:每次训练选用399个正/负样本作为训练集,剩余的1个正/负样本作为测试集;如此迭代400次,使得每个正/负样本都能用来测试SVM模型。这个过程相当于对同一个SVM模型迭代训练了400次。这里分别用P和n表示正、负样本集,用TP、TN、FP和FN分别表示真阳性、真阴性、假阳性和假阴性集。
        5.k一均值聚类法聚类。经过对大量故障时的相似度向量S各维坐标sj的统计分析发现,故障时sj的分布趋向于3类:第一类为实时向量与不相关样本向量的相似度,相似度很低;第二类为实时向量与相似样本向量的相似度,相似度较低;第三类为实时向量与当前故障样本向量的相似度,相似度很高。其中,相似样本指与当前故障相似的故障样本,例如,当前故障为某线路A相跳闸,一个相似的故障样本为该线路B相跳闸。
        总之,提出了基于告警信号文本挖掘的电力调度故障诊断方法,该方法具有如下特点。依靠对电力调度告警信号进行文本挖掘实现高效快速的故障诊断,不依赖电气量计算,无需电力系统结构信息和保护动作逻辑,能较好地适应现代电力系统结构多变的特点。告警信号文本预处理阶段构建本体词典,对告警信号进行分词并去除停用词,使用VSM将告警信号簇映射到向量空间,实现告警信号文本向量化,为电力系统文本信息处理提供了方法,构建的本体词典也可用于电力系统其他自然语言处理过程。故障诊断算法分为2层:第一层使用SVM,判断是否发生故障,若判断结果为发生故障,启动第二层算法判断发生何种故障,使用k一均值聚类法提取较高可能性的故障供调度员参考,算法逻辑清晰,诊断结果准确可靠。
        参考文献:
        [I]严航.能电网变电站集中监控告警专家处理系统的研究与应用.2018.
        [2]王新宇,关于基于告警信号文本挖掘的电力调度故障诊断.2019.
投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: