智能电表故障大数据分析探究 左勇

发表时间:2020/7/15   来源:《电力设备》2020年第7期   作者:左勇
[导读] 摘要:电力行业贸易结算智能型电表功能繁多,其多样化的种类也带来了各式各样的故障类型。
        (安徽南瑞中天电力电子有限公司  安徽合肥  230000)
        摘要:电力行业贸易结算智能型电表功能繁多,其多样化的种类也带来了各式各样的故障类型。所有机器都会因为时间而出现老化等问题,智能电表也必例外,时间越长所发生的故障的可能性越大。 本文分析和总结了智能型电表的故障类型和发生概率的数据,探讨了智能型电表数据仓库模型的建立,并提出了智能型电表质量评估和故障预测的方法。
        关键词:智能电表;故障分析
        前言
        随着智能型电表供应商不断增加,设备芯片的选择及制造工艺因每个供应商而异,故障类型可能会有所不同。智能型电表中常见的故障有工作质量故障、外部因素故障、自然灾害故障及设备质量故障四种类型,通过我们的比较发现,占比较为多数的是设备质量问题,有许多可以人为控制的因素,需要进一步研究设备的质量不良。设备质量故障包括外观故障、测量性能故障、软件故障等10多种。 由于一些操作人员缺乏检测能力,故障发生时,许多维修人员没有能力修理各种类型的故障,因此可能会出现一些问题,例如目前行部费用失衡、故障清单维修延误等。
        一、故障属性选择算法研究现状
        1.从属性上看
        全国智能型电表故障数据表载有安装地区、供电单元的设备类型、设备规格、通讯方式、供应商等。由于这些数据是分类数据,需要转换成二进制变量并输入到机器学习算法中,而且每个字段都有数十到数百个属性类别,因此二进制转换后的数据包含许多属性和记录,导致算法处理效率低下的原因。正常情况下,模型的准确性非常重要,为了保证它的准确性,以及提升分析能力,属性选择的方法被用来消除不相关的属性。
        2.故障的表现
        在数据挖掘和机器学习领域,实际问题往往涉及许多属性。不过,并非所有这些属性都适用于机器学习模型的建立,它们具有冗余性和无关性,在一定程度上,使得智能电表在反映上会出现滞后和不灵敏,能够从传统属性集合中选择相对的办法进行解决,加快学习算法的进程,简化学习模型,提高模型性能。属性配置方法不仅可以选择属性的一部分,还可以降低数据维度,属性配置方法可以在原始属性集合中构建新的属性。
        3.面临的挑战
        属性选择的主要挑战是它的复杂性,因为最佳属性子集是遍历搜索,如果数据集具有 n 个属性,则是所有属性的组合,因此它的高度复杂性,那么可能的解决方案是2的n次方。随着更多智能型电表数据的收集,从数据中过滤有效信息将是一个更大的挑战。 在大多数情况下,重复的最佳属性子集是不可能的。 因此,在属性选择中使用了随机搜索、电脑搜索、启发法搜索等多种搜索技术。 然而,许多这些算法很容易陷入局部极小或成本高的问题。 目前,属性选择方法分为包装、过滤和嵌入式三大类。包装方法使用属性子集训练模型,并根据模型的性能评估属性子集的有效性。可以用来为特定模型找到最好的属性子集,但由于需要训练许多模型,复杂度往往很高。过滤使用属性和标签相关指数来选择和预测最相关的属性,这种方法使用一般指标——相关系数、相互信息、点和相互信息来计算各个属性和目标的相关度。

由于不涉及学习过程,不包括特定的模型,因此这种属性具有通用性,但与包装方法相比性能略逊一筹。 嵌入主要依靠模型的训练,在不同属性中使用不同算法,根据不同算法分出不同的重要程度。
        二、不平衡多分类算法研究现状
        1.应用范围
        数据驱动的机器学习算法在许多领域得到了广泛的应用。比如防止银行诈骗的欺诈检测系统,智能垃圾邮件识别系统,包括: 从大量的垃圾邮件和用户反馈中学习有效的分类器;广告系统使用机器学习算法以广告为目标用户进行准确地匹配,推荐系统发生学用户的历史点击行为和兴趣爱好,可以提高点击率,合理使用算法,从而挖掘大数的有效模型。
        2.不平衡分类现状
        类别分类是数据挖掘和机器学习中最重要和最常见的任务之一。 支持向量机、决策树、 knn、神经网络和贝氏网路等一般的分类算法得到了广泛的应用。在分类任务中,函数一般被认为对每个类别具有相同的权重; 模型偏向于样本较多的类别,少数类别的准确程度不高,例如金融诈骗被发现时,成本高昂的这种情况在百万次金融交易中只会发生一次,但可能会造成巨大损失, 缺乏低频率问题类别的样本数据是不平衡研究的一大挑战。
        3.解决问题探索
        在过去十年中,虽然许多机器学习方法已经被提出来解决不平衡的数据分类问题, 其中大部分都是基于取样技术、成本灵敏度高的学习、综合学习价值方法。 利用重复取样技术对不平衡的数据进行预处理,该方法包括: 可以重新平衡不平衡的数据集的样本空间、可以减少学习过程中失真度的分布,因为它独立于分类器。常用的重新采样方法可以分为三种类型: 过采样、欠抽样 混合取样。这些重新取样方法中的每一种都可以按任何速率进行取样,但是 ,少数类和多数类之间的完全平衡并不是最佳的,提议为不同的数据大小设置不同的样本速率, 一篇论文试图自动确定不同的不平衡率和问题的最佳样本速率。如果大多数类具有大量的样本,那么多数样本可以减少算法的复杂性,因为多数样本可以减少 如果大多数类别的样本很少,过采样方法被认为是更好的选择;如果样本数量过多,可以同时使用这两种方法。
        因为作为噪声废弃的不少,所以如果能够去除属性空间中不相关的属性, 问题会得到缓解。对成本敏感的机器学习方法也被广泛应用; 对少数错误类别的类别赋予较高的成本,对多个类别赋予较低的成本,成本敏感的方法包括: 在合数级别的重采样、属性选择和算法级别处理不平衡的数据。 基于算法层次的不平衡算法有积分法和基于目前方法变化的不平衡算法。
        结束语:
        随着电表智能化和国民经济水平的提高,电力信息采集系统的覆盖范围不断扩大。智能型电表供应商多达数百家,规模从小到大各不相同。 在大量智能型电表投入实际使用后,智能型电表发生故障的频率高于非智能型电表,安装后的高发电周期为2~5年,给电网带来了巨大的财力和人力资源的消耗,从而增加了电网的运作成本。
        参考文献:
        [1]范少华. 基于大数据分析的智能电表故障预测技术研究[D].北京邮电大学,2018.
        [2]贺宁.智能电表故障大数据分析探究[J].中小企业管理与科技(上旬刊),2016(07):142-145.
投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: