摘要:随着电力技术的飞速发展,电力营销管理业务的范围逐渐扩大,其包括多种业务形式,比如抄表、缴费、电力营销作业、电力故障维修、计量点管理、电力信息服务等。在应用时,由于电力营销系统具有较广的业务分布,并且大量的项目分布分散,业务形式繁多,电力信息采集量大,相邻系统件的耦合关联性比较强。本文对电力营销聚类分析的数据挖掘算法进行分析,以供参考。
关键词:电力营销;聚类分析;数据挖掘
引言
电力营销聚类分析是数据挖掘算法的核心部分,主要任务是用于处理系统大量反馈信息,并作出相应的决策。电力营销系统的数据来源多,主要分为实时采集和调度中心收集的中央数据。因电力营销系统是采用非线性微分方程描述的,会涉及上千个状态变量,为此,采用聚类分析法,对系统进行简约化处理。
1电力大数据平台概述
电力大数据平台,主要依靠的是大数据技术,大数据技术中又包括数据存储、数据挖掘以及数据综合管理等多种技术,能够对海量的电力数据进行深度的挖掘,对有价值的信息进行全面分析,进而为电力营销方案的制定以及业务发展趋势的预测提供有力的数据支持。综合来讲,电力大数据平台主要有四个基本特性,也叫作“4V特性”:(1)规模性(Volume)。指的是电力数据信息量大,其数据流已经从最初的GB、TB级别上升到了PB、ZB级;(2)多样性(Variety)。指的是海量的电力数据信息中存在着几多的种类,既有结构化数据,还存在半结构化和非结构化的数据信息;(3)高速性(Velocity)。电力大数据平台借助数据流来完成数据生成和处理,达到实时高效的效果;(4)价值性(Value)。指的是海量的数据中,隐藏着巨大的价值,有价值的数据能够进一步推动电力行业的发展。
2基本特征
针对大数据的特征分析,其主要表现在:第一,大数据的信息呈现出多元化。在当前的大数据库中,人们基于自己的需求来实现信息的检索,大数据库能够为人们提供企业信息、生活信息、生态建设信息等。第二,在大数据库中,其本身承载了巨大的信息数据资源。为了能够提升信息的处理速度,技术人员就需要在庞大的数据信息库中收集大数据信息,并且做好对应的整理,这样才能够为人们提供一个便利的数据检索平台。第三,大数据本身具有高效性。通过互联网技术的使用,在利用大数据库来进行信息检索的时候,就可以实现对信息的高效获取。第四,大数据本身的信息具有价值性。在处理信息的时候,大数据库能够提供便利条件,并且也可以让人们接触更多信息数据。
3大数据处理方法
3.1数据挖掘算法
MMIS中的数据库通常包含基础数据库、共享数据库以及决策数据库。在对这些数据库的数据类型进行处理时,选择采用决策树算法进行运算的原因在于,这种方法能够处理数据量比较大的数据,能够使用户从大量的数据库中快速选出用户期望的数据。下面对基础数据库进行说明。如图4所示。基础数据库是各个业务子系统中业务信息的重要资产信息,它是建立其他数据库的基础。共享数据库的使用范围比较广,综合性较强,其包含的数据类型也较多。决策数据库使企业决策者执行决策、计算的常用数据。数据库作为电力营销管理系统的核心部分,各级MMIS通过物联网交互数据错综复杂。用户在使用数据时,操作、处理数据的能力显得不足。
3.2随机矩阵理论
在进行了决策树算法之后,能够使用户有效地将不同营销数据类型按照一定的属性选择出来。在输出的数据中,如果要考察不同数据之间的关联性以及不同数据之间的关系,即通过各种数据之间的关联性进行评估电力营销不同大数据之间的关系,则需要对数据进行进一步的研究,因此引入了随机矩阵理论。本文设计的系统还能够统计、分析不同地区MMIS数据之间的联系。
4聚类分析数据类型相异度计算
依据聚类分析原理,筛选电力营销系统数据。为求取聚类数据距离,要对数据对象进行聚类,计算各个数据对象之间距离的相异度。选用n×p矩阵表示,聚类分析数据相异度矩阵是一个对象结构,它是负责存放数据间形成的差异,故采用n×p矩阵表示相异度矩阵。式中,n表示数据矩阵对象,p表示属性,i和f表示对象之间的差异,也可以说是不相似程度。f和i的取值为非负数时,若i和f的取值接近于0,p数值就会越大,此时f和i不相似。f和i的取值为负数时,若f和i的取值小于0,p数值就会越小,说明f和i的相似程度较高。
5聚类分析数据挖掘算法流程设计
(1)先输入数据,数据库的记录是由一条条训练集组成,每一条记录都有一个特定的类标签,将该标签作为输入的经验数据,则具体的样本向量为(v1,v2,…,vi,c),其中,vi表示字段值,c表示类别。完成分类后,要预测准确度,引入决策树算法,这是一种新的ID3算法。用决策树挖掘数据由两个步骤实现,第一步,从数据中获取知识;第二步,利用生成的决策树分类输入数据。再依次测试记录输入数据的属性值,直到找到记录所在的类,挖掘出数据蕴含的潜在信息。(2)再设计数据挖掘算法的基本策略,第一,从单个节点开始;第二,选择的样本均为同一类,树叶代表节点;第三,启发信息选择熵的度量;第四,创建一个分支,用于测试属性中的每一个已知的值,并依据决策树的各个击破方式划分样本;第五,在使用决策算法时,若一个属性出现在另一个节点上,就不需要考虑节点的任何后代;第六,给定节点为一类,剩余节点为另一类,完成数据挖掘算法的基本策略设计后,提出SLIO算法,用户处理离散字段。
3大数据平台下进行电力营销信息化建设的具体对策
3.1高效整合信息资源
将信息技术与电力营销数据结合起来,能够让电力企业即时了解电力市场发展动向,获取到有价值的信息。网络的普及降低了企业获取价值信息的成本,再借助信息技术来完成数据的分析处理,处理过程准确高效的同时,降低了处理成本,能够进一步提升企业的经济效益。因此必须要对大量的信息资源进行高效整合。一方面,电力企业要加大基础设施建设,为信息资源整合打好基础;另一方面要尽快建立起网络系统,借助信息技术来完成数据信息高效整合。
3.2普及掌上电力APP的应用
传统的电费缴纳,需要用户前往营业厅排队缴纳,这种方式既给用户带来了不便,也给工作人员带来了工作压力。如今几乎人人都在使用智能手机,加上网上支付功能的普及,推广掌上电力APP能够拉近与用户之间的距离,用户可以直接在APP的缴费页面完成电费缴纳,进一步提高缴纳效率。让用户方便的同时,还缓解了人工压力,有效避免了工作人员操作失误造成的损失问题。这同时也为企业节省了更多的人工成本,提升了利益空间,进一步促进了企业电力营销信息化发展,让电力营销信息化平台的建设发挥实效。
结束语
以往所使用的电力营销聚类算法,很难给出恰当的决策,且挖掘速度慢。而本次提出的基于电力营销聚类分析的数据挖掘算法计算了事先给定的聚类数据,可以有效提升数据类型的聚类性。聚类算法是数据挖掘中常使用的算法,可以对数据挖掘结果进行合理的分析。
参考文献
[1]庞建军.基于大数据的电力营销管理分析[J].集成电路应用,2020,37(01):110-111.
[2]陶丽君.基于大数据的电力营销管理创新分析[J].通讯世界,2019,26(12):201-202.
[3]蔡春育.大数据在电力营销中的应用现状[J].通讯世界,2019,26(12):222-223.
[4]何俊智.基于大数据分析的电力营销管理研究[D].电力大学,2018.
[5]段艳萍.大数据的电力营销管理创新对策[J].低碳世界,2017(16):111-112.