张睿
华北电力大学,北京,中国,102206
【摘要】电力体制的改革导致电力市场走向市场化和智能化,供电企业将面临着日益激烈的市场竞争,所以要比以往更加注重市场意识,更加注重客户需求,这就要求更详细的用户行为分析。本文针对用电行为分析,针对负荷特征提取,用电行为的影响因素,等角度对现有的研究成果进行分类的详细阐述。并使用小波变换和聚类算法相结合的方式对近100个用户的用电行为进行了分析。随着电力体制改革的推进,用户行为分析将是电力企业一项重要的研究内容,具有重大的研究价值和经济价值。
【关键词】用电行为分析,负荷特征提取,小波变换,聚类算法
1 引言
随着智能电表的普及,智能楼宇、智能小区等示范工程的建设,电力公司逐渐可获取居民用户的实测负荷信息。基于这些实测数据,国内外展开了对电力用户的用电特征分析,并根据其负荷形态对用户进行分类,取得了一定的成果。本文的思想是通过小波包变换对原始数据进行处理得到低频和高频部分的数据,将这两部分的数据作为用户用电行为的特征进行聚类,以此达到对用户用电行为分析的效果。
2研究现状及发展趋势
2.1负荷特征提取的研究方法
目前,关于负荷提取的研究多关注聚类方法,人们把目光放在对聚类算法的改进或者是多类方法的组合上。黄磊[1]等人把k-means 聚类和BP神经网络结合起来组合模型的预测方法来预测用电负荷,通过与单独使用BP网络预测的结果进行对比,认为使用k-means 聚类和BP网络的组合模型方法进行用电负荷预测,可获得较高精度。赵莉[2]等人提出一种基于改进k-means 算法的海量智能用电数据分析的方法,综合考虑初始聚类中心的选择及聚类个数的选取2个因素,以数据对象密度的大小作为初始聚类中心的选取标准,将簇间距离及簇内对象的分散程度作为聚类数目选择的重要参考,对k-means 算法进行改进。
2.2各类因素对用电行为的影响
在住宅用电方面,影响用户用电的因素非常多,文献[3]采用数据驱动的方法,同时收集用户的用电数据和家庭数据,通过概率回归分析把这些房主的调查结果作为用电数据的聚类结果的预测,分析得到不同的影响因素对用电行为有着不同的影响。文献[4]提出了基于三类变量(建筑电器、家庭特征、室内热舒适性)作为居民用电需求估计一个创新的混合模型。实验首先检查皮尔森相关矩阵,然后采用主成分分析方法提取了一些相互独立的复杂因素,克服了所有的变量之间的多重共线性的风险同时结果被用于随后的回归估计。
3实验过程
本实验采用的数据为广东省地区2015年6月至2016年6月的105个专变下用户的用电负荷数据。用户类型餐馆、旅业等9大类,采样频率为每15分钟1个数据点。实验环境为python2.7和matlab2014a。
实验初始阶段为数据处理和数据清洗,以此对缺失和异常的数据点进行填充和去除。处理完数据后用
db4号小波对原始数据进行小波包分解,得到分解树。
试验中用(2.3)、(3.0)、(3.7)频段的小波系数对数据进行重构,在获得重构的数据后,对数据进行聚类分析,所采用的聚类算法为k-means。
对各个频段的数据进行聚类,得出聚类结果后用SSE指标来评判聚类中心的个数,得出最佳的聚类结果。聚类结果显示由(3.0)频段重构的低频部分的数据即去噪之后的数据能得到较好的聚类结果,但是由(2.3)和(3.7)等高频部分数据聚类出来的结果很差,不同类之间的差别极大,用户在某一类的聚集程度极高。为了验证试验结果的正确性更换了db4和sym6小波重新实验,但实验结果依旧很不理想。由此可以得出结论,低频数据所涵盖的特征能更好地对用户的用电行为进行聚类,以此为基础可以进行进一步的分析。高频部分所包含的特征信息在以15分钟为一个采样点的数据条件下,并不能很好地对用户的用电行为进行聚类分析。以电子类数据为例,原始数据的聚类结果和去噪之后的数据聚类结果对比如图1和图2所示。
4结论
本实验中通过小波变换实现对用户用电行为的特征提取。通过聚类算法实现对用户用电行为的聚类分析。实验结果发现,通过低频部分的数据,根据SSE指标将用户聚为六类较为合适。每一类用户的特征明显。
第一类用户主要集中在下午至晚上这个时间段高额用电,自11点后用电量开始上涨,在15点达到一天用电的最高峰,随后一直维持着高负载工作至深夜1点才开始下降。
第二类用户主要集中深夜这个时间段高额用电,在晚上21点后用电量开始上涨,在凌晨4点达到最高峰,随后用电量开始缓慢下降,在一天的时间里维持高负荷工作的时间较短。
第三类用户高额用电主要集中在晚上和凌晨这两个时间段,15点之后用电量开始急剧上涨,在晚上20点达到高峰,然后一直持续到第二天5点,在中午14点到达波谷。
第四类用户高额用电主要集中在中午时间段,表现为早上10点有一个波峰,在16点又有一个高峰,这类用户比较符合我们的工作规律,早8点负荷上涨,晚18点用电基本降至谷底。
第五类用户的高额用电主要集中在中午至晚上,有两个波峰,分别在中午12点和晚上20点。该类用户在一天之内高负载运行的时间段比较长,与第四类相比工作时间延长了。
第六类用户高额用电主要集中在晚上,在晚上22点达到最高峰且持续的时间比较短。该类用户自早上8点之后用电量一直缓慢上升,中午13点有个小波峰。
本实验在选取小波的过程中还有不足,对于选取哪种小波能更好地提取数据的特征目前没有得出较好的结论,这部分知识需要进一步学习。今后的研究方向为在获取用户的用电特征的基础上建立用户用电的分类模型。当有未知用户加入的时候能根据用户的用电特征对其进行分类,在此基础上可以进行用电负荷的预测、有针对性地为用户提供用电套餐或给电价制定提供指导。
References (参考文献)
[1]黄磊, 陈浩, 衣乔木,等. 基于k-means聚类和BP神经网络组合模型的用电负荷预测[J]. 电力与能源, 2016(1):56-60.
[2]赵莉, 候兴哲, 胡君,等. 基于改进k-means算法的海量智能用电数据分析[J]. 电网技术, 2014, 38(10):2715-2720.
[3]Rhodes J D, Cole W J, Upshaw C R, et al. Clustering analysis of residential electricity demand profiles[J]. Applied Energy, 2014, 135:461-471.
[4]Xie Q, Ouyang H, Gao X. Estimation of electricity demand in the residential buildings of China based on household survey data[J]. International Journal of Hydrogen Energy, 2016, 41(35):15879-15886.