陈映琼1 顾军民2
1、国电浙江北仑第一发电有限公司 浙江 北仑 315800
2、国电宁波风电开发有限公司 浙江 宁波 315040
摘要:齿轮箱是风电机组运行的关键设备,针对风电机组齿轮箱故障发生频繁,运维成本高等问题,提出一种基于SCADA系统异常数据清洗和动态神经网络建模的方法对风机齿轮箱油池温度进行建模。随后采用统计过程控制方法分析残差,根据残差分布特征计算阈值上下限,实现齿轮箱油池温度异常状态预警。最后以双馈式风力发电机组为研究对象进行建模分析并给出实例,验证了该模型对齿轮箱油池温度预警具有实用性和有效性。
关键词:风电机组;SCADA系统;数据清洗;齿轮箱;动态神经网络;统计过程控制
1 引言
近年来,风电机组装机容量在世界范围内快速增加。最新数据统计,2019年全球新增风电装机60.4GW,其中我国新增装机容量达到2.3GW,创下历史新高。随着风电事业快速的发展,但风电项目抢装潮过后的“风电机组质保”困局却没有得到足够关注,同时风电场地处偏远,环境恶劣,导致维修成本居高不下,对风电场运维影响巨大[1]。
风电机组靠风驱动,承受着巨大的随机冲击力,因此会产生多种类型的故障[2]。齿轮箱作为风电机组传动系统中的关键设备,影响整个机组的运行。齿轮箱故障若未能及时维修,则会产生重大经济损失。可见,对齿轮箱的运行状态进行实时监测至关重要。
目前,大部分风电场都已安装数据采集与监控(supervisory control and data acquisition,SCADA)系统来实时监测风电机组各个系统的运行状态参数。文献[3]使用加权主成分分析法建立正常工况下的发电机温度模型,利用所建模型对其余时间段运行数据进行温度故障检测。文献[4]结合SCADA数据采用相关性分析确定与有功功率强相关性的温度参数建立风电机组异常识别模型,采用滑动窗口进行在线监测。文献[5]提出了改进的线性回归径向基神经网络方法,建立正常运行状态下轴承的温度预测。文献[6]提出一种基于果蝇算法优化极限学习机的方法对风机齿轮箱进行状态检测并预测齿轮箱剩余使用寿命。文献[7]提出D-S证据理论对风电机组SCADA报警数据进行故障分析。上述文献都是基于相关特征参数建立优化的模型来提高模型的预测精度使机组的在线监测更加精准。但风电机组的实际运行不仅依赖合理的特征参数和模型,还包括建模选取的运行数据。
针对上述问题,为减少齿轮箱故障带来的重大影响,本文提出一种基于异常数据清洗和动态神经网络的齿轮箱油温建模方法,将现场采集的SCADA数据进行有效清洗,同时选择合理的模型输入参数,使清洗后数据所建模型精度较高,预测效果更好。最后引用统计过程控制方法实时监控齿轮箱油温趋势,并用实例证明该方法可有效监测异常状况,达到预警效果。齿轮箱油池温度预警具体方法如图1所示。
.png)
图1 齿轮箱油池温度预警方法
2 SCADA系统异常数据清洗
2.1 SCADA数据
本文选取的SCADA数据来自河北省某风电场,配备远景1.5MW双馈式风力发电机,切入风速为3m/s,额定风速为12m/s,切出风速为25m/s。该SCADA系统每1min记录一次监测数据,监测参数包括有功功率、风速、风向、桨距角、偏航角等共97个,每台机组一年可记录近400000个数据项,表1为SCADA系统监测的有效数据。
2.2标准功率曲线建立
为了更好地将SCADA系统数据进行预处理,需要建立标准风速-功率曲线。标准的风速-功率曲线是结合当地空气密度由厂家提供的,已知该风电场标准空气密度为1.01kg/m^3。标准风速-功率曲线图如图2所示。
.png)
图2 标准风速-功率曲线图
由标准风速-功率曲线可知当风速小于切入风速时,风机不发电处于待机状态;当风速达到切入风速时,风机开始转动产生输出功率,功率随风速的增加逐渐增加[8];当风速达到额定风速时,机组功率达到额定功率1.5MW;当风速超过额定风速时,风机通过变桨系统调节桨距角使功率维持在额定功率附近;当风速超过切出风速时,风机制动停机。
2.3 基于bin算法的异常数据清洗
2.3.1异常数据分布
由于弃风限电以及传感器自身精度误差等原因,实际风电场采集的SCADA数据存在大量异常数据,这些数据的存在会直接影响到模型的预测精度[9]。按照标准风速-功率曲线的分布特征,异常数据大致可分为以下几类:第一类为曲线底部堆积型数据,表现为风速很大但功率为零的数据;第二类为曲线中部堆积型数据,表现为风速很大但功率维持在小于额定功率的某个恒定功率,即限功率数据;第三类为曲线四周分布的散点型数据,表现为风速很小但功率很大或风速很大但功率很小的散点数据。这里选取该风场2017年连续12个月的数据分布如图3所示。
.png)
图3 机组异常数据分布图
2.3.2 bin算法拟合风速-功率曲线
为有效避免风速-功率曲线在额定功率时出现拟合不准的现象,采用bin算法进行拟合[10]。根据风机运行原理首先剔除风速小于切入风速和大于切出风速的数据。然后将运行范围内的风速划分为两个大区间即[切入风速,额定风速]和[额定风速,切出风速]。每个大区间再把风速等间隔划分,称为风速bin[11]。为方便拟合取每0.5m/s风速为一个bin,分别求得每一个bin中的风速、功率平均值,得到所对应点,即
式中,为第i个bin区间的平均风速;为第i个bin区间的平均功率;为第i个bin区间的总数据数;为为第i个bin区间内第j个的实际风速;为第i个bin区间内第j个实际功率。通过所得的点拟合即可得到拟合的风速-功率曲线。
2.3.3 异常数据清洗
bin算法可对风速-功率曲线进行有效的拟合,且所得曲线平滑误差较小[12]。数据清洗步骤如下:计算风速对应的拟合曲线功率与实际功率的欧氏距离,实际运行功率越接近拟合功率,距离值就越小。根据数据统计距离值分布的标准差,标准差可以反映一个数据集的离散程度,位于内的数据为正常数据,否则为异常数据,剔除标准差大于的数据,从而达到清洗原始数据的目的[13]。数据清洗后结果如图4所示。
.png)
图4 数据清洗后的风速-功率曲线图
3 NARX动态神经网络模型
3.1特征参数选取
风机的运行包括风轮系统、齿轮箱系统、偏航系统、发电机系统等,各系统相互关联,紧密联系。选择合理的特征参数可有效监测风电机组齿轮箱的运行状态。本文选择与齿轮箱油池温度密切相关的6个特征参数。
①发电机功率:发电机输出功率影响整个机组的性能,与齿轮箱关系密切,影响齿轮箱油池温度;
②风速:风电机组通过风速驱动发电,影响风机各个系统运行,相应的齿轮箱运行也受风速影响;
③主轴转速:主轴转速与风速正相关,通过齿轮箱升速,齿轮箱油温随着主轴转速变化而变化;
④液压站预充压力:液压系统为油缸和制动器提供必要的驱动压力,强制润滑型齿轮箱需要液压系统供油,与齿轮箱密切相关;
⑤齿轮箱驱动端轴承温度:主轴转速越高,齿轮箱驱动端轴承温度相对越高,齿轮箱油池温度也越高;
⑥齿轮箱非驱动端轴承温度:主轴承转速越高,齿轮箱非驱动端轴承温度相对越高,齿轮箱油池温度也越高。
3.2 NARX动态神经网络原理
NARX(nonlinear autoregressive with external input)动态神经网络是带有外部输入反馈且具有反馈的动态神经网络,网络的输入不仅与当前的输入有关,而且与过去的输出有关[14]。齿轮箱油池温度不但有较强的自相关性,还与风速、功率等外部相关变量具有相关性。本文引入NARX动态神经网络对风机齿轮箱油池温度进行建模。该模型能够将输出信号反馈到输入端从而将输出信号参与到下一次的迭代训练中,具有记忆功能,因此可以更好地描述具有复杂映射关系的时变系统的特性[15]。NARX神经网络结构如图5所示,定义如下:
(3)
式中,为非线性映射;为齿轮箱油池温度的时间序列;为外部输入参数序列;是齿轮箱油池温度预测值。网络采用莱文伯格-马夸特(Levenberg-Marquardt,LM)算法进行权值迭代,该算法具有收敛时间短等特点[16]。
.png)
图5 NARX神经网络结构图
3.3齿轮箱油池温度建模分析
本文选取2017年5月1日至7日的数据对齿轮箱油池温度进行建模。选择15%的数据用于模型训练,15%的数据用于模型验证,70%的数据用于模型测试。对较多得数据进行模型预测,可使精度达到更高要求。同时NARX神经网络的延时阶数与隐含层个数也影响着模型的预测精度。经过反复多次实验最终确定NARX神经网络的延时阶数d=3,隐含层个数m=10。
模型拟合优度结果如图4所示。由图可知NARX神经网络模型总拟合优度为R=0.99525,其中训练模型的拟合优度R=0.99628,验证模型的拟合优度R=0.99215,测试模型的拟合优度R=0.99357。模型拟合优度值较大,表明所建模型的精度较高。图5为NARX神经网络输入误差自相关性结果图,图6为NARX神经网络输入误差互相关性结果图。分析图5、6 可知,MSE的值很接近0,相关性系数R几乎为1,误差自相关图除了初始时的关联度较高,其余部分均在置信区间附近或内部,误差互相关图也均在置信区间内部,满足要求。齿轮箱油池温度预测如图7所示。
.png)
为了更好地判定模型的预测结果,采用均方差(mean squared error,MSE)、平均绝对误差(mean absolute error,MAE)、平均百分比误差(mean percentage error,MAPE)值来评价模型精度,并与BP神经网络进行对比。具体公式如下:
(4) (5)
(6)
式中:为模型预测总数据集,为时刻的实际值,为时刻模型预测值。具体结果如表3所示。MSE、MAE、MAPE等误差指标越小,则模型的预测值越准确,其中MSE描述了误差的偏离程度,反映了模型的稳定性,其值越小,则系统越稳定[17]。
表2 NARX模型和BP模型的性能指标对比结果
.png)
4 基于统计过程控制的齿轮箱运行状态监测
4.1基于统计过程控制的残差指标
本文将统计过程控制(statistical process control,SPC)方法引用到风电机组齿轮箱的残差监测中,通过监测齿轮箱实际油温与模型预测油温的残差分布状况来实现齿轮箱运行状态在线监测行为[18]。
如果残差变量服从正态分布,即,则,X的取值范围为大概率事件,该取值方法称为准则[19]。如果被监控的变量分布在(,)之间,则认为该变量是受控的,据此可以画出以为上限,以为下限的阈值线,然后根据判定准则来对齿轮箱油温进行实时监控,并对异常状况发出预警。计算公式如下所示。
(7)
(8)
式中:表示监测的总数据数;表示每个监测油温实际值与预测值的差值;表示残差均值;表示标准差。
4.2实例分析
齿轮箱油池正常温度范围基本维持在[55℃,62℃]。当油池温度高于70℃时,机组发生报警故障。正常运行状态下的残差分布基本呈正态分布符合SPC预警方法,如图8所示。根据公式(7)、(8)可求得,即。计算阈值上限UCL=1.6506,预制下限LCL=-1.6738,正常运行状态下齿轮箱油池温度残差在阈值线范围内波动。结果如图9所示。
.png)
图8 残差分布图
.png)
图9 齿轮箱正常状态下残差波动图
已知该机组2017年10月28日15:23:00发生“齿轮箱油池温度高于上限值”故障。实验选取2017年10月28日03:30:00至2017年10月28日15:22:00的数据段进行油温监测。齿轮箱油温监测结果如图10所示。当齿轮箱油池温度出现异常状况时,残差逐渐上升直至超过阈值上限。根据图10计算可知当残差超过阈值上限对应时间点为2017年10月28日09:24:00,比故障发生时间提前6小时提出预警。
.png)
图10 齿轮箱油温预警图
5 结论
本文结合风场SCADA系统采集的数据,提出一种基于bin算法拟合风速-功率曲线与标准差数据清洗方法,有效剔除了异常数据,可提高风电机组齿轮箱模型精度。通过分析齿轮箱运行原理合理选择与齿轮箱油池温度相关的特征参数,选用NARX动态神经网络建立齿轮箱油温模型,并与BP神经网络对比。通过模型评价指标分析得到NARX动态神经网络所建模型各指标均优于BP神经网络模型。最后采用统计过程控制方法确定预警上下阈值线,对油温进行实时监测。通过实例证明,该方法可对齿轮箱油温异常状况提前预警,对风电机组的运维具有重大意义。
6 参考文献
[1] 刘帅,刘长良,甄成刚.基于数据分类重建的风电机组故障预警方法[J].仪器仪表学报,2019,40(8):1-11.
[2] 向健平,凌永志,詹俊,李鹏辉.基于SCADA系统的风电机组主轴承故障预警方法[J].电力科学与技术学报,2019,34(3):223-228.
[3] 刘轩,孙建平.风力发电机温升故障预警方法研究[J].电力科学与工程,2016,32(6):38-43.
[4] 邢月,顾煜炯,马丽.基于温度参数的风电机组异常识别[J].可再生能源,2019,37(5):743-749.
[5] 丁佳煜,许昌,葛立超,杨杰,许帅,李云涛.基于轴承温度模型的风电机组故障预测研究[J].可再生能源,2018,36(2):276-282.
[6] Yubin Pan,Rongjing Hong,Jie Chen,Jaskaran Singh,Xiaodong Jia. Performance degradation assessment of a wind turbine gearbox based on multi-sensor data fusion[J]. Mechanism and Machine Theory,2019,137.
[7] Yingning Qiu,Yanhui Feng,David Infield. Fault diagnosis of wind turbine with SCADA alarms based multidimensional information processing method[J]. Renewable Energy,2020,145.
[8] 张帆,刘德顺,戴巨川,王超,沈祥兵.一种基于SCADA参数关系的风电机组运行状态识别方法[J].机械工程学报,2019,55(4):1-9.
[9] 王炜超,袁逸萍,孙文磊,赵琴,樊盼盼,贾依达尔·热孜别克.融合SCADA数据的风电机组齿轮箱状态评估[J].机械科学与技术,2020,39(2):201-206.
[10] 王新,王政霞.基于改进bin算法的风电机组风速-功率数据清洗[J].智能科学与技术学报,2020,2(1):62-71.
[11] 黎孟岩,刘兴杰,米增强.风力发电机组功率曲线建模方法研究[J].云南电力技术,2012,40(3):1-5.
[12] 林鹏,赵书强,谢宇琪,胡永强.基于实测数据的风电功率曲线建模及不确定估计[J].电力自动化设备,2015,35(4):90-95.
[13] 刘楠,刘瑾,李珂,唐娟,刘静.风力发电机组功率曲线获取方法[J].船舶工程,2019,41(S1):291-294.
[14] 黄忠山,田凌,向东,韦尧中.基于PCA和SPC-动态神经网络的风电机组齿轮箱油温趋势预测[J].清华大学学报(自然科学版),2018,58(6):539-546.
[15] José Maria P. Menezes,Guilherme A. Barreto. Long-term time series prediction with the NARX network: An empirical evaluation[J]. Neurocomputing,2008,71(16).
[16] 付青,单英浩,朱昌亚.基于NARX神经网络的光伏发电功率预测研究[J].电气传动,2016,46(4):42-45.
[17] 何群,王红,江国乾,谢平,李继猛,王腾超.基于相关主成分分析和极限学习机的风电机组主轴承状态监测研究[J].计量学报,2018,39(1):89-93.
[18] 胡庆春. 基于支持向量机和统计过程控制的风电机组故障预测算法的研究[D].华北电力大学,2011.
[19] 林涛,刘刚,蔡睿琪,杨欣,张丽,廖文喆.基于轴承温度的风机齿轮箱故障预警研究[J].可再生能源,2018,36(12):1877-1882.