廖 强
西门子(中国)有限公司 上海 200082
摘要:本论文描述了集成数据采集、分析和可视化在内的一体化云平台,该一体化云平台包含并连接了电厂侧的数字化电厂平台和集团侧的集中管理平台。数字化电厂平台包含数据层、应用层和展现层,实现基于虚拟化电厂的设备信息管理和厂级主要指标监控两大功能;集中管理平台同样包含数据层、应用层和展现层,实现集团内各电厂的主要指标监控和电厂用户管理两大功能。
关键词: 数字化电厂 大数据 云平台
前言:电厂侧的数字化平台的建设有以下三点意义,一是建立符合“数字双擎”理念的标准化数据库,解决目前电厂层面存在的“数据孤岛”问题;二是依托于该平台建立发电行业的经济性和可靠性指标体系;三是结合热力学方法和人工智能技术,提升电厂的生产效率和安全可靠性。
集团集中管理平台可以提升集团层的数字化水平,可以让集团具备全面监测电厂各系统及设备的运行状态的能力,发挥并提升集团热力性能监测能力、故障诊断能力以及隐患的预测和预警能力。
将电厂侧的数字化平台和集团集中管理平台连接在一起的一体化云平台建设,可以实现集团和电厂之间的数据同步,相对低成本的在集团侧建立各专业的专家体系,依托这些专家体系提升性能分析和故障诊断水平,进而帮助电厂提升机组运行的经济性和可靠性。
1.关键技术
1.1大数据采集技术
数据采集是云平台和数据源集成的桥梁,云平台支持设备、传感器、控制和监控系统、企业信息系统等不同对象的数据交互。云平台针对不同的数据源对象,提供了对不同层面的交互协议和接口的支持,包括物联网即时通信协议、控制、监控系统通信协议、信息系统交互及数据库适配。
1.2大数据集成和处理技术
数据抽取,转换和加载(ETL)过程是对原始数据进行抽取,清洁,转换,整合,最终产生高质量数据的过程,是进行数据管理,分析,存储之前必经的重要步骤。数据ETL的流程可以分为数据抽取、数据转换、数据加载环节。在之后的步骤中,这些数据将被应用于数据管理,分析及可视化。
1.3 大数据管理与储存技术
数据管理是发电厂数据分析的基础,硬件的存储和计算能力是一体化云平台的骨骼,是数据分析能力的支撑。在一体化云平台中,数据管理是一项最基本的平台服务。
一体化云平台中的数据管理包括数据存储和数据操作两个部分,分别完成不同类型数据(结构化、非结构化、热数据、冷数据)的持久化以及数据查询等API/服务的提供。
数据存储方面:面向电厂不同的数据类型,提供针对结构化数据和非结构化的数据存储能力,如关系型数据库、NoSQL数据库、内存数据库、专用数据库和分布式文件系统。
一体化云平台中的数据采用分级存储的方式。云平台提供的各项数据存储是松耦合、独立可选的。用户可以只使用其中的一项,也可以同时使用多项数据存储服务。这种方式可以尽量保证用户对已有数据存储系统的使用,提高灵活性、降低成本。
数据操作方面:对于已经完成了存储的数据,提供基本的CRUD(创建、查询、更新、删除)数据操作,特别是对数据的查询服务进行了性能优化。此外,数据操作部分还提供了分布式数据操作服务,针对大批量的数据查询等操作,基于分布式并行处理等技术实现高性能数据操作。
1.4 大数据分析和挖掘方法
借助大数据分析技术对大数据进行分析挖掘,得到信息,然后将信息转化为知识,最后通过可视化展现与表达,与人们进行分享。通过使用先进的传感器、控制设备和软件应用程序,将能源供给端、电力生产端、电力传输端、电力消费端的数以亿计的设备、机器、系统连接起来,形成了“物联基础”。大数据分析、机器学习和预测是这种互联网络实现生命体特征的重要技术支撑:通过整合运行数据、气象数据、电网数据、电力市场数据等,进行大数据分析、负荷预测、发电预测,打通并优化电力生产和电力消费端的运作效率,需求和供应将可以进行随时的动态调整。智能发电、用电、储电设备,最终都将接入互联网,借助信息流,形成自我优化的良性循环。
1.5 数据库技术研究
该数据库技术基于 “数字双擎”理念,能够融合电厂全生命周期数据以及各类型的子数据库。一体化云平台支持三种发电厂常见的数据源的集成,包括设备和传感器、控制和监控系统(例如DCS,SCADA系统等)、企业信息系统(例如发电厂的MIS和SIS系统,以及广泛使用的ERP系统)。同时,对于其他类型的数据源,比如三维设计数据、视频数据、图片数据、Excel报表、Word报告等,支持基于HTTP协议的扩展和适配。针对不同的数据源和数据分析目标,提供不同的数据交互协议模块,实现按需的数据通信和数据采集,包括物联网即时通信、控制/监控系统接口访问、Web /Restful服务的交互,以及关系数据库的接口适配(主要针对遗留系统,如实时数据库)等。平台拟通过对电厂的实时数据库进行通信和采集,构成电厂实时数据库和电厂历史数据库;同时为方便本地化应用,建立应用程序结构化数据(库)和非结构化数据(库);并通过KKS编码体系,将各种信息和数据进行统一管理。最终将技术开发的成果形成标准,并在国内及全球相关行业内推广。
1.6 三维数字化技术
通过引入3D引擎技术,将电厂三维设计数据融入后期数字电厂全生命管理中,满足用户所有相关数字化虚拟需求。包括基于全厂三维的虚拟现实显示,增强现实交互,同时实现基于图层显示的信息过滤技术,并通过数据库通信技术,在3D数字化虚拟电厂中显示所有相关运行状态,设备信息,故障预警,劣化趋势,运维记录,检修规范等一系统电厂大数据库中相关信息并定制化分析显示。比如,在三维模型中指定单个设备调取其实时数据;或设定关注列表,采用勾选方式在三维模型中长期显示某几个关键设备的运行参数,通过编码体系(如KKS)与三维模型、系统模型及设计数据间建立关联。
2.数字化电厂平台的解决方案
数字化电厂平台解决方案,采用基于HTML5、JavaScript、CSS、PHP、MySQL、C++、openGL/webGL技术的B/S模式开发,总体架构主要包括数据层(实时数据库、历史数据库、结构化数据、非结构化数据)、应用层(基于三维的设备管理、电厂实时监控)、展现层(人机交互、多路径接入)三部分,如图3.1所示,该分层架构的优点在于可不变动硬件架构的情况下,根据不同的用户需求开发对应的应用程序,具有非常优秀的可扩展性。该平台可为用户提供统一的数据管理接口、通用服务总线和应用程序开发环境,不仅能够集成电厂现有的信息化系统(如SIS、基建MIS、ERP、OA等),还可以为电厂运行维护开发新功能(如全厂热力性能计算、故障诊断、专家系统等)。
数据层:符合“数字双擎”理念,能够融合电厂全生命周期数据以及各类型的子数据库。数字化虚拟电厂平台支持三种发电厂常见的数据源的集成,包括设备和传感器、控制和监控系统(例如DCS,SCADA系统等)、企业信息系统(例如发电厂的MIS和SIS系统,以及广泛使用的ERP系统)。同时,对于其他类型的数据源,比如三维设计数据、视频数据、图片数据、Excel报表、Word报告等,支持基于HTTP协议的扩展和适配。针对不同的数据源和数据分析目标,提供不同的数据交互协议模块,实现按需的数据通信和数据采集,包括物联网即时通信、控制/监控系统接口访问、Web /Restful服务的交互,以及关系数据库的接口适配(主要针对遗留系统,如实时数据库)等。平台拟通过对电厂的实时数据库进行通信和采集,构成电厂实时数据库和电厂历史数据库;同时为方便本地化应用,建立应用程序结构化数据(库)和非结构化数据(库);并通过KKS编码体系,将各种信息和数据进行统一管理。
应用层:该层为数字化电厂的核心功能层,提供基于三维的设备管理和电厂实时监控两大功能。
(1)基于三维的设备管理模块:通过引入3D引擎技术,将电厂三维设计数据(如PDMS)通过浏览器展现给用户,满足用户在数字化虚拟电厂中漫游的需求,如图3.2,同时实现基于图层显示的信息过滤技术,并通过数据库通信技术,在3D数字化虚拟电厂中基于点击位置的浮动窗口实时显示用户关心的设备信息。比如,在三维模型中指定单个设备调取其实时数据;或设定关注列表,采用勾选方式在三维模型中长期显示某几个关键设备的运行参数,通过编码体系(如KKS)与三维模型、系统模型及设计数据间建立关联关系。通过数据库挂接模型技术可实现三维模型与设备基本属性的关联,简化了传统的以卷宗、图纸为载体的设备基础信息管理模式,信息的集成度更高,保证生产技术人员、管理人员可以方便、直观对设备的信息进行管理。常规的资产管理,一般是基于台账/表格的资产管理,而没有办法对其所处位置进行明晰的标定。基于三维模型的资产管理就可以将资产信息(例如使用年限、价值管理、维修状态、寿命管理…)附加到这些模型上,形成一个快速直观的检索模式,让用户不仅能查询到资产状态,还能进行地理信息定位,方便用户对该设备的全生命周期的管理。
(2)电厂实时监控模块
对全厂生产数据进行综合处理、统计分析,形成全厂生产报表和曲线,使用户可以在各终端上对各生产流程进行统一的监视和查询,实现生产数据信息的共享。通过该模块可以把采集的数据以多种形式显示,如趋势图、运行画面及报警一览等形式。通过这些功能,电厂可实时了解实际运行状态,并可针对一些关键性指标进行实时监控。
展现层:
使用Apache配置web服务器,并采用HTML5、JavaScript、PHP、CSS等技术实现web服务器的开发环境配置;提供门户系统、登陆系统、权限认证系统,实现登陆客户分级授权可视化。表达层可根据用户需求,在业务逻辑层开发对应应用,如运行监测可视化、视频监测可视化、检维修管理可视化、资产管理可视化、设备拆分可视化等应用(Apps),通过与表达层的通信,实现虚拟化控制和监测。
3. 集团集中管理平台解决方案
集中管理平台主要包括数据源、数据层、应用层、展现层,如下图3.1所示。
每层的介绍如下:
数据源,平台主要支持使用WebService / Restful服务对电厂侧的实时数据库和关系数据库进行封装。
数据层,主要对完成传输的数据进行按需的集成,例如实时数据的缓存。同时,提供不同类型的数据存储完成数据的存储管理。
应用层,在报警和事件处理中心的基础上提供针对客户需求、定制化的数据分析应用,例如热力性能分析、实时监控、远程诊断等。
展现层,针对分析结构和应用,提供标准化、用户体验友好的多终端接入和图表化展现,涵盖手机、PC,支持时间序列、散点、线型等展现。
其中数据源部署于电厂侧,其他平台层通常部署于发电集团侧。同时,按照具体功能和部署的定制化要求,平台的各个层次也可以松耦合、多级的方式部署,应用层的相关独立应用也可以部署于电厂侧直接运行。 电厂侧主要以提供数据为主,通过工业数据库(例如Pi)、关系数据库等将电厂侧需要分析的数据提供给发电集团侧的平台模块。在发电集团侧,首先对接收到的数据进行缓存和存储,然后提供给相关的分析引擎、按照应用层相关应用的处理逻辑进行分析。最后,通过应用层的报警和事件处理中心,发送给展现层,通过相应的终端和交互逻辑展现给用户。
该平台应用层上部署两个模块,一是集团层的监测模块,二是电厂用户管理模块。
监测模块可以对集团下属所有电厂生产数据进行综合处理、统计分析,形成集团层面的生产报表和曲线,使用户可以在各终端上对各生产流程进行统一的监视和查询,实现生产数据信息的共享。集团可实时了解实际运行状态,并可针对一些关键性指标进行实时监控。关键性指标分为三类,与电厂侧实时监控模块中一致。
电厂用户管理模块主要为云平台体系下的用户提供相关支撑能力。
用户角色管理:主要针对不同的电厂用户,定制在各用户之下的相关角色,例如用户管理员、用户组管理员、普通用户等;
用户权限管理:针对各电厂用户的相关角色,定义分级、分域的权限管理,权限的定义可以包括应用权限、内容权限、管理权限等;
4.一体化云平台的部署方案
整体平台的功能模块从部署维度主要包括以下几个部分:消息队列和缓存集群,大数据存储和计算集群,应用服务器集群,数据库集群,缓存集群,以及WEB服务和负载分担模块等。各个功能模块或者集群都可以实现灵活部署,可以部署在实际的物理机器上,也可以以部署在目前主流的私有云计算平台上。可以支持基于VMware ESX, Xen, KVM,以及基于Hyper-V等技术的虚拟化平台。或者根据实际的需求部署于Docker等容器。可以根据需要部署在共有云或者私有云平台。
其中,各个模块或者集群的机器可以根据整体容量,并发度要求的实际需要进行灵活的裁剪合并或者增加。以微软私有云为例,在云平台上可以方便的通过简单的配置实现扩容。可以实现方便的数据迁移,对运行状态的监测,以及保证数据安全的容灾能力等等。
在云模式下,平台可以选择本地(含私有云)或者远程的云环境进行部署。在云环境部署时,有PAAS和IAAS两种方式,考虑到大数据平台部署环境的复杂性,通常选择IAAS,采用虚拟机,从操作系统开始,进行部署环境、相关应用容器的安装和配置。大数据云平台的部署,可以采用集中和分散相混合、集团与电厂多级部署的模式。在电厂侧,可以直接采用数字化电厂平台中的数据服务器,在集团侧,可以采用私有云进行部署,方便和电厂侧进行级联。
在云模式下,平台可以采用“电厂—集团”两级部署方式,其中:电厂侧部署数字化电厂平台,集团侧可部署于私有云,发电厂和集团两级节点可以进行级联。
发电厂现场节点:相关功能模块可以部署在发电厂的数字化电厂平台上,针对单一发电厂的数据,提供现场数据预处理和实时数据分析能力,满足实时监控和诊断的需求;
集团中心节点:平台可以部署在集团,与部署在各个电厂的平台节点进行级联和数据汇总。同时,针对数据安全的要求,平台基于云计算技术,支持涉密数据和非涉密数据的云化数据隔离、数据处理实例隔离,实现两类数据智能分析的独立进行(在涉密数据侧,开展对非涉密数据的统一分析)。
结束语
一体化云平台通过连接电厂侧的数字化电厂平台和集团侧的集中管理平台,使得各分电厂间实现资源共享,从集团层面出发打通各分电厂间的数据孤岛,从而产生价值。
参考文献
[1] 数字电站一体化信息管理整合平台顶层业务架构设计及应用,赵成澎,华北电力大学 硕士论文2015
[2] 智慧电厂一体化大数据平台关键技术及其应用. 李东峰. 电子 电力与应用. 2020, (2). 34-35
[3] 一体化大数据平台技术在智慧电厂中的应用. 万震宇. 产业创新研究. 2020, (14). 38-39