基于工程大数据的大坝数据仓库体系研究--中国期刊网

字体：大中小

首页> 原创作品> 正文

基于工程大数据的大坝数据仓库体系研究

发表时间：2021/7/12 来源：《科学与技术》2021年3月第8期作者：乔琪

[导读] 以数字技术为核心的新一轮技术革命和产业变革的大环境里，

        乔琪
        上海勘测设计研究院有限公司，上海市长宁区200335
        摘要：以数字技术为核心的新一轮技术革命和产业变革的大环境里，工程大数据是数字经济发展的战略底座，亟待数字化转型升级。以大坝工程为例，在其设计、建设、运维的工程全生命周期里，既有传统的结构化数据如工程分解结构信息、合同信息等，又有非结构化的数据如文档、图片等。数据总量极其庞大、类型繁杂，仅依靠传统的数据库和应用系统架构很难高效地处理。本文在了解工程资产的产生背景、发展现状及应用前景的基础上，引入数据仓库作为本文研究的基础，提出建设企业级数据仓库(Enterprise Data Warehouse)(简称EDW)，利用大数据仓库理念，集成包括采购、运输、到货验收、入库、出库、安装、验收、运行、维护9个方面的大坝工程数据资料，探讨建立大坝工程大数据仓库体系的设计思路和架构。大数据仓库使得大坝工程的管理方式灵活方便，为其科研、生产及管理人员提供了丰富的数据信息。
        关键词：大数据；工程数字资产；数据仓库

        0引言
        信息技术与智能控制技术已在大坝的建设过程中得到越来越多的认可，借助现代信息技术、互联网技术和智能控制技术,在大坝建设期间将感知、分析和控制为主导的人工智能理念成功应用于大坝建设的施工与管理中,以“智能建造”为代表的中国引领世界坝工技术发展的新时代已经到来。
        如何高效利用工程全生命周期产生的大量数据，使其更好得服务于仿真大坝系统是一个值得解决探究的问题。本文运用大数据数据仓库的理念，研究建立结构规范、易于共享、扩展性强的面对仿真大坝系统的大数据工程资产数据仓库，梳理适用于仿真大坝系统应用的数据关系，提高了仿真大坝系统调用数据计算的能力。
1仿真大坝系统介绍
1.1 定义与内涵
        仿真大坝系统是在工业互联网战略基础上，为实现智能建造对全面感知、真实分析、实时控制的需求而提出。仿真大坝系统包括 “数字大坝”和“仿真大坝”。“数字大坝”是以大坝BIM模型为基础，全面集成工程设计、施工和运行全生命期的各类结构设计、工程地质、工程施工信息和工程安全监测数据，从而建设一座集成大坝全部信息的数字孪生大坝。
        “仿真大坝”是指在“数字大坝”的基础上，对数字大坝的工程参数、边界、进程和动态响应开展全面的分析，集成先进的仿真分析软件，开展对大坝工程工作性态的实时动态仿真与反馈。仿真大坝系统的建设除了建造一座实体大坝的孪生大坝之外，其真实内涵还包括具备动态调控功能。通过仿真大坝系统的建设，最终实现大坝工作性态的全自动感知、分析、决策与调控，并最终实现大坝工作性态的全程动态安全和关键参数指标的最优化智能控制。
1.2 仿真大坝系统功能设计
        仿真大坝有4个主要功能：自动感知、实时仿真、决策支持和智能调控。其中自动感知功能为仿真计算提供边界条件和计算参数，包括环境信息、材料信息、结构信息、进度信息、施工信息、温控信息、监测信息等，为大坝实时仿真提供全方位的基础数据、基础信息支撑。
        实时仿真的功能可以实现大坝工作性态的实时仿真与反馈，包括进行线弹性分析、非线性分析、多场耦合、高性能计算、反馈分析等。为大坝实现实时仿真提供全方位的数值模拟和反馈分析功能提供保障，并提供实时温度场、应力场、渗流场、位移场、变形场、安全系数场等方面的仿真计算结果。
        决策支持功能则是根据仿真计算结果调用工程智能决策库，自动判断大坝是否安全，并确定最优解决方案，提出最优控制参数指标群。调用的工程智能决策库包括大坝混凝土理想温度控制曲线标准知识库、混凝土强度曲线标准知识库、混凝土温差控制标准知识库、混凝土允许应力标准知识库等。这些知识库为决策支持系统实现仿真计算结果合理性与安全性进行智能识别与判断提供支撑，并提出建议的浇筑温度、冷却水温、浇筑进度、挡水时机、高度等指标要求及建议控制参数。
        智能调控功能是基于最优的解决方案，对当前实施方案的控制指标和参数进行动态调控。智能调控包括对拌合、运输、接缝灌浆、蓄水控制、运行调控等方面。如在对大坝的运行调控来说，该功能根据大坝监测资料反馈的运行状态或梯度调度的需要，智能动态调整大坝上游水位，从而保障工程安全。
2仿真大坝系统数据仓库
2.1 仿真大坝系统数据需求
        水利水电行业信息化建设起步较晚，缺乏较好的顶层设计，也缺乏成熟的数据标准体系和规范。另外，大坝、水电站工程全生命周期的数据量大而冗杂，既有结构化数据如WBS工程分解等，也有非结构化数据如工程图纸、设计文档等。数据量大、多源且无统一存储标准给系统数据需求分析带来了巨大的挑战。
        大坝仿真系统的数据需求应包括气象水文等基本边界参数，大坝温度、应力和变形等特征参数，大坝重点部位的温度、应力、开度和变形方面的监测数据、实时的进度和未来的进度等。
2.2 数据仓库设计思路
        基于仿真大坝系统的数据需求，数据仓库的设计采用应用驱动(用户驱动)法和数据驱动法相结合的方法。应用驱动是指以确认用户的部分需求为开端，循序渐进地建立整个数据仓库。这种方法多是通过与用户面谈，或采用实例分析的方法，获得形式化的用户需求；数据驱动是指通过分析源数据的实体关系（Entity Relationship，ER）模型或实际的关系表的组织方式，逐渐明确需求，并据此得到所能满足的用户需求范围。仿真大坝系统的数据仓库设计以应用驱动方法发现用户需求，以数据驱动方法发现工程数据间的关联关系，然后设计比选出数据仓库设计的最优解。

2.3 数据仓库架构设计
        一个完整的数据仓库系统的定义为：数据仓库系统（DWS）＝抽取／转换／加载（ETL）＋数据仓库（DW）＋联机分析处理（OLAP）＋数据挖掘（DM）＋决策支持（DS）。结合上述设计思路，数据仓库整体架构设计如下图所示。整个系统架构分为数据源、数据仓库和仿真大坝系统三个主要部分。通过对业务数据的解读和分析，抽象出实体、关系及上下文等对象，然后按照对象的业务属性从业务模型的三个维度进行划分并按照规则完成命名，最后设置相关属性和主外键关系。本数据仓库从数据源到采集与多层清洗加工，形成以工程数据资产为核心的数据仓库,在这一过程中，形成了一套数据逻辑分层。数据逻辑分层包括0DS层、DWD层和DM层。
        ODS层:全称Operation Data Store,用于存放原始数据信息，和数据源保持一致。
        DWD层:全称Data Warehouse Detail, 数据仓库明细层，对原始数据进行清洗转换，并按照工程全生命周期进行分类。
        DM层:全称Data Mart,数据集市层，是最直接体系数据资产的层，用来支撑上层仿真大坝系统应用。

3 总结与展望
仿真大坝建设是未来大坝工程安全保障的重要环节，也是未来大坝工程智能建造的重点组成部分。本文介绍了仿真大坝系统及其功能，并重点对其底层数据仓库的设计和架构进行了详细阐述。对于进一步加强大坝安全状建立一个完备、完善、健全，能承担仿真大坝系统的大数据仓库建设，既要有基于大数据的可靠的技术方案与技术架构，还要对大坝业务场景有清晰的理解，透彻的分析，未来应进一步进行深化和优化。