计算机软件数据整合虚拟数据库体系研究分析 伏明

发表时间:2020/12/30   来源:《论证与研究》2020年11期   作者:伏明
[导读] 摘要:近年来,经济的发展,促进我国科技水平的提升。随着科技的进步,软件技术的迅猛发展以及信息电子化的不断普及,使得信息处理能力在提高的同时也形成了一个个分散的、封闭的、异构的信息孤岛,使得大量的信息资源不能充分发挥应有的作用。实现信息资源共享的有效途径之一就是对现有信息资源进行整合。在数据整合中,对数据实行逻辑集中、物理分布管理最为符合数据源的现状。相对物理集中方式既能充分利用现有资源、节约开支,
                                                                      伏明
                                       (华能煤炭技术研究有限公司 北京 1000700)
        摘要:近年来,经济的发展,促进我国科技水平的提升。随着科技的进步,软件技术的迅猛发展以及信息电子化的不断普及,使得信息处理能力在提高的同时也形成了一个个分散的、封闭的、异构的信息孤岛,使得大量的信息资源不能充分发挥应有的作用。实现信息资源共享的有效途径之一就是对现有信息资源进行整合。在数据整合中,对数据实行逻辑集中、物理分布管理最为符合数据源的现状。相对物理集中方式既能充分利用现有资源、节约开支,又避免了大量数据迁移和管理的风险。本文就计算机软件数据整合虚拟数据库体系展开探讨。
        关键词:计算机软件;数据整合;虚拟数据库体系
        引言:
        在计算机网络技术支持下,社会各行业的各类型应用软件层出不穷,大大提升了社会的发展速度和效率。与此同时,在信息共享时代中,行业企业之间对于各类资源信息的需求量越开越大,既有的资源传播和信息化程度不高,制约着企业的高速发展需求。因此对于现代企业而言,当务之急是要求能够基于不同领域、不同应用软件的信息整合优化,又可以根据不同的应用需求开发出一个具有普适性的应用平台,从而达到软件数据存储的同一化、软件系统的既有个性化架构,又能够在整体软件平台上兼容,形成一个统一的管理模式。
        1数据整合系统设计
        VDB的处理过程是:首先把各个分散数据源的数据收集集成,然后将异质的数据转化成同质数据,并给应用程序的设计者提供一个简单、统一的关系数据库接口。VDB技术使得一类新型的应用系统得到了快速的发展。这类应用有以下几个显著的特征:(1)拥有大量不同的数据源;(2)数据源之间是相互独立的,没有集中的控制机制;(3)数据源的构成是复杂的,是结构化和非结构化数据的混合。而数据整合的特征如下所述:(1)拥有大量不同的数据源,且不断更新增减;(2)数据源之间是相互独立的,分别属于不同的数据拥有者;(3)数据源的元数据构成是复杂的,多变而不统一;(4)数据源的内容是相同、相近的,在意义上表达同一主题知识;(5)系统以数据共享为目的,并不以统一数据形式为主要目的;(6)系统中实现数据的逻辑共享与物理分治。从上面的对比中不难看出,二者所处理问题的特征有很多相似之处。但经典的VDB系统是以大量的Web站点为数据源设计的,它由数据集成与数据发布两部分组成。其核心部分——数据集成系统由包裹器、映射器和提取器3个模块构成,为上层提供一个单一的、一致的关系数据库接口。本文提出的数据整合系统是以关系数据库数据集为主要数据源,以数据服务数据集为扩展数据源,根据VDB系统工作机理来设计。该系统采用XMLSchema创建主题知识全局模型和数据集全局模型,作为异构数据源局部模式的统一定义。而局部模式(XML文档)用来存储异构数据源的元数据作为虚拟数据库的数据字典。这样通过统一的元数据定义(全局模式),实现了模式映射,屏蔽了异构数据源数据结构的异构性。并通过包装不同类型的数据源的特性,参数化实现了数据源的“即插即用”特性以及可扩展性。主要模块功能描述如下:(1)查询解析模块。用户提交的查询请求以系统给出的查询模式文件构造查询请求XML文档。该模块根据模式文件验证该文档的合法性,判断所查询的数据与数据源是否已注册,然后将解析结果发送给查询分解模块。(2)查询分解模块。该模块根据各数据源的局部模式以及查询请求构造针对各数据源的子查询请求,每个子请求都包含了针对该数据源用户完整的请求信息。

(3)查询调度模块。查询调度模块式协调各数据源工作的模块。由于整合系统的数据源是分布式的,该模块根据数据源的具体情况合理调度查询过程,以最大效率为用户提供服务。(4)元数据管理模块。负责注册、管理、组织数据源相关信息。该模块以知识主题为基础,以XMLSchema为工具定义信息的元数据作为全局模式;使用全局模式的元数据通过映射机制建立各数据源的局部模式,从而通过原数据信息屏蔽了各数据源的结构冲突。(5)数据库访问模块。该模块根据数据源局部模式,以统一借口对上层提供数据访问服务。主要功能是屏蔽异构数据源间本地SQL语言、数据类型等一些异构性。(6)异构数据处理模块。该模块处理数据访问层提交的异质数据,根据全局模式构造XML形式的同质数据。
        2数据整合系统关键技术
        2.1数据集元数据全局模式
        从数据集元数据全局模式的角度上来看,此模式主要是对各种数据集的基本信息进行描述,能对各数据集本身的基本属性信息存储。比如:数据集名称、主题、创建者、摘要等等。此模式是XMLSchema结构。能够对XML文档根元素DBSet中含有的DBSource多个子节点进行验证。对于XML文档来说,在系统中,对所有数据集元数据信息都包含。这种构造模式,对各数据集的局部模式进行检验,其系统主要以DBSource子节点的值为数据集,并对接口存储参数进行连接,其实就是连接数据集,而且对“即插即用”的必备信息更好地实现。
        2.2设计系统模式和在线开发新功能
        分布式计算机软件数据整合平台实现了对应用数据的信息化应用,该平台中对于企业管理运行中元数据的处理和开发同步并行展开,在实践中,根据企业的需求不断地优化数据处理方式以及在线开发出新的功能。如企业人力资源部门在应用管理中,向企业的技术开发部门发出关于企业技术水平等的数据的需求,这一访问请求被传输到企业网络系统的内部数据库中,由于人力资源部门所提出的信息数据同技术开发部门具有差异性,两者处理数据的方式不同。在传统的计算机网络下,该数据的访问效率和处理效率较低,但是在分布式计算机软件数据整合平台中可以将元数据进行相应的解析和处理,确保人力资源部门和技术开发部门都能够得到一个符合自己功能需求的数据。之后整合平台还能够发挥服务生成器的作用,构建软件操作页面,完成新软件的设计和开发工作。
        2.3传输负载模型及数据存储结构的构建与重组
        为实现对虚拟数据库异地异构数据源整合算法的优化设计,需利用虚拟数据库异地异构数据存储节点的分布式结构重组方法,构建异地异构数据的传输负载模型;利用相空间重构方法进行虚拟数据库异地异构数据的特征重构,根据重构特征建立虚拟数据库异地异构存储结构模型。
        2.4分布式数据源的调度策略
        在整合系统的过程中,获取分布式数据源是一个难点。结合分布式数据源特点,为了使相应的获得最小,对当前数据源状态和网络状态必须要充分考虑到,在调度和算法上,不管采取那种方法,必须要将额外工作落实到位,促使系统运行效率有所降低。对分布式数据源来说,由于具有一定的多变性,在设计本系统时,可采取以数据为调动的方法。在处理过程中,首先,对请求数据源进行判定,将可用数据源判定出来,其次,针对可用数据源,将数据请求发送出来,最后,系统的状态要处于数据监听状态,如果对数据源提交数据接受到,可根据请求立刻会话,将同构数据打包,缓存到本地,当缓存完之后,在发送给相应的用户。
        结语
        数据整合虚拟数据库系统是针对关系数据库以及数据服务设计的。对于存在于本地或网络的非结构化文档需要构造抽取器使其结构化,方能使用。为了扩充系统数据源的类型,抽取器的研究将是下一步研究的重点。
        参考文献:
        [1]张川.计算机软件数据整合平台设计初探[J].现代盐化工,2020,47(02):61-62.
        [2]喻燕华.计算机软件数据整合平台设计探究[J].计算机产品与流通,2019(11):20.
        [3]胡成娟.分布式计算机软件数据整合平台设计研究[J].电子设计工程,2018,26(17):167-170+174.
投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: