曾伟波
福建正孚软件有限公司 350003
摘要:目前大数据诸多的隐私泄露、虚假数据以及完整性破坏等安全风险严重影响网络用户的安全,阻碍了大数据的进一步发展,庞大的数据量更是对其存储性能提出了巨大的挑战,所以,越来越多的相关领域聚焦于大数据安全存储方面的研究。
关键词:区块链;非结构化大数据;安全存储;
引言
网络信息技术被应用到众多不同的领域,如金融和供应链交易、工业领域上网控制系统等,在完整且成功的交易中衍生出了非常多的动态数据资源,数据的产生是需要双方或多方的实体进行参与的。而这些动态数据的产生系统即为实例系统。完成各自产业编码,并对其进行编码的数据被称为动态数据,它的存储安全性方面与传统数据比起来也有着更加严格和高标准的要求。除了对数据的访问、实体描述以及其安全性能的保护之外,动态数据还要完成与之相关的资产安全的保护,另外最为重要的一点是要保证这些数据在被存储以及进行转移时能够不被随意改动和伪造。
1基于区块链的非结构化大数据动态安全存储技术
1.1区块链下分布式数据文件加密模型
模型中所有构成部分之间的交互操作,均通过区块链非对称加密技术而创建的公私钥得以实现,其中公开地址是公钥,而私钥则保存在各自对应的模块中。在广播数据的过程中,用户使用私钥将数据描述、访问形式等信息加密,通过交易的方式使数据版权(即信息的真实性)得到保证。如果交互授权的对象为双方用户,则可采用公私钥加密私密信息。比如用户A发送授权信息给用户B,需要用户A先使用用户B的公钥加密授权信息,取得加密信息{message}B,从而保证解密查看的对象仅为用户B;其次,用户A再利用独有的私钥对{message}B进行加密,得到数字签名信息{{message}B}A',使信息来源的可靠性得到保证;用户B接收到数字签名的加密信息{{message}B}A'后,先使用用户A的公钥解密,获取加密信息{message}B,评定来源的可信度;最后用户B利用其独有的私钥解密,得到数据授权的初始信息{message}。在区块链内保存着透明、完整的全部数据交互与版权信息流程,因为无法篡改,且用户数据无需在第三方机构中托管,不会得到缓存,所以当出现版权纠纷时,在区块链的记录里就可以实施权限追溯,对数据进行维权。区块链全部数据的备份通过各节点得以实现,如果链中的冗余数据量过多,将使共识效率下降,并增加额外的节点存储与运算成本,因而采用分布式文件系统,对数据描述等次要信息与验证完权限的数据访问形式进行记录。
1.2非结构化大数据动态安全存储的实现
虽然分布式文件系统能实现PB量级的数据存储,但存在访问延时较长的弊端,为了改进分布式文件系统的动态安全存储性能,通过MongoDB非关系型数据库的引入,设计一种分布式文件系统与MongoDB相结合的动态安全存储技术,以使非结构化大数据的动态信息存储得以实现。在MongoDB的结构中,用户模块含有MongoDB的访问接口,用于数据的缓存维护,提升访问速率,比如集合区域的信息;协调服务模块是为了保证总体的系统集群里有且仅有唯一一个主控制节点,该模块不仅可以完成全部集合寻址入口的存储,还能对集合服务状态进行实时监控,令主控制节点采集到实时的集合服务状态信息,主要用于MongoDB模式信息的存储与管理;控制节点模块的功能是达成集合空间的分配目标,调度元数据存储负载,检测到失效节点时转移故障,对MongoDB的垃圾文件回收请求与schema的更新请求进行处理;而集合服务模块则主要解决数据的I/O请求以及自动分片较大数据量的集合.
2安全存储方案设计
网络数据平台通过对区块链技术的应用,使得网络数据的存储变得更加安全且高效,因为区块链具有安全可靠的特性。网络数据平台的一个主要的设计方案为共享访问的方式,而该方式是建立在公钥加密的基础上的。用户的公钥全部由相关机构进行保管,而且对使用者的网络数据进行公钥方式下的加密,使用者如果想要访问自己的个人数据,可以通过私钥进行访问。此外采用区块链技术可以使数据避免因为外界的不良攻击或者管理者不当的权限管理造成的数据流失等问题,使得数据管理变得更加的具有安全性,这主要归功于区块链高度安全、隐私、去中心化等的优点。(1)进行区块链数据的传输,即将由存储中心生成的存储记录元数据和摘要进行区块链的传输,对元数据的数据ID等信息进行记录;(2)将存储记录传输到中心,传输过程需确保安全可靠,网络数据通过存储中心的记录和传输后,存储机构会对以上数据进行加密,通过加密算法下的加密之后,会传输到最终的使用者手中,再通过加密算法进行分发对称密钥。使用者需要对会话密钥进行解密,会话是由储存中心发送过来的,而解密方法是使用自己的私钥,接着再对以上会话的记录进行解密,解密方法是使用会话密钥,整个过程可以确保安全的分发密钥,并且存储可以得到安全快速地传递;(3)使用者在解密完存储记录之后,再将其传输至数据库。使用者对新生成的会话密钥进行加密和存储,并将其传输到数据库中尽心存储。网络数据的最终拥有方为使用者,为了使不同的用户对数据的访问得到有效的控制,其他使用者的使用权限也是要根据网络进行合理分配的。
3动态数据区块链存储系统的问题建模与改进建议
3.1区块链环境下动态数据的安全存储技术
区块链实质上是通过分布式的管理,对动态数据的传递、存储进行控制,属于开放式的技术账本管理,在技术账本中,能够对动态数据进行记录,如重要的交易活动信息录入等。同时,区域链系统记录的动态数据是以块为单位的,在区块中,不仅记录着动态数据信息,还会包含着这项数据的来源以及与前一个块的连接点,这样相关的工作人员在需要一些数据的时候,能够快速检索到需要的数据信息,缩短动态数据调动的时间。此外,不同的区块中可能记录着部分相同的动态信息,因此,任何操作者都无法单一地对区块中的信息进行改动,提升了动态信息处理与利用的安全性,被广泛地应用于信息相关产业中,具备较高的研究价值。
3.2区块链动态数据系统改进的方向
区块链技术研究与应用的深入发展,使得人们逐步认识到区块链技术的应用优势,通过在操作系统中形成的激励机制,使得各节点可以以有效性这一标准达成共识,发挥激励作用,提升动态数据处理的实效性。但是如今的区块链技术在共识机制上的应用以及表现都存在着明显的不足,所以对于现阶段的区块链技术来说,应结合数据存储的技术特点对共识机制进行优化,针对输入数据的权限以及写入数据的同步技术两个问题,对运行机制的改进目标进行确定。具体包括四点:①验证权限需要输入令牌;②设置区块链实时广播功能;③对验证者的广播信息进行接收;④在验证者列表添加自身节点。
结束语
网络数据的大爆发促使探究存储非结构化大数据技术变得至关重要,因此,提出新的基于区块链的非结构化大数据动态安全存储技术。构建多用户规则调度模型,采用存储信息种类构建集中式存储管理模型,通过分离数据源与数据管理,得出区块链分布式模型,经过对授权信息的加密与解密,设计透明、完整的全部数据交互与版权信息安全流程。利用分布式文件系统记录数据信息,得到区块链的分布式文件加密系统模型。最终将动态存储平台的MongoDB非关系型数据库与其进行融合,实现非结构化大数据动态安全存储技术。
参考文献
[1]徐望,张常泉,黄强.浅析云存储中的数据安全面临的问题及解决对策[J].南方农机,2020,51(23):150-151.
[2]成丽娟,祁正华,史俊成.基于区块链的EHR数据安全存储共享方案[J].南京邮电大学学报(自然科学版),2020,40(04):96-102.
[3]薛国.基于云计算的大数据存储安全研究[J].数字技术与应用,2020,38(06):178-179.
[4]邸洪波,戴伯伦.大数据安全保障关键技术研究[A].公安部第三研究所、江苏省公安厅、无锡市公安局.2019:4.
[5]张帆,胡博.非结构化大数据存储系统安全性增强技术分析[J].科技资讯,2019,17(26):24+26.