迟晨光
江苏国瑞信安科技有限公司 江苏省南京市 210000
摘要:随着大数据时代的降临,数据成为了我国战略资源与创新生产的重要基础,资产与战略价值不断增长的同时,海量的数据也在持年增加,随之而来的就是针对这些海量数据增长下所引发的安全性问题。而机器学习在我国属于一门较为新兴的学科,应用十分广泛。对此,本文针对基于大数据分析技术的数据安全与机器学习进行深入的探讨与分析,并结合实际应用,阐述以机器学习来解决一定范围内的数据安全问题。
关键词:大数据;机器学习;数据安全
引言
伴随着计算机等多种学科的高速发展,机器学习也逐渐诞生,并且得到了较为广泛的应用,像在检测垃圾邮件、人脸识别、语音识别等方面。在通过现有的研究成果当中能够了解到,机器学习已经在数据安全方面得到了非常权威的应用。基于对大数据的概念,对其特点展开分析,并深入了解当前数据安全的重要性,探讨如何应用机器学习来解决对于数据安全的问题,以此来更好的迎合大数据时代的发展。
1、大数据的意义
现如今,网络的普及促使人们网络行为成为了常态化的现象。而大数据就随着这种网络不断产生,很多企业针对数据进行采集,逐渐渗透并扩散,像是现在社交软件言论,网络购物数据等等。在传统的结构与意义上,数据是不同的,但是这些数据都包含了数据生产者的真实信息。总体而言,大数据具有很高的价值,而当前也正是一个大数据的发展时代。
大数据处理技术及其处理框架在多个层面上是计算机技术的融合。大数据处理涉及多个软件、硬件系统的综合信息处理技术。在大数据处理技术的主要技术层面和技术内容上划分为不同层面,具有着各自的功能与特点,详见表1。
表1大数据处理技术
.png)
2、基于大数据的数据安全
2.1新技术带来的挑战
分布式计算机在其存储架构、数据深度挖掘和可视化新技术方面都提升了数据资源的存储范围与能力。但是,也为整体数据的安全保护带来了全新的挑战。第一就是对系统安全的边界模糊,极有可能引入未知漏洞,分布式节点距离之间与大数据相关组件之间的通信安全已经成为了全新的安全薄弱重点。第二,分布式数据资源池具有汇集众多用户数据的功能,却也产生了用户数据隔离的困难,大数据一般在云端存储,而云端的开放性非常强,使用范围与用户的数据十分庞大,导致安全风险问题持续累计。在分布式数据中,对不同分布式文件系统的特性对比也具有一定的代表性,详见表2。
表2分布式文件系统的不同特性对比
.png)
2.2新需求带来的挑战
在大数据时代背景下,每个领域对于数据资源的应用和占比需求都在不断增加。数据之所以被广泛的应用和收集,来源于它的智能性与便捷性。移动智能终端、智能联网设备、传感器都对其进行了广泛的吸收应用,这促使虚拟世界正在成为现实世界的一种写照。对于数据不对延伸扩散和安全信息保护来说是全新的挑战。
3、机器学习的概述
机器学习是当前逐渐新兴的一门交叉科学,现如今已经逐渐应用在多个领域当中,像是语音识别、垃圾邮件检测等等。机器学习其策略内容丰富包含类比学习、机械学习、归纳学习。机器学习已经被广泛的应用在大数据领域当中,基于大数据,利用计算机学习对微博用户分析归纳等。
4、机器学习技术在数据安全的应用
机器学习含有极高的智能行为,其方法众多,在大数据具有超高复杂性和多样性的同时,也为机器学习的安全性提供了全新的思路。
4.1存储数据防火墙检测
大数据当中一个最为重要的环节就是存储,一般用户信息的泄漏都是由于存储机制不完善,以至于恶意攻击导致数据安全事故发生。利用机器学习对防火墙异常进行常规检测,建立防火墙网应对各种恶意攻击。
机器学习的方法能够解决很多不安全因素,利用统计学模型从海量数据中获取到隐蔽可理解而有效的信息,通过这些信息,来识别与正常数据不同的异常数据。
4.2海量软件中识别恶意攻击
伴随着现如今移动网络的不断普及,我国的手机用户每年都在增长,用户更多的会进行网络行为,这与软件相关。在海量的软件中,恶意软件数量也在增加,机器学习可以针对这样的现象发挥一定的作用,从大数据已知软件中提取样本。有效区别恶意软件与正常软件的行为特征,并展开存储划分,能够对恶意软件的出现形成一定的预防和警示作用,并提高整体恶意软件的检测效率。
结束语:综上所述,大数据时代促使数据发挥了极为重要的价值,同时也增加了数据安全的风险性,而机器学习能够为数据安全提供稳定的技术保障,通过机器学习能够得知大数据当中的恶意攻击,在其检测方面具有一定的特性优势。
参考文献:
[1]刘胜娃,孙俊明,高翔,王敏.基于机器学习与态势感知技术的钻井液大数据分析与智能决策支持平台建设[J].物联网技术,2019,9(05):46-48+51.
[2]刘伟佳,李博权.物联网、大数据分析和机器学习技术在灾备中的应用研究[J].微电子学与计算机,2018,35(12):55-58.
[3]张靖雨,王潇枫,周楠.基于大数据分析技术的数据安全与机器学习[J].电子技术与软件工程,2018(06):203.