王明俊
北方实验室(沈阳)股份有限公司 辽宁沈阳 110180
摘要:随着网络技术的快速发展,逐渐被应用到工作与生活的各个方面,节约了大量的时间,创造出更高的社会价值,进而造就更高的生产效率。然而,网络在更高经济价值的同时,也产生了与之相对的危机。这些危机不仅包含现在已经显露出来广为人知的,更包含那些尚未出现却可能发生的隐患。大数据技术的出现有效地减少了危害的产生,并提高了网络的安全性。本文就大数据技术应用于网络安全的数据分析展开阐述。
关键词:网络安全;分析;大数据
引言
信息和通信技术快速发展,越来越复杂的网络环境以及云计算和虚拟化的应用,也使主机与网络之间的动态界线变得十分模糊[1]。同时,网络攻击事件也频繁发生,隐匿性、持久性和盈利性网络威胁不断增多,使得网络不再安全[2]。但传统的网络安全分析技术由于数据源单一,处理能力有限,单纯依靠网络环境部署,在分析和使用威胁信息方面仍然存在一定缺陷,缺乏感知和预测网络安全态势能力。
1大数据时代的特点
大数据时代,数据增长速度非常快,呈现爆炸式增长,其中任何微小,不起眼的数据都可能产生难以估量的价值。大数据的关键特点是“大”,已经过去的MB和GB单位,提升到了TB、PB甚至是EB单位,对数据的存储空间提出了更高的要求。在信息技术和网络技术飞速发送在的背景下,各项数据的增长速度日益加快,网络交互是数据形成的主要来源,这也是大数据形式多样化的主要原因之一,大数据好涵盖的类型包括:日志、图片、视频、音频、文字等。现代人的生活生产都离不开互联网,每人每天使用互联网,都会产生大量数据,大数据技术能够从海量数据中,挖掘出有价值大数据,再利用人工智能进行深度分析,便能发现新的知识,从而更好地应用在各行各业,为提升社会经济发展速度,提高生产效率,推进科学研究提供基础数据支撑。
2网络安全问题
2.1不良信息传播
互联网时代信息的传播速度飞快,如果拥有一定的读者基础,一则消息可能在短短的几分钟内就突破上万的阅读量。这在很大程度上扩展了人们的视野,但也为不良信息的传播提供了有利条件。不良信息分为虚假信息和黄色信息。两者虽分属类别不同,但其带来的危害都是不容小觑的。虚假信息经由信息网络的放大化后,原本虚假的事情变作“真实”,引起人们的恐慌,严重者甚至可能发展到对社会产生危害。黄色信息主要是针对未成年人,心智尚未成熟的未成年人过早地接触,若没有好的引导,可能危害到其身心健康,严重者甚至走向违法犯罪的道路。这些不良信息的传播都是极其恶劣的行为。
2.2网络病毒
网络病毒含有极强的破坏性,其本身拥有复制和传染的功能。一旦网络系统遭到侵袭,往往伴随着数据的损坏,严重则网络崩溃,系统陷入瘫痪。网络病毒的传播途径有文件共享、网络服务器及E-mail电子邮件传播,将携带病毒的网站链接附在电子邮件中,或者电子邮件本身隐藏着病毒。通常的网络病毒所造成的结果主要是硬盘格式化、破坏数据库或远程操作计算机。网络病毒的特点在于感染速度极快、传播性强且无法彻底清除等,这些特性对于携带着大量信息的网络而言,潜藏着着巨大的隐患,网络安全问题在此便显得尤为重要。
3网络安全分析中的大数据技术应用
3.1数据采集
流量与日志是研究者用做网络安全分析的最为重要的研究数据。如果能够在网络安全分析中完美嵌套上数据挖掘算法以及大数据分析技术,将可以不断的完善各项数据收集任务的工作质量与效率。与传统的数据收集工作来比较的话,引入大数据分析技术的数据采集工作将能够更好的保证数据的完整度和收集效率。
3.2数据检索
与原始的数据检索方式相比较,引用大数据分析技术能够完善目前的数据检索的方式,并能大大降低原始检索方式的时间复杂度。引用大数据分析技术能够实现并行化方式来进行数据检索,将所需要的检索需求任务可以同时发布给大量的分节点,这些分节点能够同一时间接收到任务并同时触发任务,然后这些分节点能够各种数据挖掘算法计算来判断出是否存在契合任务所需要的相关数据。如果分节点判断出自己是具有满足任务的数据时,即可将数据反馈给上层节点,从而实现数据检索的相关任务。与传统方式相比,运用大数据分析技术能大大降低该任务的时间复杂度与空间复杂度,降低了工作者的工作难度,极大地提高了检索工作的质量与效率,减缓了工作者的工作压力。
3.3信息萃取技术的应用
为保证网络安全,需要对数据信息进行全过程安全防护,保护数据生产、数据存储、数据处理、数据转发等。这些信息在网络系统中可分为两大类型,其一是元数据,其二是内容数据,可用于描述实体的行为,萃取实体的行为信息,再按照萃取结果开展综合分析,是保证网络安全的前提。高级信息萃取技术的应用效果,直接关系到网络系统实体用户分析的广度和深度。传统信息萃取技术有:通信语音识别、语种判读、视频信息分析等。基于大数据技术萃取信息则包含更多的内容,可从PDF电子文档中分析文档传播的路径、编辑修改相关信息。也可以从浏览器信息中获得上网人员的相关信息,或者从用户使用数据中获取相关敏感目标信息等。总而言之,基于大数据技术的萃取技术种类繁多,需要结合实际网络分析相关内容,开展全方位、大纵深信息萃取,从而形成物理实体的行为信息,然后再通过地址聚合分析、联系链逐跳分析等方法,就能通过逐步聚合的方法达到各类实体的相关信息。
3.4数据储存
随着互联网技术的不断提升,尤其是移动互联设备的普及,使得每天都会产生海量数据。而这些数据中有传统的结构化数据,也有非结构化数据乃至半结构化数据,如何储存这海量的数据是网络安全分析的工作者们需要解决的头等问题。大数据分析技术的引用当即能够解决工作者们的燃眉之急。上文讲到,引用大数据分析技术能够加快数据检索工作的效率和质量,意味着在同等的工作时间内,引用大数据分析技术能够更快更多的检索数据并且各个分节点也能够迅速给出反馈信息,加快比对并将海量数据分门别类的存储起来。也就是说利用大数据分析技术能够使得对海量数据处理的方式更加规范,处理规则更加统一,所得到的结果更加精确,最后把得到的各类新的数据分开存储到各个位置,等待数据挖掘与分析工作的进行。
3.5数据处理
利用大数据分析技术来进行网络安全分析,实践上就是想要通过实现不同种类的数据挖掘算法和分析技术来完成网络安全的分析。与传统的流水式数据处理技术相比,大数据分析技术对于海量数据分析处理的优势则是分布式处理技术。大量的分节点以不规则分布方式存在,待任务触发时,能够并发处理各项数据,从数据预处理,到算法核计算、分析以及最终的分析结果等步骤无不体现了运用大数据分析技术的优势。不仅降低了任务的时间复杂度与空间复杂度,而且最终所得到的处理结果的准确率与完整性更高,消耗的时间更低,整体处理效率更高。
结束语
随着信息化时代的不断推进,网络安全问题开始受到大多数人的关注,对于网络安全问题的处理解决以及保障方式进行了大量的研究与分析。研究表明将大数据技术应用于安全网络分析,能够有效地加强网络安全,规避风险,为用户提供一个安全良好的使用环境。新时代下,大数据技术已然成为新的网络安全应用趋势。
参考文献
[1]刘春林,袁丹丹.网络安全分析中的大数据技术应用.数字通信世界,2018,161(05):196
[2]陈小波.浅谈网络安全分析中的大数据技术应用.网络安全技术与应用,2018,000(004):45,64
[3]修健.网络安全分析中的大数据技术应用分析.网络安全技术与应用,2018,000(003):67