田楠
国网湖南电力公司湘西供电分公司
摘要:现代社会已经是网络社会,计算机网络在社会生产生活中的方方面面发挥了重要的作用。在计算机网络应用的过程中,面临着多种威胁,其中网络病毒风险是最为常见的也是危害最大的,因此建立安全的计算机网络病毒防御系统具有非常重大的意义。本文对数据挖掘技术在计算机网络病毒防御系统开发中的应用进行分析研究。
关键词:数据挖掘技术;计算机;网络安全;病毒防御
前言
计算机网络病毒是对于计算机系统及其应用最大的威胁,对于社会正常生产生活极为不利。一般情况下,病毒技术要领先于计算机网络安全技术,这是由于传统的网络安全技术主要是以被动防御为主,先进的病毒技术是以主动攻击为主。随着计算机网络技术的大规模应用,高效的病毒防御系统已经成为必不可少的网络安全设施,多个公司也积极开发计算机网络病毒防御系统,但是在我们的生产生活中,依然面临着病毒攻击的威胁。数据挖掘技术是一种以大数据技术为基础的病毒防御技术,其是通过收集病毒数据,形成巨大的病毒数据库,然后以大数据技术分析网络病毒的特征,针对网络病毒的特征进行防御的一种技术,是现阶段计算机网络病毒防御系统开发与应用的主要趋势之一。
一、网络病毒和数据挖掘技术概述
1.网络病毒
计算机网络病毒不同于我们传统认知上的生物病毒,它其实与计算机程序一样,是一段可执行代码,不同的是计算机网络病毒具有恶意攻击性,会对计算机安全造成巨大的威胁。由于计算机网络本身的开放性,网络病毒能够通过多种网络媒介进行大范围的传播造成极大的危害。根据网络病毒攻击的目的不同,其本身也分为多种类型,有以盗取用户数据为目的的木马病毒;有以破坏计算机正常运行,造成网络瘫痪的蠕虫病毒;还有恶意劫持浏览器推送广告的病毒等。并不不仅类型多,传播力强而且具有非常大的破坏性,是现代网络安全的主要威胁之一。因此,针对计算机病毒开发防御系统,防治计算机病毒的恶意攻击,保护信息安全受到了人们的广泛认可。社会中有许多以网络安全病毒防御业务为主的公司,比如360公司、瑞星公司、金山公司等。其都以自己开发的安全防护软件为核心业务。病毒在攻击时会先对用户的计算机信息进行全方面的扫描,利用这一特性,使用数据挖掘技术,可以有效识别病毒,这也是利用数据挖掘技术开发计算机网络病毒防御系统的基础。
2.数据挖掘技术
数据挖掘技术是针对计算机的数据库进行全方面的分析与判断,从而寻找出有效信息的一种技术。在我们使用计算机的过程中,会产生大量的数据,这些数据可能是有用的,也可能是无效的,数据挖掘就是对所有的信息进行深入的发掘,寻找有用的信息。分析不同信息之间的关联,进行聚类与分类。通过数据挖掘之后,原本纷乱繁杂的信息并的井井有条,可以为相关的数据分析与数据决策提供基础。数据挖掘的应用场景不同,其应用目的与相关算法也有所区别,要根据实际应用需求选择与数据特征相关的算法。应用在病毒防御系统中,就是对病毒的行为进行检测,数据挖掘技术可以通过分析病毒的行为特征对其进行记录,一旦具有类型行为特征的代码侵入,就会启动报警机制,实现主动防御,从而保证计算机网络的安全。
二、数据挖掘技术基础上的病毒防御体系
1.关联性
关联性指的是计算机数据信息之中,不同信息之间存在的可以被有效关联的特征,计算机在使用过程中会产生大量具有关联性的数据,但是分布却极为随机。即便是两个看起来完全不相干的信息,其内在也可能存在着一些变量规律,从而具有一定的关联性。数据挖掘技术可以对这些数据信息之间的内在关联性进行分析,比如因果关联性、时序关联性、空间关联性等。关联性是数据信息之间的内在联系。通过关联性分析,可以有效的寻找隐藏在复杂信息之中的病毒代码。
2.异类性
异类性指的是计算机数据信息之中,大量具有关联性数据信息之外的孤立的数据信息,其与其他数据信息之间存在着明显的差异性,被称作常规数据之下的偏移数据。异类性数据的分析,可以有效的寻找在所有关联信息之外的孤立点信息,从而发现一些违法常规的现象,对于病毒的发掘具有非常重要的意义。
三、计算机网络病毒的防御系统中数据挖掘技术的有效运用
数据挖掘技术说起来简单,但是实现起来非常复杂,将数据挖掘及时应用到计算机网络病毒防御系统中需要五个模块功能组合实现,以下分别进行介绍:
1.预处理模块
预处理模块从字面意思理解就是对计算机的数据信息进行预处理,其对于数据挖掘及时非常关键,可以有效提高数据挖掘的效率,缩短挖掘时间。预处理模块是先对计算机信息进行分类分析与处理,可以提高数据玩觉得的精准度与辨识度。数据信息经过预处理后已经具备一定的条理性,并进行了简单的分类分析,再进行数据挖掘可以大大提高挖掘的速度,预处理工作完成后,数据信息被分类集中在一起等待进行下一步的工作。
2.规则库模块
规则库指的是包含有网络病毒相关信息、特征的数据库,是识别网络病毒的重要依据。在数据挖掘过程中,规则库不断的利用自己所掌握的病毒相关信息和特征与数据信息进行比对,从而达到识别网络病毒的目的。规则库的应用有效的提高了识别网络病毒的效率,在实际的应用中。规则库模块与聚类分析结合应用,可以大大提高网络病毒识别的效率,针对同类数据进行集中分析,寻找出差异较小且具有关联性的数据信息,从而实现对网络病毒的识别。
3.数据源模块
数据源模块中包含有大量的数据信息资料,可以直接传送给主机。其中重点的程被称为抓包程序,这是一种网络工具。该工具可以对特点的网络数据包进行抓包,并进行保存,将其传疏导预处理模块中进行处理。抓取的数据包大部分都是原始的网络数据包,包含有大量的原始数据,以及相关的特征数据,可以有效降低预处理的工作强度,提高数据挖掘的效率。
4.数据挖掘模块
数据挖掘模块也被称为检测模块,是数据挖掘及时的核心模块。其主要是利用数据挖掘技术对预处理后的数据信息进行筛选,寻找出有用的数据。应用在病毒防御系统中,就是寻找病毒数据。数据挖掘模块可以有效的分析各个数据信息的特征,通过与规则库模块中储存的病毒信息特征进行对比,识别出侵入的病毒。在整个处理过程中,对病毒的侵入检测是重中之重,这有赖于数据源模块的抓包程序提供的高效数据包收集能力。数据挖掘模块在处理完病毒后,还会形成事件库,对本次病毒侵入的路径、特征以及方式进行记录总结,然后记录到规则库之中。因此,数据挖掘技术应用与网络病毒防御系统,是具有可成长性的。
5.决策模块
在数据挖掘完成之后,会形成一个数据库,数据库与规则库中的病毒信息特征进行比对。如果发现相同或相似的特征,则表明可能感染病毒,如果难以匹配,则表明可能存在新型病毒。决策模块的主要功能就是判断病毒是否存在,并对病毒进行处理。
四、数据挖掘技术在病毒防御系统中的辅助模块
仅仅依靠数据挖掘技术,无法完成完成这的网络病毒防御系统。还需要其他功能模块的配合。一般来说主要有以下几类:
(1)监控模块:监控模块是对计算机数据库进行监控,以便实时掌握病毒的行为特征与数据的运行情况,以便及时采取处理措施;
(2)防御控制模块:多数计算机系统都带有网络防火墙功能,但不同的防火墙其主要的功能与能力不同,控制防御模块可以通过设置一些功能,避免病毒入侵;
(3)界面模块:界面是网络病毒防御系统的重要前端系统,是与用户进行交互的媒介,要具备较好的操作性与便捷性,具备较好的使用体验。
(4)后台数据模块:后台数据模块在一般情况下是静默的,但是在发现病毒入侵后要第一时间进行通知,保证对病毒的即时防御。后台数据模块主要是具有蚊子信息通知功能与数据包保持功能,可以完成简单的数据存储与传输。
结束语
自计算机网络出现其,计算机网络病毒就如影随形,对社会的生产生活造成了极大的危害和破坏。随着计算机网络越来越大规模的应用,网络病毒的类型与攻击手段也越来越丰富,网络的安全形势也越来越严峻,在这样的背景下,计算机网络的病毒防御系统是保障网络安全的重要工具。数据挖掘技术可以有效提高病毒防御系统的主动防御能力,提高网络安全性,是未来防护网络病毒的重要技术之一。
参考文献:
[1]孙福利.大数据时代的数据挖掘技术与应用[J].电子技术与软件工程,2018(1).
[2]柴艳妹,雷陈芳.基于数据挖掘技术的在线学习行为研究综述[J].计算机应用研究,2018(5).
[3]郑伟.数据挖掘在人工智能上的应用实践[J].电脑编程技巧与维护,2018,398(8):117-119.