甘肃航天云网科技有限公司
摘要:现阶段,随着社会的发展,我国的软件工程的发展也有了进步。数据挖掘就是从大量数据中寻找其规律的技术,它是多个学科的综合运用,并且已应用于多个领域,利用该技术能够极大提高人们工作的效率。软件在开发过程中需要收集大量的数据,并需不断将数据进行更新,将数据挖掘技术应用于软件工程中具有较高的价值。基于此,本文首先进行了数据挖掘技术的概述以及介绍软件工程数据挖掘存在的挑战,随后从三个方面讲述了数据挖掘技术在软件工程中的应用,以此来供相关人士交流和参考。
关键词:数据挖掘技术;软件工程;应用与研究
引言
数据挖掘是大数据分析领域中的一个新的数据处理理念,它的核心思想是通过对数量巨大、但价值密度低的数据进行分析处理,从而提取出一些对所研究的问题有价值的信息。随着软件工程的发展,在软件开发和项目管理过程中也逐渐出现了海量数据分析的难题,例如源代码管理、版本管理、漏洞分析、系统操作记录。软件长期运行所积累下来的数据,由于数据量过大,传统的数据处理技术显然是不可能完成的。为此,研究数据挖掘技术在软件工程中的应用具有重要意义。
1数据挖掘技术的概述
数据挖掘是在大量的数据中探测有意义的行为和规律,它不仅可以应用于研究领域,使研究人员快速获取大量目标数据,还能够应用于商业中等多个领域。该技术可以了解数据中潜在的规律,还能够用历史数据对未来进行预测。它能够检测海量数据中的异常数据,发现数据中显著不同于其他数据的对象。数据挖掘系统也在不断的发展,初代系统是作为一个独立的应用,可以支持一个算法,也可支持多个算法,而现在的系统能够和各种移动数据相连,并且大多都存在计算模型,可以应用于多种移动设备。在进行数据挖掘的过程中,首先要对数据进行预处理,能够对不一致或不完整的数据进行清除,还能够进行数据的抽样,能够保证数据的正确性以及统一性。随后需进行数据的挖掘,挖掘过程中有多种算法可对数据进行分类与预测,分类过程中可以构建模型对现有的数据和新数据进行分类,建立函数值模型能够对数据进行预测,此外还有聚类、关联等算法。最后需要根据挖掘过程中所选择的算法和最终产生的结果对整个过程进行评价,还要将结果传递给客户,需要将信息模式进行转换,使用户可以理解。
2数据挖掘技术在软件工程中的应用流程
为确保数据挖掘技术与软件工程的有效衔接,发挥数据挖掘技术的优势,工作人员有必要从整体上,确立数据挖掘技术在软件工程中的应用流程,通过这种方式,保证了数据挖掘技术价值的充分展现,无形之中,降低了数据挖掘技术的应用难度。数据挖掘技术在软件工程中的应用主要包括数据预处理、数据挖掘、模型表现等三个不同的阶段。在数据预处理阶段,主要任务与目标是,对获取的原始数据进行处理,厘清目标对象,实现有效数据的分离,并且在数据预处理的过程中,对软件工程中涉及到的原始数据进行了清理,将冗余信息进行清除,同时对部分缺失数据进行补充,形成完整的数据链条,从而为后续软件开发、软件管理以及软件评测工作的开展提供了参考。在数据挖掘的过程中,为保证挖掘效果,需要明确挖掘人物,认真做好数据的分类、归纳、评估以及总结工作,在此基础上,对挖掘方法进行针对性选择,选择过程中,要结合数据自身的特点以及软件工程相关工作的具体要求,对数据挖掘方法做出必要的调整,确保挖掘的有效性。为实现挖掘结果的完整表达,可以使用模型评价或者知识表示的方式,将数据挖掘的结果以更加完整、系统的方式呈现出来,使得相关工作人员能够在相关数据挖掘结果的指导下,有针对性地开展软件开发、管理以及测评工作,大大增强了软件工程的时效性,为后续相关工作的开展奠定了坚实基础。
3数据挖掘技术在软件工程中的应用
3.1软件工程调试中的应用
软件编码完成后需要对其进行调试,调试过程中需要对漏洞进行修补,对错误信息进行更改,能够提高软件的质量,满足用户的需求。但调试工作较为复杂,不同软件工程需要测试的项目不同,并且需要根据用户的需求进行检测,工作量较大。部分软件的设计较为复杂,系统调试的难度就随之增加。数据挖掘技术的应用可以使调试工作进行得更为顺利。数据挖掘过程中可以对数据进行处理,从而可以清理错误数据和不统一的数据,并且能够填补遗失的数据。此外还可以建立模型进行模拟,能够保证软件工程系统的稳定性。
3.2软件工程错误检测中的应用
软件工程在开发时就需进行调试,从而修补漏洞,提高软件的质量,质量不佳的产品在使用过程中的维护费用和使用成本都较大,还会存在其他的风险。软件在应用之前要对存在的bug进行严格的检测,部分bug会导致严重的后果。例如我国就曾因设备出现bug从而发生了严重的动车追尾事故,造成了较为严重的经济损失,并且导致多人伤亡。而漏洞检测过程极为复杂,需要花费的时间较多,会使软件开发周期增长。利用数据挖掘技术能够对开源软件中和克隆的代码进行检测,能够根据这些代码推断错误之处。
3.3有序开展软件项目管理活动
数据挖掘技术在软件工程项目管理活动中的应用,应当着重做好两个方面的工作。具体来看,工作人员借助于数据挖掘技术,对软件版本控制相关信息以及软件内部的组织关系进行深入挖掘、全面梳理。对两方面的数据处理,使得软件工程各个环节之间的联系性以及协调性得以充分展现出来,帮助工作人员更好地掌握软件开发的相关流程,这就为人员的调配以及流动创造了条件,尤其在项目管理的过程中,在数据挖掘技术的帮助下,各类电子邮件、共享文档成为处理对象,各个部门之间,员工与员工之间的联系进一步加强,避免了软件工程中出现混乱,保证了各项软件工程活动的有序进行[5]。同时通过对软件版本信息的有效控制,可以将项目管理与用户需求之间衔接起来,有针对性地完成软件功能或者架构的调整。同时在数据挖掘技术的引导下,软件项目管理的总体成本得到有效控制,并且能够对软件运行日志进行实时的获取与反馈,有针对性地开展相关工作。
3.4着力提升故障检测能力
软件工程涉及技术类型较为多样,软件工程中一旦出现故障,势必影响整个软件开发的进度,造成额外的成本支出。同时由于技术的复杂性,使得软件工程故障的排除难度较高。数据挖掘技术的应用,可以根据软件编写中API等规则,对运行过程中产生的各类信息进行分析,在分析过程中,如果发现错误信息,及时向工作人员发出提示,进行警报。工作人员在获取警报后,根据相关信息,对软件的故障区域进行针对性的维护、处理,从而大大增强故障检测以及应对能力,实现了软件工程体系的优化升级。
结语
随着软件产业的不断壮大,软件工程只有不断引入新的管理和技术工具才能适应快速发展的需求,作为一种可实现快速精确测量的数据分析技术,数据挖掘成为了软件工程不断向前发展的重要支撑。与此同时,数据挖掘技术也在不断地发展进步,各种新的数据挖掘理论不断涌现,使大数据的处理变得日益方便快捷。不难发现,在未来的软件工程中,各类大数据分析技术将与软件开发和管理过程更加紧密地融合在一起,为软件项目的评估、开发过程管理、系统测试及维护等工作提供重要的决策依据。
参考文献:
[1]蒯天宇.数据挖掘技术在软件工程中的应用[J].数字技术与应用,2018,036(005):112-113.
[2]张勇.软件工程行业中数据挖掘的应用探讨[J].中国新通信,2018,020(005):89.
[3]刘芬.计算机数据挖掘技术的开发及其应用探究[J].现代工业经济和信息化,2018,008(006):47-48.
[4]龙艳.分析数据挖掘技术在软件工程中的应用[J].科技风,2019,370(02):89.