徐静
无锡市梁溪区人民检察院 江苏无锡214011
摘要:随着互联网通信技术的高速发展,云时代的到来,大数据技术被广泛应用于生活的方方面面,对企业的各项决策也起到非常重要的作用。例如餐饮O2O模式、物流网络优化、城市智能交通等,这些都要靠大数据来实现。本文通过研究大数据时代的信息处理技术,来探讨大数据对网络信息处理技术的影响。
关键词:大数据;计算机;信息处理技术
引言:
大数据技术运用在计算机信息处理上,是近年来兴起的新型技术手段。大数据技术依靠先进的软、硬件功能,完成了传统计算机信息处理技术所不能完成的任务,面对十分庞大且复杂的数据群,它仍然可以采集出有效数据对其进行处理分析,提高计算机信息处理水平与能力,它在信息处理技术方面具有十分巨大的发展潜力。
1计算机信息处理技术
计算机信息处理技术涉及的内容比较广泛,如图1所示,它涵盖了大量数据的存储、多样化信息的处理分析、信息的传输等,是一种过程较为复杂,涵盖面很广的计算机技术。它包括了信息系统技术、检索技术和相数据库技术、通信网络技术等类别。随着大数据的发展运用,数据库技术的信息处理能力大幅提升,数据库技术为成为了计算机信息处理技术中的关键,对信息数据的处理水平非同一般[1]。
2大数据时代计算机信息处理技术
2.1 公布型数据存储技术和网络深层空间技术
面临大量的数据群时,计算机需要强力的存储系统。目前有一种前沿存储技术,叫分布型数据存储技术。它是由 GFS技术发展而来,现已被许多大型、技术先进的互联网公司所采用。分布型存储技术不同于传统的以行为单元来进行存储的方式,它是将列设置成基本单元来实现数据的存储。分布型存储技术的循环速度快、数据压缩大,对数据的存储处理能力比传统技术更强。随着科学技术的进步,还出现了更为先进的行列混合型存储技术,它提取了行存储技术和列存储技术这两者之长,能面对更加复杂多变的数据,进行更快的采集和处理。网络深层空间技术是大数据时代一种信息处理能力快速、高质量的技术类型,它可以快速整合大量数据,并对数据进行有效处理,具有空间分布性广阔、访问途径特殊、多维度多层次、信息规模大等特点。
2.2快速索引法与遗传算法
(1)快速索引法:目前的热门快速索引法主要是聚簇索引和互补索引。这两者间的区别主要在于索引方式的不同。聚簇型索引是将信息按照一定顺序聚合而进行存储处理;互补型搜索引擎是由列到表的将索引信息交织成网,相互补充,对表与表之间的信息完整性有一定参考价值[2]。
(2)遗传算法:遗传算法是以达尔文生物进行论为启发,衍生而来的一种计算模型,它的主要原理是靠模拟自然进化过程来直接的对所有个体参数进行选择优化。通过不断的优化调整来筛查有效数据。
2.3内容数据挖掘技术
在计算机内容经过数字化,形成数据基础的背景下,数据挖掘技术可以从海量的数据库中提取出有效信息,它的主要技术模式有网络跟踪搜索技术和关联技术。随着媒体行业的发展与变革,信息量急剧上升,人们可以通过各种渠道接收大量的信息,这就对信息的精简度有了一定要求,目前精而段、内容涵盖度高的短文本信息被各界媒体所关注运用,针对这样的情况,排序学习算法技术被广泛应用,它通过逐列、逐对和逐点分析信息,根据相关度进行信息排序。
2.4数据索引与可视化
伴随着大数据、云时代各种智能手段的成熟,面对数量越来越多、结构越来越复杂的信息数据群,上文简要提到了两种数据快速索引技术:聚簇索引和互补索引,都可以实现对它们的高效信息处理。聚簇索引依靠顺序单元进行索引,而互补型索引依靠多副本进行索引。对于索引采集的各种信息数据,用户想要以直观的效果来得到信息处理结果,就需要可视化的技术来需要提高信息的表达、传递效率,将这些繁杂的信息数据以样表、视频动画等形式展现出来,便于用户提取分析。
2.5分类、聚类分析技术
分类分析技术可以把数据库中的数据项映射某一个类别中,在类别已定义好的前提下,为用户提供合理的预测;与分类分析技术不同,聚类分析技术是提前不确定分组情况,将没有类别标签的数据划分到不同区间,再对这样一个区间进行整合。目前,分类及聚类分析技术发展迅速,是数据挖掘领域研究的重要内容。
2.6数据挖掘及分析技术
计算机信息处理新技术的崛起,很多都是在网络云智能的大背景下诞生。随着互联网销售平台规模的不断扩大,网络购买力的加强,很多商品的网络需求量巨大,平台的原始数据不断累积,销售数据在数据库中占比很大,为了对类似销售数据这种大量、无规律的数据进行合理的采集处理,从中提炼出具有商业价值的数据信息,从而对企业未来的销售决策产生有效的指导作用,计算机通过数据挖掘和数据分析技术相互配合,来对需要采集的数据信息进行深入分析。有很多新兴技术手段在数据挖掘领域出现,比如机器学习技术和关联规则技术。机器学习技术是人工智能的一个分支,它是让机器以人类的学习过程为模板去进步优化。在数据挖掘分析方面,机器学习技术突破了人类学习依靠大脑的限制,可以对大量的数据进行学习,实现对大量数据的分析预测。关联规则技术应用在数据挖掘领域,可以在大量的数据中找出高度出现的集项,由高频集项引发强规则,即对数据信息之间的关联规则进行量化,为用户提供有效的数据信息。
3总结
通过对大数据背景下信息处理技术的研究探讨发现,大数据的应用引发了信息技术和商业的巨大变革,有效推动了网络信息技术的发展,但我国的大数据技术和发达国家相比还存在差距,有很大的进步空间。加强对大数据技术的研究应用,具有不可估量的时代价值。
参考文献:
[1]王谢玮. 基于大数据下的计算机信息处理技术研究[J]. 电脑知识与技术, 2017, 13(30):37-38.
[2]杨强. 基于大数据下的计算机信息处理技术研究[J]. 电脑知识与技术, 2017, 13(3):21-22.