董济磊
山东协和学院
摘要:随着数据时代的发展,对于人类如何处理分析数据得到了高速提升。大数据在生活,医疗,商业等各个领域得到了广泛的应用。因此大数据距离我们的生活并不遥远,数据发展到今天,已经不再是一个简单的概念,而是逐渐的融入了我们的生活,大数据的应用也是层层出新。当然作为一个发展前景广阔的应用技术,还需要我们进一步了解发展,比如如何为我们的生活带来便利,如何让在应用中得到更大的利益。现如今,人们生活中产生的数据日益增多,并且已经产生了数据爆炸的效应,那我们应该如何利用爆炸性的数据,又如何使它产生不可估量的利益呢?这就需要我们进一步研究,利用好每一份有价值的数据,促进我们社会生活的发展。大数据不仅仅是大量数据,在这里,Big这个词指的是大范围的数据。这个领域的一个众所周知的谚语是用字母V开头的三个单词来描述大数据:数据量大,速度和变化。但分析和数据科学界已经看到数据在其他方面有所不同,除了大数据的三个基础,如准确性,可变性,波动性,可视化和价值。那么如何来处理.储存和控制大数据呢?由此就产生了大数据技术,它帮助我们更好的利用现有的数据内容,使我们得到了全新的发展。
关键词:大数据及大数据的应用,数据爆炸,准确性,可变性,波动性,可视化。
引言
大数据是指那些超过传统数据库系统处理能力的数据。它的数据规模和传输速度要求很高,或者其结构不适合原本的数据库系统。为了获取大数据的价值,我们必须选择另一种方式来处理它,这就是大数据。
一.大数据的发展
1.1大数据的起源
大数据起源于美国,大约从2009年开始,大数据成为互联网信息技术行业的流行词汇,事实上,大数据产生是指建立在对互联网、物联网、云计算等渠道广泛、大量数据资源收集基础上的数据存储、价值提炼、智能处理和分发的信息服务业,大数据企业大多致力于让所有用户几乎能够从任何数据中获的可转化为业务执行的洞察力,包括之前隐藏在非结构化数据化的洞察力。
2008年9月,美国《自然》杂志,正是提出“大数据”概念
2011年2月1日,美国《科学》杂志,通过社会调查的方式,第一次分析了大数据对人们生活的影响
2011年5月,麦肯锡研究院分布报告。大数据是指其大小超出了常规数据库工具获取,存储,管理和分析能力的数据集。
1.2大数据的发展过程
2008年末,“大数据”得到部分美国知名计算机科学研究人员的认可,业界组织计算社区联盟 (Computing Community Consortium),发表了一份有影响力的白皮书《大数据计算:在商务、科学和社会领域创建革命性突破》。它使人们的思维不仅局限于数据处理的机器,并提出:大数据真正重要的是新用途和新见解,而非数据本身。此组织可以说是最早提出大数据概念的机构。
2009年印度政府建立了用于身份识别管理的生物识别数据库,联合国全球脉冲项目已研究了对如何利用手机和社交网站的数据源来分析预测从螺旋价格到疾病爆发之类的问题。
2010年2月,肯尼斯?库克尔在《经济学人》上发表了长达14页的大数据专题报告《数据,无所不在的数据》。库克尔在报告中提到:“世界上有着无法想象的巨量数字信息,并以极快的速度增长。从经济界到科学界,从政府部门到艺术领域,很多方面都已经感受到了这种巨量信息的影响。科学家和计算机工程师已经为这个现象创造了一个新词汇:“大数据”。库克尔也因此成为最早洞见大数据时代趋势的数据科学家之一。
二.大数据的特征
1.大量。
大数据的特征首先就体现为“大”,从先Map3时代,一个小小的MB级别的Map3就可以满足很多人的需求,然而随着时间的推移,存储单位从过去的GB到TB,乃至现在的PB、EB级别。随着信息技术的高速发展,数据开始爆发性增长。社交网络(微博、推特、脸书)、移动网络、各种智能工具,服务工具等,都成为数据的来源。淘宝网近4亿的会员每天产生的商品交易数据约20TB;脸书约10亿的用户每天产生的日志数据超过300TB。迫切需要智能的算法、强大的数据处理平台和新的数据处理技术,来统计、分析、预测和实时处理如此大规模的数据。
2.多样。广泛的数据来源,决定了大数据形式的多样性。任何形式的数据都可以产生作用,目前应用最广泛的就是推荐系统,如淘宝,网易云音乐、今日头条等,这些平台都会通过对用户的日志数据进行分析,从而进一步推荐用户喜欢的东西。日志数据是结构化明显的数据,还有一些数据结构化不明显,例如图片、音频、视频等,这些数据因果关系弱,就需要人工对其进行标注。
三.大数据的利弊
3.1大数据的优点
更好的决策:在NewVantage Partners公司调查中,36.2%的受访者表示更好的决策是他们大数据分析工作的首要目标。此外,84.1%的受访者表示已开始朝着这一目标努力,59.0%的受访者表示取得了一些可衡量的成功,其总体成功率为69.0%。大数据分析可以为业务决策者提供他们所需的数据驱动的洞察力,以帮助企业开展竞争和业务发展。?
3.2大数据的缺点
?对人才的需求:数据科学家和大数据专家是IT领域最受欢迎的高薪工作者。AtScale公司的调查发现,缺乏大数据技能是过去三年来企业采用大数据面临的头号挑战。在Syncsort公司的调查中,受访者将技能和员工列为创建数据湖时的第二大挑战。雇用或培训员工可能会大大增加成本,获取大数据技能的过程需要相当长的时间。
四.大数据的应用
目前,大数据对于绝大多数用户而言,仍是概念,仅有少数企业开始真正的实战大数据,但就进一步发展形势来看,市场上存在大量潜增量客户在积极评估大数据以准备导入进行实践,整个市场处于概念向实践落地的重要转变期。
大数据对于绝大多数用户而言,仍是概念。得益于多项外部条件的利好,企业有了实践大数据的基本条件。如政策助推,基础设施逐渐完善、云计算、移动信息化等创新技术的趋于成熟为大数据提供了技术和生态支撑。大量潜增量客户在积极评估大数据以准备导入进行实践,整个市场处于概念向实践落地的重要转变期。
无论是在存量市场还是在潜增量市场,“国字头”机构(包括政府、事业单位、国企、集体企业)均为消费主体。 “国字头”机构对于精细化管理、洞察力的需求最为旺盛;同时,“国字头”机构拥有最为丰富的数据源和充足的资金预算,因此,在现阶段及今后的很长一段时间内,他们会是市场的消费主体。
五.结语
当今大数据技术应用于各个领域,随着时代的发展,大数据技术也逐渐提高,给我们的社会生活也带来了极大的便利。虽然我们生活中不能发现,但是它无时无刻的出现在我们的身边。如今各个高新技术领域已经离不开大数据技术,即使会带来一些问题,但是它带来的利益极大的便利了我们的时代发展。然而这项技术仍可以继续发展,得到更好的提升,使我们的未来得到更大的变革。
参考文献
1.《经济学人》:是一份由伦敦经济学人报纸有限公司出版的杂志,在全球发行。
2.GB.TB.PB.EB级别:计算机存储单位。
3.《危险边缘》:美国著名智力竞赛电视节目。
4.麦肯锡:是世界级领先的全球管理咨询公司,是由美国芝加哥大学商学院教授詹姆斯·麦肯锡于1926年在美国创建 。自1926年成立以来,公司的使命就是帮助领先的企业机构实现显著、持久的经营业绩改善,打造能够吸引、培育和激励杰出人才的优秀组织机构。
董济磊(2002年出生)男,汉族,山东省日照市莒县,学生,本科,山东协和学院