概率论与数理统计在大数据分析中的应用策略

发表时间:2021/7/1   来源:《科学与技术》2021年第29卷3月第7期   作者:李阿银
[导读] 二十一世纪以来,互联网的快速发展与推广使数据呈现几何倍数的增长
        李阿银
        华北电力大学(保定) 河北省保定市 071000
        摘要:二十一世纪以来,互联网的快速发展与推广使数据呈现几何倍数的增长,这使我国迎来了大数据时代。由于大数据具备规模大、增长快、稀疏性等特征,这也给大数据分析带来较大困难。在大数据时代,利用概率论与数理统计方法来对繁杂数据进行分析与挖掘不失为是一种简单高效的方法。文章重点就概率论与数理统计在大数据分析中的应用策略进行研究分析,以供参考和借鉴。
        关键字:概率论与数理统计;大数据;应用策略
引言
        随着人们生活水平和品质的提高,概率学知识在人们的生活工作中应用的越来越广泛,概率学知识的应用大力提升了人们对于世界的认识力度,而在大数据分析中应用概率学知识,则极大的提升了大数据分析的有效性和稳定性。在大数据的分析应用中使用概率学与数理统计的方法,能将人们生活工作中所遇到的复杂问题和数据进行科学分析并得到准确结果,有效的提升了人们的生活质量。不仅如此,应用概率学与数理统计的方法对大数据进行分析,还能对相应事物的演变规律和发展趋势做出准确的预测。
1相关概述研究
1.1概率论与数理统计
        概率论与数理统计是高等数学教育中非常重要的一门学科,其体现出分析鲜明的特点,尤其是从研究对象方面来看,彰显出其具有独特性思维分析的特点,概率论与数理统计这门学科和其他学科之间具有直接关系,以经济学方面为主。概率论和数理统计这门学科拥有丰富的内容,其实这是其成为高等数学这门学科重要组成元素的主要原因之一。就目前来看,在我国各行各业中广泛应用了概率论与数理统计。从教学实际方面来看,可以把概率论与数理统计单独当作一门学科展开教学,无论是在工业领域,还是其他领域运用概率论与数理统计,均对信息技术提出了非常严格的要求,可以真正彰显出概率论与数理统计在大数据分析中具有的优势,在人们生产与生活方面同样发挥着积极性的作用;从另一个角度来看,概率论与数理统计也不能当作单独的学科,究其原因是其和其他学科之间具有直接关系,发挥着相互渗透的作用。
1.2大数据分析
        从总体方面来看,大数据分析是社会不断进步与发展产生的一种新型词语。人们的生活水平得到明显提高,在很多非常复杂的学科中之所以可以广泛应用大数据分析,是因为把其进行了系统整合。从某个方面来看,实际上是分析庞大的数据,其自身具有很多特点,如分析速度快、储存量较大、准确度高等,因此在拥有顾客需求、用户特征等方面的数据分析中得到广泛应用;首先从企业发展方面来看,通过大数据分析可以为企业产生更多的经济利益;其次从消费者方面来看,运用大数据分析可以使消费者感受到更加优质的购物体验。
1.3二者之间的关系
        在大数据时代,针对大数据分析的需求十分庞大,而利用具有较强优势的概率论与数理统计方法对大数据进行分析,不仅有效提升了大数据分析的准确性和稳定性,也很大程度的提升了人们生产生活中对于复杂数据和问题的解决力度。概率论与数理统计方法在当前的大数据分析中占据着重要位置,同时概率论与数理统计和大数据分析之间也具有较为重要的联系。

两者之间的联系包括以下几个方面:一是两者的研究目标相同,概率论与数理统计和大数据分析两者的目的都是找出大数据内部的联系和规律并对数据结构进行有效的探索和明确;二是两者之间的相互作用,因为大数据的快速发展,使大数据分析为统计学开辟了一个全新的应用空间,同样也是因为全新应用空间的出现,针对概率论与数理统计进行的研究有了一个全新的课题,而最后的结果表明,对大数据分析进行有效研究,也能同时推动概率论与数理统计的迅速发展;三是大数据分析应用的领域较为广泛,大数据分析虽然不是统计学中的分支,但大数据分析能广泛的应用于众多领域,大数据分析的应用能为其他领域提供全新的思想、工具、方法,而其中较为常见的应用如使机器进行学习、实现数据存储等。
2概率论与数理统计在大数据分析中的常用方法
        在大数据分析中,概率论与数理统计的常用方法主要包括层次分析法和蒙特卡罗法两类,其中层次分析法是在研究不确定因素的演变规律和发展趋势时,对不确定因素所产生的影响和相互联系进行综合分析并得出相应结果的方法。层次分析法能有效的解决结构为多级递阶的复杂问题和复杂数据,在层次分析法的应用过程中,数学模型的建立需根据相应的步骤进行,首先是明确问题中的各个因素并进行准确的层次划分,以此达到使问题呈递阶层次结构目的;其次是以上一级的要素为准则,将上一级的要素和下一级的要素进行对比,确定下一级要素之于上一级要素的重要性尺度并进行相应判断矩阵的构建;最后是根据问题中各个要素的重要度进行计算并确定综合重要度,进而使相应问题能有效解决;蒙特卡罗法在使用时,需对相应问题的不确定性因素进行反复的随机抽样,以此得出不确定因素在问题中的影响程度,再对得出的影响进行计算分析后便能得出问题科学解决方法的分析结果。由于能对相应的实际问题进行真实模拟,所以蒙特卡罗法在解决实际问题时具有较高的优势。
3概率论与数理统计在大数据分析中的应用策略
3.1在经济数据分析中的应用
        数据对经济而言,一直具有十分重要的作用,在各类数据中经济数据是十分典型且应用性强的一种。对经济数据进行分析有利于推动社会的整体发展,但在分析过程中由于经济数据具有低密度的特点,导致经济数据分析存在一定困难,因此需要通过概率论和数理统计来使经济数据分析变得更为简单有效,就具有十分重要的意义了。如正被广泛应用在经济金融管理领域的正态概率分布的方法,通过此种方法对经济数据进行分析能够有效的预测和描述连续性随机变量的概率,并对概率所有相关信息进行高效的分析,通过分析结果对市场经济状况进行实时掌握,帮助人们了解市场发展规律和运作模式,以及其中普遍存在的市场经济规律,甚至能够分析出更多的经济信息,帮助决策者制定长远的战略目标和工作部署。对经济数据的分析除了对经济市场的变化规律和发展趋势进行分析和预测,还要预测和分析经济运行的风险。概率论和数理统计则可以帮助经济市场的投资者有效减少投资过程中潜在的风险,降低风险产生的可能性,增加投资者利润获取的概率和可能性。
3.2在商业数据分析中的应用
        大数据时代,商业数据对于企业的生存与发展而言具有十分重要的作用,而商业数据又属于经济数据的一种。现如今,企业进行商业数据分析时,大都会采用概率论和数理统计,如分析计算商业数据中的大客户流失概率,首先需先建立研究模型,确立流失数据与流失函数相对应的函数关系,其次找出对大客户流失产生影响最大的因素,并按照划分层次进行归类,设定特殊时段,对特殊时段中大客户流失情况进行汇总,制作流失情况走势图,计算出标准函数,获得特定客户在某一时段的流失概率,通过函数公式找出协变量,分析出影响要素的定义,最终完善模型的构造。
结束语
        综上所述,概率论与数理统计在大数据分析中的作用是非常明显的,当前概率论与数理统计在大数据分析中已经不再是一种辅助分析工具,更是一个简单而又高效的分析方法。通过概率论与数理统计的应用,对于大数据中各类数据的过程、趋势、效果等都已经成为人们进行数据分析时的分析对象。面对大数据的高速增长趋势,应用概率论与数理统计来进行大数据分析,将更有助于推动人们生产生活的发展,促进我国经济的快速增长。
参考文献:
[1]汪浩,李莹.大数据/人工智能背景下IT专业基于R的概率论与数理统计教学改革[J].计算机教育,2021(03):180-184.
[2]熊霄.基于大数据下概率论与数理统计的研究与分析[J].电子技术与软件工程,2020(16):163-164.
投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: