统计学在生活中的应用

发表时间:2021/9/6   来源:《中国科技信息》2021年9月下   作者:周彦贝
[导读] 统计学是一门与收集、分析、解释数据相关的学科。它在许多领域都发挥着至关重要的作用。人们可以通过分析样本的特征推断总体的特征、分析特定事件的发生规律。本文详细分析了统计学中的几个重要概念,深入探讨了统计学在生活中的应用,以期为相关人员提供参考。

上海市市西中学 周彦贝  200040

摘要:统计学是一门与收集、分析、解释数据相关的学科。它在许多领域都发挥着至关重要的作用。人们可以通过分析样本的特征推断总体的特征、分析特定事件的发生规律。本文详细分析了统计学中的几个重要概念,深入探讨了统计学在生活中的应用,以期为相关人员提供参考。
关键词:统计学;随机变量;正态分布;应用
        1引言
        统计学是数学的一个重要分支。统计学专家能够从庞大而复杂的数据集中提取关键的数据,进行整合分析,挖掘其中隐含的信息。这些信息将用于验证既有的假设,确定接下来的研究方案,制定合理的商业计划和公共政策。在美国,统计学家已成为需求量最大的职业之一[1]。由于世界上每日生成数据量越来越大,统计学家的需求量必然会高速增长。这些专家可以应用先进的统计学理论,从数据中挖掘关键的信息,为经济、政治、科学等领域的研究者提供重要的决策依据。
        2 统计学的简介
        在进行统计学分析时,人们需要收集来自现实生活中的数据,对数据进行深入、细致的分析,并进行逻辑推理,才能得到可靠的结论。例如,在确定人均收入、就业情况、人口增长率时,政府的工作人员常常需要在普查或抽样调查后应用恰当的统计学模型分析相关的数据,才能得到可靠的结论[2];在制定生产计划、营销计划以及进行战略规划时,商人常常需要开展关于消费者的喜好的调查,根据得到的数据确定商业计划;在天文学领域,当科学家测量宇宙中的物体的质量、大小或星球之间的距离时,他们可能无法使用具体的测量工具直接测量,但是他们可以应用统计学方法,减小测量的误差[3]。
        统计学不仅为人们提供了分析数据的工具,也为人们提供了科学地整理非结构化信息的方式。在对文献综述进行荟萃分析时,统计学发挥着重要的作用。许多研究人员在着手进行新研究之前,会开展关于特定主题的所有文献的研究。当这些文献中的研究方法各不相同,或者这些文献的发表时间跨度较大时,研究人员可能很难从多个研究中得到一个明确的结论[4]。他们可以对这些研究进行统计分析,减小研究方法和发表时间对结论的影响,更高效地整合这些文献中的结论,找到自己的研究方向。在设计临床试验时,人们也需要应用统计学的知识。当发现一种新药或新疗法时,研究者必须在一个或多个人群中测试这种药物的疗效,以了解其功效和安全性。在开展临床试验时,研究者需要仔细地选择研究对象,确定样本量,确定监测治疗效果的时间段,选择有助于确定治疗效果的参数[5]。生物统计学家不仅可以帮助这些研究者设计研究方案,而且可以更高效地分析研究过程中产生的数据,得到可靠的研究结果。在设计社会学调查方案时,人们也需要应用统计学的知识。去健身房的人过着更健康、更快乐的生活吗?纽约市的安全程度如何?人们对艾滋病毒的认识是足够深刻的吗?要解决诸如此类的问题,就要应用与统计学相关的知识。研究者需要仔细地设计研究方案,科学地实施研究计划。在分析数据时,他们需要考虑各种统计偏移的影响。统计学专家必须仔细研究调查人员收集的数据,借助自己的判断力和经验,从调查中获取最有意义的信息[6]。
        3统计学在生活中的应用
        统计学模型在生活中有着非常广泛地应用。在面对海量的数据时,人们可以借助统计学模型,分析数据的特征,从而对研究对象进行准确地评估。
        3.1分析离散变量的常用模型——古典概型
        在概率统计理论刚刚诞生的时候,基于对称性的考虑,数学家仅考虑那些看起来比较简单而合理的实验,他们几乎只研究所有结果都是“同等可能的”的实验[7]。也就是说,所有结果应以大概相同的频率发生。某事件的概率被定义为具有该事件的特征的案例数与所有案例的总数之比。假设一个人掷出两个骰子,那么他将得到36个可能的结果,这些结果的可能性是相等的。人们可以列举得到的点数之和为6的情况,分析得到的点数之和为6的概率。具体而言,得到的点数分别为1和5、5和1、2和4、4和2、3和3时,点数之和为6。由于点数之和为6的结果有5种,而结果共有36种,得到的点数之和为的概率为5/36。
        笔者借助上述例子阐明了概率的定义。事实上,上述场景涉及了古典概型的知识。古典概型的特征是:人们在试验中只能得到有限种结果,且得到每种结果的可能性相同。下面,让我们看一个与中学生活相关的例子。
        假设五年一班有30名男同学,20名女同学,现老师随机抽取两人做主持人,抽到两位女生的概率是多少?
        这是一个经典的古典概型问题。从50名同学中抽取两名同学时,有50*49/2=1225种不同的情况。从20名女同学中抽取两名同学时,有20*19/2=190种不同的情况。190/1225=15.51%。
        3.2分析连续变量的经典模型——正态分布
        许多实验具有无限多个可能的结果。例如,在旋转微调器时,人们也会得到无数种结果。假设某理想旋转器只能围绕其中心轴旋转,且可以旋转任意角度,那么人们在分析旋转器的最终位置时就会发现,就最终位置而言,旋转器转过的角度应该是[0 ,2π)范围内的任意实数。也就是说,旋转器转过的角度有无数种可能的结果。在自然科学和社会科学领域,许多测量过程都会得到无限多个可能的结果。体积、电压、温度、反应时间、边际收入等,都是连续变量,在理论上这些变量会涉及无限多个可能的值。在解决这些问题时,人们需要应用与连续变量有关的统计学模型。正态分布是描述连续变量的分布规律的重要模型,自然界中的许多连续变量都是服从正态分布的[8]。
        3.2.1正态分布的简介
        如果我们从某一人群中随机抽出100个人,我们将看到,关于人体的许多连续变量(如智商、身高、体重和血压)都服从正态分布。以这些连续变量为横坐标,以它们的出现概率为纵坐标,我们就可以得到正态分布的图像。由于多数数据分布在平均值附近,正态分布的图像是一条钟形曲线。
        在应用正态分布模型分析数据之前,我们需要先检验数据是否服从正态分布。在确定数据的正态性之后,人们一般应用参数检验等方法,比较两组或多组数据的特征。如果数据不服从正态分布,人们就不得不使用一种功能较弱的统计检验方法(非参数统计)。
        正态分布模型中有两个重要的参数——平均值和方差。在抽样时,由于存在抽样误差,人们得到的样本的特征通常与总体的特征有一定的差异。在计算样本的平均值和方差后,人们应用正态分布模型,还原总体的特征,减小抽样误差的影响。此外,人们还可以借助正态分布模型,计算特定数值的出现概率。具体而言,如果随机变量X服从正态分布,其平均值为μ,标准差为σ,那么该变量的概率分布函数应当为
        3.2.2正态性的检验
        如何评估数据是否服从正态分布,是非常重要的。当人们收集到的数据不符合正态分布时,他们可能需要用其他统计模型分析数据的特征。
        统计软件(如SPSS)可通过计算描述数据的集中趋势的三个参数,检查数据是否服从正态分布。一般而言,如果平均值、中位数和众数非常相似,则数据很有可能服从正态分布。人们也可以使用SPSS软件分析概率密度函数与x轴围成的图形的特征,判断该图形的参数与给定的正态分布曲线的参数是否有显著的差异。分析者可以根据软件显示的p值判断数据的正态性,如果p <0.05,说明差异是显著的,这组数据不服从正态分布,如果p≥0.05,说明差异不是显著的,这组数据服从正态分布。
        我们也可以通过绘制频率图,判断数据是否服从正态分布。当人们不方便应用软件分析数据时,可以先绘制出数据的分布曲线,然后通过观察曲线的形状,确定数据是否服从正态分布。这种方法是较为直观的,但是它不够精确,人们可能会做出错误的判断。
        3.2.3正态分布的经验法则
        根据正态分布的经验法则,与平均值相差不超过1个标准差的数据的出现概率是68.27%,与平均值相差不超过2个标准差的数据的出现概率是95.45%,与平均值相差不超过3个标准差的数据的出现概率是99.79%。根据正态分布表,人们可以计算位于特定范围内的数据的出现概率。在生产生活中,该法则可以用于解决与标准制定、分析预测等相关的问题。
        应用正态分布的经验法则解决遇到的问题时,人们需要先将待研究的正态分布模型转化为标准正态分布,确定感兴趣的数值和平均值之间相差几个标准差,也就是Z分数,将正态分布的“标准化”。通过此程序,研究人员可以确定落入指定范围的数值的比例[9]。
        在测试汽油发动机的性能时,人们通常需要了解喷入气缸的汽油的量的基本分布规律,计算每一循环中发动机的工作效率。一般而言,当汽油喷射系统将汽油喷入气缸时,喷射量基本服从正态分布。假设在一次试验中,操作者为模拟发动机的真实工作状态,使喷射系统连续喷射汽油,并记录了每次的喷射量,得到了100个数值。喷射量的平均值是1L,标准差是0.05L,现在评估人员想要确定该喷射系统在工作时单次喷射量低于0.9L的概率,他们应该如何计算?
        由于喷射量I是基本服从正态分布的,我们可以应用正态分布模型,解决这个问题。喷射量的平均值μ=1,标准差σ=0.05,那么其概率分布函数应当为。根据这个式子,我们可以计算喷射量为任何数值的发生概率。
        在确定该喷射系统在工作时单次喷射量低于0.9L的概率时,研究者需要应用与正态分布的经验法则相关的知识。0.9L与1L相差2个标准差,那么喷射量低于0.9L的概率应当是(1-95.45%)/2=2.275%。
        4结语
        统计学是研究分析具有随机性数据的规律的学科。在农业、工业、科研、医药等领域,统计学有着广泛的应用。借助统计学模型,研究者可以通过样本判断总体的特征,预测某些指标的变化趋势,更好地把握事物的发展规律。例如,在开展民意调查之后,政府可以确定一项计划的有效性;开展产品满意度调查后,企业的经营者可以了解顾客对特定产品的评价。在分析特别复杂的问题时,统计学家可以应用现代信息技术,对数据进行分析,更好地拟合实际情况,从而得到更可靠的结论。
参考文献
[1]吉立爽.浅析经济金融问题中的概率统计及应用[J].中国市场,2020(07):52-53.
[2]宫晓琳,陈增敬,张晓朴,等.随机极限正态分布与审慎风险监测[J].经济研究,2014,49(09):135-148.
[3]魏晶晶.概率统计教学中引入Matlab的探索与实践[J].中国多媒体与网络教学学报(上旬刊),2019(03):5-6.
[4]何林海.经济金融问题中的概率统计及应用[J].江西电力职业技术学院学报,2018,31(07):13-14.
[5]孙琬琰.经济金融问题中的概率统计及应用[J].经贸实践,2016(17):86.
[6]王彦光,朱鸿斌,徐维超.ROC曲线及其分析方法综述[J].广东工业大学学报,2021,38(01):46-53.
[7]郭英.统计与概率在生活中的运用[J].初中生世界,2021(Z3):110-112.
[8]薛文娟,沈群,许冰.案例教学法在概率论教学中应用[J].高等数学研究,2020,23(04):70-72+76.
[9]江腾旦,崔文闰.现代信息技术支持下的统计与概率教学[J].基础教育论坛,2021(01):107+109.

投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: