本科概率统计教学中的几个注解

发表时间:2020/8/13   来源:《中国教师》2020年17卷7期   作者:赵辉艳
[导读] 本科生的《概率论与数理统计》课程是大多理工专业的基础课
        摘  要  本科生的《概率论与数理统计》课程是大多理工专业的基础课,本文对概率存在的必要性,平均的优化属性及极大似然估计法做一些注解,希望对后进学子学习相关知识有所帮助。
关键词   概率;数学期望;算术平均;最大似然估计;
中图分类号  
一、引言
        本科生的《概率论与数理统计》是大多理工专业的一门重要基础课,其中蕴含的不确定性思想在当今数据爆炸时代起着越来越重要的作用。本文中,我们将对概率存在的必要性,平均的优化特性及参数估计中的最大似然法,进行一些注解。通过这些注解,我们将看到随着自然科学的发展,大众哲学也在慢慢的发生着变化,对不确定性的认识和应用正在改变着我们生活的世界;数学期望蕴含了优化的思想,这种观点可以让我们换一个视角看待数学期望;数学期望和算术平均在一定意义上是等价的;最后,我们可以看到最大似然估计法蕴含了一种灵活的逆向推理思想。
二、概率有存在的必要吗?
        当我们问什么是概率的时候?教课书大多会这样告诉我们:“概率论一门研究随机(不确定)现象及其发生规律的数学学科,概率刻画了随机现象发生的可能性。”如果我们进一步问:“什么是随机现象?存在随机现象吗?概率有存在的必要吗?”
        从教课书上逻辑来看,只有存在随机现象,才能说概率有没有存在的必要性,否则经典的确定性数学就已足够。
        为解释这个问题,我们先回顾一段自然哲学的历史。进入19世纪,由于牛顿力学的巨大成功,牛顿三定律和万有引力定律成了主宰整个宇宙的终极真理,这种观念也被称为“按时钟前进的宇宙”[1]。这其中的代表人物有法国著名数学家、物理学家拉普拉斯,但普通民众对这一科学概念却耿耿于怀。直到1846年9月23日,天文学家观测到了由牛顿数学定律预测的海王星,这为决定论的科学观念提供了一个坚实的证据。之后,决定论科学观念成了大众文化一个不可分割的组成部分,决定论哲学掌握着19世纪早期的科学,人们相信一切事物的发生都是由宇宙初始条件和描述宇宙的数学公式事先决定。到了20世纪,随着量子力学的发展,科学家们发现,牛顿力学不再适用于微观世界。著名的海森堡不确定性原理便是这样的一个例子。此外,人们期待的确定性的生物学及社会学定律也没有成功,在一些成熟的科学领域,人们发现,牛顿定律仅仅是宏观上的一个近似。慢慢的,到了20世界末,一种含有不确定性的统计模型几乎被应用到了所有的学科。
        上面的简述,让我们看到了科学观念发生变化的过程,我们当今正处的就是后者的时代。进一步,如果我们问:“世界的本质到底是确定的还是不确定的?”
        这是一个太大的问题,已经超出了作者的能力范围,下面仅仅表述一下作者的主观想法。
作者更愿意相信二者之间是你中有我,我中有你的的关系。就拿随机变量的分布函数来说,他本身是一个确定性的函数,但却是用来刻画随机现象的。至此,我们最初提出的问题依然没有解决。为此,我们考虑两个极端情形:(1)如果世界本来就是不确定的,那概率的存在自然合理;(2)反过来,如果世界的本质是确定的,但我们人类自身的认知却是有限的。这样一来,就不可能对事物的认识面面俱到,一个便宜的方法是将未知的(认识不到的)那些看作是不确定的。
        综上,不管自然的本质是确定的,不确定的或二者兼而有之,我们都可以假定存在不确定性。从这个意义上说,概率有其存在的必要性。这是我们理解自然的一种方式,一个思路。不仅如此,近代数学、概率的发展表明,概率思想对解决一些确定性问题也能发挥神奇效用。
三、平均是一种优化
        接下来,我们介绍的平均包含数学期望和算术平均,我们先看数学期望的情形。

                        .
证明.对目标函数求导,令其为零,便可得证,我们省略详细的证明。

                        .
注2. 从上述例子可以看到,数学期望是一种加权平均,可以看作是算术平均的一种推广。事实行,二者可以相互转化。也就是说,数学期望和算术平均是等价的,因此,二者通常都被称作平均。
四、揣度“上帝”的意旨
        虽然第二部分我们对自然界的本质不置可否,事实大多自然学科都会有一定哲学基础。下面我们讨论的参数估计问题便是这样的例子。假设一组数据(样本)来自一个未知分布(总体),假定未知分布依赖未知但确定的参数,对这个参数的估计问题,称为参数估计问题。
        概率中,一个通常的问题是这样表述的:“已知一个分布,问能得到某些数据的概率?”参数估计问题可以看作是它的一个逆问题,通过观测的数据对未知分布进行估计,其中分布是未知的但却是存在的(确定的)。
        接下来,我们介绍参数估计中的一个重要方法---最大似然估计法。根据现在文献的看法[2,3],最大似然估计法源起伯努利,高斯等学者,由费歇尔发扬光大。下面我们回顾一下其基本想法:

注3. 从数学角度看,最大似然估计法不是一个逻辑严密的推理方法。因为,就是似然函数取的值是,也不能保证我们一定能够观测到样本数据。反过来,作为一个统计估计方法,其蕴含了一种逆向推理的想法。另外,从其估计效果看,不得暗暗叫绝,似乎自然界就是按照此规则演化的,不得不惊讶其揣度“上帝”本领之高超。
五、总结
        在对概率是否有存在的必要性,平均的优化特性及最大似然估计等议题进行思考后,会发现常常一些细节的地方有很多值得我们深思的地方。甚至提出更大的哲学命题:自然的本质是确定的还是随机的,希望这些注解能起到抛转引玉的作用,启发后进学子继续前行。
        
参考文献
[1] (美)David Salsburg 著, 刘清山(译),女士品茶:统计学如何变革了科学和生活,南昌: 江西人们出版社,2016.
[2] 陈希孺著, 数理统计学简史,长沙:湖南教育出版社,2002.
[3](日)岩泽宏和著,戴华晶译,改变世界的134个概率统计故事,长沙:湖南科学技术出版社,2016.
投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: