李锐
湖南科技大学数学与计算科学学院 湖南省湘潭市雨湖区 411201
摘要:正态分布是概率论与数理统计中最重要的一个分布,又称高斯分布。在遇到实际的统计概率问题时,一般会涉及到复杂且难以计算的指数分布、二项分布,而我们会将它们近似转化为正态分布,再利用正态分布的性质进而解决问题。但正态分布的基本性质在实际问题中有很多的局限性和不实用性,因而其拓展研究在统计学显得尤为重要。本文就正态分布的基本性质作出简单的拓展总结。
关键词:正态分布;变化因子;标准正态分布
标准正态分布是正态分布的一个特例,但其应用却最为普遍,因此在本文中,将以正态分布与标准正态分布作以综合探究。
首先,我们对正态分布以及标准正态分布的基础定义进行简要的概述,接着再分析它们的基本性质,由于普遍性包含特殊性,我们为了不必要的赘述和保持文章的简洁性,因此只针对于正态分布的基础性质和延伸性质作出阐述,当然也是标准正态分布同样满足,最后我们基于正态分布和标准正态分布的基础性质进行拓展探究。
此外,为了便于读者对文章进行更好的解读,本文将借助Matlab进行图像的可视化操作,并附以代码,以便读者对于文章进行复现。
一、正态分布的基础定义
1.1 正态分布
若随机变量X的概率密度函数满足如下形式:
则称X服从正态分布,称X为正态变量,记为X~N(μ,σ2)。其中μ为随机变量X的数学期望值,σ2为其方差值,σ为其标准差值。
正态变量X的密度函数p(x),我们通常会根据其图形性质进行相关操作。对于满足一般形式的正态变量X,其密度函数图形均满足如下:
其图像有如下特点:
①形状呈现类峰状,钟形;②以峰顶(x=μ)为中心轴,并以此左右两边对称;③由中心至两侧延伸,p(x)越小;④x=μ±σ是其拐点。
对于正态变量X的密度分布函数F(x),有形式如下:
正态变量X的密度分布函数图像有如下形式:
其图像特点有:
①是一条稳定光滑的曲线;②严格递增趋势;③x→+∞,F(x)=1
1.2 标准正态分布
标准正态分布是正态分布的一种特殊形式,对于正态分布的一般形式有N(μ,σ2),特别的,当μ=0,σ2=1时,我们称其为标准正态分布,记为U(0,1)。
对于标准正态变量X的概率密度函数p(x)有形式如:
二、正态分布的基本性质
2.1 基本运算
2.2 基本性质
③正态分布的3σ原则
假如某随机变量取值的概率近似满足如上三条等式,则可认为这个随机变量近似服从正态分布;假如上三式中有一个偏差较大,则可以认为这个随机变量不服从正态分布。
三、正态分布的性质拓展
我们再采用蒙特卡洛模拟的方式随机选定两组正态分布的μ与σ,再利用上述的变化公式,得到μt与σ,选出最佳效果参数,最后得到对比图:
代码如下:
clear;
clc
miu1=2;
sigma1=4;
miu2=3;
sigma2=5;
a=@(x)normpdf(x,miu1,sigma1);
fplot(a,[-30,30],'LineWidth',2);
hold on
b=@(x)normpdf(x,miu2,sigma2);
fplot(b,[-30 30],'LineWidth',2);
hold on
miu3=(miu1*sigma2^2+miu2*sigma1^2)/(sigma1^2+sigma2^2);
sigma3=sqrt((sigma1*sigma2)^2/(sigma1^2+sigma2^2));
c=@(x)normpdf(x,miu3,sigma3);
fplot(c,[-30 30],'LineWidth',2);
legend('N1~(μ1,σ1)','N2~(μ2,σ2)','N3=N1×N2');
四、总结
在实际的数理统计问题中,我们对于复杂的多分布变量,可以借助3.1、3.2以及3.3的拓展性质解决,通过“对多分布变量的近似处理”,大大降低了计算难度,大幅度的提高了计算效率,而且对多分布变量使用正态分布或者标准正态分布近似后,造成的数据精度损失是在量级中的,这一点我们是可以接受的。
五、引用文献
[1]同济大学数学系. 概率论与数理统计[M].人民邮电出版社:, 201703.252.