
一、正态分布
正态分布是一种很重要的连续型随机变量的概率分布,在统计学中,正态分布无论在理论研究上还是实际应用中,均占有重要的地位。
设连续随机变量x概率密度为:

则称x服从正态分布,记为,
所确定的曲线叫作正态曲线(图2-14)。

图2-14 正态分布图
特别地,当时,我们称之为标准正态分布,记为
。概率密度函数为:

1.正态分布密度函数的特征
(1)关于对称。即正态分布以均数为中心,左右对称,逐渐降低,两端永不与横轴相交。
(2)正态曲线下面积分布有一定规律(图2-15);无论取什么值,正态曲线与横轴间的面积总等于1。

图2-15 正态分布的面积分布
(3)正态分布有两个参数,即均数和标准差
。
是位置参数,
是变异度参数(形状参数)。
当恒定时,
越大,则曲线沿x轴越向右移动;反之,
越小,曲线沿x轴越向左移动(图2-11)。
当恒定时,
越大,表示x的取值越分散,曲线越“胖”;
越小,x的取值越集中在
附近,曲线越“瘦”(图2-11)。
2.正态分布的概率计算
累积正态分布当时的概率,记为

这个积分很难计算。因此,通过变量代换的方法,令

则

标准正态分布曲线下,左侧任一区间的面积可以通过附录1求得,通过查表可以得到z值左侧的面积(图2-16)。

图2-16 标准正态分布尾部面积
标准正态分布在实际中应用极为广泛,对任何参数和
的正态分布,都可以通过一个简单的变量变换转化成标准正态分布。
例如:某项目研究变量x服从正态分布,其均数为3150g,标准差为350g。试求时的概率。

附录1中给出的仅仅是左侧负值的概率。我们可以利用正态分布的面积特征,得到其他特殊情况的概率:




有时我们不仅仅希望得到概率值,还希望能够得到概率对应的随机变量的取值,例如:假设
,我们希望求得
值,其中
。

即,查附录1可知,
,因此

正态分布有很多性质,其中就包括独立正态分布随机变量的线性组合。
如果是独立的正态分布随机变量,它们的均数为
,方差为
,则

也服从正态分布,并且对应的均数和方差为


其中是常数。
中心极限定理:正态分布被认为是最适合描述随机变量的一种分布。在后面,我们主要讨论如何去检验这种说法的合理性。一般而言,中心极限定理是变量近似正态分布的原理所在。
假设是独立的随机变量,它们的均数为
,方差为
,如果

则

当时近似服从标准正态分布
。
中心极限定理说明n个独立随机变量的和近似服从正态分布,不论它们的分布如何,这个结论都是成立的。当n逐渐增大时,近似的效果越来越好。在很多的实例中,可能要求n小一些比较好,而有些则要求n比较大一些才会获得满意的近似效果。一般而言,如果是独立分布,并且
并非来自非正态分布,则此时中心极限定理要求
。这些条件在工程质量控制问题中常常出现。