统计质量控制及其应用
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

一、正态分布

正态分布是一种很重要的连续型随机变量的概率分布,在统计学中,正态分布无论在理论研究上还是实际应用中,均占有重要的地位。

设连续随机变量x概率密度为:

  (2-21)

则称x服从正态分布,记为所确定的曲线叫作正态曲线(图2-14)。

图2-14 正态分布图

特别地,当时,我们称之为标准正态分布,记为。概率密度函数为:

1.正态分布密度函数的特征

(1)关于对称。即正态分布以均数为中心,左右对称,逐渐降低,两端永不与横轴相交。

(2)正态曲线下面积分布有一定规律(图2-15);无论取什么值,正态曲线与横轴间的面积总等于1。

图2-15 正态分布的面积分布

(3)正态分布有两个参数,即均数和标准差是位置参数,是变异度参数(形状参数)。

恒定时,越大,则曲线沿x轴越向右移动;反之,越小,曲线沿x轴越向左移动(图2-11)。

恒定时,越大,表示x的取值越分散,曲线越“胖”; 越小,x的取值越集中在附近,曲线越“瘦”(图2-11)。

2.正态分布的概率计算

累积正态分布当时的概率,记为

  (2-22)

这个积分很难计算。因此,通过变量代换的方法,令

标准正态分布曲线下,左侧任一区间的面积可以通过附录1求得,通过查表可以得到z值左侧的面积(图2-16)。

 图2-16 标准正态分布尾部面积

标准正态分布在实际中应用极为广泛,对任何参数的正态分布,都可以通过一个简单的变量变换转化成标准正态分布。

例如:某项目研究变量x服从正态分布,其均数为3150g,标准差为350g。试求时的概率。

附录1中给出的仅仅是左侧负值的概率。我们可以利用正态分布的面积特征,得到其他特殊情况的概率:

  (2-24)

  (2-25)

  (2-26)

有时我们不仅仅希望得到概率值,还希望能够得到概率对应的随机变量的取值,例如:假设,我们希望求得值,其中

,查附录1可知,,因此

正态分布有很多性质,其中就包括独立正态分布随机变量的线性组合。

如果是独立的正态分布随机变量,它们的均数为,方差为,则

也服从正态分布,并且对应的均数和方差为

  (2-27)

  (2-28)

其中是常数。

中心极限定理:正态分布被认为是最适合描述随机变量的一种分布。在后面,我们主要讨论如何去检验这种说法的合理性。一般而言,中心极限定理是变量近似正态分布的原理所在。

假设是独立的随机变量,它们的均数为,方差为,如果

时近似服从标准正态分布

中心极限定理说明n个独立随机变量的和近似服从正态分布,不论它们的分布如何,这个结论都是成立的。当n逐渐增大时,近似的效果越来越好。在很多的实例中,可能要求n小一些比较好,而有些则要求n比较大一些才会获得满意的近似效果。一般而言,如果是独立分布,并且并非来自非正态分布,则此时中心极限定理要求。这些条件在工程质量控制问题中常常出现。