
二、直方图
直方图又称质量分布图,是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。一般用横轴表示数据类型,纵轴表示分布情况。
在质量管理中,如何预测并监控产品质量状况?如何对质量波动进行分析?直方图就是一目了然地把这些问题图表化处理的工具。它通过对收集到的貌似无序的数据进行处理,来反映产品质量的分布情况,判断和预测产品质量及不合格率。
直方图是表示资料变化情况的一种主要工具。用直方图可以解析出资料的规则性,比较直观地看出产品质量特性的分布状态,对于资料分布状况一目了然,便于判断其总体质量分布情况。在制作直方图时,牵涉统计学的概念,首先要对资料进行分组,因此如何合理分组是其中的关键问题。按组距相等的原则进行的两个关键问题是分组数和组距。它是一种几何形图表,是根据从生产过程中收集来的质量数据分布情况,画成以组距为底边、以频数为高度的一系列连接起来的直方型矩形图,如图2-2所示。

图2-2 直方图
1.作直方图的目的
直方图可以用于统计一组数据的常见值。如图2-2所示,通过该图可以看到数据在208附近出现的次数是比较多的。同时,直方图还可以用于判断生产过程中一批已加工完毕的产品,通过搜集有关数据,可以掌握产品之间的差异大小。另外,在公路质量管理中,直方图可以用于估算可能出现的不合格率,判断质量分布的形态等。
2.直方图形状分析
(1)正常型 正常型是指过程处于稳定的图型,它的形状是中间高、两边低,左右近似对称。近似是指直方图多少有点参差不齐,主要看整体形状。如图2-3所示。

图2-3 正常型
(2)异常型 异常型直方图种类则比较多,所以如果是异常型,还要进一步判断它属于哪类异常型,以便分析原因、加以处理。下面介绍几种比较常见的。
①孤岛型,如图2-4所示。

图2-4 孤岛型
在直方图旁边有孤立的小岛出现,当这种情况出现时过程中有异常原因。如:原料发生变化,不熟练的新工人替人加班,测量有误等,都会造成孤岛型分布,应及时查明原因、采取措施。
②双峰型,如图2-5所示。

图2-5 双峰型
当直方图中出现了两个峰,这是由于观测值来自两个总体、两个分布的数据混合在一起造成的。如:两种有一定差别的原料所生产的产品混合在一起,或者就是两种产品混在一起,此时应当加以分层。
③折齿型,如图2-6所示。

图2-6 折齿型
当直方图出现凹凸不平的形状,这是由于作图时数据分组太多,测量仪器误差过大或观测数据不准确等造成的,此时应重新收集数据和整理数据。
④陡壁型,如图2-7所示。

图2-7 陡壁型
当直方图像高山的陡壁向一边倾斜时,通常表现在产品质量较差时,为了符合标准的产品,需要进行全数检查,以剔除不合格品。当用剔除了不合格品的产品数据作频数直方图时容易产生这种陡壁型,这是一种非自然形态。
⑤偏态型,如图2-8所示。

图2-8 偏态型
偏态型直方图是指图的顶峰有时偏向左侧、有时偏向右侧。
由于某种原因使下限受到限制时,容易发生偏左型。如用标准值控制下限,摆差等形位公差,不纯成分接近于0,疵点数接近于0或由于工作习惯都会造成偏左型。由于某种原因使上限受到限制时,容易发生偏右型。如用标准尺控制上限,精度接近100%,合格率也接近100%,或由于工作习惯都会造成偏右型。
⑥平顶型,如图2-9所示。

图2-9 平顶型
当直方图没有突出的顶峰,呈平顶型,形成这种情况一般有三种原因:a.与双峰型类似,由于多个总体、多总分布混在一起;b.由于生产过程中某种缓慢的倾向在起作用,如工具的磨损、操作者的疲劳等;c.质量指标在某个区间中均匀变化。
三、数据的定量描述
茎叶图和直方图从直观的角度提供了关于样本数据的三个信息:数据的分布形状,数据的集中趋势和数据的离散趋势。除此之外,我们可以利用数值计算的方法去衡量集中趋势和离散趋势。
1.集中趋势的统计量
分布的集中趋势是指一组数据向某一中心值靠拢的倾向,它反映了一组数据中心位置所在。测度集中趋势就是寻找数据水平的中心值或代表值,常用的指标:算数均数,中位数。
算数均数简称均数,用于说明一组观察值的平均水平,用表示,公式如下:
(2-1)
例如:测得8组为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38,试求其算术均数,则

中位数是将每个变量值从小到大排列,位置居于中间的那个变量值,用M表示。计算公式如下:


例如:有9个样本数据,分别为2,5,4,3,3,6,9,16,3,求中位数。
首先对数据排序得2,3,3,3,4,5,6,9,16,则中位数为

2.离散趋势的统计量
样本数据的离散趋势可由方差度量,公式如下:
(2-2)
由此可见,方差是各个数据与均数距离的平方和。如果数据不存在变异,所有的样本数据xi均等于
,则此时样本方差s2=0。一般来说,方差越大的样本,存在的变异也越大。
样本的方差s2是原始数据取平方后得到的,这使得在使用时存在很多的不便,因此,我们更习惯于用它的平方根,也称为标准差,计算公式如下:
(2-3)
例如:测得甲乙2组数据分别为:


则甲的标准差为

乙的标准差为

因此,相比之下甲组数据变异更大。