当我们要搜集数据之际,而无法针对所有的对象进行测量时,就可以只以部分为对象进行测量,此称为抽样(Sampling)。
例如,为了制定下一步的质量改进方案,某制造企业需要对当天生产的若干台电机进行检验。面向整体生产量,这些待检的电机只是所有出厂产品中的一部分。我们把从中挑选出来、用于测量和分析的那几台电机称为“样本”(Sample);而决定要从总体中抽取这些电机的过程,就叫做“抽样”。
“抽样手法”则是指如何选择这批样本,以及要抽取多少台电机。就如何选这一点而言,公司可以按生产线来区分,比如把第一、第二、第三号生产线作为三个层次分别抽样(分层随机抽样),也可以不区分生产线,只在所有出厂电机中随机抽取(简单随机抽样)。至于要抽多少台,则需要结合检验精度和成本来决定。这样,通过合理的抽样,企业既能在可控成本内获得具有代表性的数据,又能为质量改进提供可靠依据。
抽样(Sampling)的实例
以抽样调查来说,电视的收视率调查非常有名,这是想调查全国观看某节目的比率。由于调查所有的住户甚为困难,因此调查一部分的收视率,而后估计全国的收视率。 市场研究公司进行收视率调查的作法是针对数百住户进行调查。
此时的误差如依据统计理论来考察时,若全国有 20%的人在观看某节目时,300 家住户的调查其误差范围在 5%左右,因此在 0.1%水准下收视率是上升或下降是没意义的。如想设定在 0.1%时,则需要以 50~100 万的单位来增加住户的调查。
抽样应用的重点
抽样的基本是随机搜集样本,随机抽样也是应用统计理论的条件。譬如调查进厂的布料,只以一部分调查也不能说是调查所有的布料。无法从全体随机抽样时,也有从一部分随机选出的方法,且抽样可得知需要的数据个数。「像这样,以少数的数据就行吗?」具有此种疑问的情形也不在少数,针对此可以提供定量上的解答。
抽样在过程改进中的意义
从六西格玛的角度来看,我们在确定合适的样本量时,通常是为了两个目的之一:估计一个平均值,或者估计一个比例。
你使用的样本量计算公式,取决于你打算如何使用这个样本。