Minitab17:19.1 功效和样本量计算简介

 

本文摘自本订阅号编著的《Minitabx26nbsp;常用统计分教程》(电子工业出版社2017年待出版)...



19.1 功效和样本量计算简介

样本量(Sample Size)又称样本含量或样本大小,是指在抽样研究中每个样本所包含的调查对象数或受试对象数。样本量是试(实)验设计中重复性原则的体现,是试(实)验设计中研究工作者须重点考虑的问题,直接关系着研究工作的规模大小,涉及研究工作经费、人力物力和时间的安排。一般来说,样本量过少,所得指标不够稳定,实验结果缺少可靠性,结论缺乏充分依据;样本量过大,则会增加实际研究的难度,延长研究周期,亦造成时间、人力、经济上不必要的浪费。鉴此,在保证研究结论具有一定可靠性的条件下,对样本量进行合理估算,确定最少的试验单位数尤为重要。

Minitab的功效和样本量计算功能可以帮助我们在设计实(试)验方案并执行之前(前瞻性研究),或执行之后(回顾性研究)评估检验功效和样本量。

●前瞻性研究:应用在试验数据收集之前以充分考虑研究设计的灵敏度。研究者需要确保研究有足够大的检验效能,能够将你确定为重要变量的差值(效应)检测出来。例如,可以通过增大样本量或采取措施控制容许误差来提高设计的灵敏度。

●回顾性研究:应用在试验数据收集之后帮助了解已完成的试验的检验功效。例如,假设开展了一项研究,但数据分析显示研究中并没有任何统计学差异的结果。你可以基于期望试验检测到的变量的最小差值(效应)计算出检验效能。如果检验效能较低,那么可能需要修改试验设计后继续评估计算。但如果计算得到的检验效能很高,那么你可能要断定研究中确实不存在有意义的差值(效应),并终止试验。

通常来说,样本量大小与检验水准α、检验功效(1-β)、容许误差δ、单双侧检验以及总体的相关信息密切相关。

1.检验水准

检验水准α是指在假设检验中出现第I类错误的可能性,即当相比较的两个事物间原本并不存在差异时,通过假设检验检验出两者存在差异的可能性,一般用概率来度量。用公式表示为第I类错误的概率=P(拒绝H0∣H0为真)≤α。在假设检验中,α的数值是事先确定的,一般取α=0.05或α=0.01(偶尔可取0.10),但α的数值不能主观随意确定,必须根据第I类错误的危害性来决定。

例如在做新药与常规药物疗效比较时,第I类错误会将原本等效的新药不恰当地奉为创新,而将原本市场上的常规药物摒弃掉,造成错误和浪费。当然,要想彻底消灭第I类错误是不可能做到的,因此必须结合研究实际情况确定合适的α值大小。在样本量估计中,要求α值越小,研究所需的样本量越大。

2.检验功效

检验功效(1-β)是指在特定的α水准下,若总体间确实存在差异,该次研究能发现此差异的能力。(1-β)越大,假设检验的效能越高。根据样本假设检验得到的推论结合真实情况,假设检验有四种可能的结果。检验的功效是指当H0为假时准确否定它的概率。这四种可能的结果总结如下:

假设检验的结论
真实情况
H0为真

H0为假

拒绝H0

I类错误,P=α

正确决策,p  =1-β

不拒绝H0

正确决策

II类错误,P=β

如果假设检验H0实际上是正确的,但由样本数据计算获得的检验统计量得出拒绝H0的结论,统计学上称此类情况为发生了I类错误。发生I类错误的概率称为α(alpha),即检验水准。

如果假设检验H0为假,但由样本数据计算获得的检验统计量得出不拒绝H0的结论,就发生了II类错误。犯II类错误的概率称为β(beta)。

在科研设计时只有确定β的数值才能进一步估算样本量大小。通常取β=0.1或β=0.2,相应检验效能为0.9或0.8,一般检验效能最低不宜低于0.75,否则可能出现非真实的阴性结果。在样本量估计中,要求(1-β)值越大,研究所需的样本量越大。

3.差值或容许误差

在实际应用中,差值指样本与总体、两样本之间均值或率指标之差等。在样本量大小的计算中,需要根据专业知识判断或预实验结果来预计样本统计量(X或p)与相应总体参数(μ或π)的最大相差控制在什么范围,即确定容许误差大小δ。

在科研设计中,容许误差和检验功效的大小成正比,而与样本统计量的准确性要求成反比。即,科研设计中要求的容许误差愈小,即调查结果准确性愈高,则把握程度愈低;反之,容许误差范围增大,样本统计量的准确性减小,把握程度随之增大。因此,要求容许误差δ愈小,所需样本量愈大。

4.单、双侧检验

在实际研究工作中何时使用单侧检验,何时使用双侧检验要根据研究的目的、资料性质及样本特征来确定。例如,工厂对其产品电池的寿命进行了工艺改革,并要对新工艺条件下生产新电池的寿命与旧产品的寿命进行评估比较。当工厂欲检测新产品电池与旧产品的寿命是否一致时,可以使用独立样本双侧t检验的样本量估计来检测具有足够功效的差异需要多少样本;而在实际生产中,工艺改革后,我们关心的是电池的平均寿命μ不能降低,因此可将研究目的改为“工艺改革后,电池的平均寿命μ不低于旧产品”,此时,使用独立样本单侧t检验的样本量估计来检测具有足够功效的差异需要多少样本。同一实验中,用单侧检验比用双侧检验所需例数少。但选用单侧检验需要谨慎,在专业上必须有充分的理由。

5.总体的相关信息

进行均值比较时,需了解个体变异大小即总体标准差σ,率的比较需了解总体率π的大小,相关分析时需了解总体相关系数ρ的大小。σ越大,所需样本量越多;总体率π越接近于0.50,则所需样本量越多;ρ越小,所需样本量越多。σ、π、ρ一般未知,通常以样本的s、p、r作为估计值,多由预实验、查阅文献、经验估计而获得。

综上所述,使检验假设的结论具有一定可靠性时所必需的样本量即指按照一定的检验水准(即假设检验的I类错误概率α)发现所比较因素间特定的效应差别δ,同时又保证检验效能为(1-β)时所需的最少实验单位数。

Minitab可为以下类型的研究计算功效、样本量和差值(效应):

·单样本Z检验

·单样本t检验

·独立样本t检验

·配对样本t检验

·单方差检验

·双方差检验

·单样本率检验

·独立样本率检验

·单样本Poisson检验

·独立样本Poisson检验

·单因子方差分析

单样本等效检验

独立样本等效检验

配对样本等效检验

二阶段交叉设计等效检验

·两水平因子设计

·Plackett-Burman设计

·一般全因子设计

此外,还可以使用Minitab计算参数估计值或容差区间的样本量或允许误差。



本文摘自本订阅号编著的《Minitab 常用统计分教程》(电子工业出版社2017年待出版)。

特别礼包:回复“免费”二字可获取一起学统计工具免费资源包或“一起学统计工具”咨询平台入口网址。

本订阅号已实现智能检索功能,回复任意关键词可检索相关文章。

本订阅号出版的书籍(扫描二维码可直接购买)


    关注 一起学SPSS


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册