功效与样本量的计算

人工智能53

我经常被问到这样的问题:"做假设检验时,需要的样本量是多少", "我的实验究竟需要多少样本才有意义呢?",这类问题可以通过功效与样本量计算来解决。

什么是功效?

所有检验都不可能尽善尽美,总存在这样的可能,即当原假设 (H0) 实际为真时您会根据检验结果否定原假设(I 型错误),或当原假设实际为假时您根据检验结果未能否定 H0(II 型错误)。这是因为为了估计总体均值,您必须使用随机样本,而这些随机样本都是随机抽取的。

功效与样本量的计算

第II类错误(被坑)的概率为β,而1- β我们称之为功效。II类错误是如果有个人有罪,而错误地判他无罪,所以"功效"就可以理解为,如果他实际上确实有罪,而且法官正确地判断他有罪的概率。

假设检验的有效性受到样本数量、差异、数据变异性和检验显著水平的影响。

[En]

The efficacy of hypothesis testing is affected by the sample number, difference, data variability and significance level of the test.

功效与样本量的计算

案例分析

一种镇定剂中的活性成分的目标含量为365mg/ml,每批镇静剂在使用前都要进行检测,以发现明显偏离目标的情况。

数据收集:从6个不同批次中随机抽取6个样品,测量其中的有效成分含量。

功效与样本量的计算

描述性统计分析

功效与样本量的计算

功效与样本量的计算

功效与样本量的计算

注意:不能直接从描述性统计量中得到偏离目标含量365mg/ml的结论,即使样本均值确实不是365mg/ml.

单样本t检验

功效与样本量的计算

功效与样本量的计算

功效与样本量的计算

单样本t检验的结果显示P>0.05,故不拒绝原假设,换句话说,没有足够的证据拒绝有效成分含量均值为365mg/ml。

功效与样本量的计算

当结果是没有统计学差异时,有必要报告您的测试的效果。因为如果你的效率很低,很可能是因为样本量不足,所以不可能对有显著差异的结果进行测试。

[En]

When the result is that there is no statistical difference, it is necessary to report the efficacy of your test. Because if your efficiency is very low, it is likely that the insufficient sample size makes it impossible to test the results with significant differences.

功效与样本量的计算

功效与样本量的计算

在这里,我必须解释上面的对话框(我亲爱的客户朋友经常对此有疑问)。

[En]

Here, I have to explain the above dialog box (my dear client friends often have questions about this).

差值

差值是在检测总体参数的假设值与实际值时您想得到的最小差值,看不懂,没关系,我们举个例子。在上面的对话框中我输入的差值为-2.5和2.5,为什么呢?因为在这里我认为,如果有效成分含量偏离目标值2.5mg/ml时,我就认为是有显著偏离,当然这里的偏离可以偏大(2.5),也可以偏小(-2.5)。

标准差

效率和样本量分析中使用的标准差取决于您是否收集了数据。

[En]

The standard deviation used in efficiency and sample size analysis depends on whether you have collected data.

1) 尚未收集数据:请使用总体标准差的估计值。您的估计值应以相关研究、设计规范、试验研究、学科知识或相似信息为基础。

2) 如果您已经收集并分析了数据,则使用下表所示的分析结果所提供的值。

您执行的分析的类型

用于标准差的值

单样本 t 或单样本 Z

样本的标准差

双样本 t

合并标准差

配对 t

配对差的标准差

单因子方差分析、2 水平因子设计或 Plackett-Burman 设计

均方误 (MSE) 平方根的平均值

Minitab结果如下;

功效与样本量的计算

结果显示,当样本量只有6个时,这时候的检验功效只有0.54,或者说犯第二类错误的概率高达0.46。功效太低,当前没有显著差异的结论很可能是样本量不足导致。

如果对于此分析,我想功效不低于0.9,那么这时候我该抽取多少样本量呢?

功效与样本量的计算

功效与样本量的计算

Minitab结果显示,要想功效不低于0.9,那么这时候我们需要再抽6个样本,一共12个样本才行。

再来一次单样本t检验

现在,又再抽了6个样本,一共12个样本,再来做一次假设检验。

功效与样本量的计算

功效与样本量的计算

功效与样本量的计算

这时候我们发现,当样本量增加到12时,P<0.05,故拒绝原假设,得到有显著偏离目标值的结论。

小结

测试所需的样本量取决于你愿意承担多少犯错的风险,所以当你分析未来的样本量是否足够时,首先要尽量计算出效率和样本量。

[En]

The sample size required for testing depends on how much you are willing to take the risk of making a mistake, so when you analyze whether the sample size is enough in the future, try to calculate the efficiency and sample size first.

如果测试的效果很低,你可能无法检测到效果,并错误地得出没有效果的结论。此外,应该注意的是,如果测试的有效性太高,小的影响或不需要注意的影响可能看起来很大。

[En]

If the efficacy of the test is low, you may not be able to detect the effect and mistakenly conclude that there is no effect. In addition, it should be noted that if the effectiveness of the test is too high, small effects or effects that do not require attention may seem significant.

思考

如何提高假设检验的功效?

Original: https://blog.csdn.net/MinitabUG/article/details/122827591
Author: MinitabUG
Title: 功效与样本量的计算

相关文章
VOC数据集转YOLO数据集 人工智能

VOC数据集转YOLO数据集

文章目录 * - 制作自己的VOC数据集 - 生成数据集名称文件 - .xml文件转.txt文件 - 完善自己的YOLO数据集 制作自己的VOC数据集 首先,把VOC数据集里的图片和.xml文件按照如...
TF2.x的keras模型保存与加载 人工智能

TF2.x的keras模型保存与加载

Keras模型包含多个组件: 模型的结构或者配置文件,表明模型包含哪些网络层以及各层之间的连接方式。 当前状态模型的参数。 模型的optimizer,在complie里进行定义的。 模型的损失函数和度...