基本步骤:
- 建立假设 —— 提出原假设和备择假设
- 原假设:也称为零假设((H_0)),通常是统计者想要拒绝的假设。
- 备择假设:也称对立假设((H_1)),通常是统计者想要接受的假设。
- 类型:当原假设为(H_0:\theta=\theta_0) 时,备择假设可能有三种情况
- (H_1:\theta \neq \theta_0),此时称为双侧假设或双边假设。
- (H_1:\theta < \theta_0) 或(H_1:\theta > \theta_0),此时称为单侧假设或单边假设。 注:在假设检验中,通常将不宜轻易加以否定的假设作为原假设。
- 选择检验统计量,给出拒绝域 (W)
- 选择显著性水平
当我们运用某种检验判断时,我们可能会做出正确的判断,也可能会做出错误的判断,所以我们可能会犯两个错误:[En]
When we apply a certain test judgment, we may make a correct judgment, or we may make a wrong judgment, so we may make two mistakes:
- 当原假设为真,而样本由于随机性却落入了拒绝域,于是我们做出了拒绝原假设的错误决策,这样的错误称为 第一类错误。
- 当备择假设为真,而样本却落入了接受域,于是我们采取了接受原假设的错误决策,这样的错误称为 第二类错误。 因此需要确定一个显著性水平,以尽可能减少错误决策。然而事实证明,我们没法使犯两类错误的概率同时减小,因此通常的做法是仅限制犯第一类错误的概率 (\alpha)。
显著性水平 (\alpha),即为在原假设为真时拒绝原假设的概率。例如,显著性水平0.05表示当没有实际差异时得出存在差异,会有5%的风险。 - 给出拒绝域
所谓拒绝域是样本空间中导致拒绝零假设的所有样本点的集合。在图像上,拒绝域是被显著水平包围的区域,如下图所示。[En]
The so-called rejection domain is the set of all sample points in the sample space that lead to the rejection of the zero hypothesis. On the image, the rejection domain is an area surrounded by the significance level, as shown in the following figure.
样本点落入拒绝域中,即认为我们犯第一类错误的概率比事先设定的阈值 (\alpha) 还要小,即此时我们做出拒绝原假设的决策是可靠的。反之,如果样本点没有落入拒绝域,即我们犯第一类错误的概率比较大,那么我们此时做出拒绝原假设的决策是不可靠的,因此不能拒绝原假设。 - 计算P值
P值——假设检验犯弃真错误(第一类错误)的概率。