第八章 假设检验
8.1 假设检验的基本概念
8.1.1 假设检验的原理与基本理念
假设检验(Hypothesis Testing)是数理统计推断的另一个重要分支,它根据样本信息来判断关于总体的某个假设是否正确。
基本思想: 假设检验采用"反证法"的思想,即先假设要检验的假设是正确的,然后根据样本信息计算在此假设下某个统计量的观测值,如果这个观测值出现的概率很小(小于预先给定的显著性水平),就拒绝原假设;否则不拒绝原假设。
例子:
- 某厂声称其生产的零件的平均重量为100g,质检部门要检验这个声称是否属实;
- 医学研究中要检验某种新药是否比现有药物更有效;
- 教育研究中要检验某种新的教学方法是否能提高学生成绩。
假设:
- 原假设(零假设)
:通常是我们要检验的假设,一般表示"无显著差异"、"无显著效果"等; - 备择假设(对立假设)
:与原假设相对立的假设。
假设检验的实质是在
8.1.2 假设检验的步骤
假设检验的基本步骤如下:
第1步:建立假设 根据实际问题的需要,建立原假设
第2步:选择检验统计量 根据样本信息和原假设,选择合适的检验统计量,并确定其在原假设成立时的分布。
第3步:确定显著性水平 显著性水平
第4步:确定拒绝域 根据显著性水平
第5步:计算检验统计量的观测值 根据样本数据计算检验统计量的观测值。
第6步:作出检验结论
- 若检验统计量的观测值落在拒绝域内,则拒绝
,接受 ; - 若检验统计量的观测值不在拒绝域内,则不拒绝
。
检验的类型:
- 双侧检验:
vs - 左侧检验:
vs - 右侧检验:
vs
8.1.3 假设检验中的两类错误
在假设检验中,可能犯两类错误:
第一类错误(Type I Error):
- 概率:
称为犯第一类错误的概率,也称为显著性水平
第二类错误(Type II Error):
- 概率:
称为犯第二类错误的概率
检验功效:
不拒绝 | 正确决策 | 第二类错误 |
拒绝 | 第一类错误 | 正确决策 |
理想目标:希望
Neyman-Pearson原则:在控制第一类错误概率不超过
p值(p-value):在原假设成立的条件下,检验统计量取观测值或更极端值的概率。若
8.2 单个正态总体参数的假设检验
设
8.2.1 均值 的检验
情况1: 已知
检验问题:
检验统计量:
拒绝域: 对于显著性水平
检验过程:
- 计算检验统计量:
- 若
,则拒绝 ;否则不拒绝
单侧检验:
左侧检验:
- 拒绝域:
右侧检验:
- 拒绝域:
情况2: 未知
检验问题:
检验统计量:
拒绝域:
检验过程:
- 计算检验统计量:
- 若
,则拒绝 ;否则不拒绝
单侧检验的拒绝域:
- 左侧检验:
- 右侧检验:
8.2.2 方差 的检验
情况: 未知
检验问题:
检验统计量:
拒绝域:
单侧检验:
左侧检验:
- 拒绝域:
右侧检验:
- 拒绝域:
8.3 两个正态总体参数的假设检验
设
8.3.1 均值 , 的检验
情况1: 和 已知
检验问题:
检验统计量:
在
拒绝域:
情况2: 未知
检验问题:
检验统计量: 使用合并样本方差:
拒绝域:
情况3: 且均未知(Welch检验)
检验统计量:
近似服从自由度为
拒绝域:
情况4:配对样本检验
当两个样本中的观测值存在自然配对关系时,设
检验问题:
检验统计量:
其中
8.3.2 方差 , 的检验
检验两个方差是否相等
检验问题:
检验统计量:
拒绝域:
由于
单侧检验:
右侧检验:
- 拒绝域:
左侧检验:
- 拒绝域:
8.4 总体分布的 拟合优度检验
拟合优度检验用于检验样本是否来自某个特定的总体分布。
8.4.1 理论分布 完全已知的情况
检验问题:
基本思想: 将样本空间分成
符号:
:样本中落在区间 内的观测个数(实际频数) :当 成立时,观测值落在 内的概率 :理论频数
Pearson
定理:当
拒绝域:
检验步骤:
- 将样本空间分成
个区间,计算各区间的实际频数 ; - 在
下计算各区间的理论概率 和理论频数 ; - 检查是否满足
,如不满足需合并相邻区间; - 计算检验统计量
; - 若
,则拒绝 。
8.4.2 理论分布 含有未知参数的情况
当理论分布
检验步骤:
- 用样本估计分布
中的 个未知参数; - 用估计参数替代真实参数,按8.4.1的方法进行检验;
- 自由度改为
。
定理:当
拒绝域:
常见应用:
检验正态性:
- 用样本均值和样本方差估计
和 - 自由度为
- 用样本均值和样本方差估计
检验泊松分布:
- 用样本均值估计
- 自由度为
- 用样本均值估计
检验指数分布:
- 用样本均值的倒数估计
- 自由度为
- 用样本均值的倒数估计
独立性检验: 用于检验两个分类变量是否独立。设有
检验问题:
检验统计量:
其中
当
拒绝域: