第六章 抽样分布
6.1 数理统计中的基本概念
数理统计是以概率论为基础,研究如何有效地收集、整理、分析带有随机性的数据,以便对所考察的问题作出推断或预测的一门学科。
6.1.1 总体
总体(Population)是指所研究问题中的全体对象(个体)的集合。在统计学中,一般不是直接研究总体本身,而是研究总体某个数量指标的取值的全体,这个数量指标称为随机变量。
为了研究的方便,常常用一个随机变量
总体的分类:
- 有限总体:个体数有限的总体。
- 无限总体:个体数无限的总体。
在数理统计中,一般假设总体是无限的或者总体虽然有限但样本容量远小于总体容量,此时可以视为无限总体处理。
例子:
- 某批产品的质量指标构成总体,总体分布描述了质量指标的概率分布;
- 某地区成年男子的身高构成总体,服从某个正态分布;
- 某设备的使用寿命构成总体,可能服从指数分布。
6.1.2 简单随机样本
样本(Sample)是从总体中抽取的若干个个体的集合。设总体为随机变量
如果样本
- 代表性:每个
与总体 有相同的分布; - 独立性:
相互独立。
样本容量(Sample Size):样本中个体的个数
样本观测值:在一次具体的抽样中,样本
抽样方法:
- 有放回抽样:每次抽取后将个体放回总体,然后进行下一次抽取;
- 无放回抽样:每次抽取后不将个体放回总体。
当总体容量远大于样本容量时,有放回抽样和无放回抽样的结果相差很小,都可以看作简单随机样本。
6.1.3 统计量
统计量(Statistic)是样本的函数,即不含任何未知参数的样本函数
统计量是随机变量,其分布称为抽样分布(Sampling Distribution)。
常用统计量:
样本均值:
样本方差:
计算公式:
样本标准差:
样本
阶原点矩:样本
阶中心矩:顺序统计量: 将样本
按从小到大顺序排列,得到:称为顺序统计量,其中
, 。样本中位数:
为 奇 数 为 偶 数 样本极差:
注意:样本方差
6.2 数理统计中的三个重要分布
在数理统计中,有三个重要的分布:
6.2.1 分布
定义
设
的分布称为自由度为
概率密度函数
其中
性质
数学期望和方差: 若
,则 , 。可加性: 若
, ,且 与 相互独立,则:分布形状:
- 当
时,密度函数单调递减; - 当
时,密度函数先增后减,在 处达到最大值; - 当
较大时, 近似正态分布 。
- 当
分位数: 对于给定的
,称满足 的数 为 分布的上 分位数。
6.2.2 分布
定义
设
的分布称为自由度为
概率密度函数
性质
对称性:
分布关于 对称,即 。数学期望和方差:
- 当
时, ; - 当
时, 。
- 当
极限性质: 当
时, 分布趋于标准正态分布 。在实际应用中,当 时,可以用标准正态分布近似 分布。分布形状:
分布的形状类似于标准正态分布,但尾部更厚(方差更大)。分位数: 对于给定的
,称满足 的数 为 分布的上 分位数。由对称性:
。
6.2.3 分布
定义
设
的分布称为第一自由度为
概率密度函数
性质
数学期望和方差: 若
,则:- 当
时, ; - 当
时, 。
- 当
倒数性质: 若
,则 。与
分布的关系: 若 ,则 。分位数: 对于给定的
,称满足 的数 为 分布的上 分位数。由倒数性质:
。
6.3 正态总体中统计量的分布
当总体服从正态分布时,某些常用统计量具有确定的分布,这为统计推断提供了理论基础。
6.3.1 单个正态总体中的统计量的分布
设
定理1
样本均值
标准化后:
定理2
样本方差的分布:
推论:
定理3(重要)
样本均值
这个结论对于正态总体是成立的,但对于非正态总体一般不成立。
定理4
这个统计量在
定理5
设
6.3.2 两个正态总体中的统计量的分布
设
设
定理6
样本均值之差的分布:
标准化后:
定理7
样本方差比的分布:
特别地,当
定理8(两个方差相等的情况)
当
为合并样本方差(pooled sample variance),则:
其中:
这些分布定理是参数估计和假设检验的理论基础,在数理统计的应用中具有重要地位。