区间估计 (Interval Estimation)
基本概念
区间估计(Interval Estimation) 是用两个统计量 和 构成区间 ,使得该区间以一定概率包含未知参数 。
置信水平
设 为未知参数,若有:
则称 为置信水平(Confidence Level),区间 为 的置信水平为 的置信区间(Confidence Interval)。
置信区间的解释
正确理解:置信区间是随机的,而参数是固定的。置信水平 表示在大量重复抽样中,约有 的置信区间会包含真实参数值。
常见误解:不能说”参数落在 内的概率为 “,因为参数虽然未知但是固定值,不是随机变量。
枢轴量法
枢轴量法(Pivotal Quantity Method) 是构造置信区间的通用方法。
枢轴量的定义
枢轴量(Pivotal Quantity) 是样本和参数的函数,满足:
- 的分布不依赖于任何未知参数
- 是 的单调函数
构造步骤
- 选取合适的枢轴量
- 根据 的已知分布,确定常数 使得:
- 通过不等式变换,得到 的置信区间
示例:正态总体均值的置信区间
设 , 已知。
选取枢轴量:
确定常数:设 为标准正态分布的上 分位数,则:
变换不等式:
置信区间:
单侧与双侧置信区间
双侧置信区间
两端都有界的置信区间,如上面的 。
单侧置信区间
只有一侧有界的置信区间:
- 下限置信区间:
- 上限置信区间:
选取原则
- 当关心参数是否在某个范围内时,使用双侧置信区间
- 当只关心参数是否小于(或大于)某个值时,使用单侧置信区间
常见置信区间汇总
正态总体均值的置信区间
| 情形 | 置信区间 |
|---|---|
| 已知 | |
| 未知(大样本) | |
| 未知(小样本) |
其中 为样本标准差, 为自由度 的 分布上 分位数。
正态总体方差的置信区间
设 ,枢轴量:
置信区间:
两个正态总体均值差的置信区间
设 ,, 已知/未知。
已知:
未知:
其中 为合并方差。
比率 的置信区间(大样本)
设 为二项比例的估计(大样本 ):
寻找枢轴量的技巧
- 从点估计出发:许多枢轴量是”点估计减去参数”除以某个标准量
- 利用抽样分布:三大抽样分布(、、)是构造枢轴量的基础
- 对称变换:对于对称分布(如正态、),利用对称性构造双侧置信区间
- 单调变换:如果 是枢轴量,则 也是枢轴量( 单调)
置信区间与假设检验的关系
置信区间与假设检验存在对偶关系:
- 参数 的置信水平 的置信区间,等价于检验水平 下所有不被拒绝的 构成的集合
- 双侧检验与双侧置信区间对应
- 单侧置信区间与单侧检验对应