区间估计
定义:置信区间的概念
区间估计是用两个统计量 和 构成区间 ,使得该区间在一定概率意义下包含未知参数 。1
置信水平
设 为未知参数,若有:
则称 为置信水平,区间 为 的置信区间。
置信区间的解释
正确理解:置信区间是随机的,而参数是固定的。置信水平 表示在大量重复抽样中,按同样方法构造出来的区间里,约有 会包含真实参数值。2
常见误解:不能说“参数落在 内的概率为 ”,因为参数虽然未知,但是固定值,不是随机变量。
构造思路
区间估计的核心,是先为未知参数构造一个随机区间,再把这个随机区间的覆盖概率控制在 。
常见做法是先找到一个分布已知、且不含未知参数的枢轴量,再由其分位数反推出参数区间。
枢轴量法
枢轴量法是构造置信区间的通用方法。
枢轴量的定义
枢轴量 是样本和参数的函数,满足:
- 的分布不依赖于任何未知参数;
- 是 的单调函数。
为什么叫”枢轴量”? 这个名字很形象:枢轴量就像一个支点——当我们把不等式两边翻转时,参数从”被包围”的位置移动到了”主动”的位置。具体来说,我们把”参数在某个区间内”这个陈述,转化为”某个统计量落在某个范围内”,而这个统计量的分布是已知的(不依赖未知参数)。
寻找枢轴量的技巧:
- 从点估计出发:许多枢轴量是”点估计减去参数”再除以标准误差的形式;
- 利用已知分布:正态总体的 、 分布的 都是经典的枢轴量;
- 单调变换:如果 是枢轴量,则 ( 单调)也是枢轴量。3
构造步骤
- 选取合适的枢轴量 ;
- 根据 的已知分布,确定常数 使得:
- 通过不等式变换,得到 的置信区间。
示例:正态总体均值的置信区间
设 , 已知。
选取枢轴量:
确定常数:设 为标准正态分布的上 分位数,则:
变换不等式:
置信区间:
寻找枢轴量的技巧
- 从点估计出发:许多枢轴量是“点估计减去参数”再除以某个标准量。
- 利用抽样分布:三大抽样分布(、、)是构造枢轴量的基础。
- 对称变换:对于对称分布(如正态、),可以利用对称性构造双侧置信区间。
- 单调变换:如果 是枢轴量,则 也是枢轴量( 单调)。
常见置信区间汇总
正态总体均值的置信区间
| 情形 | 置信区间 |
|---|---|
| 已知 | |
| 未知(大样本) | |
| 未知(小样本) |
其中 为样本标准差, 为自由度 的 分布上 分位数。
正态总体方差的置信区间
设 ,枢轴量:
置信区间:
两个正态总体均值差的置信区间
设 ,, 已知/未知。
已知:
未知:
其中 为合并方差。
比率 的置信区间(大样本)
设 为二项比例的估计(大样本 ):
单侧与双侧置信区间
双侧置信区间
两端都有界的置信区间,如上面的 。
单侧置信区间
只有一侧有界的置信区间:
- 下限置信区间:
- 上限置信区间:
选取原则
- 当关心参数是否在某个范围内时,使用双侧置信区间;
- 当只关心参数是否小于(或大于)某个值时,使用单侧置信区间。
应用
置信区间与假设检验的关系
置信区间与假设检验存在对偶关系:4
- 参数 的置信水平 的置信区间,等价于检验水平 下所有不被拒绝的 构成的集合;
- 双侧检验与双侧置信区间对应;
- 单侧置信区间与单侧检验对应。
相关章节
Footnotes
-
本页关于置信区间的定义、枢轴量法与常见区间公式,整理自常见数理统计教材的区间估计章节。 ↩
-
关于置信水平的解释,可参考经典统计推断教材对“重复抽样覆盖率”的说明。 ↩
-
关于枢轴量法的详细讲解,可参考明尼苏达大学的课程笔记 Confidence Intervals ↩
-
关于置信区间与假设检验的对偶关系,可参考数理统计中“区间估计与参数检验”的对应章节。 ↩