区间估计

定义:置信区间的概念

区间估计是用两个统计量 构成区间 ,使得该区间在一定概率意义下包含未知参数 1

置信水平

为未知参数,若有:

则称 置信水平,区间 置信区间

置信区间的解释

正确理解:置信区间是随机的,而参数是固定的。置信水平 表示在大量重复抽样中,按同样方法构造出来的区间里,约有 会包含真实参数值。2

常见误解:不能说“参数落在 内的概率为 ”,因为参数虽然未知,但是固定值,不是随机变量。

构造思路

区间估计的核心,是先为未知参数构造一个随机区间,再把这个随机区间的覆盖概率控制在

常见做法是先找到一个分布已知、且不含未知参数的枢轴量,再由其分位数反推出参数区间。

枢轴量法

枢轴量法是构造置信区间的通用方法。

枢轴量的定义

枢轴量 是样本和参数的函数,满足:

  1. 的分布不依赖于任何未知参数;
  2. 的单调函数。

为什么叫”枢轴量”? 这个名字很形象:枢轴量就像一个支点——当我们把不等式两边翻转时,参数从”被包围”的位置移动到了”主动”的位置。具体来说,我们把”参数在某个区间内”这个陈述,转化为”某个统计量落在某个范围内”,而这个统计量的分布是已知的(不依赖未知参数)。

寻找枢轴量的技巧

  1. 从点估计出发:许多枢轴量是”点估计减去参数”再除以标准误差的形式;
  2. 利用已知分布:正态总体的 分布的 都是经典的枢轴量;
  3. 单调变换:如果 是枢轴量,则 单调)也是枢轴量。3

构造步骤

  1. 选取合适的枢轴量
  2. 根据 的已知分布,确定常数 使得:
  1. 通过不等式变换,得到 的置信区间。

示例:正态总体均值的置信区间

已知。

选取枢轴量

确定常数:设 为标准正态分布的上 分位数,则:

变换不等式

置信区间

寻找枢轴量的技巧

  1. 从点估计出发:许多枢轴量是“点估计减去参数”再除以某个标准量。
  2. 利用抽样分布:三大抽样分布()是构造枢轴量的基础。
  3. 对称变换:对于对称分布(如正态、),可以利用对称性构造双侧置信区间。
  4. 单调变换:如果 是枢轴量,则 也是枢轴量( 单调)。

常见置信区间汇总

正态总体均值的置信区间

情形置信区间
已知
未知(大样本)
未知(小样本)

其中 为样本标准差, 为自由度 分布上 分位数。

正态总体方差的置信区间

,枢轴量:

置信区间:

两个正态总体均值差的置信区间

已知/未知。

已知

未知

其中 为合并方差。

比率 的置信区间(大样本)

为二项比例的估计(大样本 ):

单侧与双侧置信区间

双侧置信区间

两端都有界的置信区间,如上面的

单侧置信区间

只有一侧有界的置信区间:

  • 下限置信区间
  • 上限置信区间

选取原则

  • 当关心参数是否在某个范围内时,使用双侧置信区间
  • 当只关心参数是否小于(或大于)某个值时,使用单侧置信区间

应用

置信区间与假设检验的关系

置信区间与假设检验存在对偶关系:4

  • 参数 的置信水平 的置信区间,等价于检验水平 下所有不被拒绝的 构成的集合;
  • 双侧检验与双侧置信区间对应;
  • 单侧置信区间与单侧检验对应。

相关章节

Footnotes

  1. 本页关于置信区间的定义、枢轴量法与常见区间公式,整理自常见数理统计教材的区间估计章节。

  2. 关于置信水平的解释,可参考经典统计推断教材对“重复抽样覆盖率”的说明。

  3. 关于枢轴量法的详细讲解,可参考明尼苏达大学的课程笔记 Confidence Intervals

  4. 关于置信区间与假设检验的对偶关系,可参考数理统计中“区间估计与参数检验”的对应章节。