区间估计

定义：置信区间的概念

区间估计是用两个统计量 $T_{1}$ 和 $T_{2}$ 构成区间 $(T_{1}, T_{2})$ ，使得该区间在一定概率意义下包含未知参数 $θ$ 。¹

置信水平

设 $θ$ 为未知参数，若有：

P_{θ} (T_{1} \leq θ \leq T_{2}) \geq 1 - α, \forall θ \in Θ

则称 $1 - α$ 为置信水平，区间 $(T_{1}, T_{2})$ 为 $θ$ 的置信区间。

置信区间的解释

正确理解：置信区间是随机的，而参数是固定的。置信水平 $1 - α$ 表示在大量重复抽样中，按同样方法构造出来的区间里，约有 $100 (1 - α) %$ 会包含真实参数值。²

常见误解：不能说“参数落在 $(T_{1}, T_{2})$ 内的概率为 $1 - α$ ”，因为参数虽然未知，但是固定值，不是随机变量。

构造思路

区间估计的核心，是先为未知参数构造一个随机区间，再把这个随机区间的覆盖概率控制在 $1 - α$ 。

常见做法是先找到一个分布已知、且不含未知参数的枢轴量，再由其分位数反推出参数区间。

枢轴量法

枢轴量法是构造置信区间的通用方法。

枢轴量的定义

枢轴量 $Q (X, θ)$ 是样本和参数的函数，满足：

$Q$ 的分布不依赖于任何未知参数；
$Q$ 是 $θ$ 的单调函数。

为什么叫”枢轴量”？ 这个名字很形象：枢轴量就像一个支点——当我们把不等式两边翻转时，参数从”被包围”的位置移动到了”主动”的位置。具体来说，我们把”参数在某个区间内”这个陈述，转化为”某个统计量落在某个范围内”，而这个统计量的分布是已知的（不依赖未知参数）。

寻找枢轴量的技巧：

从点估计出发：许多枢轴量是”点估计减去参数”再除以标准误差的形式；
利用已知分布：正态总体的 $\frac{X ˉ - μ}{σ / n}$ 、 $t$ 分布的 $\frac{X ˉ - μ}{S / n}$ 都是经典的枢轴量；
单调变换：如果 $Q$ 是枢轴量，则 $g (Q)$ （ $g$ 单调）也是枢轴量。³

构造步骤

选取合适的枢轴量 $Q (X, θ)$ ；
根据 $Q$ 的已知分布，确定常数 $a, b$ 使得：

P_{θ} (a \leq Q (X, θ) \leq b) = 1 - α

通过不等式变换，得到 $θ$ 的置信区间。

示例：正态总体均值的置信区间

设 $X_{1}, \dots, X_{n} \sim N (μ, σ^{2})$ ， $σ^{2}$ 已知。

选取枢轴量：

Q = \frac{X ˉ - μ}{σ / n} \sim N (0, 1)

确定常数：设 $z_{α /2}$ 为标准正态分布的上 $α /2$ 分位数，则：

P (- z_{α /2} \leq \frac{X ˉ - μ}{σ / n} \leq z_{α /2}) = 1 - α

变换不等式：

P (\overset{ˉ}{X} - z_{α /2} \frac{σ}{n} \leq μ \leq \overset{ˉ}{X} + z_{α /2} \frac{σ}{n}) = 1 - α

置信区间：

(\overset{ˉ}{X} - z_{α /2} \frac{σ}{n}, \overset{ˉ}{X} + z_{α /2} \frac{σ}{n})

寻找枢轴量的技巧

从点估计出发：许多枢轴量是“点估计减去参数”再除以某个标准量。
利用抽样分布：三大抽样分布（ $χ^{2}$ 、 $t$ 、 $F$ ）是构造枢轴量的基础。
对称变换：对于对称分布（如正态、 $t$ ），可以利用对称性构造双侧置信区间。
单调变换：如果 $Q$ 是枢轴量，则 $g (Q)$ 也是枢轴量（ $g$ 单调）。

常见置信区间汇总

正态总体均值的置信区间

情形	置信区间
$σ^{2}$ 已知	$\overset{ˉ}{X} \pm z_{α /2} \frac{σ}{n}$
$σ^{2}$ 未知（大样本）	$\overset{ˉ}{X} \pm z_{α /2} \frac{S}{n}$
$σ^{2}$ 未知（小样本）	$\overset{ˉ}{X} \pm t_{α /2} (n - 1) \frac{S}{n}$

其中 $S$ 为样本标准差， $t_{α /2} (n - 1)$ 为自由度 $n - 1$ 的 $t$ 分布上 $α /2$ 分位数。

正态总体方差的置信区间

设 $X_{1}, \dots, X_{n} \sim N (μ, σ^{2})$ ，枢轴量：

\frac{( n - 1 ) S ^{2}}{σ ^{2}} \sim χ^{2} (n - 1)

置信区间：

(\frac{( n - 1 ) S ^{2}}{χ _{α /2}^{2} ( n - 1 )}, \frac{( n - 1 ) S ^{2}}{χ _{1 - α /2}^{2} ( n - 1 )})

两个正态总体均值差的置信区间

设 $X_{1}, \dots, X_{n_{1}} \sim N (μ_{1}, σ_{1}^{2})$ ， $Y_{1}, \dots, Y_{n_{2}} \sim N (μ_{2}, σ_{2}^{2})$ ， $σ_{1}^{2} = σ_{2}^{2} = σ^{2}$ 已知／未知。

$σ^{2}$ 已知：

(\overset{ˉ}{X} - \overset{ˉ}{Y}) \pm z_{α /2} \frac{σ _{1}^{2}}{n _{1}} + \frac{σ _{2}^{2}}{n _{2}}

$σ^{2}$ 未知：

(\overset{ˉ}{X} - \overset{ˉ}{Y}) \pm t_{α /2} (n_{1} + n_{2} - 2) S_{p} \frac{1}{n _{1}} + \frac{1}{n _{2}}

其中 $S_{p}^{2} = \frac{( n _{1} - 1 ) S _{1}^{2} + ( n _{2} - 1 ) S _{2}^{2}}{n _{1} + n _{2} - 2}$ 为合并方差。

比率 $p$ 的置信区间（大样本）

设 $\overset{p}{^}$ 为二项比例的估计（大样本 $n \overset{p}{^} \geq 5, n (1 - \overset{p}{^}) \geq 5$ ）：

\overset{p}{^} \pm z_{α /2} \frac{p ^ ( 1 - p ^ )}{n}

单侧与双侧置信区间

双侧置信区间

两端都有界的置信区间，如上面的 $(\overset{ˉ}{X} \pm z_{α /2} \frac{σ}{n})$ 。

单侧置信区间

只有一侧有界的置信区间：

下限置信区间： $(\overset{ˉ}{X} - z_{α} \frac{σ}{n}, + \infty)$
上限置信区间： $(- \infty, \overset{ˉ}{X} + z_{α} \frac{σ}{n})$

选取原则

当关心参数是否在某个范围内时，使用双侧置信区间；
当只关心参数是否小于（或大于）某个值时，使用单侧置信区间。

应用

置信区间与假设检验的关系

置信区间与假设检验存在对偶关系：⁴

参数 $θ$ 的置信水平 $1 - α$ 的置信区间，等价于检验水平 $α$ 下所有不被拒绝的 $θ_{0}$ 构成的集合；
双侧检验与双侧置信区间对应；
单侧置信区间与单侧检验对应。

Metaphor

探索

区间估计

区间估计

定义：置信区间的概念

置信水平

置信区间的解释

构造思路

枢轴量法

枢轴量的定义

构造步骤

示例：正态总体均值的置信区间

寻找枢轴量的技巧

常见置信区间汇总

正态总体均值的置信区间

正态总体方差的置信区间

两个正态总体均值差的置信区间

比率 $p$ 的置信区间（大样本）

单侧与双侧置信区间

双侧置信区间

单侧置信区间

选取原则

应用

置信区间与假设检验的关系

相关章节

关系图谱

目录

反向链接

Metaphor

探索

区间估计

区间估计

定义：置信区间的概念

置信水平

置信区间的解释

构造思路

枢轴量法

枢轴量的定义

构造步骤

示例：正态总体均值的置信区间

寻找枢轴量的技巧

常见置信区间汇总

正态总体均值的置信区间

正态总体方差的置信区间

两个正态总体均值差的置信区间

比率 p 的置信区间（大样本）

单侧与双侧置信区间

双侧置信区间

单侧置信区间

选取原则

应用

置信区间与假设检验的关系

相关章节

Footnotes

关系图谱

目录

反向链接

比率 $p$ 的置信区间（大样本）