点估计

定义

点估计 是指用样本数据构造一个统计量 ,作为未知参数 的一个具体数值估计。

它回答的是“参数大概取多少”这个问题:在样本有限、总体参数未知时,我们希望用一个可计算的统计量尽可能逼近真实参数。

估计量与估计值

  • 估计量(Estimator),是统计量。
  • 估计值(Estimate):将样本观测值代入估计量后得到的具体数值。

点估计通常是后续区间估计假设检验的基础。

为什么需要多个评判标准? 想象你要估计一座山的海拔高度。不同的人用不同的方法测量可能得到不同的结果:有人用 GPS(可能非常精确但可能有系统偏差),有人用气压计(受天气影响),有人看地图等。我们需要多个标准来判断哪个估计”更好”——这正是估计量评判标准存在的意义。

无偏性关注的是”多次测量结果的平均值是否等于真实值”;
有效性关注的是”测量的波动大小”;
一致性关注的是”样本量增大时估计是否越来越准”;
MSE 则综合考虑偏差和方差的影响。

矩估计法

原理

矩估计法(Method of Moments, MOM) 的思想是用样本矩估计相应的总体矩。

设总体有 个未知参数 。总体矩是参数的函数:

样本矩:

令总体矩等于样本矩,解方程组得到参数估计:

示例:正态分布

,有两个未知参数

总体矩:

样本矩:

方程组:

解得:

注意: 使用除以 (而非 )的样本方差。

极大似然估计

似然函数

似然函数(Likelihood Function) 是给定参数 时,观测到当前样本的概率(密度):

极大似然估计的定义

极大似然估计(Maximum Likelihood Estimation, MLE) 满足:

或等价地,最大化对数似然函数:

MLE 的直观理解:可以把似然函数想象成一幅”参数-可能性”的地形图。给定观测数据后,不同的参数值对应着不同的”可能性高度”。MLE 的目标就是找到这座山的”峰顶”——即使观测数据出现概率最大的参数值。

举例来说,如果抛掷 10 次硬币出现 7 次正面,MLE 估计的 正是因为这个值使得”观测到 7 次正面”这件事最容易发生。1

MLE 的求解步骤

  1. 写出似然函数
  2. 取对数得到对数似然函数
  3. 求导并令导数为零:
  4. 解方程得到
  5. 验证二阶导数小于零(确保是极大值)。

示例:正态分布

,参数均未知。

似然函数:

对数似然函数:

求偏导并令为零:

求偏导并令为零:

评判标准

之所以需要多个标准,是因为估计量之间通常存在权衡:

  • 无偏性只保证长期平均不偏离真值,但不一定方差小;
  • 有效性关注方差大小,但通常是在无偏估计量之间比较;
  • 一致性强调大样本下是否趋近真值,却不保证小样本时足够稳定;
  • MSE把偏差和方差统一起来,更适合综合比较。

因此,一个估计量往往不可能在所有维度上都“最优”,实际应用中需要根据样本规模、可接受偏差、计算复杂度和推断目的综合选择。

无偏性

无偏估计量

渐近无偏

有偏估计量:偏差

例子: 是有偏的(偏差为 ),而 是无偏的。

有效性(CRLB 下界)

克拉美-罗不等式(Cramér-Rao Lower Bound, CRLB) 给出了无偏估计量方差的理论下界。

的无偏估计量,且满足正则条件,则:

其中 费希尔信息量

若无偏估计量达到 CRLB,则称其为有效估计量(Efficient Estimator)

一致性(相合性)

一致估计量(Consistent Estimator):当样本容量 时,

即估计量依概率收敛于真实参数。

均方误差

MSE 统一衡量了估计量的方差和偏差。

应用

常用估计量总结

总体分布未知参数MLE是否无偏
否(除 才无偏)
有偏(乘 才无偏)

相关章节

Footnotes

  1. 关于最大似然估计的详细介绍,可参考 Maximum Likelihood Estimation - A Comprehensive Guide