点估计
定义
点估计 是指用样本数据构造一个统计量 ,作为未知参数 的一个具体数值估计。
它回答的是“参数大概取多少”这个问题:在样本有限、总体参数未知时,我们希望用一个可计算的统计量尽可能逼近真实参数。
估计量与估计值
- 估计量(Estimator):,是统计量。
- 估计值(Estimate):将样本观测值代入估计量后得到的具体数值。
为什么需要多个评判标准? 想象你要估计一座山的海拔高度。不同的人用不同的方法测量可能得到不同的结果:有人用 GPS(可能非常精确但可能有系统偏差),有人用气压计(受天气影响),有人看地图等。我们需要多个标准来判断哪个估计”更好”——这正是估计量评判标准存在的意义。
无偏性关注的是”多次测量结果的平均值是否等于真实值”;
有效性关注的是”测量的波动大小”;
一致性关注的是”样本量增大时估计是否越来越准”;
MSE 则综合考虑偏差和方差的影响。
矩估计法
原理
矩估计法(Method of Moments, MOM) 的思想是用样本矩估计相应的总体矩。
设总体有 个未知参数 。总体矩是参数的函数:
样本矩:
令总体矩等于样本矩,解方程组得到参数估计:
示例:正态分布
设 ,有两个未知参数 。
总体矩:
样本矩:
方程组:
解得:
注意: 使用除以 (而非 )的样本方差。
极大似然估计
似然函数
似然函数(Likelihood Function) 是给定参数 时,观测到当前样本的概率(密度):
极大似然估计的定义
极大似然估计(Maximum Likelihood Estimation, MLE) 满足:
或等价地,最大化对数似然函数:
MLE 的直观理解:可以把似然函数想象成一幅”参数-可能性”的地形图。给定观测数据后,不同的参数值对应着不同的”可能性高度”。MLE 的目标就是找到这座山的”峰顶”——即使观测数据出现概率最大的参数值。
举例来说,如果抛掷 10 次硬币出现 7 次正面,MLE 估计的 正是因为这个值使得”观测到 7 次正面”这件事最容易发生。1
MLE 的求解步骤
- 写出似然函数 。
- 取对数得到对数似然函数 。
- 求导并令导数为零:。
- 解方程得到 。
- 验证二阶导数小于零(确保是极大值)。
示例:正态分布
设 ,参数均未知。
似然函数:
对数似然函数:
对 求偏导并令为零:
对 求偏导并令为零:
评判标准
之所以需要多个标准,是因为估计量之间通常存在权衡:
- 无偏性只保证长期平均不偏离真值,但不一定方差小;
- 有效性关注方差大小,但通常是在无偏估计量之间比较;
- 一致性强调大样本下是否趋近真值,却不保证小样本时足够稳定;
- MSE把偏差和方差统一起来,更适合综合比较。
因此,一个估计量往往不可能在所有维度上都“最优”,实际应用中需要根据样本规模、可接受偏差、计算复杂度和推断目的综合选择。
无偏性
无偏估计量:
渐近无偏:
有偏估计量:偏差
例子: 是有偏的(偏差为 ),而 是无偏的。
有效性(CRLB 下界)
克拉美-罗不等式(Cramér-Rao Lower Bound, CRLB) 给出了无偏估计量方差的理论下界。
若 是 的无偏估计量,且满足正则条件,则:
其中 为费希尔信息量。
若无偏估计量达到 CRLB,则称其为有效估计量(Efficient Estimator)。
一致性(相合性)
一致估计量(Consistent Estimator):当样本容量 时,
即估计量依概率收敛于真实参数。
均方误差
MSE 统一衡量了估计量的方差和偏差。
应用
常用估计量总结
| 总体分布 | 未知参数 | MLE | 是否无偏 |
|---|---|---|---|
| 是 | |||
| 否(除 才无偏) | |||
| 是 | |||
| 有偏(乘 才无偏) | |||
| 是 |
相关章节
Footnotes
-
关于最大似然估计的详细介绍,可参考 Maximum Likelihood Estimation - A Comprehensive Guide。 ↩