无偏,一致,MLE
♨️

无偏,一致,MLE

 

🧩 一、定义

1️⃣ 无偏(Unbiasedness)

一个估计量 () 对参数 () 是无偏的,如果:
也就是说,在重复抽样的平均意义上,估计值等于真值。
如果 (),则称其为有偏(biased),偏差为:
👉 关键词:期望等于真值(平均不偏)

2️⃣ 一致(Consistency)

一个估计量 () 随样本量 () 被称为对 () 一致的,如果:
即:
意思是:
当样本越来越多时,估计量越来越接近真值。
👉 关键词:大样本下趋近真值(概率上接近)

📊 二、直观对比

性质
无偏 (Unbiased)
一致 (Consistent)
数学定义
()
()
关注点
期望(平均水平)
收敛(样本量增大)
样本量
有限样本
()
能否保证估计准确
不一定(可能方差大)
能(概率趋近真值)
核心关键词
“平均正确”
“越来越准”

📘 三、二者关系

  • 无偏 ≠ 一致
    • 有可能平均正确,但方差太大,导致随着样本增多并不集中到真值。
      例如:
      则 ()(无偏),
      但 () 随 () 不会集中到 1(不一致)。

  • 一致 ≠ 无偏
    • 很多估计量有限样本有偏,但随着样本量增大偏差消失。
      例如:指数分布的 (): 但当 (), 渐近无偏 → 一致

🧠 四、直觉理解

类比
无偏
一致
射击比喻
枪打得很散,但平均在靶心上
枪越打越准,集中在靶心
图像
🎯
平均位置对但分布宽 → 无偏不一致
🎯
分布逐渐集中在靶心 → 一致(即使最初有偏)

🧮 五、常见例子

分布
参数
估计量
无偏性
一致性
()
()
()
✅ 无偏
✅ 一致
()
()
()
❌ 有偏
✅ 一致
指数分布
()
()
❌ 有偏
✅ 一致
伯努利分布
(p)
样本均值
✅ 无偏
✅ 一致

🧾 六、两者的形式化联系

若估计量满足以下两个条件:
则:
即:无偏 + 方差趋零 ⇒ 一致。
这其实就是一致性的一个充分条件。

✅ 七、小结记忆法

无偏:平均上对(不系统性偏离真值)一致:样本多了对(越来越接近真值)MLE:有限样本有偏,但大样本一致、渐近无偏。

是否希望我帮你画一张“无偏 vs 一致”对比的图(带靶心和箭点示意,类似统计教材里的射击图)?这在面试或课堂展示时特别直观。
 
 

一、指数分布例子:为什么MLE有偏?

设随机样本 ( ),其概率密度函数为

1️⃣ 写出似然函数

取对数:

2️⃣ 对 (\lambda) 求导并令其为零

 

3️⃣ 计算其期望

已知 () 的分布:若 ( ),则
因此 ()。
于是:
若 ( ),
所以:

✅ 结论:
即 MLE 高估了 真正的 (),存在正偏差
随着样本量 (),偏差 (),MLE 渐近无偏。

二、为什么MLE一般会有偏?

MLE 是通过最大化似然函数(或对数似然)得到的,它保证的是:
  • 一致性(Consistency):( )
  • 渐近正态性(Asymptotic normality)
  • 渐近有效性(Asymptotic efficiency)
不保证有限样本下无偏。原因是:
  1. 非线性变换引入偏差
      • MLE 常是某个充分统计量的非线性函数,比如 ( ),
        • 而 ()。
  1. Jensen不等式
      • 由于凸性或凹性,()。
        • 比如 ( ) 是凸的 ⇒ ( )。
  1. 有限样本的分布不对称
      • MLE 通常是对对数似然求导的结果,而有限样本下对称性破坏,导致偏差。

三、一般如何判断 MLE 是否有偏?

理论上:
  1. 若可以求出 MLE 的期望 (),直接比较是否等于真值;
  1. 若不能显式求解,可以用 Taylor 展开(Bias Approximation)
    1. 其中 () 可由信息矩阵的导数形式给出(Cox–Snell偏差近似公式):
      这里 () 与 log-likelihood 的三阶导数有关。
经验上:
  • 模拟(Monte Carlo)检验:生成大量样本,用MLE估计,取平均值,看是否偏离真值;
  • 若模型中估计量是非线性的充分统计量函数,几乎总是存在偏差;
  • 若估计量是线性的充分统计量函数(如正态分布中 () 的MLE = 样本均值),则无偏。