Jupyter AI

17 贝叶斯更新与先验、后验

📅 发表日期: 2024年8月10日

分类: 📊AI 概率必备

👁️阅读: --

在上篇中,我们探讨了贝叶斯定理的基本理解,它为我们提供了在获得新证据后如何调整我们对某一事件概率的看法的框架。本篇将进一步深入到贝叶斯更新的概念,以及如何利用先验概率后验概率进行推理。最后,我们将通过具体的案例来阐述这些概念的实际应用。

1. 贝叶斯更新与基本概念

贝叶斯更新是指当我们获得新数据时,基于已有的先验概率对我们的信念进行调整,形成后验概率的过程。这个过程关键在于如何将新信息整合到我们已有的知识中。

  • 先验概率(Prior Probability):在获得新数据之前,对于某一事件的初始信念。
  • 后验概率(Posterior Probability):在获取新数据后,对该事件新的信念。

贝叶斯公式

贝叶斯更新的核心是贝叶斯定理,可以用公式表示为:

P(HE)=P(EH)P(H)P(E)P(H|E) = \frac{P(E|H) \cdot P(H)}{P(E)}

这里,

  • P(HE)P(H|E) 是后验概率,表示在证据 EE 已知的情况下,假设 HH 为真的概率。
  • P(EH)P(E|H) 是似然概率,表示在假设 HH 为真的情况下,证据 EE 发生的概率。
  • P(H)P(H) 是先验概率,表明在证据 EE 之前,我们对假设 HH 真实的信念。
  • P(E)P(E) 是边际似然,所有可能情况下证据 EE 发生的总概率。

2. 案例分析:新冠病毒检测

让我们通过一个具体的案例来理解贝叶斯更新。考虑一个新冠病毒的检测程序。

假设

  • 疾病的先验概率(即某个人在没有进行测试时感染新冠的机率)为 P(H)=0.01P(H) = 0.01(假设在某个地区感染率为 1%)。
  • 测试的准确性
    • 如果一个人确实感染新冠,测试结果为阳性的概率(真正率)P(EH)=0.9P(E|H) = 0.9
    • 如果一个人未感染,测试结果仍然是阳性的概率(假阳性率)P(E¬H)=0.05P(E|\neg H) = 0.05

计算后验概率

我们想计算一个人测试结果为阳性后,他实际上感染新冠的后验概率 P(HE)P(H|E)

  1. 计算 P(E)P(E)(即一个人测试结果为阳性的所有可能性):

    P(E)=P(EH)P(H)+P(E¬H)P(¬H)P(E) = P(E|H) \cdot P(H) + P(E|\neg H) \cdot P(\neg H)

    其中,P(¬H)=1P(H)=0.99P(\neg H) = 1 - P(H) = 0.99。 将这些数值代入:

    P(E)=0.90.01+0.050.99=0.009+0.0495=0.0585P(E) = 0.9 \cdot 0.01 + 0.05 \cdot 0.99 = 0.009 + 0.0495 = 0.0585
  2. 计算后验概率:

    P(HE)=P(EH)P(H)P(E)=0.90.010.05850.1538P(H|E) = \frac{P(E|H) \cdot P(H)}{P(E)} = \frac{0.9 \cdot 0.01}{0.0585} \approx 0.1538

因此,尽管测试结果为阳性,该患者实际上感染新冠的概率只有约 15.38%。这表明,仅依赖测试结果并不能完全确定感染状态,尤其在先验概率较低的情况下。

3. 总结

通过贝叶斯更新的步骤,我们看到如何从先验概率开始,在新证据(测试结果)出现后,使用贝叶斯定理更新我们的信念,得出后验概率。在实际应用中,理解先验与后验的关系,对于作出合理的推断至关重要。

下一篇将围绕实际应用案例分析,探索如何利用贝叶斯理论进行实用的数据分析。敬请期待!