漫谈贝叶斯定理

 

贝叶斯定理告诉我们如何对待已有的知识和利用新的证据调整自己的思考。但更重要的是,仔细检视证据的其他可能解释,否则,我们仍然会沦为偏见、迷信、非理性的囚徒。...



让我们先从一个例子谈起:

参加体检的40岁女性患乳腺癌的概率是1%。如果一个女性患有乳腺癌,那检查结果为阳性的概率为80%;如果她没有乳腺癌,那么检查结果为阳性的概率为9.6%。

在一次检查中,一位40岁的女性检查出了乳腺癌,那她实际患有乳腺癌的概率是多少呢?

严肃点,我们在讨论贝叶斯定理

简单来讲,贝叶斯定理告诉我们在证据面前如何合理地估计特定事件真实发生的概率。



故事从头说起。

我们用P(A)代表事件A发生的概率,P(A&B)代表事件A和B同时发生的概率,P(B|A)代表A发生的条件下B发生的概率,也被叫做条件概率。

那么,A和B同时发生的概率是A发生的概率乘以A发生的条件下B发生的概率:

P(A&B)=P(A)•P(B|A)

同理可得:

P(A&B)=P(B)•P(A|B)

上面两个公式是对同一概率的两种表达方式,所以:

P(B)•P(A|B=)P(A)•P(B|A)

两边除以P(B):

P(A|B)=P(A)•P(B|A)/P(B)

在B发生的条件下A发生的概率等于事件A发生的总体概率乘以在A发生的条件下B发生的概率再除以B发生的总体概率。也即,用A和B同时发生的概率除以B单独发生的概率。

A是我们的假设(hypothesis),如患乳腺癌,记为H;B是证据(Evidence),如检测为阳性,记为E。因此,上式也被写成:

P(H|E)=P(H)•P(E|H)/P(E)

在许多实际问题中,P(E)通常是不知道的。因此,我们利用已知的信息来计算它:

P(E)=P(E&H)+P(E&-H)=P(H)•P(E|H)+P(-H)•P(E|-H)

因此,P(H|E)=P(H)•P(E|H)/[P(H)•P(E|H)+P(-H)•P(E|-H)]

回到上面的例子,P(H|E)=1%✖️80%/(1%✖️80%+99%✖️9.6%)=0.8%/(0.8%+9.5%)=7.8%

患乳腺癌的概率是检查结果为阳性时真的患乳腺癌的概率(true positive)和所有阳性结果的概率,后者包括了真阳性(ture positive)和假阳性(false positive),假阳性是指你没有患乳腺癌,但却检查出了阳性结果。

简言之,贝叶斯定理就是提醒我们要当心假阳性(false positive)。

我们似乎都是糟糕的贝叶斯推理者

文章开头的例子来自 Eddy(1982)的一项心理学研究。在他的研究中,100个医生中95%的医生猜测女性患乳腺癌的概率在75%左右。

这与上面得到的7.8%简直是天壤之别。

为什么会这样?

一种解释是,人们在日常推理中会忽略先验概率(Kahneman and Tversky, 1972, 1973):

P(H|E)=80%/(80%+9.6%)=89%

与75%接近但仍然高了10个百分点以上。

另一种解释是,人们估计的东西和要求他们估计的东西根本就不是一个东西;人们会混淆P(H|E)和P(E|H)(Koehler, 1996)。

也就是说,我们需要估计的是检查结果为阳性时真实患病的概率,但实际估计的却是真实患病下检查结果为阳性的概率。后者的概率为80%,与75%更为接近。

其实,人类并不擅长用概率来判断事物。在人类进化过程中,概率计算是晚近发展出来的能力;人类更擅长用自然频次来计算事物。



如果用自然频次来重新表达上面的问题,回答起来就容易多了:

40多岁的女性1000个人中有10个会患乳腺癌。在这10个人中,8个会得到阳性的结果;在剩下的990个人中,95个人会得到阳性结果。问题:1个40岁女性得到了阳性结果,她患乳腺癌的概率是多少?

简单程度简直令人发指:

P(H|E)=8/(8+95)=7.8%



在得到阳性结果时患癌症的概率其实就是人群中患癌症的人检查出阳性结果的次数除以所有人检查出阳性结果的次数。

P(H|E)=f(H&E)/f(E)

在现实生活中,先验概率并不是给定的,而是因人而异的主观概率(这可能会受到认知可得性、动机和情感等因素的影响)。例如,对于特定的40岁女人来说(而不是一个抽象的没有任何具体特征的40岁女性),她对患乳腺癌的先验概率的判断取决于她对自身特征的认识。如果她具有一些会提高女性患乳腺癌几率的特征,她使用的先验概率就不会是1%,可能是10%,甚至是90%。

前面讲到,我们会混淆P(H|E)和P(E|H),导致我们实际估计的和需要估计的不是一个东西。更有可能的是,我们用P(H&E)代替了P(H|E)。条件概率实在是一个反人类、反直觉的东西。而这样推算就简单多了:

如果我患乳腺癌的概率是90%,检查的正确率是80%,那么我真正患乳腺癌的概率就是72%。

这一概率和研究结果70%到80%的概率就基本一致了。

当看到阳性的检查结果时,我们会先验地认为自己患癌症的可能性是很高的,然后再考虑到检查本身可能出错的因素,最后得到我们对结果可信度的判断。

我们完全忽略了假阳性的问题!

贝叶斯推理者的自我修养

既然我们不能很好地用概率或曰百分比来理解贝叶斯,那就让我们用比例来重述贝叶斯定理。

百分比是部分比整体,比例则是两个事件的相对频次。如果心理学专业的女生数量是男生人数的6倍,那么比例就是6:1,百分比呢?显然,比例相比百分比更易于计算。其次,贝叶斯公式中混杂中各种概率,你无法利用它很好地进行推理判断。人们并不是很好的贝叶斯推理者。

用比例来重塑贝叶斯定理:

原始比例*证据调整=新比例

回到最初的例子。40岁女性患乳腺癌的比例是1:99,出现新的证据,即得到阳性结果(得到阳性结果的女性患乳腺癌的可能性大8倍,即80:9.6),于是更新我们的猜测,患乳腺癌的新比例是80:950.4。患乳腺癌的可能性是增加了,但不患比患的可能性仍然大将近12倍。

用比例来代替百分比推理只是成为更好的贝叶斯推理着的表面工夫,要成为更好的贝叶斯推理者,是要当心对贝叶斯定理的过分迷恋。

贝叶斯定理不能自动帮我们做出正确决策,避免偏见、迷信、伪科学的影响。

首先,如前面所说的,现实生活中,先验概率是多少常常是未知的或模糊的,会受到主观因素的影响,尤其是那些我们无法直接观察的事物。例如,外星人、多重宇宙、上帝存在的先验概率是多少呢?

其次,理论模型的可信度取决于只有这一理论模型能够解释数据的程度。也就是说,证据的其他可能解释越多,你的理论模型就越不可信。

其他可能解释包括:(1)数据可能是错误的,比如测量工具误差、错误的分析、证实偏见甚至是造假;(2)其他理论也可以解释你的数据。

如果你没有为你的证据仔细寻找其他可能的解释,证据只可能强化你已有的偏见。

神通广大的贝叶斯定理

贝叶斯定理广泛地应用于各种领域。从物理学到哲学,从心理学到人工智能,处处可见贝叶斯定理的踪迹。

Google自动驾驶汽车的设计者就采用贝叶斯原理来帮助汽车识别规律、做出决定。



贝叶斯定理也用来帮助我们过滤电子邮件中的垃圾邮件。

首先,收集一堆正常邮件和垃圾邮件,计算每封邮件中每个词出现的频次:



假设即将到来的邮件有9:1的机会是垃圾邮件,打开邮件看到“你好,亲爱的”:

  • 垃圾邮件与正常邮件的比例是9:1
  • 看到“你好”仍然是9:1(因为你好在正常邮件和垃圾邮件中出现的概率是相等的)
  • 看到“亲爱的”是9:5(亲爱的出现在正常邮件中的可能性是垃圾邮件的5倍)
  • 最后的比例是9:5,比原始比例更不可能是垃圾邮件,让它通过


现在我们又收到一封新邮件,我们看到“购买伟哥”:

  • 原始比例是9:1
  • 看到“购买”调整为27:2
  • 看到“伟哥”调整为?
就目前的证据而言,伟哥从来没有出现在正常邮件中,它就一定是垃圾邮件吗?很可能不是这样,让我们假设一封正常邮件中就有这个词,这时有“伟哥”这个词的邮件的比例就变成3:1。最后的比例是81:2。这个比例是让人不爽的。我们可以直接将其设为垃圾邮件,或者收集更多的证据。

随着过滤器得到更多的训练,它会更新某些词语是垃圾邮件的概率,从而做出更精准的判断。

结语

贝叶斯定理告诉我们在证据面前如何合理地估计特定事件真实发生的概率。我们对已有的知识和信念应该保持谨慎而谦逊的态度,它不是百分之百确定的。在新证据面前,我们不必完全丢弃已有的知识,但要根据新的信息来调整自己的思考。

我们可能会沦为糟糕的贝叶斯推理者,受非理性因素的影响而高估事件发生的先验概率,忽略假阳性的影响等等。用比例而不是百分比来思考贝叶斯问题或许可以帮助我们。但更重要的是,仔细地检视证据的其他可能解释,否则,我们仍然会沦为偏见、迷信、非理性的囚徒。

参考资料:

  1. CRUCIAL CONSIDERATIONS|Bayes’ Theorem(这篇文章谈到了贝叶斯定理的数学公式及贝叶斯定理对科学研究范式的启示)
  2. Frontiers|The psychology of Bayesian reasoning(贝叶斯推理的心理学)
  3. Scientific Americans|Bayes's Theorem: What's the Big Deal(这篇文章批评了对贝叶斯定理过于迷恋和推崇的风潮)
  4. Better Explained|Understanding Bayes Theorem With Ratios(利用比例来理解贝叶斯)
  5. 所有图片来自网络,表格根据正文内容制作


    关注 精神的冒险


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册