news 2026/4/22 18:00:50

如何像贝叶斯一样应对周末测验

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
如何像贝叶斯一样应对周末测验

原文:towardsdatascience.com/how-to-tackle-the-weekend-quiz-like-a-bayesian-b5e035ba3746?source=collection_archive---------5-----------------------#2024-10-28

你知道哪一个是 malmsey 吗?你能做出一个好的猜测吗?

https://medium.com/@juntaah?source=post_page---byline--b5e035ba3746--------------------------------https://towardsdatascience.com/?source=post_page---byline--b5e035ba3746-------------------------------- Junta Sekimori

·发表于《Towards Data Science》 ·9 分钟阅读·2024 年 10 月 28 日

几周前,这个问题出现在《悉尼晨锋报周末测验》中:

malmsey 是什么:轻微宿醉、女巫的诅咒,还是加烈酒?

假设我们对答案毫无头绪,在这种情况下有什么办法可以做出明智的猜测吗?我认为是有的。

在继续阅读之前,欢迎您先思考一下。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/fbcdaf14ae352f0d6620a2ca5e4b6610.png

一位因饮用加烈酒而稍感宿醉的女巫,使用 Gemini Imagen 3 创建

我们真的没有任何可以带到这个问题中的线索吗?

看着这个词,感觉它可能代表这些选项中的任何一个。当然,这个多项选择题的设计就是为了让人产生这种感觉。

但我们可以采取一种理性的方法,那就是认识到这些选项有不同的基准概率。也就是说,暂时不讨论什么是和不是 malmsey,我们可以感觉到,宿醉的名称可能没有女巫的诅咒那么多,而且对于各种加烈酒的名称肯定更多。

为了进一步量化这个问题:

因此,在没有其他线索来指引正确答案的情况下,加烈酒将是一个经过充分推理的猜测。根据我上面的估算,加烈酒的正确概率是轻微宿醉的 100 倍,是女巫诅咒的 10 倍。

即使我对这些数量有误差,我至少对这些基准概率的顺序有信心,因此我会将加烈酒作为我的最佳猜测。

宾果!

基准率忽视

这个推理看似简单,但在做类似判断时忽视基准率是 Kahneman、Tversky 以及许多其他人提到的重大认知偏误之一。一旦我们察觉到这一点,便能到处都看到它。

考虑一下 Rolf Dobelli 在The Art of Thinking Clearly中提到的以下智力游戏:

Mark 是一个来自德国、戴眼镜的瘦男人,喜欢听莫扎特的音乐。哪个更可能?Mark 是 A) 一名卡车司机,还是 B) 法兰克福的一名文学教授?

诱惑是根据我们与描述相联系的刻板印象选择 B,但更合理的猜测应该是 A,因为德国有比法兰克福的文学教授更多的卡车司机。

这个难题是对 Kahneman 和 Tversky 的图书管理员-农民人物描绘的改编(参见Judgment under Uncertainty)*,它也为伟大的 3B1B 对贝叶斯定理的解释 提供了框架,在这个视频中,这种思维过程与贝叶斯公式的条件概率和边际概率(基准概率)对应。

识别思维陷阱

贝叶斯框架帮助我们更清楚地看到概率推理中的两个常见陷阱。用 Kahneman 和 Tversky 的语言来说,我们可以说它为系统二(“慢速”)思维提供了一种工具,以克服我们冲动且易犯错误的系统一(“快速”)思维。

第一个洞察是,条件概率 p(A|B) 并不等同于其反向概率 p(B|A),尽管在日常生活中,我们常常会误以为它们是相同的。

在 Dobelli 的例子中,这就是以下的区别:

如果相信刻板印象,P(👓|🧑‍🏫) 看起来相当可能,而 p(🧑‍🏫|👓) 不太可能,因为我们会预期在德国有许多人符合相同的描述,但并不是文学教授。

第二个启示是,这两个条件概率是相关的,因此知道一个可以引导我们得到另一个。我们需要做的是连接这两个条件的 A 和 B 的个体基准率,比例因子实际上是这两个基准率的简单比率,如下所示:

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/9082f781092ee335e83b383083f774c3.png

图片由作者创建

这是贝叶斯公式。

贝叶斯推理——逐步进行

那么这如何帮助我们呢?

除了教科书和示例中的问题,我们通常不会期望有所有数字可以直接代入贝叶斯公式,但它依然提供了一个有用的框架,用于组织我们的已知和未知并形式化一个有根据的猜测。

例如,在 Dobelli 情境中,我们可能从以下估算值开始:

所有这些参数都是基于我个人世界观的估算。只有德国人口是我可以查到的一个数据点,但这些估算有助于我理性地推理关于 Dobelli 问题。

下一步是将这些框架化为列联表,展示每个事件发生的相对频率,无论是同时发生还是单独发生。通过从总人口开始并应用我们的百分比估算,我们可以开始填写法兰克福教授和卡车司机的两张表格,每个符合描述(对于这一部分,您也可以跟随这个电子表格):

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/7c6b253e9780c1a3d8284c785ac24afb.png

图片和资源由作者创建——请见这里查看原始文档

四个白色框代表两种事件可能发生的四种方式:

灰色阴影部分代表每个事件的总频率,不考虑重叠部分,这只是行和列的总和。基准率来源于这些边际频率,这也是为什么它们通常被称为边际概率

接下来,我们可以像填数独一样填写空白,通过确保所有行和列的总和一致:

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/8166d201a8dd7d720dc62a672ec74e45.png

图片和资源由作者创建——请见这里查看原始文档

现在,在我们的列联表完成后,我们有了关于基准率的估计以及个人资料与描述相匹配的可能性。贝叶斯公式中的所有条件概率和边际概率现在都可以在这里表示,并可以按以下方式计算:

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/9963f810b06d9a51b6ae50292ad1beb8.png

作者创作的图像和资源 - 请见这里以查看原始文档

回到最初的问题,我们感兴趣的概率是上面列表中的第三个:给定描述,他们是教授/卡车司机的概率。

并且,基于我们的参数估计,我们看到卡车司机比教授更有可能符合要求,概率是 4 倍(0.001 / 0.00025)。与此相对的是反向条件概率,即描述更可能符合教授,而不是卡车司机,比例为 125 倍(0.25 / 0.002)!

回到马姆赛(Malmsey)

现在,回到我们从马姆赛(malmsey)例子开始的地方,希望直觉已经逐渐形成,并且基准率在做出猜测时的作用已经清晰。

在将思维与贝叶斯公式对照时,本质上,思维过程将是比较我们对以下三种情况的信念程度:

因为在这种情况下我们完全不清楚“马姆赛”可能对应什么(如果我们有一些词源学上的怀疑,情况就会不同),我们可以说 B 是无信息的,因此要做出任何合理的猜测,我们只能依赖 A 的概率。在贝叶斯公式中,我们可以看到我们感兴趣的概率是随着 A 的基准率而变化的:

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/4fd36e1a4f8032faa5eb1c3452bb2f0d.png

作者创作的图像

为了完整性,这里是我们如何像 Dobelli 例子中的列联表那样,列出我们的信念程度。因为 B 没有提供有效信息,我们给出了 50:50 的几率,表示“马姆赛”这个词可以与任何其他词或概念匹配。虽然这有些过度,且一旦我们认识到可以简单地将我们的信念与基准率相结合,这种做法并非必要,但它展示了贝叶斯框架在这种更抽象问题中的适用性。

基准率忽视在假设(A/B)检验中的应用

我之前写过关于检察官谬误的话题(一种基准率忽视的形式),其中给出了更多基准率忽视的例子以及对分析实践者的启示。

在这里再次强调,在传统的 A/B 测试方法中,人们常常将看到测试结果的概率与假设本身为真的概率混淆。关于 p 值及其陷阱已经有很多相关文献(例如,《肮脏的十二个:十二个关于 p 值的误解》),但这是另一个地方,贝叶斯思维方式有助于澄清我们的推理,同时也提醒我们注意基准率忽视的概念,在这种情况下,基准率忽视指的是我们一开始对假设为真的信心(我们的先验)。

我鼓励你阅读这篇文章,以更好地理解这一概念。

关键点

深入阅读

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 23:50:46

超越`fit`与`predict`:深度解构Scikit-learn的API设计哲学与高级实践

好的,收到您的需求。结合“Scikit-learn模型API”这一选题、1766973600072的随机种子,以及您对深度、新颖性和结构的要求,我将为您撰写一篇深入探讨Scikit-learn API设计哲学、高级应用模式与定制化扩展的技术文章。 超越fit与predict&#x…

作者头像 李华
网站建设 2026/4/16 10:12:56

快速理解IAR在工业控制系统中的安装流程

从零搭建工业级嵌入式开发环境:IAR安装实战全解析 你有没有遇到过这样的情况?刚接手一个基于STM32的PLC项目,兴冲冲地打开电脑准备写代码,结果发现编译器报错“Target not supported”,调试器连不上,甚至连…

作者头像 李华
网站建设 2026/4/20 19:35:21

5分钟快速上手VGGSfM:从零开始实现三维场景重建

5分钟快速上手VGGSfM:从零开始实现三维场景重建 【免费下载链接】vggsfm [CVPR 2024 Highlight] VGGSfM Visual Geometry Grounded Deep Structure From Motion 项目地址: https://gitcode.com/gh_mirrors/vg/vggsfm VGGSfM(Visual Geometry Grou…

作者头像 李华
网站建设 2026/4/17 21:35:18

微博数据采集终极指南:WeiboSpider完整实战教程

微博数据采集终极指南:WeiboSpider完整实战教程 【免费下载链接】weibospider 项目地址: https://gitcode.com/gh_mirrors/weib/WeiboSpider 想要获取实时微博数据进行分析?WeiboSpider是一个功能强大的Python微博数据采集工具,能够帮…

作者头像 李华
网站建设 2026/4/19 15:16:17

Instagram私有API终极指南:从零开始构建自动化社交工具

Instagram私有API终极指南:从零开始构建自动化社交工具 【免费下载链接】instagram-private-api NodeJS Instagram private API SDK. Written in TypeScript. 项目地址: https://gitcode.com/gh_mirrors/in/instagram-private-api 你是否曾想过,为…

作者头像 李华