0


统计学:你是贝叶斯主义者还是频率主义者?

如果我告诉你我可以通过抛硬币来展示贝叶斯统计和频率统计的区别呢?

在左边,一切都与视角有关。在右边,这完全是关于不会移动的数量。但大多数情况下,在你看到视频之前,我需要一些东西来保护你的眼睛免受下面的剧透。

在视频中,有一个时刻我问你,“我手掌中的硬币是正面朝上的概率是多少?”硬币已经落地了,我看着它,但你们还看不到。你在那一刻给出的答案是一个强烈的暗示,表明你是倾向于贝叶斯思想还是频繁主义思想。

频繁主义:“这是不可能的。我可能不知道答案,但这不能改变硬币是正面朝上,概率是100%如果硬币是反面朝上,概率是0%

贝叶斯:“对我来说,概率是50%!对你来说,是什么都可以。”

只有坚持参数不是一个随机变量(频繁主义),才有理由谈论你的方法是否有能力提供正确的答案。一旦你让参数成为一个随机变量(贝叶斯),就不再有任何对与错的概念。这只是你个人的观点。

频繁主义:参数不是一个随机变量。

贝叶斯:参数是一个随机变量。

所以他们两个有巨大的区别。让我们仔细看看。

频率主义与贝叶斯论

哪些词告诉你你在和谁打交道?

有什么黑话告诉你你已经进入了他们的领地?

频率主义者:置信区间、p 值、功效、显着性

贝叶斯:可信区间,先验,后验

他们的目标是什么?

他们用什么统计数据来改变他们的想法?

频率主义者:要采取的行动(默认行动,请参阅此说明)

贝叶斯:你的意见(先前的信念)

主要区别是什么?

频率主义者:参数是一个固定数量(没有概率)

贝叶斯:参数是一个随机变量(没有正确答案)

对你有什么好处?

加入他们的思维方式,你有什么收获?

频率主义者:谈论你的方法的质量和“得到正确的答案”是有意义的

贝叶斯:直观的定义,例如 例如可信区间是你所希望的置信区间(虽然不是!)

你失去什么?

如果你选择他们,你会失去什么?

频率主义者:核心概念更难理解(例如,p 值和置信区间有违反直觉、冗长的定义),懒惰的思考者经常对它们进行散列。

贝叶斯:你无法谈论任何“正确答案”和“方法质量”的概念——没有统计显着性或拒绝零这样的东西。从你的角度来看,只有“更有可能”和“不太可能”。

如果没有固定的正确答案这样的事情,就没有做错的事情。

那么,哪个更好呢?

问错了!正确的选择取决于您希望如何进行决策。例如,如果您没有默认操作,请使用贝叶斯。如果没有默认操作,除非您有特殊的哲学原因在计算中调用 TRUTH 的概念,否则频率主义方法不如贝叶斯方法实用。

(注意:最后三个词很重要。我们不是在谈论一般的真理概念,而是在讨论如何在数学中处理它,为这些统计方法提供动力。阵营之间的区别归结为你是否对待 感兴趣的参数是否为固定常数。)

那么哪个更客观?

两者都不!它们都基于假设,因此它们基本上是主观的。

关键的区别在于,一旦确定了决策上下文,它们将如何协助决策。

等等,样本量呢?贝叶斯不是处理小数据的方法吗?

如果你一直在和“如果有很多数据,那就是频繁主义者,如果没有数据,那就是贝叶斯主义者”的人打交道,你可能会接受这样的观点,即你应该让样本大小来决定选择哪个阵营。唉,如果你质疑一下,他们的建议背后的理由就会变得摇摆不定。

频率主义者确实拒绝 小数据集。如果你的手指比例子多,他们几乎肯定会告诉你不要打扰。

如果您采用贝叶斯方法,确实可以使用一个 (!) 数据点进行处理。数学检查出来了。当然。你能行的。

......但是,你应该这样做吗?

被允许处理少量数据可能是一个错误。在某些情况下,您绝对不想这样做。(统计数据不是炼金术。我们不是凭空制造黄金。无论您宣誓效忠哪种学派,每数据点中的数据信息量都是相同的。)

“要求更少数据”的方法是做出更大的假设(这对两种哲学都适用)……所以,当你的主要成分不是数据,而是你自己编造的一些废话时,花点时间思考你的结论的营养成分。如果你在处理微小的数据时太过认真,贝叶斯专家和频繁论者都会忘记他们的差异,一起嘲笑你。

那么,你是贝叶斯主义者还是频率主义者?

两个都是!我的选择是基于我制定决策的方式。这取决于形势是否需要在行动和形成基于证据的观点之间做出选择。

我应该选择支持哪一方吗?

我建议不要只投入一个阵营(除非你花了几年时间思考统计学的哲学,你愿意死在这座山上)。

老实说,如果你没有非常深入地思考过,就说自己是其中一种或另一种是有点愚蠢的。我很高兴在杜克大学做我的研究生工作(杜克大学对于贝叶斯统计来说就像梵蒂冈对于天主教一样),我注意到,对贝叶斯统计的优势说得最大声的并不是教授们……而是那些新生,他们因为不用再背古怪的频率置信区间(贝叶斯可信区间要简单得多)的定义而松了心。教授们明白,“更好”取决于你为什么努力去做。他们花很多时间用贝叶斯方法思考因为它符合他们感兴趣的决策方法。

所以,我的建议是不要站在一边。把它们看作是适合两种不同的决策和推理风格的两种不同的方法,然后让你自己选择哪种方法适合你所处的心态/环境。

作者:Cassie Kozyrkov

原文地址:https://towardsdatascience.com/statistics-are-you-bayesian-or-frequentist-4943f953f21b

标签:

“统计学:你是贝叶斯主义者还是频率主义者?”的评论:

还没有评论