重新审视 p 值

重温“P 值意味着什么”

在一个 以前的文章,我们提供了 p 值的教学定义。 然而,它可能无法准确反映其全部含义。

这种简化有利于那些最初接触该概念的人,有助于建立基础理解。

我们现在提出了 p 值的更精确的定义,这需要更密切的关注。

统计假设

在进行推理假设检验时——例如 卡方, t检验、方差分析、相关性、回归等——我们有两个假设:

零假设 (H0): 这是更简单的默认假设。 它假设没有“组之间的差异”或没有“变量之间的关系”。

替代假设(H1): 这个假设是H0的补充。 它表明“群体之间的差异”或“变量之间的关系”。

显着性水平和 P 值

任何假设检验的主要目标是确定是否拒绝原假设 (H0)。 这一决定取决于两个关键因素:

显着性水平 (α):这是我们用来决定是否拒绝H0的预定阈值。 在执行测试之前,它通常设置为 1% 或 5%。

P 值 (p):p 值是从我们执行的每个推理假设检验中获得的概率。

具有统计显着性意味着什么?

在执行分析并获得 p 值后,我们将其与预设的显着性水平 (α) 进行比较。

例如,我们将显着性水平 (α) 设置为 0.05(或 5%)。 当将此 α 与我们获得的 p 值进行比较时,我们有两种可能性:

1. 如果 p 值小于或等于显着性水平 α (p ≤ 0.05),我们拒绝原假设 (H0)。 在这种情况下,我们的测试被认为具有统计显着性。

2. 如果 p 值大于显着性水平 α (p > 0.05),我们不会拒绝原假设 (H0)。 在这里,我们的测试被认为没有统计显着性。

P值的含义

从技术角度来说, p-值 是:

假设零假设为真,获得等于(或更极端)我们在数据中观察到的结果的概率。

例如,如果我们得到的 p 值为 2% (p = 0.02),这意味着如果 H0 为真,则获得等于(或更极端)我们的结果的概率仅为 2%。 由于这小于 α = 5%,我们拒绝 H0。

例:女士品茶

这个故事带我们来到 1920 年代初英国哈彭登的一个夏日午后。

一群科学家——一名统计学家、一名藻类学家和一名生物化学家——聚集在洛桑实验站喝下午茶。
藻类学家穆里尔·布里斯托尔坚持认为,茶倒在牛奶上与牛奶倒在茶上的味道不同。

该小组对她的说法提出质疑,发现很难相信口味上会有任何明显的差异。

统计学家罗纳德·费舍尔提出了一项实验。 穆里尔将得到八杯茶。 其中一半将牛奶倒在茶上,另一半将茶倒在牛奶上。 不过,她并没有亲眼目睹准备过程。

当穆里尔品尝每一杯时,她正确地识别了准备方法,并全部正确!

结束语

关于我们对 p 值的讨论。

让我们考虑零假设 (H0),即 Muriel 无法识别不同的制剂。 如果 H0 为真,则 Muriel 正确识别所有八个杯子中的茶制剂的概率仅为 1.43%。

由于 1.43% 的 p 值小于我们选择的 5% 显着性水平 (α),因此我们认为该检验具有统计显着性。 因此,我们将拒绝原假设 (H0),转而支持备择假设 (H1),即 Muriel 可以区分不同的茶制品。

*此示例说明了在进行测试之前设置显着性水平 (α) 的重要性。 通常,α 设置为 1% 或 5%。 如果我们要获得这两个阈值之间的 p 值,我们可能会偏向于选择使我们的结果看起来显着的 α — 在本例中为 5%。

 

记得阅读第一篇关于 p 值的文章! 点击这里!

在我们的社交网络上访问我们

Instagram 上的每日帖子!

类似的帖子

发表评论

您的电邮地址不会被公开。 必填项 *