方差分析

方差分析:不要忽视这些秘密

方差分析的秘密在于它的假设:观察的独立性、正态性和同方差性。 正确选择方差分析类型、准确的样本量计算以及仔细的事后分析对于获得有效结果至关重要。

您是否意识到统计检验(包括方差分析)的错误应用比我们想象的更为普遍,并且可能导致我们得出错误的结论? 这是令人担忧的,因为错误的发现可能会导致错误的决定。 因此,我们邀请您仔细阅读本文,以避免陷入这个陷阱。

亮点

  • 方差分析是一种统计检验,用于比较两个或多个组的平均值。
  • 单向方差分析和重复测量方差分析是最常用的方差分析类型。
  • 违反观察的独立性可能会使分析产生偏差并产生误导性的结果。
  • 如果方差分析的 p 值显着,则事后检验可以识别哪些组存在差异。
  • 方差分析的滥用很常见,导致许多研究结论值得怀疑。

问题

读完这篇文章是不是有一种似曾相识的感觉? 可能是因为您读过我们的文章“学生们 T 检验:不要忽视这些秘密设立的区域办事处外,我们在美国也开设了办事处,以便我们为当地客户提供更多的支持。“

这两个用于比较平均值的检验有许多相似之处。

如果您还没有阅读上一篇文章,我们建议您在读完这篇文章后打开它并进行必要的比较。 如果您已经阅读过,请将这篇文章作为比较和回顾的基础。

与 t 检验一样,方差分析的广泛可用性和简单性,加上其易于理解和应用,使其成为全球最常用的推理统计检验之一。

然而,这种类似于 t 检验的“普及”导致了分析使用不正确等问题。

最近有几个 系统评论文章 揭示在某些类型的研究中近 80% 已发表的论文在统计分析中存在错误!

考虑到人类问题的解决方案往往依赖于这些研究,令人不安的是意识到其中很大一部分可能被错误地分析,并可能导致错误的结论。

正确进行方差分析的“秘诀”并不复杂。

您所需要的只是了解分析的一些基本特征!

解决方案

ANOVA 是“方差分析”的缩写,本质上是比较均值的检验——推断 3 个或更多组的均值是否相等。

通常,我们使用方差分析来比较三个或更多组,并使用 t 检验来比较两个组。

请密切关注,因为以下六个步骤对于正确且明确地应用方差分析至关重要。

1. 确定合适的方差分析类型

最常用的方差分析类型是:

单向方差分析

这是最常见的类型,它评估从三个或更多独立组中获取的样本的平均值是否相等。

更技术性地说,它检查分类自变量对连续因变量的影响。

例如,它可以用来检查三种不同鸟类的翼展平均值是否相等。

单向重复测量方差分析

这种类型相当于单向方差分析,但三个[或更多]组之间的样本是相关的。 也就是说,样本是配对的或相关的。

例如,假设我们要检查一个城市老年女性的平均血压是否保持不变:

  • 服药一小时后
  • 服药两小时后
  • 服药四小时后

在这里,由于每个妇女的血压测量三次——服药后一小时、两小时和四小时——所以每个样本单位都有一对(受试者内测量)。

其他类型

在这篇文章中,我们不会深入研究其他类型的方差分析,例如双向方差分析和双向重复测量方差分析。

这两种分析之间的主要区别在于,在重复测量方差分析中,样本是配对的。

这些代表单向方差分析的扩展,并检查两个独立的 calcategori 变量对连续因变量的影响。

2. 计算方差分析的样本量

确定您将采用的方差分析类型后,下一步涉及确定您的研究所需的受试者数量。

获得合适的样本量通常可以缓解许多统计问题。

要确定测试的适当样本量,您必须执行特定的计算,该计算因统计测试而异。

对于方差分析,您将需要研究的每个群体的近似或估计平均值和标准差。

这些值被输入到统计软件中的样本量计算器中,并与所选的方差分析类型一致。

然后,软件会提供要收集的最佳受试者数量。

但这些均值和标准差从何而来?

通常,它们源自先前的试点研究或类似的研究工作。

专家提示: G*Power 是一款出色的免费统计软件,可用于计算样本量。

3.观察必须是独立的!

观察的独立性是最重要的统计假设,但它经常被忽视。

这一假设对于包括方差分析在内的所有统计测试都至关重要,因为违反它可能会导致分析有偏差和误导结果。

为了保持独立性,请确保样本的每个元素都是独立的。

随机性的概念是这里的关键; 从适合您的研究的人群中随机收集数据可以帮助支持这一假设。

例如,应该使用城市内个体的随机样本来识别城市的基因谱。 例如,仅从一个家庭进行采样就会违反独立性假设,因为他们的遗传特征密切相关。

4. 残差的正态性

所有参数推理分析(包括方差分析)都需要残差(误差)的正态性假设。

您的残差必须符合正态(或高斯)分布。

统计检验(例如 Shapiro-Wilk、Anderson-Darling 和 Kolmogorov-Smirnov 检验)可以帮助确定残差是否符合此分布。

解释这些测试结果时要小心; 如果它们表明违反了正态性假设,请考虑以下选项:

  • 继续进行方差分析,如果您的样本量足够,则断言它对于偏离正态性具有稳健性。

  • 转换您的数据并重新测试是否正常。

  • 选择与 t 检验等效的非参数检验。

虽然第一个选项可能看起来很方便,但通常不建议这样做。

通常,采用第二种选择; 如果继续违反正态性假设,则建议使用第三种选择。

参数检验及其非参数等效项:

5. 残差的同方差性

仅当残差符合正态性假设后才需要执行此步骤。

同方差性是指抽样总体之间方差相似或同质的要求。

各种测试(例如 F、Bartlett 和 Levene 测试)可以检查是否违反此假设。

然而,违反这一假设通常是可以控制的。

如果您的数据存在异方差性(方差不等),您可以通过较小的调整来运行方差分析 (Welch)。

大多数统计程序的分析报告会自动提供调整后的方差分析结果。

6. 方差分析和事后检验

方差分析中的显着 p 值表示至少一对不同的均值。

然而,它没有指定哪对或多对是不同的。

事后测试(事后 测试)用于确定哪些组存在显着差异。

根据方差是相等(同方差)还是不相等(异方差),使用不同的事后检验。

假设方差相等时,常用的检验包括 Tukey 检验 (HSD)、Bonferroni、Scheffé 和 Duncan 检验。

Games-Howell 检验、Tamhane 的 T2 检验、Dunnet 的 T3 检验和 Dunnet 的 C 检验通常用于不等方差。

结束语

方差分析是全球使用最广泛的推论统计分析之一。

尽管如此,它在许多研究中的滥用导致了有问题的结果和结论。

您可以按照我们概述的六个步骤进行更稳健、更可靠的分析。 记得:

  1. 选择正确的方差分析类型,
  2. 计算适当的样本量,
  3. 确保适当的随机抽样,
  4. 检查残差的正态性,
  5. 确认同方差假设,并且
  6. 执行方差分析和随后的事后检验。

推荐文章

你准备好进一步探索统计数据和 数据分析? 查看我们博客中有关相关主题的其他信息文章。通过探索有价值的见解和专家提示来扩展您的知识并提高您的技能。单击此处立即开始您的学习之旅!

常见问题解答(FAQ)

Q1:什么是方差分析? 这是一种比较两个或多个组的平均值的统计检验。

Q2:最常见的方差分析类型有哪些? 最常见的类型是单向方差分析和重复测量方差分析。

Q3:方差分析的样本量是如何确定的? 它需要通过统计软件计算出每个研究人群的估计平均值和标准差。

Q4:方差分析中观察的独立性有何意义? 这是方差分析中的一个关键假设。 违反这一点可能会使分析产生偏差并产生误导性结果。

Q5:方差分析中残差的正态性是什么意思? 这意味着残差(误差)必须服从正态分布。 这对于参数推理分析是必要的。

Q6:如何检验残差的正态性? 这可以使用正态性检验(例如 Shapiro-Wilk、Anderson-Darling 和 Kolmogorov-Smirnov)进行验证。

Q7:方差分析中的同方差是什么? 这意味着采样总体的方差必须相似才能应用标准方差分析。

问题 8:如果方差分析的 p 值显着,会发生什么情况? 事后测试可以确定哪些组存在差异(如果差异显着)。

Q9:使用方差分析时常见的错误是什么? 方差分析的滥用很常见,常常导致有问题的研究结论。

Q10:如何正确使用方差分析? 通过以下六个步骤:选择方差分析类型、计算样本量、进行随机抽样、检查残差的正态性、检查同方差性以及使用事后检验运行方差分析。

标准差可以为负吗?

在我们的社交网络上与我们联系!

Instagram 上的每日帖子!

类似的帖子

发表评论

您的电邮地址不会被公开。 必填项 *