方差分析:不要忽视这些秘密
方差分析的秘密在于它的假设:观察的独立性、正态性和同方差性。 正确选择方差分析类型、准确的样本量计算以及仔细的事后分析对于获得有效结果至关重要。
您是否意识到统计检验(包括方差分析)的错误应用比我们想象的更为普遍,并且可能导致我们得出错误的结论? 这是令人担忧的,因为错误的发现可能会导致错误的决定。 因此,我们邀请您仔细阅读本文,以避免陷入这个陷阱。
亮点
- 方差分析是一种统计检验,用于比较两个或多个组的平均值。
- 单向方差分析和重复测量方差分析是最常用的方差分析类型。
- 违反观察的独立性可能会使分析产生偏差并产生误导性的结果。
- 如果方差分析的 p 值显着,则事后检验可以识别哪些组存在差异。
- 方差分析的滥用很常见,导致许多研究结论值得怀疑。
问题
读完这篇文章是不是有一种似曾相识的感觉? 可能是因为您读过我们的文章“学生们 T 检验:不要忽视这些秘密设立的区域办事处外,我们在美国也开设了办事处,以便我们为当地客户提供更多的支持。“
这两个用于比较平均值的检验有许多相似之处。
如果您还没有阅读上一篇文章,我们建议您在读完这篇文章后打开它并进行必要的比较。 如果您已经阅读过,请将这篇文章作为比较和回顾的基础。
与 t 检验一样,方差分析的广泛可用性和简单性,加上其易于理解和应用,使其成为全球最常用的推理统计检验之一。
然而,这种类似于 t 检验的“普及”导致了分析使用不正确等问题。
最近有几个 系统评论文章 揭示在某些类型的研究中近 80% 已发表的论文在统计分析中存在错误!
考虑到人类问题的解决方案往往依赖于这些研究,令人不安的是意识到其中很大一部分可能被错误地分析,并可能导致错误的结论。
正确进行方差分析的“秘诀”并不复杂。
您所需要的只是了解分析的一些基本特征!
解决方案
ANOVA 是“方差分析”的缩写,本质上是比较均值的检验——推断 3 个或更多组的均值是否相等。
通常,我们使用方差分析来比较三个或更多组,并使用 t 检验来比较两个组。
请密切关注,因为以下六个步骤对于正确且明确地应用方差分析至关重要。
1. 确定合适的方差分析类型
最常用的方差分析类型是:
单向方差分析
这是最常见的类型,它评估从三个或更多独立组中获取的样本的平均值是否相等。
更技术性地说,它检查分类自变量对连续因变量的影响。
例如,它可以用来检查三种不同鸟类的翼展平均值是否相等。
单向重复测量方差分析
这种类型相当于单向方差分析,但三个[或更多]组之间的样本是相关的。 也就是说,样本是配对的或相关的。
例如,假设我们要检查一个城市老年女性的平均血压是否保持不变:
- 服药一小时后
- 服药两小时后
- 服药四小时后
在这里,由于每个妇女的血压测量三次——服药后一小时、两小时和四小时——所以每个样本单位都有一对(受试者内测量)。
其他类型
在这篇文章中,我们不会深入研究其他类型的方差分析,例如双向方差分析和双向重复测量方差分析。
这两种分析之间的主要区别在于,在重复测量方差分析中,样本是配对的。
这些代表单向方差分析的扩展,并检查两个独立的 calcategori 变量对连续因变量的影响。
2. 计算方差分析的样本量
确定您将采用的方差分析类型后,下一步涉及确定您的研究所需的受试者数量。
获得合适的样本量通常可以缓解许多统计问题。
要确定测试的适当样本量,您必须执行特定的计算,该计算因统计测试而异。
对于方差分析,您将需要研究的每个群体的近似或估计平均值和标准差。
这些值被输入到统计软件中的样本量计算器中,并与所选的方差分析类型一致。
然后,软件会提供要收集的最佳受试者数量。
但这些均值和标准差从何而来?
通常,它们源自先前的试点研究或类似的研究工作。
专家提示: G*Power 是一款出色的免费统计软件,可用于计算样本量。
3.观察必须是独立的!
观察的独立性是最重要的统计假设,但它经常被忽视。
这一假设对于包括方差分析在内的所有统计测试都至关重要,因为违反它可能会导致分析有偏差和误导结果。
为了保持独立性,请确保样本的每个元素都是独立的。
随机性的概念是这里的关键; 从适合您的研究的人群中随机收集数据可以帮助支持这一假设。
例如,应该使用城市内个体的随机样本来识别城市的基因谱。 例如,仅从一个家庭进行采样就会违反独立性假设,因为他们的遗传特征密切相关。
4. 残差的正态性
所有参数推理分析(包括方差分析)都需要残差(误差)的正态性假设。
您的残差必须符合正态(或高斯)分布。
统计检验(例如 Shapiro-Wilk、Anderson-Darling 和 Kolmogorov-Smirnov 检验)可以帮助确定残差是否符合此分布。
解释这些测试结果时要小心; 如果它们表明违反了正态性假设,请考虑以下选项:
-
继续进行方差分析,如果您的样本量足够,则断言它对于偏离正态性具有稳健性。
-
转换您的数据并重新测试是否正常。
-
选择与 t 检验等效的非参数检验。
虽然第一个选项可能看起来很方便,但通常不建议这样做。
通常,采用第二种选择; 如果继续违反正态性假设,则建议使用第三种选择。
参数检验及其非参数等效项:
- 单因素方差分析 = 克鲁斯卡尔-瓦利斯 H 检验。
- 单向重复测量方差分析 = Friedman 检验
5. 残差的同方差性
仅当残差符合正态性假设后才需要执行此步骤。
同方差性是指抽样总体之间方差相似或同质的要求。
各种测试(例如 F、Bartlett 和 Levene 测试)可以检查是否违反此假设。
然而,违反这一假设通常是可以控制的。
如果您的数据存在异方差性(方差不等),您可以通过较小的调整来运行方差分析 (Welch)。
大多数统计程序的分析报告会自动提供调整后的方差分析结果。
6. 方差分析和事后检验
方差分析中的显着 p 值表示至少一对不同的均值。
然而,它没有指定哪对或多对是不同的。
事后测试(事后 测试)用于确定哪些组存在显着差异。
根据方差是相等(同方差)还是不相等(异方差),使用不同的事后检验。
假设方差相等时,常用的检验包括 Tukey 检验 (HSD)、Bonferroni、Scheffé 和 Duncan 检验。
Games-Howell 检验、Tamhane 的 T2 检验、Dunnet 的 T3 检验和 Dunnet 的 C 检验通常用于不等方差。
推荐文章
你准备好进一步探索统计数据和 数据分析? 查看我们博客中有关相关主题的其他信息文章。通过探索有价值的见解和专家提示来扩展您的知识并提高您的技能。单击此处立即开始您的学习之旅!
常见问题解答(FAQ)
Q1:什么是方差分析? 这是一种比较两个或多个组的平均值的统计检验。
Q2:最常见的方差分析类型有哪些? 最常见的类型是单向方差分析和重复测量方差分析。
Q3:方差分析的样本量是如何确定的? 它需要通过统计软件计算出每个研究人群的估计平均值和标准差。
Q4:方差分析中观察的独立性有何意义? 这是方差分析中的一个关键假设。 违反这一点可能会使分析产生偏差并产生误导性结果。
Q5:方差分析中残差的正态性是什么意思? 这意味着残差(误差)必须服从正态分布。 这对于参数推理分析是必要的。
Q6:如何检验残差的正态性? 这可以使用正态性检验(例如 Shapiro-Wilk、Anderson-Darling 和 Kolmogorov-Smirnov)进行验证。
Q7:方差分析中的同方差是什么? 这意味着采样总体的方差必须相似才能应用标准方差分析。
问题 8:如果方差分析的 p 值显着,会发生什么情况? 事后测试可以确定哪些组存在差异(如果差异显着)。
Q9:使用方差分析时常见的错误是什么? 方差分析的滥用很常见,常常导致有问题的研究结论。
Q10:如何正确使用方差分析? 通过以下六个步骤:选择方差分析类型、计算样本量、进行随机抽样、检查残差的正态性、检查同方差性以及使用事后检验运行方差分析。