掌握 Mann-Whitney U 测试:综合指南
Mann-Whitney U 检验是一种非参数统计检验,用于确定两个独立的非正态分布数据组之间是否存在显着差异。它对两组观察结果进行排名,然后计算 U 统计量以对它们进行比较。
介绍
- 曼惠特尼 U 检验,或 Wilcoxon 秩和检验,是一种强大的非参数检验,用于比较两个独立样本。 与传统的 t 检验不同,它不需要假设数据呈正态分布。 该测试确定一个样本的观察结果是否通常大于另一个样本的观察结果。
请务必注意, 曼惠特尼测试 最适合未通过正态性检验的序数、计数或连续数据。该工具变得越来越受欢迎,因为它对异常值和偏差数据具有很强的抵抗力,这使得它对于各种情况下的数据科学家非常有用。
- 曼惠特尼 U 检验 具有广泛的实际应用。例如,在药物研究中,它可以用来比较两种不同药物的有效性。它可以在教育中用于分析教学方法 A 是否比方法 B 产生更高的测试分数。关键是它允许比较两组的连续或顺序结果。
亮点
- Mann-Whitney U 检验是非参数的,比较两个独立组。
- 与 t 检验不同,Mann-Whitney 不需要正态分布的数据假设。
- 曼-惠特尼检验使用秩双列相关性来衡量效应大小。
- 解释结果时考虑 U 统计量、p 值和效应大小。
广告标题
广告描述。 Lorem ipsum dolor sat amet,consectetur adipiscing elit。
曼-惠特尼 U 检验的假设
的效力 曼惠特尼 U 检验 依赖于某些假设:
观察的独立性:这个关键假设意味着每个观察结果都是独立于其他观察结果的。 各个观察结果之间不存在相关性或依赖性。
从总体中随机抽样:数据应从总体中随机抽样。 换句话说,每个单独的观察结果都应该独立地从总体中得出。
序数数据:Mann-Whitney 检验特别适合不遵循正态分布的序数(排名)、计数或连续数据。如果数据是连续的并且服从正态分布,则更合适的检验是参数 t 检验,它在这些条件下具有更大的统计功效。
违反这些假设可能会导致有偏见或不正确的结果。 因此,在执行之前理解和验证这些假设至关重要 曼惠特尼 U 检验.
执行 Mann-Whitney U 检验的分步过程
必须遵循多个步骤才能进行 曼惠特尼 U 检验,非参数检验。
1. 对数据进行排序:首先合并两个数据集并按升序对所有值进行排序。 为每个观察值分配排名编号,最小的数据点获得排名 1。如果两个或多个数据点相同(即并列),则它们获得平均排名。
2. 计算排名总和:分别总结各组的排名。 这将为您提供两个总计——您要比较的两组各一个。
3. 计算U统计量:可以使用以下公式计算每个组的 U 统计量 U = n1.n2 + (n1(n1+1))/2 – R1 (第 1 组)和 U = n1.n2 + (n2(n2+1))/2 – R2 (第 2 组),其中 n1 和 n2 是 2 个样本的大小。 R 是第一/第二组中的秩和。因此,您将获得两个 U 值,每个组一个。
4. 找到较小的U值:使用两次计算出的 U 统计量中较小的 U 值进行检验。
5. 确定重要性:将计算出的 U 统计量与 Mann-Whitney U 分布表中的临界值(随样本大小而变化)进行比较。 如果计算出的 U 值小于或等于表中值,则认为差异具有统计显着性。
6. 进行假设检验:根据 U 统计量的 p 值(通常使用 p < 0.05),拒绝或无法拒绝原假设。曼-惠特尼检验的原假设 (H0) 是两组的分布相等。
请记住,软件包和编程语言,例如 R 和 Python ,具有内置函数来为您执行这些计算。使用此类工具可以节省时间并降低手动计算错误的可能性。
报告 Mann-Whitney U 检验的结果
在报告 Mann-Whitney U 测试结果时,提供必要的详细信息至关重要,以便读者能够充分理解测试结果并验证结果。 要创建完整的报告,请确保包含以下关键组成部分:
描述测试:说明您进行了曼-惠特尼测试。指定为什么该测试是合适的,通常是由于数据是有序的或不正态分布的。
报告样本量:给出您比较的样本的大小。 这些为 U 统计量的大小提供了背景。
提供测试统计数据:报告准确的 U 统计量、p 值和秩双列相关性作为效应大小的度量。
当前描述性统计:包括每组的中位数,因为 Mann-Whitney U 检验是中位数检验。 此外,还提供每个组的变异性度量。
陈述结果:解释结果是否显着以及这对您的研究问题意味着什么。
讨论效果大小:反思秩双列相关性的实际含义。 绝对值高代表效应量大,具有实际意义。
报告其他相关信息:详细说明指导您决定使用 Mann-Whitney U 检验的任何其他相关分析或测试。例如,如果进行正态性检验(如 Shapiro-Wilk 检验或 Kolmogorov-Smirnov 检验)并且发现数据呈非正态分布,则可以证明使用 Mann-Whitney 检验而不是 t-测试。包含此信息可以让您更透明地了解统计决策过程。
以下是如何报告 Mann-Whitney U 检验结果的示例:
“我们进行了曼-惠特尼 U 检验,以调查品牌 A(n = 50,中位数 = 85,IQR = 10)和品牌 B(n = 60,中位数 = 75,IQR = 15)的客户之间满意度的差异。在此之前,进行了 Shapiro-Wilk 正态性检验,结果显示数据呈非正态分布,从而证明了 Mann-Whitney 检验的合理性。测试结果具有统计显着性(U = 1200,p = .03),表明两个客户组之间的满意度存在差异。作为效应大小的衡量标准的二列相关性为 0.4,表明具有中等的实际意义。因此,我们可以得出结论,品牌 A 的客户明显高于品牌 B 的客户。“
解释 Mann-Whitney U 检验的结果
解释结果 曼惠特尼 U 检验 涉及了解 U 统计量、p 值以及效应大小:
U统计:U 统计量提供两组数据的排名总和。 两个计算出的 U 统计量之间较小的 U 值用于检验。 如果 U 统计量很小,则表明第一组中有许多低排名,而第二组中有许多高排名,表明两组之间存在显着差异。
P值:p 值有助于确定测试结果的统计显着性。 p 值小于所选显着性水平(通常为 0.05)表明两组之间的差异具有统计显着性。 因此,我们拒绝原假设(两组之间没有差异)。
规模效应:除了 p 值之外,还必须考虑效应大小。 这一关键指标量化了两组之间差异的大小。 在 Mann-Whitney U 检验中,效应大小通常使用秩双列相关性来测量。 与 p 值不同,效应大小与样本大小无关。 因此,它可以更直观地了解观察到的效果的大小。 排名二列相关性提供了标准化的效果测量,这对于比较不同研究或数据集的结果是有益的。 该值的范围可以是 -1 到 +1。 接近 |1| 的值表示一个组中的排名始终高于另一组中的排名的巨大影响。 接近于零的值表明几乎没有影响。 这种对效应大小的解释可以更好地理解组间差异的存在、相关性和实际意义。
曼-惠特尼 U 检验 vs. 其他非参数检验
- 曼惠特尼 U 检验 通常与非参数检验(例如 Kruskal-Wallis H 和 Wilcoxon 符号秩检验)进行比较。虽然这些测试有相似之处,但它们用于不同的场景。例如,Kruskal-Wallis H 检验将 Mann-Whitney 检验扩展到两组以上,而 Wilcoxon 符号秩检验则用于配对数据。
广告标题
广告描述。 Lorem ipsum dolor sat amet,consectetur adipiscing elit。
推荐文章
浏览我们博客上的其他相关文章,了解有关统计测试及其应用的更多见解!
- 两个集合的并集和交集:集合分析的基本方法
- Kruskal-Wallis 测试:掌握多组非参数分析
- 了解卡方独立性检验的假设
- t 检验和曼惠特尼检验有什么区别?
- 统计数据与参数:综合常见问题解答指南
- 非参数统计:综合指南
常见问题解答 (FAQs)
这是一种非参数统计检验,用于比较两个独立的非正态分布的数据组。
当处理非正态分布的序数或连续数据时,此测试非常理想。
Mann-Whitney U 检验假设观察是独立的,这意味着每个观察都是不相关的。 它还假设从总体中随机采样,这意味着数据应该从总体中随机采样。 最后,该检验适用于有序数据或连续数据,并且不遵循正态分布。
首先,您必须对所有数据值进行组合并按升序排列。 然后,分别计算两组的排名总和。 然后,可以使用特定公式确定每个组的 U 统计量,该公式考虑样本的大小(n1 和 n2)以及每个组中的排名总和 (R)。 检验中的最终 U 统计量是两个计算的 U 值中较小的一个。
较小的 U 统计量表明两组之间存在显着差异。
p 值小于 0.05 表明两组之间存在统计显着差异。
它使用秩双列相关来衡量两组之间差异的大小。
包括样本大小、测试统计数据、效应大小和结果的清晰解释等详细信息。
Kruskal-Wallis H 检验将 Mann-Whitney U 检验扩展到两个以上的组。
不,Wilcoxon 符号秩检验更适合配对数据。