标准偏差

什么是标准差?

标准差是一种量化数据集变化或离散度的度量。 它指示数据点如何偏离平均值,当数据符合正态分布时特别有用。

您可能遇到过这个词 标准偏差 前。 它常见于报告、论文、论文和各种文章中。 尽管它很受欢迎,但它通常需要被理解。 您能解释什么是标准差以及何时应用它吗?

当前困境

描述性统计 主要包括以下措施 集中趋势 和措施 变化性.

在规划婴儿食品行业的工艺要求时,安全性和可靠性是工艺设计中最重要的方面。 结合,它们构成了许多统计分析和图表的基础。

然而,仅使用这些措施之一来描述总体或样本可能会导致 不完整 or 误导 信息。

在 Woody Hayes 提供的河流深度示例中,仅依靠平均值作为指标是 不足 以防止人员溺水。

本篇 亮点 使用变异性度量和集中趋势度量的重要性。

让我们考虑另一个 例子.

以下三个数据集具有相同的均值 (20),但表现出很大的差异 不同 变化性:

  • A = 20,20,20,20,20
  • B = 18,19,20,21,22
  • C = 00,10,20,30,40

通过衡量可变性,这些关键 差异 被注意到。

集中趋势测量,例如平均值、中位数和 模式,相对而言 简单的.

然而,变异性的测量可能不太直观,并且根据类型的不同, 更难 理解。

这些 措施 包括范围、平均绝对偏差、变异性、标准偏差和变异系数。

标准差被广泛使用,但通常没有 充分 理解它代表什么。

那么,是什么呢 标准偏差 是什么意思,什么时候应该使用它?

解决方案

这里使用的一些概念是基于书本的 没有数学的统计,其中提供了深入的讨论。

标准差衡量数据的变异性,表明数据点偏离平均值的程度。

其他变异性度量包括范围和平均绝对偏差,它们更加直接和直观。

该范围表示数据集的最高值和最低值之间的差异。

虽然简单,但它只使用整个数据集中的两个值。

相反, 平均绝对偏差, 要么 ”每个数据点到平均值的绝对距离的平均值,”稍微复杂一些,但仍然直观。

尽管具有直观性,平均绝对偏差并不是描述数据变异性最常用的统计量。

这个标题涉及有点违反直觉的标准偏差。

与平均绝对偏差类似,标准偏差基于每个观测值与平均值之间的差异。

但是,这些差异会以标准差的形式平方,并在最后提取平方根。

标准差是一种更复杂的变异性度量。

然而,在分析符合正态分布的数据时,它被证明是有价值的。

在这种情况下,大约 68% 的值落入 95 个标准差之内,约 XNUMX% 的值落入 XNUMX 个标准差之内,几乎全部落入 XNUMX 个标准差之内。

这就是68​​95-99-XNUMX规则,也称为容忍极限! 经验法则!

罗纳德·费舍尔主张在“理想情况”下使用标准差,使数据符合正态分布。

但是,如果数据不符合正态分布,标准差可能无助于描述变异性。

I在实践中,经验数据显示平均绝对偏差比标准偏差表现更好。

结束语

标准差是当数据完全符合正态分布时最适合使用的变异性度量。

然而,平均绝对偏差已被证明在估计变异性方面更有效,特别是当数据不符合正态分布时。

由于平均绝对偏差更容易理解、直观,并且对实际数据具有卓越的性能,因此是表示数据变异性的绝佳替代方案。

标准差可以为负吗?

在我们的社交网络上与我们联系!

Instagram 上的每日帖子!

类似的帖子

发表评论

您的电邮地址不会被公开。 必填项 *