使用统计数据可以撒谎吗? 确实如此,而且可能比您预期的更为普遍。
那么,如何操纵统计数据,更重要的是,如何避免成为这些扭曲的牺牲品?
本文探讨了经常用于歪曲数据的各种技术,并为寻求避免欺骗的读者提供了宝贵的参考。
记者、营销人员甚至科学家有时会以误导观众的方式使用统计数据、图表、表格和图表。 因此,大家一定要提高警惕,不要上当受骗!
人们普遍认为,统计数据在用于呈现信息时可以为所传达的信息增添可信度。 这是意料之中的反应,体现了人们对统计领域的尊重和重视。
然而,机会主义者可以利用这种信任,依靠捏造或操纵的统计数据提供伪装成真相的虚假信息。 经过仔细审查,这些欺骗通常是站不住脚的或完全没有根据的。
本文为数据分析师和那些不再希望被统计欺骗所蒙蔽的人提供了宝贵的信息和资源。
统计操纵渗透到许多社会部门,对我们的生活产生深远影响。 例如,选民意图数据、新闻和营销的精心策划组合可以对选举结果产生决定性影响。
为了避免被误导,了解这些操作背后的技术至关重要。
1954 年,达雷尔·赫夫 (Darrell Huff) 出版了《如何用统计数据撒谎》。 这部颇具影响力的著作探讨了流行的统计技术,揭露了旨在误导而不是提供信息的操纵方法。
“达雷尔·哈夫(Darrell Huff)涵盖了所有常用的统计类型,探讨了样本研究、制表方法、访谈技巧或从数字中得出结果的方式等内容,并指出了无数的回避方法用来充分而不是告知。“
尽管出版已有半个多世纪了,比尔·盖茨指出,这本书的见解比以往任何时候都更有意义。 以下各节讨论了十章中每一章的主要内容。
有兴趣购买《如何用统计说谎》吗? 点击这里!
本章介绍采样偏差的概念。 如果您操纵样本选择来证实您的观点,您可以获得所需的结果。
当随机数据选择受到损害时就会出现偏差。 理论上,每个数据点应该有平等的机会被选为样本,但有偏抽样却忽视了这一原则。
在实践中,可以根据期望的结果来指导样本选择。 例如,可以操纵访谈的设计和应用来引发特定的反应。 这个领域充满了欺骗和欺诈的机会。
在本节中,哈夫解释了如何选择集中趋势的度量,以得出最有利于你的论点的值。集中趋势的关键指标包括算术平均值、中位数和 模式.
例如,假设一家酒吧有 15 位顾客,每个顾客的年收入分别为 15、16、18、20、20、21、21、84 和 26,000 千美元。 平均收入为 20,000 美元,中位数为 XNUMX 美元。
假设比尔盖茨带着年收入10万美元走进酒吧。 平均收入飙升至 1 万美元,但中位数仍保持在 20,000 美元。 因此,酒吧老板现在可以声称他的顾客的平均年收入约为 1 万美元!
省略数据通常表明试图掩盖问题。 本章强调了样本量的重要性。
当处理小样本时,机会可能会显着扭曲结果。 较大的样本会稀释机会偏差,产生的结果更能代表总体。
一些公司反复进行小组实验,直到获得适合其议程的结果。 这种扭曲的结果随后通过公司的广告传播。
通常,通过比较来呈现价值是最有效的方法。 例如,缺少数据的图表无法向敏锐的观察者传达任何信息,但可能会误导那些分心的人。
本章还探讨了在没有任何变异性衡量的情况下呈现平均值如何会导致误解,特别是对于那些需要更多关注的人来说。
哈夫在本章中讨论了测量误差,并强调了利用 置信区间 管理这些错误。此类错误是所有采样过程中固有的。因此,应考虑这些错误,因为样本永远不会完美地代表其母体。
操纵图形表示是欺骗粗心者的有效方法。 通过改变图表的视角,可以不成比例地强调具体事实。
截断图表的一部分或扭曲轴的比例可能会显着改变消息。
这种形式的操纵利用了视觉吸引力。 相同的数据可以用适当形状的图表和误导性的象形图来表示。
例如,如果钱袋图形的高度加倍,其面积就会增加四倍,这可能会夸大感知差异。
这种操纵技术的原理是:“如果你不能证明你想要什么,那就证明别的东西并假装它们是同一件事。“
“你无法证明你的药物可以治愈感冒,但你可以(用大号字体)发表一份经宣誓的实验室报告,证明半盎司的药物在试管中可在 31,108 秒内杀死 XNUMX 个细菌。=
例如,声称去年死于飞机事故的人数比 1910 年多并不一定意味着现代飞机更危险。 因此,自 1910 年以来,航空旅行量呈指数级增长,这一欺骗性的说法很容易忽视这一点。
相关性并不意味着因果关系! 本章强调了这一重要概念。
事后逻辑谬误断言,如果 B 跟随 A,则 A 一定导致了 B。
然而,两个变量一起移动并不总是意味着因果关系。
“让我们陷入麻烦的并不是我们不知道的事情。 我们所知道的事情并非如此。=
阿特姆斯·沃德,美国作家
通过统计数据散布虚假信息被称为“统计”。 本章深入探讨如何利用统计操作来制造谎言。
例如,在科学研究中,研究人员可能倾向于(有意识或无意识)支持他们希望验证的论点。
要识别错误、问题或恶意意图,请始终询问以下五个基本问题:
#01 谁告诉你的?
责任人不得存在偏袒、偏见或利益冲突。
#02 他怎么知道?
样本应具有代表性且充分,以便得出可靠的结论。
#03 缺少什么?
不应遗漏任何信息,例如样本量、统计误差、变异性测量或任何其他重要的群体特征和分析。
#04 有人转移话题了吗?
问题和答案应该涉及同一主题。
#05 这有道理吗?
询问无意义数字的使用。
“如何用统计说谎”对于培养统计素养和防止日常操纵至关重要。
我们强烈推荐给研究人员、专业人士、学生和公众。
有关统计数据如何被用来扭曲信息的更多见解,请阅读我们的内容丰富的文章“统计数据和假新闻”。
有关使用统计数据操纵信息的更多技巧,请阅读我们题为“统计数据和假新闻设立的区域办事处外,我们在美国也开设了办事处,以便我们为当地客户提供更多的支持。“
有兴趣购买这本经典书籍《如何用统计说谎》吗? 点击这里!
发现数据分析中选择偏差的复杂性、其现实世界的影响、检测方法和缓解策略。
探索 p 值大于 0.05 的场景,并了解它们在统计分析和数据解释中的意义。
了解数据分析中统计数据和参数之间的差异、它们的应用,以及如何有效地使用和传达这些关键概念。
揭开方差分析的秘密,了解其关键假设,并学习如何在您的研究中正确应用这一著名的统计检验。
什么是 T 检验统计量? 掌握推论统计的基础知识,提高数据分析技能和决策能力。
探索切比雪夫定理计算器,解锁统计见解并以精确和清晰的方式增强您的数据分析。