本文将指导您计算样本量 简单二元 Logistic 回归.
我们将利用流行且免费的软件 G*功率,这是用于此目的最常用的之一。
我们曾经 灵感 在意识到许多基于 G*Power 的样本量计算的在线教程不准确后,我创建了这篇文章。
下载并安装 G*Power 后,打开它并选择样本量计算选项 逻辑回归 点击进行分析 测试:相关性和回归:Logistic 回归选项卡。
接下来,输入以下内容 参数:
In 尾巴, 选择 一个 对于单尾测试或 二 用于双尾测试。
A 一尾的 检验适用于特定的备择假设,例如“X 值的增加对应于事件发生的更高概率。“
A 双尾 检验适用于一般的备择假设,例如“X影响事件Y,”没有最初的方向区别。
您的假设基于您所在领域的现有知识。 如果不确定,请选择 两个(双尾).
显着性水平 (α) 表示当原假设为真时拒绝原假设并导致 I 类错误的概率。
通常,α 设置为 0.05 or 0.01。 例如,α 为 0.05 表示,得出结论存在显着关系的风险为 5%,而实际上却没有。
- 测试功率 (1 – β) 是拒绝原假设(如果错误)的概率,有效控制 II 类错误 (β)。
可接受的值通常范围为 0.80 至 0.99。 较高的测试功率是优选的,但也会增加所需的样本量。
由于简单的二元逻辑回归模型只有一个自变量,因此将该值设置为 零.
点击 变量 X 的分布类型,它是模型中的自变量或预测变量。
选择 二项式 对于二元变量, 正常 对于连续定量变量,以及 泊松 对于离散变量。 仅在必要时使用其他可用的发行版。
最后四个参数需要 人口估计 来自试点研究、类似研究或理论计算。
如果可能的话,使用来自 试验研究,正如我们将在这里演示的那样。
输入变量 X 的试验研究数据的平均值和标准差 变量的总体均值 X和 人口标准差 分别为变量 X 参数。
通过a获取最后两个参数 初步 使用试点研究数据进行简单逻辑回归分析。
对于我们的演示,我们将使用免费且易于使用的 聚苯乙烯 软件。 任何 软件 可以使用能够运行逻辑回归的方法。
- 比值比 表明暴露与结果之间的关联并测量效应大小。
执行一个 初步分析 利用 PSPP 中的试验数据来获取 比值比 值(变量 X 的 Exp(B),本例中为 1.48)并将其输入到 G*Power 中。
最终参数为 当原假设 (H1) 为真时因变量 (y = 0) 出现的概率,即当自变量(X)的系数等于0时,并且模型仅包含截距。
要计算该值,请输入 常数(截距)估计 B 从上一步转换为以下 Excel 公式:
=EXP(B)/(1+EXP(B))
对于我们的例子:
=经验值(-1.85)/(1+经验值(-1.85))
= 0.1355
在 G*Power 中输入所有参数后,单击 计算 即可得到计算确定的样本量!
在我们之前关于 例子,确定估计优势比所需的样本量是从目标人群中随机抽样的 97 个个体。
通过遵循这些 步骤 使用 G*Power,您可以有效地计算简单二元 Logistic 回归分析的适当样本量。
本篇 工艺 使您能够优化研究设计、最大限度地减少错误并提高研究结果的有效性。
此外, 理解 不同参数在确定样本量方面的作用有助于全面掌握逻辑回归的整体情况。
想要了解如何在 G*Power 中计算样本量以进行最关键的推理分析?
不要错过 免费 我们最近推出的数字图书样本!
在里面,您将掌握独立或配对 t 检验的样本量计算; 单向或双向方差分析,有或没有重复测量,以及混合模型; 简单、多元线性和逻辑回归等等。
单击此链接并发现它所提供的一切: 应用统计学:数据分析.
掌握广义线性模型分布和链接函数选择,以增强统计建模和分析。
通过我们关于预测建模实用 Python 应用程序的基本指南,了解随机森林在数据科学中的潜力。
了解弗洛伦斯·南丁格尔如何在克里米亚战争期间使用数据可视化和饼图彻底改变医疗保健。
揭示决定系数与相关系数之间的差异及其在数据分析中的关键作用。
深入研究数据分析的基础,探索测量的四个基本级别:名义尺度、序数尺度、区间尺度和比率尺度。
掌握统计分析中同方差和异方差的概念,以进行准确的预测和推断。