逻辑回归中的样本量
|

逻辑回归中的样本量:简单的二元方法

本文将指导您计算样本量 简单二元 Logistic 回归.

我们将利用流行且免费的软件 G*功率,这是用于此目的最常用的之一。

我们曾经 灵感 在意识到许多基于 G*Power 的样本量计算的在线教程不准确后,我创建了这篇文章。

选择逻辑回归分析

下载并安装 G*Power 后,打开它并选择样本量计算选项 逻辑回归 点击进行分析 测试:相关性和回归:Logistic 回归选项卡。

一尾还是二尾?

接下来,输入以下内容 参数:

In 尾巴, 选择 一个 对于单尾测试或 用于双尾测试。

A 一尾的 检验适用于特定的备择假设,例如“X 值的增加对应于事件发生的更高概率。

A 双尾 检验适用于一般的备择假设,例如“X影响事件Y,”没有最初的方向区别。

您的假设基于您所在领域的现有知识。 如果不确定,请选择 两个(双尾).

显着性水平

显着性水平 (α) 表示当原假设为真时拒绝原假设并导致 I 类错误的概率。

通常,α 设置为 0.05 or 0.01。 例如,α 为 0.05 表示,得出结论存在显着关系的风险为 5%,而实际上却没有。

统计权力

- 测试功率 (1 – β) 是拒绝原假设(如果错误)的概率,有效控制 II 类错误 (β)。

可接受的值通常范围为 0.800.99。 较高的测试功率是优选的,但也会增加所需的样本量。

其他解释变量的 R² (X)

由于简单的二元逻辑回归模型只有一个自变量,因此将该值设置为 .

❓ 对数据分析感到困惑?

我们的综合指南将使其一目了然
点击了解更多!

变量 X 分布

点击 变量 X 的分布类型,它是模型中的自变量或预测变量。

选择 二项式 对于二元变量, 正常 对于连续定量变量,以及 泊松 对于离散变量。 仅在必要时使用其他可用的发行版。

试验研究?

最后四个参数需要 人口估计 来自试点研究、类似研究或理论计算。

如果可能的话,使用来自 试验研究,正如我们将在这里演示的那样。

估计平均值和标准差

输入变量 X 的试验研究数据的平均值和标准差 变量的总体均值 X和 人口标准差 分别为变量 X 参数。

初步分析

通过a获取最后两个参数 初步 使用试点研究数据进行简单逻辑回归分析。

对于我们的演示,我们将使用免费且易于使用的 聚苯乙烯 软件。 任何 软件 可以使用能够运行逻辑回归的方法。

单击此处了解如何使用 PSPP!

赔率

- 比值比 表明暴露与结果之间的关联并测量效应大小。

执行一个 初步分析 利用 PSPP 中的试验数据来获取 比值比 值(变量 X 的 Exp(B),本例中为 1.48)并将其输入到 G*Power 中。

H1 下 y = 0 的概率

最终参数为 当原假设 (H1) 为真时因变量 (y = 0) 出现的概率,即当自变量(X)的系数等于0时,并且模型仅包含截距。

要计算该值,请输入 常数(截距)估计 B 从上一步转换为以下 Excel 公式:

=EXP(B)/(1+EXP(B))

对于我们的例子:

=经验值(-1.85)/(1+经验值(-1.85))

= 0.1355

结语

在 G*Power 中输入所有参数后,单击 计算 即可得到计算确定的样本量!

在我们之前关于 例子,确定估计优势比所需的样本量是从目标人群中随机抽样的 97 个个体。

通过遵循这些 步骤 使用 G*Power,您可以有效地计算简单二元 Logistic 回归分析的适当样本量。

本篇 工艺 使您能够优化研究设计、最大限度地减少错误并提高研究结果的有效性。

此外, 理解 不同参数在确定样本量方面的作用有助于全面掌握逻辑回归的整体情况。

想要了解如何在 G*Power 中计算样本量以进行最关键的推理分析?

不要错过 免费 我们最近推出的数字图书样本!

在里面,您将掌握独立或配对 t 检验的样本量计算; 单向或双向方差分析,有或没有重复测量,以及混合模型; 简单、多元线性和逻辑回归等等。

单击此链接并发现它所提供的一切: 应用统计学:数据分析.

在我们的社交网络上访问我们

Instagram 上的每日帖子!

类似的帖子

发表评论

您的电邮地址不会被公开。 必填项 *