确定样本量的三种方法(匹配设计的病例对照研究的样本含量估计)


确定样本量的三种方法(匹配设计的病例对照研究的样本含量估计)

上一篇文章我们探讨了成组设计的病例对照研究的样本含量估计,这篇文章我们将聚焦于匹配设计的病例对照研究的样本含量估计,从基础知识、问题与数据、问题分析以及PASS软件操作等方面为大家进行详细讲解。

一、基础知识

1. 基本原理:

匹配设计的病例对照研究通过根据某些特征如年龄、性别等,对病例和对照进行匹配,使两组在这些潜在混杂因素上更具可比性,从而更精确地探究研究因素与疾病之间的关系。在估算连续变量的样本量时,我们需要考虑匹配因素对研究效率的影响,以及如何在控制混杂因素的确保有足够的样本量来检测病例组和对照组在连续变量上的差异。

2. 设计特点:

病例对照研究为了控制某些混杂因素的影响,会按照某些特征对病例和对照进行一对一或一对多的匹配,然后比较匹配组中的病例和对照的情况。

3. 影响样本量的因素:

(1)检验水准()、检验效能(1-)、预期组间差异()和总体标准差():这些因素与成组设计类似,对样本量有影响。值越小、检验效能越高、总体标准差越大,所需样本量越大;预期组间差异越大,所需样本量越小。

(2)匹配因素与研究因素的关联程度:若匹配因素与研究的连续变量关联较强,匹配可以有效减少组间变异,提高检验效率,从而减少样本量需求。反之,若关联较弱,匹配可能带来过度匹配问题,反而降低研究效率,增加样本量需求。

(3)匹配比:即病例与对照的匹配比例,如1:1、1:2等。随着匹配比的增加,每个病例对应的对照数量增多,能更好地控制混杂因素,但同时也会增加研究成本和样本量计算的复杂性。

4. 估算方法:

以1:1匹配为例,计算公式为...,其他匹配比有相应的修正公式。

5. 注意事项:

(1)选择匹配因素时,应选择与研究因素和疾病结局都相关的因素,避免选择因果链上的中间变量,否则可能导致过度匹配。

(2)确保匹配的准确性和有效性,避免错配现象。

(3)匹配设计在分析数据时,需采用专门的分析方法,如条件logistic回归等。

(4)在实际研究中,可能需要根据情况调整样本量,如考虑失访率、数据缺失等因素。

二、问题与数据

以某研究者探讨吸烟与肺癌关系的研究为例,考虑年龄可能与肺癌有关,因此设计一项按年龄1:1匹配的病例对照研究。选择肺癌患者为病例组,并为每个病例选择一个年龄差异在3岁以内的非肺癌患者作为对照组。预期OR=2.0,对照组吸烟率约为20%,=0.05,=0.10。如何估计样本量?

三、对问题分析:

研究者的设计是匹配设计的病例对照研究。在病例对照研究中,想要探讨的危险因素称为。计算样本量需要拟定检验水准和检验效能1-,以及根据既往文献或预试验的结果给出相关参数。

四、PASS软件操作:

1. 选择相应的计算模块。在PASS软件中选择“Proportions→Two Correlated Proportions→Test (Inequality)→Test for Two Correlated Proportions in a Matched Case-Control Design”。

2. 填入相关参数。包括、、M(匹配比)、P0(对照组中的比例)、OR(比值比)和Phi(病例与对照之间的危险因素相关程度)。

3. 运行软件并解释结果。PASS软件会给出样本量计算结果、参考文献等。关注Cases (N)即病例组样本量和Controls Per Case (M)即对照组样本量。

四、撰写结论:

本研究为匹配设计的病例对照研究,主要观察的因素为吸烟。根据年龄进行1:1匹配。根据既往文献和设定的参数,利用PASS 11软件计算得到病例组和对照组的样本量。考虑到研究中的无应答率和问卷合格率,最终共需样本量为XX例。

欢迎大家关注我,学习更多统计分析方法。还提供单个问题答疑咨询、答疑咨询年度会员等付费服务,选购视频课程还可获得课程相关主题内容的答疑服务。


确定样本量的三种方法(匹配设计的病例对照研究的样本含量估计)