检验假设(即无效假设)Ho:OR=1,双侧备择假设HA:OR≠1。统计量X2MH呈自由度为1的X2分布。 分层分析法举例:某地进行了一次食管癌病因的病例对照研究,共调查病例200例,人群对照776例。现分析其中饮酒与食管癌的联系,结果如表4-3。 表4-3 饮酒与食管癌的联系 饮酒史 病倒数 对照数 合计 饮 酒 171 381 552 不饮酒 29 395 424 合计 200 776 976 OR=6.11 χ2=84.29 可见饮酒与食管癌有强联系,但已知吸烟与食管癌也有强联系。为了分析饮酒与食管癌显示出的强联系是否可能与吸烟有关,或吸烟是否可能是一个混淆因子,可采用分层分析:按是否吸烟分为两组,再分析饮酒与食管癌的联系,结果见表4-4。 表4-4 饮酒与食管癌在吸烟与不吸烟者的联系 不吸烟者 吸烟者 饮酒史 病倒 对照 合计 饮酒史 病倒 对照 合计 饮 酒 69 191 260 饮酒 102 190 292 不饮酒 9 257 266 不饮酒 20 138 158 合计 78 448 526 合计 122 328 450 OR=10.3 χ2=53.99 OR=3.70 χ2=24.62 计算ORMH ,先用公式(4-3)计算 再用公式(4-4)作χ2检验: χ2MH=76.84 ρ<0.00000001。用附录五公式(附式5-1)计算ORMH的95%可信限,上限为8.09,下限为3.81。用附录五(一)的Woolf法作各层ORi的齐性检验,结果说明各层间的OR差异显著,来自同一总体的可能性很小,所以ORMH不能说明吸烟、饮酒与食管癌的联系,因此是无意义的。这种齐性检验可同时检验各因素间是否存在交互作用。本例的计算过程及结果解释见附录五(一)的计算实例。 以上关于分析方法的介绍,都是以暴露有无和疾病有无这种最简单的两分变量为例。实际情况常较此复杂,有必要时读者可参考专书。 多个混淆因子如用分层法同时控制多个混淆因子,则分成的层数将很多(例如,年龄分5组,性别分2组,吸烟与否2组,就已有20层),在样本含量不是特别大的情况下,每层的人数将剧减,而且各层中病例数与对照数或与未暴露者数目的比例波动很大,可能出现只有病例而无对照或相反以及人数为零的层,以致统计效率降低,信息丢失。这时应采用多元分析法解决问题。现在借助电子计算机及软件包,已可使过去用手工计算很难进行的几种方法成为普及。多元分析法在样本不是极大的情况下可同时控制多个变量的作用而不影响研究效率。现在应用十分广泛的是多元logistic回归分析。 (2)匹配数据的分析:本书只以1:1匹配的数据为例。数据分析的程序基本上与非匹配数据相同。 1)检验病例与对照的暴露比例是否有显著差别:就每一对中的病例与对照的暴露史而言,可能有四种组合情况(频数记为f ,有暴露记为下标1,无暴露记为下标0):①病例有暴露,对照也有暴露(记为f11);②病例有暴露,对照无暴露(f10);③病例无暴露,对照有暴露(f01);④病例与对照都无暴露(f00)。只有这四种组合,而且四者必居其一。设四种情况的对子各有f11,f10,f01,f00对,则全部数据可用一张四格表归纳(表4-5)。每格的数字代表对子数。 设暴露与患病无联系,即H0:OR=1,x2检验用下式: 表4-5 配对数据的四格表 病倒 对照 合计 暴露 未暴露 暴 露 f11 f10 f11+f10 未暴露 f01 f00 f01+f00 合计 f11+f01 f10+f00 N (式4-5) 自由度=1。此式适用于较大样本。 2)比数比及其可信限的计算:只有病例与对照暴露史不相同的对子(f10与f01),才能提供关于暴露与疾病联系程度的信息。 OR=f10/f01 (f01≠0时) (式4-6) OR可信限可用附录五公式(附式5-1)计算。 实倒1:有一项调查心肌梗死与高血压的关系的病例对照研究,用1:1匹配设计,以收缩压(SBP)≥18.6kPa(140mmHg)为高血压。数据如表4-6(虚构)。 表4-6 高血压与心肌梗死的病例对照研究
对 照
SBP≥18.6 SBP<18.6 SBP≥18.6 15 60 75 SBP<18.6 35 40 75 合计 50 100 150 用公式(式4-5)作卡方检验: 用公式(式4-6)计算OR: OR=60/35=1.71 用附录五公式(附式5-1)计算OR的95%可信限: 计算结果说明高血压与心肌梗死有中等程度的联系(OR=1.71)。高血压患者患心肌梗死的危险度较非高血压者约高出70%。OR的可信限不包括1,说明OR值有显著性。 (3)人群归因危险度:在一定条件下,从病例对照研究结果可以算出人群归因危险度,详见“队列研究”。 (三)病例对照研究的偏倚 偏倚问题将在第七章详细讨论。三种主要偏倚,即选择偏倚、信息偏倚、混淆偏倚,在病例对照研究都可能发生。特别是选择偏倚,在医院为基础的病例对照研究更易发生。又因作为一种回顾性调查,特别易受回忆偏倚(信息偏倚的一种)的影响,因为暴露史主要须依靠被调者的回忆,但一些复杂烦锁的问题(如膳食史)很难正确回忆;一些被认为可能与患病有关的暴露史,病例易高估,对照易低估。如果调查员知道谁是病例谁是对照以及病因假设,则易于在调查时态度不同、重点不同,产生诱导作用,从而造成偏倚,称为调查员偏倚。这些都是在设计、执行和分析时应加预防和处理的。 实例2:女青年阴道腺癌(vaginal adenocarcinoma)和母亲妊娠期服用已烯雌酚关系的研究。美国波士顿妇产科医生AL Herbst注意到1966~1969年期间在该市Vincent纪念医院诊断了7例15~22岁的女青年患阴道腺癌。这本是一种罕见的女性生殖系统癌症,发病年龄一般在50岁以上。现在这种明显的时间和地区的聚集性以及大为提早的发病年龄,引起了Herbst医生探究其病因的兴趣。 初步调查结果发现这7例均无使用阴道局部刺激物的历史,除1例于发病后结婚外均否认有性交史。为详细了解这些病例从胚胎期至发病前的情况以及她们的母亲在妊娠期的情况,从而寻找病因线索,Herbst决定作一次病例对照研究。 另外,同时期在另一所医院也诊断了一例20岁的阴道腺癌病人。这样,共有8个病例。每例匹配4个对照。从病例出生的医院保存的出生记录中选择与病例在同等级病房中前后不超过5天出生的女婴作为对照候选人,优先选择与病例出生时间最近者为对照。由经过训练的调查员用调查表对病例、对照以及他们的母亲进行访问调查。 在列入比较的许多因素中,多数在两组间无显著差别。例如,出生时母亲的年龄、母亲吸烟史、哺乳史及X线照射史等。但有3个因素显示显著差别:母亲以前流产史,此次怀孕时阴道出血史,此次妊娠期曾用过已烯雌粉(DES)。三者的关系是:因有前两个因素存在才用DES治疗。尤以DES服用史差别最为明显(x2=23.22, p<0.00001)。 通过8个病例与32个对照的病例对照研究,Herbst等得出结论,母亲在妊娠早期服用DES可使其在子宫内受暴露的女儿以后发生阴道腺癌的危险性增加。 实际上,在妊娠期用过DES的妇女很多,但她们的女儿发生阴道腺癌的危险并不高。病例对照研究结果提供的不是暴露招致的绝对危险度(发病率)而只是相对危险度。 从方法选择上,DES与阴道腺癌的联系问题,还可用历史性队列方法研究:收集在病例诊断前15~25年间曾在妊娠期用过DES的妇女的住院病历,再选择合适的、未用过DES的妇女的病历作为对照组。对两组妇女的女儿们进行随访,确定阴道腺癌的发生率是否有差别。因为这是一种罕见病,这样研究虽然理论上可行,但实际做起来困难很多。至于用前瞻性队列法研究罕见病的病因,虽然理论上也可行,但实际上做不到。因此,可以看出:病例对照法是研究罕见病的最经济最快捷的途径,常常是唯一实际可行的途径。Herbst等只用8个病例与32个对照所完成的病例对照研究就是一个有意义的例子。 (责任编辑:泉水) |