第四章　分析性研究- -一、病例对照研究

第四章　分析性研究

　　本书在绪论的“流行病学研究方法”一节中已经介绍过流行病学观察法可分为描述性研究与分析性研究两大类。对于病因研究来说，这两类方法可以看成是研究过程中的两个相互联系、相互补充的阶段。描述性研究结果可以为病因和危险因素的研究提供构成假设（假说）的线索（“病因的概念”将在第七章详述）。所谓病因假设是对某因素与某病因果关系的一种推测性的可检验的解释。检验结果可以支持或不支持原来的假设，也可产生新的假设。

　　例如，“吸烟引起肺癌”曾是一个概念性假设（conceptual hypothesis）但“某年某地某人群中每天吸烟20支以上长达20年的男子患肺癌的危险性显著大于不吸烟或少吸烟的同龄男子”就是一个可形成具体研究问题并可加以检验的假设。可检验假设又称可操作假设（operational hypothesis）。概念性假设通过研究设计而与可操作假设相联系。

　　分析性研究就是检验假设的一类研究方法。但研究结果也可产生新的假设。分析法主要有病例对照法和队列研究法两种，后者又可分为前瞻性与回顾性两种。

一、病例对照研究

　　（一）概说

　　病例对照研究（case control study）是主要用于探索病因的一种流行病学方法。它是以某人群内一组患有某种病的人（称为病例）和同一人群内未患这种病但在与患病有关的某些已知因素方面和病例组相似的人（称为对照）作为研究对象；调查他们过去对某个或某些可疑病因（即研究因子）的暴露有无和（或）暴露程度（剂量）；通过对两组暴露史的比较，推断研究因子作为病因的可能性：如果病例组有暴露史者或严重暴露者的比例在统计学上显著高于对照组，则可认为这种暴露与患病存在统计学联系，有可能是因果联系（图4-1）。究竟是否是因果联系，须根据一些标准再加以衡量判断（详见第七章“病因及其推断”）。所谓联系（associatiom）是指两个或更多个变量间的一种依赖关系，可以是因果关系，也可以不是。

图4-1 病例对照研究示意图

　　例如，对一组肺癌病人（病例组）和一组未患肺癌但有可比性的人（对照组）调查他们的吸烟（暴露）历史（可包括现在吸烟否，过去吸过烟否，开始吸烟年龄，吸烟年数，最近每天吸烟支数；如已戒烟则为戒烟前每日吸烟支数，已戒烟年数，等等）。其目的为通过比较两组吸烟史的差别，检验吸烟（可疑病因）与疾病（肺癌）有因果联系的假设。这就是病例对照研究。

　　实例1.吸烟与肺癌的关系。

　　英国流行病学家A.B.Doll与R.Hill于1948～1952年进行过一项病例对照研究。他们从伦敦20所医院及其他几个地区选取确诊的肺癌1465例。每一病例按性别、年龄组、种族、职业、社会阶层等条件匹配一个对照；对照系胃癌、肠癌及其他非癌症住院病人，也是1465例。由调查员根据调查表询问调查。经分析数据，得到的主要结果有：①肺癌病人中不吸烟者的比例远小于对照组：男性占0.3％，女性占31.7％；而对照组中男性不吸烟者占4.2％，女性占53.3％，差别均很显著；②肺癌病人在病前10年内大量吸烟者（≥25支/日）显著多于对照组；③随着每日吸烟量的增加，肺癌的预期死亡率。（推算出的年死亡率）也升高，例如男性45岁～64岁组日吸烟25～49支者与不吸烟者死亡率之比为2.94/0.14，即前者的率为后者的21倍；④肺癌病人与对照组比较，开始吸烟的年龄较早，持续的年数较多，而病例中已戒烟者的停吸年数也少于对照组中已戒烟者。

　　以后，Hill，Doll，Peto等又用前瞻性队列研究法深入研究，经长达20年（女性经22年）的观察，更加令人信服地提示出吸烟为肺癌的主要病因以及吸烟对健康的其他多种危害。他们的结论已为其他许多研究所证实，成为许多国家提倡不吸烟、限制吸烟及限制卷烟销售政策的科学基础。

　　病例对照研究是最常用的分析流行病学方法。因其需要的调查对象数目较少，人力、物力都较节省，获得结果较快，并且可由临床医生在医院内进行。对于少见病的病因研究，常为唯一可行的方法。但这些优点都是与前瞻性队列研究相对而言的，实际上倘与同等规模的临床研究或实验室研究比较，病例对照研究所费的时间与精力可能更多。

　　本书以临床医学专业学生为主要读者，并不要求他们能掌握或独立应用分析流行病学方法，目标只是了解大概、扩大眼界、培养科学思辨能力，领会科学上获得一个发现或作出一个结论的复杂过程及需要的客观态度。

　　病例对照研究是从现在是否患有某种疾病出发，回溯过去可能的原因（暴露），在时间顺序上是逆向的，即是从“果”推求“因”，所以又称回顾性调查、研究。

　　病例对照研究（及其他类型的流行病学研究）中所谓的暴露（exposure）是指研究对象（病例或对照）具有某种疑为与患病与否可能有关的特征或曾受到某种疑为与患病与否可能有关的因子的影响。所谓特征（characteristic）可以是体质上的、生理上的、也可是心理精神上的；即可以是遗传性的也可以是获得性的；所谓因子（因素）既可以是外界的也可以是机体内在的；特征或因子可以是致病性的，也可以是保护性的（使人免于患病的）。因此，“暴露”是一个涵义广泛的概念。

　　（二）方法

　　1.样本含量的估计　为了研究一种暴露与疾病的关系需要多大一个样本，也就是需要多少个病例和多少个对照，首先取决于4个条件：①人群中暴露者的比例；②假定暴露造成的相对危险度（其涵义详见后文）；③要求的显著性水平；④要求的把握度。从这4个条件估算样本的含量的方法，详见附录五。实际上，样本含量还受许多因素的制约，例如病例和对照的来源、财力、人力、完成期限等。假定只有一定数目的病例与对照可以利用，则一个研究能查出的最小相对危险度是多少？又假定经费数目已限定，则应选多少个病例与对照才能取得最大的把握度，这些都是应考虑的问题。此外，评价交互反应，控制混淆因素，亚组分析，每例多个对照等均影响所需样本的大小。

　　2.病例和对照的来源与选择

　　（1）病例：主要有两种来源：①从医院病人选择，即是从某一所或若干所医院选择某时期内就诊或住院的某种病的全部病例。病例应符合统一的、明确的诊断标准。最好是新发生的（新诊断的）病例。因为一种病的全部病例不大可能都有进入某一所或几所医院的同等机会，能进入的只是其中符合条件（即选择因素）的那一部分，所以不要求能代表某时某地的全部病例，但应要求能代表产生病例的人群，即该人群只要发生该种病例均可能进入该院。这样，结果的普遍性虽受限，但真实性不受影响，而真实性是普遍性的前提。这种研究称为以医院为基础的（hospital-based）病例对照研究；②从某特定人群选择病例，即是以符合某一明确规定的人群在某时期内（一年或几年，视病例发生多少而定）的全部病例或当病例数过多时以其中的一个随机样本作为研究对象。其优点是选择偏倚比前一种来源的小，结论推及该人群的可信程度较高。这种研究称为以人群为基础的（population-based）病例对照研究。

　　（2）对照：设立对照的目的在于估计如果疾病与暴露无联系，则病例组的暴露率可能为多少，也就是为比较提供一个基准。因此，对照与病例在一些主要方面必须具可比性。首先，对照必须从病例所来自的人群选择，对照是有可能成为病例的人，换言之，每一病例在未发病前应该是合格的对照，而每一对照若发病都有可能成为病例组的成员。对照选择是否恰当是病例对照研究成败关键之一。

　　通常的做法是：如果病例组来自某一特定人群，则可以该人群的非病例（即未患该种疾病的人）的一个随机样本作对照；如果病例来自某所医院，则可从同医院同时就诊或住院的其他病例中选择对照。要求对照具有和病例一致的某些特征，即对照与病例有可比性，例如性别、年龄、居住地等；同时要求对照没有患和研究因子与研究疾病有关的其他疾病的可能。例如，研究吸烟与肺癌的关系时，不能以慢性支气管炎病人为对照，因为吸烟同时是这两种病的可能病因；研究胃癌的病因不能以“慢性胃炎”病人为对照，因为这两种病在病因上有密切关系，前者可能是后者在病因链上的一环。上述要求的目的都是减少混淆偏倚。其他来源的对照如病例的邻居、同事、亲属等。各种不同来源的对照要解决的问题不同，都各有其局限性。例如，邻居对照可控制社会经济地位的混淆作用，兄弟姊妹对照是考虑控制早期环境的影响和遗传因素的混淆作用（极端要求为用同卵孪生），配偶对照是主要考虑成年期环境的影响。最常采用的方式是对照和病例都选自同一医院，因为理论上他们都来自该医院所服务的同一人群，而且对两者都可在相同的环境中进行调查，也易于合作。但是由于不同病种的患者入院的机会不同，有可能使本来与某病无关的特征在医院病例中表现出虚假的联系（详见第七章“病因及其推断”）。为了减少这种偏倚发生的可能性，应该选取多种疾病而不是一种疾病的病人作对照。

　　3.病例与对照的配合　设置对照的作用在于平衡除了研究因子（暴露）以外的其他可能影响患病的因素，也就是说如果暴露与所研究的疾病不存在联系的话，病例的暴露比例（率）应该与对照的无显著差别；如果发现显著差别，既然对照与病例在其他有关方面都可比较，因此可以推断患病与否可能是与暴露率的差别有联系。为使两者具可比性，首先可以通过限制选择病例与对照的范围（例如年龄范围、性别、种族等），使有关因子尽可能齐同。病例组与对照组的某些特征不应存在显著差别，即应该均衡。

　　另一个选择对照的重要方法叫匹配（matching，曾译“配比”），又称匹配抽样（matched sampling），就是在安排病例与对照时，使两者的某些特征或变量相一致。具体做法有两种：一种叫成组匹配或频数匹配，即在选择好一组病例之后，在选择对照组时要求其某些特征或变量的构成比例与病例组的一致（即在两组的总体分布一致），例如性别、年龄构成一致，具体做法上类似分层抽样。另一种做法叫个别匹配，就是以每一病例为单位，选择少数几个特征或变量方面与病例一致的一个或几个对照者组成一个计数单位或计数和分析单位。一个病例匹配一个对照的（即1:1匹配）一般称为配对，也就是说由一个病例和一个对照组成对子（pair）为一个计数单位。

　　个别匹配，特别是1:1匹配，最常被采用。理论上，一个病例可以匹配多个对照，但研究证明病例与对照之比超过1:4时，统计效率不会明显增加，但工作量却增大。如果病例与对照来源都充足，调查费用又差不多，则以1:1匹配最合适；如果病例数有限而对照易得，则可采用一个病例匹配几个对照的办法以提高统计效率（例如实例2）。

　　在病例对照研究中采用匹配的目的，首先在于提高研究效率（study efficiency），表现为每一研究对象提供的信息量的增加。匹配后再按匹配的因素进行分层分析，可使每一个匹配层中都有一定数目的病例与对照，不至于因有的层只有病例有的层只有对照而无法对比，不能提供信息。其次，在于控制混淆因素的作用。所以匹配的特征或变量必须是已知的混淆因子，至少也应有充分的理由这样怀疑，否则不应匹配。

　　无论是否采用匹配设计，为控制混淆作用都须在分析阶段用分层、标准化或多元分析，但匹配后再按匹配因素作分层分析可以提高分析的效率，也就是提高了控制混淆因素的效率。

　　但是匹配也要付出代价：匹配增加了寻找对照的速度，以同样的低价也许可以得到更多不匹配的对照，从而扩大样本含量。从这个意义上说，匹配又降低了研究效率。增加匹配项目又会导致可能作为对照者的减少，无法找到可匹配对照的病例只得被剔除；一个项目一经匹配不但使它与疾病的关系不能分析而且使它与其他研究因子的交互作用也不能充分分析。把不必要的项目列入匹配，企图使病例与对照尽量一致，如果匹配的因素与暴露有联系，就可能人为地造成更多的病例与对照暴露史一致的对子，徒然丢失信息，增加工作难度的结果反而是降低了研究效率。这种情况称为匹配过度（over-matching），应注意避免。

(责任编辑：泉水)

搜索

热门标签: