?

醫學觀察性研究設計講座(連載三)

2020-09-26 10:44徐應軍
現代養生·下半月 2020年8期
關鍵詞:關聯人群病例

徐應軍

3.3 研究目的及優缺點

3.3.1 研究目的

3.3.1.1 檢驗病因假設

病例對照研究屬于分析性研究,其主要作用是對描述性研究獲得的病因假設進行檢驗。假設檢驗的基礎是分析因素與疾病之間是否存在聯系,當病例組與對照組某個或某些因素暴露程度不同,如果統計學證明不是偶然機會造成的,那么就認為假設成立,即暴露與疾病有聯系,否則假設不成立,暴露與疾病無聯系。病例對照研究中,當得到假設不成立的結論時具有肯定意義,即因素與疾病之間不存在因果關系;但當假設成立時沒有肯定意義,只能說明二者因果關系在假設的基礎上又進了一步,需要進行前瞻性研究的驗證。

3.3.1.2 篩選危險因素 病例對照研究設計的一個特點是可以同時對多個因素進行分析,首先經過統計學檢驗將那些有統計學聯系的因素篩選出來,再將那些因偏倚造成的虛假聯系和非生物性效應的純數字關系的因素排除,剩余的就是該病的危險因素。篩選危險因素是疾病預防與控制的重要環節。

3.3.1.3 快速發現問題

病例對照研究是從“果”(疾?。┏霭l,探尋過去的“因”,只要有病例存在,收集數據就可分析出結果,甚至當天或當時就可解決問題,因此對于急需探明原因的突發公共衛生事件,病例對照研究是首選方法之一。例如集體性食物中毒時,那些病例食用過,而對照沒有食用過的食物,最有可能是毒物的載體。

3.3.2 優缺點

病例對照研究的優缺點是相對現況研究和隊列研究而言。

3.3.2.1 優點

1)出結果快:病例對照研究調查的事件是已經存在的,如疾病已經確診,不需要等待,節省時間,是快速研究方法之一,在暴發調查、突發事件調查中常用。

2)可行性好:尤其是以醫院為基礎的病例對照研究更加容易組織實施,而且投入相對較少。

3)適用于罕見疾病的研究:病例對照研究是直接找病例作為研究的對象,不像現況研究和隊列研究那樣,從觀察人群中產生,越是罕見的疾病,觀察的人群越龐大,例如在隊列研究中,如果某病的發病率為1/10萬,那么僅僅調查10個病人就需要觀察100萬人,這是幾乎不可能做到的。因此對于某些罕見疾病的研究,病例對照研究可能是唯一的方法。在Herbst經典研究范例中僅用了8個病例,就獲得成功,是典型的案例。

4)探索性:因為病例對照研究可以同時探討多個因素與一種疾病的關系,因此雖為分析性方法,同時可進行病因的探索性研究,即可進行假設檢驗,同時又是進一步假設的基礎。

3.3.2.2 缺點

1)不能計算發病率、患病率、死亡率:病例對照研究的病例和對照是分別選來的,沒有分子和分母的關系,因此不能計算類似發病率、患病率、死亡率等重要指標,不能評價疾病對人群健康的影響及其損害程度。

2)不能證明因果關系的時序性:因為先“果”后“因”的設計,所觀察到的因素與疾病的關系,有可能是由于患病導致的某種暴露的出現,例如在煤礦工人叁期矽肺發病因素的研究中,發現結核病與叁期矽肺關系十分密切,幾乎達到100%,而壹期、貳期矽肺患者較少。對于這個結果出現兩種解釋,一是結核感染會加速矽肺的晉期,由壹期、貳期迅速發展為叁期;另一種解釋是叁期矽肺,肺組織嚴重破壞,更容易感染結核。孰為因果,病例對照研究不能給出答案。

3)出現偏倚的環節較多:由于病例與對照是單獨選來,并非一個完整人群的兩個部分,因此外部影響因素難以完全控制,出現混雜偏倚機會增大;由于獲取信息是回顧過去,數據的準確性和可靠信性難以保障,信息偏倚比較嚴重。

4)不適合人群暴露率低的因素的研究:因素的暴露率低需要的樣本量大。

3.4 研究設計與實施步驟

3.4.1 設計思路及技術要點

3.4.1.1 技術路線

病例對照研究過程的主要環節及流程圖1。

3.4.1.2 技術要點

1)病例與對照選擇:在病例對照研究中,雖然不刻意追求研究對象的代表性,但病例與對照的可比性是必須要保證的。

2)研究因素:病例對照研究的主要目的是篩查危險因素,因此確定研究因素,制定調查表問卷,是病例對照研究的一項重要任務,關系到研究的質量、水平和成敗。

3)偏倚控制:病例對照研究與其他類型的研究方法比較更容易出現偏倚,因此,采取有效措施識別與控制偏倚,保證研究質量,是病例對照研究的關鍵技術。

3.4.2設計內容與實施步驟

3.4.2.1 選題

根據現況調查提出的假設,在查閱文獻的基礎上確定研究的選題。

3.4.2.2 病例選擇

當研究的題目確定下來,病例選擇是病例對照研究的第一步,病例選擇步驟如下:

1)病例來源:以醫院為基礎的病例對照研究是在醫院選擇病例,這種方法選擇病例方便,容易取得病例的配合,通過病歷可以獲得準確的臨床信息,使研究的成本及難度大大降低,但這種病例的代表性差,容易出現選擇偏倚;以人群為基礎的病例對照研究是在社區選擇病例,這種方法雖然選擇病例的難度大,但可以明確源人群(source population)即產生病例的人群,研究樣本有較好的代表性。

在設計時具體選擇哪種方法,要根據研究者的能力和目的,如果不是為了把研究結果推論到一般人群,如果研究者沒有足夠的投入開展人群的研究,可以在醫院選擇病例,這時更多關注的不是代表性,而是病例組與對照組的可比性。

2)病例的定義:病例的定義應該包括疾病的名稱、診斷的標準、時間、地點等信息。定義中使用的診斷標準盡量采用國際或國內通用的標準,便于被他人接受和進行相互比較。

3)納入與排除條件:為了保證入選的病例具有相同的性質,排除特殊因素對病例的干擾作用,需要對病例的一些特征進行限定。另外病例對照研究不一定是對患病的全體進行研究,可以是自己感興趣的某種類型或某個人群,因此也需要對某些因素進行限定,例如患病部位、病理類型、患病時間、并發癥、治療史等,或對非研究因素(外部因素)加以限定,如年齡、性別、民族等。在病因學研究時,病例最好為新發病人。

4)病例選擇程序:即選擇病例的具體方法,如怎樣發現病例、如何核實診斷、由誰確定入選與排除、怎樣確保無遺漏和降低無應答等的具體操作程序。

3.4.2.3 對照選擇

在病例對照研究中,對照的意義十分重要,許多時候選擇對照的難度大于選擇病例。對照的代表性及可比性直接影響研究的結果,從某種意義上講,對照選擇是否合適關系研究的質量和水平。理想的對照應該是能夠代表產生病例的源人群,對照組的危險因素暴露率應該能夠代表源人群的該因素的暴露水平。對照選擇的步驟如下:

(1)對照來源:不同來源的對照,研究的結論是不同的。對照的來源有:

1)醫療機構:以醫院為基礎的病例對照研究,可在產生病例的同一所醫院中選擇確診為其他疾病的患者為對照,這種對照選擇方便,容易實施,但選擇偏倚較大,而且不能代表源人群。因此,在醫院選擇對照時更多關注的是與病例的可比性。

2)社區人群:利用隨機抽樣的方法在社區無該病或健康人群中選擇對照組,這種對照代表性較好,但與病例組的可比性不易控制。

3)病例的鄰居:在病例生活的鄰居中選擇未患該病的人為對照,這種對照可以排除生活環境的混雜影響。

4)病例的親友:將病例的配偶、同胞、親戚、同學、同事中無該病的人選為對照,可以觀察來自環境與遺傳方面的作用。

在實際研究中,對照多在醫療機構中選,而一些大規模的研究選擇人群對照,鄰居和親友對照多用于匹配設計。

(2)對照定義:對照定義包括類別、診斷標準、時間、地點等信息,類別是指健康人或具體哪種疾病的患者,此時對照也必須有明確診斷標準。為了降低選擇偏倚,在一次病例對照研究中可以設置多組對照,例如肺癌的研究,在醫院可以選其他癌癥患者為第一組對照,再選非癌癥疾病患者為另一組對照,分別進行分析;也可以設計在醫院選擇一組對照,人群中選擇一組對照。多組對照設計不僅可以對疾病的危險因素的認識更加深入和全面,而且可以判斷對照有無選擇偏倚。

(3)納入與排除條件:為了保持與病例組的可比性,根據病例的某些要求限定對照組的一些外部特征,如年齡、性別等。另外對照中還應排除那些與所研究的疾病具有共同病因或共同發病機制的疾病,或身患多種疾病的人,或可能因與暴露因素有關的疾病入院的患者,例如肺癌研究,不能以慢性支氣管炎患者為對照。

(4)匹配條件:如果選擇匹配設計,需要制定匹配條件及匹配方式。

(5)對照選擇程序:與病例選擇一樣,對照選擇也需要按照嚴格設計的程序和方法進行,不能隨意或盲目進行。

匹配設計的對照選擇程序是每確定1例病例后,立即根據匹配條件和匹配的個體數,在規定的人群中選擇適合的對照,與病例組成分析的對子。

成組設計的對照是獨立完成的,但是選擇的過程需要設計清楚,最好與病例選擇同步進行。以人群為基礎的病例對照研究,需要按照隨機抽樣的方法選擇對照。如果涉及的人口比較廣泛,可以根據病例的某些特征在限定范圍內抽樣選取,例如在產生病例的周圍,年齡接近、性別相同的人群中抽取。以醫院為基礎的病例對照研究,如果是利用既往住院患者病歷資料,則可以根據病例的數量計算抽樣比例(病例數/總患者數),采取系統隨機的方法選擇對照;如果是利用新住院的病例,則可根據每周獲得的病例數,確定每周選擇對照的數量及方法。

3.4.2.4 樣本量估計

當研究的顯著性水平α和把握度1-β確定后,影響病例對照研究樣本量的因素有①危險因素在人群中的暴露率,暴露率越低,所需要的樣本量越大;②危險因素預期的相對危險度(OR),OR值越大,所需要的樣本量越小。樣本量可以通過公式計算,或查表獲得。成組設計常用的計算公式如下:

式中n為病例組人數,對照組的人數可以等于或大于病例組,當α和β一定時zα、zβ是常數,可由標準正態分布界值表查得。P1是病例組某個因素的暴露率,P0是對照組該因素的暴露率,P0可以根據文獻報道的人群暴露率,或預調查獲得的對照人群的暴露率來估計,P1可根據公式計算。

式中OR(或RR)是某暴露因素的相對危險度(RR)的估計值,也需要根據文獻或預調查獲得。

例如,吸煙與心血管病關系的病例對照研究,預期吸煙者心血管病的OR=2.6,人群吸煙率P0=30%,當α=0.05,β=0.10時:

P1=(2.6×0.3)/(1+0.3×1.6)=0.527

n=2×0.414×0.586×(1.96+1.28)2/(0.527-0.3)2=99(人)

即每組需要調查99人。

3.4.2.5 研究因素選擇

病例對照研究的目的之一是篩選危險因素,因此選擇研究因素、擬定調查表是病例對照研究一個關鍵環節。選擇研究因素的原則是①包括一切可疑的危險因素和可能的混雜因素;②盡可能的采用量化和客觀的測量方法。

3.4.2.6 擬制調查表

將選定研究因素,按照問卷設計要求制定調查表,列入到問卷中的每個因素必須有明確的定義和測量的方法。

3.4.2.7調查與測量方法

調查表中大部分內容是通過調查員詢問病例與對照獲得,部分可通過查閱歷史資料和臨床檢驗、檢測獲得。在調查過程中,病例與對照必需采用同樣的問卷和同樣的方式方法調查,而且每個調查員完成的病例與對照的比例相同,確保調查的質量和數據的準確。如果需要檢驗和檢測收集資料,設計時要確定使用的儀器設施、試劑、操作方法和評價標準;需要查閱歷史資料的,需要明確資料的來源和記錄方法。

3.5 資料的整理與分析

3.5.1 資料錄入與整理

將經過核實和整理過的每份問卷的數據錄入計算機,建立數據文件。

3.5.2 樣本的描述性分析

3.5.2.1 基本特征描述

分別計算病例組與對照組在年齡、性別、職業等人口學特征方面的構成,以及兩組各自疾病的類型、種類、病期等的構成。描述和分析究對象的特征,以便推測本次研究結果的適用范圍。

3.5.2.2均衡性分析

在成組設計時,需要對一些研究因素以外的,而且可能對研究結果產生干擾作用的因素,如年齡、性別等,進行病例組與對照組之間構成的比較分析,如果統計學檢驗,兩組間構成差異無統計學意義,則認為該因素組間均衡可比,該因素對研究結果的影響可以忽略;如果有統計學意義,則認為該因素組間不均衡,可能對研究結果產生一定影響,需要在分析時采取措施加以校正,如分層分析。匹配設計時,主要的因素已經被控制,可以不進行均衡性分析。

3.5.3 危險因素分析

3.5.3.1 擬制分析表格

將要分析的因素按照暴露的有無或暴露的程度分類制定分析表格,成組設計時最基本的分析表格形式見表1。

3.5.3.2 分析內容及指標

1)暴露與疾病是否有關聯:回答暴露與疾病是否有聯系的依據是 檢驗,如果病例組與對照組的暴露程度無統計學差別,則暴露與疾病之間無關聯;如果有統計學意義,且病例組的暴露程度大于對照組,則認為有關聯,暴露是危險的;相反,對照組的暴露程度大于病例組,也認為有關聯,但暴露是有意的。對于四格表資料常用的檢驗公式為:

自由度為1,當 ≥3.84,P≤0.05,則差別具有統計學意義,此時暴露與疾病之間存在關聯,否則不存在關聯。

2)暴露與疾病聯系的強度:如果 檢驗證實暴露與疾病存在關聯,需要估計二者關聯的密切程度,即關聯的強度。表示因素間關聯強度的指標是相對危險度(relative risk, RR),即暴露人群的發病率與非暴露人群的發病率的比值。但是病例對照研究不能計算發病率,因此不能直接計算RR值,這也是病例對照研究的局限性之一。根據數學推理,比值比(odds ratio, OR),即病例組和對照組暴露比值之比,可以替代RR,尤其是疾病的患病率或發病率較低時(小于5%),OR可以在病例對照研究中表示暴露與疾病的聯系強度。

根據表3-7可知,病例組的暴露比值為:

對照組的暴露比值為:

比值比為:

OR的含義與RR值完全一致,表示暴露者的疾病危險性是非暴露者的多少倍,當OR=1時,病例與疾病無關聯;當OR>1時,暴露增加疾病危險性,此時OR值越大,危險性越大,暴露與疾病的關聯強度越大;當OR<1時,暴露減少疾病危險性,此時OR值越小,危險性越低,暴露與疾病的關聯強度越大。當然,是否OR=1,取決于 檢驗,只有當 檢驗有統計學意義時,OR≠1,才能根據OR值的大小判斷關聯的強度。

3)暴露與疾病關聯的范圍:OR值是根據一個樣本對暴露與疾病聯系強度做出的點估計值,進一步可以根據抽樣誤差,進行區間估計,即總體OR值的范圍,通常以95%的可信區間表示。區間估計可以采用Meittnen卡方值法,其公式為:

在此區間內如果包含1,例如0.8~1.2,則暴露與疾病無關聯,否則為有關聯,例如0.6~0.9或1.2~1.8,這個結果與 檢驗完全一致,不會出現矛盾現象。

3.5.3.3 示例

一項關于收縮壓與心急梗死關系的病例對照研究資料見表2。

1)χ2檢驗確定是否有關聯

χ2=(145×249-135×178)×707/(323×384×280×427)=6.95

因為χ2>6.63,P<0.01,具有統計學意義,表明收縮壓與心肌梗死有關聯。

2)計算OR值判斷關聯的強度

OR=(145×249)/(135×178)=1.50

表明收縮壓高于140mmHg的人心肌梗死的危險性是低于140mmHg人的1.5倍,收縮壓是心肌梗死的危險因素。

3)計算OR 95%可信區間

OR95%CI==1.11~2.03

區間不包含1,收縮壓與心肌梗死有關聯。

(未完待續)

猜你喜歡
關聯人群病例
“病例”和“病歷”
本土現有確診病例降至10例以下
我走進人群
奇趣搭配
基于通勤目標人群需求的慢行交通系統構建
基于通勤目標人群需求的慢行交通系統構建
拼一拼
財富焦慮人群
人群中總有一個好看的
智趣
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合