?

基于傾向性得分匹配法的平均處理效應的自助法推斷

2019-09-20 02:35非,吳
統計與信息論壇 2019年8期
關鍵詞:平衡性傾向性樣本量

彭 非,吳 浩

(中國人民大學 a.應用統計科學研究中心;b.統計學院,北京 100872)

一、背景介紹

平均處理效應(average treat effect,以下簡稱ATE)是評價處理對結果的影響效應的度量,目前廣泛應用于生物制藥的藥效評價,醫院治療方案的療效評估及公共政策的影響研究等領域。根據反事實結果概念,每個個體只可能具有接受處理的反事實結果Y(1),或者接受對照的反事實結果Y(0),則實際觀測值Y可表示為:

Y=ZY(1)+(1-Z)Y(0)

其中Z取1表示處理,取0表示對照,那么ATE的估計為:

K-近鄰匹配法是估計ATE的常見方法,但Abadie和Imbens指出在固定匹配個數時,基于協變量歐氏距離匹配法的ATE估計是有偏估計[1]。為此,Abadie和Imbens提出了基于非參數序列回歸法的偏差校正匹配估計法[2]。然而,歐氏距離等基于協變量距離的匹配法無法規避維數災難問題,為此,通常采用傾向性得分法代替協變量距離以實現高維協變量情形的匹配[3]。同時,劉鳳芹和馬慧指出傾向性得分匹配法具有對誤差分布不敏感,以及當公共支撐域較大時對具體匹配方法選擇不敏感的優點[4]。Abadie和Imbens證明了基于傾向性得分匹配法的ATE估計的大樣本性質,但是方差的漸近表達式形式復雜,程序實現難度較高,且據作者了解目前還沒有現成程序包能夠直接實現其正確方差估計式,這極大影響了傾向性得分匹配法在實際工作中的使用[5]。

當估計量的理論方差表達式較復雜時,自助法(bootstrap)是方差估計的有效替代方法[6]。但是,Abadie和Imbens通過例子證明了當固定匹配個數時,由于第i個個體的被匹配次數KM(i)在bootstrap樣本中不是原樣本的一致估計,因此經典的自助法無法直接用于固定匹配個數時匹配法下ATE的統計推斷,該結論對固定匹配個數時的任何匹配法(不論是協變量的距離匹配法還是傾向性得分匹配法)均成立,并且猜測可以嘗試wild bootstrap[7]。Otsu和Rai在固定匹配個數的協變量歐氏距離匹配法場合下證實了關于wild bootstrap的可行性猜測,并將其權重條件進一步放寬,提出加權自助法并證明了所得估計量的分布收斂于Abadie和Imbens所得估計的分布[8]。但是對于傾向性得分匹配法如何正確使用自助法目前還沒有文獻指出。

二、ATE的識別條件及傾向性得分匹配法

Rosenbaum和Rubin提出在如下強可忽略假設下,ATE可以被識別。

假設1(強可忽略假設):

(1)給定X時,(Y(1),Y(0))與Z條件獨立;

(2)傾向性得分p(X)=Pr(Z=1|X)滿足0

τ=E[E(Y|Z=1,X)-E(Y|Z=0,X)]

(一)ATE的匹配法估計

ATE的估計關鍵在于利用觀測樣本估計反事實結果,其中Yi(0)的M-最近鄰匹配法估計可分別表示為:

其中,M表示固定的匹配個數,JM(i)表示個體i的匹配的指標集,其定義為:

JM(i)=

I[|p(Xi)-p(Xk)|≤|p(Xi)-p(Xj)|]≤M}

則ATE的M-最近鄰匹配法估計為:

其中

表示第i個個體被匹配的次數。

(二)傾向性得分

三、基于傾向性得分匹配法的ATE的自助法推斷

(一)加權自助法

(1)

則根據H?rdle和Mammen,可以采用wild bootstrap。因此,加權自助法的研究思路是從wild bootstrap出發,對其權重進行一般化進而得到一般的加權自助法。

(2)

(3)

其中

假設2:

(2)對i=1,2,…,n有

假設2涵蓋了幾種常見的加權自助法,如非參數自助法,貝葉斯自助法以及wild bootstrap等,因此本文方法具有一定普適性[12-13]。

假設3:

(2)E[Y|Z,p(X)]關于θLipschitz連續,其中θ為傾向性得分模型p(X,θ)中的參數。

下述定理1證明了在傾向性得分匹配場合,“OR”法的加權自助估計的分布弱收斂于傾向性得分配法的估計的分布,因此式(3)可用于固定匹配數時傾向性得分匹配法下ATE的統計推斷。

定理1(1)篇幅限制,定理證明過程從略。有興趣讀者請來函向作者索取。:在假設1、假設2及假設3下,對?r∈R有:

因此,若記:

諸如此類的情況,讓這些殯儀館工作的青年人,在專業得到工作單位認同和重視的情況下,感受到來自社會的職業聲譽壓力。

(二)經典自助法

四、數值模擬

以下模擬是為了展示兩種方法在有限樣本下的表現,并設置了兩種模擬情境:首先是在固定數據生成機制下結果隨著樣本量n和匹配數M變化的情況;其次是在固定匹配數M時,不同數據生成機制下結果隨著樣本量的變化情況。

第一種模擬情境的數據產生機制如下,協變量X1,X2獨立同分布于U(0,1),殘差e~N(0,1),響應變量為:

第二種模擬情境的數據產生機制效仿了“OR”方法,即:

ξi~U(0,1),ζi~N(0,I3),εi~N(0,0.22)

Xi=(X1i,X2i,X3i)′

Xji=ξi|ζji|/‖ζi‖,j=1,2,3

p(Xi)=0.15+0.7‖Xi‖

Zi=I(p(Xi)≥vi),vi~U(0,1)

響應變量為:

Y=m(‖X‖)+2Z+e,e~N(0,0.22)

其中m(·)分別取為:

m1(x)=0.15+0.7x

m2(x)=0.1+x/2+exp(-200(x-0.7)2)/2

m3(x)=0.4+0.25sin(8x-5)+

0.4exp(-16(4x-2.5)2)

M-近鄰取值M=5,bootstrap次數為500,樣本量n分別取100,500,1 000,2 000。漸近結果,wild bootstrap,naive bootstrap與bootstrap的計算與第一種模擬情境的計算方式相同。

兩種模擬情景的結果依次見表1和表2,其中“SSE”,“SE”和“95%CP”分別表示1 000次蒙特卡羅模擬下ATE匹配法mi(·)估計值的樣本標準差,ATE標準差估計值的平均值和95%置信區間覆蓋率。

表1 1 000次蒙特卡洛模擬結果

表2 1 000次蒙特卡洛模擬結果

五、居民人均年收入的實證研究

本部分分別采用第三部分提出的兩種自助法以分析性別、婚姻狀況、健康狀況、抑郁狀況、勞動合同狀況、是否黨員和地區這7個因素分別作為處理變量時對收入的平均處理效應的估計。

(一)數據來源與描述

本部分數據來自2016年中國綜合社會調查數據(簡稱為CGSS),調查覆蓋了全國28個省/市/自治區的478村莊,調查內容涉及受訪者的性別、年齡、工作年限、教育程度、婚姻狀況、健康狀況和2015年全年收入等信息。本部分把2015年全年收入作為感興趣的結果變量,并記為Y;感興趣的處理變量分別為性別、婚姻狀況、健康狀況、抑郁狀況、勞動合同狀況、是否黨員與地區,并依次記為Zj,j=1,2,…,7;年齡,工作年限和教育年限視為協變量并分別記為Xi,i=1,2,3。下面將分別研究處理變量Zj對收入影響的處理效應。

接下來將北京市、天津市、河北省、山東省、江蘇省、上海市、浙江省、福建省、廣東省、海南省視為東部地區,其余省份為非東部地區。刪去了收入為0的樣本,并將原始收入數據除以1 000后再對其取自然對數。經過處理后樣本量為8 693,具體變量說明見表3。

表3 變量說明

(二)分析與結果

表4 三種方法的ATE估計

圖1 處理變量Z1匹配后協變量X1的平衡性檢測①

① 其中匹配前、后的左側均是對照組的箱線圖,右側均為處理組的箱線圖。下同。

圖2 處理變量Z1匹配后協變量X2的平衡性檢測

圖3 處理變量Z1匹配后協變量X3的平衡性檢測

根據箱型圖和密度函數圖像在匹配前后的對比,協變量的平衡性有很大改變,特別是X2在匹配前后的變化尤為明顯。圖1說明協變量在根據Z1匹配后基本實現平衡,因此Z1的匹配法的結果具有一定可信度。其它處理變量的匹配后協變量的平衡性檢測結果由于圖像數量過多而在此處略去,僅通過展示處理變量Z1的平衡性檢測結果以說明該檢測的必要性。

根據表4,男性,已婚,身體健康,簽有勞動合同,是黨員以及東部地區對收入有正的影響效應,而抑郁對收入有負影響效應。具體而言,例如,男性的四種方法的ATE估計均是0.206,即男性年收入比女性將平均高出6 763.53元(不對原樣本中收入做對數處理的結果);健康狀況的ATE的bootstrap估計是0.159,即身體健康者的年收入比不健康者平均高出8 164.46元(計算方式同上男性情形);而抑郁的ATE的wild bootstrap估計是-0.211,即抑郁者的年收入比非抑郁者平均低3 586.43元。

六、結論與展望

通過模擬表明,兩種方法與SSE及傾向性得分配法的漸近結果很接近并且在幾種模擬情景中表現穩定,而對觀測樣本直接采用經典自助法(naive bootstrap)則通常差強人意。實證部分得出了幾個常見社會因素如性別、婚姻狀況、健康狀態等對收入的影響效應,所得結果雖不能全面解釋影響收入的原因,但為分析某單一因素對收入的影響提供了方法。

重點介紹了ATE的自助法推斷,同樣可將其推廣至ATT(Average treatment effects for the treated)的方差及置信區間的推斷。關于ATT的傾向性得分匹配法估計的大樣本結論及協變量歐氏距離匹配法的加權自助法可分別參考Abadie和Imbens[5]及Otsu和Rai。

猜你喜歡
平衡性傾向性樣本量
一種基于進化算法的概化理論最佳樣本量估計新方法:兼與三種傳統方法比較*
公眾對我國足球歸化運動員的情感傾向性——基于大數據的微博情感分析
醫學研究中樣本量的選擇
基于模糊數學法的阿舍勒銅礦深部巖體巖爆傾向性預測
超重/肥胖對兒童腸套疊空氣灌腸復位的預后影響:傾向性評分匹配分析
樣本量估計及其在nQuery和SAS軟件上的實現*——均數比較(十一)
樣本量估計及其在nQuery和SAS軟件上的實現*——均數比較(十)
分析我國體育新聞報道中的傾向性文獻綜述
電力系統安全穩定標準研究
基于熵值法的山西省煤炭行業生產使用平衡性分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合