?

面板有序響應模型多種參數估計方法的仿真比較

2019-09-20 02:36陳永偉莊佳強
統計與信息論壇 2019年8期
關鍵詞:假設檢驗參數估計面板

陳永偉,莊佳強

(1.浙江工商大學 經濟學院,浙江 杭州 310018;2.中南財經政法大學 財政稅務學院,湖北 武漢 430073)

一、引言及文獻綜述

在應用研究中,我們經常會涉及到需要去分析一些個體的主觀評價及其影響因素的作用機制問題。典型的例子包括居民對自身幸福感(生活滿意度)的主觀評價、對宏觀經濟穩定性程度的判斷、對企業債券的信用評級以及金融分析師對備選股票的推薦順序等[1-4]。但是,在這些問題的主觀評價中,個體異質性常常會發揮重要的作用。兩個外在條件基本相似的個體會因為對生活采取積極或消極偏好的不同,而對自身的生活滿意度評價出現較明顯的差異。因此,為了獲得研究結果的可靠結論,在計量方法上能夠包含個體異質性的面板有序響應模型在這類問題的研究中就呈現出優勢,也得到了廣泛使用。同時,應用研究的需求本身也引起計量經濟學家對面板有序響應模型參數估計方法的深入討論。到目前為止,現存文獻有關該模型的參數估計至少存在DvS、BUC、OMD和CML等多種方法[5-7]。那么,對于應用研究者而言,這些可供選擇的估計方法有無差異?研究者應該使用哪種方法來獲得所關心問題的穩健估計結果?本文希望通過蒙特卡羅仿真實驗技術,通過比較各種主要方法在有限樣本以及大樣本條件下參數估計以及基于參數估計過程在后續假設檢驗階段的表現結果,從而為實際應用研究者在方法論的選擇上提供建議。

從計量方法來看,當我們感興趣的結果變量具有排序結構時,如在滿意度評價中,我們常用序數1、2、3、4、5來表示評價結果非常不滿意、不太滿意、一般、比較滿意和非常滿意的等級差異,這時的模型參數估計會存在特殊困難。這種困難主要表現在兩個方面:一是極大似然方法會成為估計有序變量模型的主要方法,但是由于似然函數通常是待估計參數的非線性形式,因此很難直接給出待估參數的具體解析表達式,這也意味著在計算上,需要使用重復迭代直至收斂的算法(如牛頓方法)來獲得模型參數的最終估計結果?,F存文獻中也有部分研究為了避免這種參數估計的復雜性,同時也為了獲得參數估計結果在均值意義上的直觀經濟含義,采用傳統的回歸方法,將有序結果變量看成是普通的連續型隨機變量,使用普通最小二乘法來估計模型參數[8-9]。這種處理方法的缺點是忽視了有序響應變量模型所能特定揭示出的事件發生概率的經濟含義。二是在影響評價結果的機制分析中,為了包容個體異質性對評價結果產生的差異化影響,同時考慮到這種異質性也有可能與模型中的其他解釋變量存在相關性,構建固定效應面板有序響應模型是現階段研究所采用的主要方法,但同時這也給模型參數估計帶來較大困難,主要原因是在固定效應中,反映個體異質性的參數會隨著個體數量而增加,由此導致使用極大似然方法并不能獲得模型參數的一致估計結果,這即是面板模型中的冗余參數問題[10]。Greene指出,在時間較短的面板中,因冗余參數導致的估計偏誤會非常明顯[11]?,F有文獻也有部分研究假定個體異質性與模型中的解釋變量服從已知的特定相關關系,在這一約束下可以將固定效應面板有序響應模型轉化為相對容易估計的隨機效應結構形式[12]。Jansen提出了隨機效應面板有序響應模型的極大似然參數估計理論[13]。

對于個體異質性與模型中的解釋變量服從未知的相關性結構時,Das和van Soest提出,可以首先將有序結果變量的多種類別劃分成兩種類別[5]。例如,將滿意度評價中的非常不滿意、不太滿意、一般、比較滿意、非常滿意五種類別合并成不太滿意及以下、一般及以上兩種類別,這樣可以將面板有序響應模型轉換為面板二元選擇模型,進而通過構造面板二元選擇模型的充分統計量,使用條件極大似然方法估計模型參數。由于充分統計量不依賴于反映個體異質性的參數,因此這種方法可以獲得模型參數的一致估計結果。并且,由于對有序結果變量的類型劃分存在多種不同的方式(如也可以將滿意度評價劃分為一般及以下、比較滿意及以上兩種類型),相應地,每一種劃分都對應于一套不同的參數估計結果,Das和van Soest建議使用最小距離方法將所有不同結果合并成最終的參數估計結果(本文簡記這種方法為DvS估計)[5]。與DvS方法不同,Baetschmann等認為,既然每一種劃分都是對真實參數的估計,那么在每一種劃分下估計的參數結果就應該相等,因此他們建議使用受約束的條件極大似然方法來獲得模型參數的一致估計結果(本文簡記這種方法為BUC估計)[6]。Muris指出,在將有序結果變量轉化為二元選擇變量的過程中,除了可以按照上述方法進行劃分之外,也可以補充使用其他方法進行劃分,例如,對于樣本第一期的觀測值,按照評價等級是否高于“不太滿意”而劃分為二元選擇變量,對于第二期觀測值則按照評價等級是否高于“比較滿意”而劃分為二元選擇變量,這樣可以更多地利用有序結果變量的信息,從而在理論上也可以獲得更有效的參數估計結果(本文簡記這種方法為OMD估計)[7]。但是,當樣本較小時,Muris也提出,我們并不需要使用最小距離法將針對每種劃分下所獲得的參數估計合成最終的一致估計結果,而是只需要將各種劃分下的似然函數進行簡單相加,然后使用一次條件極大似然的方法來獲得參數的最終估計,這樣可以避免在使用最小距離法過程中因計算維度過高的海塞矩陣而產生估計偏誤(本文簡記這種方法為CML估計)[7]。

那么,以上這些在理論上均能獲得一致估計的方法在實際應用中有無差異?特別地,那些在漸近理論上更加有效的估計方法在后續的假設檢驗階段是否也具有更明顯的優勢?鑒于個體異質性與模型解釋變量存在未知的相關性結構這種設定形式在實際應用中更具有普遍性及廣泛的使用價值,因此本文旨在使用蒙特卡羅仿真實驗技術,通過比較DvS、BUC、OMD和CML四種方法在有限樣本及大樣本條件下參數估計與假設檢驗的表現,從而為實證研究的方法論選擇提供建議。本文研究具有較明顯的理論及實踐指導意義,特別是,在面板有序響應模型的研究中,Ferrer-i-Carbonell和Frijters被發現提出了一種錯誤的條件極大似然估計方法[14],在后續研究中卻被廣泛使用[15-16],由此就更加突出了本文研究工作具有必要性及其重要意義,因此也體現了研究的貢獻性。

二、面板有序響應模型設定及其四種主要估計方法

(一)模型設定

對于具有一般形式的面板有序響應模型,可以將其設定為:

(1)

(2)

(3)

其中,(τ0,τ1,…,τJ)被稱為切點參數,并且τ0和τJ通常被標準化為-和+。模型(1)、(2)及(3)因此構成了固定效應面板有序響應模型。在有關主觀評價的應用研究中,潛在變量經常被解釋為個體i在時期t所獲得的經濟效用,yit是依據所獲得的效用水平給出的評價等級[17]。因此,對于給定的個體異質性αi及解釋變量xit,觀察到評價結果yit=j的概率可以表示為:

P(yit=j|xit,αi)

(4)

相應地,模型的整體似然函數可以表示為:

(5)

其中,I(yit=j)是示性函數:若yit=j,則I(yit=j)=1;否則,I(yit=j)=0。根據式(5)給出的似然函數可以看出,當樣本內T相對較小而N趨向無窮時,模型待估參數αi的數量會隨著樣本而增加,這即是面板模型中的冗余參數問題,由此也意味著即使從漸近理論上看,使用極大似然方法也不能獲得模型參數的一致估計量。

(二)DvS估計方法

(6)

(7)

因此,基于式(6)給出的充分統計量,我們可以構造模型的條件對數似然函數形式:

(8)

(9)

(三)BUC估計方法

(10)

(四)OMD估計方法

di,π={di,t,π=I(yit≤π(t)),t=1,2,…,T}

(11)

(12)

(13)

需要注意的是,在將有序響應變量轉換為二元選擇變量時,針對我們給出的第一種方法(按照時不變的規則)轉換有序變量,例如對于任意時間t,均令π(t)=π(1),那么此時有∑t(ht-dt)τπ(1)=0?;谶@一特征,上述充分統計量式(12)可以進一步表示為:

pi,π(d|β,τ)=

(14)

(15)

(16)

(17)

(五)CML估計方法

(18)

這種簡潔的估計方法被稱為是CML估計。

三、四種估計方法的仿真結果比較

為了比較DvS、BUC、OMD及CML四種估計方法在小樣本以及大樣本條件下的真實表現,本文設定統一的面板有序響應模型及其數據生成過程,并在這一相同的數據生成過程下綜合比較以上四種方法在模型參數估計和假設檢驗兩個階段的表現結果。

(一)數據生成過程

假設面板有序響應模型的樣本數據按照如下方式生成:

(19)

(20)

本文設定的面板有序響應模型具有一般的結構形式,與普通的有序響應模型或logit模型相比,若本文設定的模型沒有包含面板數據結構,那么模型(19)、(20)首先會退化成有序響應模型形式。但是,由于有序響應模型通常被應用于主觀評價問題的分析,而在這些問題中,個體異質性會對評價結果產生重要影響,因此從這個意義上看,面板有序響應模型具有更好的應用針對性。進一步,若本文設定的模型沒有包含面板數據結構并且可觀察變量yit的結果只有兩種類型,那么此時面板有序響應模型可退化為logit模型的形式。

針對面板有序響應模型,現有參數估計方法及其漸近理論的推導都是基于T固定而N趨向無窮的條件,因此在數據生成中,我們設定N=100,200,500來模擬小樣本的條件,設定N=1 000,2 000,5 000來模擬大樣本的條件。在樣本不斷增大的條件下,T的取值都相對固定。我們將重點分析在每一種樣本條件下,以上四種參數估計方法對系數β1和β2的估計,以及基于估計結果在假設檢驗階段的不同表現??紤]到每次仿真生成樣本數據并使用上述四種方法估計模型都需要耗費大量時間,因此在重復生成數據并估計模型時,我們將重復實驗的次數設定為100次。

(二)參數估計的仿真結果比較

表1報告了當樣本較小時,基于100次重復實驗估計的系數β1和β2的均值,同時也報告了參數估計值對真實值的標準偏差,列于表中括號內。從整體上來看,即使在樣本較小的條件下,使用BUC、CML和DvS方法獲得的參數估計值與真實值都表現出較好的接近程度,估計結果具有準確性。相對而言,由OMD方法獲得的估計值與真實值存在較大的偏差。這也說明,雖然從漸近理論的角度看,OMD方法更充分地利用了有序響應變量類別的信息,在理論上可以獲得更有效的估計結果,但是當樣本較小時,由于OMD方法首先需要估計模型(J-1)T次,然后在第二階段使用最小距離估計時至少需要構造(J-1)T維的方差加權矩陣,當(J-1)T在數值上接近或超過N時,由OMD方法獲得的估計結果就表現較差。

表1 小樣本條件下的參數估計結果

從表中估計結果的具體比較來看,在縱向上,當T固定,如T=4,且N=100時,使用BUC、CML、DvS、OMD四種估計方法都會出現程度不同的估計偏誤,相對而言,DvS的估計結果表現要優于其他三種方法。而當樣本從N=100增加到N=500時,上述四種方法的估計值都會出現向真實值逐漸靠近的趨勢,這一現象說明,四種估計方法都存在收斂性的特征。具體來看,當N=500時,我們發現,由BUC、CML和DvS三種方法獲得的估計結果與真實值已經足夠接近,而由OMD方法獲得的估計值表現較差,這也說明OMD方法在收斂速度上可能略慢于其他方法。從估計結果的橫向比較上看,當N固定,如N=100時,隨著時間T變化,由BUC、CML和DvS三種方法獲得的估計結果沒有表現出明顯的趨勢,但是由OMD方法獲得的估計結果在T增加時會逐漸惡化,主要原因在于,OMD方法依賴于時間T的變化,因為在T增加時,參數估計中需要構造的方差加權矩陣的維數(J-1)T會快速增加,因此在小樣本下,OMD方法并沒有產生較好的估計結果。

同時將樣本擴大到N=1 000,2 000,5 000,以此分析在大樣本條件下各種參數估計方法的表現。從仿真結果可以看到(1)受限于篇幅,在正文中未報告大樣本條件下的詳細仿真結果,有興趣的讀者可聯系作者索取。,此時OMD方法會較少地受到樣本條件的限制,并且在參數估計上也取得了較好的表現。同時,與BUC和DvS方法相比,OMD估計產生的標準偏差確實要小于其他兩種方法,由此也印證了Muris提出的觀點:使用有序響應變量類別的更多信息,可以獲得更有效的估計結果[7]。另一方面,也可以發現,基于BUC、CML和DvS三種方法產生的系數估計值在大樣本條件下也沒有產生明顯的劣勢。綜合以上在大樣本以及小樣本條件下的表現,我們建議在估計固定效應的面板有序響應模型時,可以選擇使用BUC、CML或者DvS方法。

(三)假設檢驗的仿真結果比較

由于OMD方法在理論上可以獲得更有效的估計結果,也就是說,參數估計量具有更小的漸近方差,那么由此提出的問題是,更小的漸近方差是否會導致在參數的假設檢驗過程更容易拒絕不顯著的原假設,從而形成更準確的檢驗結論?從更廣泛的意義上來看,以上四種估計方法在參數的假設檢驗階段是否存在差異?分析這一問題有助于更加全面地綜合比較各種參數估計方法的優劣。因此,基于這一目標,本文從假設檢驗的顯著性水平(size)和檢驗功效(power)兩個角度進行分析。

1.檢驗顯著性水平的仿真結果比較

首先,仍然按照上述模型(19)和(20)生成仿真樣本數據,并設定待檢驗參數的真實值為β1=0.5,β2=1.5。然后,建立待檢驗的原假設H10:β1=0.5,H20:β2=1.5,分別使用上述四種方法估計模型參數,并建立t統計量。設定檢驗的名義顯著性水平為5%,因此從理論上來看,依據t統計量值而拒絕原假設的實際顯著性水平應該也等于5%。不同的是,每種參數估計方法最終獲得估計值的準確性會不同,并且每種方法計算參數估計量方差的思想也不同。例如,DvS和OMD方法按照最小距離估計思想來計算最后參數估計量的方差,BUC方法按照組群(個體)調整思想來計算穩健的估計量方差,CML方法則直接計算,沒有對估計量的方差做出調整,由此導致基于不同方法所獲得的假設檢驗的實際顯著性水平也會不同。

表2報告了在小樣本條件下,通過100次重復實驗所獲得的關于參數假設檢驗的實際顯著性水平。不難發現,由于OMD方法在小樣本條件下存在較大的參數估計偏誤,因此這種方法在假設檢驗階段也存在非常明顯的水平扭曲現象。例如,當N=100,T=6時,拒絕原假設的實際顯著性水平(假設檢驗犯第一類錯誤的概率)分別為0.93和0.92,即使當樣本從N=100上升到N=500時,假設檢驗的實際顯著性水平仍然有0.34和0.37。同時,也可以發現,雖然CML方法在小樣本條件下具有良好的參數估計結果,但是在對模型參數進行假設檢驗時,這種方法也存在較為明顯的水平扭曲現象。在各種樣本(N和T)的組合下,由CML方法產生的最小的實際檢驗顯著性水平也達到0.34和0.41,與標準的名義顯著性水平5%仍然相差較遠。相對而言,BUC和DvS方法都可以獲得較好的檢驗結果,具體如表2中所示。

表2 小樣本條件下參數假設檢驗的顯著性水平

同時,也將樣本從N=100,200,500放大到N=1 000,2 000,5 000,觀察在大樣本條件下,BUC、CML、DvS和OMD四種方法假設檢驗結果的表現。我們看到,當樣本增大時,例如,當N=5 000時,由OMD方法獲得的拒絕原假設的實際顯著性水平也具有良好表現,結果與名義顯著性水平值都較為接近,這主要是由于在大樣本條件下,OMD方法可以產生有效的估計結果。但是,CML方法在大樣本下仍然存在較為嚴重的顯著性水平扭曲現象,結果與5%的名義顯著性水平都相差較遠,產生這一問題的原因則在于,CML方法在估計模型參數時并未對參數估計量的方差做出調整。另一方面,BUC和DvS方法在大樣本條件下的假設檢驗仍然有較好的表現結果。

2.檢驗功效的仿真結果比較

考察檢驗方法優劣的另一標準是分析該方法在檢驗功效上的表現,因此在仿真模擬中,首先令β1≠0.5(或者是β2≠1.5),生成樣本數據(2)在數據生成中,令β1分別取0,0.1,0.2,0.3,0.35,0.4,0.45,0.55,0.6,0.65,0.7,0.8,0.9等數值,以此觀察在這些取值下,關于β1檢驗功效的變化并繪圖得到圖1(a)。同理,令β2分別取0.2,0.5,0.7,1,1.1,1.2,1.3,1.4,1.6,1.7,1.8,1.9,2,2.2,2.5,觀察在這些取值下,關于β2檢驗功效的變化并繪圖得到圖1(b)。;然后建立原假設H10:β1=0.5(H20:β2=1.5),使用t統計量進行檢驗。那么,從理論上來看,當設定真實參數β1≠0.5(或β2≠1.5)時,拒絕該原假設H10:β1=0.5(H20:β2=1.5)的概率應該趨向于1。因此,較高的拒絕原假設的概率說明該檢驗方法(相應地說明與該檢驗方法相關的參數估計方法)具有較好的表現。圖1(a)報告了在小樣本(N=200,T=4)條件下,隨著參數真實值β1的變化,拒絕原假設H10:β1=0.5的實際概率分布;圖1(b)報告了隨著真實值β2的變化,拒絕原假設H20:β2=1.5的實際概率分布??紤]到CML方法在前述檢驗顯著性水平的分析中具有較差的表現結果,因此在檢驗功效的比較中,我們沒有包含CML方法。

從圖1(a)及1(b)的結果可以看出,當設定的參數真實值在檢驗值的左側時,如β1<0.5或β2<1.5,使用OMD方法獲得的拒絕原假設的檢驗功效要高于BUC和DvS方法,但在檢驗值的右側,如當β1>0.6或β2>1.9時,BUC和DvS方法獲得的檢驗功效要略高于OMD方法。整體來看,當β1和β2的參數真實值偏離0.5及1.5較遠時,使用BUC、DvS和OMD方法都可以獲得非常好的檢驗功效,拒絕原假設的實際概率都趨向于100%。

同時,本文也分析了在大樣本(N=2 000,T=4)條件下,隨著參數真實值β1和β2的變化,拒絕原假設H10:β1=0.5、H20:β2=1.5的實際檢驗功效??梢园l現,此時BUC、DvS和OMD三種方法具有非常相似的檢驗功效,并且三種方法對β1和β2值的變化都具有較大的敏感性,只要真實值偏離待檢驗值(0.5和1.5)的距離在0.1及0.2以上,t統計量的檢驗功效就可以達到100%。

結合以上在檢驗顯著性水平和檢驗功效兩個方面的比較結果,本文認為,BUC和DvS方法的結果要優于其他兩種方法。進一步,將參數估計和假設檢驗兩個階段的比較結論相結合,本文建議,對于固定效應面板有序響應模型可優先使用BUC和DvS參數估計方法。

(a) (b)圖1 小樣本參數β1和β2的檢驗功效分布

四、結論與建議

本文主要對固定效應面板有序響應模型的多種參數估計方法的效果進行仿真比較,所得結果和結論可以概括為:

第一,從參數估計的仿真比較來看,在小樣本條件下,DvS、BUC和CML方法都可以獲得較好的參數估計結果,OMD方法會產生較嚴重的估計偏誤,特別是當樣本的時間維度(T)較大時,由OMD方法獲得的參數估計值會嚴重偏離真實值。在大樣本條件下,以上四種方法都可以獲得漸近一致的估計結果,并且OMD方法估計的參數標準差要略低于其他三種方法。產生以上估計結果的原因在于,OMD方法在估計參數時更加充分地利用了有序響應變量的類別信息,對于固定維數(N和T)的面板有序響應模型,如果有序響應變量的類別共有J類,那么OMD方法總共有(J-1)T種不同方式來利用有序變量的類別信息,因此這種方法在大樣本條件下的估計結果會更有效。但是,當樣本較小時,特別是當(J-1)T在數值上趨向或超過N時,這種方法的估計偏誤也會非常大。相反,DvS和BUC方法只是按照(J-1)種方式部分利用了有序響應變量的類別信息,因此在大樣本條件下只能獲得一致的估計結果,但是在小樣本條件下也會更穩健。CML方法雖然也充分利用了有序響應變量的類別信息,但是在估計參數時,該方法并未對方差估計量做出個體調整,因此也只能獲得一致的估計結果。另一方面,從四種方法適用的前提假設來看,OMD和CML方法要求基于不同期構成的解釋變量的方差矩陣具有正定性,該條件相當于要求解釋變量不能包含一些不隨時間變化的變量(如性別),同時也不能包含時間效應變量,這在一定程度上也限制了OMD和CML方法的應用范圍,而DvS和BUC方法則沒有這種限制。

第二,從假設檢驗的比較結果來看,由于在小樣本條件下OMD方法會產生嚴重的估計偏誤,因此這種方法在假設檢驗的實際顯著性水平上也存在非常顯著的小樣本扭曲現象。當樣本增大時,水平扭曲現象可以得到控制。CML方法由于未對方差估計量做出調整,因此在假設檢驗過程也存在非常嚴重的水平扭曲現象。DvS和BUC方法可以產生良好的檢驗結論,從假設檢驗的顯著性水平和檢驗功效兩個方面看,在大樣本和小樣本條件下,這兩種方法都可以獲得較穩健的檢驗結論。

結合以上參數估計和假設檢驗的比較結果,我們建議,對于固定效應的面板有序響應模型,優先使用DvS或者是BUC方法進行參數估計,并基于估計結果開展假設檢驗工作。

猜你喜歡
假設檢驗參數估計面板
基于新型DFrFT的LFM信號參數估計算法
一種GTD模型參數估計的改進2D-TLS-ESPRIT算法
石材家具臺面板劃分方法
假設檢驗結果的對立性分析
基于自適應參數估計的三軸磁傳感器實時校正方法
MasterCAM在面板類零件造型及加工中的應用
Photoshop CC圖庫面板的正確打開方法
面板塑件凸轂結構優化及模具設計
淺談死亡力函數的非參數估計方法
淺談死亡力函數的非參數估計方法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合