?

縱向多分類數據的廣義估計方程分析

2024-04-12 23:42尹長明代文昊尹露陽
應用數學 2024年1期
關鍵詞:小類大類定理

尹長明,代文昊,尹露陽

(廣西大學數學與信息科學學院,廣西 南寧 530004)

1.引言

設響應變量Y是分成k類的屬性數據(categorical data),協變量X是×1維向量.Y屬于第r類記為Y=r,其概率記為μ(r) :=P(Y=r|X),r=1,···,k.顯然,=1,所以只需對μ(r),r=1,···,q(=k-1)進行建模.

如果數據分成的k類沒有大小順序,比如分析人們出行對交通工具(可以是汽車,火車或飛機)選擇得到的數據,可以用下面多項(multinomial)logit模型[1]:

其中γr0,γr分別是截距和回歸參數向量,T表示向量或矩陣的轉置.如果數據分成的k類有大小順序,比如分析某種疾病的變化(分為變好,不變或變壞)得到的數據,可以用下面累積(cumulative)logit模型[1]:

其中F(x)=exp(x)/(1+exp(x)),γ是回歸參數向量,-∞=δ0<δ1<···<δq<δq+1=∞是門限(threshold)值.

有時,響應變量的取值分成t大類,不同大類之間的性質不一樣,同一大類內的不同小類之間性質類似.這時建??煞謨刹?two step),第一步對大類之間建一個模型,第二步分別對每一大類的不同小類之間建一個模型.例如Morawitz &Tutz[2]分析的商業調查數據,分為“知道”和“不知道”兩大類;“知道”又分為“增加”和“減少”兩小類.Fahrmeir &Tuts[1]分析的風濕疾病的數據分為“大有好轉”,“好轉”,“無變化”,“惡化”,“大有惡化”五小類,顯然“大有好轉”和“好轉”是一大類,“無變化”是第二大類,“惡化”和“大有惡化”是第三大類(t=3).第一步對三大類建個模型,第二步對“大有好轉”和“好轉”建一個模型,對“惡化”和“大有惡化”再建一個模型.

不失一般性,第j大類數據記為Sj={sj-1+1,···,sj},其中s0=0,st=k.第一步,對不同大類之間若用累積Logit模型建模,就得

其中-∞=δ0<δ1<···<δt-1<δt=∞.第二步,第j(j=1,···,t)大類若用多項logit模型建模,就得

下面我們將累積多項logit模型寫成廣義線性模型的形式.記

當S1={1,2},S2={3},即k=3,t=2,就得到Morawitz和Tutz[2]分析商業調查數據所用的兩步Logit模型.這時

其中(η(1),η(2))T=ZTβ,ZT=diag[(1,XT),(1,XT)],βT=(δ1,γT,γ10,γT1).

當S1={1,2},S2={3},S3={4,5},即k=5,t=3,就得到文[1]中分析類風濕疾病數據所用的模型.這時

在生物醫學和經濟學中,需要對同一個個體(如病人)進行跟蹤觀測,所得數據是相關的,假設不同個體觀測數據是獨立的,這樣的數據稱為縱向(longitudinal)數據或集團(clustered)數據,在經濟上稱為面板(panel)數據)[3].記(Yij,Xij)是第i個個體的第j次觀測值,由前面的定義知,對應的有yij=y(Yij),Zij=Z(Xij),ηij=等等,i=1,2,···,n,j=1,2,···,m.記

其中A(ηij)=diag(σT(ηij)).

類似文[4-6],我們定義方程

2.主要結果

在本文中,C,C1,C2,···代表與樣本容量n無關的正常數,在不同地方可以表示不同值.為了得到我們的主要結果,需要如下假設條件.

定理2.1若條件(C1)-(C4)成立.則

2) 若條件(C5)也成立,則對任意單位向量αn有,

定理2.2若條件(C1)-(C5)成立,則存在使(2.1)成立且

其中a是l×1向量,我們有下面結果.

定理2.3若條件(C1)-(C5)和假設H0成立,則存在使(2.1)成立且

注2.3顯然定理2.1-2.3對本文模型的特殊情形經典(binary)Logit模型也成立,所以我們推廣了文[6]的結果.

這就是Lindeberg-Feller中心極限定理中Feller條件[7].

3.主要結果的證明

為了證明第2節的主要結果,我們還需要如下一些引理.

定理2.1的證明由向量值函數中值定理[9]知,

由條件(C3),(3.3),(3.4),(C2)知對所有i ≥1和n ≥1有

由(3.12),引理3.1,可知(2.1)成立.

對任意單位向量an,由引理3.3,引理3.4,假設(C5),可得,

因而定理2.3得證.

4.結語

若再對響應變量加上大于二階矩一致有界的假設,用類似的方法可證本文的結果對響應變量是多維的一般隨機變量也成立.文[5]也研究了每個個體觀測次數m=mn發散的情形,所以mn和協變量的維數pn都發散的縱向數據模型的漸近性質,值得進一步研究.

猜你喜歡
小類大類定理
J. Liouville定理
基于CiteSpace 的中醫軟堅散結法的可視化分析
單座物流車專利布局分析
汽車智能駕駛領域專利布局分析
A Study on English listening status of students in vocational school
談大類招生背景下音樂教育課程的創新與發展
“三共定理”及其應用(上)
浙江配電網物資標準化研究與應用
化學學科大類人才培養研究
Individual Ergodic Theorems for Noncommutative Orlicz Space?
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合