王越等
1.似然距離
為了對廣義部分線性模型作統計推斷,假設:對于響應變量Y密度函數的積分,可以關于參數β在積分號下求倒數??蛇M一步得到響應變量Y關于興趣參數β的得分函數(β)、觀察信息陣-(β)和Fisher信息陣J(β)的表達式。
又l()在處的Taylor展開可得:
l()≈l()+()(-)+(-)()(-)
≈2{()(-)+(-){-()}(-)}。從而可得到()=0,-()≈J()。因此似然距離可近似地表示為LDi(β)≈(-)()(-)
2.曲率
設原模型為M受到擾動變為M(ω)。l(θ)為模型M中隨機變量 Y的對數似然函數。模型M(ω)相應的對數似然函數為l(θ/ω)。根據Cook(1986),可取LD(ω)=2[l()-l()]
容易得出LD(ω0)=0,并且LD(ω)在ω0處的一階導數也為0,因此 LD(ω)在ω0附近的變化情況應取決于二階導數,即曲率。為了定義曲率,我們把方程z=LD(ω)改寫為如形式:π:α=,α在ω0處沿k方向(k=1)的影響曲率可表示為C(θ)=-2kk,=△。其中=,為l(θ)關于θ的二階導數,且以上各量均在 (,ω0)處計值。易見,Ck大的值有較強的局部影響。記kmax為使得Ck達到最大的方向,由于很難判斷Cmax為多大才表示模型的擾動影響很大,而kmax的意義比較明確,并且通過散點圖(i,(kmax)i)可以很明顯的看出影響最大的分量,從而識別出是否從在異常值。
3.擾動模型
②單個解釋變量擾動模型:對于廣義部分線性模型考慮只有一個解釋變量擾動的情形。
假設只擾動矩陣X=(x1,...,xn)T的第t列Xt,即Xt擾動為Xtω=Xt+stω,其中st為Xt的某種模。ω0=(0,...0)T表示模型沒有擾動。 [科]