張明珠,岳曉鵬,田 萍
(許昌學院 數學科學學院,許昌 461000)
在概率中總是假定隨機變量之間是相互獨立的,但在很多實際問題中獨立很難滿足,隨機變量之間存在著千絲萬縷的聯系。因此對隨機變量的這種復雜關系,即相依性的研究一直以來是個熱點問題[1,2],對它出現了很多不同指標的刻畫,Kendall’s τ[3]就是其中的一個,它刻畫出了二維隨機變量,對于二維以上的隨機變量卻沒有定義。因此本文擬建立三維隨機變量的和諧定義,即從和諧的角度衡量了三維隨機變量之間的相依關系。借助于連接函數copula得到其計算公式,并且進一步討論得到幾個等價的計算公式。最后討論三維隨機變量和諧度量指標和二維邊緣和諧度量指標的關系,得到它們之間關系的表達式。本文第一部分將介紹copula[3]函數和Kendall’s τ的定義及相關結論;第二部分將建立三維隨機變量的和諧定義,并借助copula函數得到其計算公式;第三部分將具體討論三維隨機變量的 Kendall’s τ與二維邊緣Kendall’s τ的關系。
布,則二維隨機變量的Kendall’s τ的定義為
τ=τX,Y=P((X1-X2)(Y1-Y2)>0)-P((X1-X2)(Y1-Y2)<0)
為了方便研究,這里把二維隨機變量的和諧度量指標Kendall’s τ簡記為 τ(2)或 τ(2)X,Y。
引理1[3]條件同上,若二維隨機變量是連續型的,存在唯一的 Copula 有 H(x,y)=C(F(x),G(y)),則
通過τ的定義可以看出,它從一個側面反映了二維隨機變量X和Y的相依關系。就是用二維隨機變量(X,Y)是一致增或一致減與非一致增或非一致減的差值來表現的它們之間的相依性,是衡量復雜的相依關系的一個度量。其實它是一種序的關系。這里把隨機變量之間的一致增和一致減統稱為一致序,把隨機變量之間的一增一減統稱為不一致序。當然也可通過τ(2)值反映出隨機變量取值的一種變化。因此成為衡量相依關系的一個重要指標。
三維隨機變量的相依性將更加復雜,下面就從和諧的角度給出相依性的一種度量,因為這種定義和二維的幾何意義相同,所以也把它命名為和諧指標。
Copula是連接聯合分布函數與其邊緣分布函數的函數(有的文獻把它稱為連接函數[2])。下面給出Copula的存在性定理。即Sklar定理[3]。
Sklar定理[3]令二維隨機變量(X,Y)的聯合分布函數為H,邊緣分布函數分別為F和G,那么存在一個Copula,有
H(x,y)=C(F(x),G(y)),?(x,y)∈R2
若F和G連續,則C是存在唯一的。相反,如果C是Copula,并且F和G是分布函數,則由上式確定的H是邊緣分布分別為F和G的聯合分布。
下面給出二維隨機變量的Kendall’s τ的定義[3]。
定義1[3]設二維隨機變量(X1,Y1)和(X2,Y2)服從同一分
定義2 設三維隨機變量(X1,Y1,Z1)和(X2,Y2,Z2)具有相同的聯合分布函數H(x,y,z),三維隨機變量和諧指標的定義為
為了和二維和諧度量指標Kendall’s τ區別,記三維和諧度量指標 Kendall’s τ為或 τ(3)X,Y,Z。
因為[P(X1-X2)(Y1-Y2)(Z1-Z2)>0+P(X1-X2)(Y1-Y2)(Z1-Z2)<0]=1,所以定義2可以簡化為
從定義2可以看出,三維和諧度量指標Kendall’s τ是一致序減去不一致序,它與二維的定義的幾何意義是相同的。由于和諧度量指標Kendall’s τ一般是衡量二維隨機變量之間序關系的度量,對三維隨機變量沒有具體的刻畫,而τ(3)也是從序的角度衡量隨機變量之間關系的度量,因此可以說三維和諧度量指標 Kendall’s τ是二維和諧度量指標Kendall’s τ的一種推廣。
三維隨機變量的和諧指標τ(3)同樣可以借助于Copula這個工具來表達。
定理1 設(X1,Y1,Z1)和(X2,Y2,Z2)是兩個同分布的三維連續型隨機變量,且聯合分布函數為H,邊際分布分別為F1(x),F2(x)和 F3(x)。 令 C 為三維隨機變量的聯合分布對應的Copula,有 H(x,y,z)=C(F1(x),F2(x),F3(x)),則
證明:首先
類似的
所以
結論得證。
由定理1的結論知,三維Kendall’s τ也可以完全借助Copula表達。三維Kendall’s τ還有另外一種Copula表述形式,如下定理所示:
定理2 前提條件同定理2,則
對 P(X1<X2,Y1<Y2,Z1<Z2)的證明換一種角度
因為
又因為
因此
所以
結論得證。
通過定理1和2的證明可知,τ(3)的兩種Copula形式是等價的。定理2的結論更適合當Copula C是對稱形式時的使用。當然也可以根據不同的情況,采用不同的形式。通過上述兩個定理的證明,可以得到一個有趣的結論。
結論1 設(X,Y,Z)為任意的三維連續隨機變量,且聯合分布函數為 H,邊際分布分別為 F1(x),F2(x)和 F3(x)。 令 C為三維隨機變量的聯合分布函數對應的Copula,即H(x,y,z)=C(F1(x),F2(x)和 F3(x))。 則
證明:只需利用定理1和2的結論即可得上式。
三維 Kendall’s τ和二維 Kendall’s τ具有一定的聯系,又有一定的差別。那么能否建立三維Kendall’s τ與其自身的二維邊緣Kendall’s τ的關系呢?下面來研究它們之間具有何種關系。
定理3 設(X,Y,Z)為三維連續的隨機變量,聯合分布函數為 H,一維邊緣分布函數分別 F1(x),F2(y)和 F3(x)。令分布函數對應的 Copula 是 C,有 H(x,y,z)=C(F1(x),F2(y),F3(x))則
其中 τ(2)X,Y、τ(2)Y,Z、τ(2)X,Z分別表示隨機變量(X,Y,Z)的二維隨機變量(X,Y)、(Y,Z)、(X,Z)的二維邊緣 Kendall’s τ。
證明:由隨機變量(X,Y,Z)和(X,Y)的關系知,隨機變量(X,Y)的聯合分布函數為 H(x,y,+∞),則聯合分布函數對應的 Copula 為 C(F1(x),F2(y),1)。 由二維 Kendall’s 的定義知,隨機變量(X,Y),(X,Z)和(Y,Z)的 Kendall’s τ分別為
τ(2)X,Y、τ(2)Y,Z、τ(2)X,Z分別是 二 元函數的 積 分表達式 ,因此若想建立 τ(3)和它們的關系,就必須想辦法使 τ(3)這個三重積分表達式變為二重積分表達式。記
Δai=C(u1,u2,ai)-C(u1,u2,ai-1) (i=1,2,…,n)
令 λ=max{Δa1,Δa2,…,Δan},則
同理
所以由定理2得
結論得證。
由定理 3可得到三維 Kendall’s τ與二維邊緣 Kendall’s τ的關系。從而說明,三維Kendall’s τ可以通過它的分量,即二維邊緣Kendall’s來表示,二者之間存在密切的關系。定理4還給出了求三維Kendall’s τ的另一種方法,即可以借助二維邊緣 Kendall’s τ來求 τ(3)。
例 1:設三維連續的隨機變量(X,Y,Z)對應的 Copula[2]形式如下,求 τ(3)。
解:(方法 1)首先利用定理 2 求 τ(3)。
由Copula的對稱性知
(方法 2)由定理 3知,只需要求出二維邊緣 Kendall’s τ即可求得 τ3。
本文從和諧的關系出發度量和刻畫了三維隨機變量之間復雜的相依關系,對解決實際問題提供幫助。并且進一步探討三維隨機變量的和諧指標 Kendall’s τ與二維邊緣Kendall’s τ之間的關系,還建立了它們之間關系的恒等式。這在二維的和諧關系的研究基礎之上又前進了一步,具有較強的理論意義。在今后的研究中,將對它們之間關系作更深入的挖掘。
[1]張堯庭.我們應該選用什么樣的相關性指標[J].統計研究,2002,(9).
[2]Roger.B.Nelsen.Multidimensional Dependency Measures[J].Journal of Multivariate Analysis,2004,89.
[3]Roger.B.Nelsen.An Introduction to Copulas[M].New York:Springer-Verlag,Inc,1999.