萬文龍,羅潔,許皓
(西華師范大學數學與信息學院,四川 南充 637009)
信息幾何是用微分流形或用黎曼流形來研究概率分布的學科,該學科的主要思想是亞馬里(Amari)和永岡(Nagaoka)[1]提出的以費歇爾信息矩陣作為黎曼度量來建立黎曼流形,而概率分布的全體參數被視為該流形的坐標系統[2]。統計流形是信息幾何的核心內容,被證明具有由費歇爾信息矩陣給出的唯一黎曼度量和對偶仿射聯絡。
伽馬分布是統計學的連續概率函數[3],是概率統計中非常重要的分布,許多分布都直接或間接地與之相關。麥凱拉(Mc Kay)和斯科(SC)[4]提出了二元Mc Kay型伽馬分布,本文基于四參數二元Mc Kay型伽馬分布,在其尺度參數和形態參數的基礎上增添了位置參數[5-22]。為了更好地研究四參數二元Mc Kay型伽馬分布的實際應用和其他統計性質,本文嘗試從信息幾何的角度研究其幾何性質。
本文計算了四參數二元Mc Kay型伽馬流形的信息矩陣及其逆矩陣、克里斯托弗符號和黎曼曲率張量,并給出了子流形的黎曼幾何結構等。
統計流形M=的α-聯絡由下式給出:
其中g=<,>是以ξ為局部坐標系的費歇爾信息矩陣,并且α-聯絡系數由下式給出:
當α=0時,上式為黎曼聯絡系數。此外,統計流形的黎曼曲率張量由下式給出:
定義2.1 設(U;xi) 是M的一個局部坐標系,則其曲率張量的分量為:
Ricci曲率張量的分量為:
從而有數量曲率R為:
以及截面曲率K(u,v)為:
若二元變量(X,Y)服從四參數二元Mckay型伽馬分布,其聯合密度函數為:
其中,β≤x<y,a>0,p>2,q>0,β是位置參數,伽馬函數為:
關于X和Y的邊緣密度函數分別為:
X與Y的協方差與相關系數為:
相關系數ρ隨p,q變化的圖像如圖1所示。
圖1 相關系數隨p 和q 的變化圖
定理3.1 統計模型
是一個四維統計流形,稱為四維二元Mc Kay型伽馬流形,其自然坐標系為ξ=(a,p,q,β)。
定理3.2 在自然坐標系ξ=(a,p,q,β)下,四維二元Mc Kay型伽馬流形的費歇爾信息矩陣G( ξ )為:
其中ψ(p)=?!?p)/Γ(p) ,?!?p) 是伽馬函數的導數。
證明根據其似然函數:
則有:
從而有:
證畢。
由上面結果可知費歇爾信息矩陣的行列式為:
其圖像如圖2所示,可以看到,隨著p和q的增大,極速減小,其極限值為0。
圖2 行列式隨p 和q 的變化圖
通過計算可以得到費歇爾信息矩陣G (ξ)的逆矩陣G-1(ξ) ,其分量如下:
由(1)式,四維二元Mc Kay型伽馬流形的黎曼聯絡系數分別為:
其余未列出的分量為0。
定理3.3 在自然坐標系ξ=(a,p,q,β)下,流形M的曲率張量的分量由下式給出:
在(3)式中,取a=1,則有:
定理4.1在自然坐標系ξ=(p,q,β)下,統計流形M1的費歇爾信息矩陣[gij]和它的逆矩陣[gij]分別如下:
定理4.2 在自然坐標系ξ=(p,q,β)下,統計流形M1的黎曼聯絡系數分別為:
其余未列出的分量均為0。
當p=3時,統計模型
是一個三維流形,其自然坐標系為ξ=(a,q,β)。
定理4.3 在自然坐標系ξ=(a,q,β)下,統計流形M2的費歇爾信息矩陣[gij]和它的逆矩陣[gij]分別如下:
定理4.4 在自然坐標系ξ=(a,q,β)下,統計流形M2的黎曼聯絡系數分別為:
當q=1時,統計模型
是一個三維流形,其自然坐標系為ξ=(a,p,β)。
定理4.5 在自然坐標系ξ=(a,p,β)下,M3的費歇爾信息矩陣[gij]和它的逆矩陣[gij]如下:
定理4.6 在自然坐標系ξ=(a,p,β)下,M3的克里斯托費爾符號如下:
當β=0時,統計模型
是一個三維流形,其自然坐標系為ξ=(a,p,q)。
定理4.7 在自然坐標系ξ=(a,p,q)下,統計流形M4的費歇爾信息矩陣[gij]和它的逆矩陣[gij]如下:
定理4.8 在自然坐標系ξ=(a,p,q)下,統計流形M4的黎曼聯絡系數分別為:
定理4.9 在自然坐標系ξ=(a,p,q)下,統計流形M4的曲率張量分量為
本文給出了基于信息幾何的四參數二元Mc Kay型伽馬流形,并計算了相關幾何結構,包括費歇爾信息度量、黎曼聯絡和曲率張量等。此外,本文還給出了四參數二元Mc Kay型伽馬流形的四個子流形的相關幾何結構。二元伽馬分布在地震預測和水文學上有廣泛的應用,通過對其幾何結構的研究,可以在相關概率預測模型上做優化與改進。