郝淑穎
(荊楚理工學院 生物工程學院,湖北 荊門 448000)
在利用試驗數據進行統計推斷時,經常會遇到數據的缺失,如進行壽命試驗時有一些高可靠性產品的存在,要獲得全部失效數據必然要經歷很長的試驗時間.為了節省試驗費用,通常采用截尾試驗來獲得缺失數據樣本,因此基于缺失數據的統計推斷是一個重要且有意義的問題,如在文獻[1-6]中羅倩,趙志文等討論了在部分缺失數據樣本下兩個總體分布的參數估計和假設檢驗問題.Topp-Leone分布是一種具有有界支撐的連續單峰分布,可用于刻畫元器件的壽命現象.目前已經有很多統計學研究者研究了這個分布的統計推斷問題,并產生了一些研究成果.在文獻[7]中GHITANY等研究了該分布的一些統計性質.文獻[8-9]中MIRMOSTAFAEE等基于記錄值討論了Topp-Leone分布的Bayes統計推斷問題.文獻[10-11]中GEN等給出了Topp-Leone次序統計量的遞推關系.文獻[12-14]中FEROZE等在完全樣本或者截尾樣本下研究了Topp-Leone分布形狀參數的極大似然估計和Bayes估計.
本文將進一步討論在數據缺失樣本下Topp-Leone 分布的參數估計問題,計算出參數的極大似然估計,并在不同的損失函數下得到了參數的Bayes和E-Bayes估計,且對各種估計進行分析.
設樣本觀測值服從Topp-Leone分布,其概率密度函數為
f(x,θ)=2θ(1-x)(2x-x2)θ-1,0
(1)
假設對上述Topp-Leone分布進行n次獨立觀測,每次以概率P觀測到樣本值,以概率1-P丟失樣本值.用(Xi,δi),i=1,2,…,n表示來自Topp-Leone分布總體的觀測值,其中Xi表示來自Topp-Leone分布總體的第i個樣本觀測值,并且第i個樣本觀測值丟失,記δi=0,否則記δi=1.
下面求未知參數θ的極大似然估計.基于樣本觀測值(Xi,δi),i=1,2,…,n,則似然函數為
(2)
(3)
由極大似然估計的性質可得到如下定理.
在前面我們討論了參數的點估計,有時要估計參數在某一范圍中取值的情況,這樣就是參數的區間估計.由第1部分的結論可以得到如下定理.
定理3 如果θ的極大似然估計由式(3)給出,則θ的置信度1-α的近似置信區間為
因此
于是θ的置信度1-α的近似置信區間為
下面討論參數的假設檢驗問題.
H0:θ=θ0?H1:θ≠θ0.
1) 對于假設檢驗
2) 對于假設檢驗H0:θ>θ0?H1:θ≤θ0.
給定顯著性水平α(0<α<1),則檢驗的拒絕域為
3) 對于假設檢驗H0:θ<θ0?H1:θ≥θ0.
在貝葉斯統計推斷中“先驗分布”和“損失函數”是參數估計精度的兩個重要方面,最常用的是平方損失函數,由文獻[15] 有下面的引理1.
引理1[15]設x=(x1,x2,…,xn)是來自某總體密度函數f(θ,x)的樣本觀測值,θ為其未知參數,則有
是未知參數θ的E-Bayes估計(expected Bayesian estimation),其中π(a,b)是超參數a,b在集合D上的聯合密度函數.
(4)
若取θ的先驗分布為伽瑪分布,其概率密度函數為
(5)
這里超參數a>0,b>0.
由式(4)、(5),并根據Bayes公式可得到θ的后驗密度為
(6)
證明1)在平方損失函數下θ的Bayes估計為
根據定義1 ,則θ的E-Bayes估計為
3) 由2)的證明可得θ的Bayes估計為
θ的E-Bayes估計為
表1 參數估計的均值、均方誤差及置信區間的平均長度
可以看到,參數θ的各種估計的均值都很接近真值.隨著樣本量n的增加,估計值之間越來越接近,置信區間的平均長度和均方誤差都逐漸變小.參數的Bayes估計和E-Bayes估計的均方誤差都要小于極大似然估計的均方誤差,且在樣本量較小時它們之間的差距更加明顯.