?

基于Bootstrap法的BCa區間二階矯正性質研究

2014-03-13 23:21常振海張德生
關鍵詞:置信區間天水位數

劉 薇,常振海,張德生

(1.天水師范學院數學與統計學院,甘肅天水741001;2.西安理工大學理學院,陜西西安710054)

基于Bootstrap法的BCa區間二階矯正性質研究

劉 薇1,常振海1,張德生2

(1.天水師范學院數學與統計學院,甘肅天水741001;2.西安理工大學理學院,陜西西安710054)

首先,證明了基于Bootstrap法的BCa區間二階矯正性質的相關抽象結論;其次,討論了BCa區間的算法實現,并進行了實證分析。結果表明,在分布左尾較長的情形下,分位數法將正態區間的端點向左調整,BCa法又將分位數區間端點進一步向左調整,區間對稱性也從正態區間的1,調整至分位數區間的0.58和BCa區間的0.38。這些調整均說明BCa區間是最為符合分布特性的估計區間,印證了BCa區間的優良二階性質。

Bootstrap法;BCa區間;二階修正性;二階精確性

近些年來,Bootstrap方法因為其優良的統計性質一直是眾多相關學者關注的熱點之一,如文獻[1-4]從不同領域、不同方面展示了Bootstrap方法及其應用?;贐ootstrap方法的區間估計是其應用方面之一。

依據文獻[5,6]關于BCa區間的高度概括和抽象的結論,我們首先簡化了基于Bootstrap法的BCa區間二階矯正性質。然后討論了BCa區間的算法實現,并進行了實證分析,印證了BCa區間的優良二階性質。

1 二階性質

2 實證分析

實例數據來源于Bootstrap法的發明者Bradley Efron所用數據[5],目的是用抽取的15對樣本數據去估計總體(共82對數據)的相關系數,本文進一步分析了相關系數的BCa置信區間??傮w數據和隨機抽取的樣本數據見圖1。運算基于Matlab 7.5。

圖1 總體數據點和樣本數據點

圖2 Bootstrap法相關系數分布圖

表1 三個非參數Bootstrap法置信區間

從表1能看出,非參數Bootstrap分位數法把上下區間端點分別從1.0574和0.5219調整到了0.9611和0.4619;BCa法則進一步把分位數區間上下分位點分別調整到了0.9413和0.3564。而shape則從1減小到了0.38。為了直觀的說明這些調整過程,把BCa法區間和分位數區間顯示在了圖3中。

圖3 Bootstrap法相關系數分布圖及相關置信區間

從圖3能直觀的看出,BCa法的調整更加符合分布左尾較長這個特性,從而是較適合的估計區間。

3 結論

(1)文獻[5,6]中關于BCa的高度概括和抽象的結論不利于人們對BCa區間優良性質的理解,本文首先從理論上簡化了基于Bootstrap法的BCa區間二階修正性這個性質,它甚至把上端點延伸到了1之外,所以它的這個性質在總體不對稱的時候是十分有害的。因為分布左邊尾巴較長,所以分位數區間的shape=0.58就比1小了很多,應該說比正態區間好多了,而BCa法區間的shape=0.38,比分位數區間的還小,就更加符合分布的左尾較長這個分布特性,應該說是較適合的區間。

(3)需要指出的是,本文證明二階性質時是從總體均值入手證明的。對于更加復雜的總體參數形式或總體參數的函數的二階性質的證明,方法類似,只不過矯正參數a,z0的表達式應該和文中的不一樣。

另外,BCa區間需要再抽樣次數較大才能起到有效的作用[6],一般要在B=2000以上,本文為3000,對于這個不足之處本文沒有過多強調,這個缺陷現在計算機較為發達的今天不是問題,同時也可以考慮ABC法區間[5,7],詳見相關論文。

[1]Shuang Li,Li Hsu,Jie Peng.Bootstrap inference for network construction with an application to a breast cancermicroarray study[J].Annals of Applied Statistics,2013,7(1):391-417.

[2]Xiaofeng Shao,Dimitris N.Politis.Fixed b subsampling and the block bootstrap:improved confidence sets based on pvalue Calibration[J].J.R.Statist.Soc.B,2013,75(1):161-184.

[3]Guosheng Yin.Pearson-type goodness-of-fit test with bootstrap maximum likelihood estimation[J].Electronic Journal of Statistics,2013,7:412-427.

[4]金浩,張思,喬寶明,等.基于Bootstrap的厚尾相依序列持久性變點檢驗[J].數學的實踐與認識,2012,43(13):174-179.

[5]Efron B,Tibshirani R J.An Introduction to the Bootstrap[M].New York:Chapman&Hall Ltd,1993.

[6]DiCiccio J,Efron B.Bootstrap confidence intervals[J].Statistical Science,1996,11(3):189-228.

[7]DiCiccio J,Efron B.More accurate confidence intervals in exponential families[J].Biometrika,1992,79:231-245.

[責任編輯 畢 偉]

Second-Order Correct Properties of BCa Interval Based on the Bootstrap M ethod

LIUWEI1,CHANG Zhen-hai1,ZHANG De-sheng2
(1.School of Mathematics and Statistics,Tianshui Normal University,Tianshui741001,China;2.School of Science,Xian University and Technology,Xian 710054,China)

Firstly,abstract conclusions of second-order correct property of BCa interval based on bootstrap method are simplified.Then,BCa interval algorithm is discussed,and example is used to show how this is done.The results show,in the case of long left tail distribution,standard interval endpoint is adjusted to the leftby percentilemethod,and percentile interval endpoint is further adjusted to the left by BCamethod;The shape about symmetry of standard interval is adjusted from 1to percentile interval's0.58,and further to BCa interval's0.38.These adjustments show that BCa estimation interval is themost consistentwith distribution characteristics,which also confirm excellent second-order properties of BCa interval.

Bootstrap method;BCa interval;second-order correct;second-order accuracy

O212.1

A

1004-602X(2014)04-0008-02

10.3969/J.ISSN.1004-602X.2014.04.008

2014-10-20

國家自然基金(51379173);天水師范學院中青年教師科研資助項目(TSY201204)

劉 薇(1980—),女,河南盧氏人,天水師范學院講師。

猜你喜歡
置信區間天水位數
天水嬸與兩岸商貿
Maxwell分布參數的最短置信區間研究
p-范分布中參數的置信區間
多個偏正態總體共同位置參數的Bootstrap置信區間
五次完全冪的少位數三進制展開
連續自然數及其乘積的位數分析
天水地區的『秦與戎』
列車定位中置信區間的確定方法
重返絲綢之路—從天水到青海湖
《天水之鏡像》
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合