?

基于ARMA模型對我國病毒性肝炎流行特征分析

2018-01-22 12:45羅玲黎明
中國醫學創新 2018年33期
關鍵詞:病毒性肝炎發病率預測

羅玲 黎明

【摘要】 目的:分析我國病毒性肝炎的年發病率動態變化及發展趨勢,為衛生安全部門制定病毒性肝炎的預防監測措施提供決策依據。方法:采用自回歸積分滑動平均模型(ARMA)對我國政府部門1975-2013年公布的法定傳染病報告數據進行擬合。結果:基于AIC及SC最小原則選擇ARMA(3,2)

模型進行精度評價及外推預測,模型殘差檢驗為白噪聲序列,預測結果能夠準確反映了中國病毒性肝炎發病率動態變化,平均相對誤差僅為4.29%。結論:研究利用ARMA實現了全國病毒性肝炎發病趨勢評價與預測,全國2014-2018年病毒性肝炎發病率呈現小幅下降趨勢,未來一段時間內,病毒性肝炎的發病率(VPM)仍將處于較高水平。

【關鍵詞】 ARMA模型; 病毒性肝炎; 發病率; 預測

【Abstract】 Objective:To analyze the dynamics of the morbidity of viral hepatitis in China and offer decision-making foundation to prevention and surveillance of viral hepatitis in China.Method:Autoregressive integrated moving average(ARMA) models were developed using reported data of viral hepatitis in China from 1975 to 2013 and evaluated on forecasting new data for the following five years.Univariate Box-Jenkins time-series analysis had been used for modeling and forecasting yearly notifiable infectious diseases from 1975 to 2013.

Result:The optimum model of ARMA(3,2) derived according to the Akaike Information Criterion(AIC) and Schwarz Criterion(SC) and testified by the residual analysis.ARMA model hold the high capacity to forecasts yearly data for the evaluation year with an average percentage error of 4.29%.Conclusion:In this study,ARMA model simulated and predicted the tendency of the viral hepatitis morbidity in China.The forecasting results also showed the slight reduction of the morbidity in the following years from 2014 to 2018 and that the morbidity of viral hepatitis will still stay the high level in the future.

【Key words】 ARMA model; Viral hepatitis; Morbidity; Prediction

First-authors address:Hubei University of Technology Hospital,Wuhan 430068,China

doi:10.3969/j.issn.1674-4985.2018.33.001

病毒性肝炎是危害人類健康的重要疾病之一,全球每年約有100萬人感染病毒性肝炎病毒及相關后遺癥、肝臟疾病和原發性肝癌[1-2]。以乙型肝炎和丙型肝炎為例,全球約有2.48億人長期感染乙型肝炎[3],丙型肝炎約為2億和1.85億[4],而且病毒性肝炎所致的并發癥及死亡率呈逐年上升趨勢[5]。中國是病毒性肝炎的高發病國家,其發病機制、傳染途徑及流行動態特征一直是我國醫療衛生管理部門及醫療專家重點研究對象[6-8]。針對傳染病時間序列進行動態預測,有助于公共衛生部門掌握其流行特點,從而為其預防與監測工作提供一定的科學依據[9]。國內外學者已經采用時序方法對病毒性肝炎發病率進行了大量的研究,線性回歸模型、灰色關聯系統[10]、移動自回歸模型及人工神經網絡[11]等各具特點的統計方法被用于病毒性肝炎的動態預測研究。相較而言,自回歸積分滑動平均模型(ARMA)善于捕捉數據中的線性特征,綜合考慮了序列的趨勢變化、周期變化及隨機干擾,具有預測精度較高,適用于短期預測等特點,在傳染病預測中具有廣泛的適用性[12-13]。本文以我國1975-2013年

病毒性肝炎發病率為數據基礎,研究ARMA時間序列建模與預測方法的應用可行性,并對我國病毒性肝炎發病率水平進行短期預測,從而為衛生管理部門的流行病防控提供決策參考?,F報道如下。

1 材料與方法

1.1 數據來源 文中病毒性肝炎發病率(VPM)的數據全部取自衛生部網站公布的甲乙類傳染病發病率法定報告數據。運用Eviews軟件生成1975-2013年我國病毒性肝炎發病率的時間序列圖(圖1)。我國病毒性肝炎發病率經歷了三次較大的波動,其峰值分別為1980年的111.47/100 000,1988年的132.47/100 000和2007年的108.44/100 000,之后基本穩定在高位(92.45/100 000~107.30/100 000),發病比率未來上升幅度逐步減小。觀察曲線變動情況,初步判斷為非平穩時間序列。根據Box-Jenkins相關方法,只有平穩的時間序列才能夠直接建立ARMA 模型,否則必須經過適當處理使序列滿足平穩性要求。

1.2 研究方法

1.2.1 ARMA表達形式 ARMA模型(Box-Jenkins)是一種以隨機理論為基礎的時間序列分析方法。ARMA模型使用包括AR項和MA項兩種形式對擾動項進行建模分析,使模型綜合考慮過去值,現在值和誤差值,從而提高模型的預測精度。ARMA模型將時間序列視為隨機過程,采用數學模型來描述或模擬,模型確立后,則通過時間序列的過去值和現值來預測未來值[14]。

若序列{Y}為平穩序列{Z},則可建立ARMA(p,q)模型:zt=c+φ1zt-1+…+φzt-p+εt+φ1εt-1+…+φqεt-q。其中p為AR的階數,q為MA的階數,為一個白噪聲序列。ARMA模型建模需要經過4個步驟,即序列平穩性檢驗,模型初步識別,模型參數估計和模型診斷分析。

1.2.2 ARMA模型的定階 ARMA模型主要通過觀察描述序列特征的一些統計量 (如自相關系數和偏相關系數)的性質來確定ARMA(p,q)模型的階數p和q[15],具體描述見表1。

2 結果

2.1 我國病毒性肝炎發病率時間序列平穩性檢驗 時間序列的平穩性檢驗是應用ARMA模型的首要問題,檢驗方法主要有圖檢法(含時序圖檢驗法自相關圖檢驗法)、單位根檢驗法(包括ADF檢驗法、DFGLS檢驗法、KPSS檢驗法等),為保證客觀性,本研究采用單位根檢驗統計量(ADF)來檢驗序列是否平穩[16]。觀察VPM時間序列動態特征,數據分布無明顯趨勢特征,因此采用(c,0,9)

進行檢驗。檢驗結果表明,原始數據ADF的值為-3.250 945,小于5%顯著水平的t值,表明該序列平穩,見表2。

2.2 ARMA模型初步識別 通過分析1975-2013年我國病毒性肝炎發病率量時間序列自相關圖和偏自相關圖(圖2)。自相關系數延遲2階拖尾,偏自相關系數延遲3階拖尾,故選取ARMA(p,q)模型,由于原始時間序列為平衡序列,所以初步確定模型為ARMA(3,2)。

2.3 ARMA模型參數估計 考慮到自相關函數和偏自相關函數確定的ARMA模型階次具有一定的主觀性,經Eviews 7.2測算,模型ARMA(3,2)、(3,2)、

(1,0)、(2,2)和ARMA(0,2)均通過了檢測,所有系數均為顯著。在此基礎上,對模型的R2、RSS、AIC及SC值進行比較,根據AIC及SC準則,以AIC及SC值最小時為相對最優模型。對比結果顯示,ARMA(3,2)相關系數R2為0.785 013,RSS、AIC及SC為所有模型中最小值,因此根據AIC信息準則,選擇ARMA(3,2)對VPM動態進行預測(表3)。

2.4 ARMA模型構建及診斷分析

2.4.1 模型構建 由ARMA(3,2)模型可得VPM最小二乘估計:VPMt=89.426 38-0.411 235 VPMt-3+εt+1.006 117 VPMεt-1+0.958 098 VPMεt-2,模型各解釋變量參數均為顯著,模型通過F檢驗,R2值達到0.785 013,P<0.01,表明該模型具有較好擬合優度(表4)。

2.4.2 診斷分析 由模型殘差序列的自相關分析圖可知,其自相關系數和偏自相關系數均落入置信水平為95%的置信區間(圖3)。根據ACF、PACF及Q-Stat顯示,殘差序列純隨機序列,為白噪聲,因此模型擬合達到標準。針對該模型為時間連續變量模型的特點,采用Lagrange Multiplier檢驗法,對模型的殘差序列進行自相關檢驗[17]。由表5可知,得到的F-statistic和Obs*R-squared兩個值對應的概率值(Probability)分別是0.991 6、0.997 8,均大于5%的顯著性水平,表明殘差不存在序列相關性。

2.5 ARMA模型預測結果 圖4描述了根據模型ARMA(3,2)對病毒性肝炎發病率(VPM)進行模擬所得的殘差、實際值和擬合值。圖中實際值與擬合值的變化趨勢大體一致,并且模型的殘差值較小,這表明擬合效果較好。通過分析預測值與真實值差異,發現相對誤差在1.38%~6.18%,預測效果較好(表6)。同時也可以看出,我國病毒性肝炎發病率在未來五年內持續保持高位,未來病毒性肝炎防治工作依然嚴峻。

3 討論

根據世界衛生組織數據,中國是病毒性肝炎感染的高發國家之一[18]。預測病毒性肝炎發病率對其預防和控制具有重要意義,有助于研究人員及衛生人員完善應對策略,進而幫助衛生部門執行科學的健康戰略規劃[19]。本研究基于真實數據集,采用了時間序列預測方法來提供病毒性肝炎數據中心結構及趨勢信息。時間序列預測是當前的研究熱點,采用的方法多種多樣,移動自回歸模型是其中的典型代表,善于捕捉數據中的線性特征[13]。本文以1975-2013年的中國病毒性肝炎發病率數據為基礎,利用Eviews建立ARMA模型,基于AIC最小準則選擇模型ARMA(3,2),經檢驗,模型通過F檢驗,殘差序列為隨機序列,該模型能夠較好地反映病毒性肝炎流行動態。對2014-2018年我國病毒性肝炎發病率總量進行模擬預測,模型的預測結果與實際誤差較?。≧2=0.78,P<0.01),平均誤差僅為4.29%,對我國病毒性肝炎發病率水平進行短期預測并針對性地制定相關措施具有一定的參考價值。未來,研究將側重于使用更為復雜的預測技術,如遺傳算法,概率規則,模糊神經系統或其他一些先進的數據挖掘技術來預測病毒性肝炎的流行趨勢。同時,我們也需看到,真實時間序列數據包含了大量的非線性的成分,我國病毒性肝炎發病率受區域醫療發展水平、地區環境質量、經濟發展水平及人群結構與素質多等多方面因素的影響[20-21],采用單一模型進行數據處理時存在較大的局限性,若要對進行較長期的預測,應結合外部影響因素對相關模型進一步改進完善。

參考文獻

[1] Schweitzer A,Horn J,Mikolajczyk R T,et al.Estimations of worldwide prevalence of chronic hepatitis B virus infection:a systematic review of data published between 1965 and 2013[J].Lancet,2015,386(10003):1546-1555.

[2] Venkatesh A G,Brickner H,Looney D,et al.Clinical detection of Hepatitis C viral infection by yeast-secreted HCVcore:Gold-binding-peptide[J].Biosensors and Bioelectronics,2018,119:230-236.

[3] Sharma S,Carballo M,Feld J J,et al.Immigration and viral hepatitis[J].Journal of Hepatology,2015,63(2):515-522.

[4] Mohd Hanafiah K,Groeger J,Flaxman A D,et al.Global epidemiology of hepatitis C virus infection:new estimates of age-specific antibody to HCV seroprevalence[J].Hepatology,2013,57(4):1333-1342.

[5] Wiktor S Z,Hutin Y J.The global burden of viral hepatitis: better estimates to guide hepatitis elimination efforts[J].Lancet,2016,388(10049):1030-1031.

[6]李揚,耿愛生,汪心海,等.中國病毒性肝炎流行狀況GIS空間分析[J].中國衛生統計,2016,33(2):235-238.

[7]陳國翠,謝旭,陳偉紅,等.2010-2014年深圳市乙型和丙型病毒性肝炎流行特征分析[J].實用預防醫學,2017,24(7):810-813.

[8]朱小康,王建輝,王克強,等.2011-2015年撫州市丙型病毒性肝炎流行病學特征分析[J].現代預防醫學,2017,44(5):788-792.

[9] Goyal A,Chauhan R.The dynamics of integration, viral suppression and cell-cell transmission in the development of occult Hepatitis B virus infection[J].Journal of Theoretical Biology,2018,455:269-280.

[10]陳銀蘋,吳愛萍,范紅敏,等.灰色系統對乙型病毒性肝炎發病率的預測研究[J].中國現代醫學雜志,2014,24(24):77-81.

[11]曾海燕,解合川,任欽,等.徑向基函數神經網絡在甲型病毒性肝炎發病率預測中的應用初探[J].現代預防醫學,2013,40(24):4489-4492.

[12]嚴婧,楊北方.指數平滑法與ARIMA模型在湖北省丙型病毒性肝炎發病預測中的應用[J].中國疫苗和免疫,2017,23(3):292-297.

[13] Ture M,Kurt I.Comparison of four different time series methods to forecast hepatitis A virus infection[J].Expert Systems with Applications,2006,31(1):41-46.

[14] Mills,Terence C.Time Series Techniques for Economists[M].Cambridge University,1990.

[15] Wold H.A Study in the Analysis of Stationary Time Series[M].Uppsala,Sweden:Almqvist & Wiksell,1938.

[16] Elliott G,Rothenberg T J,Stock J H.Efficient Tests for an Autoregressive Unit Root[J].Econometrica,1996,64(4):813-836.

[17] Godfrey L G.Misspecification Tests and Their Uses in Econometrics[J].Journal of Statistical Planning and Inference,1996,49(2):241-260.

[18] WHO.Combating hepatitis B and C to reach elimination by 2030[S].WHO,2016.

[19] Ahn H R,Cho S B,Chung I J,et al.Socioeconomic differences in self- and family awareness of viral hepatitis status among carriers of hepatitis B or C in rural Korea[J].American Journal of Infection Control,2018,46(3):328-332.

[20]朱小康,王建輝,王克強,等.2011-2015年撫州市丙型病毒性肝炎流行病學特征分析[J].現代預防醫學,2017,44(5):788-792.

[21]鄭翠玲,邢麗,高風至,等.重癥病毒性肝炎患者醫院感染的影響因素分析[J].中華醫院感染學雜志,2016,26(4):752-754.

(收稿日期:2018-08-30) (本文編輯:程旭然)

猜你喜歡
病毒性肝炎發病率預測
選修2—2期中考試預測卷(B卷)
選修2—2期中考試預測卷(A卷)
重慶每小時10人確診癌癥 癌癥發病率持續上升
年輕人直腸癌和結腸癌發病率升高
在病毒性肝炎診斷中相關常規生化檢驗指標的應用價值分析
病毒性肝炎合并心肌損傷的臨床研究
病毒性肝炎應用痰熱清注射液聯合西藥治療的可行性分析
凝血四項檢測對病毒性肝炎的診斷價值評估及分析
針灸配合關節腔內注射治療膝關節滑膜炎的臨床療效觀察
《福彩3D中獎公式》:提前一月預測號碼的驚人技巧!
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合