?

基于ARIMA模型對江蘇省GDP的預測

2022-06-08 03:11華,石
關鍵詞:對數差分江蘇省

查 華,石 舢

(1.南京審計大學 統計與數據科學學院,江蘇 南京 210031;2.喀什大學 數學與統計學院,新疆 喀什 844000)

0 引言

GDP數據的大小從一個角度反映了這個國家或地區的經濟狀況,因此預測和分析GDP數據未來的走勢,具有非常重要的理論意義和現實意義.GDP數據受多方面的因素影響.江蘇省地區生產總值自改革開放以來持續增長,江蘇省GDP總量一直位居全國前幾位.本文以通過江蘇省統計年鑒獲取了1975-2020年GDP數據為樣本,以1975-2017年江蘇省GDP數據為訓練集,以2018-2020年江蘇省GDP數據為測試集,通過相對性誤差分析,構建了可信度較高的ARIMA模型.對江蘇省未來2年的GDP做出了預測,預測的結果為江蘇省制定經濟決策提供了參考.

隨著近些年來對經濟的研究熱度持續上升,GDP是在經濟研究中的一個重要指標.目前對GDP數據的預測方法眾多,國內目前也有不少學者通過不同的預測方法對GDP數據進行了預測,也獲得了不同預測效果.朱佳俊[1]通過選用1978-2018年我國的GDP數據,運用統計分析R軟件先后構建了ARIAM模型、BP神經網絡模型、組合預測模型,最終通過構建預測效果較好的改進組合模型對我國未來3年的GDP進行了預測.嚴彥文[2]通過對1975-2015年GDP數據進行分析,構建了ARIMA(1,1,1)模型,對山東省未來五年的GDP進行了預測.沈秋彤[3]以1978-2013年遼寧省的GDP數據為樣本,構建了ARIMA(1,1,1)模型并對遼寧省2012-2014年GDP數據進行了預測,經過對比發現2012和2013年實際GDP和預測GDP相對誤差都控制在5%以內.同時對遼寧省統計局當年發布的2014年GDP數據和模型預測數據進行對比,發現預測誤差控制在5%以內,模型短期預測效果較好.宋平和邱燕玲[4]選取1993-2016年青海省GDP數據,通過構建ARIMA、最小二乘模型和逐步回歸3個模型分別對青海省2015年和2016年兩年GDP數據進行預測,得出了3個模型都有較好的預測效果,同時ARIMA模型短期預測效果較好,在預測10年以及時間更長的長期預測效果較差.本文選取江蘇省1975-2020年GDP數據,通過spss軟件和python軟件數據分析的功能構建ARIMA模型,對江蘇省未來2年的GDP數據做出了預測.

1 理論基礎

1.1 ARIMA模型理論基礎

ARIMA是差分自回歸移動平均模型的英文縮寫,其中AR表示的是自回歸模型,MA表示的是移動平均模型,I表示的是差分[5].它針對的是平穩的時間序列模型.然而在現實生活中絕大多數時間序列都是非平穩的.因此可以對數據進行差分,使其轉化為平穩的時間序列,再用ARIMA模型對其數據進行建模和預測.ARIMA模型是根據過去不同時期數據的相關性,可以進行有效和精準的短期預測,它彌補了AR和MA進行預測出現的參數過多問題,在短期預測領域具有廣泛的應用.它的基本形式如下:

Φ(B)(1-B)dyt=Θ(B)εt,

E(εk,εt)=0,k≠t,E(εt)=0,Var(εt)=σ2,

E(εt,yk)=0,?k

ARIMA模型是由AR(自回歸)模型和MA(移動平均)模型經過差分構成的組合模型,一般寫成ARIMA(p,d,q).p和q分別為自回歸階數和移動平均階數,d表示差分的次數,一般可以通過幾階差分將不平穩的序列轉化為平穩的序列,一般差分的階數不超過3階.上述公式中{yt}表示需要預測的時間序列;Φ(B)=1-φ1B-φ2B2-…-φpBp,表示模型的自回歸多項式;以及Θ(B)=1-θ1B-θ2B2-…-θqBq,表示為模型的移動平均多項式;{εt}則為白噪聲序列,d表示差分的次數[5].

1.2 ARIMA模型建模流程

在對ARIMA模型理論相關知識了解的基礎上,用ARIMA模型進行建模預測就變得非常容易了.具體建模流程如下所示:

(1)首先需要對需要擬合的樣本數據進行平穩性檢驗.

(2)若擬合的樣本數據不是平穩數據,則需要進行差分使其平穩化.否則進行下一步.

(3)對平穩的樣本數據進行白噪聲檢驗,若是白噪聲數據,則建模結束;否則進行下一步.

(4)對平穩非白噪聲的樣本數據建立ARIMA模型.

(5)模型的優化和應用.

具體的ARIMA建模流程圖如圖1所示.

圖1 ARIMA建模流程圖

2 實證分析

2.1 數據來源

本文以江蘇省1975-2017年的GDP數據作為訓練集,以2018-2020年的GDP數據作為測試集構建了ARIMA模型,并預測了江蘇省未來2年的GDP數據.1975-2020年的GDP數據均來自于江蘇省統計局網站所發布的江蘇省統計年鑒,所有GDP數據如表1所列.

表1 1975-2020年江蘇省GDP數據 單位:億元

2.2 平穩性檢驗及處理

一般在生活中得到的原始時間序列數據是非平穩的,所以要對數據進行差分或者取對數運算,使原始時間序列數據變成平穩時間序列數據.江蘇省1975-2020年GDP數據,選取了1975-2017年數據為訓練集,2018-2020年數據為測試集,通過時序圖以及平穩性檢驗發現是非平穩的,時間序列圖如圖2所示.

圖2 江蘇省1975-2017年GDP時序圖

經過對GDP數據取對數和一次差分后,通過觀察時序圖可以看出數據變成了平穩時間序列數據,通過取對數和一階差分后的GDP數據趨勢基本消除,但是這并不能夠精準地判斷該數據為平穩時間序列.對GDP數據取對數和一次差分的時間序列圖如圖3所示.

圖3 江蘇省GDP數據取對數一階差分后時序圖

接下來將通過更為嚴格的單位根檢驗來進行判斷.

通過單位根檢驗發現p值為0.000 752,分別大于顯著性水平為1%和5%以及10%所對應的臨界值,可以判斷不存在單位根,可以判斷出該數據為平穩時間序列.ADF檢驗結果如表1所列.

表1 取對數后且一階差分后的GDP序列ADF檢驗

同時使用python軟件對該組數據使用Q檢驗進行了白噪聲檢驗,結果返回統計量和p值,發現p值全部都小于0.05,表明該平穩序列不是白噪聲.

2.3 ARIMA模型的建立及估計

在通過平穩性處理的過程中,模型中的d可以確定為1,模型中的另外兩個參數p和q通過觀察ACF和PACF圖來確定.使用python軟件繪制的ACF和PACF圖如圖4和圖5所示.

圖4 江蘇省GDP取對數一階差分后序列自相關圖

圖5 江蘇省GDP取對數一階差分后序列偏自相關圖

從圖中可以看出,自相關圖經過1階延遲之后,ACF均落在于兩倍的標準差范圍之內.同時取值圍繞0上下波動,呈現出截尾性質.而PACF衰減到0的速度比較慢,呈現出拖尾的性質.初步可以判定擬合MA模型.

但是通過ACF和PACF圖對模型進行定階主觀性較強,最后通過AIC和BIC準則來確定.最終通過使用python軟件進行數據分析,得出當p=0,q=1時,AIC值和BIC值均取得最小值.最終模型確定為ARIMA(0,1,1),模型統計和參數估計結果如表2、表3所列.

表2 模型統計

表3 ARIMA 模型參數

表2中可以看出相關系數為0.998 714,說明模型的擬合效果較好.同時p值為0.995 302,大于顯著性水平0.05,說明殘差序列為白噪聲.同時還沒有離群值的出現,反映出模型整體擬合的效果不錯.從表3的參數估計結果來看,p值遠遠小于顯著性水平0.05,說明模型的參數都是顯著的,通過了參數的顯著性檢驗.最終的預測模型確定為ARIMA(0.1,1)模型.

2.4 ARIMA模型預測

通過選取江蘇省1975-2020年GDP數據為訓練集,建立了ARIMA(0,1,1)模型,同時預測了2018-2022年江蘇省GDP數據,預測值見表4所列.

從表4可以看出模型預測的相對誤差均在10%以下,平均相對誤差為3.75%,整體預測效果較好.同時也給出了江蘇省未來2年的GDP數據分別為109 505.67億元,123 192.63億元.但是隨著預測年份的增加,預測的GDP數據誤差也漸漸變大.也反映出ARIMA模型適合做短期預測,不適合進行長期預測.

表4 2018-2022年江蘇省GDP預測值與實際值對比 單位:億元

3 結語

本文通過選取江蘇省1975-2017年GDP數據為測試集,2018-2020年GDP數據為驗證集.構建了ARIMA(0,1,1)模型,預測了江蘇省2018-2022年的GDP.可以看出模型在驗證集上表現出較好的預測效果,平均相對誤差在5%以下.最后從結果可以看出,未來2年江蘇省GDP呈現出穩步增長的趨勢,為當地經濟決策者作出經濟決策提供了一定的參考.同時隨著預測年份逐漸增加,預測精度也發生了下降,也反映出ARIMA模型適合短期預測.尤其是2020年江蘇省GDP預測值出現了超過5%的誤差,也有可能和2020年出現的新冠疫情有關.

猜你喜歡
對數差分江蘇省
RLW-KdV方程的緊致有限差分格式
江蘇省常州市第一中學
含有對數非線性項Kirchhoff方程多解的存在性
指數與對數
數列與差分
指數與對數
江蘇省南就市鼓樓區第一中心小學
江蘇省交通圖
江蘇省政區圖
對數簡史
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合