商豐瑞 張靜
摘要:我國快遞業務總量目前已成為全球第一,快遞業發展具有長趨勢性和短周期性。本文探討基于SARIMA模型對我國快遞業務量數據進行分析,解釋數據的特征并用來預測。本文分析了我國2003~2015年的月度快遞包裹總量時間序列,剔除時間趨勢和季節周期性后使原序列平穩并建立季節時間序列模型。通過對不同模型進行參數估計和比較后發現:SARIMA(0,1,1)(0,1,1)[12] 模型可以得到較為理想的結果,它能很好地擬合我國月度快遞包裹總量時間序列,分析發現受春節假期影響,模型在二月份預測準確度較差。
關鍵詞:SARIMA 模型;月度快遞包裹總量;預測
中圖分類號:F252.5 文獻識別碼:A 文章編號:1001-828X(2016)030-000-01
一、研究背景
2016年,我國快遞業務總量已躍居全球第一。電子商務的興盛有效帶動快遞行業的高速發展,反之,快遞行業的提升也為電子商務的增長提供配套支撐。對快遞包裹的總量預判是快遞運輸企業在投資決策、風險評估、人員管理中至關重要的一環。只有通過理論研究和實證分析,利用科學的分析方法,對海量數據進行有效分析、深度挖掘,并建立包裹量預測模型,才能為企業在運輸經營上提供有效決策。
目前,利用我國快遞業務量月度數據建立季節時間序列模型并進行短期預測的文章還很少。本文主要運用時間序列的確定性因素分解方法和SARIMA(季節時間序列)模型分析法,借助R軟件時間序列分析包tseries和預測包forecast對數據進行處理和模型擬合,最終選擇合適的模型參數對我國快遞業務量進行分析和預測。
二、SARIMA模型簡介
SARIMA模型(Seasonal Autoregressive Integrated Moving Average),全稱為自回歸單整移動平均季節模型,主要是基于經濟學理論知識和計量經濟學方法,對研究標的物的變量因素建立序列回歸,并利用樣本數據觀察值(周期項)和隨機項對價格走勢進行短期測算。季節時間序列在經過合理的函數變換之后,都可以分拆為三項:趨勢項、周期項和隨機項。趨勢項反映的是整體價格走勢的方向;周期項表示特定時間周期內的價格變化特點;隨機項考慮的是不確定或者突發條件下,產生的價格隨機信號和隨機噪聲??爝f業務量的時間序列數據就屬于季節時間序列,通過SARIMA模型選擇合適的模型參數就可以對其進行分析和預測。
三、模型建立
(一)原始數據預處理
國家統計局網站2003年1月至2014年12月的快遞量-當期值(萬件)數據顯示,從2008年開始,我國快遞包裹量呈級數增長,并且存在明顯的周期性變化,快遞行業在此期間飛速發展。這種周期是由于季節性變化或其他一些固有因素引起的。在快遞包裹運輸領域中,季節性影響是不可避免的。因此,SARIMA模型可以合理分析和準確預測我國快遞業務量。
(二)預測模型建立
接下來使用R軟件時間序列包的decompose函數對包括時序數據進行分解,分別為隨機、趨勢、季節。
通過隨機、趨勢、季節三張圖可以看出,我國快遞包裹量呈級數增長;包裹量的變化存在季節性因素;時序隨機性變化平穩。
分別選擇SARIMA(0,1,1)(0,1,1)[12]模型和SARIMA(0,1,1)(0,1,2)[12]模型進行預測比較。
可見,模型預測效果差距較小,但SARIMA(0,1,1)(0,1,1)[12]模型效果更好,而且除了二月份,其余三個月的預測值可以說非常準。二月份之所以不準,主要原因是趕上春節假期,全國休假,包裹量驟降是必然的。
四、結論
本文利用SARIMA季節時間序列模型,對我國2003~2015年的月度快遞包裹總量時間序列進行分析,明確我國快遞包裹總量時間序列存在指數級增長趨勢和季節性變化。通過設定SARIMA模型的不同參數,得出SARIMA(0,1,1)(0,1,1)[12]模型有較低的AIC值,預測準確率較高。
SARIMA模型是在ARIMA模型基礎上優化而來的一種預測模型,與眾多預測模型相比,SARIMA模型對季節性時間序列數據具有較好的預測效果。因此,SARIMA模型對今后我國快遞業務量的分析和預報有很大的參考價值。
參考文獻:
[1]趙喜倉,周作杰.基于SARIMA模型的我國季度GDP時間序列分析與預測[J].統計與決策,2010,11:18-20.
[2]張健.SARIMA模型在預測中國CPI中的應用[J].統計與決策,2011,5:28-30.
[3]賈凱威,韓家彬,楊洋.基于SARIMA模型的短期通貨膨脹預測.統計與決策,2014,22:33-35.