?

基于組合預測模型的快遞需求預測研究

2022-03-14 08:48陳疇鏞高明鏡
關鍵詞:需求預測業務量預測

陳疇鏞,高明鏡

(杭州電子科技大學 管理學院,浙江 杭州 310018)

電子商務崛起以來,憑借其龐大的用戶規模和產業關聯能力,帶動了快遞需求的快速增長。電子商務交易以網絡為載體,交易時間自由、交易量龐大且退換貨較多;加之網絡貿易本身存在的淡旺季以及促銷活動的影響,特別是農村電商、跨境電商、社交電商等新業態的快速發展,使得快遞需求的季節性差異不斷增大,旺季爆倉、淡季資源過剩的不平衡問題愈發突出。對快遞需求做出較為準確的預測,可為政府和企業在快遞業資源的合理布局,提升快遞服務質量、安全性和響應能力等方面提供決策依據。

一、相關概念與文獻研究

快遞需求是指在一定時間范圍和行業發展水平下,快遞業對快件(信函、商業文件或包裹)從攬收、包裝到送達消費者手中的各個環節中起到的資源配置功能,包括時間效用、安全效用和信息查詢等附加服務的實現。目前我國的快遞需求分為現實快遞需求和潛在快遞需求?,F實快遞需求通常用“快遞業務量”衡量,即一定時期內社會活動中企業和個人所需要的總的快遞服務,是快遞作業過程中有形物資數量的總計。近年來快遞業務量的八成以上均來自于電子商務快遞[1]。潛在快遞需求指消費者對快遞服務產生的尚未滿足的確定意愿。一旦條件許可,潛在的快遞需求就可以形成現實的快遞活動。目前我國快遞業的寄遞設施和網絡布局還未完善,快遞服務能力較弱,而隨著快遞業的進步,末端配送網絡規?;?、專業化程度的提高,潛在的快遞需求將會隨之轉變。

在快遞需求的季節性特征方面,康閱春[2]認為該季節性表現在快遞業務量在春節、五一、國慶等節假日會顯著增長,而在節假日過后會回落;湯炎非和黃靜[3]則認為快遞業淡季較常出現在春節至3月期間,旺季則在9月至春節期間;魏邦艷[4]注意到快遞業務量在春節時期的錯峰效應,電商企業的節日促銷使得春節的快遞業務量暴漲,通常2月份后業務量開始出現回落;鄧欣偉和劉麗娜[5]認為天氣會影響人們的社會活動范圍及顧客的購物心理,而由于人們的購物傳統、商家的促銷活動等因素,節假日是人們產生購物需求的高峰期;李貞貞[6]采用ARIMA季節模型對河南省快遞業業務量進行預測,該模型能夠較好擬合業務量變化趨勢且精度較高。

在電子商務對快遞業的影響方面,Tang和Deng[7]認為經濟的快速增長、互聯網的普及和網上購物的興起是促使快遞業務快速增長的主要原因;Han等[8]研究得出宏觀經濟、電子商務發展和運輸水平三方面因素影響了快遞業發展;Lv和Weng[9]采用電子商務企業營業收入和快遞組合兩個關鍵指標,對電子商務與快遞業協調程度進行協整檢驗;張文法[10]使用灰色關聯分析法對山東省電子商務的發展對物流業的影響做出研究,結果顯示兩行業總體業態關聯度較高,電子商務從業人數對物流業發展有較強影響;石詠梅[11]采用協整模型分析影響快遞業務量的因素,研究表明網上購物和互聯網發展對快遞業發展起到了促進作用。

在快遞需求預測模型方面,Yu等[12]將蟻群算法引入到建模過程中,建立改進的ACO-SVM預測模型對青島市的物流需求進行預測;Huang等[13]為緩解電子商務與物流需求增長匹配度較低的問題,從電子商務的角度構建廣東省物流需求預測指標體系,并采用GM(1,1)模型和BP神經網絡模型預測物流需求;許榮斌等[14]研究物流公司日均快遞業務量的預測問題,并對粒子群優化算法進行慣性權重改進,結合反向傳播神經網絡模型的組合模型進行快遞業務量預測;周楊等[15]基于某快遞企業的日度業務量數據,使用優化后的SARIMA模型與滑動窗口模型共同預測該企業的快遞業務量;許闖來等[16]研究不確定需求下快遞配送網絡魯棒優化問題,使用改進的蟻群算法在滿足時間窗的基礎上對每條路徑的使用時間進行精確計算;薛蓉娜等[17]根據GRU深度學習算法在不同日期的有效性對我國日均快遞業務量進行預測,該算法的抗干擾性與預測準確率均較優。

上述學者的研究成果豐富了快遞需求的研究內容,但仍存在一些問題,如對電子商務影響的定量研究和季節性特征的研究不足,數據往往為快遞業務量單一數據且預測周期較長,預測精度也不夠理想。因此本文從擴充數據多樣性及提升模型預測精度出發,探討電子商務及季節性差異影響下的快遞需求預測問題,并使用GM(1,N)模型與ARIMA模型進行組合預測。

二、組合模型的構建

(一)快遞需求預測指標體系

在相關文獻研究的基礎上,將影響快遞需求的指標分為宏觀指標和電子商務指標,構建快遞需求預測指標體系(表1),指標說明如下。

表1 快遞需求預測指標體系

1.宏觀指標

地區生產總值。經濟發展程度較高的地區往往具有人口密集、產業集群、基礎設施完善等特征,這些地區的服務業發展水平通常也較高,快遞服務作為服務業中的基礎產業在該地區具有一定的發展優勢。故區域經濟的發展水平可以很好地反映該區域快遞服務水平。

進出口總額。國內貿易在快遞業發展初期產生了大量的快遞需求,使我國快遞業在短時期內得以實現規模性的增長。而隨著我國國際貿易的蓬勃發展,跨境電商產業也如雨后春筍般茁壯成長,近年來跨境電商產業進出口總額高速增長,隨之產生的進出口業務快遞需求同樣不容忽視。故選用進出口總額衡量國際貿易和國際快遞需求的發展潛力。

第三產業增加值??爝f業是為消費者提供運輸服務及相關信息服務的基礎服務業,從屬于第三產業??爝f需求的增長會直接推動第三產業的發展,第三產業發展水平的提高也會帶動快遞業的轉型升級,兩者具有相互促進的正相關關系。故本文選用第三產業增加值來反映包括快遞業在內的第三產業發展水平。

社會消費品零售總額。近年來網絡購物和快遞送貨的新型消費方式逐漸成為居民消費的主要途徑。在實體購物中,人們也往往選擇將體積較大或難以搬運的商品通過快遞等方式送貨上門,人們的消費行為越來越多地與快遞需求產生聯系。故本文選用社會消費品零售總額反映快遞需求的潛在增長。

固定資產投資總額。我國主要的快遞業基礎設施包括道路、港口、機場、快遞網點、網絡及通信設備等,基礎設施的完善對于快遞業的發展起到關鍵作用。對其建設的投資力度越大,快遞業的發展規模和潛力就越大,進而促進潛在快遞需求的增加。由于目前缺少針對快遞業的固定資產投資額統計指標,故采用固定資產投資總額這一宏觀指標進行替代。

公路和水路貨運量。運輸作為快遞業的核心環節,任何快件都必須經過運輸過程送達消費者手中,快遞需求的升高與貨運量的增加有著直接聯系。目前我國快遞的運輸方式主要有水路、公路、鐵路、空運四種,其中公路和水路是快遞運輸的頻率最高的方式。由于目前缺少針對快遞業的貨運量統計指標,故采用公路和水路貨運量這一宏觀指標進行替代。

2.電子商務指標

網絡零售額。電子商務的發展直接推動了網絡購物行為的普及,已成為人們購物的主要方式之一。網購商品設置快遞和自取兩種取貨方式,其中絕大多數商品均為快遞送貨,網絡購物群體也逐漸成為了使用快遞服務的主力軍。網絡零售額的增加往往意味著相應的快遞服務的增加,即快遞需求上升。

跨境網絡零售出口額??缇吵隹陔娚檀蜷_了國外消費市場,目前主要的跨境電商物流模式有郵政小包、國際快遞、國內快遞、專線物流、海外倉儲等??缇尘W絡零售出口額反映了跨境電商國際貿易的規模,也影響了國內外快遞服務的變化。

電子商務產業增加值。電子商務產業增加值是電子商務產業發展規模的數據表現,國內外學者對快遞業與電子商務產業的協同情況已做出了較多的研究。電子商務產業規模的增大,一方面會帶動快遞業產業規模擴大,另一方面會促進快遞業經營模式的更新和快遞服務的轉型升級,均對快遞需求產生積極影響。

居民人均可支配收入和居民網絡消費額。居民消費能力的提升與潛在快遞需求的提升有著直接關系,居民人均可支配收入作為潛在快遞需求的主要來源,是反映居民消費能力的重要指標;而居民網絡消費額是指居民在網絡購物過程中實現的商品零售總額,是居民消費的數據表現,直接反映了居民網絡購物的規模。

城鎮和農村居民電腦擁有量。電腦作為電子商務實現的基礎設施,是人們在互聯網進行娛樂、消費等的主要工具,居民電腦擁有量能較好地衡量人們的網絡消費基礎。但應說明,在尋找相關網絡基礎設施統計指標(如互聯網普及率)時,發現其他較普遍的指標往往為年度數據,不符合所需的數據要求,暫不納入考慮范圍。

(二)基于灰色關聯分析的指標關聯度排序

1.設置參考序列和比較序列

設參考序列為X0={X0(t)|t=1,2,…,n};比較序列為:Xi={Xi(t)|t=1,2,…,n},其中i=1,2,…,m。

2.數據的無量綱化處理

(1)

其中t為時間,i為其他指標序列中的一行。

3.計算灰色關聯系數

ξi(t)為其他指標序列對業務量序列在第t時刻的關聯系數:

(2)

4.計算灰色關聯度

ri為其他指標序列對快遞業務量序列在第t時刻的灰色關聯度:

(3)

ri值越接近1,說明相關性越好。

5.關聯度排序

將各關聯度按照大小順序排列,從而更直觀地判斷其他因素序列對快遞業務量序列的影響程度。

(三)GM(1,N)預測模型及其應用

1.模型構建

(4)

(5)

得到快遞需求GM(1,N)預測模型的白化方程如下:

(6)

2.模型求解

由最小二乘參數估計法,求得GM(1,N)預測模型的參數為:

(7)

其中,以下指標的解為:

GM(1,N)預測模型白化方程的解為:

(8)

此時GM(1,N)模型的時間響應函數為:

(9)

(10)

(四)時間序列ARIMA預測模型及其應用

考慮到灰色GM(1,N)預測模型具有線性擬合的特征,模糊了快遞需求的季節變化趨勢,因此使用ARIMA模型對快遞需求的季節性特征做進一步預測。模型表達式為:

(11)

ARIMA模型預測步驟如下:

1.對輸入數據進行預處理。輸入數據為所預測區域的歷史快遞業務量數據。

2.識別序列平穩性。使用ARIMA模型需滿足數據序列為平穩序列,因此對歷史快遞業務量輸入數據進行平穩性檢驗。通常同時使用時序圖檢驗法、自相關圖(ACF)與偏自相關圖(PACF)檢驗法和單位根檢驗法。

3.序列平穩化。若檢驗得出快遞業務量原始數據為非平穩數列,一般使用差分法使之平穩化。

4.模型識別。參數p、q分別代表模型的自回歸項數和滑動平均項數。對差分后的快遞業務量序列畫出自相關與偏自相關圖,確定p、q值。

5.模型定階。確定參數p、q時往往會產生多個符合條件的模型組合,為選出精確度最高的預測模型,可使用AIC、BIC、HQ最小準則進行模型比較。

AIC=2k-2ln(L)

(12)

BIC=kln(n)-2ln(L)

(13)

(14)

其中L為最大似然函數,n為數據數量,k為變量個數。

6.殘差檢驗。對該模型的有效性進行檢驗,即檢驗該模型是否充足而有效地將數據中所包含的信息提取完全。

7.得到預測值。ARIMA模型具有靜態或動態兩種預測方法。靜態預測即滾動地進行向前一步預測,需手動調節預測數據范圍,精確度高;動態預測步驟簡單,但精確度較低。本文選用靜態方法進行預測。

(五)GM(1,N)-ARIMA組合預測模型

為克服單一模型局限、綜合利用兩模型優勢,建立GM(1,N)-ARIMA組合預測模型。選用方差倒數加權法進行權重分配,利用誤差與權系數成反比關系原理,對于誤差和較大的預測方法賦予較小的權數,反之賦予較大的權數。設可確定第i種單項預測模型的權重為wi,該模型可表示為:

(15)

其中,權重系數的計算公式為:

(16)

式中:Yt為t時間段內的組合預測值;yti為t時間段內GM(1,N)模型與ARIMA模型預測值;wi為GM(1,N)模型與ARIMA模型權重系數;Si為GM(1,N)模型與ARIMA模型得到的擬合值序列方差。

為選出最具適用性的快遞需求預測模型,使用模型評估指標MAE、RMSE、MAPE對比預測結果。指標計算公式如下:

(17)

(18)

(19)

三、杭州市快遞需求預測的實證分析

(一)數據來源

杭州市作為“電子商務之都”,是阿里、網易等電子商務平臺和眾多電商創業者崛起的發源地,多年來快遞業務量排在全國前五之列,對其進行實證分析具有較強的借鑒意義。數據來源為《杭州市國民經濟和社會發展統計公報》《杭州市郵政行業發展統計公報》。

(二)灰色關聯分析

使用MATLAB2018a對數據序列進行處理得到各指標的灰色關聯度結果(圖1、表2)。從整體來看,14個指標序列與快遞業務量序列灰色關聯度均大于0.55,表明所選指標與快遞需求存在較強的相關性,可有效預測杭州市需求,但各指標的關聯性并不均衡,波動幅度較大。電子商務因素指標中的四個指標與快遞需求均有較強的相關性,有力證明了電子商務因素是快遞業良性發展、快遞業務量快速增長的有力支撐。

圖1 各指標結果與關聯趨勢圖

表2 各指標灰色關聯度結果

(三)GM(1,N)預測模型應用分析

選取關聯度大于0.70的指標作為因素行序列,建立基于GM(1,6)的快遞業務量預測模型,使用MATLAB2018a進行計算。使用2015年1季度至2020年4季度數據作為模型訓練數據以驗證模型準確性,結果表明該訓練結果的總體相對誤差為-0.38%(表3)。

表3 GM(1,6)模型模擬預測值

對2015年1季度至2021年3季度的模型擬合值、殘差值、平均相對誤差值進行計算并作圖(圖2)。結果表明,GM(1,6)模型平均相對誤差為5.52%,但該模型擬合值存在明顯的線性趨勢,消除了快遞需求的季節性特征,需對快遞需求的季節性特征做進一步預測。

圖2 GM(1,6)模型預測值與真實值對比

(四)ARIMA預測模型應用分析

圖序列自相關與偏自相關系數圖

使用Eviews11.0軟件建立ARIMA預測模型,原序列的ADF檢驗結果為0.980 1,大于檢驗臨界值(10%顯著性水平),證明該序列為非平穩序列。一階差分后序列的ADF檢驗統計量為0.025 3,小于檢驗臨界值(5%顯著性水平),且消除了大部分的季節性趨勢,證明一階差分序列平穩。畫出一階差分序列的自相關與偏自相關圖(圖3),圖中自相關系數拖尾,偏自相關系數截尾,且在1階、4階較顯著,因此可以嘗試q=1,4。反復比較不同參數組合后所產生的模型效果,最終確定ARIMA(2,1,1)、ARIMA(1,1,4)、ARIMA(4,1,3)、ARIMA(4,1,4)符合模型要求,采用AIC、SIC、HQ最小準則和殘差的純隨機性檢驗確定最優模型(表4)。

表序列各模型的檢驗參數值對比

最后對ARIMA(4,1,3)與ARIMA(4,1,4)模型進行殘差檢驗。結果顯示,ARIMA(4,1,4)模型的殘差序列為非白噪聲序列,排除此模型。選用ARIMA(4,1,3)模型進行杭州市快遞需求預測,模型的平均相對誤差為-3.87%(圖4),季節性趨勢的擬合效果較好。

圖4 ARIMA(4,1,3)模型月度預測擬合值與實際值對比

(五)GM(1,N)-ARIMA組合預測模型應用及比較分析

根據式(15)、式(16)計算得出各預測模型權重系數為:w1=0.564 3,w2=0.435 7,則組合模型預測值為:Yt=0.564 3*yt1+0.435 7*yt2。各模型預測值見表5。

表5 杭州市2021Q4—2022Q4快遞業務量預測值

各模型誤差對比見表6。由于疫情影響,2020Q1的預測誤差值顯著偏高,剔除該特殊值影響后,61.5%的預測誤差值在10%以內,其余在20%左右浮動,認為該模型精度在可接受范圍內。采用評價指標綜合比較各模型預測結果,GM(1,N)-ARIMA組合模型平均誤差(1.30%)顯著優于GM(1,6)模型(5.54%)和ARIMA(4,1,3)模型(-3.87%);平均絕對誤差(3 557)、均方根誤差(22 596)與平均誤差率(7%)也小于兩種單一模型,組合模型顯著提高了預測精度。

表6 三種模型誤差對比

四、結論

1.快遞需求受多種因素影響。電子商務因素中網絡零售額、跨境網絡零售出口額、電子商務產業增加值、居民網絡消費額的灰色關聯度均大于0.70,說明快遞業與電子商務的協同發展狀況良好;宏觀因素中固定資產投資總額的灰色關聯度大于0.70,說明基礎設施的完善對潛在快遞需求的影響較大。

2.杭州市快遞需求產生新特征??爝f業務量將保持高速增長,2022年全年快遞業務總量將達389 293.44萬件,同比增長6%,并在第4季度達到861.89萬件/天的高峰,迎來繼疫情危機后一波新的業務量增長。季節性差異出現新特征,業務量次高值與最高值分別出現在2022年第2季度和第4季度;第1、2季度的業務量增速顯著升高,同比增速分別為9.71%、9.87%。

3.GM(1,N)-ARIMA組合模型具有優越性。該組合模型集合了GM(1,N)模型和ARIMA模型的優勢,同時考慮到電子商務環境和季節性特征兩個重要因素,且預測精度最高,是研究快遞需求預測較理想的方法。

本文的研究不足之處是,在進行預測時,由于數據獲得的難度,預測指標的選擇不夠全面、精準;并且由于部分數據統計的缺失,對快遞需求影響因素的歸納不夠完善,也使得預測精度受到影響。

猜你喜歡
需求預測業務量預測
無可預測
選修2-2期中考試預測卷(A卷)
選修2-2期中考試預測卷(B卷)
高質量發展背景下大型建筑企業融資需求預測與結構優化策略研究
選修2—2期中考試預測卷(A卷)
2020年業務量達830億件快遞跑出經濟活力
“一帶一路”戰略下廣西區域物流需求預測研究
一季度郵政快遞業務量增長41.7%
物聯網環境下高速公路交通事故影響范圍預測技術
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合