?

基于Lasso-PSO-BP方法的中國黃金期貨價格短期預測

2022-02-02 01:11
關鍵詞:相空間收盤價期貨

尹 晨 曦

(蘭州財經大學 統計學院, 甘肅 蘭州 730020)

黃金不同于其他金屬,它是一種兼具貨幣和金融屬性的特殊貴重金屬,擁有高流動、高安全和低收益的特性。由于黃金自身的多重屬性且影響黃金價格變化的因素繁多復雜,難以準確地對黃金期貨收盤價的走勢進行預測。國內外眾多學者對此開展了廣泛且深入的研究,從選擇變量的角度,可以將模型分2種。一種是單變量法,許貴陽[1]基于灰色預測方法對中國黃金現貨價格進行短期預測。另一種是多元變量法,相較于單變量法,計算復雜,但模型預測精度高。Pierdzioch等[2]在隨機森林中引入多元變量對黃金等4種貴金屬進行樣本外預測,引入多變量構建預測模型的精度要高于單變量預測的精度。針對多元變量法,如何選擇合適的變量也是提升預測效果的關鍵問題。賈尚暉等[3]選用Lasso回歸方法從定性分析所選的10個變量中選取與對倫敦現貨黃金價格收益率有關的4個變量進行分析。張文等[4]考慮到變量之間并非都是同期的關系,利用時差相關分析法確定影響國際原油價格多元變量的滯后期以提高模型的預測效果。喬宏圖[5]驗證黃金價格序列的混沌性并利用相空間重構法確定神經元中的節點個數,并利用相關分析法篩選重要變量,最終選用BP神經網絡與RBF神經網絡進行比較分析。

預測方法大致分為基于傳統統計預測模型和以神經網絡為主的智能預測方法2類。傳統統計預測模型有灰色預測[1]等,智能預測模型主要包括隨機森林[2]、BP神經網絡[6]、支持向量機(SVM)[7]、多層感知機[8]等。單個模型無法有效捕捉到時間序列的主要特征,人們提出了組合方法來分析時間序列。Alameer等[8]考慮匯率、油價、銅價、銀價及黃金歷史價格等10個變量作為輸入變量,建立由鯨魚算法優化的多層感知器神經網絡預測黃金月度價格。

綜上所述,在構建模型中加入外生變量能夠有效提升模型的預測性能。本文選用16個變量對中國黃金期貨收盤價進行研究,以其所屬金融市場可分為4大類:現貨市場因素、期貨市場因素、能源價格因素和其他因素。本文基于Lasso對影響黃金收盤價的變量進行篩選,考慮到變量之間的關系并非都屬同期,采用時差相關分析和相空間重構確定不同變量的滯后期,同時引入PSO優化BP神經網絡初始權值與閾值,以達到更好的預測效果。

1 研究方法

1.1 Lasso變量選擇方法

Lasso(Least absolute shrinkage and selection operator,Lasso)即最小絕對值壓縮選擇算法,是一種基于絕對系數降低數據維度的方法。本質就是在傳統目標函數的基礎上添加懲罰項來壓縮變量的系數,強制類系數絕對值之和小于某個特定值,同時設定一些變量的回歸系數為零并將這些變量剔除,達到降維的目的,未被剔除的變量視為顯著變量。通過Lasso回歸分析進行特征提取可以有效降低神經網絡輸入變量的維度,解決變量之間存在多重共線性的問題,從而提高模型的有效性。假設有n組自變量為Xi(i=1,2,…,n),所選取因變量為Yi(i=1,2,…,n),Lasso回歸公式:

(1)

等價于:

(2)

1.2 時差相關分析及相空間重構

1.2.1 時差相關分析法

(3)

當l=0時,r0表示xt和yt之間的皮爾遜相關系數;當l>0時,x和y之間的關系為超前;當l<0時,x和y之間的關系為滯后。本文將黃金期貨收盤價作為基準指標,提取后的影響因素分別視為被分析指標,根據計算結果調整模型中相關變量的滯后階數。

1.2.2 相空間重構

相空間重構(Phase Space Reconstruction,PSR)通過對時序數據重構吸引子把數據的時間相關性轉換成更高維的空間向量。時間序列x(i),i=1,2,…,N的相空間重構

X(t)=(x(t),x(t+τ),…,x(t+(m-1)τ)

(4)

式中:t=1,2,…,N-(m-1)τ;m為嵌入維度;τ是延遲參數;X(t)表示為延遲向量。本文選取C-C算法[9]尋找最佳嵌入維度m和延遲參數τ。

1.3 PSO優化的BP神經網絡

1.3.1 PSO-BP神經網絡

粒子群優化算法(Particle Swarm optimization,PSO)是由Eberhart和Kennedy提出的一種基于鳥群覓食時群體與個體之間的合作與信息共享來尋找最優解的智能優化算法。本文利用PSO優化BP神經網絡中的初始連接權值與閾值以提高模型的準確率。主要步驟如下:

步驟1 初始化一粒子群并確定相關參數。設置本文PSO-BP模型中相關參數,粒子群規模大小為20;最大迭代進化次數為100;學習因子C1=1.5,C2=1.2。

步驟2 計算粒子相應的適應度值。適應度函數選用BP神經網絡所得的均方誤差,即所得適應度函數值越小所選粒子適應度越強。

步驟3 更新迭代過程。粒子通過計算適應度更新個體極值與群體極值從而尋找到個體局部最佳位置與群體中的全局最佳位置,更新公式

(5)

(6)

步驟4 判斷是否為最優解。若達到網絡預先設定的訓練次數或訓練誤差到達設定范圍內,則為最優解停止網絡訓練,輸出最終結果。

1.3.2 評判準則

選取平均絕對百分比誤差(MAPE)、均方根誤差(RMSE)和平均絕對誤差(MAE)3個統計指標對模型樣本外預測性能進行客觀的評價:

(7)

(8)

(9)

所構建的預測流程圖如圖1所示。

圖1 Lasso-PSO-BP模型預測流程圖

預測模型的主要步驟:

步驟1 確定主要變量,利用Lasso回歸分析找到黃金期貨收盤價的主要影響因素。

步驟2 確定各變量的滯后期,利用時差相關分析法確定主要影響因素的滯后期,相空間重構法確定收盤價自身的滯后期。

步驟3 預測,確定網絡的拓撲結構,采用PSO-BP神經網絡等模型進行預測。

步驟4 預測效果評價,選用MAPE、RMSE和MAE這3個統計指標分別對模型進行客觀評價。

2 實證分析

2.1 數據處理與預測評價準則

2.1.1 數據選取

2015年8月11日,匯改后形成了以供求關系為基礎,結合一籃子貨幣進行定價的匯率機制,使匯率更加合理化、國際化與市場化。黃金期貨作為一種金融衍生品,匯改制度的變化會在一定程度上對金融產品產生影響。為了消除不同匯率制度對黃金期貨收盤價的影響,選用上海黃金交易所自2015年8月11日匯改后到2021年4月1日的黃金期貨收盤價格日度數據,如圖2所示??紤]到影響黃金價格的相關因素,宏觀經濟指標大多數都以月度、季度或者年度為主,利用多變量預測黃金期貨收盤價日度數據,如表1所示,由于時差及國內外節假日等因素,對所有數據選取了有公共交易日的區間進行分析,最終得到1 182條樣本數據。數據均來自于Wind數據庫。

圖2 黃金期貨收盤價趨勢圖

表1 價格影響因素

2.2 預測結果及對比分析

2.2.1 Lasso變量選擇

利用Python進行編程可以實現特征提取,參數λ的取值范圍會影響到所選取變量的數目,當設定λ的取值過大時,會剔除某些重要變量,不利于預測模型的構建。最終本文選定的最優參數λ=0.000 509 4,并得到影響黃金期貨收盤價的7個因素,即上海金交所Au9995黃金現貨收盤價、美元兌人民幣匯率、英國布倫特原油現貨價(Dtd)、中債國債到期10年收益率和黃金期貨的成交量、最高價、最低價。選取的變量以及相對應的回歸系數如表2所示。

表2 Lasso選取的變量及回歸系數

2.2.2 滯后期確定

充分了解影響因素與收盤價之間的數據特征,能夠有效提高后續預測模型的準確率,利用時差相關分析法確定被提取變量的時間序列滯后期,采用C-C相空間重構法確定黃金期貨收盤價最佳嵌入維度m=4,延遲參數τ=2,即收盤價最佳滯后期為4期。根據公式(3)計算各變量滯后5期的時差相關系數,對比5期的時差相關分析系數,選取系數最大值所對應的期數,上海金交所Au9995黃金現貨收盤價、黃金期貨的最高價和最低價最佳滯后期均為1期;美元兌人民幣匯率、原油現貨價(Dtd)、中債國債收益率和成交量所選最佳滯后期均為5期。

表3 變量相關系數表

2.2.3 PSO-BP神經網絡預測結果

將滯后1期上海金交所Au9995黃金現貨收盤價、黃金期貨最高價與最低價;滯后4期的黃金期貨收盤價;滯后5期的美元兌人民幣匯率、原油現貨價(Dtd)、中債國債收益率和黃金期貨成交量共27個變量作為PSO-BP神經網絡的輸入層,下一天的黃金期貨收盤價格為輸出層。訓練集與測試集劃分比為9∶1,即1 059個訓練樣本,118個測試樣本。本文所用對比模型參數設置如表4所示,通過神經網絡進行仿真訓練,得到測試集上的預測結果如圖3~圖5所示。

表4 對比模型參數設置

BP神經網絡與其單一神經網絡的預測效果圖如圖3所示,ELM的預測效果好于BP與LSSVR神經網絡,這是由于ELM隨機設定神經網絡輸入層與隱含層之間參數值;BP神經網絡與經PSO優化的BP神經網絡在測試集上的預測結果如圖4所示,可以明顯看出PSO-BP神經網絡的走勢更貼近真實值;PSO優化BP、ELM與LSSVR模型的結果如圖5所示。不同模型的評判指標數據如表5所示,利用IR公式(10)計算提出模型與基準模型各指標的提升率,相對于其他模型的提升率結果如表6所示,可見PSO-BP神經網絡的預測效果要明顯優于其他模型。

(10)

圖3 BP金價預測模型擬合結果圖 圖4 PSO-BP金價預測模型擬合結果圖

圖5 PSO-BP、PSO-ELM與PSO-LSSVR金價預測模型擬合結果圖

表5 各模型評判指標及對比

表6 PSO-BP指標提升率

3 結 語

本文選用多變量對黃金期貨收盤價建立了Lasso-PSO-BP預測模型,并針對“811”匯改后的黃金期貨價格數據進行了實證分析與預測。通過Lasso對所選取的影響因素進行降維,在模型中選入與收盤價更加相關的變量,從而有效減少模型的訓練時間,提高模型的預測精度。從時間滯后的角度分析相關變量與收盤價之間的滯后關系,利用相空間重構法最大程度地尋找收盤價本身的數據特征,最終確定模型的拓撲結構。利用PSO優化傳統BP神經網絡的2個重要參數,捕捉收盤價非線性的特征。Lasso-PSO-BP神經網絡的預測效果要好于單一神經網絡預測模型,也要好于Lasso-PSO-ELM和Lasso-PSO-LSSVR模型。

猜你喜歡
相空間收盤價期貨
美棉出口良好 ICE期貨收高
國內尿素期貨小幅上漲
相干態輻射場的Husimi分布函數在非對易相空間中的表示
尿素期貨上市又近一步
股神榜
股神榜
股神榜
中糧期貨 忠良品格
股神榜
非對易空間中的三維諧振子Wigner函數
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合