?

基于改進粒子群算法的LSTM 股票預測模型

2022-10-25 13:41黃建華胡慶春
關鍵詞:特征選擇粒子預測

黃建華, 鐘 敏, 胡慶春

(華東理工大學信息科學與工程學院, 上海 200237)

自從股票市場誕生以來,股票價格的預測一直備受關注,同時也是一項巨大的挑戰[1],人們嘗試通過各種算法來預測股票價格的未來走勢以獲取收益。最早是以隨機波動的方式來描述股票價格的變動[2],此后國內外學者提出了更多的算法來描述股票行為,如傳統的時間系列預測方法有指數平滑法( Exponential Smoothing) 、 多 元 線 性 回 歸 模 型(Multivariable Linear Regression)、自回歸滑動平均模型(ARMA)、差分整合移動平均自回歸模型(ARIMA)等[3-4]。由于影響股價的因素眾多,影響機理也非常復雜,使用這些簡單的數學模型難以獲得較好的預測精度。隨著人工智能的發展,許多機器學習模型由于能夠更好地處理非線性問題,有著更好的擬合能力,因而被廣泛應用到股票價格預測中,如支持向量機(SVM)、決策樹(Decision Tree)、隨機森林(Random Forest)和深度神經網絡(RNN,LSTM)等[5]。

研究表明針對復雜的金融時間序列,深度學習算法是目前最適合進行股票市場預測的算法。在眾多深度神經網絡模型中,LSTM 網絡被廣泛應用于各種時間序列分析任務中[6]。LSTM 網絡克服了梯度消失(或爆炸)的問題,能夠通過記憶單元有效地學習長期依賴關系,優于傳統的RNN[7],所以,在處理股票價格這樣的時間序列數據時,LSTM 網絡更為合適。文獻[8-9]指出,無論是預測股票價格還是股票收益,基于LSTM 神經網絡的模型預測效果更好,風險更低。文獻[10]的分析表明,在金融市場預測中,LSTM 網絡適合此領域,并且以明顯的優勢擊敗了其他預測模型。

盡管在時間序列和模式識別問題中,LSTM 網絡是一種強大的工具,能夠顯著地處理要解決的目標問題,但LSTM 網絡仍存在一些不足。首先,包括LSTM 網絡在內的神經網絡模型缺乏解釋模型所獲得的最終決策的能力,無法為實現預測結果所使用的參數提供具體的解釋[11];其次,模型的參數通常由經驗決定,主觀性強,會影響模型的擬合能力;最后,LSTM 網絡的神經元數量、學習率和迭代次數難以確定,因此,研究人員一直在探索改進LSTM 網絡的方法。文獻[11-12]分別使用基于小波變換和Adam、遺傳算法優化LSTM 網絡;文獻[13-15]采用粒子群算法(PSO)對LSTM 網絡參數進行優化。通過與遺傳算法、小波變換等算法比較,發現PSO 算法作為優化算法求解精度更高、收斂速度更快、性能更優,在優化應用中使用頻率更高。盡管PSO 算法被廣泛應用于LSTM 網絡的優化,但優化后的算法在股票市場卻少有應用,尤其是經過優化后的PSO 算法對LSTM 網絡進行優化構建的股票價格預測模型相對更少。

針對以上問題,本文將PSO 算法應用于LSTM網絡的優化,提出了基于改進PSO 算法優化LSTM的股票預測模型。通過優化算法對LSTM 網絡的重要參數尋優,解決LSTM 網絡缺乏解釋模型所獲得的最終決策的能力以及受人為因素影響的問題,以提高預測精度。為了提高優化效果,對相應的PSO 算法進行了優化操作,通過動態調整PSO 算法中的慣性權重學習因子來構建動態多群粒子群優化器(Dynamic multi-swarm PSO,DMPSO),解決了PSO 算法容易陷入局部最優的問題,提高了尋優精度。優化后的PSO 算法與LSTM 網絡相結合,構建股票預測模型,提高了LSTM 網絡在處理時間系列數據時的有效性及精確性,從而提高了股票價格的預測精度。同時,為了減少篩選出與待預測指標高度相關的指標特征,降低模型訓練的成本及復雜度,提高模型預測精度,使用多種特征選擇算法構建特征選擇委員會[16],進行指標的過濾篩選,得到完善的預測指標體系。

1 相關工作

1.1 LSTM 網絡

LSTM 網絡是一種特殊的循環神經網絡,它在RNN 的基礎上進行了改進[17],通過增加輸入門、遺忘門和輸出門,緩解了模型訓練中梯度消失和梯度爆炸的問題,彌補了傳統RNN 模型的不足。

圖1 示出了LSTM 網絡的單元結構,共有4 層。圖1 中ht、ht-1為當前單元及上一個單元的輸出;xt為當前單元的輸入;sigmoid、tanh 為激活函數;圖中的圓圈均表示向量之間的算術規則;Ct為神經元在t時刻的狀態;ft為遺忘閾值,該閾值通過sigmoid 激活函數控制細胞應該如何丟棄信息;it為輸入閾值,該閾值決定了sigmoid 函數需要更新的信息,然后使用tanh 激活函數生成新的記憶Ct,并最終控制向神經元狀態添加多少新信息;ot為輸出閾值,該閾值決定了sigmoid 函數輸出神經元狀態的哪些部分,并使用tanh 激活函數處理神經元狀態,得到最終的結果。計算公式如下:

圖1 LSTM 網絡單元結構Fig.1 LSTM network structure

其中:Wf、Wi、Wo、Wc分別為遺忘門、輸入門、輸出門以及神經元狀態矩陣對應的權系數矩陣;bf、bi、bo、bc分別表示對應的偏移常數。根據上述公式,可以進一步計算神經元的狀態Ct和輸出ht。

通過3 個控制門機制,完成神經元的內部處理,保證LSTM 網絡能夠有效地利用輸入數據,對過去長期數據形成記憶,能夠學習長期的依賴關系。

1.2 PSO 算法

PSO 算法是一種元啟發式算法,它的思想源于優勝劣汰的自然進化,該方法模擬了社會行為,如鳥群聚集[18]。相比于普通的遺傳算法,PSO 算法沒有交叉與變異的操作,它通過學習當前粒子群的最優解來獲取最終解。

PSO 算法可描述為:假設在一個D維搜索空間,m個粒子構成的一個種群,則t時刻第i個粒子的位置為,速度為,個體最優位置為,全局最優位置為gtbest,因而該粒子在t+1 時刻的速度和位置信息為式(7)和式(8)。

其中:ω為慣性權重;c1和c2為學習因子;r1和r2為均勻分布在[0,1]的隨機數。

1.3 特征選擇算法

特征選擇算法的定義為:從現有的特征集中,根據實際情況篩選出最適合作為訓練特征集的方法。通常,對于給定的數據集,假設包含n個特征,則F={f1,···,fn}為特征集,特征選擇算法需要從F中挑選出一個合適的子集F={f1,···,fm} ,m為特征選擇后的特征數,其中mn,以此實現數據的降維。 目前已有的特征選擇算法根據處理方式主要分為過濾式、封裝式及嵌入式。常見的過濾式特征選擇算法主要有最大信息系數(Maximal Information Coefficient,MIC)、皮爾遜(Pearson)相關系數法、方差選擇法、Relief 及卡方檢驗法等;最常用的封裝式特征選擇算法為遞歸特征消除(Recursive Feature Elimination,RFE);最常用的嵌入式算法有Lasso 回歸及分類決策樹等。通過對不同類別的特征選擇算法比較,篩選出以下幾種常用算法:

(1)Pearson 相關系數。通過計算變量間的線性相關強度r來評估特征間的相關性,計算公式如下:

(2)MIC。該算法不僅能衡量變量間的線性相關關系,也可用于分析變量間的非線性相關強度。MIC 的算法流程是將兩個變量x和y在二維空間中構成散點圖,形成x×y的網格,然后計算不同分割尺度下的互信息值I(X,Y) ,最大的互信息值則為max{I(x,y) },對此值進行歸一化,通過式(10) 得到歸一化后的特征矩陣,式(10)中p(x,y)為X和Y的聯合概率密度函數,p(x) 和p(y) 分別為X和Y的邊際概率密度函數。然后通過式(11)、式(12) 獲得MIC 值。

(3)Lasso 回歸。該算法屬于正則化回歸,主要通過構建懲罰函數并對其正則化來防止產生過擬合現象,比較適合用于變量的選擇。懲罰函數如下:,

其中:m為樣本數;n為特征數;ω與θ分別是長度為n、n+1 的 向 量;b為 常 數;λ為 常 數 系 數; ‖ω‖1為L1 范數。

(4)RFE。通過多次迭代構建模型對特征進行篩選。每次迭代篩選出優質特征后,剩余特征繼續進行下一次迭代,直到遍歷完所有特征,特征被篩選出來的順序則代表特征的優劣,而是否為優質特征則通過設置一定的閾值來判斷。

(5)隨機森林(Random Forest,RF)?;跊Q策樹構建的分類器,通過計算每個特征對每棵決策樹的貢獻度,然后以求平均值或者投票的方式計算出特征的最終貢獻度,以此比較篩選出貢獻較大的特征,實現對特征的重要性評估。

2 基于改進PSO 算法的LSTM 預測模型

將PSO 算法與LSTM 網絡相結合,能有效地實現LSTM 網絡參數的尋優。但傳統的PSO 算法容易在尋優過程中陷入局部最優,影響尋優效果,從而影響模型的預測精度。本文引入動態調整理念,控制PSO 算法參數的動態變化及實現尋優過程中子群的動態劃分來平衡算法的全局與局部搜索能力,實現更好的尋優效果,從而有效提高預測模型的擬合能力,提高股票價格預測的準確性。同時基于多種特征選擇算法構建的特征選擇委員會篩選出優質指標,將其用于股票預測模型的訓練,達到優化預測過程的目的。

2.1 基于委員會投票的特征選擇模型

現有的研究中,通常使用單一的特征選擇算法,導致對樣本數據特征的篩選不夠全面,具有一定的局限性。為了能夠結合各特征選擇算法的優點,克服單一選擇算法存在的問題,本文使用Pearson 相關系數、MIC、Lasso 回歸、RFE 以及RF 特征選擇算法組成特征選擇委員會,完成特征重要度的衡量,并通過委員會投票進行最終的特征篩選。

圖2 示出了基于委員會投票的特征選擇模型的工作流程。由圖2 可知,此模型的工作流程分為兩個階段。

圖2 特征選擇模型工作流程Fig.2 Workflow of feature selection model

(1)重要指標特征集的獲取。針對每個指標特征使用選定的5 種特征選擇算法進行重要度計算。計算后的重要度值使用三分位數的方式進行分類。重要度值位于2/3 分位數與最大值之間的指標為“強”指標;重要度值位于1/3 至2/3 分位數之間的指標為“中”指標;而重要度小于1/3 分位數的指標則為“弱”指標。將“弱”指標剔除,保留“強”與“中”指標,獲得重要的指標特征集。

(2)最優指標特征集的獲取。針對篩選出的重要特征,將分別為其投票。投票流程則為統計每個指標特征由5 種特征選擇算法計算出的重要度為“強”及“中”的個數,因而各指標的票數取值可能為1、2、3、4、5。為了能夠客觀地評估各指標特征,本文將只選取獲得票數為3、4、5 的指標,而票數小于3 的指標則表明大部分特征選擇算法認為其不重要,在后續的研究中將不予考慮。

2.2 改進的PSO 算法

2.2.1 慣性權重的動態調整 PSO 算法中的慣性權重ω能使粒子保持運動慣性,擁有拓展搜索空間的趨勢,是平衡算法全局和局部搜索能力的重要參數。常用的慣性權重分配策略是線性遞減分配,雖易實現,但隨著迭代次數的線性增加,仍然存在慣性權重過小、算法的全局搜索能力變差、易陷入局部最優的問題,且在算法搜索后期,群體的多樣性會有所缺失,導致算法在搜索后期的收斂速度明顯變慢[19]。

本文采用余弦函數來控制慣性權值的變化[20],使ω的取值具有隨機性。同時加入服從貝塔分布的隨機調整策略,實現對慣性權重的動態調整,從而更好地平衡算法的全局和局部搜索能力。其中,貝塔分布是在統計數據擬合中被廣泛使用的一組定義在(0,1)區間的連續概率分布,且能夠擬合出均勻分布、正態分布等多種分布形式[21]。動態調整慣性權重的計算公式如下:

其中:ωmax和ωmin分別為慣性權重的最大值和最小值;Tmax為粒子最大迭代次數;σ為慣性調整因子;betarnd 生成服從貝塔分布的隨機數,a和b是貝塔分布的兩個參數。

2.2.2 學習因子的動態調整 PSO 算法中的學習因子c1和c2主要用于調整粒子移動到個體最優和全局最優的步長,為了加快迭代早期的搜索速度,提高全局搜索能力,通常需要將c1的值由大變小,c2的值由小變大,以方便迭代后期的局部求精搜索?,F有的優化研究極少考慮對學習因子的優化,而傳統的PSO 算法通常設置c1=c2,且等于一個固定值,不能滿足學習因子在實際應用中的需求。在眾多尋優算法中,正余弦函數常被用來調整尋優參數[22],能夠通過多次迭代獲得大量的隨機解,實現參數的動態變化,并且可以控制參數的大小范圍,避免隨著迭代次數的增加出現參數極大或者極小的情況。因此,本文使用余弦函數來改善學習因子,提出了基于余弦函數的學習因子計算方法,如式(15)和(16)所示:

隨著迭代次數的增加,余弦函數的絕對值也相應增加,在(0,2)的取值范圍內,c1能夠非線性地減小,相反c2值能夠非線性地增大,從而在迭代過程中實現學習因子的動態變化,獲得更好的尋優效果。

2.2.3 粒子位置更新 為了加快PSO 算法的收斂速度,避免早熟現象的產生,本文對簡化粒子群算法[20]進行了改進,去除粒子的速度更新,在僅使用位置更新的前提下,再結合均值粒子群算法思想,通過使用個體最優位置和全局最優位置的線性組合取代算法中的個體最優位置和全局最優位置,因此能夠更好地控制粒子的飛行方向與當前位置方向的偏移,保障尋優過程的高效進行,從而加快算法的收斂速度。具體的實現公式如下:

通過結合式(14)、式(15)、式(16) 動態調整PSO 算法的慣性權重及學習因子,再與式(17)結合來簡化粒子位置更新,實現了對PSO 算法的優化,解決了PSO 算法容易陷入局部最優的問題,同時可加快早期的搜索速度,提高全局搜索能力及尋優精度。

2.2.4 動態多子群的構建 采用動態多種群PSO 算法[23]對鄰域拓撲結構進行改進,可以改變粒子的學習模式,實現子群的動態劃分,改善PSO 算法的早熟現象。將整個粒子群劃分為若干個包含少量粒子的種群,小種群再利用自身的歷史最優信息進行搜索,結合隨機重組調度,即每間隔R代后進行種群隨機重組。R為重組周期,以此實現種群間的信息交互。圖3 示出了動態子群的構建過程。所有子群并行搜索,沒有信息交換,每隔R次迭代后,子群隨機重組,就有可能使子群所獲得的最佳位置與其他子群的粒子進行交換,從而創造更優的條件來探索更好的尋優方案。文獻[24]的研究結果表明,重組周期R為5 時,尋優效果最好,因而本文將R的值設定為5。

圖3 動態子群構建過程Fig.3 Construction process of dynamic subgroups

2.3 改進的LSTM 股票預測模型

LSTM 模型中隱藏層的作用是將輸入數據的特征抽象化,以便進行更好的線性劃分。其中的神經元數量對應著線性劃分的數量,若神經元過少,LSTM 模型則不具備必要的學習能力和信息處理能力。相反,若神經元過多,不僅會導致LSTM 模型的結構復雜,還容易導致訓練結果過擬合。在股票市場預測中,由于股票數據的時效性較強,與待預測時刻間隔越短的數據對預測結果影響越大。為了使預測的結果更加精確,需要控制每次訓練的樣本數,選擇合適的時間窗大小。

為了解決上述問題,使模型網絡結構與股票數據特征相匹配,本文采用改進后的PSO 算法構建動態多群粒子群優化器(DMPSO),并與LSTM 模型結合構建了一個全新的股票價格預測模型(DMPSOLSTM)。該模型將時間窗口大小、batchsize、隱藏層神經元數目作為尋優對象。LSTM 模型的優化工作分為4 個階段:

(1)參數及網絡結構確定。首先明確LSTM 模型的網絡結構及初始化參數,分別包括輸入層、隱藏層和輸出層中神經元的數量,以及各層神經元之間相互連接的權重,同時包括模型訓練時的時間窗口大小、batchsize。

(2)初始化編碼。根據待優化參數所取的隨機值完成粒子位置信息的隨機初始化。

(3)確認粒子評價函數。為了能夠充分評估參數最優值,選取訓練次數達到極限后得到的LSTM模型驗證數據的均方誤差(MSE)作為個體適應度函數,以適應度最小值作為PSO 算法的迭代目標。適應度函數f的定義如下:

其中:K為數據集的大??;yi為第i個真實值;為第i個數據的預測值。

(4)結果判斷。使用DMPSO 優化器進行尋優,當達到收斂條件時停止尋優,輸出最終的尋優結果,即模型參數最優值。

LSTM 模型的優化工作為預測模型構建的核心,圖4 示出了預測模型的構建流程。通過樣本數據訓練模型,在此過程中對參數尋優。

圖4 改進的LSTM 預測模型Fig.4 Improved LSTM prediction model

具體的算法流程如下:

(1)預處理樣本數據。首先,檢測異常值并丟棄,補充缺值并排序,降低噪音;然后,將數據集進行歸一化,以避免LSTM 網絡對輸入數據的規模敏感;最后,進行特征選擇,提高預測精度。

(2)初始化參數。確定待優化參數的種群大小、迭代次數、學習因子、慣性權重和定義區間。

(3)初始化粒子的位置。隨機生成一個種群粒子Xi,0(h1,h2,n,m),其中,h1為第1 層隱藏層的神經元數,h2為第2 層隱藏層的神經元數,n為滑動窗大小,m為LSTM 網絡的batchsize。

(4)根據式(18)計算粒子的適應度值,通過粒子對應的參數構建LSTM 網絡模型,使用訓練數據進行模型的訓練。通過驗證數據進行預測,獲取預測結果的MSE 作為適應度值。

(5)根據適應度值及子群的劃分,確定粒子最優值,并通過式(14)~式(17)更新粒子的位置信息。在迭代過程中,不斷更新粒子的位置至最大迭代次數,輸出優化后的參數值。

(6)利用最優參數構建預測模型。通過測試數據集完成預測驗證。

3 實驗結果與討論

實驗選取上證指數(000001.SH)及深證成指(399001.SZ)對模型的性能進行評估。數據中選取了股票市場的交易指標、行情指標以及技術指標,具體數據類別見表1。具體數據通過Choise 金融終端及優礦平臺獲得,其中時間段為2000 年7 月3 日至2021 年1 月29 日,包括了上證指數4 995 條數據及深證成指的4 994 條數據。

表1 股票價格預測指標Table1 Stock price prediction index

實驗前對數據中的空缺數據進行刪除操作,并按時間對數據進行排序。為了更好地評估模型性能,選用SVM、RNN、RF、LSTM 模型及PSO-LSTM與改進后的DMPSO-LSTM 模型進行對比實驗。為了對比優化后PSO 算法的尋優效果,同時也與PSOLSTM 模型的預測效果進行了比較。

3.1 模型評價標準

為了顯示每個模型的預測效果,采用均方根誤差(RMSE)、平均絕對百分比誤差(MAPE)、平均絕對誤差(MAE)以及決定系數(R2)這4 個指標來衡量每個模型的性能。具體公式如下:

其中:N為樣本數;為模型預測值;yn為樣本真實值;y'為樣本真實值的平均值。

3.2 實驗分析

3.2.1 預測指標體系構建 首先通過基于多種特征選擇算法的組合模型計算各特征的重要度,用于衡量各指標的重要性,然后通過投票的方式決定是否保留指標。表2、表3 分別示出了兩支股票數據指標特征重要度的計算值,根據計算后的重要度值,將計算值按照“強(S)”、“中(M)”、“弱(W)”進行分類。

表2 指標重要度(上證指數000001.SH)Table2 Importance of indexs(Shanghai component index 000001.SH)

表3 指標重要度(深證成指399001.SZ)Table3 Importance of indexs (Shenzhen component index 399001.SZ)

基于特征篩選規則,將票數小于3 的指標剔除。其中,上證指數被剔除了6 個指標,分別為Rf、Applies、OBV6、RSI、ADX 以及Aroon;深證成指被剔除了5 個指標,分別為Applies、OBV6、ROC6、RSI及Aroon。

3.2.2 DMPSO 尋優 為了能夠直觀地了解DMPSO優化器的高效性,通過Griewank(f1)、Rastrigin(f2)和Schaffe(f3)這3 個具有代表性的函數進行驗證,公式如下:

表4 示出了3 個函數通過DMPSO 優化器與PSO 算法的尋優結果對比。通過各函數尋優后的最優適應度值(Best fitness)、最小值(Mini)、平均值(Average)以及方差(Variance) 的對比可知,DMPSO優化器的測試結果明顯優于PSO 算法。

表4 PSO 與DMPSO 的尋優結果Table4 Optimization results of PSO and DMPSO

使用DMPSO 對各支股票預測模型的參數尋優,圖5 示出了尋優迭代圖。其中圖5(a)示出了上證指數數據訓練所得最優參數,分別為時間窗大小為6、batchsize 為17、第1 層隱藏層單元數為62、第2層隱藏層單元數為88。圖5(b)示出了深證成指數據訓練所得最優參數,分別為時間窗大小為1、batchsize 為3、第1 層隱藏層單元數為19、第2 層隱藏層單元數為6。

圖5 DMPSO 尋優迭代過程Fig.5 Optimization iterative process of DMPSO

3.2.3 股票價格預測 基于3.2.2 節的參數最優值構建的預測模型進行股票價格的預測,將經過特征篩選的兩支股票數據作為預測模型的輸入,驗證模型的有效性及普適性,并通過與多種算法的預測結果進行對比,使用模型評價指標驗證模型的高效性。

圖6 示出了各模型對上證指數收盤價的預測效果對比圖。從圖中可以看出,DMPSO-LSTM 模型的預測值與真實值之間的偏差較小,預測曲線更接近于真實值曲線,擬合程度更高。無論是預測的準確性,還是減弱預測結果的滯后性,該模型都優于其他預測模型。

圖6 各模型對上證指數的預測結果Fig.6 Forecast results of each model to Shanghai component index

為了更加直觀、準確地驗證各個模型的預測效果,體現本文模型的性能優勢,表5 示出了各個模型的評估結果。

由表5 可知,DMPSO-LSTM 模型對應的RMSE、MAPE、MAE 值分別為35.921 4、0.006 7、25.337 4,相比其他模型,DMPSO-LSTM 模型的評價指標都是最低的,且該模型的R2為0.931 5,更接近于1,擬合優度越大,模型的擬合效果更佳。其中,DMPSO-LSTM的RMSE 指標比SVM 低20.74%,比RF 低17.22%,比RNN 低17.37%,比LSTM 低10.23%,比PSO-LSTM低6.7%;MAPE 指標比其他5 種模型分別低46.40%、44.17%、37.96%、32.32%、28.72%;MAE指標則分別減少了28.00%、21.11%、25.89%、12.65%、9.19%。綜上可知,無論是相比于傳統的預測模型還是神經網絡模型,DMPSO-LSTM 模型都擁有更好的預測效果。

表5 各模型的評估結果(上證指數)Table5 Evaluation results of models( Shanghai component index)

為了驗證模型的通用性,實驗還選擇了深證成指數據進行模型訓練與預測。圖7 示出了DMPSOLSTM 模 型 與SVM、RNN、RF、LSTM 以 及PSOLSTM 模型的預測效果對比結果。從圖7 可以看出,DMPSO-LSTM 模型的預測效果優于其他模型。表6示出了各個模型的評價結果??梢钥闯?,DMPSOLSTM 模型的RMSE、MAPE 以及MAE 的值相比其他5 個模型都是最低,R2值更接近1,模型的預測效果最佳。

圖7 各模型對深證成指的預測結果Fig.7 Forecast results of each model to Shenzhen component index

表6 各模型評估結果(深證成指)Table6 Evaluation results of models( Shenzhen component index)

綜合預測結果表明,本文所提出的DMPSOLSTM 模型對于處理時間系列數據更有效,且預測精度較高,具有通用性。

4 結束語

為了提高股票價格預測模型的預測效果,本文提出了使用DMPSO 優化器優化LSTM 的股票價格預測模型,DMPSO 算法在參數尋優時,無論在收斂速度,還是搜索能力方面都體現出了明顯的優勢。利用DMPSO 對LSTM 網絡的重要參數尋優,減少了人為因素影響,提高了模型的預測精度。實驗對比了DMPSO-LSTM、PSO-LSTM、統計模型、其他機器學習模型的預測精度,結果表明DMPSO-LSTM 模型對于股票價格預測具有較高的預測精度,驗證了該模型的有效性。實驗數據選擇了上證指數及深證成指,也驗證了模型的普遍適用性。同時,實驗考慮了冗余特征的存在,通過特征屬性間的相關性分析,篩選出與預測值負相關以及低度相關的特征,訓練新的模型,在一定程度上進一步提高了模型的預測精度。

面對復雜的股票市場,DMPSO-LSTM 模型能夠實現更加快速、準確的預測,可在一定程度上降低投資者的風險。該模型能夠高效地處理時間系列,具有可遷移性,針對其他時間系列問題,也具有一定的實際應用價值。

猜你喜歡
特征選擇粒子預測
無可預測
選修2-2期中考試預測卷(A卷)
選修2-2期中考試預測卷(B卷)
Conduit necrosis following esophagectomy:An up-to-date literature review
基于粒子群優化的橋式起重機模糊PID控制
基于粒子群優化極點配置的空燃比輸出反饋控制
不必預測未來,只需把握現在
Kmeans 應用與特征選擇
聯合互信息水下目標特征選擇算法
基于特征選擇聚類方法的稀疏TSK模糊系統
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合