?

基于WPT-ISO-RELM模型的月徑流時間序列預測研究

2024-03-18 01:31王應武白栩嘉崔東文
水力發電 2024年3期
關鍵詞:水文站徑流精度

王應武,白栩嘉,崔東文

(1.云南省水利水電勘測設計研究院,云南 昆明 650021;2.云南省文山州水務局,云南 文山 663000)

1 研究背景

準確的月徑流量時間序列預測為防澇減災、水資源的合理配置和調度提供科學依據和指導性建議。月徑流受降水、氣候、人類活動等因素影響,時序數據表現出高噪聲、非線性、非平穩性和多尺度等特征,導致未經數據分解處理的模型難以獲得滿意的預測效果[1-4]。由于月徑流影響因素眾多,并最終體現在隨時間變化的月徑流監測數據中,因此,可采用時間預測模型挖掘月徑流數據的潛藏規律,進一步預測其變化趨勢。近年來,時間序列預測模型已廣泛應用于月徑流預測,如王文川等[5]建立完全集合經驗模態分解方法(CEEMDAN)、變分模態分解(VMD)和BP神經網絡相融合的月徑流預測模型;劉尚東等[6]將極點模態分解法(ESMD)與最近鄰抽樣回歸模型(NNBR)結合構建耦合月徑流預測模型;張璐等[7]建立VMD、相空間重構(PSR)和貝葉斯神經網絡(BNN)相融合的月徑流預測模型;徐冬梅等[8]基于CEEMDAN、小波分解(WD)二次組合分解技術,構建CEEMDAN-WD-粒子群優化(PSO)-最小二乘支持向量機(LSSVM)月徑流組合預測模型;孫國梁等[9]構建VMD、麻雀搜索算法(SSA)與長短期記憶神經網絡(LSTM)相耦合的月徑流預測模型;梁曉鑫等[10]建立奇異譜分析(SSA)、梯度優化算法(GBO)與相關向量機(RVM)、支持向量機(SVM)相融合的月徑流預測模型;李新華等[11]構建小波包分解(WPD)-金槍魚優化算法(TSO)-極限學習機(ELM)組合月徑流預測模型;楊瓊波等[12]建立WPD、人工水母搜索算法(AJS)、數據分組處理方法(GMDH)組合月徑流預測模型;席東潔等[13]建立經驗模態分解(EMD)與Elman神經網絡組合月徑流預測模型;桑宇婷等[14]建立互補集合經驗模態分解(CEEMD)與BP神經網絡組合月徑流預測模型;王麗麗等[15]構建SSA、灰狼優化算法(GWO)、回歸支持向量機(SVR)融合月徑流預測模型。

正則化極限學習機(Regularized extreme learning machine,RELM)主要為解決極限學習機(Extreme learning machine,ELM)泛化能力差、預測不穩定等問題而提出,具有訓練速度快、泛化能力好等優點,已在各行業領域得到廣泛應用。但在實際應用中,隨機給定的輸入層權值和隱含層偏差(簡稱“超參數”)在很大程度上影響了RELM的穩定性和預測精度。針對這一問題,PSO算法[16-17]、天牛群優化算法(BSO)[18]、蜉蝣算法(MA)[19]、鳥群算法(BSA)[20]等已被用于RELM超參數優化。

為提高月徑流時間序列預測的精度,驗證改進蛇群算法(Improve snake optimization,ISO)優化RELM超參數對模型性能的影響,提出小波包變換(Wavelet packet transform,WPT)-ISO-RELM預測模型,并構建WPT-SO-RELM、WPT-GWO-RELM、WPT-變色龍群算法(CSA)-RELM、WPT-鯨魚優化算法(WOA)-RELM、WPT-樽海鞘群體算法(SSA)-RELM、WPT-侏獴優化算法(DMO)-RELM、WPT-PSO-RELM模型、WPT-ISO-LSSVM、WPT-SO-LSSVM、WPT-GWO-LSSVM、WPT-CSA-LSSVM、WPT-WOA-LSSVM、WPT-SSA-LSSVM、WPT-DMO-LSSVM、WPT-PSO-LSSVM、WPT-RELM、ISO-RELM模型作對比分析模型,通過黑河流域鶯落峽水文站、討賴河水文站1956年1月~2009年12月月徑流預測實例對各模型進行驗證。

2 研究方法

2.1 小波包變換(WPT)

WPT能同時對信號低頻部分和高頻部分進行分解,更適用于波動激烈的月徑流時間序列分解。WPT對月徑流原始信號進行分解,具體參考文獻[11,21-22],其公式為

(1)

重構算法公式為

(2)

2.2 改進蛇群優化(ISO)算法

SO是F. A. Hashim等人于2022年提出的一種新型元啟發式優化算法。該算法靈感來自于蛇的覓食和繁殖行為,即通過模擬探索階段(覓食過程)和開發階段(繁殖過程)進行位置更新來達到求解優化問題的目的[23]?;維O數學描述簡述如下:

Xi=Xmin+r(Xmax-Xmin)

(3)

式中,Xi為第i個個體位置;r為介于0和1之間的隨機數;Xmax、Xmin分別為搜索空間上、下限值。

(2)定義溫度和食物量。SO算法中,其探索、開發階段主要受溫度Temp和食物量Q的影響,溫度Temp和食物量Q定義為

(4)

式中,t、T分別為當前迭代次數和最大迭代次數;c1為常數,取0.5。

(3)探索階段。SO算法中,若食物量Q<0.25,則蛇群個體選擇任何隨機位置來搜索食物并更新位置。位置更新描述為

(5)

(4)開發階段。SO開發階段相對復雜,分為靠近獵物、戰斗、交配等3種策略,3種策略均受溫度Temp和食物量Q的影響。

靠近獵物策略。SO算法中,若食物量Q>0.25且溫度Temp>0.6時,則蛇靠近獵物,位置更新如下

(6)

戰斗或交配策略。若溫度Temp≤0.6時,則蛇執行戰斗或交配策略。

戰斗策略位置更新為

(7)

交配策略位置更新為

(8)

(5)種群更新。SO算法中,若有蛇蛋孵化,則隨機生成位置替換最差雄性或雌性個體位置,數學描述為

(9)

SO已被驗證具有較好的尋優性能[23],但對于復雜優化問題,SO仍然存在搜索能力不足和搜索精度低等不足。為進一步提高SO的全局和局部搜索性能,本文針對常數c1、c2、c3改進如下

(10)

2.3 正則化極限學習機(RELM)

ELM是一種廣義的單隱層前饋神經網絡,具有較快的學習速度和良好的泛化能力。給定M個樣本Xk={xk,yk},k=1,2,…,M,其中xk為輸入數據,yk為真實值,激勵函數為f(·),隱層節點為m個,ELM輸出可表示為[24-25]

(11)

式中,oj為輸出值;Wi={ωi1,ωi2,…,ωim}′為輸入層節點與第i個隱含層節點的連接權值;bi為第i個輸入節點和隱含層節點的偏值;λi為第i個隱含層節點與輸出節點的連接權值。

在實際應用中,ELM存在過擬合、可控性弱等缺點。為克服ELM不足,Deng等[26]在ELM中引入結構風險和正則化系數C,通過參數C來調節結構風險與經驗風險的比例,以改善ELM過擬合問題[27-28]。RELM數學模型目標函數表述為

(12)

受限于

(13)

2.4 建模流程

步驟1。利用2層WPT對鶯落峽水文站、討賴河水文站月徑流時序數據進行分解,得到2個高頻分量[2,1]、[2,2]和2個低頻分量[2,3]、[2,4],見圖1。從圖1可以看出,高頻分量波動激烈,頻率大、振幅小,大致反映了月徑流時序數據的隨機變化情況;低頻分量波動較緩,頻率小、振幅大,大致反映了月徑流時序數據的變化趨勢。本文選取鶯落峽水文站、討賴河水文站月徑流時序數據的80%作為訓練樣本,剩余的20%作為預測樣本。

圖1 月徑流時序數據2層WPT分解

步驟2。參考文獻[11,21-22],利用Cao方法確定圖1中低頻和高頻分量的輸入步長a,并利用前a個月的徑流分量預測未來1個月的分量值,即輸入層節點數為a,輸出層節點數為1。利用同樣的方法確定原始月徑流的輸入步長a,計算結果見表1。

表1 輸入步長a的計算結果

依據表1,預測模型的輸入、輸出可表述為

(14)

式中,M為樣本數量;a為輸入步長,即嵌入維度。

步驟3。利用低頻和高頻分量的訓練樣本擬合值與實際值構建均方誤差(MSE),并將其作為ISO、SO、GWO、CSA、WOA、SSA、DMO、PSO算法優化RELM超參數的適應度函數,其公式為

(15)

步驟4。設置ISO、SO、GWO、CSA、WOA、SSA、DMO、PSO算法的種群規模為50,最大迭代次數為200,其他參數采用算法默認值(本文著重介紹ISO算法優化過程,其他7種算法優化過程可參考ISO算法實現)。利用式(3)隨機初始化蛇群個體位置Xi,將蛇群規模N分為相等的兩組Nm、Nf。

RELM、LSSVM參數設置如下:RELM選用含有一個隱含層的3層網絡結構,隱含層節點數設置為a(a為輸入步長),激活函數選擇sigmoid函數,超參數搜索空間設置為[-1,1],其中RELM網絡正則化系數C設置為1×10-10;LSSVM核函數g和正則化參數γ搜索空間均設置為[0.01,2 000],式(15)為8種算法優化的適應度函數。為驗證優化效果,RELM模型參數設置同上;所有模型的原始數據進行[0,1]歸一化處理。

步驟5。計算蛇群所有個體適應度值,找到并保存當前最佳獵物位置Xfood。令當前迭代次數t=1。

步驟6。計算c1、c2、c3值,分別將其代入式(4)~式(8)。若食物量Q<0.25,則利用式(5)更新雄性和雌性位置;若食物量Q>0.25且溫度Temp>0.6,則利用式(6)更新位置;若溫度Temp≤0.6,則利用式(7)、式(8)更新位置。

步驟7?;谑?9)替換具有最差位置的雄性或雌性個體。

步驟8。利用更新后的蛇群個體位置計算適應度值,比較并保存當前最佳獵物位置Xfood。

步驟9。重復步驟6~步驟9直至滿足算法終止條件。

步驟10。 輸出全局最佳獵物位置Xfood,該位置即為RELM最佳超參數。利用該超參數建立WPT-ISO-RELM等模型對低頻、高頻分量進行預測和重構。

步驟11。利用平均絕對百分比誤差MAPE、平均絕對誤差MAE和納什效率系數NSE對模型進行評價。

3 模型驗證

數據來源于國家冰川凍土沙漠科學數據中心(http:∥www.ncdc.ac.cn)提供的鶯落峽水文站、討賴河水文站1956年1月~2009年12月共648組月徑流時序數據,月徑流過程如圖1所示。從圖1可以看出,鶯落峽水文站、討賴河水文站月徑流序列波動性較大,復雜程度較高,呈現出較強的非線性和非平穩性,不利于直接預測。

3.1 算法實例驗證

為驗證ISO優化性能,基于式(15)構建8個RELM超參數尋優適應度函數fMSE,利用ISO、SO、GWO、CSA、WOA、SSA、DMO、PSO分別對各適應度函數fMSE進行20次尋優,并利用最優值fB、最劣值fW和平均值fA對8種算法的實際優化性能進行評估,見表2、3,某次尋優曲線見圖2。

表2 鶯落峽水文站月徑流8種算法優化結果評估指標對比 10-3

表3 討賴河水文站月徑流8種算法優化結果評估指標對比 10-3

圖2 ISO等8種算法實例適應度函數尋優曲線

從表2、3和圖2可以得出:

(1)ISO尋優精度均優于SO、GWO、CSA、WOA、SSA、DMO、PSO等7種算法,表現出更好的尋優精度和全局優化性能,表明通過改進c1、c2、c3參數,ISO優化性能得到大幅提升??傮w而言,8種算法優化性能依次是ISO>SO>GWO>SSA>PSO>DMO>CSA。

(2)從圖2可以直觀看出,ISO尋優精度高、收斂速度快,表現最好;PSO、DMO、CSA在實例適應度函數尋優過程中陷入局部極值,表現較差。

3.2 預測結果及分析

利用WPT-ISO-RELM等模型對鶯落峽水文站、討賴河水文站的月徑流低頻、高頻分量進行訓練及預測,將預測結果加和重構后得到最終預測結果,同時構建ISO-RELM模型對原始月徑流序列進行訓練及預測,見表4。

表4 鶯落峽、討賴河水文站月徑流預測結果評估指標對比

由表4可知:

(1)WPT-ISO-RELM模型對鶯落峽水文站月徑流預測的MAPE、MAE、NSE分別為0.854%、0.245 m3/s、0.999 9,對討賴河水文站月徑流預測的MAPE、MAE、NSE分別為0.447%、0.068 m3/s、0.999 9,預測精度優于WPT-SO-RELM模型、WPT-GWO-RELM模型、WPT-CSA-RELM模型,遠優于其他對比模型,具有更高的預測精度和更好的穩健性能,將其用于月徑流時間序列預測是可行的。

(2)在相同預測器情形下,對于鶯落峽水文站月徑流序列,WPT-ISO-RELM模型預測的MAPE較WPT-SO-RELM模型、WPT-GWO-RELM模型、WPT-CSA-RELM模型、WPT-WOA-RELM模型、WPT-SSA-RELM模型、WPT-DMO-RELM模型、WPT-PSO-RELM模型分別提高12.4%、50.2%、61.0%、82.7%、53.7%、82.3%、69.2%,對討賴河水文站月徑流序列分別提高9.1%、55.2%、68.5%、81.6%、61.9%、83.5%、74.6%,表明ISO優化RELM超參數的效果要優于其他算法,算法優化性能越強,尋優精度越高,優化獲得的RELM超參數越優,由此構建的模型預測精度越高。

(3)與WPT-RELM模型相比,通過優化RELM超參數構建的模型,其預測性能均得到大幅提升,表明采用智能算法優化RELM超參數,能大大改善RELM網絡的預測性能。

(4)與ISO-RELM模型相比,采用WPT對月徑流時序數據進行分解,其預測精度得到顯著提升,表明WPT能有效將月徑流原始序列分解為更具規律的低頻和高頻分量,大大提高了模型的預測精度。

(5)由于RELM超參數優化維度Dim=inputnum×hiddennum+hiddennum(inputnum、hiddennum分別為輸入層、隱藏層神經元個數),因此,本文RELM超參數優化維度在132~756之間,屬高維優化問題;而LSSVM超參數僅有2個,屬2維優化問題。從表4預測結果來看,對于高維優化問題,ISO優化效果最好,SO、GWO、SSA次之,PSO、DMO、CSA優化效果較差;對于2維優化問題,雖然ISO優化效果最好,但與其他算法優化效果差別不大,其他7種算法均對LSSVM超參數有著較好的優化效果??梢?,基于c1、c2、c3參數改進的ISO算法,無論是高維還是低維優化,均具有較好的全局極值尋優能力;同時也可看出,對于高維RELM超參數優化問題,算法的尋優性能對提升RELM預測精度十分關鍵。

4 結 論

為驗證ISO改進效果和優化算法尋優能力對RELM超參數尋優效果的影響,基于WPT分解方法和ISO、SO、GWO、CSA、WOA、SSA、DMO、PSO共8種群體智能算法,提出了WPT-ISO-RELM、WPT-SO-RELM、WPT-GWO-RELM、WPT-CSA-RELM、WPT-WOA-RELM、WPT-SSA-RELM、WPT-DMO-RELM、WPT-PSO-RELM等8種組合時間序列預測模型,并構建若干對比模型,以黑河流域鶯落峽水文站、討賴河水文站月徑流預測實例對各模型性能進行驗證,得到以下結論:

(1)對于實例適應度函數fMSE,ISO尋優效果均優于SO、GWO、CSA、WOA、SSA、DMO、PSO,具有較好尋優精度和收斂性能,通過改進c1、c2、c3參數,能有效提升ISO極值尋優能力和平衡能力。

(2)WPT-ISO-RELM模型對鶯落峽水文站、討賴河水文站月徑流的預測效果均優于其他對比模型,具有更高的預測精度和更好的穩健性能。

(3)對于高維優化問題(RELM超參數優化),ISO優化效果最好,SO、GWO、SSA次之,PSO、DMO、CSA優化效果較差;算法尋優性能對提升RELM預測精度十分關鍵,算法優化性能越強,尋優精度越高,由此獲得的RELM超參數越優,所構建的模型預測性能越好。對于低維優化問題(LSSVM超參數優化),ISO、SO、GWO、CSA、WOA、SSA、DMO、PSO等8種算法均具有較好的優化效果,但ISO優化效果最好。

(4)WPT能有效挖掘原始序列中的內部特征信息,獲得更具規律的低頻和高頻分量,更容易建模預測。

(5)本文提出的模型及組合方法可為相關預測研究提供參考,具有較好的實際應用和推廣價值。

猜你喜歡
水文站徑流精度
SL流量計在特殊河段的應用——以河源水文站為例
基于DSPIC33F微處理器的采集精度的提高
郭家屯水文站單斷沙關系分析
草壩水文站兩種蒸發器對比分析
韓府灣水文站報汛方案
Topmodel在布哈河流域徑流模擬中的應用
GPS/GLONASS/BDS組合PPP精度分析
探秘“大徑流”
攻克“大徑流”
改進的Goldschmidt雙精度浮點除法器
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合