?

基于GEO-RVM模型的枯水期月徑流預報研究

2022-09-02 08:57張亞杰崔東文
人民珠江 2022年8期
關鍵詞:金雕徑流獵物

張亞杰,崔東文

(1.云南省玉溪市易門縣水利局,云南 玉溪 651100;2.云南省文山州水務局,云南 文山 663000)

枯水期江河流量小,水資源供需矛盾突出。提高枯水期月徑流預報精度對于緩解生產生活用水供需矛盾具有重要意義。目前用于月徑流預報的方法有傳統人工神經網絡法[1-2]、支持向量機法[3-5]、長短時記憶神經網絡法[6]、組合預測法等[7]。在國內月徑流相關預報研究中,由于支持向量機(support vector machines,SVM)具有結構簡單、全局理論最優、克服維數災等優點,無疑在枯水期月徑流預報研究中應用最為廣泛。相關向量機(relevance vector machine,RVM)是Micnacl E Tipping[8]于2000年提出的一種與SVM(Support Vector Machine)類似的稀疏概率模型,已在徑流預報相關研究中得到應用。與SVM相比,RVM具有以下優勢:①同SVM相比,RVM極大地減少核函數的計算量,克服了所選核函數必須滿足Mercer條件的缺點;②RVM基于貝葉斯框架構建學習機,相關向量數目遠少于 SVM中的支持向量數目,模型相對簡潔;③RVM自動賦值懲罰因子,不存在因懲罰因子設置不當帶來的過學習等問題;④與SVM相比,RVM更稀疏,預報時更短,泛化能力更優。在徑流預報中,雖然RVM具有較好預報性能,但RVM“超參數α”和“核函數寬度因子d” 2個關鍵參數的科學選取對提高RVM預報精度十分關鍵。目前除傳統優化方法,如粒子群優化算法(PSO)[9-10]、蝙蝠算法(BA)等[11]用于RVM關鍵參數優化外,一些新型群體智能仿生算法(SIBA),如鯨魚優化算法(WOA)[12]、雞群優化(CSO)算法[13]、海鷗優化算法(SOA)[14]、蝗蟲優化算法(GOA)等[8]已償試用于RVM關鍵參數優化,并取得較好的優化應用效果。

為提高枯水期月徑流預報精度,拓展群體智能仿生算法優化RVM關鍵參數的應用范疇,研究提出一種基于金雕優化(Golden Eagle Optimization,GEO)算法與RVM相融合的徑流預測方法?;谠颇鲜∧乘恼?7 a的徑流資料,以枯水期11月、12月和次年1—4月月徑流預報為例,選取預報月之前具有較好相關性的月徑流作為預報影響因子,通過主成分分析(PCA)對影響因子進行降維處理,利用GEO算法優化RVM核寬度因子和超參數,建立GEO-RVM月徑流預報模型,并構建GEO-SVM模型作對比,通過實例驗證GEO-RVM模型用于枯水期月徑流預報的可行性。

1 GEO-RVM預測模型

1.1 金雕優化(GEO)算法

GEO算法是Abdolkarim Mohammadi-Balani等于2020年基于金雕狩獵行為而出的一種新穎群智能元啟發式算法。該算法通過模擬金雕在狩獵過程中智能調整搜索策略和攻擊策略來捕食獵物,并達到求解待優化問題的目的。GEO算法基于以下假設:①金雕沿著螺旋軌跡進行搜索獵物,并沿著直線路徑進行攻擊;②金雕在狩獵初期表現出更大的搜索傾向,在狩獵后期表現出更大攻擊傾向;③金雕在飛行的每個時刻都保持搜索和攻擊傾向;④金雕同時搜索其他金雕鎖定的獵物信息[15]。

與其他啟發式算法相比,GEO算法原理簡潔、實現簡單、設置參數少,而且具有較好的尋優精度和全局搜索能力。GEO算法數學描述簡述如下[15]。

a)獵物鎖定。GEO算法中,每只金雕都記住它迄今為止所探測過的最佳獵物位置,且同時具有攻擊獵物和巡航搜索獵物的傾向。每次迭代中,金雕i隨機選擇另一只金雕f的獵物,并繞著金雕f迄今為止所獲得的最佳位置進行盤旋,金雕i也可以選擇盤旋自己的目標獵物。

b)記憶更新。在GEO中,獵物被模擬為金雕群迄今為止發現的最佳解決方案(待優化問題最佳解),每只金雕都能記住迄今為止找到的最佳解決方案。在迭代過程中,每只金雕從金雕群體的記憶中選擇一個目標獵物,然后計算每只金鷹的攻擊向量和巡航向量,如果新位置優于記憶中的先前位置,則將更新記憶。

c)攻擊策略(開發階段)。攻擊策略可以通過一個向量來模擬,該向量從金雕當前位置開始,到金雕記憶中獵物位置結束。由于攻擊向量將金雕種群引向最佳獵物位置,因此突出了GEO的開發階段。金雕i的攻擊向量可以通過式(1)計算。

(1)

d)巡航策略(勘探階段)。GEO基于攻擊向量計算巡航向量,巡航向量是圓的切線向量,垂直于攻擊向量。巡航被認為是金雕相對于獵物的線性速度。GEO算法利用式(2)表示n維空間中超平面方程的標量形式。

(2)

(3)

e)位置更新。GEO算法中將金雕i第t次迭代步長向量Δxi定義為:

(4)

則第t+1次迭代金雕位置更新如下:

(5)

式中xt+1——第t+1次迭代金雕位置;xt——第t次迭代金雕位置;Δxi——步長向量。

f)勘探到開發過渡。GEO使用pa和pc從勘探轉向開采。該算法從低pa和高pc開始,隨著迭代的進行,pa逐漸增加而pc逐漸減小。pa、pc數學描述如下:

(6)

1.2 相關向量機(RVM)

(7)

(8)

式中t=(t1,t2,…,tN)T;Φ——N×(N+1)的核函數矩陣。

(9)

式中α——N+1超參數向量。

基于貝葉斯公式,后驗分布的權重描述為:

p(ω|t,α,σ2)=(2π)-(N+1)/2

(10)

式中μ=σ-2∑ΦTt;∑=(σ-2ΦTΦ+A)-1;A=diag(α0,α1,…,αN)。

為建立統一的超參數,p(t|α,σ2)定義如下:

(11)

本文利用高斯徑向基核函數(RBF)作為核函數,即:

(12)

式中d——核函數寬度因子。

1.3 預測模型的建立及實現步驟

步驟一基于實例實測徑流資料,選取與預報月11、12月和次年1—4月具有較好相關性的月徑流作為預報影響因子。參考文獻[16],采用PCA對預報影響因子進行降維處理,并合理劃分訓練及預報樣本,利用GEO算法優化RVM超參數α和核函數寬度因子d,建立GEO-RVM徑流預測模型,利用訓練樣本數據對GEO-RVM模型進行訓練。

步驟二選用訓練樣本均方誤差作為優化目標函數:

(13)

步驟四評估目標函數適應度值,選取并保存具有最佳適應度值的金雕位置x*。令當前迭代次數t=1。

步驟六評估金雕新位置的適應度函數,如果當前金雕位置的適應度優于前代金雕位置的適應度,則保留當前金雕位置為最佳位置;否則保留前代金雕位置為最佳位置。

步驟七令t=t+1。判斷t是否等于T,若是,輸出最佳金雕位置x*,算法結束;否則重復步驟五至步驟七。

步驟八輸出最佳金雕位置x*,x*即為RVM超參數α和核函數寬度因子d向量。

圖1 GEO優化流程

2 實例分析

a)數據來源及相關性分析。該實例水文站系紅河流域瀘江水系盤龍河干流控制站,控制徑流面積3 128 km2,為國家重要水文站和中央報汛站。本文以該水文站1952—2018年實測水文資料為研究對象,通過計算預報月11、12月,次年1—4月月徑流與之前月月徑流相關系數。經計算,11月月徑流與同年8—10月月徑流的相關系數分別為0.541、0.444、0.627;12月月徑流與同年4—5、7—11月月徑流的相關系數在0.330~0.764;次年1月月徑流與上年1—4、7—12月月徑流的相關系數在0.333~0.914;次年2月月徑流與上年2—5、7—12月和次年1月月徑流的相關系數在0.321~0.945;次年3月月徑流與上年1—2、4、8—12月和次年1—2月月徑流的相關系數在0.328~0.871;次年4月月徑流與上年4、8—12和次年1—3月月徑流的相關系數在0.408~0.772??梢?,各預報月與各相關影響因子之間均具有一定的相關性。

b)數據降維處理。由前分析可知,對于11月,預報影響因子3個,即3維,維度較低,無需進行降維處理;對于12月、次年1—4月,預報影響因子分別為7個(7維)、10個(10維)、11個(11維)、10個(10維)、9個(9維),可采用PCA進行數據降維,以使數據樣本簡潔且更具代表性。本文參考文獻[15],利用SPSS軟件對實例數據進行PCA降維處理,經處理,12月、次年1月前4個特征值累計貢獻率分別為85.34%、87.49%,次年2月前5個特征值累計貢獻率為89.20%,次年3月、次年4月前3個特征值累計貢獻率分別為85.43%、85.38%。根據累計貢獻率大于85%的原則,分別選取前4個(4維)、4個(4維)、5個(5維)、3個(3維)、3個(3維)變量代替原7個(7維)、10個(10維)、11個(11維)、10個(10維)、9個(9維)變量,并選取前60組數據作為訓練樣本,后6組數據作為預報樣本。主成分分析結果見表1,降維數據及原始數據限于篇幅從略。

d)預測及對比分析。利用所構建的GEO-RVM、GEO-SVM模型對實例預報月11、12月,次年1—4月月徑流進行訓練及預報,并利用絕對平均相對誤差MRE、平均絕對誤差MAE、決定系數R2對2種模型性能進行評價。訓練-預報相對誤差見圖2—7,預測結果見表2。

表1 枯水期預報月主成分分析結果

圖2 11月月徑流擬合-預報相對誤差

圖3 12月月徑流擬合-預報相對誤差

圖4 次年1月月徑流擬合-預報相對誤差

圖5 次年2月月徑流擬合-預報相對誤差

圖6 次年3月月徑流擬合-預報相對誤差

圖7 次年4月月徑流擬合-預報相對誤差

表2 枯水期月徑流預報結果及其對比

依據表2及圖2—7可以得出以下結論。

a)GEO-RVM模型對實例預報月11、12月,次年1—4月月徑流預報的絕對平均相對誤差MRE分別為8.59%、7.34%、5.97%、6.07%、5.99%、5.04%,平均絕對誤差MAE分別為1.42、0.90、0.75、0.56、0.47、0.34 m3/s,預報精度均優于GEO-SVM模型,表明GEO-RVM模型具有較好的預報精度和泛化能力;同時也表明GEO算法能有效優化RVM超參數和核函數寬度因子,GEO-RVM模型用于枯水期月徑流預報是可行的。

b)從決定系數R2來看,除次年4月外,GEO-RVM模型對枯水期預報月11、12月,次年1—3月擬合-預報的決定系數R2均大于GEO-SVM模型,表明GEO-RVM模型擬合-預報的整體效果要優于GEO-SVM模型。其中,枯水期12月、次年1年、次年2月擬合-預報的決定系數R2均大于0.92,擬合-預報效果優于其他月份。從圖1—6也可以看出,GEO-RVM模型對枯水期12月、次年1年、次年2月擬合-預報效果更優,更接近實測值。

c)GEO-RVM模型對實例預報月11、12月,次年1—4月月徑流預報的相對誤差分別在-12.64%~14.66%、-9.58%~14.01%、-0.69%~13.94%、-8.43%~11.62%、-11.99%~7.66%、-13.40%~5.32%,相對誤差均小于實測值的20%,達到水文預報甲等精度等級。

3 結論

介紹一種新型群體智能仿生算法——金雕優化(GEO)算法,利用GEO算法優化相關向量機(RVM)核寬度因子和超參數,建立GEO-RVM模型,并構建GEO-SVM模型作對比。通過云南省某水文站枯水期11、12月和次年1—4月月徑流預報為例對GEO-RVM模型進行驗證。結論如下。

a)GEO-RVM模型對實例枯水期月徑流預報精度優于GEO-SVM模型,具有較好的預報精度和泛化能力。GEO算法能有效優化RVM超參數和核函數寬度因子,將GEO-SVM模型用于枯水期月徑流預報是可行的。

b)GEO-RVM模型對實例枯水期12月、次年1年、次年2月的擬合-預報效果更優,更接近實測值。

c)本文介紹的GEO算法及提出的GEO-RVM模型可為徑流預報及其他相關研究提供借鑒。

猜你喜歡
金雕徑流獵物
格陵蘭島積雪區地表徑流增加研究
流域徑流指標的構造與應用
基于SWAT模型的布爾哈通河流域徑流模擬研究
三木落
金雕失手的啟示
可怕的殺手角鼻龍
Duck-billed platypuses
聰明誤
人工降雨下三種屋面徑流過程環境質量比較
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合