?

基于EEMD-LSTM組合模型石家莊月降水量預測研究

2024-02-23 12:27
水利科技與經濟 2024年2期
關鍵詞:石家莊降水量模態

秦 壯

(河北省石家莊水文勘測研究中心,石家莊 050000)

1 概 述

氣候變化深刻影響人類社會,降水量變化對農業、水資源管理等領域產生重大影響,準確的降水量是旱澇防御、節水和農作物灌溉等工作前提。但由于氣候系統復雜性和不確定性,降水量預測一直是氣象學領域面臨的挑戰。石家莊位于華北平原西南部,是灌溉農業聚集地,降水對其農業生產和生態環境具有重要影響。由于該地區降水量分布不均勻,且具有明顯的季節性變化,傳統數學統計方法在降水量預測方面存在一定局限性。因此,需借助建模技術來提高其預測可靠性。

近年來,深度學習技術在氣象預測領域取得顯著進展。其中,長短時記憶網絡(Long Short-Term Memory)作為一種特殊的循環神經網絡,具有良好的序列建模能力。但由于降水序列具有非線性和非平穩性特點,傳統LSTM模型在降水量預測中仍存在一定局限性。

為此,本文引入經驗模態分解(Ensemble Empirical Mode Decomposition,EEMD)方法,將降水序列分解成一系列固有模態函數(IMFs),并通過LSTM網絡對每個IMF進行預測,可將復雜的降水序列轉化為多個簡單的子序列,可以提高預測模型的準確性和穩定性。本研究的目的是基于EEMD-LSTM算法,對石家莊逐月降水量進行預測,并與傳統模型進行對比分析。

1.1 研究區概況

研究區位于華北平原西南向太行山地延伸地帶的石家莊市,空間位置為E113°3′-E115°2′、N37°27′-N38°4′,轄區總面積15 848km2。屬土石山地、平原分異地貌,高程自西向東遞減,介于0~2 281m。受季風環流與海陸位置影響,形成溫帶大陸性季風氣候,多年平均氣溫13℃、降水量545mm、蒸發量1 650mm。研究區下轄正定、趙縣等縣區,降水量呈現自東向西減少。見圖1。

圖1 氣象站點數據分布示意圖

1.2 氣象資料來源

本研究月降水量資料來自氣象數據共享服務網站 (http://dctc.cmc.cn/),獲取研究區12個氣象站點自1981-2020年日數據集,經合成后得到480個逐月序列數據。該原始數據經過質量控制,已在氣象、水土科學中得到廣泛應用。選取1981-2010年月降水序列(共360個月)為訓練集,2001-2020年月序列(共120個月)為驗證集。

1.3 EEMD分解法

EEMD是建立于EMD基礎上的一種改進的數據分解算法,其旨在通過加入白噪聲解決EMD方法中存在模態混疊現象,進而生成精準包絡線。EEMD具有自適應性,能夠在不需要預先選擇小波基的情況下,根據信號的不同特征尺度自動產生基函數,并且仿真信號的EMD分解可重構成出原始信號。其主要流程如下:

①基于逐月降水量序列X(t)中的極大或極小值Ei(1≤i≤n),計算出鄰域中值Fi(1≤i≤n-1)。

②利用最小二乘法,擬合全部n+1個中值點連成的k值曲線,則曲線平均值:

L*=(L1+L2+…+Lk)/k

(1)

③迭代前兩個步驟,直至得到篩選次數達到預設最大值q或滿足 或|L*|≤ε(ε為允許誤差),由此分解到第一模態分量MF1。

④基于數據結構與長度,自適應提取生成其他IMF。

⑤原徑流序列X(t)可重構為所有模態分量與殘差趨勢項之和:

X(t)=∑Mi+R0

(2)

1.4 LSTM模型

式中:W為隱藏狀態到輸出的權重矩陣;b為對應的偏置項;ht為t時刻LSTM輸出值。

φ=δ[Wo(ht-1,xt)]+bo

(5)

ht=φttanh(Ct)

(6)

式中:δ為激活函數sigmoid;ht為t時刻LSTM輸出值。

2 結果與分析

2.1 石家莊逐月降水量時間序列特征

由圖2可知,研究區逐月降水量呈非線性變化,其總體呈躍遷波動性。近480個月序列中,最大值出現在第470個月,達72.8 mm;最少月僅為15.2 mm,出現在第67月;其整體離差系數為36.5%,表明其波動性強烈。統計得到該時域內,月降水量變化的傾向斜率為-0.0013,變化形式為y=-0.0013x+41.767,R2=0.0002,但并不具有統計意義(P>0.05)。由此可見,常規線性擬合方法難以捕捉其非平穩性特征,這增加了降水量預測難度。

圖2 研究區逐月降水量序列變化

2.2 基于EEMD石家莊月降水量分解特征

將研究區480個逐月徑流量序列使用EEMD解析,得到若干固有模式函數(IMF),其結構見圖3。由圖3可知,隨著模態數增加,其頻率域信息量減少、波動性變弱,而殘差趨勢項描述了月降水量序列整體傾向趨勢特征。在此基礎上,利用周期圖法計算得到第一模態(IMF1)的方差貢獻率最大,為32.83%,承載了降水量分量強烈波動信息;IMF2-IMF4次之,分別為24.20%、16.45%、11.29%;IMF5-IMF7僅為1.96%~8.44%,其承載的分量信息率較低。IMF代表了時間序列中的不同頻率分量,通過對IMF進行分析,可以了解降水量的周期性和趨勢性變化。

2.3 基于EEMD-LSTM逐月降水量預測性建模分析

為了驗證EEMD-LSTM算法的有效性,將數據集劃分為訓練集和測試集。其中,訓練集用于訓練,驗證數據用于測試。7項模態分量以及殘差項作為輸入變量,利用Rustudio開源平臺設計LSTM網絡,為確定模型性能,采用貝葉斯方法進行參數優化。LSTM網絡中包含隱藏層大小(hidden_size)、網絡層數(n_layer)、Dropout、滑動窗口大小(window size) 、學習率(learn rate) 、梯度截斷(Gradient Clipping)等關鍵參數。其中,hidden_size 影響模型所能捕捉的訓練數據復雜度;n_layer控制模型的復雜度;Dropout是為了防止模型過擬合而添加的正則化項,以減小過擬合的風險;window size 為記憶單元長度、learn rate控制收斂速度、Gradient Clipping防止梯度爆炸或梯度消失。將其通過貝葉斯參數試錯分析,確定以上6項模型參數配置依次為150、16、0.5、13、0.03、0.1。

圖4為EEMD-LSTM算法預測的研究區2010-2020(第361-480月份)的降水量。由圖4可知,該模型準確模擬了降水量變化形態,對徑流豐枯變化、相位躍遷具有較高溯源性。經計算,得到模型驗證精度決定系數R2為0.92,MAE和RMSE分別為2.14、3.13mm,顯示了該模型較高擬合性能,因此具有良好應用潛力。

該算法的成功應用,一方面在于EEMD分解的模態可將非線性逐月降水數據轉化為若干簡易、靜態序列變量,極大地去除了數據噪聲而僅保留有益的信息;另一方面在于LSTM善于利用EEMD分解得到的IMF信息溯源降水變化,在前向模擬過程中加入歷史信息,從而有助于提高預測性能。

圖4 研究區逐月降水量序列預測精度圖

3 結 論

本文通過應用EEMD-LSTM算法,對石家莊市逐月降水量進行了預測,結論如下:通過EEMD分解去除原始降水量序列中的噪聲,并將其分為獨立模態IMF和殘差,包括降水量變化非線性、非平穩、周期性特征,促進了模型解釋性。EEMD-LSTM模型以每個IMF作為輸入,能夠較好地捕捉時間序列數據中的非線性和長期依賴關系。

但本研究也存在一些限制:①只考慮了石家莊市的逐月降水量數據,對于其他地區預測效果還需要進一步驗證;②EEMD-LSTM算法的參數選擇對于預測結果的影響較大,需要進一步優化參數選取方法,以提高預測精度;③還可以考慮將其他氣象數據如溫度、濕度等納入模型中,以提高預測效果。

猜你喜歡
石家莊降水量模態
繪制和閱讀降水量柱狀圖
石家莊曉進機械制造科技有限公司
降水量是怎么算出來的
1988—2017年呼和浩特市降水演變特征分析
梁叢
人民幣緣何誕生在石家莊
基于小波變換的三江平原旬降水量主周期識別
國內多模態教學研究回顧與展望
基于HHT和Prony算法的電力系統低頻振蕩模態識別
由單個模態構造對稱簡支梁的抗彎剛度
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合