?

基于數據驅動的氣象災害自動化監測預測模型設計

2023-11-15 11:30梁燮凡保鴻燕李陽斌
自動化與儀表 2023年10期
關鍵詞:降維徑向氣象

梁燮凡,譚 喆,保鴻燕,李陽斌

(清遠市氣象局,清遠 511510)

氣象災害是自然災害之一,氣象災害是指對人類的人身安全和國民經濟以及國家建設造成的傷害[1]。為避免氣象災害對各地區造成經濟影響和人身安全問題,實時監測并運用科學的手段提升氣象災害預測能力,對于各地區的防災減災工作十分重要[2]。為此,國內外學者在氣象災害監測預測方面做了大量研究。文獻[3]提出利用KPCA 對氣象災害數據進行降維,采用RBF 對降維后的數據進行訓練,最終得到氣象災害預測結果;文獻[4]提出采用長短期記憶神經網絡得到數據特征,再對長短期記憶神經網絡得到的特征進行選擇,將選擇后的特征進行訓練,最后由支持向量回歸建立氣象災害預測模型,完成氣象災害預測。但是以上兩種方法均存在算法復雜度高、計算量大、訓練時間長等不足,難以滿足現階段精準的氣象災害監測需求。

本文結合KPCA 和RBF 兩種數據驅動技術共同完成氣象災害監測預測。采用RBF 建立氣象災害自動化監測預測模型。采用KPCA 對指標評價進行降維處理,把降維后的指標代入到RBF 神經網絡模型中作為輸入因子,完成氣象災害的檢測預測。

1 基于數據驅動的氣象災害自動化監測預測模型

1.1 氣象災害影響因素和氣象災害預測指標

樣本因子選取日照時數、月平均氣溫和月降水量[5]。針對洪災與旱災,為選擇最大值并兼顧平均值,采用內梅羅指數為影響因素,分別用x1和x2描述,計算公式為

式中:當年最大月和當年平均月的降水量分別用Imax和描述;當年最大月和當年月平均氣溫分別用Jmax和描述。

針對干旱和冰凍,為突出最小值和平均值,采用算術平均值指數為影響因素,分別用x3和x4描述,其計算公式為

式中:當年最小月和平均月的降水量分別用Kmin和描述;當年最小月和當年月平均氣溫分別用Lmin和描述。

針對每年降水量變化和日照影響,影響因素為每年降水距平百分率和日照時數的內梅羅指數,分別用x5和x6描述,計算公式為

式中:當年降水量和平均年降水總量分別用M 和Mˉ描述;最大年日照時數和平均年日照時數分別用Nmax和描述。

因此,選取x1~x6為氣象災害檢測預測的影響因素。

以自然氣象災害的危害程度與影響范圍為依據,樣本因子為洪災(F5)、旱災(F6)和霜凍災害面積(F7)、經濟損失(F8)、總收入(F9)和破壞總面積(F10),獲取預測指標Y1~Y4需要對樣本因子進行處理,預測指標為洪災(F1)、旱災(F2)、冰凍受災率(F3)和經濟損失率(F4),計算公式分別為

1.2 基于核主成分分析的影響因素降維

由于氣象災害評價指標有信息重合并且非線性程度較高,主成分分析降維效果不夠理想,因此本文采用核主成分分析對影響因素進行降維處理。核主成分分析對主成分分析進行優化,可以提取影響因素的非線性特征。KPCA 降維的原理為

原始影響因素X 從輸入空間Rn映射到高維空間G,是通過映射函數ω()實現的[6]。原始輸入空間的影響因素為X={x1,…,xM},映射和映射關系分別為ω()和ω:Rn→G;X→ω(x),影響因素映射后變為ω(X)。

設高維空間中X 是符合中心化條件的,公式為

式中:M 為影響因素數量,高維空間G 中的協方差矩陣用下述公式描述:

基于協方差矩陣C 的特征向量分析,特征向量為V,特征值為λ,則:

無法求解協方差矩陣是因為ω()為隱式形式,將式(7)代入到式(8)中得到:

公式(8)也可以轉換成:

式中:α=[α1,α2,…,αM]為系數列向量。將式(9)×ω(X)參數:

M×M 維的核矩陣K 用下述公式描述:

矩陣形式需要將式(11)代入式(10):

獲取高維空間中的特征值λ 及特征向量V,需要求解式(12),影響因素X 在特征向量V1方向的投影為

通過上述方式完成影響因素的降維處理。

1.3 徑向基函數神經網絡氣象災害預測模型

RBF 通過將處理好的輸入向量映射到輸出層,最終獲取隱含層節點的激活函數,徑向基函數神經網絡結構如圖1 所示。

圖1 徑向基函數網絡結構Fig.1 Radial basis function network structure

在徑向基網絡結構中,n 維輸入因子為X=[x1,x2,…,xn]T,隱含層的徑向基向量為

式中:隱含層節點數和高斯徑向基函數分別用d 和h 描述,hm可表示為

式中:S=[s1,s2,…,sd]T為隱含層節點的中心參數;B=[b1,b2,…,bd]T為徑向基函數的寬帶參數。k 時刻RBF 的輸出為

式中:隱含層到輸出層的權值用W=[w1,w2,…,wd]T描述。

徑向基函數神經網絡的輸入因子為降維后的影響因素,與輸入層神經元數目相對應。

將樣本數據進行歸一化處理,可提升訓練速度和靈敏性:

式中:Xx*為第x 個輸入參數的規范化值;Xx、meanx、stdx 分別為第x 個輸入參數的取值及其均值與方差。

輸出層神經元數目為4,預測指標為徑向基神經網絡的輸出向量,也就是氣象災害的預測值。

1.4 氣象災害預測實現

(1)利用KPCA 對氣象災害自動化監測預測的影響指標進行降維處理,減少徑向基神經網絡的輸入因子數量,降低網絡運算量。

(2)將包含全部降維后影響因素的樣本數據分為訓練樣本和測試樣本。

(3)徑向基神經網絡輸入向量為訓練樣本,輸出向量為氣象災害的預測值,對徑向基神經網絡進行訓練。

(4)將測試樣本輸入模型,進行氣象災害檢測預測。

氣象災害自動化預測流程如圖2 所示。

圖2 氣象災害自動化預測流程Fig.2 Automatic meteorological disaster prediction flow chart

1.5 基于等值面提取的監測結果呈現

本文采用氣象色斑圖來直觀的顯示出監測預測出的氣象災害要素的區域分布,呈現氣象要素的地區變化趨勢。提取等值面,并將等值面上色即為色斑圖。相近的等值線閉合形成的面為等值面,相近等值線之間產生變化,等值面也會產生變化。將原始的柵格數據進行離散,將等值點連起來,形成等值線,用相近的等值線閉合,形成多邊形面,進行光滑處理,最終得到等值面。共有兩種光滑方式分別為B 樣條法和磨角法。通常情況下,提取等值面個數是由基準值和等值距確定的。氣象色斑圖形成步驟為

(1)將氣象災害監測預測結果生成氣象數據序列;

(2)將離散的數據處理成符合要求的柵格數據;

(3)記錄等值線經過點位置,是通過三角網剖分法分析得到的;

(4)線條光滑處理,將經過點的等值線閉合,獲取色斑區分區詳細情況;

(5)對各個色斑分區進行著色,根據色斑分區的數字來尋找對應的色彩值,從而實現色彩填充。

2 實驗分析

2.1 研究區簡介

某省位于中國東南地區,長江上游。全省土地面積15 萬平方公里,該省南西兩面環山,中部低平,屬于亞熱帶季風潤濕氣候,光、熱、水資源豐富。年平均溫度18~25℃,年平均降水量1800~2200 mm。研究區簡圖如圖3 所示。

圖3 研究區簡圖Fig.3 Sketch map of the study area

2.2 KPCA 降維實驗

為驗證本文模型的有效性,對影響氣象災害監測預測的影響因素進行核主成成分降維處理。主成分累計貢獻率如表1 所示

表1 KPCA 主成分累計貢獻率Tab.1 KPCA principal component cumulative contribution rate

本文模型設定的主成分累計貢獻率p=90%,由表1 可以看出,前5 個主成分的累計貢獻率達到了90%,可以認為前5 個主成分包含了全部指標的絕大部分信息,計算原始影響因素x1,x2,…,x5的投影,從而得到RBF 網絡模型的輸入因子。由此實驗可以看出本文模型能實現對原始數據進行降維處理,減少價值度低指標,因此提高RBF 網絡模型的運算效率。

2.3 隱含層測試

RBF 神經網絡結構對網絡訓練有一定的影響,太大的網絡結構訓練效率不高,太小的網絡不收斂,選取均方根誤差作為RBF 選取不同層數隱含層的訓練效果測試指標,均方根誤差值越小,網絡結構越好,訓練優勢越顯著。定義均方根誤差函數為

式中:實際輸出和理論輸出分別用Ti和Zi描述。均方根誤差小于收斂誤差,停止訓練。

此實驗統計網絡選取不同隱含層節點數時,得到相對應的網絡訓練均方根誤差值,尋找最優隱含層節點。如圖4 所示,隨著隱含層節點數的增加,本文模型訓練均方根誤差曲線呈現先減小后增大的趨勢,可以明顯看出,隱含層節點數為4 時,本文模型的訓練均方根誤差最小,數值為0.24,此時本文模型的訓練效果最好。

圖4 隱含層節點數和網絡訓練誤差的關系Fig.4 Relationship between the number of hidden layer nodes and network training error

2.4 氣象災害監測預測實驗

為驗證本文模型氣象災害監測預測的有效性和真實性,預測2021 年某省各市氣象災害情況并與真實數值進行對比,預測的2021 年氣象災害數值如表2 所示,2021 年真實氣象災害數值如表3 所示。結合表2 和表3 來看,本文模型有較好的預測性,與真實數值相比,相差無幾,可以看出本文模型具備氣象災害監測預測準確性。

表2 預測2021 年氣象災害數值Tab.2 Predicted meteorological disaster values in 2021

表3 2021 年氣象災害真實數值Tab.3 Real meteorological disaster values in 2021

依據本文模型監測預測到的氣象災害情況,通過氣象色斑圖能直觀的顯示出氣象要素的區域分布,如圖5 所示??梢钥闯霰疚哪P湍軌驅崿F氣象災害的預測,并可以用氣象色斑圖來直觀的顯示出氣象要素的區域分布,實時更新,可以更好地實現監測,提前規避風險,避免氣象災害對各地區造成經濟影響和人身安全問題。

圖5 氣象要素的地區分布情況Fig.5 Regional distribution of meteorological elements

3 結語

為避免氣象災害對各地區造成經濟影響和人身安全問題,設計基于數據驅動的氣象災害自動化監測預測模型。通過實驗可以看出本文模型能實現對氣象災害影響因素的降維處理,減少價值度相對較低指標,提高網絡模型運算效率。當隱含層節點數為4 時,本文模型的訓練均方根誤差最小,數值為0.24,此時本文模型訓練精度最高。本文模型對洪災、旱災、冰凍受災率和經濟損失率有較好的預測準確性,與真實數值相比,相差無幾。同時可結合氣象色斑圖來直觀的顯示出氣象要素的區域分布,實時更新,可以更好地實現監測。

猜你喜歡
降維徑向氣象
混動成為降維打擊的實力 東風風神皓極
氣象樹
《內蒙古氣象》征稿簡則
淺探徑向連接體的圓周運動
RN上一類Kirchhoff型方程徑向對稱正解的存在性
基于PID+前饋的3MN徑向鍛造機控制系統的研究
降維打擊
一類無窮下級整函數的Julia集的徑向分布
大國氣象
美麗的氣象奇觀
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合