?

基于改進BP神經網絡的多層土壤濕度反演

2023-11-29 02:20孫佳倩余鐘波
節水灌溉 2023年11期
關鍵詞:土壤濕度搜索算法天牛

劉 娣,孫佳倩,余鐘波,4

(1.河海大學 水災害防御全國重點實驗室,南京 210024;2.河海大學水文水資源學院,南京 210024;3.河海大學全球變化與水循環國際合作聯合實驗室,南京 210024;4.長江保護與綠色發展研究院,南京 210024)

0 引 言

土壤濕度(Soil Moisture, SM)指土壤的含水量,通過改變地表反射率、地表蒸散發過程、陸面植被的生長狀況、蒸散發過程以及能量輸送過程等方式影響蒸散發、通量等物理過程,進而影響陸地與大氣之間的耦合及水分和能量交換,給氣候變化帶來影響[1]。通過機器學習反演獲取高精度表層至深層土壤濕度數據,對研究氣候預報、水文模型模擬預報、干旱監測[2]、農作物生長[3]等具有重要意義。

機器學習被廣泛應用于水文領域的研究中。其中BP 神經網絡(Back Propagation Neuron Network,BPNN)因具有較強的非線性映射能力、自適應能力和泛化能力,被大量的應用于土壤濕度反演的工作中[4,5]。但隨著研究的深入,BP 神經網絡也展現出較強的隨機性和不確定性,存在不能保證收斂到全局最小點等問題[6]。使用天牛須搜索算法(Beetle Antennae Search Algorithm, BAS)對BP 神經網絡進行改進是目前一個新的研究方向,李琪等[7]使用BAS-BP模型對鉆井鉆速進行預測,結果表明BAS-BP具有良好的收斂性和搜索能力且預測效果優于BP、PSO-BP 及GA-BP。徐轟釗等[8]建立了BAS-BP 柴油機故障診斷和識別模型,證明了BAS-BP 模型在各方面都優于PSO-BP 和GA-BP 模型,且BAS-BP 的故障分類準確率可達到98.90%。但目前BAS-BP模型在反演土壤濕度的適用性領域還缺乏具體的研究。

機器學習模型是黑箱模型,主要是利用已有的指標對結果進行評價,不能自主選擇輸入變量??紤]到氣象因子與土壤濕度之間存在互饋效應[9-12],遲凱歌等[13]利用主成分分析法辨識了影響流域NDVI 變化的主導氣候因素,并在此基礎上構建了BP 神經網絡,證明因子篩選能夠顯著提高模型精度。李柳陽等[14]基于站點觀測的10cm 深度土壤濕度數據和8 個氣象數據,通過主成分分析法選取溫度、日照時間、降水、風速及相對濕度作為線性回歸和BP 神經網絡模型的輸入數據,構建BP神經網絡模型。

本文基于BP 神經網絡,利用有限氣象站點觀測數據進行驅動,構建適應于不同深度土壤濕度反演的BP 神經網絡模型。采用天牛須搜索算法(Beetle Antennae Search Algorithm,BAS)對BP 神經網絡進行改進,構建BAS-BP 神經網絡模型(Beetle Antennae Search-Back Propagation Neural Networks),驗證BAS-BP模型對不同區域不同深度土壤濕度的反演效果。

1 研究方法

1.1 主成分分析方法

主成分分析法是目前最常用的線性降維方法之一,其核心思想是利用某種線性投影,將高維度的數據映射到低維度的空間當中[19],使投影到低維度上數據信息在降低維數的同時能夠盡可能的保留原數據的信息,達到使用少數具有代表性數據代替多個原始變量的目的。其主要原理如下[20]:

(1)對由n維相關變量組成的原始變量集X進行z分數(z-score)標準化處理,得到均值為0、方差為1 的標準化矩陣ZX。

(2)基于標準化矩陣ZX建立協方差矩陣R,利用特征值分解法求解標準化矩陣ZX的特征值并將其從大到小排列,得到特征值λk(k=1,2,…,n)、特征向量Gk與主成分Fk。

(3)根據方差貢獻率和累計方差貢獻率確定主成分。

1.2 BP神經網絡

BP 神經網絡是1986 年由Rumelhart 和McCelland 團隊提出來的機器學習方法,是一種按誤差逆傳播算法訓練的多層前饋網絡,由輸入層、隱藏層和輸出層組成。其核心思想是利用負梯度下降算法,將誤差控制在設計的范圍之內,再將誤差的變化量反向傳播到神經網絡的每一層,進而調整每一層神經網絡的參數值,通過多次迭代之后,誤差就會穩定在一定的范圍內[21,22],使最終輸出結果接近期望值。

1.3 天牛須搜索算法

天牛須搜索算法BAS 是在2017 年提出的一種受到生物啟發的智能優化算法,具有搜索速度快、實施便捷、不依賴目標函數的具體形式和梯度信息即可實現尋優計算等優點[23]。神經網絡隨機生成初始連接權值和閾值,會對BP 神經網絡的收斂速度和泛化能力產生影響,使用天牛須搜索算法對BP 神經網絡的初始權值和閾值進行優化重構,可以減少BP 神經網絡的運行時間,提高收斂速度和穩定性。其基本步驟如下[24]。

(1)建立并初始化BP 神經網絡,獲取網絡初始權值和閾值。

(2)設置初始步長和迭代次數,對天牛須搜索算法進行初始化,創建天牛須朝向的隨機向量且做歸一化處理,創建天牛左右須空間坐標。

(3)將BP 神經網絡的初始權值和閾值分別設置為天牛須的方向與初始位置。

(4)通過計算適應度函數值判斷天牛左右兩須所感知到的氣味濃度。

(5)進行探尋氣味、前進操作:利用自適應函數計算左右兩須感知的氣味濃度,如果左邊觸角感知到的氣味濃度比右邊強,則天牛下一步向左邊前進,如果右邊觸須感知到的氣味濃度比左邊強,則天牛下一步向右邊前進。

(6)判斷是否達到迭代終止條件,即天牛是否找到食物,亦即輸出的權值與閾值是否為全局最優解。若是全局最優解則停止迭代;否則返回步驟(3)。

(7)獲得最優權值和閾值后,將其賦值給BP 神經網絡,得到BAS-BP神經網絡模型。

1.4 評估指標

本文采用均方根誤差(Root Mean Squared Error,RMSE)、平均絕對誤差(Mean Absolute Error,MAE)、相關系數(Correlation Coefficient,R)對BP 及BAS-BP 模型的反演效果進行評估,RMSE和MAE越小,R越大,反演效果越優。

本文技術路線如圖1所示。首先,采用主成分分析法篩選出有效氣象觀測數據作為驅動,構建不同深度土壤濕度BP 神經網絡模型;其次,利用天牛須搜索算法對BP 神經網絡模型進行改進,構建不同深度土壤濕度BAS-BP神經網絡模型;最后,綜合利用統計分析指標評估不同模型的反演效果。主成分分析方法、BP 神經網絡模型、天牛須搜索算法及評估指標介紹如下。

圖1 技術路線Fig.1 Technology route

2 模型構建及實例分析

本研究數據資料選自美國南卡羅來納州(South Carolina)的McClellanville 站(北緯33°5′20.23″,西徑79°28′2.23″)和青藏高原野外觀測站MAWORS(Muztagh Ata Westerly Observation and Research Station,慕士塔格西風帶環境綜合觀測研究站)(北緯38°24′30.26″,東經75°2′21.31″)的站點觀測數據。在McClellanville 站,選用2010年1月1日-2013年12月31日的實測數據,共計4 a 的有效數據進行訓練與模擬。所選數據要素包括平均降雨量、相對濕度、氣溫、太陽能、紅外表面溫度、土壤溫度以及土壤濕度。將2010 年1 月1 日-2012 年12 月31日(1 096 d)的數據作為訓練集建立模型,將2013年1月1日-2013 年12 月31 日(365 d)的數據作為測試集檢驗模型的反演精度。在MAWORS 站,由于觀測數據資料序列缺失較多,選用2012 年1 月1 日-2016 年12 月31 日的多年日平均數據(共計365 d)進行訓練與模擬,所選數據包括氣象數據、地表輻射數據、EC數據、土壤溫度、土壤濕度。將第1~250 d 的數據作為訓練集建立模型,第251~365 d 的數據作為測試集檢驗模型的反演精度。各站的數據資料如表1所示,各要素時間序列如圖2所示。

表1 McClellanville和MAWORS站數據資料Tab.1 McClellanville and MAWORS station data information

圖2 研究數據時間序列Fig.2 Time series of the hydroclimate variables

2.1 主成分分析

通過MATLAB 中的pca 函數和wmspca 函數,計算各項特征因子與所選因子之間的相關性進而選取不同深度土壤濕度的主成分(表2)。在反演不同深度土壤濕度時,使用表中相應的主成分作為輸入數據,對應的土壤濕度作為輸出數據,分別利用BP 神經網絡和BAS-BP 神經網絡建立反演模型。根據不同土壤深度對應的主成分計算得到BP 和BAS-BP 模型對McClellanville 站和MAWORS 站訓練集和測試集不同深度土壤濕度的反演值與觀測值的RMSE、MAE及R如表3所示。

表2 McClellanville站與MAWORS站主成分分析結果Tab.2 Results of principal component analysis for McClellanville and MAWORS stations

表3 BP、BAS-BP模型對各站各層土壤濕度反演的均方根誤差(RMSE)、平均絕對誤差(MAE)及相關系數(R)Tab.3 The RMSE, MAE, and R of BP and BAS-BP models for the inversion of soil moisture in each layer at each station

2.2 反演結果分析

2.2.1 訓練集與測試集對比分析

由表3可知,BP和BAS-BP模型對各站訓練集的不同深度土壤濕度的反演效果較好,證實構建的BP 和BAS-BP 模型適應于各站不同深度土壤濕度的反演。其中,在McClellanville站,各模型反演的各層土壤濕度的RMSE范圍為0.005~0.039 m3/m3,MAE范圍為0.004~0.025 m3/m3,R范圍為0.948~0.997;在MAROWS 站,各模型反演的各層土壤濕度的RMSE范圍為0.010~0.092 m3/m3,MAE范圍為0.007~0.165 m3/m3,R范圍為0.830~0.942。

McClellanville 站各模型反演的各層土壤濕度的RMSE范圍為0.015~0.191 m3/m3,MAE范圍為0.010~0.115 m3/m3,R范圍為0.625~0.994;在MAROWS 站,各模型反演的各層土壤濕度的RMSE范圍為0.014~0.181 m3/m3,MAE范圍為0.010~0.177 m3/m3,R范圍為0.390~0.903。通過對比分析,BP 和BAS-BP模型對各站訓練集不同深度土壤濕度的反演效果均優于測試集,主要體現在訓練集各模型反演的各站不同深度土壤濕度的RMSE和MAE均略低于相同深度的測試集,而R均略高于相同深度的測試集。

2.2.2 不同深度土壤濕度反演結果對比

通過對比分析,在測試集,BP 和BAS-BP 模型對各站不同深度土壤濕度的反演效果在表層(SM5、SM10) 及中層(SM20、SM40、SM50)較優且均在表層SM10達到最佳,而隨著土壤深度的增加(SM80、SM100、SM160),各模型對各站深層土壤濕度的模擬能力呈減弱趨勢。主要體現在各站各模型在SM10處的RMSE與MAE量值較其余土壤深度最低,而R最高。隨著土壤深度的增加,反演的表層土壤濕度的RMSE和MAE低于深層土壤,而R高于深層土壤。例如,在McClellanville站,BAS-BP 模型在SM5和SM10的RMSE和MAE分別為0.018 m3/m3、0.012 m3/m3和0.015 m3/m3、0.010 m3/m3,而R分別為0.978、0.994。隨著土壤深度的增加,BAS-BP 模型的反演效果逐漸減弱,在SM20、SM50及SM100的RMSE增加至0.019 m3/m3、 0.026 m3/m3、 0.107 m3/m3,MAE增加至0.013 m3/m3、0.019 m3/m3、0.082 m3/m3,R下降為0.975、0.954、0.776。BP模型對McClellanville 站測試集的反演效果與此一致。在MAWORS 站,BP 模型在SM10和SM20的RMSE和MAE分別為0.016 m3/m3、0.012 m3/m3和0.016 m3/m3、0.016 m3/m3,而R分別為0.879、0.561。隨著土壤深度的增加,BAS-BP 模型的反演效果逐漸減弱,在SM20、SM50及SM100的RMSE增加至0.025 m3/m3、0.053 m3/m3、0.181 m3/m3,MAE增加至0.026 m3/m3、0.038 m3/m3、0.177 m3/m3,R下降為0.530、0.403、0.390。BAS-BP模型對MAWORS站測試集的反演效果與此一致。

2.2.3 BP與BAS-BP模型反演精度對比分析

綜合統計分析指標(表3)及對比圖(圖3)和離差圖(圖4),BAS-BP 模型對各站各層土壤濕度的反演效果均優于同一土壤深度的BP 模型。在測試集,BAS-BP 模型在各站反演的各層土壤濕度的RMSE與MAE均低于BP 模型,而R均高于BP模型。例如,在MAWORS站,BP與BAS-BP模型在SM10處的RMSE和MAE分別為0.016 m3/m3、0.014 m3/m3和0.012 m3/m3、0.010 m3/m3,R分別為0.879、0.903。在SM160處的RMSE和MAE分別為0.181、0.143 和0.177、0.131,R分別為0.390、0.504。此外,BAS-BP模型對各站不同深度土壤濕度發反演值與觀測值時間序列擬合性更好(圖3),偏差較?。▓D4)。以上結果表明,通過天牛須搜索算法優化的BP 模型有效提高了表層至深層土壤濕度的反演能力,BAS-BP 模型穩定性與適配性更優。

圖3 基于BAS-BP模型、BP模型反演不同深度土壤濕度與觀測值對比圖Fig.3 Comparison of soil moisture at different depths with observed values based on BAS-BP model and BP model inversion

3 討 論

3.1 不同機器學習模型精度分析

目前,土壤濕度反演常用的機器學習方法有BP 神經網絡、隨機森林(Random Forest,RF)、支持向量機(Support Vector Machine, SVM)、 極限學習機(Extreme LearningMachine, ELM)、廣義回歸神經網絡(Generalized Regression Neural Network,GRNN)[26-28]等。相較于BP 神經網絡、GRNN、ELM 和SVM 模型,RF 模型在土壤濕度反演中的穩定性更好,精度更高[29-32]。然而,原始機器學習模型的預測效果易受外界影響。越來越多的研究聚焦于模型參數的優化,例如,利用遺傳算法(Genetic Algorithm, GA)、粒子群算法(Particle Swarm Optimization, PSO)、 蟻群算法(Ant Colony Algorithm, ACA)、天牛須搜索算法、二次移動平均法(Double Moving Average, DMA)、 變分模態分解(Variational Mode Decomposition,VMD)、灰狼優化算法(Grey Wolf Optimizer,GWO)算法等對機器學習模型進行優化重構[33-35],優化后的模型能克服原始模型的缺點,具有更強的穩定性和擬合能力,可以大幅提高模型計算精度。在眾多優化機器學習的算法中,BAS具有原理簡單、參數少、計算量少等優點,現有研究[7,8,36]表明基于BAS 優化的機器學習模型的計算精度和穩定性均優于GA、PSO 等算法。然而,將BAS-BP 神經網絡模型用于土壤濕度反演的研究鮮有報道。因而,本文嘗試使用BAS 算法對BP 神經網絡進行優化,構建BAS-BP 神經網絡模型,驗證其在不同深度土壤濕度反演中的效能。研究結果表明,基于BAS-BP 神經網絡模型顯著提高了BP 神經網絡模型在表層至深層土壤濕度的反演能力。

3.2 不同深度土壤濕度反演精度分析

由于土壤中各種物理過程的熱力和水力結構特性,使得土壤過程相較于大氣的變化更為緩慢,從而使得土壤濕度具有一定“記憶性”。趙家臻等[25]利用中國氣象局國家氣象信息數據,通過比較皮爾遜相關法和自相關法計算,量化了土壤濕度的記憶能力,結果顯示隨著土壤深度的增加,土壤濕度的記憶性也顯著增強。表層土壤濕度受到大氣的影響最為直接,土壤記憶性較短,使用機器學習方法反演得到的土壤濕度精度較高。隨著土層向下延伸,土壤濕度的記憶性增強,其變化過程相較于大氣變化更加緩慢,反演得到的土壤濕度精度隨之下降。因此,兩個站均在表層土壤10 cm 處土壤濕度的反演效果最佳,隨著土壤濕度的增加,反演精度逐漸下降,在深層土壤100 cm以及160 cm處反演精度最差。

3.3 影響機器學習模型反演效果因素分析

通過對比分析,McClellanville 站的反演效果更佳,使用BP 和BAS-BP 模型相關系數R的變化幅度分別為10.789%、5.061%,MAWORS 站使用BP 和BAS-BP 模型相關系數R的變化幅度分別為38.531%、14.624%,BP 和BAS-BP 模型對McClellanville 站各層土壤濕度的反演效果均優于MAWORS站,這主要歸因于地理條件及數據資料等因素。青藏高原是我國最大、海拔最高的高原,被譽為“亞洲水塔”。然而,由于環境條件惡劣、海拔高、地形復雜、地表不均等諸多因素,青藏高原的水文氣象觀測站點較為稀少,觀測數據有限。這些因素對機器學習模型的反演性能影響較大。

4 結 論

本文采用天牛須搜索算法對BP 神經網絡進行優化,構建BAS-BP 神經網絡模型。 選用美國南卡羅來納州的McClellanville 站及青藏高原MAWORS 站水文氣象觀測數據,利用主成分分析法篩選土壤濕度反演的驅動因子作為BP 及BAS-BP模型的輸入數據,分別構建BP及BAS-BP模型,對不同深度土壤濕度進行反演。主要結論如下:

(1)BP 及BAS-BP 模型適應于各站點表層至深層土壤濕度的反演,其對訓練集的反演效果優于測試集。

(2)融合天牛須搜索算法優化的BAS-BP 模型優于BP 模型。BAS-BP 模型可以有效提高表層至深層土壤濕度的反演精度,穩定性與適配性更優。

(3)BP 與BAS-BP 模型均在SM10反演效果最佳。隨著土壤深度增加,反演效果減弱。在SM100和SM160,BP 與BAS-BP模型反演效果最低。在相同條件下,BAS-BP 模型始終優于BP模型。

(4)青藏高原受到環境、海拔、地形、地表等諸多因素的影響,站點觀測數據質量略有不足,BP 及BP-BAS 模型對MAWORS站各層土壤濕度的反演效果略低于McClellanville站。

猜你喜歡
土壤濕度搜索算法天牛
天牛到底有多牛
改進的和聲搜索算法求解凸二次規劃及線性規劃
土壤濕度傳感器在園林綠化灌溉上的應用初探
基于51單片機控制花盆土壤濕度
黑黃花天牛
巨型昆蟲——天牛
四川盆地土壤濕度時空分布及影響因子分析
中國不同氣候區土壤濕度特征及其氣候響應
天牛
基于汽車接力的潮流轉移快速搜索算法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合