?

基于LSO-RF模型的階躍型滑坡位移速率預測方法

2023-12-28 12:47黃智杰簡文彬夏昌賴增榮林立鵬
關鍵詞:階躍關聯度滑坡

黃智杰, 簡文彬, 夏昌, 賴增榮, 林立鵬

(1. 福州大學紫金地質與礦業學院, 福建 福州 350108; 2. 地質工程福建省高校工程研究中心, 福建 福州 350108; 3. 福州市規劃設計研究院, 福建 福州 350108)

0 引言

滑坡是一種嚴重的自然災害, 發生時, 嚴重危害人類的生命財產安全[1-2]. 近年來, 對滑坡進行監測預警已成為一個重要的研究熱點, 許多學者在相關方面展開了許多卓有成效的研究[3-7], 其中主要一方面可集中于對滑坡的變形趨勢進行預測, 而后在其基礎上進行預警. 林世權等[8]通過平均值影響法篩選出藕塘滑坡的誘發因素, 并使用BP神經網絡預測該滑坡位移; 王偉等[9]利用粒子群優化算法(particle swarm optimization, PSO)優化后的最小二乘支持向量機模型對大華滑坡的周期項位移建模預測; 岳強等[10]通過小波分析和BP神經網絡對鄭家大溝滑坡位移進行預測等. 上述研究雖取得了較好的效果, 但多集中于對滑坡的累積位移進行預測, 而對滑坡位移速率進行預測的研究則相對較少. 相比較滑坡累積位移, 位移速率指標更直觀, 可通過對位移速率劃分等級等方式, 更好地運用于滑坡的預警中[11-12].

階躍型滑坡是指一種在累積位移上呈現出階躍段與平穩段交替變化的滑坡[13-14], 其位移速率常常呈現出從接近于零處突然增大的現象, 給其預測造成困難. 此外滑坡是一個復雜的系統, 受到多因素的共同作用, 在利用人工智能模型進行預測時, 合理選擇輸入特征將直接影響著預測的準確性[15].

隨機森林(randomforests, RF)模型是機器學習集成類算法的代表, 其具有控制模型過擬合等優勢, 可提高預測的精度. 獅群優化算法(lion swarm optimization, LSO)是一種新型智能優化算法, 具有尋優能力強、 收斂速度快等優點. 為提高階躍型滑坡位移速率預測的準確性, 本研究以福建省泉州市安溪縣堯山村階躍型滑坡為例, 通過斯皮爾曼相關系數同灰色關聯度結果相結合的方法, 篩選出該滑坡影響位移速率的特征, 輸入至隨機森林模型中, 并通過LSO對模型參數尋優, 實現對階躍型滑坡位移速率的準確預測.

1 理論與方法

1.1 斯皮爾曼相關系數與灰色關聯度

斯皮爾曼相關系數是用于表征兩列數據相關性程度的指標, 相較于常見的皮爾遜相關系數, 其對數據要求的條件更低、 適用的范圍更廣. 灰色關聯度分析方法是根據因素之間發展趨勢的相似或相異程度來衡量因素間關聯程度的一種方法. 根據滑坡各因素監測數據間非線性等特點, 文中綜合使用斯皮爾曼相關系數和灰色關聯度分析進行滑坡位移速率預測模型的輸入特征篩選.

1.2 LSO-RF耦合模型

1.2.1隨機森林算法

隨機森林算法是一種基于決策樹的集成學習模型[16], 它能隨機選擇數據樣本和特征來訓練多個決策樹, 并通過取平均值等方式提高模型準確性和泛化能力. 由于隨機森林算法具有能減少模型過擬合、 運行速度快等優點, 本研究選用隨機森林模型作為預測耦合模型的一部分. 該算法對樣本i的預測流程如圖1所示.

圖1 隨機森林算法預測流程圖Fig.1 Prediction flowchart of random forest algorithm

1.2.2獅群優化算法

LSO算法是一種基于自然界中獅群行為特征的啟發式優化算法. 與傳統的優化算法不同, 該算法通過模擬獅子狩獵時的合作行為來實現全局最優解的搜索[17]. 因LSO算法具有魯棒性強、 避免陷入局部最優解等優點, 通過該算法對隨機森林模型中關鍵參數進行尋優, 以找到模型參數的最佳組合.

本研究預測方法的總流程見圖2. 首先, 由滑坡監測站及附近氣象資料獲取日降雨量、 日均孔隙水壓力、 位移速率、 地表徑流等數據; 其次, 分別計算滑坡位移速率與其余指標的斯皮爾曼相關系數和灰色關聯度, 選取兩者均較優的結果與滑坡歷史位移速率共同作為RF模型的輸入特征; 最后, 通過LSO算法對RF模型參數進行尋優以提升模型的預測精度.

圖2 預測方法流程圖Fig.2 Flowchart of the forecasting method

2 實例分析

2.1 工程地質概況與位移速率分析

堯山滑坡位于福建省泉州市安溪縣西坪鎮堯山村境內[18]. 滑坡后緣橫向寬約80 m, 前緣寬約200 m, 縱向長約350 m, 前后緣高差約115 m, 滑坡體坡度約為20°~25°, 面積約5.2×104m2, 體積約5.0×105m3, 滑動面深度約為10~13 m, 且滑坡后緣拉張裂縫發育, 主滑面工程地質剖面圖見圖3. 自2019年8月起, 對該滑坡進行自動化監測, 獲取了該滑坡監測站1與監測站2的深部水平位移、 深部孔隙水壓力、 日降雨量等時間序列數據. 滑坡邊界及監測站布置圖如圖4所示.

圖3 研究區滑坡主滑面工程地質剖面圖 圖4 滑坡周界及監測站示意圖Fig.3 Engineering geological profile of the main landslide surface within the study area Fig.4 Schematic diagram of landslide perimeter and monitoring points

因監測站1位移大, 站2位移相對較小, 故此次選擇監測站1滑面附近處埋深為12 m的位移數據及埋深10 m的孔隙水壓力數據為代表進行分析. 滑面附近處位移與滑動面處位移在數值上存在差異, 且由于監測儀器埋設的問題, 這種誤差可能會加大, 但兩者在趨勢上相符. 因此將上述埋深12 m的累積位移視為滑坡的相對累積位移、 由相對累積位移所確定的位移速率稱為滑坡的相對位移速率(后文為方便表述, 統稱為累積位移s和位移速率v). 為分析該滑坡位移特點, 2021年2月25日—7月25日時間段內滑坡的累積位移、 位移速率、 日降雨量情況如圖5所示.

圖5 滑坡累積位移、 位移速率、 日降雨量關系圖Fig.5 Relationship among cumulative displacement, displacement rate and daily rainfall

由圖5可知, 該滑坡受降雨影響明顯. 在無雨或少雨期間, 滑坡處于平穩段(如圖5中虛線框1), 位移速率較小且變化緩慢(基本為0~0.7 mm·d-1); 而在連續大雨期間, 滑坡處于階躍段, 位移速率會迅速上升(如虛線框2中速率突升到17.36 mm·d-1)并在雨停一段時間后回落至平穩段. 這些特點會導致許多人工智能模型因學習到平穩段大量數據的規律而產生過擬合, 對階躍段數據的預測效果不佳. 因此, 在預測該類滑坡位移速率時, 需要選擇適合的人工智能模型.

2.2 基于斯皮爾曼相關系數和灰色關聯度的特征選擇

為實現較好地預測效果, 需要挑選與預測目標相關性程度高的數據作為模型輸入特征. 首先探究位移速率與其他因素的相關性. 由于這些時間序列之間的關系不是嚴格意義的線性關系, 如圖6, 因此采用斯皮爾曼相關系數進行分析, 結果詳見表1.

表1 位移速率與其余因素間相關性Tab. 1 Correlation between the displacement rate and the remaining factors

圖6 位移速率與相對濕度散點圖Fig.6 Scatter plot of displacement rate and relative humidity

此外, 為了判斷滑坡系統中各因素對位移速率的影響, 計算位移速率時間序列與其他因素時間序列的灰色關聯度(分辨率ρ取0.5), 結果見表2.

表2 位移速率與其余因素間灰色關聯度Tab.2 Gray correlation between the displacement rate and the remaining factors

在選取輸入特征方面, 從斯皮爾曼相關系數角度來看, 日均孔隙水壓力、 土壤有效持水量與位移速率之間的相關性排名分別為第一和第二, 相關性較高; 從灰色關聯度角度來看, 日降雨量、 地表徑流與位移速率之間的關聯度排名分別為第一和第二, 關聯度較高; 如綜合兩者結果來看, 位移速率只有同日降雨量、 日均孔隙水壓力的相關性和關聯度均較高. 本研究所提方法為綜合斯皮爾曼相關系數和灰色關聯度排名, 選擇兩者排名均較前的因素作為輸入特征. 為驗證該方法的優越性, 采用隨機森林模型比較上述不同特征選擇方法所確定的輸入特征對預測效果的影響. 3種特征選擇方法對應的輸入特征組合分別為: 1) 日均孔隙水壓力、 土壤有效持水量(斯皮爾曼相關系數角度選取); 2) 日降雨量、 地表徑流(灰色關聯度角度選取); 3) 日降雨量、 孔隙水壓力(本研究所提特征選擇方法選取). 模型的訓練集為2021年2月25日—6月9日期間的數據, 模型的測試集為2021年6月10日—7月25日期間的數據, 預測結果見圖7.

圖7 不同組合作為輸入特征時模型的預測效果Fig.7 Prediction effect of the model when different combinations of input features are used

從圖7中可以看出, 選擇第3組特征組合作為模型輸入特征時, 模型的預測效果在三者中最好. 說明本研究所提的特征選擇方法篩選出的輸入特征能使模型取得更好的預測效果. 分析上述原因, 主要有以下兩點: 1) 斯皮爾曼相關系數適用范圍雖廣, 但個別情況下會因數據不適用(如文中的位移速率與地表徑流間的關系非單調), 失去統計意義; 2) 在計算灰色關聯度時, 因分辨率取值等原因存在主觀性, 會影響到排序的結果.

綜上所述, 本研究所提方法, 能最大程度上彌補單獨使用斯皮爾曼相關系數或灰色關聯度進行特征選擇的局限性, 更準確地實現模型輸入特征的選擇.

2.3 階躍型滑坡位移速率預測

依據前文所述, 確定日降雨量、 日均孔隙水壓力為預測模型的輸入特征. 有學者研究表明, 滑坡受自身演化階段的影響[19], 學習預測目標以前的趨勢有助于提升模型的預測精確度. 最終, 本研究將日降雨量、 孔隙水壓力、 歷史位移速率作為輸入特征, 位移速率作為輸出特征, 進行模型的訓練和預測. 訓練集和測試集的劃分采用擴展窗口法, 即每預測完一個數據后, 將數據的真實值納入原有的訓練集中, 使模型學習到最新的趨勢, 減少模型過擬合.

用Python搭建結合擴展窗口法的RF模型, 表3所列的模型中4個參數會對模型預測結果產生較大的影響, 其初始參數分別設置為300、 2、 1、 4. 采用LSO算法對這4個參數進行調優, 適應度函數為預測結果與真實值之間的平均絕對誤差(mean absolute error,EMA)、 均方根誤差(root mean square error,ERMS)和擬合優度R2相反數的平均值. 將參數尋優范圍分別設為1~1 000、 2~10、 0~0.5、 1~4, 找到的最佳參數見表3. 圖8展示了優化前后模型的預測效果.

表3 LSO-RF模型搜索參數的最優值Tab.3 Optimal values of search parameters of the LSO-RF model

圖8 LSO算法優化RF參數前后預測結果圖Fig.8 Prediction results before and after optimization of RF parameters by LSO algorithm

文中使用EMA、ERMS和R2評估模型預測效果, 使用LSO算法優化參數后, 模型的EMA、ERMS和R2都較優化前好(優化前EMA為0.594,ERMS為0.900,R2為0.829; 優化后EMA為0.560,ERMS為0.829,R2為0.854); 此外, 模型在位移速率峰值附近的預測更加準確(優化前誤差為7.0%, 優化后為3.4%). 因此, LSO-RF模型可以在數據集較少的情況下有效地預測階躍型滑坡的位移速率.

3 預測模型對比分析

為驗證LSO-RF模型的預測優勢, 本研究將RF模型與SVM、 PLS、 KNN算法進行對比, 結果見圖9. 此外, 將分別經過LSO算法和鯨魚優化算法(whale optimization algorithm,WOA)優化后的RF模型的預測結果同優化前的結果進行對比, 結果見圖10. 各模型的EMA、ERMS和R2見表4.

表4 各預測模型的評價指標值Tab.4 Evaluation index values for each forecast model

圖9 RF模型同常見模型預測結果對比Fig.9 Comparison of prediction results of RF model and common models

從圖9中可看出, 各模型在預測平穩段時表現相近, 但在預測階躍段時表現差異很大. 綜合圖9和表4, PLS略優于KNN模型, 兩者均優于SVM模型, 但它們在預測位移速率峰值時均存在滯后和預測精度不高的問題. 相比之下, 采用RF隨機森林模型在預測階躍段位移速率上表現良好.

如圖10和表4所示, 經過LSO算法和WOA優化后, RF模型的預測效果均有提升. 但LSO-RF模型的預測效果較WOA-RF模型更好, 表現為在峰值速率附近的預測誤差更小(兩者對峰值時刻的預測誤差分別為3.4%與4.5%), 以及EMA、ERMS和R2指標更優. 兩種優化算法在各迭代次數中的適應度值見圖11, 由圖11可知, LSO算法比WOA更快地實現了更好的適應度值, 一定程度表明了LSO算法的尋優能力和速度更強.

綜上所述, 本研究所建立的LSO-RF模型相較于其它常見模型, 能充分地學習、 提取到訓練集中特征的規律, 避免或減少模型的過擬合, 實現利用較少的數據集對階躍型滑坡位移速率更準確的預測, 且獅群優化(LSO)算法在模型參數尋優上具有一定的優勢.

4 結語

1) 提出一種綜合考慮斯皮爾曼相關系數和灰色關聯度結果的特征選擇方法, 用于篩選影響滑坡位移速率的關鍵因素. 該方法選擇的輸入特征能夠提高模型的預測能力, 相比于單獨使用灰色關聯度或斯皮爾曼相關系數進行特征選擇, 本文提出的方法具有明顯的優勢.

2) 隨機森林算法因其具有較好的泛化能力及處理非線性數據等特點, 相較于常見模型, 能有效解決在階躍型滑坡位移速率預測中存在的過擬合問題, 實現更好的預測效果, 其較SVM、 PLS、 KNN模型的預測能力有著很大的進步.

3) 使用LSO算法對RF模型參數進行尋優, 可避免主觀因素和人工搜索的影響, 實現更好的預測效果. 與WOA算法相比, LSO算法具有更強的優化能力, 所搭建的LSO-RF模型可以更準確地預測階躍型滑坡的位移速率, 可為同類型滑坡位移速率預測提供參考.

猜你喜歡
階躍關聯度滑坡
基于階躍雙包層光纖的螺旋型光纖傳感器
滑坡推力隱式解與顯式解對比分析——以河北某膨脹土滑坡為例
探討單位階躍信號的教學
基于灰色關聯度的水質評價分析
淺談公路滑坡治理
基于Fluent的滑坡入水過程數值模擬
“監管滑坡”比“渣土山”滑坡更可怕
基于灰關聯度的鋰電池組SOH評價方法研究
基于灰色關聯度的公交線網模糊評價
一種階躍函數在矩形時間窗口頻域特性的分析方法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合