?

耦合遞歸特征消除與二維CNN的滑坡敏感性評價

2024-01-15 00:44李英冰張鎮平胡露太
測繪通報 2023年12期
關鍵詞:敏感性滑坡函數

張 沛,李英冰,張鎮平,胡露太

(武漢大學測繪學院,湖北 武漢 430079)

山體滑坡是地震造成的嚴重次生災害之一,地震會使原本處于極限平衡或將近極限平衡的山坡在極短時間內經歷裂縫與下滑的整個過程。地震災害具有突發性,地震滑坡具有形成時間快、規模大、破壞性極強的特點,容易造成人員傷亡和不可估計的經濟損失。2008年汶川地震是有記錄以來誘發地質災害最多的地震,觸發了15多萬處滑坡[1-2]。

對滑坡易發地區進行滑坡敏感性分析,可以對滑坡發生概率高的地區進行針對性監測預警,為滑坡風險管理與防災減災提供支持。目前滑坡敏感性的評價方法有4類:確定性物理模型、啟發模型、統計模型與機器學習模型[3]。物理模型需要實地勘察,耗費大量人力[4];啟發模型(如層次分析法)依賴專家主觀先驗知識[5];統計模型挖掘滑坡與影響因子間的關聯模式,常用信息量與頻率比模型等[6];文獻[7]對礦山附近滑坡敏感性的研究中用信息量方法顧及各種滑坡影響因子,但沒有區分不同因子的貢獻程度。

隨著機器學習的成熟與發展,邏輯斯蒂回歸LR、支持向量機SVM、隨機森林等在滑坡敏感性評價上表現出優異性能[8-9]。文獻[10]將隨機森林與InSAR相結合,預測了滑坡敏感性。新興的深度學習也憑借其對海量多維數據特征的挖掘能力,在多個領域發展迅猛。文獻[11]將CNN、RNN應用于伊朗的滑坡敏感性分析。國內將其應用于該領域的研究起步較晚,文獻[12]采用一維CNN評價了川藏鐵路沿線的滑坡敏感性。但傳統機器學習與一維CNN忽略了滑坡通常與周圍的空間環境有緊密聯系。

因此,本文提出耦合遞歸特征消除與二維卷積神經網絡相結合的RFE-2DCNN模型,對滑坡影響因子貢獻度排序篩選,用優化的二維CNN保證模型質量與精度,輸入二維圖像彌補了傳統機器學習與一維CNN方法僅考慮當前滑坡點信息的缺陷,預測滑坡敏感性。

1 研究方法

本文提出的RFE-2DCNN滑坡敏感性評價方法的技術路線如圖1所示。

圖1 RFE-2DCNN方法技術路線

1.1 數據預處理

滑坡敏感性的影響因子中,巖性、土地利用、坡向屬于類別變量,采用信息量法對其進行量化[13]?;掠绊懸蜃舆^多時,可能出現多重共線性,干擾建模結果,使其出現誤差。因此,首先使用方差膨脹因子VIF檢測滑坡影響因子之間的多重共線性。當VIF>10時,認為該因子與其他因子高度相關,予以剔除[13]。

1.2 RFE-2DCNN方法

1.2.1 遞歸特征消除(RFE)

遞歸特征消除法旨在消除冗余及不相關變量,是一種尋找最優特征子集的貪心算法。通過循環迭代,每次消除一個最不相關的特征,根據被消除的順序對特征排序,選出最優特征子集[14]。

1.2.2 二維卷積神經網絡(2DCNN)

一維CNN和機器學習方法的數據輸入為單個滑坡點的影響因子特征集,輸入數據大小為1×1×n,其中n為影響因子個數?;碌陌l生不僅與自身有關,還與孕災環境相關,因此使用二維CNN且輸入二維柵格圖像考慮滑坡點的空間信息。將采樣點作為圖像中心點,裁剪出25×25個柵格單元構成二維柵格圖像,疊加所有滑坡敏感性影響因子圖層,形成25×25×n的多通道圖像,將其作為二維CNN的輸入,再將預測精確度作為目標函數且進行模型訓練。

本文采用的2DCNN結構如圖2所示。其中,卷積層(Conv)用于提取滑坡影響因子特征,卷積核大小為3×3,經3次卷積后分別得到深度為32、64和128的特征圖。

圖2 2DCNN結構

通過卷積層后使用ReLU激活函數與歸一化BN層,ReLU激活函數將影響因子的特征映射至非線性維度,學習高維度特征;BN層用于加快2DCNN的訓練和收斂速度,防止過擬合[15]。通過最大池化層(MaxPool)降低分辨率,獲得具有空間不變性的滑坡特征,減少網絡的數據量與計算復雜性[16],最后使用1×128維度的全連接層(FC)展平特征。

為了防止過擬合,在全連接層中加入L2正則化與Dropout。Dropout在訓練時隨機棄用一定比例的神經元,L2正則化在原始損失函數C0后添加正則化項以防止權重過大,使模型更平滑[17],最后通過Sigmoid函數對滑坡特征進行分類,輸出預測的滑坡發生概率。

1.3 對比試驗方法

采用機器學習方法:Logistic模型和帶有線性核函數Linear、徑向基核函數RBF與Sigmoid核函數的SVM模型驗證結果,采用與2DCNN相同的特征因子集訓練。

Logistic在滑坡敏感性分析中應用廣泛,模型將滑坡影響因子線性組合后,以Sigmoid函數作為后驗概率分布函數進行分類[18]。SVM核函數將影響因子特征映射到高維空間,利用高維空間中的超平面對滑坡進行分類[19]。

在帶有核函數的SVM中使用粒子群算法尋找最優參數,包括SVM-Linear的懲罰參數C、SVM-RBF和SVM-Sigmoid的懲罰參數C與核函數參數γ。最后使用受試者工作特性曲線ROC及AUC衡量模型性能。

2 研究區域與試驗數據

2.1 研究區概況

2017年8月8日,四川省阿壩州九寨溝縣發生7.0級地震,此次地震烈度高、震源淺,震區地質環境脆弱,給九寨溝景區的生態環境帶來嚴重破壞[20]。同時,地震觸發了大量同震滑坡,造成了交通堵塞,對應急救援進度產生了嚴重影響。

震區主要受岷江斷裂、虎牙斷裂、文縣-瑪沁斷裂影響[21],海拔為2048~4455 m,地形起伏大,位于寒冷的亞濕潤和半干旱季風性氣候區,年均降雨量約為550 mm[15]。本文選取阿壩州九寨溝縣西南部(涵蓋所有同震滑坡的范圍)為研究區域,面積約為457.54 km2,如圖3所示。

圖3 研究區域概況

2.2 研究數據

2.2.1 滑坡清單

滑坡清單是敏感性評價的數據基礎,該數據來源于國家冰川凍土沙漠科學數據中心。研究區域共有滑坡4834個,最大面積約為0.2 km2,最小面積約為7 m2,總面積約為9.6 km2。

2.2.2 影響因子

本文選取海拔高度、地形濕度指數(TWI)、坡度、坡向、平面曲率、剖面曲率、地形起伏度、植被歸一化指數(NDVI)、峰值地面加速度(PGA)、距水系距離、距斷層距離、距道路距離、土地利用、巖性共14個因子作為滑坡敏感性的評價因子。

DEM、坡度、坡向、TWI、曲率、地形起伏度用于反映研究區域地形狀況,通常較為陡峭的區域更容易發生滑坡。巖性與距斷層距離表明地質情況,與土層動力穩定性有直接關聯。土地利用和NDVI表征不同土壤濕度和地表徑流,間接影響滑坡發展。土地利用與距道路距離反映人類活動情況。PGA則是衡量地震對滑坡影響的重要因素[22]。

影響因子來源見表1,分布如圖4所示,根據DEM分辨率,將所有影響因子的分辨率統一至30 m,組成14個柵格圖層輸入模型,分析九寨溝地區滑坡敏感性。

表1 數據來源

圖4 滑坡敏感性影響因子

3 滑坡敏感性建模結果

3.1 多重共線性分析

通過方差膨脹因子VIF檢測滑坡影響因子間的相關性。當VIF>10時,被認為與其他因子高度相關,檢測結果見表2,坡度與地形起伏度有較高相關性。將地形起伏度因子去除后,所有因子VIF值均小于10,說明剩余因子間不存在多重共線性。

表2 影響因子多重共線性與重要性排序

3.2 RFE-2DCNN滑坡敏感性評價

利用遞歸特征消除法對剩余因子進行排序,每次剔除一個貢獻最低的特征,組成新的滑坡特征集,重新計算特征重要性,通過10折交叉驗證計算分類精度,重復此過程對所有因子進行排序,選擇分類精度最高的滑坡特征集,結果見表2,剔除貢獻較低的NDVI、距道路距離與距水系距離,其余10個因子被輸入模型進行滑坡敏感性計算。

以1∶1比例隨機選2000個滑坡點與非滑坡點作為訓練集,訓練時使用5折交叉驗證測試模型擬合優度。按相同比例隨機選400個滑坡點與非滑坡點作為測試集。裁剪周圍的柵格單元組成25×25大小的柵格圖像作為輸入數據集。訓練時使用Adam優化器,根據交叉驗證中的驗證集精度自適應改變學習率,加入早停法,當驗證集精度下降時停止訓練,保證訓練時的驗證集精度。

將訓練好的RFE-2DCNN模型應用至整個研究區域,如圖5所示,利用自然斷點法將滑坡敏感性分為5類:極高敏感性[0.78,1)、高敏感性[0.53,0.78)、中等敏感性[0.29,0.53)、低敏感性[0.10,0.29)與極低敏感性[0,0.10),各部分所占比例見表3。極高敏感區在西北部的九寨天堂景區及東南部的熊貓海至箭竹海景區分布較多,這與地震滑坡發生的地區相吻合。研究區域大部分為中低風險,占比約為80.1%;極高敏感性區域僅為10.8%,范圍較小。此外,86%的實測滑坡發生在高敏感性與極高敏感性地區內,證明模型得到的結果與實際情況相吻合。

表3 RFE-2DCNN法滑坡敏感性各部分比例

圖5 RFE-2DCNN方法的滑坡敏感性分布

3.3 對比試驗與精度評價

為了評價本文提出的RFE-2DCNN模型的有效性與正確性,將其與Logistic、SVM兩種機器學習方法作對比。機器學習方法得到的預測結果如圖6所示。與圖5對比發現,考慮周圍一定范圍內信息的RFE-2DCNN得到的結果更平滑連續,僅考慮單點影響因子狀況的機器學習方法得到的結果更為破碎。

圖6 機器學習方法的滑坡敏感性分布

5種方法的測試集精度見表4。機器學習中SVM-RBF在測試集的準確度最高,但仍比RFE-2DCNN準確度低1%。圖7 RFE-2DCNN的AUC值最大,相較于SVM-RBF模型提高了0.018。整體而言,在本文對比的幾個模型中,RFE-2DCNN模型的泛化能力與預測精度是最好的。

表4 試驗準確度與AUC

圖7 ROC曲線

4 結 語

本文方法改進了傳統機器學習與一維CNN僅考慮滑坡點信息的不足,增加了滑坡點周圍空間信息在模型中的作用。首先在14個滑坡影響因子中,根據多重共線性檢測與遞歸特征消除法保留具有最大貢獻的10個影響因子,隨后將其輸入帶有L2正則化、Dropout與早停優化方法的二維CNN進行九寨溝地區的滑坡敏感性評價,最終將滑坡發生概率劃分為極高、高、中、低與極低5類。

結果表明:研究區大部分是中低風險,高風險區域與極高風險區域范圍較小;86%的實測滑坡發生在高敏感性與極高敏感性區域內,證明了模型的正確性與有效性。經過與Logistic模型、帶有Linear、RBF和Sigmoid核函數的SVM模型對比發現,本文方法有最高的準確度90.5%和AUC(0.968)。證明顧及周圍環境信息可以提高模型泛化能力與預測精度。

5種方法的滑坡敏感性圖表明,九寨天堂景區與九寨溝風景區附近存在敏感性較高的區域,這對九寨溝地區的旅游業有一定影響,災害應急管理部門可以增加對高敏感性區域災情的監測與預警,對滑坡易發區域實施治理與防范措施,降低滑坡災害損失。

猜你喜歡
敏感性滑坡函數
二次函數
第3講 “函數”復習精講
滑坡推力隱式解與顯式解對比分析——以河北某膨脹土滑坡為例
二次函數
函數備考精講
釔對Mg-Zn-Y-Zr合金熱裂敏感性影響
淺談公路滑坡治理
基于Fluent的滑坡入水過程數值模擬
“監管滑坡”比“渣土山”滑坡更可怕
AH70DB鋼焊接熱影響區組織及其冷裂敏感性
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合