?

低山丘陵區公路地質災害氣象預報模型對比及應用
——以江西山區公路為例

2024-01-18 03:29李三角謝克勇
中國地質災害與防治學報 2023年6期
關鍵詞:雨量江西省降雨

周 雨,肖 雯,李三角,謝克勇

(江西省氣象服務中心,江西 南昌 330096)

0 引言

江西省三面環山,中部丘陵起伏,亞熱帶季風氣候和復雜的山區地形導致境內交通生態環境極其脆弱,公路地質災害頻繁發生。據統計,僅2020年全省公路滑坡、泥石流、塌方等地質災害發生數量300 余起,其中有90%以上由強降水引起,對沿線交通設施、人民群眾的生命安全構成嚴重威脅[1]。因此,加強山區公路地質災害預報和防治工作具有重要意義。

地質災害氣象預報是一種基于氣象條件與地質災害時空關系特征,研究地質災害發生可能性的方法,其核心是地質災害氣象預報模型研究。傳統的關于地質災害預報模型研究歸納起來可分為統計模型和動力模型兩大類[2]。最初,在獲取足夠多且具有統計意義的地質災害隱患點的基礎上,劉傳正等[3]、白利平等[4]、湯人杰等[5]、呂小波等[6]利用計模型計算誘發地質災害的臨界雨量閾值。此后,劉傳正等[7]、狄靖月等[8]、張海磊等[9]將氣象風險的理念應用到地質災害預報領域,將地質環境條件做為承災體的脆弱性納入預報模型中,取得了較好的效果。統計模型主要依靠臨界雨量的分析,其優點是數據讀取快速、用戶使用便捷,但是并未考慮降水入滲與產匯流等水文過程的影響。動力模型正好彌補了上述不足,劉艷輝等[10]通過分析降雨-滲流-災害發生的機理過程,耦合水文地質模型與斜坡穩定性力學模型;ZHANG 等[11]、包紅軍等[12]、PAN 等[13]綜合分析了地表降水和入滲徑流造成土體邊坡失穩條件引發地質災害的機理過程。由于模型及參數的不確定因素,動力模型應用尚處于實驗室或小范圍研究階段。

近年來,隨著大數據和人工智能技術的發展,基于人工智能的機器學習和深度學習算法在地質災害預報領域得到了廣泛應用,KAIN 等[14]、劉艷輝等[10]、包紅軍等[15]、黃發明等[16]、孫德亮[17]、黃露[18]、劉福臻等[19]、董力豪等[20]的文章應用了邏輯回歸、隨機森林、支持向量機、神經網絡等。本文以江西省高速公路為例,利用國家氣象站觀測雨量數據、江西省高速公路沿線交通氣象站觀測數據和地質災害災情數據,分析高速公路沿線地質環境條件和雨量特征。進一步基于支持向量機SVM、邏輯回歸、K 近鄰和隨機森林4 種機器學習方法,開展公路地質災害預報氣象風險預報研究,以期為山區高速公路地質災害預報提供科學參考。

1 研究區概況

江西地處亞熱帶季風氣候區,雨量充沛,短時大暴雨或連續性降雨使得公路地質災害時有發生。由江西省交通廳應急指揮中心發布的道路管制數據分析可知,僅2020年全省發生公路滑坡、泥石流、塌方等地質災害300 余起,其中90%以上由強降水引起,導致道路遭到不同程度損毀,交通運行安全受到極大的影響。本研究選取江西省內主要高速公路為研究對象,所屬區域東、西、南三面環山,中間丘陵起伏,北部為鄱陽湖及平原。如圖1 所示,江西高速公路沿線高差大多在50 m以上,地勢變化顯著,坡度平陡不一,河網密集,植被覆蓋差異顯著,復雜的地形地貌和降水差異使得江西高速公路各路段呈現明顯的小氣候特征。江西省主要高速公路概況如表1 所示。

表1 江西省主干高速公路概況Table 1 Overview of main highways in Jiangxi Province

圖1 江西省高速公路沿線情況Fig.1 Distribution of along highways in Jiangxi Province

2 材料與方法

2.1 數據來源和質量控制

研究所用的公路地質災害數據由江西省交通運輸廳應急指揮中心提供,時段為2015—2020年,包括災害時間、類別、接報時間、阻斷位置、通行情況等,并對災害記錄進行逐條梳理,保留與降雨相關的災害記錄。同期氣象觀測站點雨量數據源于江西省氣象信息中心,為彌補道路沿線雨量數據不足帶來的分析困難,基于ArcGIS 空間插值功能得到道路沿線地質災害點雨量??紤]到氣象觀測站點與高速公路有一定距離,可能造成空間插值出現偏差,因此在插值時選取空間匹配站點最大距離不超過3 km,最近為500 m,插值結果驗證時,檢測剔除訂正異常值,保證時空要素的一致性,同時泰和-井岡山高速公路沿線雨量還對比了沿線交通氣象觀測站點雨量,效果理想?;A地理信息DEM 高程數據來源于國際科學數據鏡像網站SRTM 地形數據(http://www.gscloud.cn),空間分辨率為90 m×90 m。植被指數數據來源于中國科學院地理科學與資源研究所(https://www.resdc.cn/Default.aspx),空間分辨率為1 km。

2.2 機器學習方法介紹

地質災害預報預警最終要預報的只是“發生地質災害”或“不發生地質災害”,這實質上是一種分類或回歸預測問題,常用的解決該類問題的機器學習方法有SVM、K 近鄰、邏輯回歸、隨機森林等。

SVM 方法是一種基于結構風險最小化理論求解凸二次規劃的最優化算法,可高效處理小樣本、非線性的分類和回歸問題[21],因而在圖像分析[22]、要素預測和數據挖掘[23]等領域取得了較好的實踐效果。本次訓練中,考慮到地質災害樣本的非線性特征,以降雨影響因子為輸入向量,將輸入向量映射投影到更高維的空間中,并在這個高維空間中尋找輸入變量和輸出變量的線性關系進而做出預報。映射函數的選擇是模型結果好壞的關鍵,多次對比試驗后選取高斯函數為映射函數,見式(1)。SVM 方法雖然分類思想簡便,但是對機理過程解釋不佳。

式中:σ——核光滑參數,其值大小取決于樣本容量,通常采用交叉驗證方法確定。

邏輯回歸和 K 近鄰算法既可作為一種分類方法,也可以實現一個因變量與一組自變量之間的回歸分析,相較于SVM 方法更為靈活。使用邏輯回歸模型進行地質災害概率預測時,需選取相對獨立的因子。K 近鄰方法將降雨誘發因子做為樣本特征參數,地質災害發生與否做為目標向量,通過距離公式尋找距離目標最近的k個點(即k個“近鄰”),而后通過這k個“近鄰”所提供的信息,對新樣本進行預測,將出現最多次的預測類別或者目標標簽平均值作為預測結果的一種經典的機器學習方法。K 近鄰方法穩定度和準確度高、對異常值不敏感,但與SVM 方法一樣對于機理釋用比較困難。隨機森林是一種有監督的機器學習方法,該方法通過bootstrap 重抽樣技術,從原始訓練集中有放回地抽取多個樣本生成新的樣本集,由此構建多個相對獨立的決策樹,最終綜合得到最優分類結果。相較于前述3 種方法,隨機森林在樣本選取方面更具隨機性,且無須進行預處理,泛化能力更優,能有效避免過擬合。

本研究基于python 語言,構建基于SVM、邏輯回歸、K 近鄰和隨機森林4 種機器學習模型,比較不同模型的預報效果,目的是研發精細化的山區高速公路氣象風險預報產品,更好地開展交通氣象保障服務,為公眾正常出行和社會經濟和諧發展保駕護航。

2.3 模型構建

訓練樣本集的構建是基于人工智能學習研發地質災害預報模型的根本[15],一定程度上直接決定了模型預報的準確度和泛化能力。研究表明,地質災害的發生發展是地質環境和降雨條件共同作用的結果,因此本研究模型訓練樣本綜合考慮了兩方面的屬性,其中地質環境條件做為易發性因子,包括地形、坡度、高程、河網密度、植被覆蓋5 個地質環境特征項;降雨條件做為危險性因子,根據劉艷輝等[15]研究方法,綜合考慮小時雨量、前0—2 h 雨量、前0—11h 雨量、前0—2d 有效雨量、前10 d 有效雨量以及前15 d 有效雨量等6 個雨量特征項。利用2015—2020年江西境內高速公路地質災害點地質環境與同期雨量氣象數據構進行空間疊加分析構建正樣本集,選取同等數目的上述同期未發生地質災害點構建負樣本集。本次試驗共收集716 樣本,按照7∶3 比例劃分樣本訓練集和測試集,樣本構建及訓練流程如圖2 所示。

圖2 基于機器學習方法的公路地質災害預報技術路線圖Fig.2 Road geological disaster prediction technology roadmap based on machine learning methods

3 結果與討論

3.1 地質環境特征

采用研究區的DEM 數據,經過ArcGIS 柵格表面分析、掩膜提取、自然斷點分級法等處理后,得到高速公路沿線地質環境因子。分析可知,江西省主要高速公路沿線地形極為復雜,高速沿線海拔高度范圍為0~600 m,公路東北段和南段海拔高度普遍在200 m 以上,局部路段超過450 m;公路沿線坡度范圍為0°~35°,東北段20°~35°。坡向分布上,公路沿線坡向為0°~360°,不同地域間差異不顯著。公路附近的河網密度值為0.1~1.3km/km2之間,除鄱陽湖外,中部和東北部路段沿線河網密集。植被覆蓋上,歸一化植被指數指數值為0.2~0.7,環鄱陽湖路段植被覆蓋相對較低。進一步將地質環境因子關聯到災害點,分析災害點附近地質特征可知:江西高速沿線地質災害隱患點海拔高度為300~450 m,占總數73%;災害所處的坡度范圍為10°~50°,數量隨地形坡度增加呈現單峰型分布;這是因為坡度增大,斜坡坡面附近應力增加,坡腳應力集中,導致斜坡不穩定繼而誘發地質災害。坡向分布上,地質災害點各個坡向在0°~360°均有發生。地質災害附近河網密度值為0.5~1.0,占災害總數的70%,河網越密集,越容易誘發地質災害。高速沿線地質災害發生點植被指數歸一化植被指數值為0.3~0.6,表明有一定的植被覆蓋地區反而更容易發生地質災害。

3.2 降雨特征

統計結果表明,2015—2020年江西省公路地質災害次數呈逐年上升趨勢,其中崩塌、山體滑坡、泥石流、地面塌陷災害占地質災害總數的88%。受強降雨影響,地表水迅速匯集沖刷坡腳或滲入坡體軟化巖土,重力作用使得位于公路邊坡上的巖土體突然脫離母體,從而堆積在公路路基上造成災害。研究發現,對地質災害有影響的降雨一般發生在地質災害前15 d 內[24-25],且不同的降雨類型誘發的地質災害預報準確度不同[26-27],因此本文在分析地質災害與降雨關系時,綜合考慮了災害發生前14 d 的總有效雨量和降雨持續時間2 個因子,進一步建立合理的判別依據,明確誘發地質災害的降雨特征。

目前計算有效雨量普遍采用的是API 方法,計算有效雨量,計算公式如下:

式中:RE——有效雨量,表示從災害發生時次的當天算起(災害發生當日=0,災害發生前1 d,i=1,前2 d,i=2)的雨量;

Ki——第i個遞減系數;

Ri——災害發生當日算起,前第i天降水量/mm。

在對降雨誘發的358 例地質災害進行分析時,定義P為降雨量誘發公路地質災害的貢獻率,根據降雨持續時間長短,引入判別系數D和P對致災降雨特征進行分類,公式如下:

由表2 計算得到D≈0.51 。根據式(3)(4),當P0-2d=R0-2d/R0-14d≤D時,認為該次公路地質災害是由于長歷時降雨造成的;當P0-2d=R0-2d/R0-14d>D時,認為該次公路地質災害是由于短期降雨造成的;當R0-11h/R0-2d>0.8時,則認為該次公路地質災害是由于短時強降雨造成的。通過計算得到,誘發地質災害的降雨包括長歷時降雨、短期降雨和短時降雨3 種類型:其中長歷時降雨一般認為地質災害發生當日前有連續性降雨,累計雨量在50 mm 以上;短期降雨為地質災害發生當日及前2 d有降雨,累計雨量在50 mm 以上;短時降雨為地質災害發生當時及前11 時以內降雨,累計雨量在30 mm 以上。當地質災害發生前有降雨,但是累計雨量達不到30 mm 以上的,暫不考慮是降雨誘發引起的地質災害;當發生地質災害時滿足短時、短期或長歷時中兩種或兩種以上時,優先考慮是由長歷時降雨引起,其次是短期或短時降雨。圖3 給出了各類降雨引發的地質災害分布,分析可知358 條公路地質災害記錄中,193 次公路地質災害是由于長歷時降雨造成的,主要分布在大廣高速、昌九高速、滬昆高速萍鄉至新余段;143 次公路地質災害是由于短期降雨造成的,主要分布在G45 大廣高速武寧-上高段和吉安-南康段、寧定高速、G76 廈蓉高速;僅6%是由短時降雨造成的,主要分布在G56杭瑞高速、G60 滬昆高速萍鄉-新余段??傮w而言,江西主要高速公路地質災害大多是由長歷時降雨和短期降雨造成的,由短時臨近降雨造成的公路地質災害情況占比較少。

表2 有效雨量衰減系數表Table 2 Table of effective rainfall attenuation coefficients

圖3 地質災害不同降雨型分布Fig.3 Distribution of geological disasters for different rainfall types

3.3 結果分析

基于測試樣本,對4 種常用機器學習分類模型進行對比評估,分析結果顯示4 種預報模型的準確率均超過0.75,對比各模型的準確率和模型泛化能力指標可知:對于不同的降雨類型造成的地質災害而言,4 種模型對連續性降雨造成的地質災害預報準確率最好,其次為短期降雨造成的地質災害,短時降雨誘發的地質災害預報效果最不理想。這是因為短時降雨具有突發性,因而造成的地質災害也具有瞬時性和不可預見性。對比同一降雨類型可知:對于短時降水,邏輯回歸和隨機森林方法預報效果相對較好,準確率都在0.82 以上,SVM方法和K 近鄰方法預報效果不太理想,準確率分別為0.732 和0.785,AUC分別為0.756 和0.825,二者均存在漏報較多的情況。對于短期降水,K 近鄰和隨機森林方法預報效果較好,準確率分別為0.863 和0.924,AUC分別為0.756 和0.925。對于長歷時降水,邏輯回歸和隨機森林預報較為理想,準確度都在0.95 以上,AUC值為0.94 以上。綜合而言,4 種模型中邏輯回歸模型預測準確率最高,為0.949,模型泛化能力為0.944;其次為隨機森林模型,準確率為0.918,模型泛化能力為0.917;K 臨近和SVM 模型相比較而言,效果不太理想。各模型的泛化曲線如圖4 所示。

圖4 4 種機器學習模型ROC 泛化曲線Fig.4 ROC curves of the four machine learning models

4 案例應用

以2020年6 月8—9 日江西省一次強降水過程誘發地質災害為例,基于邏輯回歸模擬江西省2020年6 月8 日高速公路地質災害預報業務運行,模型輸出地質災害發生的概率,依據概率大小確定預警等級:當概率P≤40%為低(較低)風險,不發預警;當概率P>40%且P≤60%為中風險,發布高速公路地質災害黃色預警;當P>60%且P≤80%為較高風險,發布高速公路地質災害橙色預警;當概率P>80%為高風險,發布高速公路地質災害紅色預警,結果如圖5 所示。據江西省交通監控指揮中心提供的數據,2020年6 月8 日全省高速公路有8 處發生地質災害,主要分布在德昌高速、濟廣高速贛州至泉南段、滬昆高速萍鄉至豐城段,均落在高風險預警路段內。

圖5 2020年6 月8 日江西省高速公路地質災害預報Fig.5 Geological disaster forecast for Jiangxi Province highways on June 8,2020

5 討論

本文基于4 種不同的機器學習方法,開展了針對不同降雨類型誘發的公路地質災害預報研究,這在目前國內外公路地質災害預報研究中是一種創新。陶星宇等[1]對林芝市公路地質災害易發性開展了區劃,基于邏輯回歸方法建立了氣象預報模型,但并未對造成災害的雨量進行分類研究,其預報準確率不及本研究分類型預報的準確率。陳華興[28]基于穩定性系數、臨界降雨強度等各類滑坡預報判據,開展公路地質災害預報,其對所預報路段地質災害監測要求較高,普適性不強。李宇梅等[29]開展區域公路地質災害臨界雨量預報,該預報只考慮了降雨因子,并未考慮地質環境條件,在實際預報時經常會存在漏報的情況。盡管本文研究實現了對江西省高速公路地質災害的預報預警,但仍存在一定的局限性,如地質環境特征只考慮了高差、坡度和坡向,并未考慮發生地質災害的坡體類型,而實際上不同的坡體類型或地質構造對地質災害發生與否影響重要。劉洋[30]研究表明,由土體組成的坡體較堅硬巖層坡體在強降雨作用下更容易誘發地質災害。其次,劃分的3 種誘發地質災害降雨類型并不是有嚴格的界定,誘發地質災害的降雨類型多樣,有時是一種或者多種類型混合,如臺風降雨造成的地質災害既可能存在短時強降雨,也可能是短期降雨。再者,模型預報效果與樣本數量有關,基于短時降雨預報效果較差,除了短時降雨的突發性外,可能與用于訓練的樣本較少也有一定的關系,這在我們的后續研究中將收集更多的地質災害記錄來改進。

6 結論

(1)提出了基于機器學習的公路地質災害預報預警方法,綜合考慮地質環境因子和降雨因子構建預報模型,構建正負樣本集、訓練集和測試集,實現模型保存和調用。

(2)探討了高速公路地質災害與地質環境的關系,發現江西高速公路沿線地質災害所處的海拔高度以300~450 m 最多;災害坡度以20°~35°居多,隨地形坡度增加呈現單峰型分布;河網密集和有一定的植被覆蓋地區更容易發生地質災害。提出了誘發公路地質災害的3 種主要降雨類型,分別為長歷時降雨、短期降雨和短時降雨,其中以長歷時降雨和短期降雨誘發的地質災害居多。

(3)分析了4 種機器學習模型優缺點,比較各模型在不同降雨類型誘發的公路地質災害中的預報準確率、模型泛化能力AUC和ROC 曲線,并給出了模型輸出地質災害發生概率及相應的預警等級。以2020年6 月8—9 日江西省一次強降水過程誘發地質災害為例開展實例校驗,結果顯示:當日8 處發生地質災害均落在高風險預警路段內,上述預報模型預警效果較好,可做為實際業務預報參考。

猜你喜歡
雨量江西省降雨
模擬成真
寧夏紅柳溝流域水沙變化及產沙分析
《江西省志?審計志》順利通過驗收
考了個大的
基于小波去噪的稱重雨量數據分析
滄州市2016年“7.19~7.22”與“8.24~8.25”降雨對比研究
SL—1 型雨量傳感器故障分析排除和維護
紅黏土降雨入滲的定量分析
南方降雨不斷主因厄爾尼諾
江埡水庫降雨徑流相關圖的建立
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合