?

加權確定性系數模型的滑坡易發性評價

2020-06-16 00:31喬德京王念秦郭有金楊盼盼
關鍵詞:隨機森林滑坡

喬德京 王念秦 郭有金 楊盼盼

摘?要:針對傳統的滑坡災害易發性評價中僅考慮評價因子間的一級指標權重或者因子各分級狀態的二級指標權重,未能考慮各評價因子各分級狀態的綜合權重,從而導致評價結果缺乏一定適應性問題。文中提出了將隨機森林模型(Random Forest,RF)和確定性系數模型(Certainty Factor,CF)相耦合的加權確定性系數評價模型(Weighted Certainty Factor,WCF)。該模型通過CF模型計算二級指標因子權重,并利用RF模型計算出一級指標因子權重,然后通過將所有指標因子的易發性指數進行加權求和,獲得多種因素耦合下的滑坡災害易發性程度。以陜西省西安市周至縣為研究區,在對研究區的地質環境、人類活動情況、滑坡分布特征及形成條件進行了綜合分析的基礎上,選取了14類與滑坡發生相關的指示因子,結合GIS的空間分析功能,分別采用CF,RF和WCF模型對研究區內滑坡災害易發性進行區劃,各模型的評價結果采用Kappa系數進行對比驗證。研究結果表明:研究區內的滑坡主要受高程、地貌類型、與斷層距離因子的影響,各因子所占權重分別為0.27,0.12,0.11;改進后的WCF模型區劃結果的準確性相對于RF和CF模型提高了5.2%和9.9%.由此表明,WCF模型更適用于研究區的滑坡易發性評價,評價結果可為研究區的滑坡災害防治規劃提供重要的參考價值。

關鍵詞:滑坡;易發性評價;WCF模型;隨機森林;確定性系數

中圖分類號:P 642

文獻標志碼:A

文章編號:1672-9315(2020)02-0259-09

DOI:10.13800/j.cnki.xakjdxxb.2020.0210開放科學(資源服務)標識碼(OSID):

Landslide susceptibility assessment based on

weighted certainty factor model

QIAO De-jing,WANG Nian-qin,GUO You-Jin,YANG Pan-pan

(College of Geology and Environment,Xian University of Science and Technology,Xian 710054,China)

Abstract:The susceptibility assessment of landslide hazard is the basis for geological hazard risk assessment.Taking Zhouzhi County of Xian City,Shaanxi Province as an example,based on the analysis of geological environment,landslide distribution characteristics and formation conditions in the area,14 evaluation factors of topography,hydrology,geology and human engineering activities were selected.The random forest(RF)model and the deterministic coefficient(CF)model were used to evaluate the susceptibility of landslides in the area.According this paper combines the weight of the first-level index factor of the random forest model and the weight of the second-level index factor of the deterministic coefficient model and proposes a landslide susceptibility evaluation model based on the weighted deterministic coefficient(WCF),which was use to evaluate the susceptibility of landslides in the study area.The evaluation results of each model were compared and verified by the Kappa coefficient.The results show that the landslides in the study area are mainly affected by elevation,landform type,and fault distance factor,and the weights of each factor are 0.27,0.12,and 0.11,

respectively.The prediction accuracy of the WCF model is 5.2% and 9.9% higher than that of the RF and that ofCF models,respectively.The model turns out to be better for evaluating the susceptibility of landslides in the region.

Key words:landslide;susceptibility assessment;

WCF model;random forest;certainty factor

0?引?言

滑坡是我國常見的地質災害形式之一,其具有歷時短和破壞程度大等特點,對人民生命財產安全和生態環境造成巨大破壞,嚴重制約著國民經濟的發展[1]。因此,對滑坡災害進行有效的預測和預防具有重要的意義[2]?;聻暮σ装l性評價是根據滑坡災害發育特征,

并參考其發育現狀,應用定性分析結合定量評價的方法對災害易發性予以確定[3-5]。評價結果能夠直觀地反映滑坡災害的空間分布,并且為預防潛在的滑坡災害提供參考。

目前滑坡的易發性評價過程如下:首先在對區內的地質環境條件、滑坡分布特征、形成條件、影響因素以及滑坡編錄庫內的滑坡自身特征分析的基礎上,選取評價因子指標;然后通過分析各評價因子與滑坡的空間分布關系,進而確定各因子的權重;最后構建評價模型對整個研究區滑坡易發性做出評價,并對評價結果進行檢驗[6]。如許沖等人針對汶川地震滑坡選取8個影響因子,采用確定性系數模型(Certainty Factor,CF)對其易發性做出評價,結果表明極高與高易發區與實際滑坡之間有著良好的一致性[7]。吳孝情等利用隨機森林模型(Random Forest,RF)對東江流域滑坡危險性做出評價,在評價過程中,針對因子提出一種客觀賦權方法,為不同類型的評價因子賦權提供新思路[8]。王佳佳等采用信息量模型計算出評價因子各分級狀態的信息量值進而對三峽庫區萬州區滑坡易發性進行研究,得出較好的預測結果[9]。

綜上所述,在易發性評價過程中,大多數研究在確定評價因子權重時,僅考慮評價因子的一級指標權重或者各評價因子分級狀態的二級指標權重,而忽視了評價因子在各分級狀態的綜合權重,使得評價結果缺乏一定的適應性。文中提出了基于RF模型與CF模型相耦合的加權確定系數模型(Weighted Certainty Factor,WCF),以陜西省西安市周至縣為例,在GIS的支持下,分別利用RF模型、CF模型和改進的WCF模型對研究區進行滑坡災害易發性區劃,并采用Kappa系數對各模型的評價結果進行精度驗證。

1?研究方法

1.1?確定性系數模型

確定性系數模型(CF)是一種概率函數,它是一種用來分析影響某一事件發生的各因素分級狀態權重的方法[10]。最早在1975年由Shortliffe提出,Heckerman對其進行改進推廣,被廣泛應用于在權重計算中[11]。該模型結合GIS技術廣泛應用滑坡易發性評價區劃中,其計算公式為

式中?PPa為某一事件(滑坡災害)在影響因素分級狀態a中發生的條件概率,在實際應用中常表示為在分級狀態a中的滑坡點數與分類面積的比值;PPs為歷史滑坡在整個研究區中發生的概率,即總滑坡災害點占研究區面積的百分比。

由公式(1)可知,CF的取值范圍為[-1,1],當CF>0時,表示某事件發生的確定性大;CF<0時,表示事件發生的確定性小;當CF=1時,表示事件一定發生;CF=-1時,表示事件一定不發生;CF=0時,表示無法判斷事件是否發生。

確定系數模型的優勢在于其可以避免專家打分等方法引起的人為因素的影響,能夠較好地反映各評價因子內部不同特征變量對滑坡災害易發性的貢獻,然而其忽略了各評價因子對滑坡災害易發性的影響存在一定的差異。

1.2?隨機森林模型

隨機森林模型(Random Forest,簡稱RF)屬于集成學習領域中用于對樣本進行分類預測的一種方法。它屬于一種特殊的自助抽樣集成(Bagging)方法,并以決策樹作為Bagging中的模型[12]。該模型首先采用自助法(Bootstrap)對大小為N的原始樣本進行有放回的隨機抽樣,得到m個大小為N的新的訓練集,然后對每個訓練集,構造一棵決策樹分類器,在決策樹節點處進行特征分裂時,采用隨機抽樣的方式從全部特征中抽取一部分,從抽取的特征中尋找最優解應用于節點,進行分裂。最后給定任一樣本點,可以得到m個決策樹分類結果,采用投票方式確定樣本最終的分類結果,具體實現過程如圖1所示。

該模型在不僅處理大數據、高維度、缺省值問題方面具有明顯優勢,而且在地質災害易發性評價過程中,可以評估出各個評價因子的貢獻率,避免了人為主觀賦權的影響。除此之外,該模型比層次分析法更簡單、準確,且模型的穩定性和預測精度較高。

1.3?加權確定系數模型

據上述分析,可以發現傳統的CF模型可以準確、客觀地獲取評價因子內部不同分級對滑坡災害易發性的影響程度,但是其不能很好確定各因子之間的相對權重。RF模型能夠根據確定不同評價因子之間對滑坡災害易發性的相對權重。因此,為了獲得更加準確客觀的滑坡災害易發性區劃,文中將CF模型與RF模型相耦合,構建了一種加權確定系數模型(WCF模型),其將RF獲得的一級指標因子權重與CF模型計算出的二級指標因子權重分別對應相乘,即得到各評價因子的綜合權重,該模型融合RF模型和CF模型的優點,其表達為式中?wp為RF模型獲得的評價因子p的一級指標權重;xpq為CF模型計算出的評價因子p的二級指標因子權重。

2?研究區概況

研究區位于陜西省西安市西南部的周至縣,地理坐標為東經107°39′~108°31′,北緯33°42′~34°14′,總面積2974 km2,南北長約59.8 km,東西寬約67.3 km(圖2)。區內地勢北低南高,由3個地貌單元組成,分別為渭河平原、黃土臺塬、秦嶺剝蝕山地。研究區屬暖溫帶半濕潤大陸性季風氣候,年平均氣溫13.2 ℃.降雨量在空間分布上存在明顯的差異,平原地區年均降雨量為700.6 mm,山區年均降雨量為865.1 mm.地表水主要為河流,區內共有大小河流15條,均屬于渭河水系和漢江水系。區內發育有9條大的斷裂帶。境內共有地質災害177處,其中滑坡災害點145處,占總災害數的81.9%.

3?評價因子的選取與分級

3.1?評價因子選取

滑坡發生的因素分為主控因素和誘發因素[13]。主控因素主要包括地形地貌因子、水文因子以及地質因子等對滑坡的發生起控制作用的因素;誘發因素主要包括降雨量、人類工程活動等誘發和促進滑坡發生的因素。在收集與分析相關資料(地質圖、高程數字模型DEM,路網圖、氣象站點數據、水系圖、滑坡編錄數據庫,區域滑坡調查報告等)的基礎上,選取地質類因子:巖土體類型、與斷層距離;地形地貌類因子:高程、坡度、坡向、曲率、地形起伏度、地表切割深度、地表粗糙度、地貌類型;水文類因子:降雨量、與水系距離、地形濕度指數;人類工程活動類因子:與道路距離,共14類。

3.1.1?地質類因子

地質類因子屬于滑坡災害的控制因素,坡體失穩發生的概率與地層巖性有密切關系[14]。巖土體類型決定巖土體的物理和水理性質。根據研究區的巖相、巖體結構、強度和巖性等要素,研究區的巖土體類型可分為:塊狀堅硬巖、層狀較堅硬巖、松散軟弱巖和破碎半堅硬巖。此外,離斷裂帶距離也是誘發滑坡災害的重要因素。距離斷裂帶越近,巖土體越破碎,坡體的穩定性越差,滑坡災害越容易發生,反之,滑坡災害發生的概率相對較低。離斷層距離通過對地質圖中斷層矢量化,然后采用歐氏距離計算得到。圖3展示了研究區內的巖土體類型和斷層距離的空間分布情況,可以看出,研究區的巖土體類型大部分為塊狀堅硬巖、層狀較堅硬巖和破碎半堅硬巖,分布較集中,松散軟弱巖較少,分布相對零散。斷層距離的空間分布表明研究區內部存在著多條斷層帶。

3.1.2?水文類及人類工程活動類因子

滑坡災害的發生往往與水有密切關系,其中降雨是誘發滑坡災害的主要因素,本研究采用克里金插值將收集的氣象站站點觀測數據,得到研究區的年均降水量格網數據。其次,河流將對坡體坡腳浸濕、沖刷和淘蝕,加速了坡體的失穩,引發滑坡災害。本次評價以200 m為間隔將研究區距河流的距離分為8個緩沖區,分類結果如圖4所示。已有研究發現地形在地表水再分配過程中起到重要作用,因此本研究引入了地形濕度指數(Topographic Wetness Index,TWI)[15],該指數以DEM為基礎,能夠刻畫出地形變化對地表徑流的影響,其計算可以利用GIS的水文分析工具獲得。

對于人類活動因素,文中選取了離公路距離因子進行分析。離公路距離可反映人類活動程度,距公路的距離越近,人類工程活動相對頻繁。此外,公路工程不可避免會出現削坡和坡頂加載等工程,這些都將會改變坡體的自然地貌,破壞了坡體原有的結構,使得滑坡災害發生的概率增加。

3.1.3?地形地貌因子

地形地貌也是滑坡災害發生的重要因素,文中綜合選取了高程、坡度、坡向、曲率、地表粗糙度、地表切割深度、地形起伏度和地貌類型8類因子。其中,坡體的坡度將直接影響著坡體的應力分布情況,控制著坡體的穩定性。而不同坡向的坡體受太陽輻射強度也不同,這將直接影響坡面的蒸發量、植被覆蓋和侵蝕程度,進而影響著坡體地下水空隙壓力的分布和巖土體物理力學特征。其次,不同高程的水系發育程度、土壤類型、人類活動存在較大的差異,這也將對坡體的穩定具有間接的關系。曲率將影響著坡面物質的搬運和沉積。各地形地貌因子的空間分布如圖5所示。

3.2?評價因子分級

為了分析各評價因子分級狀態與滑坡點的空間分布關系,以確定各因子分級狀態下的權重,需要對誘發滑坡發生的重要因子(地質因子、水文因子、人類工程活動因子、地形地貌因子)進行分級。具體為高程、坡度、坡向、地表切割深度、與斷層距離、與道路距離、與水系距離、降雨量等因素采用等間隔法進行重分類;地形起伏度、地形濕度指數、地形粗糙度按照自然間斷法進行分級;其他因子依據本身的不同性質進行量化處理,得到分級結果。研究中應用的評價因子分級標準見表1.

4?滑坡災害易發性評價

4.1?單元劃分與數據庫建立

依據湯國安[16]采用DEM試驗進行回歸分析而得到的經驗公式

Gs=7.49+0.000 6S-2.0×10-9S2+2.9×10-15×S3(2)

式中?S為地形圖比例尺,將整個研究區劃分為30 m×30 m大小的柵格單元,共計3 304 444個。在ArcGIS操作平臺下,將滑坡點矢量圖層與各因子柵格圖層進行疊加,采用空間分析里的多值提取至點工具提取滑坡點屬性數據,再將各因子圖層通過柵格轉點工具提取整個研究區屬性數據,最后建立評價因子數據庫。

4.2?滑坡災害易發性評價結果

4.2.1?隨機森林模型評價結果

將研究區內145個滑坡災害點與隨機選取的相同數量的非災害點組成總樣本點。從總樣本點中隨機選取102(70%)個災害點與相同數量非災害點組成訓練集,剩余樣本點組成測試集。借助MATLAB軟件平臺編寫隨機森林函數代碼,將訓練數據集按所需格式帶入編寫函數中對模型進行訓練,得到各評價因子的權重排序如圖6所示??梢园l現高程、地貌類型、與斷層距離等評價因子所占權重較大,說明該區域滑坡災害的發生主要受高程、地貌類型、與斷層距離等因素的影響。將測試集帶入訓練好的模型,得到模型的預測正確率為86.5%.最后將模型用于整個研究區易發性評價中,得到滑坡易發性評價指數LSI,將其按自然間斷點法分為極低易發區、低易發區、中易發區、高易發區、極高易發區5個等級,最后生成易發性評價區劃圖,如圖7所示。

4.2.2?確定性系數模型評價結果

通過對各因子分級狀態下滑坡點數與各分級面積的統計分析,得到各因子分級狀態下的CF值,將得到的CF值進行歸一化后即可得評價因子各分級狀態權重,那么滑坡易發性評價指數LSI

式中?p分別為坡度、坡向…斷層等14類評價因子;q為對應評價因子的分級狀態;xpq為評價因子p的第q級狀態的權重。

將每個因子圖層進行權重相加,得到最終的滑坡易發性評價結果圖,按同一劃分標準將其分為5個等級:極低易發區、低易發區、中易發區、高易發區、極高易發區,如圖8所示。

4.2.3?加權確定性系數模型評價結果

將隨機森林模型確定的一級指標因子權重與確定性系數模型確定的二級指標因子權重分別對應相乘,得到加權確定性系數模型。根據公式(2)得到其易發性指數。然后將計算得到的整個研究區的易發性指數按以上同一劃分標準,分為5個等級,分別為:極低易發區、低易發區、中易發區、高易發區、極高易發區,如圖9所示。

5?評價模型的檢驗

文中采用Kappa系數評估WCF模型、RF模型和CF模型的滑坡災害易發性評價結果的準確度。Kappa系數基于混淆矩陣,常作為衡量分類精度和一致性檢驗的指標[17]。Kappa系數的取值范圍為[0,1],系數越大,代表模型的預測精度越高。假設混淆矩陣見表2.

則?k=po-pe1-pe

文中選取剩余樣本點組成的測試集,共43個,通過Kappa系數對RF模型、CF模型以及WCF模型進行檢驗,得到其預測精度分別為:87.3%,82.6%,92.5%.結果表明WCF模型的預測精度比RF模型、CF模型分別提高了5.2%,9.9%.

6?結?論

在分析資料的基礎上,選取14類評價因子指標,分別采用隨機森林模型、確定性系數模型以及加權確定性系數模型對研究區開展滑坡易發性評價,

并采用Kappa系數對3種模型的預測精度進行對比檢驗,取得以下結論

1)依據隨機森林的評價結果,可以發現研究區內的滑坡主要受高程、地貌類型、與斷層距離因子的影響,所占權重分別為0.27,0.12,0.11.

2)采用Kappa系數對3種模型的預測精度進行對比檢驗,其檢驗結果為:RF模型、CF模型以及WCF模型的預測精度分別為87.3%,82.6%,92.5%.WCF模型的預測精度比RF模型、CF模型分別提高了5.2%,9.9%.結果表明文中提出的WCF模型對滑坡易發性評價具有更高的預測精度,該模型對研究區內滑坡災害易發性評價更加科學。

參考文獻(References):

[1] Chen W,Yan X,Zhao Z,et al.Spatial prediction of landslide susceptibility using data mining-based kernel logistic regression,naive Bayes and RBF Network models for the Long County area(China)[J].Bulletin of Engineering Geology and the Environment,2019,78(1):247-266.

[2]趙?洲,侯恩科,王建智.汶川震區陜西省寧強縣滑坡災害危險性分析與評價[J].西安科技大學學報,2012,32(5):548-555.

ZHAO Zhou,HOU En-ke,WANG Jian-zhi.Research on landslide hazard in Ningqiang County of Wenchuan earthquake affected area[J].Journal of Xian University of Science and Technology,2012,32(5):548-555.

[3]王念秦,羅東海,姚?勇.滑坡綜治方案的模糊決策[J].西安科技大學學報,2009,29(6):731-736.

WANG Nian-qin,LUO Dong-hai,YAO Yong.Fuzzy decision making in synthetic control of landside[J].Journal of Xian University of Science and Technology,2009,29(6):731-736.

[4]趙?洲,魏江波.基于顆粒流方法的滑坡破壞機理與強度分析[J].西安科技大學學報,2018,38(4):611-619.

ZHAO Zhou,WEI Jiang-bo.Landslide failure mechanism and intensity analysis based on PFC2D[J].Journal of Xian University of Science and Technology,2018,38(4):611-619.

[5]

Dai F C,Lee C F,Ngai Y Y.Landslide risk assessment and management:an overview[J].Engineering Geology,2002,64(1):65-87.

[6]吳賽男,田?毅.我國單體滑坡模擬和區域滑坡易發性評價研究進展[J].中國地質災害與防治學報,2019,30(3):113-119,128.

WU Sai-nan,TIAN Yi.Review on progress of individual landslide simulation and assessment of regional landslide susceptibility in China[J].The Chinese Journal of Geological Hazard and Control,2019,30(3):113-119,128.

[7]許?沖,戴福初,姚?鑫,等.基于GIS與確定性系數分析方法的汶川地震滑坡易發性評價[J].工程地質學報,2010,18(1):15-26.

XU Chong,DAI Fu-chu,YAO Xin,et al.

GIS platform and certainty factor analysis method based Wenchuan earthquake-induced landslide susceptibility evaluation[J].Journal of Engineering Geology,2010,18(1):15-26.

[8]吳孝情,賴成光,陳曉宏,等.基于隨機森林權重的滑坡危險性評價:以東江流域為例[J].自然災害學報,2017,26(5):119-129.

WU Xiao-qing,LAI Cheng-guang,CHEN Xiao-hong,et al.A landslide hazard assessment based on random forest weight:a case study in the Dongjiang river basin[J].Journal of Natural Disasters,2017,26(5):119-129.

[9]王佳佳,殷坤龍,肖莉麗.基于GIS和信息量的滑坡災害易發性評價——以三峽庫區萬州區為例[J].巖石力學與工程學報,2014,33(4):797-808.

WANG Jia-jia,YIN Kun-long,XIAO Li-li.Landslide susceptibility assessment based on GIS and weighted information value:a case study of Wanzhou district,three gorges reservoir[J].Chinese Journal of Rock Mechanics and Engineering,2014,33(4):797-808.

[10]賈?娟.粗糙集與支持向量機耦合模型滑坡易發性評價——以筠連縣為例[D].成都:成都理工大學,2018.

JIA Juan.Landslide susceptibility assessment using rough sets and support vector machine:a case of Junlian County[D].Chengdu:Chengdu University of Technology,2018.

[11]

Heckmann T,Becht M. Investigating the transferability of statistical disposition models for slope-type debris flows[J].Erdkunde,2009,63(1):19-33.

[12]劉?堅,李樹林,陳?濤.基于優化隨機森林模型的滑坡易發性評價[J].武漢大學學報(信息科學版),2018,43(7):1085-1091.

LIU Jian,LI Shu-lin,CHEN Tao.Landslide susceptibility assessment based on optimized random forest model[J].Geomatics and Information Science of Wuhan University,2018,43(7):1085-1091.

[13]段?釗,李文可,王啟耀.涇河下游臺塬區黃土滑坡類型與時空分布規律[J].西安科技大學學報,2015,35(3):369-375.

DUAN Zhao,LI Wen-ke,WANG Qi-yao.Types and spatial-temporal distribution of loess landslides in the south plateau of lower Jing river[J].Journal of Xian University of Science and Technology,2015,35(3):369-375.

[14]張?麗,黃敬軍,武健強,等.江蘇省地質災害區劃評價[J].中國地質災害與防治學報,2015,26(2):81-86.

ZHANG Li,HUANG Jing-jun,WU Jian-qiang,et al.Zonation of geological hazards in Jiangsu province[J].The Chinese Journal of Geological Hazard and Control,2015,26(2):81-86.

[15]Western A W,Grayson R B,Bloschl G,et al.Observed spatial organization of soil moisture and its relation to terrain indices[J].Water Resources Research,1999,35(3):797-810.

[16]湯國安,楊勤科,張?勇,等.不同比例尺DEM提取地面坡度的精度研究——以在黃土丘陵溝壑區的試驗為例[J].水土保持通報,2001,21(1):53-56.

TANG Guo-an,YANG Qin-ke,ZHANG Yong,et al.Research on accuracy of slope derived from DEMs of different map scales[J].Bulletin of Soil and Water Conservation,2001,21(1):53-56.

[17]管新邦.云南省滑坡地質災害危險性評價研究[D].北京:中國礦業大學,2018.

GUAN Xin-bang.Study on risk assessment of landslide in Yunnan Province[D].Beijing:China University of Mining and Technology,2018.

猜你喜歡
隨機森林滑坡
某停車場滑坡分析及治理措施
夏季大山里的隱形殺手——滑坡
只要思想不滑坡,辦法總比困難多
隨機森林在棉蚜蟲害等級預測中的應用
基于二次隨機森林的不平衡數據分類算法
拱壩變形監測預報的隨機森林模型及應用
基于隨機森林算法的飛機發動機故障診斷方法的研究
基于隨機森林算法的B2B客戶分級系統的設計
基于多視角特征融合與隨機森林的蛋白質結晶預測
滑 坡
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合