?

基于maxEnt模型的哈尼梯田核心區滑坡易發性評價

2020-07-07 13:38趙冬梅角媛梅邱應美劉澄靜徐秋娥
水土保持研究 2020年4期
關鍵詞:環境變量易發梯田

趙冬梅, 角媛梅, 邱應美, 劉澄靜, 徐秋娥, 張 娟

(云南師范大學 旅游與地理科學學院, 昆明 650500)

滑坡是我國乃至世界范圍內發生最頻繁、最具危險的地質災害之一[1]。云南省地處板塊交界處,構造運動強烈,地形陡峻,切割破碎,加之局地強降水頻繁,滑坡、泥石流等災害易發高發,是造成生命財產損失、制約區域經濟發展的主要災種。被列為聯合國教科文組織世界遺產名錄的哈尼梯田作為云南省旅游勝地,其地質環境脆弱,人類活動影響強烈,易引發滑坡等地質災害。該區因受連續強降雨的影響,遺產地內老虎嘴梯田片區在2018年6月26日發生了一起重大的山體滑坡,造成約11.5 hm2梯田受損,嚴重威脅哈尼梯田世界遺產地景觀的可持續發展。因此,開展世界遺產地滑坡易發性對區域的防災減災及可持續發展具有重要意義。

滑坡易發性評估始于20世紀70年代中期[2],以滑坡災害理論、形成機制等定性描述為主。近年來,涌現出大量的定量評估方法,可歸納為兩類:一是以滑坡災害機制為基礎“白箱”型方法,二是以災害監測歷史數據為基礎“黑箱”型方法?!鞍紫洹毙头椒ㄖ饕ㄐ逼铝W[3]和專家經驗模型[4]。斜坡力學模型側重單個滑坡體,其可靠性較高,但所需水文、巖土力學等物理參數難以獲得,進而難以大范圍推廣[5]。然而專家經驗模型主觀性較強,使得模型精度具有很大不確定性?!昂谙洹毙头椒ㄖ饕ǜ怕式y計、機器學習模型等。概率統計模型評價方法在中國、印度、意大利和土耳其等地運用廣泛,如邏輯回歸[6]、頻率比、判別分析[7]、數據疊加、證據權重[8]、信息量模型[9]等,雖然一定程度上減少模型主觀性且表現性能相對較好,但仍然存在:高精度數據難以獲得;滑坡和地質環境資料需由專業學者初步處理;權重受研究區間劃分的影響[10]等缺點。相比之下,最近學術界更偏向于機器學習模型,它是一組強大的數據驅動工具,使用算法上考慮了滑坡與滑坡影響因子之間的非線性關系[11],有效克服了概率統計模型的局限性。如交叉決策樹、隨機森林[12]、貝葉斯[13]、支持向量模型[14]與人工神經網絡[15]等應用廣泛,但截至目前,依然缺乏最佳模型評價滑坡易發性。

為探究最佳模型以準確評價滑坡易發性,本文將最大熵模型(maxent entropy Model,簡稱maxEnt)引入到滑坡易發性評價中。maxEnt模型是由Phillips等[16]開發的生態位模型,作者將其應用物種生境適宜性評價。主要是根據物種的不完整分布數據和環境特征計算其分布概率,從而達到預測該物種潛在分布的目的。與其他模型相比,模型具有操作簡便、計算效率高、預測結果精確性和可信度高,可避免模型過擬合等優勢,因而被生態學者廣泛應用,現已成為生態學研究的熱點工具。物種分布模式與滑坡易發性制圖非常相似,都是利用已知事件對目標空間分布進行建模,建模過程涉及多個環境變量。國外已有學者嘗試將maxEnt模型應用于滑坡易發性的研究[17-19],但國內引用較為鮮見。

鑒于此,研究以哈尼梯田遺產地為例,綜合研究區滑坡災害發育的地質環境、滑坡空間分布和發育特征等數據,選取氣象、地形、地質、植被、人類活動等15個指標因子,應用maxEnt模型進行滑坡易發性評估,通過計算歷史滑坡點落在較高危險性區域內的比例和接收器工作曲線下的面積AUC值定量檢驗。探究maxEnt模型在哈尼梯田核心區滑坡易發性評價中的適用性,并對其預測性能進行評估。根據統計結果確定預測危險性等級評價標準,由此對預測結果進行危險性等級劃分,這對哈尼梯田心區的可持續發展、土地利用規劃及災害防治有一定的參考價值。

1 研究區概況

研究區位于我國西南部云南省元陽縣,屬紅河哈尼梯田世界文化景觀遺產核心區,面積為166.12 km2。其地理坐標22°49′—23°19′N,120°27′—103°13′E(圖1)。該區地處哀牢山南段,為高山峽谷切割中山地貌,溝壑密布,切割強烈,地形陡峻,向源侵蝕較為嚴重。區內平均海拔2 000 m以上,梯田多分布在海拔400~1 900 m和>25°的陡坡上,且山脊走向為北東—南西向,整個地勢南高北低,自南向北傾斜。氣候屬亞熱帶山地季風氣候,素有“一山有四季,隔里不同天”之稱。全年日照時數1 770.2 h,年均溫14.2 ℃,雨量充沛,年降水量1 353.8 mm,年均濕度90.3%。土壤主要以黃棕壤、黃壤為主,土壤剖面發育完整。境內地層巖性主要為變質巖、砂巖、板巖等,在水作用下易于軟化、崩解,且受長期復活的紅河大斷裂和哀牢山深大斷裂的影響,新構造運動強烈,滑坡、崩塌等地質災害頻繁發生,滑坡是該區最為突出的地質災害。此外,伴隨著近年來哈尼梯田申遺成功,旅游業得以巨大發展,人類活動愈加頻繁,加劇了滑坡生成,嚴重影響了哈尼梯田景觀的穩定性及區域旅游的發展。

2 數據來源及研究方法

2.1 數據來源

2.1.1 易發性評價流程 滑坡易發性評價研究主要由3步驟組成。首先構建滑坡易發性指標體系,研究共選取了地質、地形、植被、氣象和人類活動5類共15種環境變量;其次對所有環境變量進行預處理,統一轉換格式、坐標系和像元值等,并將研究區內111個滑坡歷史數據隨機分成兩部分,75%為訓練數據,25%為驗證數據;最后,將maxEnt模型引入哈尼梯田滑坡易發性評價,利用受試者工作特征曲線下面積ROC-AUC和滑坡密度指標分別對模型精度及分區結果進行檢驗。

圖1 云南省紅河哈尼梯田核心區位置及滑坡點分布

2.1.2 滑坡數據 基于哈尼梯田遺產核心區地質災害實地調查資料并結合Google地球上獲取的遙感影像數據,研究區共確定滑坡111處。其中,70%以上滑坡厚度小于5 m,80%以上屬淺層滑坡。區內滑坡主要分布于道路兩旁,且多發生于雨季和人為工程活動強烈的區域,最后將滑坡數據隨機分為兩組數據,75%的數據即84個滑坡點用做訓練樣本進行建模,剩余的25%即27個滑坡點作為測試樣本對模型進行驗證。設模型運行參數中的迭代次數為500次,取500次模擬結果的平均值作為最終模擬結果。

2.1.3 指標因子構建及處理 選取了氣象、地形、植被、地質、人類活動等共15個影響因子作為易發性評價指標體系。各因子來源如下:(1) 地形因子使用地理空間數據云上的數字高程模型DEM柵格數據,精度為30 m,并從中提取了7個地形因子:海拔、坡度、坡向、地表粗糙度、平面和剖面曲率和地形濕度指數(topographic wetness index,TWI)(附圖6-Ⅰ A—G)。(2) 地質數據經云南省地質環境監測院提供的1∶5萬地質圖數字化獲得,包括巖性、斷層(附圖6-Ⅰ L,K),巖性主要包括六類:1為泥質灰巖,2為泥質粉砂巖、灰巖、白云質灰巖、白云巖,3為片麻巖及角閃斜長片麻巖互組,4為粉砂巖、石英砂巖、夾板巖,5為灰巖,6為長石石英砂巖。(3) 距道路、水系、斷層距離3個指標(附圖6-Ⅰ I—K)在ArcGIS 10.4中通過歐式距離計算得到這些因子的距離圖層。(4) 多年平均降水數據(AMR)由黑河中心提供的2008—2014年的降雨量數據經空間分析克里金插值得到(附圖6-Ⅱ O)。(5) 植被歸一化指數(NDVI)由分辨率為30 m的地理空間數據云Landsat8遙感影像數據經過大氣矯正、波段運算獲得(附圖6-Ⅱ M)。土地利用數據是云南省地理信息中心提供的0.6 m的高分辨率遙感數據采用監督分類的方法提取的,根據國家最新發布的《土地利用現狀分類》(GB/T21010—2017),將土地利用劃分為8類,分別是旱地、林地、水田、草地、園地、水域、建筑用地和其他用地(附圖6-Ⅱ N)。(6) 居民點密度由云南省第一次地理國情普查數據庫矢量圖經ArcGIS軟件的核密度分析獲得(附圖6-Ⅰ H)。本研究所有環境變量均在ESRI公司的ArcGIS 10.4軟件中完成,統一到WGS_1984_UTM_Zone_48N投影坐標系,并以空間分辨率10 m×10 m的ASCⅡ grid格式的形式輸入軟件。將所有的環境變量數據通過ArcGIS 10.4將格式轉換為ASC格式,并結合滑坡數據導入maxEnt Version 3.3.3 K軟件中,采用jackknife刀切法計算各氣候因子貢獻率,其余選項采用模型默認設置。

2.2 研究方法

2.2.1 maxEnt模型 maxEnt模型是基于已知的滑坡災害分布數據以及地質環境條件,通過特定算法求出區域內滑坡災害發生在特定位置上的可能分布π,進行未知區域的滑坡分布概率預測[16,20]。具體是將研究區劃分為有限個像元集X,設x表示研究區域上的隨機點x∈X,π(x)是每個像元π發生滑坡的一個非負概率分布值P(x),且所有像元的概率值之和為。將任意像元的滑坡觀測結果視為響應變量y。若像元內“發生”滑坡則定義為y=1,“不發生”滑坡時則定義為y=0。由此通過使用貝葉斯規則得到條件分布概率P(y|x)[16,21]。因此,滑坡發生的概率可表示為:

(1)

式中:P(y=1|x)為在特定x點發生山體滑坡的概率;P(y|x=1)為滑坡分布條件下特定點x發生滑坡的可能性,亦是π(x);P(y=1)為滑坡總體發生率;P(x)為任意點發生x滑坡的概率。由于P(x)在研究區內所有像元X的任意點x中等于1/|X|,因此上述等式可以改寫為:

P(y=1|x)=π(x)P(y=1)|X|

(2)

可通過邊緣化聯合概率分布來計算P(x):

(3)

考慮滑坡發生和不發生的概率相等[P(y=0)=P(y=1) =0.5],可簡化方程為:

(4)

maxEnt模型的應用直接取決于條件概率P(y=1|x),條件概率值越大,滑坡發生的可能性越大。事件發生的數據π(x)可用于建模,代替直接估算P(y=1|x)。最大熵原理估計的π(x)值等于由指數表示的吉布斯概率分布。如果考慮n個特征(f1,i=1,2,…,n),則吉布斯的概率分布可定義為:

(5)

式中:Zλ是一個歸一化常數可確保qλ(x)和1,而是分配給特征的權重向量。在qλ(x)的估計中,模型試圖利用正則化I2找到最接近約束條件下的分布,以避免過度擬合。因此,maxEnt模型的目的是最大限度地處理對數似然。如果研究區內事件出現m次,則對數似然與正則化之間的差異應為最大化,表示為:

(6)

式中:βj是jth特性fj的正則化參數。最大熵模型發現吉布斯分布不僅符合賦存數據,而且具有較好的推廣意義。

2.2.2 模型精確性驗證 模型模擬的精度驗證是保證預測結果準確度的必要步驟。一般預測模型通常會產生兩類誤差:一是過低估算,將實際有滑坡發生的區域預測為低敏感區,為假陰性;二是過高估算,將實際不發生滑坡的區域預測為高敏感區,為假陽性,這兩類誤差都與閾值有關。受試者工作特征曲線下的面積(ROC-AUC)分析法是目前學者們認可度較高的模型診斷試驗評價指標。該分析方法以靈敏度(sensitivity,也稱作真陽性,1-遺漏率)為縱坐標,以特異度(specificity,也稱作假陽性)為橫坐標,繪制而成的曲線稱之為ROC曲線。通常AUC-ROC值越大,表示指標因子與預測模型結果之間相關性越大,預測效果也就越好,其能很好地說明模型模擬的準確性。其評價標準為:當AUC-ROC的值為0.5~0.6時預測效果失敗(fail),值在0.6~0.7預測效果較差(poor),0.7~0.8預測效果一般(moderate),0.8~0.9預測效果較好(good),0.9~1.0預測效果非常好(Excellent)[17]。

2.2.3 環境變量重要性評價 利用刀切法(Jacknife)對模型的因子貢獻進行了估計。在這種方法中,每個環境變量都被有意排除在外,并且使用剩余的因素構建了一個模型。然后將使用所有環境變量創建的模型與使用依次排除一個變量構建的模型的預測性能進行比較。因此,可以審查排除的環境變量貢獻值。還利用響應曲線推導了各因果因子與預測模型之間的關系。

3 結果與分析

3.1 預測結果檢驗

研究所用的訓練樣本和測試樣本生成的ROC曲線如圖2所示,模型運算結果表明訓練樣本下的ROC-AUC值達0.895,驗證樣本下的ROC-AUC值達0.739,顯然兩者值均大于0.7,遠大于隨機測試的ROC曲線下面積值(ROC-AUC=0.5),且ROC-AUC標準差為0.047,非正規訓練增益為1.201 5,未經規范的測試增益為0.319。根據分類標準,此模型在滑坡易發性中的預測精度達到優秀水平,表明模型模擬效果具有很高的可信度和準確度,可用于滑坡易發性預測。

圖2 模型精度檢驗ROC曲線

3.2 環境變量因子對模型的貢獻度

本研究采用Jackknife檢驗模型中15個環境變量對模型預測的貢獻程度表明(表1),所有環境變量的貢獻率都大于0,貢獻率大于1%的因子9個,排名前7的環境因子依次是距斷層距離(26.80%)、多年平均降雨量(17.33%)、距道路距離(16.42%)、土地利用(14.91%)、居民點密度(4.80%)、坡向(4.67%)和巖性(4.5%),累計貢獻率達到了89%,這7個因子對滑坡分布具有重要影響,其次是距水系距離、地表粗糙度、海拔、NDVI、坡度和TWI,平面和剖面曲率的影響最小。

3.3 環境變量對maxEnt模型預測結果的影響

圖3為15個環境變量響應曲線,各環境因子的易發性分析表明,滑坡易發性在1 500~2 500 m出現峰值,在2 200 m時達到最大,之后隨海拔的增加而減小,這與當地居民居住的海拔范圍相同,另外居民點密度顯示人類活動對滑坡的影響巨大。對坡度、地表粗糙度和坡向進行易發性分析發現隨著坡度的增加,靈敏度值越大,表明滑坡發生的可能性和坡度呈正比,在坡度較大的地段,土壤與巖石之間十分不牢固,梯田灌水后將增大下滑動力,促使滑坡發生。坡向統計發現坡向為東北、西北、東坡時對滑坡災害的影響最大,而北坡影響最小。從曲率值看,滑坡的發生可能性隨著平面、剖面曲率值的增加而減少,呈負相關關系。地形粗糙度來看值為1.0時對滑坡的影響最大。

表1 環境變量的貢獻率及對應環境變量的ROC-AUC值

從TWI來看,滑坡在值0~5呈增長趨勢,值為5時達到峰值,表明此時對滑坡影響最大。居民點密度越大,表明越容易發生滑坡。從距離因子上看,距離道路越近時滑坡易發性越高,特別是在0~500 m影響最大。距水系0~300 m也表現出一定的距離效應,但當距離大于300 m后滑坡影響逐漸減少。當斷層距離在4 000~6 000 m時對滑坡的影響最大。從巖性的不同類別上看,片麻巖與角閃斜長片麻巖對滑坡的影響最大,這類巖石在水作用下極易風化、崩解,形成粘性的紅壤、黃壤等,這類土壤土質緊密,遇水泥濘,粘性很強,但透水性差,雨水不容易下滲,常導致滑坡產生。NDVI在-0.05~0.22時滑坡隨植被指數的增加呈現緩慢的增加趨勢,而大于0.22時又隨植被指數的增加而減少,直至為0表現為幾乎無影響的狀態。從土地利用類型上看,林地對于滑坡易發性影響較大,水田影響相對較小,一定程度上梯田確實減緩了地表徑流速度,減小了水土流失量,但其分布于山腰居多,其山體的坡度普遍較陡,會造成田埂垮塌,從而引起滑坡的發生。從AMR上看,滑坡隨降雨量的先增加影響也在增加,在920 mm時出現峰值,后較為平穩,小于820 mm時影響較小,長時間降雨會導致水壓力過大,將有增大滑坡災害發生的可能性。據調查,研究區內近80%的滑坡發生在雨季,降雨成為誘發滑坡的主要因子。

3.4 滑坡易發性分區

模型預測結果值越大,滑坡發生的可能性越大。根據正態分布理論與專家經驗法,將研究區模擬的滑坡易發性結果劃分為5個等級:極低易發區、低易發區、中易發區、高易發區和極高易發區。maxEnt模型模擬的滑坡易發性指數值為0~1,其分級標準為:極低(0~0.13)、低(0.14~0.31)、中(0.32~0.51)、高(0.52~0.73)和極高(0.73~1)。

統計顯示(附圖7,圖4)極低易發區占比最高,達到37.24%,低易發區占23.21%,其他中、高和極高易發區分別占17.78%,12.79%,8.96%。易發性區劃圖空間差異明顯,極高和高易發區的占比不大。實際存在滑坡點在易發區類別上看,高和極高易發區的實際占比分別為27.92%,54.05%,極高和高敏感區主要分布核心區中部道路兩旁,即人類居住集中區域,以中部偏東地區最為嚴重。據調查,中東部的道路是在哈尼梯田申遺后期修筑的,修建道路,致使邊坡失穩,加大了邊坡發生滑坡的可能性。研究區西南部也有零散分布,集中于距斷裂較近處,該區由于受哀牢山的大斷裂強烈影響,斷裂帶沿線巖體破碎,巖層節理裂隙發育,進而造成滑坡呈條帶狀的格局。

此外,研究還利用滑坡密度指標對滑坡易發性分區結果進行檢驗,它是通過滑坡點占比與各易發性等級占比相除計算得出,前人研究顯示滑坡易發性等級越高滑坡密度越大,說明模型越可靠[22]。因此,根據統計得到滑坡易發性分區下對應的5個滑坡密度值,可以發現滑坡密度隨著滑坡易發性的等級的升高而增加,且對應易發性區域值分別為0.1,0.27,0.46,2.18,6.03,符合以上事實,這再次證明在滑坡數據量較少的情況下,maxEnt模型模擬結果仍可信。

圖3 環境變量的響應曲線

圖4 基于自然斷點法模型的滑坡易發性評價區劃

4 討 論

目前,滑坡易發性的研究已涌進了大量的評估方法。受調查程度、地區條件、使用者水平等的影響,不同地區方法不同時,預測效果不同;同一地區方法不同,預測性能也有所差別,學術界針對不同的模型對其方法進行了大量的比較分析并確定最佳模型,但在模型精度上并沒有達成一致意見。這些模型不僅僅運用在地質災害的評估中,大多也被運用到生物物種的生境適宜性分析、潛在礦物分布、地面沉降測繪及醫學傳染病等研究,注重不同學科模型及方法的交叉及多重使用,特別是物種分布模型與滑坡易發性研究的原理研究類似,都是利用已知的事物來模擬未來事物的分布。因此,研究引用了生態位模型最為常用的maxEnt模型,它也稱為人工挖掘模型來評價哈尼梯田區滑坡易發性。

該模型與滑坡易發性相關的研究國內幾乎沒有,國際上較為少見。最早將maxEnt模型引入此研究是2013年,Felicísimo等[18]選擇了20個環境變量和1 102個滑坡點將多變量回歸模型、多元自適應回歸、分類回歸樹和maxEnt模型運用在西班牙吉普祖科亞省德巴河谷,結果顯示maxEnt模型模擬精度高于其他模型。Kornejady等[19]運用maxEnt模型模擬不同樣點情景下的滑坡易發性,結果表明馬氏距離樣點方案下模擬結果精度達0.906,高于隨機情景下模擬精度。以及Jiao等[23]將其與常用的信息量模型進行對比研究發現maxEnt模型的精度達到了優秀水平。相較于前人研究而言,本研究運用maxEnt模型的模擬精度相差不大,ROC-AUC值達到0.895,模擬效果較好,研究結果可信。研究再次證明了maxEnt模型具有較高的預測精度這一說法。

同時,在影響因子的選擇上看,本文不僅考慮了氣候條件對滑坡的影響,該研究還將人類活動因子作為當前和未來發生滑坡的重要驅動因素,從而增加了關于氣候與人為干擾的討論。前人滑坡易發性研究中常見的變量有地形、距離、巖性、土地利用等因子,對居民點密度這個變量考慮較少,但此類變量在本研究的貢獻程度為4.8%,影響程度較大(表1),是哈尼梯田遺產核心區滑坡災害產生的主要控制因子,缺少此因子時模擬結果精度ROC-AUC為0.69,較坡向、地表粗糙度、平面和剖面曲率、距水系距離、坡度、NDVI和TWI高。因此,在人類活動強度較高的區域應當充分考慮居民點對滑坡災害的影響。此外,研究區內AMR單個因子的影響程度最大(表1),降雨成為該區滑坡發生的一個主要因子。有研究表明受區域持續強降雨的影響,滑坡等地質災害產生的概率將會提高,因此,在未來的研究過程中,結合當地實際情況,充分利用遙感高分辨數據及ArcGIS等技術手段,多時段、多時間序列的觀測區域的環境,將自然和人類活動等因子考慮到研究領域中,以便更加精確地預測滑坡等地質災害。本研究存在一些不足之處,如使用的滑坡數據點通過高分辨率的Google遙感影像目視解譯的,可能存在一定的遺漏,難免會對模擬結果產生一定的誤差,但整體上模擬的結果與實際存在的數據大致相符,因此模型預測結果本身具有一定的參考價值,得到的結果更能體現由人為活動貢獻較強的情況下滑坡發生的概率,所以本研究既具有學科意義,也對哈尼梯田遺產核心區的土地利用規劃及災害防治及減災有一定的指導作用。

5 結 論

(1) 以哈尼梯田世界遺產地為研究對象,選取海拔等15個因子建立滑坡易發性評價體系?;贕IS和maxEnt模型進行區域滑坡易發性評價,所得結果與實際滑坡分布情況較為一致,ROC-AUC值達到了0.895,表明模型模擬效果具有很高的可信度,在滑坡易發性評價中適用。且通過滑坡密度可以看出模型具有較強的準確度。

(2) 根據Jackknife方法對模型預測的貢獻程度表明距斷層距離、多年平均降雨量、距道路距離和居民點密度是影響遺產地滑坡發育的主要影響因子。環境響應曲線也揭示了各變量的等級狀態下滑坡分布的統計規律,對分類及連續型變量具有很好的適用性。

(3) 使用正態分布理論與專家經驗法將滑坡易發性分成5類,滑坡極高和高易發區主要分布核心區中部道路兩旁,即人類居住較為集中區域,中部偏東最為嚴重。而研究區內西南部集中分布于距斷裂較近處,呈條帶狀分布格局的特點。

猜你喜歡
環境變量易發梯田
機用鎳鈦銼在乳磨牙根管治療中的應用
貴州省地質災害易發分區圖
夏季羊易發疾病及防治方法
冬季雞腸炎易發 科學防治有方法
從桌面右鍵菜單調用環境變量選項
《山區修梯田》
徹底弄懂Windows 10環境變量
秀美梯田
梯田之戀
基于三階段DEA—Malmquist模型的中國省域城鎮化效率測度及其收斂分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合