?

基于致災因子對稱法分級的信息量模型在地震滑坡危險性評價中的應用

2021-07-08 05:44凌曉劉甲美王濤朱月琴袁玲玲陳揚洋
自然資源遙感 2021年2期
關鍵詞:信息量正態分布危險性

凌曉,劉甲美,王濤,朱月琴,袁玲玲,陳揚洋

(1.中國地質大學(北京)信息工程學院,北京 100083;2.中國地質科學院地質力學研究所,北京 100081;3.新構造運動與地質災害重點實驗室,北京 100081;4.中國地質調查局發展研究中心,北京 100037)

0 引言

地震是誘發滑坡的重要因素,強震可在短時間內誘發大量滑坡,加劇地震所造成的損失,因此對于地震滑坡的研究具有很強的社會和學術意義[1-2]?;挛kU性評價方法大體上可分為定性評價[3-5]與定量評價。定量評價方法又可分為傳統的統計量評價法[6-8]與機器學習評價法[9-11]。定性評價依賴于專家經驗[12],客觀性較差,而機器學習方法對于樣本的數量、質量要求較高,且需要頻繁進行迭代運算與參數調整,不適用于較大的研究區。因此,傳統的統計量評價法仍被廣泛應用于地震滑坡的危險性評價。

1948年Shannon[13]發表的著名論文《通信的數學理論》標志著信息科學的誕生,Shannon把信息定義為“隨機事件不確定性的減少”,并把數學統計方法移植到了通信領域,提出了信息量的概念及信息熵的計算公式。在此基礎上,Van[14]提出了信息量模型,這是一種較為客觀、適用性較強的統計預測方法,具有分析尺度大、建模流程簡單等優點。國內外已有很多學者利用信息量模型進行滑坡危險性評價[15-19]。在信息量模型建模過程中,首先應制定因子分級標準,為了確保結果的準確性,需預先進行單因子統計分析。大部分研究者結合單因子分析結果,采用等間距法進行因子分級,少數研究者則采用自然間斷法進行因子分級[19]。這些方法具有一定的科學性,但忽略了因子的復雜性和多樣性,不能最大限度地發揮單因子分析的優勢。如何充分考慮致災因子的特征,結合單因子分析結果制定出最合適的因子分級方法,提高評價結果的準確性,是利用信息量模型評價滑坡危險性時亟待解決的問題。為了加強對單因子分析的利用,從而提高信息量模型的評價精度和適用性,本文提出了一種新的合并對稱區間進行分級的方法,并以汶川地震滑坡密集區為研究區,用該方法構建的信息量模型進行了地震滑坡危險性評價。

1 對稱法分級與信息量模型構建

1.1 模型構建原理

在信息論中,信息熵是接收到每條消息中包含的信息的平均量;在信息量模型中,地質災害危險性可由信息熵度量。信息預測的觀點認為,滑坡的發生是多種致災因子相互耦合、共同作用的結果[20]。因此在應用信息量模型評價滑坡危險性時,可將滑坡危險性視為多個因子的信息熵疊加值。信息熵以概率倒數的對數函數計算,即

(1)

式中:I(y,x1x2…xn)為在(x1x2…xn)組合下產生的總信息量;P(y,x1x2…xn)為在(x1x2…xn)組合下事件發生的概率;P(y)為事件發生的實際概率。

在進行滑坡危險性研究時,信息量模型公式中的條件概率可簡化為樣本頻率,即滑坡面積與研究區總面積的比值。信息量模型的表達式為:

(2)

式中:x為任一致災因子;n為因子x的分級總數目;I(x,H)為x因子對滑坡發生提供的信息量值;S為研究區評價單元的總數;Si為x的第i級區域內覆蓋的評價單元數;N為研究區內滑坡單元的總數;Ni為x的第i級區域內覆蓋的滑坡單元數。

當存在m種致災因子時,總信息量I的計算公式為:

(3)

式中:I為信息量總和;m為參與評價的因子總數??傂畔⒘恐礗是滑坡危險性的量化表達,信息量值越大,代表其危險性越高。

本文的研究目的為利用對稱法對因子進行分級以構建信息量模型,以進行滑坡危險性評價,并驗證該方法的合理性,技術流程圖如圖1所示。

圖1 基于信息量模型的汶川地震滑坡危險性評價技術流程Fig.1 Workflow of landslide hazardness analysis in Wenchuan area using information value model

1.2 因子分級原理

由式(2)可知,因子分級是信息量模型建模過程中的必要步驟。為了使有限的分級區間包含盡量多的信息,本文參照正態分布相關的統計學知識,提出了一種對稱分級法。該方法以標準差分級法為基礎,可有效減少分級數目,能以盡可能少的分級數突出與滑坡相關性更高的部分。標準差計算公式為:

(4)

式中:μ為均值;σ為標準差。

本文首先以標準差分割法對因子進行預分割,標準差分割法結果中往往會存在一個中心區間(定義為μ±1/2nσ,其中,n為σ的倍數,可為整數或小數),并在此中心區間之外以nσ為間隔進行區間劃分。在經過預分割后,本文對區間進行合并,以中心區間為對稱軸,從外到內對左右對稱的區間依次進行合并,所得到的結果即為對稱法分級結果,如圖2所示(以標準正態分布為例),圖中相同填充色的區間被劃分為同一級。本文將預分割間隔設定為1/2σ。

圖2 對稱法分級示意圖(以標準正態分布為例)Fig.2 Schematic diagram of the symmetrical classification method (e.g. standard normal distribution)

2 實驗

2.1 研究區概況及數據源

本文選擇汶川地區北川-映秀斷裂帶及其周邊地區作為研究區,覆蓋范圍為E102°17′18″~105°43′12″,N30°20′6″~33°15′19″。研究區范圍較廣,高程范圍在0~6.25 km之間,山勢陡峻,地表起伏大,地形地貌變化多樣;研究區內巖性種類豐富,地質構造復雜,地震烈度范圍為Ⅶ~Ⅺ度;區內河流眾多,包含岷江、白龍江、小涇川及其細小徑流,溝谷河流遍布于山體之中,易積水,存在土壤結構疏松的區域,因此廣泛具備滑坡發生的基本條件。

許沖等[21]利用2008年汶川特大型地震前后獲取的高分辨率遙感影像,制定了客觀、詳盡的滑坡編錄,該編錄包含195 290個矢量面,覆蓋面積達到1 160 km2。本文基礎數據包括該滑坡編錄、1∶25萬數字地質圖(公開版)、1∶100萬河網圖、1∶100萬斷裂數據、25 m空間分辨率DEM、汶川地區地震烈度矢量圖等。原始數據如圖3所示。

圖3 研究區內基礎地理數據Fig.3 Original geographical data of study area in Wenchuan

在開始實驗之前,首先對多源數據進行預處理,本文對于矢量數據中冗余的屬性進行了清洗,統一了數據格式、柵格分辨率、參考系;隨后,將多源數據處理為多源致災因子,因子圖均為柵格格式,空間分辨率為25 m。由于坡度0°~10°之間的區域地勢較為低緩,發生滑坡的可能較低,多分布滑坡堆積物,本文研究中沒有對該區域進行分析。

2.2 單因子統計分析

根據對前人研究的整理歸納[4~27],本文選取了9個致災因子,選取依據與數據源見表1。本文采用ArcMap10.2軟件將柵格化后的滑坡圖與對應的致災因子圖相疊置,以獲取各個致災因子與滑坡面積的關系。由于本文研究區面積較大,滑坡分布廣泛,因此在進行單因子分析時,需要進行由粗放到細致的多次疊置分析,以達到精細分析的目的。

表1 致災因子的詳細數據源與選取原則Tab.1 Selection principles and original data resources of hazardness factors

(續表)

2.2.1 坡度

研究區內的坡度范圍由10°~89.3°。由圖4可知,滑坡的面積隨著坡度的增大呈現正態分布變化趨勢,其中,分布于坡度35°~45°區域內的滑坡面積所占比例最大。

2.2.2 坡向

本文將坡向以45°為間隔分為8個方向,以337.5°~22.5°為北坡。坡向的單因子統計分析結果如圖5所示,大部分滑坡發生在東坡與東南坡上,與前人的研究結論[24]相吻合。

圖5 坡向與滑坡之間的關系Fig.5 Statistical analysis results between landslide and aspect

2.2.3 高程

在本文研究區內,滑坡大多分布在高程0.522~5.307 km的區域內。由圖6可以看出,隨著海拔高度的增加,滑坡面積呈現先上升后下降的趨勢,滑坡集中分布在高程1~2 km范圍內,在這個區間內存在較為明顯的拐點;在高程超過4 km后,滑坡顯著減少。

圖6 高程和巖性與滑坡之間的關系Fig.6 Statistical analysis results between landslide and height

2.2.4 到斷層距離

本文圍繞汶川地震主發震斷裂北川-映秀斷裂構建了25 km的緩沖區,分析了不同斷層距離范圍內滑坡面積的分布,結果如圖7所示。隨著到斷層距離的增加,發生的滑坡面積相應減小,曲線有較明顯的拐點,分別位于5 km,11.5 km以及15.5 km處;在超過15 km后,滑坡面積的變化幅度減小,基本不會隨著到斷層距離的增加而明顯下降。

圖7 到斷層距離與滑坡之間的關系Fig.7 Statistical analysis results between landslide and distance to fault

2.2.5 地表曲率

在研究區內,大部分滑坡發生在曲率范圍為-0.05~0.05之內。本文選取該部分,以0.003為間隔再次對區間細分,進行統計。由圖8可知,地表曲率與滑坡面積的關系近似呈正態分布。大部分滑坡分布在水平曲率-0.01~0.01、剖面曲率-0.015~0.015的范圍內。

(a)水平曲率 (b)剖面曲率

2.2.6 巖性

本文以汶川地區地質圖為底圖,將巖性由堅硬到軟弱分為5個大組,編號1—5,依次代表極堅硬巖組、較堅硬巖組、堅硬巖組、較軟弱巖組、極軟弱巖組;每個大組又按相對強弱細分為3個小分組,編號Ⅰ—Ⅲ,分組與對應的典型巖性類型如表2所示。分析結果如圖9所示,可以看出,滑坡高發地區的巖性大多為極堅硬巖組的堅硬組,堅硬巖組的較軟組,較堅硬巖組的堅硬組和軟弱巖組的堅硬組。

表2 巖性分組及其對應的部分代表巖性Tab.2 Classification result of lithology and examples matching each group

圖9 巖性和巖性與滑坡之間的關系Fig.9 Statistical analysis results between landslide and lithology

2.2.7 到河流距離

本文將河流緩沖區設置在0~3 km之內;在3 km之后,可認為受河流的影響基本可以忽略不計,分析結果如圖10所示。隨著到河流距離的增加,發生的滑坡面積相應減??;在距離1.7 km以外,曲線呈較為平緩趨勢。

圖10 到河流距離與滑坡之間的關系Fig.10 Statistical analysis results between landslide and distance to river

2.2.8 地形濕度指數

地形濕度指數計算公式為:

(5)

式中:ITW為地形濕度指數;As為匯水面積,可通過流量得到;β為坡度,在實際計算中,需將坡度由角度制轉為弧度制。

本文根據式(5)計算地形濕度指數。經分析后可知,滑坡大部分分布在地形濕度指數值為3~10的區域內。本文選取該范圍,以0.3為間隔對區間進行細分,結果如圖11所示。地形濕度指數與滑坡面積的關系呈現正態分布,地形濕度指數在6~8之間區域內的滑坡面積較大。

圖11 地形濕度指數與滑坡面積之間的關系Fig.11 Statistical analysis results between landslide and topographic wetness index

2.2.9 地震烈度

本文采用汶川地震發生后中國地震局實地調查獲取的地震烈度分布圖,分析結果所如圖12所示??梢钥闯?,隨著地震烈度的增大,滑坡面積呈現增加趨勢,在地震烈度為Ⅺ度的區域內,發生的滑坡總面積最大。

圖12 地震烈度與滑坡面積之間的關系Fig.12 Statistical analysis results between landslide and intensity

2.3 信息量模型構建

在實驗中,坡向、巖性、地震烈度可根據屬性分類結果進行分級,無需進行分級方法探究。其余因子按照單因子統計分析結果,分為呈近似正態分布的因子(坡度、地表曲率、地形濕度指數)與非正態分布的因子(高程、到河流距離、到斷層距離)。對于呈近似正態分布的因子,采用對稱法進行分級;呈非正態分布的因子,遵循區間異質性最大化原則選擇分級方法。

為了驗證對稱法的合理性,探究不同分級方法對模型評價結果的影響,本文選取了5種標準分級法進行對比試驗,分別為等間距分割(equal interval,EI)、分位數分割(equal quantile,EQ)、自然間斷分割(natural break,NB)、幾何間斷分割(geometric break,GB)和標準差分割(standard deviation,SD)。部分分級結果如圖13所示(以地形濕度指數為例)。EQ,NB和GB分級數目均為10級??梢钥闯?,對稱法(圖13(f))用最少的分級等級,包含了最多的信息,突出了地形濕度指數因子中與滑坡相關性更大的區域。

(a)EI法 (b)EQ法

(c)NB法 (d)GB法

在對因子進行分級后,按式(3)對因子的各個等級對應的滑坡面積進行統計與信息量計算。當信息量值為正值時,說明該因素對于滑坡災害的發生有正向貢獻,而信息量值為負值或0時,說明該因素對于滑坡災害的發生有負向貢獻或沒有貢獻。

3 實驗結果與分析

將信息量計算結果乘1 000轉為整形,通過重分類將因子的信息量賦值給相應的等級,隨后通過疊置分析,得到結果圖。由于計算結果值范圍相差較大,為了方便對比,需統一范圍。本文采用歸一化處理,將結果范圍歸納至0~1,再以0.2為間隔,將危險性圖從高到低劃分為危險性極低(0~0.2)、較低(0.2~0.4)、中等(0.4~0.6)、較高(0.6~0.8)、極高(0.8~1)5個等級,如圖14所示。

(a)EI法 (b)EQ法 (c)NB法

(d)GB法 (e)SD法 (f)對稱法

由圖14可以看出,研究區內滑坡危險可能性較高的區域集中在北川-映秀斷裂帶兩側。其中,斷層分布較為密集的地區多為山區,海拔也相應較高,地勢較為陡峭,因此滑坡發生的危險性最高。將致災因子圖與該結果圖對照可發現,滑坡危險性高的地區與地震烈度的Ⅹ~Ⅺ級覆蓋地區、斷層緩沖區0~15 km內、巖性的第一大類分布地區重合度較高。將該結果與信息量值的正值部分相對照,可發現危險性較高的地區與正向貢獻的因子及其對應等級基本相吻合。

圖14(f)表明,利用對稱法分級所得到的滑坡危險性評價圖中較高、極高危險性區劃地域所占面積比例相對較大,因此危險性等級的區分度更高。為進一步驗證對稱法的優越性,本文統計了6種分級方法的結果中危險性較高、極高區域內的實際滑坡面積的比例(表3)。

表3 危險性較高和極高區域內實際發生滑坡面積的大小和比例對比Tab.3 Comparison of the proportion of actual landslide area in high-risk and extremely high-risk areas (%)

通過將表3中較高、極高危險區劃內滑坡面積比例相加可以得到6種分級方法的結果,分別為:EI法79.24%,EQ法79.61%,NB法74.79%,GB法68.65%,SD法68.81%,對稱法80.87%。利用對稱法構建模型的制圖結果中,覆蓋于危險性較高和極高區域中的實際發生滑坡面積比例最高,說明對稱法充分利用了單因子分析的優勢,具有較好的分級效果。

4 結論與討論

為最大限度地發揮單因子統計分析的優勢,提高信息量模型的評價準確性與適用范圍,本文提出了一種合并對稱區間進行分級的方法,并利用該方法構建信息量模型,對汶川地區的地震滑坡危險性進行了評價。為了驗證對稱法的合理性,本文選取了5種標準分級進行建模,將所得到的結果進行對比,得出結論:

1)通過單因子分析可知,滑坡面積與坡度、地表曲率(水平曲率和剖面曲率)、地形濕度指數之間的關系呈現正態分布,即分布于因子范圍兩側區域內的滑坡面積較小,分布于中部區域中的滑坡面積較大。

2)研究區內滑坡危險較高、極高的區域集中在北川-映秀斷裂帶兩側,該范圍內山區分布眾多,地勢較為陡峭,海拔也相對較高,與災害信息量值呈正值的區域大致相同。

3)對稱法得到的危險性區劃圖中,較高、極高危險區覆蓋實際滑坡面積比例最大,達80.87%,高于其他標準分級方法所得的結果。這表明,對稱法分級結果能夠充分利用單因子分析的優勢,突出危險性較高的地區,便于決策者快速鎖定危險性較高和極高的區域。

應該指出,對稱法存在著一定局限性,即假定因子與滑坡的關系呈近似正態分布狀。然而,因地質災害規模的不同,滑坡面積與因子的關系大多不符合標準正態分布,甚至可能呈現離散分布(地質災害規模較小),在這些情況下對稱法是否仍舊適用,還有待進一步研究與討論。

志謝:本文所使用的汶川地震滑坡編錄數據由中國地震局地殼應力研究所許沖研究員提供,對此深表謝意。

猜你喜歡
信息量正態分布危險性
O-3-氯-2-丙烯基羥胺熱危險性及其淬滅研究
危險性感
輸氣站場危險性分析
基于AHP對電站鍋爐進行危險性分析
基于GIS和信息量法的四川峨眉山市地質災害易發性定量評價
基于信息理論的交通信息量度量
基于對數正態分布的出行時長可靠性計算
正態分布及其應用
如何增加地方電視臺時政新聞的信息量
正態分布題型剖析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合