?

面向地質災害防治的第四系空間信息提取研究

2020-04-20 03:45葉潤青李士垚牛瑞卿
安全與環境工程 2020年1期
關鍵詞:第四系土質厚度

葉潤青,李士垚,牛瑞卿

(1.中國地質調查局武漢地質調查中心(中南地質科技創新中心),湖北 武漢 430205;2.中國地質大學(武漢)地球物理與空間信息學院,湖北 武漢 430074)

第四系空間分布及其厚度信息是可持續農業、土地利用管理決策的主要依據,也是山區重大工程建設、地質災害監測防治工作中的重點關注對象[1]。第四系空間分布及其堆積厚度是影響斜坡穩定性的關鍵因素,多種地質災害(如滑坡、土壤侵蝕、地震砂土液化等)的破壞強度及發生概率也與之相關[2-4]。第四系厚度還影響地下水動力過程,隨著第四系厚度的增加土體孔隙水壓力增大,不利于斜坡穩定[5];在強降雨或地震作用下,淺層土質滑坡易發于第四系分布區[6]。然而,地質圖并未提供第四系厚度信息。傳統的確定第四系厚度的調查手段如鉆孔、探槽等山地工程以及地球物理手段只限于局部(如滑坡)勘查,不適用于區域調查工作的需求。

第四系厚度可概化為是加深、堆積和搬運的函數[7]。其中,加深(deepening processes)是指底部基巖風化導致土壤厚度從底部向下增厚的過程;堆積(upbuilding)是指由于沉積和有機物堆積等作用使得土壤厚度由表層往上增厚的過程;搬運(removals)是指土層受侵蝕、剝蝕等作用使得土體缺失以及溶濾等質量虧損的過程。如McKenzie等[8]采用回歸樹建立線性模型,并以數字地形和γ射線調查數據為解釋變量,開展了土壤性質的預測研究;Tsai等[9]建立了土壤-地形回歸模型,并進行了土層深度預測。第四系受時-空多變要素控制和影響,如過去和現在的土地利用狀態、地層巖性和風化剝蝕等,其厚度難以用單一地形因子與回歸模型估計[10]。

通過收集以往地質調查工作中獲取的第四系厚度資料,運用空間插值算法可以估算區域第四系空間分布情況。但是,利用傳統的空間插值算法的制圖效率和制圖精度均不理想。信息技術的發展為地學研究提供了新技術、新方法,如地理信息系統、遙感、數據挖掘等技術為信息的獲取與分析提供了強有力的支撐。如郭培虹等[11]提出了從遙感影像中提取水體泥沙指數識別水庫第一岸坡土質和巖質分布的方法,可以確定高植被覆蓋區近岸斜坡的巖土性質,但無法獲取土層厚度信息;劉磊等[12]分析了三峽庫區萬州主城區的沉積標志、地貌標志與區域第四系分布之間的關系,并利用標志因子構建了基于隨機森林算法的第四系厚度估算模型,編繪了區域第四系厚度空間分布圖。

基于以上研究,本文以三峽庫首區秭歸段為研究區,在遙感影像、地質圖、地形圖、地面調查和勘查資料等多源數據的支持下,利用C5.0決策樹構建了第四系空間分布及其相對厚度信息提取模型,編繪了研究區第四系相對厚度空間分布圖。

1 研究方法

1.1 技術路線

圖1 第四系相對厚度及其空間分布信息提取的技術流程圖Fig.1 Technical flow chart for extracting the relative thickness and spatial distribution information of Quaternary

本研究基于多源數據的第四系空間分布及其堆積厚度信息提取的技術路線如下:在收集遙感影像、地形圖、地質圖以及現場調查資料的基礎上,獲取第四系厚度評價因子專題圖,建立第四系相對厚度C5.0決策樹模型,估算區域第四系相對厚度,并編繪區域第四系相對厚度空間分布圖。具體的技術流程如下(見圖1):①研究區數據收集,包括Landsat-7 ETM+多光譜影像數據、高空間分辨率DMC(Digital Mapping Camera)數字航空影像數據、1∶1萬地形圖和1∶5萬地質圖以及工程勘查、野外調查數據等;②第四系厚度評價因子提取,并利用多源數據生成第四系厚度評價因子專題圖,包括地層巖性、坡度、水系多級緩沖區、歸一化植被指數(NDVI)、影像光譜特征中的亮度(Brightness)和影像紋理特征中的灰度共生矩陣對比度(GLCM contrast)共6個評價因子專題圖件,并通過收集、整理勘查資料且輔以遙感解譯和現場調查來獲取已知區域第四系厚度數據(即分類樣本);③第四系相對厚度C5.0決策樹模型的建立,并估算區域第四系相對厚度,生成第四系相對厚度空間分布圖。

1.2 C5.0決策樹算法原理

決策樹算法是數據挖掘中的經典分類算法,可以揭示數據集中的結構化信息,適用于探測式知識發現。決策樹可以處理高維數據,學習和分類步驟簡單快速,也往往具有較好的準確率。獲取的知識用樹的形式直觀表示、易于理解。Quinlan等[13]開發了ID3算法用來構造決策樹,并在剪枝技術和派生規則等方面對ID3算法做出了較大改進,提出了C4.5算法,既適用于分類問題,又適用于回歸問題[13-14]。C5.0算法通過在分類過程中增加Boosting方法等改進策略提高了分類精度和算法性能[13-14]。SPSS Clementine等數據挖掘軟件中提供了C5.0算法實現。

C5.0算法使用信息增益率作為屬性選擇度量,依據信息增益率最大的屬性對樣本數據進行劃分。通??梢杂萌缦碌姆椒ㄓ嬎鉉5.0決策樹算法中的信息增益率[15]:

設數據集S為訓練樣本集,假定類標號屬性具有m個不同的值,定義了m個不同的類Ci(i= 1,2,…,m)。設Ci,S是S中Ci類的樣本集合,|Ci,S|和|S|分別為Ci,S和S中樣本的個數。則集合S分類所需的期望信息量可定義為:

(1)

式中:pi是任意樣本屬于Ci的概率,并用 |Ci,S|/|S|來估計。

設依照屬性X劃分S,X具有v個不同的觀測值{x1,x2,…,xv},則S可被分成v個子集{S1,S2,…,Sv}。其中,Sj為S中屬性X的取值為xj的子集,j=1,2,…,v。在分類的過程中,如果X被選為決策屬性,則根據屬性X可以將樣本集劃分到不同的分枝中。設|Sij|表示子集Sj中屬于Ci類的樣本數量,則基于按X劃分對S的樣本分類所需的期望信息量為:

(2)

其中,(|S1j|+|S2j|+…+|Smj|)/|S|是第j個分類的權重。

由此可得屬性X作為決策分類屬性的信息增益:

Gain(X)=Info(S)-InfoX(S)

(3)

信息增益傾向于選擇具有大量值的屬性,使用增益率來減少這種偏倚。增益率使用分裂信息值將信息增益規范化,即:

(4)

則信息增益率為:

(5)

2 研究區概況

三峽庫首區秭歸段(寬約4 km、長約42 km)人類工程活動強烈,滑坡地質災害密集發育。該區域地處中國地形第二階梯向第三階梯的過渡地帶,是川東褶皺與鄂西山地會合部位,為中、低山侵蝕峽谷地貌(含西陵峽西段和秭歸盆地)[16]。研究區地層發育較完整,除缺失泥盆系下統、石炭系上統及下統、白堊系大部分以及第三系地層外,自前震旦系至第四系地層皆有出露(見圖2),總體上地層具有自東向西漸新展布的規律[17]。香溪河以東地區為峽谷區,三疊系以老的地層連續出露,主要為碳酸鹽巖;香溪河以西地區主要出露三疊系中統至侏羅系(T2—J)地層,以碎屑巖為主,巖性為砂巖、粉砂巖和頁巖。褶皺是區內的主要構造形式,主要發育黃陵背斜和秭歸向斜。區內地層巖性多樣、構造復雜,不僅提供了地質災害的發育條件,還控制了空間孕災環境的差異,部分地層(如巴東組)被稱為易滑地層[18-19]。研究區是三峽庫區地質災害嚴重區,也是災害重點防治區域之一,曾在1985年發生了新灘滑坡、2003年發生了千將坪特大型滑坡[20-21],近年來不斷有滑坡險情出現,如白水河滑坡、臥沙溪滑坡等。由于區內大部分滑坡、不穩定斜坡、塌岸發生在土質岸坡,即為第四系堆積層滑坡,因此第四系識別和厚度信息提取成為關注的焦點之一。

圖2 研究區域構造綱要圖[17]Fig.2 Regional geological and tectonic framework map of the study area[17]1.斷層;2.背斜;3.向斜;4.中生代地層;5.晚古生代地層;6.早古生代地層;7.震旦系地層;8.晚元古代地層;9.中元古代地層;10.研究區邊界

研究區內第四系覆蓋較廣,是滑坡地質災害的主要物質組成,包括人工堆積層(Qml)、滑坡堆積層(Qdel)、沖積層(Qal)、坡積層(Qdl)。據多個滑坡鉆孔揭示,沿長江兩岸的河流階地或山麓平臺均分布有第四系沖洪積物、崩坡積物、風化殘積層、古滑坡堆積層、古崩塌堆積層,最大厚度超過50 m。

3 第四系相對厚度與空間分布信息提取

3.1 數據預處理

3.1.1 遙感解譯及現場調查數據

在三峽庫區大壩建設、移民遷建和地質災害防治工作中,已經獲取了部分區域第四系覆蓋層信息,包括土層位置、厚度、邊界,在此基礎上,本文收集了研究區內52處滑坡勘查資料,包括堆積層土體的厚度及其分布位置,但勘查資料缺少薄層土質區和巖質區樣本,為此采用遙感解譯輔以野外調查方式補充薄層土質區和巖質區樣本。遙感解譯是利用高分辨率DMC航空影像數據(此數據由中國地質調查局武漢地質調查中心三峽庫區地質災害監測預警指導中心提供),其地面空間分辨率為0.2 m,目視解譯可以準確地識別土地覆蓋類型(如基巖出露),并結合地面調查可確定薄層土質區和巖質區。經資料收集和遙感解譯獲得了研究區第四系厚度訓練樣本總面積為15.59 km2,為研究區總面積的2.99%,并將區內第四系巖土體厚度劃分為4個相對等級,分別為巖質區(基巖出露或土層堆積厚度小于1 m)、薄層土質區(1~5 m)、中層土質區(5~10 m)和厚層土質區(大于10 m)。

3.1.2 地質圖

作為第四系松散堆積物的物源,巖性無疑是第四系特征的控制因素,因此將地層巖性作為第四系厚度的評價因子之一。研究區地層巖性可分為兩類:碳酸鹽巖和碎屑巖。其中,碳酸鹽巖主要是由灰巖和白云巖組成,巖石強度高、硬度大,巖石抗風化能力強,表面第四系覆蓋層薄,集中分布在研究區香溪河和童莊河以東;而碎屑巖是由砂巖、粉砂巖、泥巖組成,巖石強度相對低、硬度小,巖石抗風化能力弱,形成相對厚的第四系覆蓋層,主要分布在香溪河和童莊河以西和新灘附近。

3.1.3 地形圖

山區地形坡度控制了第四系的搬運和堆積,緩坡有利于巖石風化碎屑物的堆積,易形成較厚的第四系覆蓋層,而陡坡則以剝蝕為主,表面第四系覆蓋層薄。坡度主要是用來衡量地形陡緩或地表高程的變化率,故將其選擇為第四系厚度評價因子之一。坡度可從數字高程模型(DEM)中提取,而DEM由地形等高線生成。因此,本文由收集的19幅1∶1萬地形圖(等高距為10 m)制作了研究區DEM。研究區坡度分布范圍集中在35°以下,主要為中、緩坡,第四系厚度與斜坡坡度的關系總體上呈反比,即隨著坡度的增加第四系厚度變薄,當坡度大于60°時一般為基巖裸露。

河流岸坡的第四系剝蝕是由高處往低處的搬運過程,最終匯入長江或其支流。一般情況下,斜坡上第四系堆積物也是自上而下變厚,因此本文將水系多級緩沖區作為第四系厚度的評價因子之一。

3.1.4 Landsat-7 ETM+多光譜影像數據

Landsat-7 ETM+多光譜影像數據獲取時間為2000年5月14日,其空間分辨率為30 m,經輻射定標、大氣校正、幾何校正等預處理后,獲取歸一化植被指數以及影像光譜特征中的亮度和影像紋理特征中的灰度共生矩陣對比度作為第四系厚度的評價因子。

圖3 研究區Landsat-7 ETM+多光譜影像示例圖Fig.3 Landsat-7 ETM+ image of the study area

三峽庫區人類活動強烈,主要是農業活動和移民城鎮建設,土地資源相對緊張,因此大部分第四系較厚堆積層區已成為農業和城鎮居民用地?,F場調查顯示,研究區第四系厚度與土地覆蓋具有較大的相關性,例如高植被覆蓋區下面第四系堆積層薄,甚至是巖質區;而植被稀少或無植被區,如耕地、裸地、居民區則往往是厚層第四系覆蓋。歸一化植被指數(NDVI)在一定程度反映了植被覆蓋和土地利用情況,因此選取NDVI作為第四系厚度的評價因子。本文選取ETM+多光譜影像近紅外波段(Band 4)和紅光波段(Band 3)數據通過波段運算提取了研究區的NDVI。

第四系厚度與土地覆蓋類型組合也具有較強的相關性,土質區(尤其是厚層土覆蓋區)的地表覆蓋類型主要是耕地、裸地、居民區(農村居民點,房屋比較分散)、稀疏植被等多種地物類型組合,在遙感影像上呈現特定的紋理特征,因此可采用圖像分割及面向對象信息提取技術研究第四系厚度與地物組合之間的關系,即利用多尺度分割算法將鄰域中具有相似的光譜和紋理特征像素聚類為一個對象,然后獲取對象的光譜和紋理特征。多尺度分割算法既能很好地反映圖像鄰域間的空間關系,又提供了更靈活的表示形式,因此對于圖像信息的進一步提煉十分有益[22],其原理是通過多尺度策略對每個像素鄰域關系(上下文內容)自適應模擬和聚類[23]。在eCognition軟件平臺中,對Landsat-7 ETM+多光譜影像數據進行多尺度分割,使用控制單一變量選優的策略,利用ESP2工具可得到較為理想的多尺度分割參數:尺度參數Scale=44,形狀指數Shape=0.2,緊置度Compactness=0.5[24-25]。經與第四系厚度樣本對比分析,選擇影像光譜特征中的亮度(Brightness)和影像紋理特征中的灰度共生矩陣對比度(GLCM contrast)作為第四系厚度的評價因子。

如上所選取的評價因子變量多源數據可用間隔尺度、有序尺度和名義尺度3種類型表示。其中,間隔尺度的變量用實數表示,如坡度為0°~90°;名義尺度的變量用特征狀態表示,如地層巖性用碳酸鹽巖類和碎屑巖類描述;有序尺度的變量用有序等級表示,如第四系厚度用薄層、中層、厚層描述。另外,坡度、NDVI、Brightness、GLCM contrast評價因子使用自然間斷點分級法進行重分類,將連續性評價因子變量離散化,各評價因子重分類情況見表1和圖4。

表1 第四系厚度評價因子的分類

圖4 第四系厚度評價因子的分類圖Fig.4 Map of Quaternary thickness estimating factors

3.2 第四系相對厚度與空間分布信息提取

在數據挖掘SPSS Clementine軟件中,基于前述分析得到的6個第四系厚度評價因子,利用C5.0決策樹算法對訓練樣本學習,構建第四系相對厚度分類模型,生成研究區第四系相對厚度估算結果(見表2),并在ArcGIS軟件中制作研究區第四系相對厚度空間分布圖(見圖5)。

由表2可知,研究區第四系覆蓋區域面積占研究區總面積的73.48%,巖質區為26.52%。第四系覆蓋區中,厚層、中層、薄層土質區域面積占研究區總面積的百分比分別為32.13%、4.28%和37.07%。

表2 第四系相對厚度信息提取結果統計

圖5 第四系相對厚度分區及基巖分布圖Fig.5 Map of spatial distribution for Quaternary relative thickness and the bedrock

利用現場調查和遙感解譯數據的一部分(50%)作為檢驗樣本,在ENVI軟件中通過混淆矩陣計算得到分類的總體精度為75.79%,Kappa系數為0.68,表明第四系相對厚度的分類精度中等。

3.3 討論

通過對比分析圖4和圖5可以得出區域上第四系相對厚度及其空間分布具有如下規律:

(1) 第四系空間分布及其堆積厚度由巖性控制,厚層土質覆蓋區主要分布在碎屑巖中,碳酸鹽巖則是以薄層土質覆蓋區和巖質區占主導。

(2) 第四系厚度與水系具有相關性,隨著離岸距離的增大,第四系厚度具有由厚變薄的趨勢。但從局部范圍來看,第四系相對厚度及其空間分布由坡度控制,坡度越大,第四系厚度越??;且第四系相對厚度及其空間分布與NDVI以及影像的光譜、紋理等因素存在較強的關聯性,厚層土質區主要分布于居民建筑區、耕地、裸地和稀疏植被覆蓋區。

研究區172 m高水位蓄水期間(2008年11月)塌岸現場調查顯示:區內共發現19個塌岸,均為土質塌岸;從塌岸數量上看,發育在厚層土質區的塌岸有11處、薄層土質區的塌岸有8處;從塌岸規模上看,厚層土質區的塌岸規??傮w上大于薄層土質區,9處較大規模的塌岸中有7處發育在厚層土質區中。上述塌岸現場調查結果反映了此研究結果可為庫岸再造和塌岸防治提供科學依據。

根據第四系空間分布及其堆積厚度信息提取結果,將研究區長江干流及其主要支流岸坡第四系相對厚度劃分為若干段,其中長江干流岸坡第四系相對厚度劃分為11段,具體描述見表3。

表3 研究區長江干流及其主要支流岸坡第四系相對厚度分段

由表3統計結果顯示:以厚層、中層第四系覆蓋為主的岸坡長度為79.3 km(其中長江干流為45.2 km),以巖質和薄層第四系覆蓋為主的岸坡長度為47.9 km(其中長江干流為38.9 km)。

4 結 論

本文針對目前工程地質中,尤其是三峽庫區地質災害防治中普遍關注的庫岸斜坡中第四系空間分布及其堆積厚度問題,在多源數據的支持下,提出了第四系空間分布及其堆積厚度信息提取方法。以三峽庫首區秭歸段為研究區,在收集遙感影像、地質圖、地形圖以及勘查資料等數據的基礎上,通過分析第四系空間分布及其厚度的成因和控制因素,確定地層巖性、坡度、水系多級緩沖區、歸一化植被指數(NDVI)、影像光譜特征中的亮度、影像紋理特征中的灰度共生矩陣對比度共6個評價因子,通過收集現場勘查、野外調查資料以及將高分辨遙感影像解譯的方式獲取的已知區域第四系空間分布及其厚度作為樣本,經C5.0決策樹模型學習建立了第四系相對厚度估算模型,估算區域第四系相對厚度,并編繪研究區第四系相對厚度空間分布圖。結果表明:①區域內第四系的空間分布及其堆積厚度由巖性控制,其與水系的相關性較強,而局部則受坡度控制;②遙感技術是第四系空間分布信息獲取和分析的有效手段,不僅利用Landsat ETM+影像獲取了第四系厚度評價因子(如歸一化植被指數、影像光譜和紋理因子),還通過高分辨率DMC航空影像解譯,并結合地面調查獲取了巖質和薄層土質區,而采用多尺度分割算法提取對象的光譜和紋理信息,有利于分析第四系厚度與土地覆蓋類型組合的關系,表明遙感影像的光譜、紋理特征可較為真實地反映第四系的空間分布信息;③172 m高水位蓄水期間的塌岸調查結果佐證了第四系厚層區劃結果的可信度,該研究結果在庫岸再造和塌岸防治方面具有一定的參考價值。

致謝:感謝中國地質調查局武漢地質調查中心三峽庫區地質災害監測預警指導中心的支持與幫助,感謝彭令、趙艷南、江齊英、吳婷和許霄霄的幫助。

猜你喜歡
第四系土質厚度
大厚度填土場地勘察方法探討
慢阻肺患者肺功能與HRCT支氣管壁厚度的相關性
大厚度SA-516M Gr.485鋼立焊位熔化極氣體保護焊
渤海灣西第四紀以來差異性沉積特征及其構造指示
撫順東露天煤礦第四系邊坡錨索加固設計
基于無人機測繪-物探-鉆探組合技術的某場地第四系地層特征研究
詩要有溫度,有厚度
江蘇丹陽地區第四系物性特征研究
公路土質路基工程施工探討
公路路基施工中過濕土的施工對策研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合