?

基于GF-1數據多尺度遙感特征的森林蓄積量估測研究

2022-08-09 02:47黃冰倩岳彩榮朱泊東
林業資源管理 2022年3期
關鍵詞:樣地波段精度

黃冰倩,岳彩榮,朱泊東

(1.西南林業大學,昆明 650224;2.貴州省林業調查規劃院,貴陽 550003)

隨著遙感(RS)、地理信息系統(GIS)、全球導航衛星系統(GNSS)等信息技術在林業資源監測應用日趨成熟,國內外已有一些學者利用“3S”技術結合數學模型對蓄積量進行遙感估測,并嘗試了一些新的方法[1-2]。遙感影像早期較多利用Landsat TM/ETM,SPOT5,IKONOS提取遙感特征因子,建立森林蓄積估測模型。遙感特征因子也從波段光譜特征、植被指數特征逐漸增加了地形特征、紋理特征因子[1-2]。Shamsoddini[3]應用WorldView-2影像,對澳大利亞新南威爾士州的松樹林分蓄積進行了估測。近年來,我國自主研制的衛星遙感數據(如高分1號,高分2號,資源3號等)逐漸推廣應用,且影像時間分辨率、空間分辨率、覆蓋區域都能較好地滿足研究要求。結果顯示,波段的紋理特征比光譜值和衍生光譜值具有更好的反演效果[4-6]。通過隨機森林方法對不同的特征變量重要性進行研究,發現紋理特征比光譜特征因子對森林蓄積建模影響大[4-6]。隨著引入特征變量的增加,一方面提高了建模精度,另一方面也會引起共線性問題。通過多元逐步回歸、隨機森林建模的方法,篩選關鍵變量,提高建模精度,減少數據冗余。

遙感森林蓄積估測模型研究逐漸由參數化方法向非參數方法模型過渡,參數化方法通用性、可解釋性較好,但是建模精度比非參數方法低,且建模因子較多時會存在數據冗余等問題[7-11]。與參數化方法相比,非線性森林蓄積估測模型擬合精度較高,無需先驗假設,模型構建更便捷。機器學習算法是典型的非參數化模型構建方法,雖然此類算法不能輸出具體模型,但也可以進行回歸預測[7-11]。目前,通過不同因子組合、對比不同建模方法來研究模型擬合精度較多,從特征提取單元與地面監測尺度匹配性考慮較少。本文基于貴州省觀山湖區GF-1遙感數據提取的光譜信息、植被指數及紋理特征,結合研究區實測馬尾松樣地數據,通過多元逐步回歸、隨機森林算法構建不同窗口遙感特征的森林蓄積量估測模型,尋求最優擬合效果對應的適宜窗口,進一步深化提高森林蓄積估測的建模精度方法,旨在為高分辨率光學遙感影像數據估測森林蓄積探索一些方法和思路。

1 研究區概況

研究區位于貴州省貴陽市中心城區西北部的觀山湖區,地處苗嶺山系西部中段,東鄰云巖區黔靈鎮、南接花溪區久安鄉、西靠清鎮市麥格苗族布依族鄉、北接觀山湖區艷山紅鎮。地理位置 26°33′~26°40′N,106°33′~106°41′E,國土總面積306.95km2。地貌以中山丘陵為主,平均海拔1 280m左右,地勢相對平緩。地帶性植被屬于亞熱帶常綠闊葉林,植被大多是次生植被和人工植被,主要樹種有馬尾松、杉木、柳杉、泡桐、青岡、麻櫟等。

2 研究方法

2.1 數據來源及處理

影像數據來源于2015年10月觀山湖區高分1號(GF-1)遙感影像(圖1),全色波段分辨率為2m,多光譜波段分辨率為8m,投影為2000國家大地坐標系(CGCS2000)。該影像為開展二類調查統一采購,已經過輻射定標、大氣校正、幾何校正、影像拼接、勻光勻色等處理,并通過假彩色合成得到觀山湖區范圍內高分遙感影像。GF-1光譜對應情況如表1所示。研究區影像完成幾何配準后,對全色和多光譜影像進行融合和裁切,輸出2m分辨率的GF-1融合影像。在融合影像基礎上,生成分辨率為2m的各波段影像(藍、綠、紅、近紅外),并以此為基礎數據進行后續的光譜特征、植被指數計算、紋理特征提取。

圖1 研究區高分1號遙感影像圖

表1 高分1號衛星波段光譜信息

2.2 樣地布設

外業數據主要采用2016年觀山湖區二類調查中馬尾松樣地實測數據,樣地布設在GIS平臺上,以1∶10 000遙感影像圖為基礎,在調查區域內隨機確定起點后,以計算出的樣地間距(L)為參照,從上至下、從左至右按公里網布設樣地,樣地規格為半徑14.57m的圓形樣地,面積667m2。對樣地內胸徑大于等于5.0cm的樣木進行每木檢尺,采集其胸徑、樹高、郁閉度、優勢樹種等數據,對各樹種(組)檢尺樣木按徑級組歸類,用各徑級組平均樹高、各徑級組檢尺木胸徑通過二元立木材積式計算各株樣木材積,匯總得到樣地蓄積,記載到0.1m3。研究區選取馬尾松樣地點總樣本共180個(其中訓練樣本120個,驗證樣本60個)各樣本最大值、最小值、平均值情況及樣地空間分布情況如表2所示。

表2 研究區樣地蓄積量分布統計表

2.3 特征變量設置

2.3.1光譜特征

1)光譜信息。以高分1號影像的band4(近紅外)、band3(紅光)、band2(綠光)、band1(藍光)波段作為單波段遙感因子。在ArcGIS中使用“區域分析”中以“以表格顯示分區統計”工具提取特征單元對應遙感數據的反射率。

2)植被指數。在ArcGIS中利用字段計算器,進行植被指數計算。

歸一化植被指數:NDVI=(B4-B3)/(B4+B3)

比值植被指數:RVI=B4/B3

差值植被指數:DVI=B4-B3

式中:B4為高分1號影像的第4波段;B3為高分1號影像的第3波段。

2.3.2紋理特征

紋理特征主要體現遙感影像的紋理信息,主要包括均值(ME)、協同性(HO)、方差(VVA)、相關性(CO)、二階矩(SM)、相異性(DI)、熵(EN)、對比度(CT)。本文基于ENVI軟件選用二階概率統計的濾波方法,在3×3,5×5,7×7,9×9,11×11,13×13,15×15,17×17,19×19,21×21等9種窗口下分別提取GF-1各波段數據的紋理特征。

2.4 森林蓄積估測

選用多元逐步回歸方法、隨機森林算法構建森林蓄積量估測模型。

2.4.1特征變量分析

在多元逐步回歸建模過程中,參與擬合的自變量越多,建模精度將會提高,同時對建模無顯著影響的因子可能會引起共線性和數據冗余問題,從而影響估測結果。因此,對森林蓄積量和遙感因子進行相關性分析,根據決定系數R2、調整R2、精度檢驗指標等選取主要變量是線性回歸建模的關鍵。隨機森林的特征選擇方法屬于包裹法,可在訓練過程中輸出變量的重要性,并對特征變量重要性進行排序,即哪個特征變量對預測類更有用。經多次試驗確定決策樹數目和節點分裂時變量個數,代入隨機森林回歸模型,并利用回歸模型對驗證樣本進行預估[12-17]。

2.4.2窗口與樣地的匹配

濾波方法提取影像的紋理特征主要受窗口大小、X和Y變換值、選擇灰度量化級別等參數的影響。在提取影像紋理特征的過程中,設置X和Y變換值默認值為1和1,灰度量化級別默認值為64,對比設置3×3,5×5,7×7,9×9,11×11,13×13,15×15,17×17,21×21不同窗口。本研究樣地規格半徑為14.57m,面積667m2的圓形樣地,使用GF-1單波段遙感影像單個像元面積為2m×2m,以13×13的移動窗口取平均值,代表676 m2遙感特征值,與實測的圓形樣地面積尺度上可較好匹配。

2.4.3模型的構建與擬合效果

通過特征變量篩選、最佳窗口確定后,引入參與建模的遙感特征變量作為自變量,實測森林蓄積作為因變量,引入多元逐步回歸分析模型、隨機森林模型進行建模,并根據輸出的回歸分析中決定系數(R2)、均方根誤差(RMSE)、相對均方根誤差(rRMSE)、容差等參數對模型擬合效果進行評價。

3 結果與分析

3.1 多元逐步回歸模型

通過分析候選的光譜特征、紋理特征和蓄積量的相關性,從中挑選出相關性顯著的特征變量進行組合,采用多元線性回歸方法,建立森林蓄積量與各個光譜因子、紋理特征因子之間的多元回歸模型。隨著引入特征變量的增加,一方面提高了建模精度,另一方面也會引起共線性問題。當設置13×13的窗口,篩選引入特征變量為B3(紅光波段),DI2(第二波段相異性),EN2(第二波段熵),SM2(第二波段二階矩陣),CO3(第三波段相關性)時,擬合效果較好,R2增加到0.722,RMSE減少至36.305,容差為0.226,擬合效果如表3所示。

表3 不同因子多元逐步回歸模型擬合效果

本文基于3×3,5×5,7×7,9×9,11×11,13×13,15×15,17×17,21×21等9種不同窗口提取的遙感特征變量與森林蓄積量進行多元逐步回歸分析。實驗表明:篩選引入特征變量為B3,DI2,EN2,SM2,CO3,在3×3至13×13窗口區間,容差均大于0.1,R2呈遞增趨勢,RMSE隨之遞減;在13×13至21×21窗口區間,容差均大于0.1,R2呈遞減趨勢,RMSE隨著遞增。因此,在13×13窗口下,擬合精度最優,R2(0.722) 最高,RMSE(36.305m3/hm2)最小,擬合效果如表4所示。

表4 不同窗口多元逐步回歸擬合效果

遙感影像因分辨率不同對應像元面積也存在差異,GF-1單波段遙感影像單個像元面積為2m×2m,在遙感特征變量提取過程中,以13×13的移動窗口取平均值,代表676 m2遙感特征值,與樣地規格半徑為14.57m,面積667m2實測的圓形樣地面積尺度上可較好匹配,經過上述特征因子、窗口比選,多元逐步回歸森林蓄積量最優估測模型為:

y=-570.884+0.131x1-0.054x2+3.274x3+8.814x4-0.002x5

式中:x1為DI2;x2為B3;x3為EN2;x4為SM2;x5為CO3;y為樣地森林蓄積量。

3.2 隨機森林建模

本文提取的24個特征變量(表5),分別為光譜特征、紋理特征、歸一化植被指數、比值植被指數、差值植被指數,由特征變量的重要性大小排序(圖2)可知,光譜特征中B3(紅光波段)、紋理特征中SM3(第三波段二階矩陣)、DI2(第二波段相異性)、HO2(第二波段協同性)、ME3(第三波段均值) SM2(第二波段二階矩陣)、DI3(第三波段相異性)、EN2(第二波段熵)對蓄積估測影像較大。mtry和ntree為影響隨機森林建模效果2個較為重要的參數。mtry表示平均樹深,一般情況,默認設置為全部自變量數量的1/3;ntree表示模型默認會生成多少株樹,ArcGIS pro的默認值為100,本研究選擇100。

表5 遙感特征變量相關系數分析表

圖2 特征變量重要性排序

隨機森林模型精度也受窗口大小的影響,對比3×3,5×5,7×7,9×9,11×11,13×13,15×15,17×17,21×21等9種不同窗口提取的遙感特征變量與森林蓄積量進行隨機森林建模分析。實驗表明:當窗口設置為13×13時,模型的擬合效果最優,具有最大值R2(0.955),最小值RMSE(16.305 m3/hm2)。相同尺度窗口下,對比多元逐步回歸模型,隨機森林算法蓄積量估測模型擬合效果更好(表6)。

表6 不同隨機森林蓄積估測建模擬合效果

3.3 模型驗證

實際調查馬尾松樣地點共180個(其中訓練樣本120個,驗證樣本60個),其中訓練樣本與驗證樣本相互獨立,對比多元逐步回歸、隨機森林模型驗證樣本中實測值與預測值的散點圖擬合效果,2個模型的決定系數R2分別為0.722和0.955,隨機森林模型散點分布更靠近預測趨勢線,分布規則性更強,因此隨機森林模型擬合效果更優(圖3)。

圖3 不同預測模型散點分布圖

由上述模型中精度檢驗指標得出:隨機森林模型精度優于多元逐步回歸模型,多元逐步回歸模型參數(R2=0.722,RMSE=38.77,rRMSE=35.33%);隨機森林模型參數(R2=0.955,RMSE=17.31,rRMSE=14.15%),檢驗結果如表7所示。

表7 不同模型精度檢驗結果

4 結論與討論

1)優化了特征變量篩選組合方法。本文將提取的遙感特征因子作為特征變量,根據隨機森林建模中輸出變量的重要性進行排列,選取對建模貢獻較大的因子組合,采用多元逐步回歸方法,篩選擬合精度較優、共線性和數據冗余問題較小的因子作為特征變量。該方法減少了多元逐步回歸中因子組合迭代次數,也在一定程度上解決了因子間共線性和數據冗余問題,在因子篩選過程中發現紋理特征對森林蓄積建模精度更為敏感,最終選取DI2,B3,EN2,SM2,CO3作為建模特征變量。

2)有效解決了遙感特征提取單元與地面監測尺度匹配性問題。對比多元逐步回歸方法和隨機森林算法,構建3×3,5×5,7×7,9×9,11×11,13×13,15×15,17×17,21×21等9種窗口下蓄積估測模型,分析各窗口建模擬合精度指標,發現13×13窗口下擬合精度指標最優,且13×13的移動窗代表676 m2遙感特征值,與實測的圓形樣地面積667m2尺度上匹配性高。因此,尋求特征變量提取單元與地面監測單位對應最優尺度是本研究的創新點。

3)隨機森林模型擬合效果優于多元逐步回歸模型?;诓煌b感特征變量、不同窗口構建蓄積量估測模型,相比于多元逐步回歸模型,隨機森林建模的擬合效果、精度檢驗更優,適應性更強。選取DI2,B3,EN2,SM2,CO3作為建模特征變量,以13×13窗口建立蓄積估測模型,擬合效果和檢驗精度分別為多元逐步回歸模型(R2=0.722,RMSE=38.77,rRMSE=35.33%)、隨機森林模型(R2=0.955,RMSE=17.31,rRMSE=14.15%)。因此,選取適宜窗口、較為敏感的特征變量,隨機森林模型可提高建模精度。

4)本文主要考慮了光譜、紋理特征因子進行組合,而地形、環境因子等未參與建模分析。研究主要以GF-1遙感影像作為數據源,其它不同分辨率遙感影像對應的最佳建模窗口尺度需繼續深入分析研究。

猜你喜歡
樣地波段精度
四川省林草濕調查監測工作進展
基于不同快速星歷的GAMIT解算精度分析
數字化無模鑄造五軸精密成形機精度檢驗項目分析與研究
桉樹培育間伐技術與間伐效果分析
Ku波段高隔離度雙極化微帶陣列天線的設計
仁懷市二茬紅纓子高粱的生物量及載畜量調查
最佳波段組合的典型地物信息提取
新型X波段多功能EPR譜儀的設計與性能
最佳波段選擇的遷西縣土地利用信息提取研究
近似邊界精度信息熵的屬性約簡
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合