?

基于隨機森林協同克里金法的區域森林地上生物量制圖
——以粵北森林為例

2024-01-23 05:35周友鋒謝秉樓李明詩
關鍵詞:克里插值波段

周友鋒,謝秉樓,李明詩

(1. 南京林業大學林草學院、水土保持學院,南方現代林業協同創新中心,江蘇 南京 210037;2. 浙江省森林資源監測中心,浙江 杭州 310020)

森林是陸地生態系統的重要組成部分,是陸地上最大的碳庫,儲存了大約 80% 的地表碳和 40% 的地下碳,在全球碳循環中扮演重要角色[1-2]。森林地上生物量(aboveground biomass,AGB)是森林生態系統固碳能力的直觀表達,也是評估森林生態系統碳收支平衡的重要指標[3]。作為森林生態系統碳匯潛力評估的重要要素,如何快速、準確地獲取大尺度 AGB 信息對于宏觀掌握森林碳儲量及其分布,進一步制定公平合理的碳排放政策具有重要意義[4-5]。

隨機森林算法(random forest,RF)作為一種優秀的機器學習算法,近年來被廣泛應用于基于遙感數據的 AGB 制圖研究中。RF 所構建的模型屬于非參數模型,能夠應對 AGB 與遙感因子之間復雜的非線性關系[6-7]。而且它對訓練樣本中存在的噪聲敏感度低,能較好應對由于數據缺失所引起的精度降低問題,同時還能識別預測變量的重要性[8-9]。諸多的研究表明,RF 相較于其他機器學習算法和傳統統計回歸方法具有更高的預測精度[10-12]。而 RF 在預測 AGB 時只考慮了 AGB 與遙感因子間的關系,而忽略 AGB 制圖時鄰近觀測數據的空間自相關性[13-14]。將隨機森林與克里金法進行協同從而構建隨機森林/克里金方法框架(random forest Kriging,RFK)將能夠有效應對上述缺陷。此框架通過克里金插值法對RF預測的模型殘差值進行建模,以分離殘差項中的結構化成分(空間自相關的描述項),并將之疊加到隨機森林模型的預測結果上,從而達到改進制圖精度的目的[15]。在過去近10年內,RFK模型已經用于預測環境因子、土壤有機質、樹木材積等研究中,其預測精度均優于 RF 模型[13,16-17]。而在近兩年的 AGB 預測研究中也出現了這類方法,研究結果皆表明,RFK 模型在 AGB 預測中是可行的。Chen 等[18]和 Silveira等[19]分別在大興安嶺地區和大西洋沿岸熱帶山地森林區域,采用 RFK 模型對 AGB 進行預測,所得到的預測精度及各項誤差指標均優于 RF 模型。

然而,上述研究所使用的克里金插值法均為普通克里金插值法(ordinary Kriging,OK),它是最常用于區域化變量的最優無偏插值,但在環境復雜的地區預測能力有限[20]。協同克里金插值法(Co-Kriging,CK)是 OK 的一種擴展方法,通過添加一個或多個協變量,能夠考慮多個變量之間的相關關系,因而可提高空間插值的精度效果[21-22]。目前已有的研究多為基于多源遙感數據,利用隨機森林普通克里金(random forest ordinary Kriging,RFOK)模型對 AGB 進行預測,很少有利用隨機森林協同克里金(random forest Co-Kriging,RFCK)模型進行AGB 制圖研究的案例。因此,本研究采用國家連續清查野外樣地調查數據,Landsat 5 TM 數據、ALOS-1 PALSAR-1 數據和 STRM DEM 數據,利用 RFCK 模型來執行 2012 年廣東省北部亞熱帶森林 AGB 的制圖任務。期望本研究提出的方法和制圖結果,可以為我國南方森林增匯和可持續森林管理實踐發展提供技術參考。

1 材料與方法

1.1 研究區概況

研究區位于廣東省北部(112.74°~115.09°E,23.59°~25.51°N),主要包括韶關、清遠和河源等市(圖 1)。研究區的氣候屬于亞熱帶濕潤季風氣候,年平均降水量為 1 300~2 400 mm,年平均氣溫達18~21 ℃ ,水熱條件優良,適合植被生長。海拔 10~1 710 m,地形起伏大,以山地和丘陵為主。研究區內森林資源豐富,植被群落類型復雜多樣,涵蓋了亞熱帶地區典型的植被群落類型。研究區屬于典型的人工林區域,經常性的森林采伐和更新事件廣泛存在[23],林分年齡時空異質性較高,便于 AGB 估算模型的構建與性能評價。樹種多為常綠速生樹種,優勢樹種包括杉木(Cunninghamialanceolata)、毛竹(Phyllostachysedulis)、馬尾松(Pinusmassoniana)、桉樹(Eucalyptusrobusta)等。

底圖審圖號:GS(2019)3333。圖1 研究區樣地點分布STRM 影像(上)及研究區縮略圖(下)Fig. 1 The field sampling sites STRM image (upper) and overview map (lower)

1.2 數據來源及預處理

1.2.1 遙感數據

本研究所使用的遙感數據主要包括2011 的 Landsat 5 TM 數據、2010 年的 ALOS-1 PALSAR-1 數據和 30 m 分辨率的SRTM DEM 數據,以上數據的投影坐標系均為WGS 1984 UTM Zone 49N。其中,Landsat 5 TM 和 SRTM DEM 數據來源于 USGS EROS 數據中心(https://glovis.usgs.gov/);ALOS-1 PALSAR-1 數據來源于日本宇宙航空研究開發機構(JAXA)。

Landsat 5 TM自 2011 年 11 月起停止采集影像,于是下載了鄰近年份的 Landsat 5 TM 影像,并處于植被生長旺季內(采集時間為 2011 年 8 月 20 日)且含云量最小。并對之進行幾何校正、輻射定標和大氣校正以及地形校正等預處理操作。

由于 Landsat 5 TM 僅能采集森林冠層的平面信息,在高郁閉度森林內易發生光譜飽和現象[24]。因此本研究引入 ALOS-1 PALSAR-1 數據,其長波信號對森林冠層具有一定的穿透力,能在一定程度上降低飽和效應[25]。ALOS-1 PALSAR-1 數據自 2011 年 4 月起停止采集,故本研究采用鄰近年份 2010 年的影像數據,數據產品等級為 Level 1.1,包括 HH 和 HV 雙極化信息,空間分辨率為 25 m。從影像中提取振幅數據,利用公式(1)將其轉換為后向散射系數(σ0):

(1)

式中:ND為 HH 和 HV 后向散射體的振幅數值;FC為絕對校準因子,為 -83 dB[26]。然后,對轉換為后向散射系數的 HH 和 HV 影像執行 7×7 窗口的 Lee 濾波操作以減少散斑噪聲。最后將之重采樣為 30 m 分辨率,以匹配 Landsat 5 TM 數據。

1.2.2 樣地數據

本研究所使用的樣地數據為 2012 年的國家森林連續清查數據,來源于廣東省森林資源監測中心。預處理過程如下:首先利用廣東省森林資源監測中心發布的該地區各樹種的異速生長方程[27](表 1),計算出連續清查數據的樣地 AGB 觀測值,單位為t/hm2;之后,對原始的 290 個樣地 AGB 觀測值進行質量控制。

表1 研究區內優勢樹種的異速生長方程

將遙感影像中被云及陰影所覆蓋的樣地點排除,對速生樹種(如桉樹)的樣地 AGB 通過生物量隨林齡增長模型進行修正[28],再利用3倍標準差法剔除離群值,共剩下 245 個有效樣點。最后,對剩余的有效 AGB 觀測值依數值大小進行分層抽樣,提取 80% 作為訓練數據,剩余 20% 作為驗證數據。245 個有效樣點依據林分類型劃分的 AGB 分布狀況如表 2 所示。

表2 有效樣點 AGB 分布狀況

1.3 特征變量提取

對于 Landsat 5 TM 數據,通過對影像進行多種光譜特征變換、紋理信息提取以及波段組合運算,提取了共 80 個特征變量,包括植被指數、纓帽變換指數、主成分、紋理測度、原始單波段和波段組合。植被指數包含歸一化植被指數(NDVI),差值植被指數(DVI),比值植被指數(RVI),大氣阻力植被指數(ARVI),增強植被指數(EVI),土壤調節植被指數(SAVI);纓帽變換指數包含亮度(brightness)、綠度(greenness)與濕度(wetness);主成分為包含了 95% 以上原始影像光譜信息的第1主成分(PC1)、第2主成分(PC2)與第3主成分(PC3);紋理信息則通過基于灰度共生矩陣的紋理測度進行提取,其在刻畫森林空間分布形態上是有效且重要的[29]。對第1主成分(PC1)采用 8 個紋理測度,包含均值(mean)、方差(variance)、均勻性(homogeneity)、對比度(contrast)、相異性(dissimilarity)、熵(entropy)、二階性(second moment)、相關性(correlation)。紋理測度提取時的滯后距離為1個像元,方向為右下,移動窗口大小為 3×3,5×5,7×7,9×9;原始波段包括 B1—B7(不包含熱紅外波段)6個波段,同時將對應波段的反射率倒數作為備選變量,即 TM1_1,TM2_1,……,TM7_1;波段組合是對原始影像信息的組合,不同的波段組合會凸顯不同的影像特征從而豐富影像信息,且部分波段組合對 AGB 相關性較高[30]。本研究提取 Landsat 5 TM 影像每個原始波段的地表反射率與其他 5 個波段反射率的比值,如 TM 75,即 B7/B5,共 30 個作為波段組合變量。

從 PALSAR-1 數據中提取的變量包括 HH 和 HV 的后向散射系數、HH/HV 和雷達森林退化指數(RFDI)[31]。此外,通過同樣的方式提取 HH 和 HV 極化數據 4 個移動窗口大小(3×3,5×5,7×7,9×9)的8 個紋理測度。

另外,考慮到地形因子對植被生長有所影響,故本研究也從 STRM DEM 數據中提取坡度(slope)、坡向(aspect)、粗糙度(roughness)等地形因子作為建模備選變量。

1.4 隨機森林克里金建模

1.4.1 隨機森林建模

RF是一種基于決策樹的分類和回歸算法,通過多次 bootstrap 抽樣獲得多個隨機樣本,并通過這些樣本分別建立相對應的決策樹,從而構成隨機森林。該方法適用于解決分類和回歸問題,對于回歸問題,取所有決策樹預測結果的均值作為最終預測結果。本研究使用 R 語言中的 ‘randomForest’ 軟件包來實現 RF 的建模過程。RF 有兩個重要參數,分別為表示輸入變量數量的mtry和代表決策樹數量的ntree。mtry默認為數據集中變量數的二次方根(分類模型)或1/3(回歸模型);ntree值是通過在模型誤差相對穩定的情況下,經過不斷測試能獲得多少個決策樹來確定的。本研究 RF建模所設定的參數值為:mtry= 3,ntree= 500。

本研究所提取的特征變量較多,需要對變量進行篩選,選取與AGB相關性較高的變量進行建模。使用randomForest包中的important命令進行變量重要性分析,通過2個指標均方誤差百分比增加量(%IncMSE)與節點純度增加量(IncNodePurity)來評估每個變量對建模性能的貢獻。%IncMSE與IncNodePurity值越大,表明對應的預測變量的重要性越強[23]。為了保證各變量對 RF 模型的綜合代表性,同時降低模型計算的復雜度,以 IncNodePurity 中前 25% 的變量為基礎,若這些變量在 IncMSE% 中排名前 10,則選取作為建模變量,進行 AGB 預測。

1.4.2 克里金插值法

克里金插值法是一種用于空間插值的地統計學方法,可用估計的預測誤差來評估預測的質量,所輸入的數據集需要滿足正態分布假設。本研究采用的克里金插值法包括 OK 和CK 兩種方法。OK 以變異函數理論和結構分析理論為基礎,它通過基于區域化變量的變異函數生成最優無偏估計[32]。計算如下:

(2)

式中:ROK(x0)為通過 OK 得到的殘差預測值,n是用于插值的樣點數量,Wi是點i的加權系數,可根據最優無偏估計原理與拉格朗日最小化原則確定[33],R(xi)是樣地點i的殘差值。

CK是 OK 的一種擴展方法,通過添加一個或多個協變量,考慮了多個變量之間的相關關系,可提高結構化成分的預測精度。由于研究區位于廣東北部山區,AGB 空間分布受地形因素影響較大[19]。因此,本研究選擇高程作為協變量。CK 的插值公式如式(3)所示:

(3)

式中:RCK(x0)為通過 CK 得到的殘差預測值,R1(x1i)為樣地點i的殘差值,W1i為樣地點i殘差權重,R2(x2j)為樣地j的高程,W2j為樣地j的高程權重,N1為訓練樣本個數,N2為高程樣本點個數,其中N1≥N2。

克里金法用變異函數測定空間自相關要素。變異函數描述的是區域化變量空間變化的特征和強度,可表示為隨著距離增加,兩樣點間半變異函數值或協方差函數值的變化情況。變異函數可供擬合模型較多,本研究采用地統計學軟件 GS+ 進行變異函數擬合模擬,選擇最優擬合模型。GS+ 所提供的擬合模型有指數函數(exponential)、球面函數(spherical)和高斯函數(Gaussian),所采用的評價指標為決定系數(R2)與殘差平方和(RSS)。擬合模型的R2越大,RSS 越小,擬合性能越好。變異函數的3個模型參數是塊金(nugget)、變程(range)和基臺(sill)。塊金是距離為 0 時的變異函數值,表示測量或分析誤差;變程是變異函數值穩定時的距離,即與空間自相關距離相對應;基臺是變異函數的最大值。塊金效應是塊金值與基臺值的比值,能夠描述空間自相關性的強弱,塊金效應越小,空間自相關性越強[34]。

1.4.3 隨機森林克里金模型

RFK模型的實現步驟分為2步:①通過 RF 建模,得到 AGB 預測值;②通過克里金插值法分離殘差中的結構化成分,并將之疊加到隨機森林模型預測值上[式(4)]。RF 模型預測殘差值通過公式(5)計算得到。

R(xi)=BBF(xi)-B(xi);

(4)

BRFOK/RFCK(xi)=BRF(xi)-ROK/CK(Xi)。

(5)

式中:R(xi)是樣地點i的殘差值,B(xi)是樣地點i的AGB觀測值,BRF(xi)是基于 RF 模型的樣地點i的AGB預測值,BRFOK/RFCK(xi)是通過 RFOK 或 RFCK 模型得到的 AGB 預測值,ROK/CK(xi)是樣地點i通過 OK 或 CK 得到的殘差預測值。

1.5 模型精度評價

使用決定系數(R2)[式(6)]、平均絕對誤差[MAE,式中記為σ(MAE)][式(7)]、均方根誤差[RMSE,式中記為σ(RMSE)][式(8)]指標量化模型的性能。采用式(9)計算 RFOK 模型和 RFCK 模型相對于 RF 模型的相對改進指數(relative improvement)[RI,式中記為σ(RI)],評估模型的改進效果。公式如下:

(6)

(7)

(8)

(9)

2 結果與分析

2.1 隨機森林模型構建

構建 RF 模型首先要求優選特征變量,為RF模型中變量重要度排序結果見圖2,選擇了如下 10 個建模參數:HV、HVcorrelation99、mean99、TM75、TM57、TM53、TM35、TM21、TM12、B2??傮w而言,Landsat 5 TM 數據的原始波段和波段組合占了建模變量的很大比例。而紋理信息變量(例如:HVcorrelation99 和 mean99)重要度排序較高,對 AGB 預測也有一定影響。

以上述 10 個建模參數構建 RF 模型,同時通過訓練集進行模型訓練?;谟柧毤A測 AGB 和實測 AGB 間的R2為 0.96,MAE 為15.77 t/hm2,RMSE 為 19.98 t/hm2,表明模型的擬合效果優良。

B1、B2、B3和B7表示Landsat 5 TM影像1號、2號、3號與7號波段的地表反射率;TM12、TM13、TM15、TM21、TM24、TM31、TM34、TM35、TM42、TM51、TM52、TM53、TM57、TM74、TM75表示Landsat 5 TM影像某一波段地表反射率與另一波段地表反射率的比值,如TM12,即B1/B2;TM1_1、TM2_1、TM3_1和TM7_1表示Landsat 5 TM影像1號、2號、3號與7號波段地表反射率的倒數;PC1和PC3表示Landsat 5 TM影像的第1主成分與第3主成分;RVI和ARVI分別表示比值植被指數與大氣阻力植被指數;Brightness表示Landsat 5 TM影像通過纓帽變換得到的亮度值;mean77、mean99和correlation99分別表示基于PC1采用7×7窗口得到的均值紋理特征,采用9×9窗口得到的均值與相關性紋理特征;HH和HV表示PALSAR-1 HH與HV極化信息的后向散射系數;HHcorrelation55和HHcorrelation77分別表示HH采用5×5與7×7窗口得到的相關性紋理特征;HVmean55、HVmean77和HVmean99分別表示HV采用5×5、7×7與9×9窗口得到的均值紋理特征;HVcorrelation77和HVcorrelation99分別表示HV采用7×7與9×9窗口得到的相關性紋理特征。B1, B2, B3 and B7 represent the surface reflectance of Landsat 5 TM images at bands 1, 2, 3 and 7. TM12, TM13, TM15, TM21, TM24, TM31, TM34, TM35, TM42, TM51, TM52, TM53, TM57, TM74 and TM75 represent the ratio of surface reflectance in one band of Landsat 5 TM image to that in another band, such as TM12, that is B1/B2; TM1_1, TM2_1, TM3_1 and TM7_1 represent the reciprocal of surface reflectance in bands 1, 2, 3 and 7 of Landsat 5 TM images. PC1 and PC3 represent the first principal component and the third principal component of Landsat 5 TM images. RVI and ARVI represent ratio vegetation index and atmospheric resistance vegetation index, respectively. Brightness indicates the brightness value of Landsat 5 TM images obtained by hat transformation. mean77, mean99 and correlation99 indicate the mean texture features obtained in 7×7 window size based on PC1, and the mean value and correlation texture features obtained in 9×9 window size, respectively. HH and HV represent the backscattering coefficients of HH and HV polarization information of PALSAR-1. HHcorrelation55 and HHcorrelation77 indicate the correlation texture features obtained in the 5×5 and 7×7 window sizes of HH, respectively. HVmean55, HVmean77 and HVmean99 represent the mean texture features obtained by HV using 5×5, 7×7 and 9×9 window sizes, respectively. HVcorrelation77 and HVcorrelation99 indicate the correlation texture features obtained by HV using 7×7 and 9×9 window sizes, respectively. 圖2 RF 中變量重要度排序結果Fig. 2 The importance ranking of the variables for AGB mapping by using RF model

2.2 隨機森林預測殘差分析

對隨機森林預測殘差進行統計分析,得到殘差的范圍為-59.73~39.64 t/hm2,均值為 0.53 t/hm2,標準差為20.04 t/hm2,絕對峰度值為3.50(接近 3),絕對偏度值為0.89(接近 1),說明殘差近似服從正態分布。因此,符合進行克里金插值的前提假設,可以對 AGB 預測殘差進行隨后的克里金插值分析。

OK和 CK 的變異函數模型模擬結果及相關參數見圖3及表3。依據 GS+ 建模的結果,在 OK 和 CK 方法下,高斯函數模型擬合效果略優于其他兩個模型,最終作為 OK 和 CK 最優擬合變異函數模型??傮w而言,CK 的變異函數模型擬合性能優于 OK 的模型,前者的R2更大,RSS 更小(表 3)。圖4是依式(2)和式(3)建立的殘差空間插值結果。CK 較 OK 具有更大的殘差預測范圍,OK 的殘差插值范圍為-19.61~19.38 t/hm2,CK 的范圍則為-28.72~21.37 t/hm2。此外,本研究還通過布設 100 個隨機點提取得到不同海拔區間的平均插值結果。OK 和 CK 在低海拔區域(34~300 m)的平均插值結果分別為 1.24 和 2.09 t/hm2,在中海拔區域(301~600 m)為 0.13 和 0.30 t/hm2,而在高海拔區域(601~1 158 m)則為-0.45 和-2.01 t/hm2??梢?在3個海拔區域中,通過分析 AGB 高程空間位置關系,CK 相比 OK 均分離了更多殘差項中的結構化成分,所得到的殘差插值效果更好。

表3 OK 和 CK 的變異函數擬合模型及其參數

圖3 基于 OK 和CK的殘差變異函數模擬Fig. 3 The variogram simulation of residuals derived from OK and CK models

圖4基于OK和CK的殘差插值結果和各模型生成的AGB專題圖Fig. 4 The inter polated spatial patterns of residuals derived from OK, CK models and AGB patterns derived from the models

2.3 RFOK和RFCK模型精度分析

依據式(5),從RFOK模型和RFCK模型構建改進后的AGB預測值(圖5)。如圖5所示,在模型的泛化能力方面,RFCK模型的AGB預測范圍為0.48~165.76 t/hm2,略高于RF和RFOK模型。3個模型的AGB預測值在高海拔的山地區域都較大,且呈現由西北往東南增多的趨勢。用20%的獨立樣本進行驗證,結果如下:RFCK模型的RI值為0.08,R2由0.46增加到0.57,MAE由27.28減少到25.12 t/hm2,RMSE由32.48減少到29.80 t/hm2。RFOK模型的RI值為0.03,R2由0.46增加到0.51,MAE由27.28減少到26.63 t/hm2,RMSE由32.48減少到31.58 t/hm2。兩種改進模型的精度評價表現均優于RF模型,且RFCK模型較RFOK模型更勝一籌。圖5展示了RF模型的驗證數據集R2在0.46左右,擬合線(虛線)與1∶1線有較大差異,存在比較明顯的低值被高估,高值被低估的現象,但是這種現象隨著針對預測誤差的空間插值技術的引入而得到一定程度的減弱。

圖5 模型驗證時 AGB 觀測值與預測值的散點圖Fig. 5 Scatterplots of the observed AGB and the predicted AGB when validating the models

3 討 論

根據重要度排序結果,本研究選擇了 10 個變量進行 RF 建模。其中,與兩個短波紅外波段(B5、B7)反射率的波段組合占據很大比例。Landsat 5 TM 的B5與B7波段的反射率與植被水分含量有關,在夏季多雨的亞熱帶地區分辨植被較為有利,而通過設置與其他波段的比值更能夠使原始波段上不易區分的植被能夠識別[35]。HVcorrelation99和mean99與AGB有較高相關性,這與部分研究的特征優選結果是一致的[36],表明在林分結構復雜的亞熱帶森林區域引入紋理信息進行AGB估測是可靠的。另外,由PALSAR-1數據發展的特征變量(后向散射系數HV等)在AGB估測上也有貢獻,這主要由于PALSAR-1數據的長波信號能夠穿透冠層,獲取植被AGB的主體——樹干的信息。

本研究的結果表明,結合了殘差插值結果的RFOK與RFCK模型較RF模型具有更高的AGB制圖精度,低值高估和高值低估的現象在一定程度上得到改善,各項精度指標均優于RF模型,同時也優于部分亞熱帶地區AGB估測研究結果[11,21]。但本研究不足在于RFOK模型與RFCK模型的RI分別為0.03和0.08,精度改進效果不高。以往有關RFK模型在AGB預測應用的研究,最高RI值均能夠達到0.10以上,本研究結果與之相比偏低[18-19],這與本研究AGB殘差空間自相關性較低有關。本研究OK和CK變異函數模型的塊金效應值較高,均在0.9以上。而之前有關土壤特性的研究結果表明,當塊金效應值低于0.6[13],其精度提升效果十分顯著。這也表明相比土壤特性,AGB預測殘差受空間地理位置分布關系的影響并不大。而就數據源而言,一方面本研究采用的遙感數據包括Landsat 5 TM 和PALSAR-1數據。前者易存在光譜飽和現象,后者雖能減弱飽和現象,但飽和點通常在 150 t/hm2左右,在本研究研究區內的高 AGB 區域作用相對有限[26]。另一方面可能與 RF 模型的建模變量結合了Landsat 5 TM 和 PALSAR-1 數據,而非單一數據源有關[18]。此外,還可能與本研究遙感數據與樣地數據時間不匹配有關。本研究所使用的 Landsat 5 TM 數據為 2011 年,PALSAR-1 數據為2010年,而樣地數據則為 2012 年。研究區內部分樣地屬于灌木林、幼齡林與跡地,且樹種多為速生樹種。雖然本研究對這些樣地進行了部分修正,但這些樣地的遙感數據信息與實際樣地信息顯然仍有差距。這一方面部分解釋了 RF 模型的過擬合現象,另一方面可能對于殘差數據的空間自相關性有所影響。

RFCK模型通過將高程作為協變量,除考慮 AGB 距離與方位間的關系外,還將 AGB高程間的空間關系考慮在內,相比 RFOK 模型所得到的變異函數擬合效果更好,空間自相關性更強,這與其他有關 CK 的研究結果是一致的[20,22]。從結果上看,相較 RFOK 模型,RFCK 模型在本研究中高海拔區域(如西北、中部及東南區域)和低海拔地區(如東北、南部區域)的插值效果更好。相對應地,RFCK 模型在刻畫 AGB 空間分布模式的效果時也要優于 RFOK 模型,輪廓更加清晰。RFCK 模型在山地和平原的分布情況更加接近實際情況,特別是山地區域,這也說明飽和效應得到進一步削弱。因此在具有高 AGB 的亞熱帶山地區域,相比傳統的 RF 和隨后改進的 RFOK 模型而言,RFCK 模型更加適合用來進行亞熱帶山地區域森林 AGB 制圖,若結合長時間序列數據進行分析,能夠更好掌握當地桉樹、松樹等人工林與天然林的生長健康狀態與森林碳儲量動態分布情況,以評價當前森林經營撫育措施是否合理,有助于進一步制定針對性強的森林經營方法和公平合理的碳排放政策,增強森林生態系統綜合效益。

雖然 RFCK 模型的 AGB 預測精度優于 RFOK 模型,但是精度提升的效果并不明顯,這可能與本研究只采用了一個協變量有關。如果在選取協變量時,僅僅選取一個與目標變量相關性較高的因子,則不能全面反映協變量的信息,預測效果提升有限[20]。因此未來的研究可考慮添加多個協變量,以充分發揮 CK 的優勢。同時可通過主成分分析法選取協變量,以應對 CK 在插值時協變量較多造成計算復雜度增加,而協變量較少引起插值精度降低的問題[22]。另外,RFCK 模型雖然能降低 RF 模型的過擬合現象,但是 RFCK 模型的過擬合依然存在。RF 模型出現過擬合,與訓練數據中存在噪聲有關,而本研究中的樣地數據恰恰有此問題。因此,除了上述通過優選協變量進行改進,也可對 RF 模型訓練時的樣地數據進行優化減少噪聲,抑或增大研究區,擴大數據量來削弱模型過擬合現象。

本研究以 Landsat 5 TM、PALSAR-1 遙感影像數據為主要數據源,并且結合國家森林連續清查數據,比較了 RF、RFOK 與 RFCK 模型在 AGB 預測中的效果,同時比較了 RFOK 與 RFCK 模型相較于 RF 模型的預測精度改進水平??傮w而言,以高程作為協變量的 RFCK 模型對 AGB 的預測效果更好,其次是 RFOK 和 RF 模型,且 RFCK 模型的精度改進效果也優于 RFOK 模型,能更好地描繪實際 AGB 的分布情況,特別是在山地區域。本研究所獲得的高精度亞熱帶大區域 AGB 專題圖,有助于了解當地 AGB 分布情況,為政府制定與完善相關政策提供依據,并為早日實現碳達峰與碳中和目標打下基礎。

猜你喜歡
克里插值波段
今晚不能去你家玩啦!
我可以咬一口嗎?
你今天真好看
基于Sinc插值與相關譜的縱橫波速度比掃描方法
你今天真好看
M87的多波段輻射過程及其能譜擬合
一種改進FFT多譜線插值諧波分析方法
基于四項最低旁瓣Nuttall窗的插值FFT諧波分析
日常維護對L 波段雷達的重要性
基于SPOT影像的最佳波段組合選取研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合