?

母質與土地利用類型對土壤光譜反演模型的影響①

2016-04-25 07:37鄔登巍張甘霖
土壤 2016年1期
關鍵詞:母質光譜

鄔登巍,張甘霖*

(1 土壤與農業可持續發展國家重點實驗室(中國科學院南京土壤研究所),南京 210008;2 中國科學院大學,北京 100049)

?

母質與土地利用類型對土壤光譜反演模型的影響①

鄔登巍1,2,張甘霖1,2*

(1 土壤與農業可持續發展國家重點實驗室(中國科學院南京土壤研究所),南京 210008;2 中國科學院大學,北京 100049)

摘 要:用可見光近紅外(Vis-Near Infrared,VNIR)光譜建立的土壤反演模型可以快速高效測定土壤某些屬性,但不考慮土壤自身特點的純統計模型反演的精度會受到制約。本文研究了母質和土地利用類型對土壤光譜反演模型建立的影響。研究所用集合為SF(安徽宣城的林地樣品)、SP(安徽宣城的水田樣品)、DP(安徽定遠的水田樣品),結果顯示:母質和土地利用類型的差異會顯著影響異地模型的適應性,一個地區建立的反演模型不可隨便用于母質和土地利用類型不同的其他地區;當異地模型不適用于反演時,可考慮采用精度稍低的全局模型進行預測。

關鍵詞:母質;土地利用類型;光譜;可見光近紅外

可見光-近紅外光譜能夠快速、高效、無損測定土壤某些屬性,但建立精度符合要求的土壤光譜反演模型一直是具有積極現實意義的挑戰性工作。一些研究考慮到土壤類型會影響到其光譜特征而將土壤分類的概念引入到土壤光譜的分析研究[1-5],并從光譜的角度對土壤進行分類或歸納[4-7],其中有的是純粹從光譜的差異來進行土壤分類[6],有的則加入了其他的協變量,如氣候變量、地形變量[8]。

光譜模型的建立涉及建?;貧w算法、土壤屬性以及不同研究區域等[1,10-12],研究表明本地光譜模型的預測精度總高于異地模型。有研究認為母質會顯著影響土壤光譜特征,考慮了土樣背景的光譜反演模型將更具解釋性[13]。但除母質外,影響土壤屬性和土壤光譜特征的因素還有土地利用、生物和時間等[9],目前綜合考慮母質和土地利用類型對光譜模型影響的報道尚甚少。為此,本研究嘗試以土壤有機質(SOM)為目標屬性[11,14-16],選擇母質和土地利用類型不同的樣品,分析母質和土地利用類型對光譜反演模型建立的影響。

1 材料與方法

1.1 樣品信息

本研究采用控制變量的思想,挑選 3 個目標集合為研究對象,樣品信息如圖 1 所示。3 個集合中SF、SD 和 DP 分別為安徽宣城的林地樣品、安徽宣城的水田樣品和安徽定遠的水田樣品,SF 的母質主要是第四紀紅黏土以及巖類風化形成的坡積物或殘積物,SP 的母質為上述物質經過河流搬運形成的沖積物和河湖相沉積物,DP 的母質則多是黃土類物質的河流沖積物。

為盡可能避免樣品數量對建模結果的影響,選擇相近個數的樣品為目標,最終 3 個集合中分別包含了25、22 和 22 個土壤剖面,實際調查剖面位置是依據宣城和定遠的第二次土壤普查資料[13]中土種的典型剖面位置確定,挖掘土壤剖面(寬 1.2 m × 深1.2~1.5 m × 長 3~3.5 m),劃分發生層,按發生層進行采樣,合計分別包含了 106、107 和 108 個發生層樣品。

1.2 理化屬性和光譜數據測定

土樣經室內風干、去雜、研磨過0.15 mm篩后用于測定,其中土壤有機質(SOM)測定采用重鉻酸鉀-硫酸硝化法[17]。使用Cary 5000分光光度計采集光譜數據,波段范圍為350~2 500 nm,步長為1 nm。測量前,將過0.15 mm篩的樣品于45℃烘箱中烘干24 h,然后置于干燥器中待測。用Cary 5000配套樣品池進行制樣,即將適量樣品放在樣品池中即可采集光譜數據。經獨立實驗重復檢驗,由于樣品池法的測量精度高,重復測量數據穩定,因此本研究采用樣品池法進行土壤光譜采集。

1.3 建模方法及模型評估方法

1.3.1 光譜吸收強度提取 1 400、1 900、2 200 nm為羥基吸收峰,是礦物的主要吸收峰,也是土壤光譜在可見光近紅外(Vis-Near Infrared,VNIR)波段最主要、最明顯的吸收波段,其信息對光譜解析和建模具有重要意義[18]。提取1 400、1 900及2 200 nm波段的吸收強度值的具體步驟包括:①將光譜反射率通過log(1/R)轉化變為光譜吸收率。②通過對數據的觀察后確定,在1 350~1 450、1 850~2 050、2 130~2 250 nm波段范圍內作光譜基線校正。校正類型為線性消去兩端數值,即以兩個端點為依據擬合線性的基線,然后將原吸收率減去基線值,于是兩端的數值為零。③在基線校正后,以各波段吸收峰處的最大值為波段的吸收強度值。

1.3.2 數據分析 主成分分析PCR(Principal Component Analysis)和偏最小二乘回歸PLSR(Partial Least Squares Regression)多用于分析光譜數據。本研究用PCR計算光譜數據主成分,得到每個樣品的光譜數據對應的PC_SCORE;用PLSR對光譜數據和SOM數據間建立回歸模型。使用R2和RMSE為衡量統計模型的統計量。數據運算在UMSCRAMBLER中完成。

圖1 采樣區位置示意圖Fig.1 Sampling regions

2 結果與分析

2.1 有機質含量分析

3個樣品集合的SOM含量統計信息如圖2所示。結果顯示:①SF為林地樣品,由于多年枯枝落葉和根系腐解的影響,其SOM總體上比SP(水田樣品)高。②SP和DP雖同為水田,但SP經歷了長期的雙季稻輪作,DP則是長期的小麥-晚稻輪作,總體上SP的秸稈和根系還田生物量相對較高,土壤濕度也相對較高,均有利于SOM的積累,導致SP的SOM含量相對高于DP。

圖2 土壤有機質含量Fig.2 Descriptions of SOM contents of studied soil samples

2.2 光譜特性分析

對3個樣品集合的光譜曲線在1 400、1 900和2 200 nm附近的吸收峰強度進行提取,由于3個波段吸收峰強度信息維度為1,即相關性很大,所以在結果展示中只選用了1 400 nm和2 200 nm兩個波段的結果,如圖3所示。在1 400、2 200 nm波段的吸收強度比值有兩個特點:一是每個集合中的點都沿著一條直線分布;二是SF和SP集合所沿直線的斜率相近,而DP則與兩者的斜率相差較大。

不同母質樣本的吸收峰強度信息沿不同斜率的直線分布,證明不同母質發育成的土壤由于其母質中礦物類型及其組成的差異,會使其形成的土壤在1 400、1 900和2 200 nm處展現出不同的吸收特征,而這一特征在經過吸收強度提取后,可以通過如圖3的散點圖的形式來表現。

除了特征吸收峰的吸收強度分析,常見的對土壤光譜的分析還有PCA。在對原始光譜進行重采樣預處理后,將其進行PCA分析,主成分1和主成分2的分數圖見圖4。PCA結果有兩個特點:一是SF和DP的點有較明顯的界線,而SP則與SF和DP集合都有交集;二是圖中粗黑線框點SP-AVG、SF-AVG、DP-AVG分別代表SP、SF和DP對應集合中所有點的平均值,SP與DP的均值點非常接近,SF的均值點與SP、DP均值點距離較遠。

圖3 1 400 nm 和 2 200 nm 附近吸收強度提取結果Fig.3 Extraction results of absorption near 1 400 nm and 2 200 nm

圖4 光譜數據PCA結果Fig.4 PCA results of spectral data

主成分是以在原變量基礎上通過線性組合得來的新變量,目的是降維,以盡可能少的變量來表達盡可能多的變量信息。通常前兩個變量能解釋原變量80% 以上的信息。由此,主成分1表達的是最共性、最概括的信息,主成份2次之。土壤VNIR光譜的整體反射率與SOM含量相關,而PC_1、PC_2代表樣本最共性的信息,所以PC_1、PC_2攜帶很多的關于SOM的信息。

SP 與 DP 均是水田樣品且 SOM 均值相近,無論是有機質的組成形式和含量都比 SF 更接近,所以在 PCA 分析中,SP 和 DP 分布比較接近。

由吸收強度和 PCA 的分析結果可知,土壤光譜對礦物和 SOM 的響應可以不同的形式得到顯示,當集合中存在不同母質或不同土地利用類型的土壤時,可能會能以某種形式在光譜中顯示出其分異,在建立反演模型時應考慮相應的策略。

2.3 光譜反演模型分析

對于光譜數據的建模算法有過不少研究,即對于同一組光譜數據和屬性數據,用不同的算法進行建模,在統一對比參數的基礎上(通常是R2、RMSE等統計參數)將各種算法得到的結果進行對比,如MLR、PLSR、PCR、MARS、SVM、RF、BT和ANN等,或者兩種算法的聯用等[1,10-12]。研究表明,PLSR的綜合運算能力最高,且沒有一種算法能夠在大多數的光譜反演運算中超過PLSR,其雖然是一種經典、不復雜的算法,但在土壤光譜反演中是最穩定和可靠的,故本研究仍選用PLSR。

2.3.1 模型建立 在PLSR的運算過程中,主成分個數根據變量的特點會有所不同。本研究首先對各個數據集在不同主成分個數下的模型精度參數進行了統計(圖5)。結果顯示,3個獨立集合與一個3合1的混合集合,分別在1~20個主成分的設置下進行回歸運算,在10~15個主成分的時候4個集合都達到最佳回歸結果。按照回歸精度排序依次為SF>SP>SF+SP+DP>DP,建模R2分別為0.94、0.89、0.87、0.84,其中SF集合得出的模型回歸精度最高,DP集合的最低。

2.3.2 獨立模型驗證 為驗證各個獨立模型的預測精度,用以下兩種方法進行計算:一是留一交叉驗證(leave-one-out validation),另一種是用異地模型對SOM含量進行反演預測。留一交叉驗證的結果可表示在母質、土地利用類型等屬性與建模集樣本最大程度上相似的情況下得到的預測結果,也可理解為在最理想的采樣情況下所能得到的預測精度;異地模型驗證是用一個地方的模型對另一地方的樣品進行反演預測。圖6是留一交叉驗證的結果,與建模時的精度排序一樣,留一交叉驗證的結果排序為SF>SP>SF+SP+DP>DP,其中R2分別為0.90、0.82、0.81、0.75,RMSE(g/kg)分別為2.35、4.54、3.75、3.03。如果能在光譜庫中依照母質、土地利用類型對應的樣品形成樣本數相當的樣品集,則最終最優的結果就是如此。

圖5 主成份個數對模型精度的影響Fig.5 Effects of principle component numbers on model accuracies

圖6 預測值與測量值的散點圖(驗證方法為留一交叉驗證)Fig.6 Scatter plots of predicted and reference values(leave-one-out validation)

圖7為異地模型預測結果,用SF模型對SP的反演結果最好(圖7A,RMSE為5.54 g/kg),DP模型對SP的反演結果次之(RMSE為8.38 g/kg)。其中圖7b、7d、7e分別出現了不同程度的坐標偏移,圖7C中低SOM含量的樣本值被嚴重高估。從異地模型預測的結果看,無論是母質還是土地類型,都會對反演結果造成很大影響,再一次證明異地模型應用的風險非常大。

另外,圖7A和7C為SF和SP互作為異地反演模型的預測結果,其結果分別為6個模型中最好和最差。這一結果與常規思維所得的結果不同。在計算得出這一系列結果之前,原本的設想中SF和SP作為兩個獨立集合,在預測和被預測的關系中應該處于對稱的位置,即SF模型對SP的預測結果會與SP模型對SF的預測結果相差不大。但最終預測結果中一個RMSE為5.54 g/kg,表現尚可;另一個卻為28.42 g/kg,表現極差。若加上土地利用類型來表述,即為林地SOM模型可用來反演農田SOM含量,而農田SOM模型卻不適用于林地。對此的解釋是,結合SOM含量分布頻率圖,林地樣本中SOM含量高于10 g/kg以上的樣品顯著多于農地,而農地除了表層SOM含量較高,其他層次基本都低于10 g/kg,特別是SOM含量2~4 g/kg的樣本數量約為35個,為整個建模集規模的1/3;另外,農地的SOM均值水平也與林地差異較大,農地的為7.2 g/kg,林地為10.8 g/kg,農地為林地的2/3。所以,在SF的林地模型中,各個含量的樣本的分布較SP農田的平均,模型對各個含量都有不錯的預測能力;而在SP的農田模型中,低含量的樣本太多,且整個模型所涉及的閾值范圍較窄,所以對SF林地集合中預測目標值范圍較大的樣本進行運算時表現出極度的不適應。再將交叉驗證和異地驗證的結果進行對比,結果如表1所示。唯有當建模集和預測集母質、土地利用類型等條件相同時,才能達到比較理想的預測結果。這表明:一個地區建立的反演模型不可隨便應用于母質和土地利用類型不相同的其他區域;當某地的模型能適用于另一個區域時,并不代表反之也能行得通,這不僅與母質、土地利用類型有關,還跟目標屬性的分布情況有關。

圖7 預測值與測量值的散點圖(驗證方法為異地模型預測)Fig.7 Scatter plots of predicted and measured values(using models developed by other calibration data)

2.3.3 全局模型驗證 除各個集合建立的獨立模型,還可將各種土壤樣品放在一起作為一個籠統的建模集而建成全局反演模型。全局模型通常盡可能多的包含各種類型的土壤樣本,使各種類型的數據特征都能在最終模型中有所體現。將3個集合所有樣本放在一個集合中作為建模集,然后將3個獨立集合的樣本分別代入并反演得出的預測結果如圖8A及表1所示。從RMSE的結果可得,全局模型的結果比交叉驗證的精度高。交叉驗證的結果顯示,只有預測集中的樣本的母質、土地利用類型等屬性與建模集中樣本一致時才能得到相同精度的交叉驗證結果,但是此時全局模型的精度已超過原獨立模型,其可能性只有一個——建模樣本數量較大從而提高了模型精度,因為獨立模型的樣本數平均為107,而全局模型建模集的規模為321。為了驗證這一猜想,將原樣本集中的樣本以剖面為單位,隨機選擇1/3作為新的全局模型建模集。其驗證反演結果如圖8B及表1。當樣本數統一到同一水平,交叉驗證的結果明顯好于1/3全局模型的反演結果。證明,樣本數量確實能在一定程度上顯著影響反演模型的精度。

表1 交叉驗證和全局模型驗證的RMSE結果(g/kg)Table 1 RMSE results of cross-validation and global model validation

圖8 預測值與測量值的散點圖(全局模型預測)Fig.8 Scatter plots of predicted and measured values(using global model)

3 結論

本文研究了母質和土地利用類型對光譜反演模型建立的影響,所用的3個集合中,SF和SP有共同的母質,SP和DP有相同土壤利用類型。研究結果表明:母質和土地利用類型的差異會顯著影響異地模型的適應性,一個地區建立的反演模型不一定適用于母質和土地利用類型不同的其他地區;某類土地利用類型建立的模型也不一定適用于另外一類土地利用類型;當異地模型不適用于反演時,可考慮采用精度稍低的全局模型進行預測,在預測精度上的排序為本地模型>全局模型>異地模型。

參考文獻:

[1]Tian Y C,Zhang J J,Yao X,et al.Laboratory assessment of three quantitative methods for estimating the organic mattercontent of soils in China based on visible/near-infrared reflectance spectra[J].Geoderma,2013(202/203):161-170

[2]Morgan C L S,Waiser T H,Brown D J,et al.Simulated in situ characterization of soil organic and inorganic carbon with visible near-infrared diffuse reflectance spectroscopy[J].Geoderma,2009(151):249-256

[3]Rawlins B G,Kemp S J,Milodowski A E.Relationships between particle size distribution and VNIR reflectance spectra are weaker for soils formed from bedrock compared to transported parent materials[J].Geoderma.2011,166(1):84-91

[4]Du C,Linker R,Shaviv A.Identification of agricultural Mediterranean soils using mid-infrared photoacoustic spectroscopy[J].Geoderma,2008,143(1/2):85-90

[5]Awiti A O,Walsh M G,Shepherd K D,et al.Soil condition classification using infrared spectroscopy:A proposition for assessment of soil condition along a tropical forestcropland chronosequence[J].Geoderma,2008(143):73-84

[6]Ramirez-Lopez L,Behrens T,Schmidt K,et al.Distance and similarity-search metrics for use with soil vis-NIR spectra[J].Geoderma,2013,199:43-53

[7]Oliveira J F,Brossard M,Vendrame P R S.Soil discrimination using diffuse reflectance Vis-NIR spectroscopy in a local toposequence[J].Comptes Rendus Geoscience.2013,345(11/12):446-453

[8]Viscarra Rossel R A,Chen C.Digitally mapping the information content of visible-near infrared spectra of surficial Australian soils[J].Remote Sensing of Environment,2011,115(6):1443-1455

[9]黃昌勇.土壤學[M].北京:中國農業出版社,2000:6-7

[10]Vohland M,Besold J,Hill J,et al.Comparing different multivariate calibration methods for the determination of soil organic carbon pools with visible to near infrared spectroscopy[J].Geoderma.2011,166(1):198-205

[11]Melendez-Pastor I,Navarro-Pedre O J,Gómez I,et al.Identifying optimal spectral bands to assess soil properties with VNIR radiometry in semi-arid soils[J].Geoderma,2008,147(3/4):126-132

[12]Summers D,Lewis M,Ostendorf B,et al.Visible near-infrared reflectance spectroscopy as a predictive indicator of soil properties[J].Ecological Indicators,2011,11(1):123-131

[13]Wu D W,Zhang G L.Study on paddy soil chronosequences based on visual-near infrared diffuse reflectance spectra(to be published in Spectroscopy and Spectral Analysis,2015)

[14]Mcdowell M L,Bruland G L,Deenik J L,et al.Soil total carbon analysis in Hawaiian soils with visible,nearinfrared and mid-infrared diffuse reflectance spectroscopy[J].Geoderma,2012,189/190:312-320

[15]Denis A,Stevens A,Van Wesemael B,et al.Soil organic carbon assessment by field and airborne spectrometry in bare croplands:accounting for soil surface roughness[J].Geoderma,2014,226/227:94-102

[16]AiChi H,Fouad Y,Walter C,et al.Regional predictions of soil organic carbon content from spectral reflectance measurements[J].Biosystems Engineering,2009,104(3):442-446

[17]張甘霖,龔子同.土壤調查實驗室分析方法[M].北京:科學出版社,2012

[18]吳昀昭,田慶久,季峻峰,等.土壤光學遙感的理論、方法及應用[J].遙感應用,2003(1):40-47

Effects of Parent Materials and Land Use Types on Inversion Models by Using Soil Spectral Data

WU Dengwei1,2,ZHANG Ganlin1,2*
(1 State Key Laboratory of Soil and Sustainable Agriculture(Institute of Soil Science,Chinese Academy of Sciences),Nanjing 210008,China; 2 University of Chinese Academy of Sciences,Beijing 100049,China)

Abstract:Using visible near-infrared(Vis-Near Infrared,VNIR)spectral data to build inversion model is a rapid and nondestructive potential method to measure soil properties.However,the models based on pure statistical methods are weak in explaining the information of soil properties.This paper studied the effects and strategies of parent materials and land use types on the established spectral inversion model.3 sample sets of SF(forestry soils from Xuanchens),SP(paddy soils from Xuancheng)and DP(paddy soils from Dingyuan)were used,where,SF and SP with same parent material,SP and DP with same land use type.The results showed that the differences of parent materials and land use typse could affect the suitability of the off-site model significantly.It is possibly unreliable to use a model in a different region with different parent materials or land use types,however,the global model with expense of the prediction accuracy can be used when the off-site model does not work well.

Key words:Parent material; Land use type; Spectroscopy; Vis-Near Infrared

作者簡介:鄔登巍(1984—),女,湖北通山人,博士研究生,主要從事土壤光譜研究。E-mail:wdw@issas.ac.cn

* 通訊作者(glzhang@issas.ac.cn)

基金項目:①國家自然科學基金項目(41130530)資助。

DOI:10.13758/j.cnki.tr.2016.01.026

中圖分類號:P237;S-3

猜你喜歡
母質光譜
多發性毛母質瘤1例
基于三維Saab變換的高光譜圖像壓縮方法
毛母質瘤臨床特征及超聲診斷價值研究
河南省成土母質與土壤空間分布多樣性的特征*
不同母質類型下耕地土壤速效鋅與速效鉬的空間變異及其影響因子
貴州母巖(母質)對土壤類型及分布的影響
星載近紅外高光譜CO2遙感進展
改進 C-V 分割算法在多光譜成像儀中的應用
基于GPU的高光譜遙感圖像PPI并行優化
苦味酸與牛血清蛋白相互作用的光譜研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合