?

基于原位光譜的濱海灘涂土壤含水量預測模型

2023-05-08 01:32宋敬茹滿衛東高均海張永彬劉明月郝玉峰楊曉蕪
江西農業大學學報 2023年2期
關鍵詞:灘涂濱海反射率

宋敬茹,滿衛東,2,3,4*,高均海,張永彬,劉明月,2,3,4,郝玉峰,鄭 浩,楊曉蕪

(1.華北理工大學 礦業工程學院,河北 唐山 063210;2.唐山市資源與環境遙感重點實驗室,河北 唐山 063210;3.河北省礦區生態修復產業技術研究院,河北 唐山 063210;4.河北省礦業開發與安全技術重點實驗室,河北 唐山 063210;5.中煤科工生態環境科技有限公司唐山分公司,河北 唐山 063012)

【研究意義】土壤是生態系統的重要組成部分,是植物生長的必需因素。土壤含水量是土壤中必不可少的成分之一,是水文、林業和農業領域關注的熱點[1]。植物依托土壤水分獲取土壤鹽分,土壤含水量直接影響土壤-植被生態系統中的水分和養分循環[2]。土壤含水量是評價土壤水分的重要指標,可以調節土壤所受的侵襲程度影響土壤持水能力。常規土壤含水量獲取是一項需消耗大量的人力、物力和資金的工程,且大多是地面測定實驗,難以實現大尺度的快速監測[3]。灘涂位于海洋與陸地交會處,因其獨特的地理位置,使土壤樣品采樣難度增加,對灘涂土壤含水量進行區域尺度監測耗費更大。如何實現濱海灘涂土壤含水量預測,是目前海岸帶生態環境管理亟待解決的重要問題,構建濱海灘涂土壤含水量預測模型對快速、高效地監測其土壤含水量具有重要意義?!厩叭搜芯窟M展】高光譜技術能夠直接獲取連續的土壤反射率信息,其對土壤含水量的細微變化較為敏感,可為灘涂土壤含水量定量反演提供技術支持[4]。眾多學者通過尋求土壤含水量高光譜最佳波段,進行基于各種反射率數據的土壤含水量定量預測研究。Li 等[5]開發了一種利用手持式光譜輻射計估算土壤含水量水平的方法,發現當土壤含水量低于19% db時,土壤水分含量與對應高光譜反射率呈線性相關,得到了利用地面遙感獲得的高光譜反射率來估算土壤含水量是可行的結論。Wu 等[6]采用流行的線性回歸算法,選取695,711,736,747,767,778,796 nm 波段構建灌溉農田土壤含水量高精度反演模型。王靜等[7]采集175個土樣及相應含水量,并結合對應土樣實驗室光譜數據,建立了在1 423,1 524,1 746 nm 光譜波段下土壤含水量的預測回歸模型。劉偉東等[8]利用相對反射率法、一階微分法、反射率對數一階微分、差分法等方法分別對10 種土壤含水量進行預測,結果表明:反射率對數一階微分、差分法對土壤含水量具有很好的預測效果。以上研究多基于室內的高光譜數據,通過算法或光譜反射率變換研究發現反映土壤含水量信息的主要波段集中在1 400,1 900,2 200 nm波段周圍,而關于野外原位土壤光譜對土壤含水量的響應以及二者之間的預測模型研究較少。自20世紀90年代起,土壤屬性預測模型經歷了從線性回歸方法到機器學習方法的演變過程[9],提高模型預測精度一直是相關領域關注的焦點。Moore 等[10]采用線性回歸與判別分析結合的方法對土壤屬性進行預測。Hong 等[11]利用支持向量機(SVM)估算土壤有機質(SOM)含量,比較了分數階導數(FOD)與光譜變量選擇技術(CARS)、彈性網(ENET)和遺傳算法(GA)不同組合優化土壤近紅外光譜模型,并取得了較好的效果。Tomislav 等[12]研究發現RF 模型相較于線性回歸模型對土壤屬性的預測誤差明顯下降,說明RF模型對于非洲土壤屬性制圖方面具有良好的適用性。Curtis等[13]使用統計學習方法與機器學習算法分別對玉米種植區土壤氮含量進行預測,對比發現基于機器學習算法構建的模型預測精度更高。Zhang等[14]使用多元線性回歸模型和隨機森林模型預測復墾土壤的有機碳含量,發現隨機森林模型可以獲得更高的R2和更低的誤差指數。Forkuor等[15]利用遙感變量采用機器學習和多元線性回歸對土壤性質進行了對比研究。多數研究表明機器學習模型較傳統線性模型能更好地預測土壤的屬性,但仍需基于不同土壤類型和區域特性選擇適用的建模方法。

【本研究切入點】滄州市濱海區域是典型的淤泥質海灘,該區域內灘涂廣泛分布,植物種類豐富,構建濱海灘涂土壤含水量預測模型對土壤-植被生態系統水分循環研究具有重要意義?!緮M解決的關鍵問題】基于實測濱海灘涂土壤原位高光譜和對應土壤含水量數據,采用逐步線性回歸(MSR)和支持向量機回歸(SVR)方法構建濱海灘涂土壤含水量預測模型,比較不同變換形式的土壤反射率下表層灘涂土壤含水量預測模型精度,分析出最優預測模型,以期更加快速精準地獲取濱海灘涂土壤含水量,解決土壤含水量獲取復雜的問題,推動滄州沿海區域灘涂生態系統科學管理。

1 材料與方法

1.1 研究區概況

滄州(37°29′~38°57′N,115°42′~117°50′E)地處河北省東南部,北依京津,南接山東,總面積約為14 304.26 km2(圖1),屬于暖溫帶大陸性季風氣候,年均降水量達600 mm 左右。四季分明,河流眾多,素有“九河下梢”之稱。滄州海岸帶的近岸灘涂資源豐富,濱海灘涂因渤海潮汐堆積形成,以沙土、黏土和淤泥為主要土壤類型。濱海灘涂表層土壤(0~20 cm)粒徑變化約為2.15~55.73 μm,屬粉砂質土壤。

圖1 研究區概況與采樣點分布Fig.1 Survey of the study area and distribution of sampling sites

1.2 樣品采集與處理

1.2.1 濱海灘涂土壤樣品采集與土壤含水量測定 2019 年8 月,沿滄州海岸線從北到南依次確定14 個濱海灘涂土壤采樣點(圖1),每點采集表層(0~20 cm)土壤樣品2 個并密封保存,用于測定土壤含水量。采用烘干法測定土壤含水量。烘干前將采集的濱海灘涂土壤樣品稱重記為m1,在105 ℃的烘箱中烘干土壤樣品,直至前后兩次稱重恒定不變,稱重記為m2,土壤水分計算公式如下:

其中,ω為土壤含水量,m1為烘干前土樣的質量(g),m2為烘干后土樣的質量(g)。

1.2.2 濱海灘涂土壤原位光譜采集與處理 利用FieldSpec 4 便攜式光譜儀(350~2 500 nm)實測灘涂土壤原位光譜。高光譜數據采集時,天氣晴朗無風,在每天10:00—14:00 獲取濱海灘涂土壤高光譜數據。采樣前先去除暗電流影響,并利用白板進行定標。FieldSpec 4便攜式光譜儀傳感器探頭垂直于地面,并與地面相距1 m,每個采樣點采集5條土壤反射率光譜曲線。

用ViewSpecPro 軟件對每個采樣點的5條實測光譜數據取平均值作為原始光譜反射率[16]。將取均值后的土壤光譜數據進行Savitzky-Golay 卷積平滑處理(窗口大?。?0,多項式階數:2),以去除噪聲影響[17]。在對原始光譜反射率進行土壤含水量特征分析的基礎上,采用倒數(1/R)、反射率倒數的對數(log(1/R))、一階微分(R′)以及去包絡線(CR)等變換方法[18],獲取土壤含水量預測模型構建的變量。

1.3 研究方法

1.3.1 相關性分析 利用Pearson 相關系數分析原位光譜和4 種光譜變換形式下的光譜數據與濱海灘涂土壤含水量的相關性[62]。根據土壤含水量與光譜數據的相關程度,快速準確地選取了土壤對應的特征光譜波長。這為進一步構建濱海灘涂含水量預測模型提供了便利。相關性分析具有很強的目的性,精度高,可靠性好。相關系數高于0.7 表示關系非常緊密;0.4~0.7 表明關系密切;從0.2~0.4 表明關系正常。

式中:xi表示光譜反射率值,表示光譜反射率值的平均測量值,yi表示土壤含水量的測量值表示土壤含水量的平均測量值,n表示樣品的數量,i=1,2,3…,n,r表示相關程度。

1.3.2 多元逐步回歸模型(MSR)基于多個變換形式下光譜反射率,采用多元逐步回歸方法分別建立灘涂表層土壤含水量的高光譜預測模型,多元逐步回歸模型的結構形式為:

式中:x1、x2、x3…xn為光譜反射率值,為表層灘涂土壤含水量預測值,α1、α2、α3…αk為自變量回歸系數,b0為常數項。

1.3.3 支持向量回歸模型(SVR)SVR 基于支持向量機(SVM)來擬合曲線,其是由SVM 擴展而來的[19]。SVR 與SVM 類似,SVR 使用條帶擬合數據,其優點是可以高精度近似復雜的非線性連續函數[20]。優化SVR模型的目的是通過調整超參數來實現的,以找到超平面滿足所有數據的最小距離的位置。

SVR 模型有兩個非常重要的超參數cost 與gamma,cost 是懲罰系數,即對誤差的寬容度,cost 值越大則越不能容忍出現誤差,容易過擬合;cost值越小,容易欠擬合[21]。RBF 函數作為核函數(kernel),其自帶超參數為gamma,其隱含地決定了數據映射到新的特征空間后的分布,gamma 值越大,支持向量個數越少;反之gamma 值越小,支持向量個數越多[22]。而支持向量的個數影響訓練與預測的速度,故調整參數cost和gamma可以達到優化SVR的作用。

1.3.4 模型精度評定 灘涂土壤預測模型建立時,采用留一交叉驗證法(leave-one-out cross-validation,簡稱LOO-CV)對模型進行驗證[23]。該方法是一種K 折疊交叉驗證法,使K 等于數據集中的數據量。每次只使用一個測試集,其余的都作為訓練集[24]。這種方法得到的結果最接近于訓練整個測試集的預期值,適合于基于本研究的小樣本數據。

模型的檢驗精度采用預測值與實測值的調整型決定系數(Adjusted-R2)、均方根誤差(RMSE)和相對分析誤差(RPD)來評價[25]。Adjusted-R2越大、RMSE 越小,表明模型估算精度越高。RPD 值可以用來解釋模型的預測能力,當RPD<1.4 時,表明模型無法進行準確預測;當1.4≤RPD<2.0 時,表明模型的預測能力一般;RPD≥2.0時,表明模型具有較好的預測能力[26],公式如下:

式中,yi為土壤含水量實測值,?為土壤含水量預測值,為土壤含水量實測值的平均值,n為樣本數量[27],用i=1,2,3,…,n表示,SD為實測值標準偏差。

2 結果與分析

2.1 濱海灘涂土壤原位光譜特征分析

濱海灘涂土壤含水量會對土壤光譜反射率造成較強的非線性干擾,比較不同濱海灘涂土壤含水量反射光譜,發現隨著濱海灘涂土壤含水量增加,在原位光譜區間可見近紅外(VIS-NIR)(350~2 500 nm)的光譜反射率有明顯下降趨勢(圖2),與其他研究者得到規律一致[28]。不同濱海灘涂土壤樣品的光譜走勢基本相同,波峰與波谷所在波段一致,均在500~1 500 nm和2 000~2 200 nm光譜區間濱海灘涂土壤光譜反射率隨波長增加而增加,1 600~1 800 nm 光譜區間濱海灘涂土壤光譜反射率波動較小,2 200~2 500 nm光譜區間濱海灘涂土壤光譜反射率隨波長增加反射率降低。野外實測原位光譜受大氣水汽的影響,在1 900 nm光譜處存在較為明顯的反射峰。1 400~1 600 nm和2 000~2 200 nm光譜區間處分別存在較為明顯的土壤含水量吸收谷。

圖2 濱海灘涂土壤光譜曲線Fig.2 Spectral curve of tidal flat soils

2.2 濱海灘涂土壤含水量與光譜數據相關性分析

濱海灘涂土壤含水量與原位光譜相關性通過Pearson 相關系數進行分析,快速、準確篩選出用于構建濱海灘涂土壤含水量預測模型的光譜區間。原始光譜反射率(R)、倒數(1/R)、反射率倒數的對數(log(1/R))、一階微分(R′)以及去包絡線(CR)與濱海灘涂土壤含水量的相關程度在0.4以上的光譜波段如圖3 所示。研究發現原位光譜R 和R′、1/R、log(1/R)、CR 均在1 000~1 300 nm、1 400~1 600 nm 和1 900~2 400 nm 維持與濱海灘涂土壤含水量相關性緊密,而光譜R′與濱海灘涂土壤含水量相關性高低分布較為明顯。結合光譜特征區間選擇用于建模的波段為1 400~1 600 nm 和1 900~2 400 nm。

圖3 不同濱海灘涂土壤光譜反射率變換形式對應的濱海灘涂土壤含水量相關系數及波段Fig.3 Correlation coefficient and band of soil water content in tidal flats corresponding to different tidal flats soil spectral reflectance transformation form

2.3 濱海灘涂土壤含水量原位光譜預測模型對比分析

不同濱海灘涂土壤含水量預測模型精度顯示:基于MSR構建的濱海灘涂土壤含水量預測模型中,精度最高的是基于R構建的濱海灘涂土壤含水量預測模型,精度最低的為基于CR 構建的濱海灘涂土壤含水量預測模型;利用MSR 方法構建的濱海灘涂土壤含水量預測模型由于Adjusted-R2值均小于0.4,RPD均低于1.4且RMSE較高,導致模型均不具有良好的預測能力。

表1 不同濱海灘涂土壤含水量預測模型的驗證與對比Tab.1 Verification and comparison of soil water content prediction models in different tidal flats

與MSR 對比,同種光譜變換形式下,采用SVR 方法構建的濱海灘涂土壤含水量預測模型結果更優,Adjusted-R2和RPD 值均有提高,且RMSE 值也顯著降低。其中,在R′變換形式下,采用SVR 方法構建的濱海灘涂土壤含水量預測模型的Adjusted-R2最高為0.81,RMSE 較小為2.56,且滿足RPD≥2.0,模型具有很好的預測能力。比較基于以上10 個模型的濱海灘涂土壤含水量預測值與實測值(圖4),分析濱海灘涂土壤含水量預測值與真實值的95%置信帶和預測帶,發現在R′變換形式下采用MSR 和SVR 方法得到結果中95%置信帶和預測帶會更加接近真實值和預測值的1∶1線,并結合對模型的精度評價,說明在R′變換形式下采用SVR方法構建的濱海灘涂土壤含水量預測模型為最優模型。

圖4 五種光譜反射率處理模式的回歸模型驗證Fig.4 Regression model validation diagram of five spectral reflectance processing modes

3 討論

全波段建模既會引起信息冗余,又容易產生嚴重的多重共線性[29],對濱海灘涂土壤原位光譜區間進行選取是克服上述問題實現濱海灘涂土壤含水量預測模型構建的重要方法。通過分析原位光譜及其變換后的光譜數據與濱海灘涂土壤含水量相關性,篩選出用于構建濱海灘涂土壤含水量預測模型的光譜(1 400~1 600 nm和1 900~2 400 nm),此研究結果與Han等[30]研究的土壤含水率引起的光譜吸收谷(1 450 nm 和1 940 nm)相一致。產生的微小范圍差異可能與濱海灘涂土壤類型、環境因素、植被生長等研究區現狀有關[31-33]。

同種原位光譜變換形式下,采用SVR 方法構建的濱海灘涂土壤含水量預測模型精度高于MSR 方法。當土壤含水量與對應的VIS-NIR 光譜之間存在線性關系時,MSR 方法具有結構簡單、計算方便、便于理解等優勢[34]。當濱海灘涂土壤含水量與原位光譜較難呈現理想化的線性關系,利用SVR 方法處理其非線性關系,構建的濱海灘涂土壤含水量預測結果具有明顯的精度優勢。相應結論在Forkuor 等[15]的研究中得到了證實:比較多元線性回歸(MLR)、隨機森林回歸(RFR)、支持向量機(SVM)、隨機梯度提升(SGB)4 種方法,發現RFR 在大多數情況下提供了最高的準確性,而MLR 無法處理因變量和自變量之間的非線性關系。濱海灘涂土壤含水量與光譜數據可能呈現的線性關系與非線性關系,未來可采用決策樹、隨機森林和神經網絡等多種機器學習方法建模,增加模型的可靠性,以探求更適用于濱海灘涂土壤的最優建模方法。

4 結論

利用FieldSpec 4便攜式光譜儀高效獲取原位濱海灘涂土壤VIS-NIR光譜數據(350~2 500 nm),對光譜反射率進行變換處理(R、1/R、log(1/R)、R′、CR),采用MSR 和SVR 兩種建模方法基于土壤含水量高相關性光譜波段探究濱海灘涂土壤含水量預測模型。主要研究結論如下:

1)濱海灘涂土壤原位光譜反射率隨土壤含水量增加而下降,在1 400~1 600 nm、1 900~2 400 nm 光譜存在較為明顯的反射峰和吸收谷,光譜反射率經過變換處理后與濱海灘涂土壤含水量密切相關。

2)對比兩種建模方法發現無論在何種變換形勢下,機器算法SVR比普通線性回歸方法MSR得到預測模型更加準確,Adjusted-R2更高,RMSE更小。其中在R′變換形式下利用SVR方法構建的濱海灘涂含水量模型建模效果最好,即為最優預測模型,其能夠為在短時間內獲取濱海灘涂土壤含水量提供數據支持。

致謝:唐山市科技計劃重點研發項目(19150231E)、唐山市科技研發平臺培養計劃(2020TS003b)、中煤科工生態環境科技有限公司生產力轉化基金項目(0206KGST005)同時對研究給予了資助,張闊、李京對土壤樣品采集給予了幫助,謹致謝意!

猜你喜歡
灘涂濱海反射率
影響Mini LED板油墨層反射率的因素
近岸水體異源遙感反射率產品的融合方法研究
霞浦灘涂
具有顏色恒常性的光譜反射率重建
濱海白首烏
濱海頂層公寓
岳濱海 藏石欣賞
灘涂評估方法適用性研究
化學腐蝕硅表面結構反射率影響因素的研究*
海邊灘涂軟淤地基擋潮閘基礎設計
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合