?

基于高光譜特征參數的冬小麥氮營養指數估算

2023-10-23 08:18王玉娜李粉玲李振發呂書豪
麥類作物學報 2023年11期
關鍵詞:拔節期植被指數冬小麥

王玉娜,李粉玲,李振發,呂書豪

(西北農林科技大學資源環境學院,陜西楊凌712100)

氮素是作物生長必需的營養物質之一,與作物的生長狀況、產量和蛋白質含量息息相關[1-2]。氮營養指數(nitrogen nutrition index,NNI)是定量表達作物氮素營養豐缺程度的一個重要指標,能夠從作物群體特征出發,較準確地反映作物的氮營養狀況[3]。實時、快速、無損監測作物氮營養指數是掌握農田氮素養分分布、協調田間管理措施的重要依據[4-5]。

隨著高光譜遙感技術的發展,國內外學者在實時監測葉片葉綠素含量(LCC)、葉片氮素含量(LNC)、葉片氮素積累(LNA)、植株氮素濃度(PNC)、植物氮素吸收(PNU)等作物氮素營養方面取得了一定的研究成果[6],但利用高光譜技術對作物NNI實時監測的研究還比較少。研究表明,利用線性內插法紅邊位置(REPLI)估測冬小麥NNI的精度較高,決定系數可達0.859[7];春玉米NNI與黃邊內一階微分光譜中的最大值相關性較高[8];在可見光至近紅外光的冠層光譜反射率區域,對夏玉米NNI最敏感的光譜帶位于710和512 nm[9]。植被指數與作物NNI也密切相關。如,植被指數與甜椒NNI在果實生長早期和開花期存在較強的相關性,但相關性在營養階段和收獲階段變弱[10];Yu等[11]提出了一種基于雙植被指數的NNI遙感指數(NNIRS),可用于監測作物氮素狀況。然而,目前還沒有具體的植被指數用于跨多個生長發育時期的NNI反演。在目前的高光譜遙感研究中,偏最小二乘回歸、支持向量機、隨機森林回歸等算法被廣泛應用,而且均顯示出了強大的模型構建能力,但不同算法在具體實踐中應用效果各有千秋,如對玉米冠層原始高光譜信息預處理后,結合隨機森林算法反演NNI的精度要優于偏最小二乘回歸和BP神經網絡回歸[9]??傮w來看,作物冠層高光譜技術結合機器學習算法是NNI估算的潛在途徑,但目前基于冠層高光譜的NNI估算精度整體不高,而且對不同生育時期的估算結論有待驗證。如,基于無人機高光譜成像影像構建了NNI的隨機森林估算模型,雖然模型較為穩定,但其解釋能力不到80%[12];基于無人機高光譜成像影像和不同時期的植被指數預測冬小麥NNI時,揚花期的解釋能力要高于拔節期和孕穗期[13];機器學習算法結合遙感數據、土壤、氣候和田間管理參數會進一步提升作物NNI估算模型的精度[14]。

有研究者認為,吸光度變換(ABS)[15]、連續統去除變換(CR)[16]等光譜變換能在一定程度上減弱作物冠層原始光譜背景噪聲,提升作物理化參數的反演精度[17-18]。本研究對獲取的冬小麥冠層高光譜數據進行光譜變換,構建“三邊”參數、任意兩波段光譜指數和植被指數三類光譜參數,篩選對NNI敏感的光譜特征參數,基于偏最小二乘回歸、隨機森林、支持向量機回歸和梯度增強回歸構建冬小麥NNI模型,并對模型精度進行比較,以期獲得最佳NNI估算方法,為診斷調控冬小麥氮素營養、實時監測生長狀況和后期田間管理提供基礎數據。

1 材料與方法

1.1 試驗設計

2017-2019年在陜西省咸陽市乾縣梁山鎮齊南村設置冬小麥小區種植試驗(34°38′N,108°07′E)。該區土壤類型為壤土,0~40 cm耕層有機質含量為13.36 g·kg-1,全氮含量為0.48 g·kg-1,速效氮含量為44.86 mg·kg-1,有效磷含量為13.54 mg·kg-1,速效鉀含量為182.88 mg·kg-1。供試小麥為當地主栽品種小偃22。試驗設置不同水平的氮磷鉀單因素處理,每個處理重復兩次,小區面積90 m2(10 m×9 m)。氮素處理設置0、30、60、90、120和150 kg·hm-26個施氮水平,各處理均施磷(P2O5)45 kg·hm-2和鉀(K2O)60 kg·hm-2;磷素處理設置0、22.5、45、67.5、90 和112.5 kg·hm-26個施磷(P2O5)水平,各處理均施氮90 kg·hm-2和鉀肥(K2O)60 kg·hm-2;鉀素處理設置0、15、 30、45、60 和 75 kg·hm-26個施鉀(K2O)水平,各處理均施氮90 kg·hm-2和施磷(P2O5)45 kg·hm-2。小區種植管理方式同當地大田。

1.2 光譜數據及處理

采用美國SVC HR-1024I型野外光譜輻射儀,分別在2017、2018、2019年冬小麥生長發育的四個關鍵時期(拔節期、抽穗期、開花期和灌漿期)進行冠層高光譜測定。調整光譜儀視場角25°,鏡頭垂直向下距冬小麥冠層1 m處,重復測定冠層光譜10次。每個樣區選取兩個樣點,取平均值作為該樣區的光譜反射率。每次冠層光譜測定前進行標準白板校正,以確保良好的光譜測定質量。為減弱或消除光譜的背景噪聲,提高敏感波段的靈敏度,本研究對350~1 350 nm范圍內高光譜反射率數據分別進行平滑光譜變換(SM)、一階導數光譜變換(FD)、吸光度變換(ABS)和連續統去除光譜變換(CR)4種預處理[19]。

1.3 農學參數獲取

采集冠層高光譜數據后,各小區以測定點為中心,采集0.5 m×0.5 m范圍內的植株地上部。從樣品中隨機選取20株稱鮮重,放置105 ℃烘箱殺青30 min,然后于80 ℃下烘干48 h以上,根據范圍比例計算記錄各小區地上部干物質重。烘干的樣品粉碎后稱取0.2 g,使用凱氏定氮法測定冬小麥植株氮濃度(%)。NNI定義為作物地上部植株氮濃度與臨界氮濃度的比值[20]。NNI=Nc/Nct;Nct =4.28W-0.49。式中Nc為作物植株氮濃度(%),Nct為臨界氮濃度(%)。臨界氮濃度為作物達到最大干物質所需要的最低氮濃度,本研究采用李正鵬基于小偃22建立的關中平原冬小麥臨界氮濃度模型[21]:W為作物地上部生物量(t·hm-2)。

1.4 光譜參數的提取與選擇

為充分利用光譜信息構建光譜參數,提高作物高光譜監測精度,本研究構建三類光譜參數進行估算分析:(1)“三邊”參數,是在原始光譜和一階導數光譜的基礎上構建的光譜參數,主要包括藍邊內最大一階導數值(Db)、紅邊內最大一階導數值(Dr)、黃邊內最大一階導數值(Dy)、綠峰反射率最大值(Rg)、紅谷反射率最小值(Rr)、藍邊面積(Sb)、黃邊面積(Sy)、紅邊面積(Sr)、紅邊面積和藍邊面積的比(Sr/Sb)、紅邊面積和黃邊面積的比(Sr/Sy)、紅邊面積和藍邊面積歸一化值((Sr-Sb)/(Sr+Sb))及紅邊面積和黃邊面積歸一化值((Sr-Sy)/(Sr+Sy))等12類特征參數;(2)任意兩波段光譜指數,是在各變換光譜350~1 350 nm波段范圍內計算任意兩個光譜反射率之間的差值(DSI)、比值(RSI)和歸一化指數(NDSI);(3)篩選與NNI相關性較好的植被指數,主要包括紅邊指數1(VOG1)、MERIS 陸地葉綠素指數(MTCI)、改進紅邊比值植被指數(mSR705)、改進紅邊歸一化植被指數(ND705)、最佳植被指數(VIopt)、修正型三角植被指數(MTVI2)和土壤調節植被指數(SAVI)等7類[22]。

1.5 模型構建

對構建的三類光譜參數與NNI進行皮爾遜相關性分析,利用逐步回歸對與NNI呈極顯著相關的光譜參數進行敏感性和不存在共線性篩選,篩選出的敏感光譜參數參與NNI建模。本研究的建模方法包括偏最小二乘回歸(PLSR)、隨機森林(RFR)、支持向量機回歸(SVR)和梯度增強回歸(GBDT)。

PLSR是多元線性回歸分析、典型相關分析和主成分分析集成的建模方法,通過主成分分析對樣本數據進行篩選,確定對因變量解釋性最強的變量參與建模,克服變量的多重相關性問題[23-24]。RFR是通過自助重采樣,從原始的訓練樣本中有放回地隨機采樣構建決策樹進行分類預測的一種算法,具有很好的抗過擬合能力和抗噪聲能力[25-26]。SVR通過使樣本實測值與預測值之間的損失函數最小化和靠超平面最遠的樣本點之間的間隔最大來確定模型[27-28]。GBDT通過樣本建立決策樹,得到預測值和殘差,后面的決策樹基于前面決策樹進行殘差學習,直到樣本預測值和實測值的殘差為零[29-30]。本研究在SPSS20.0軟件中進行偏最小二乘回歸,在R軟件中實現隨機森林算法,在Python軟件中進行SVR和GBDT。

1.6 模型精度檢驗

本研究將三年拔節期、抽穗期、開花期和灌漿期的數據混合,共采集樣本數據432個,按照3∶1的比例隨機劃分為建模集和驗證集。模型精度采用決定系數(r2)、均方根誤差(RMSE)和相對預測偏差(RPD)檢驗。r2反映模型擬合能力,RMSE和RPD可以衡量預測值與實測值之間的離散程度和偏差,r2越接近1,RMSE越小,模型預測效果越好,RPD大于2時,模型具有極好的預測能力[31]。

2 結果與分析

2.1 敏感光譜參數篩選

2.1.1 任意兩波段光譜參數篩選

利用Matlab軟件分析350~1 350 nm波段范圍內四種預處理光譜中任意兩波段組合的歸一化光譜指數(NDSI)、差值光譜指數(DSI)和比值光譜指數(RSI)與NNI的相關性,分別選擇與NNI相關性最大的波段組合參與顯著性檢驗,入選波段見表1。拔節期入選波段集中在可見光區域,隨著生育時期的變化,入選波段向長波方向偏移,在可見光和近紅外區域均有分布。

表1 各生育期任意兩波段光譜參數入選波段Table 1 Optimal bands selection in any two-band spectral index for each growth stage

2.1.2 三類光譜參數與氮營養指數的相關性

相關性分析(圖1)表明,各生育時期“三邊”參數中,拔節期“三邊”參數與NNI相關性最好(圖1a),紅邊內最大一階導數值、紅邊面積、紅谷反射率最小值、紅邊面積和藍邊面積的比、紅邊面積和黃邊面積的比、紅邊面積和藍邊面積歸一化值、紅邊面積和黃邊面積歸一化值與NNI的相關系數分別為0.33、0.27、0.25、0.41、0.32、0.42和0.32,均達到極顯著水平(P<0.01)??傮w來看,紅邊位置計算的光譜參數與NNI的相關性較好,拔節期、開花期和灌漿期的紅邊內最大一階導數值、紅邊面積與NNI均相關極顯著。

圖1 光譜參數與氮營養指數的相關性Fig.1 Correlation between spectral parameters and nitrogen nutrition index (NNI).

在拔節期,典型植被指數與NNI均極顯著相關(圖1b)。在開花期,VIopt、MTVI2、SAVI與NNI的相關系數分別是0.30、0.29和0.29,均極顯著相關。灌漿期的VOG1與NNI也通過了0.01水平的顯著性檢驗。抽穗期各參數與NNI的相關性均未通過0.01水平的顯著性檢驗。

各生育時期的任意兩波段光譜指數與NNI的相關性均通過0.01水平的顯著性檢驗(圖1c)。其中,拔節期的任意兩波段光譜參數與NNI的相關性最佳,相關系數均大于其他時期,其中基于一階導數光譜的NDSI和RSI與NNI的相關系數最大,均為0.66。

2.1.3 基于逐步回歸篩選敏感光譜參數

從各個生育時期與NNI呈極顯著相關的光譜參數中,利用逐步回歸法剔除多重共線性的光譜參數,篩選出對模型敏感的解釋變量(表2)。其中,拔節期敏感光譜為任意兩波段光譜參數和“三邊”參數,抽穗期、開花期和灌漿期的敏感光譜參數均為任意兩波段光譜參數,植被指數三個時期均未入選。

表2 各生育期敏感光譜參數Table 2 Sensitive spectral parameters ateach growth stage

2.2 NNI模型的構建和驗證結果

基于各生育時期的敏感光譜參數,分別采用偏最小二乘回歸(PLSR)、隨機森林算法(RFR)、支持向量機回歸(SVR)和梯度增強回歸(GBDT)構建冬小麥NNI預測模型。從圖2來看,拔節期、抽穗期、開花期和灌漿期基于GBDT構建模型的預測精度均高于其他三個模型,決定系數(r2)分別為0.96、0.92、0.90、0.95,均方根誤差(RMSE)分別為0.05、0.05、0.05、0.03,同時基于GBDT驗證模型的決定系數(r2)也高于其他三個模型,模型精度相對較高。

圖2 基于PLS、RFR、SVR和GBDT的冬小麥NNI的建模精度

比較四個生育時期,建模集中,拔節期四個模型的決定系數(r2)高于其他生育時期,其中GBDT模型的建模精度最佳,r2和均方根誤差(RMSE)分別為0.96和0.05;其次是RFR模型,r2和RMSE分別為0.89和0.05,其他模型的建模精度相對較低。

所有模型中,拔節期GBDT模型的驗證精度也最佳,r2和RMSE分別為0.95和0.12;其實測值與預測值斜率為0.87,散點空間分布接近1∶1線(圖3)。從相對預測偏差(RPD,實測值和預測值之間標準差和均方根誤差之比)(圖4)看,拔節期GBDT模型的RPD最高,為2.12;其次為SVM模型,其RPD為1.92。其余模型的RPD均小于1.5??傮w來看,各個生育時期GBDT模型精度相對較高,拔節期建立的NNI模型精度優于其他時期,且拔節期基于GBDT的NNI模型具有較好的預測能力。

圖3 拔節期基于GBDT的NNI預測值與實測值相關性

圖4 冬小麥NNI估算模型相對預測偏差對比

3 討論

快速精準實現作物氮素管理對于提高氮肥利用率、減少土壤和地下水污染至關重要[32-33]。NNI綜合植株氮濃度和生物量在診斷氮素營養狀況的不同作用,為快速實現作物氮素營養診斷和管理提供支持。本研究中,任意兩波段篩選出的比值光譜指數位置為749和763 nm,與王仁紅等得到的冬小麥NNI引用比值指數位置相似[7],也表明了紅邊參數與農學組分之間的密切關系[34]。對原始冠層光譜進行一階導數、吸光度和連續統去除變換,能夠在一定程度降低噪聲干擾,增強光譜特征[35]。本研究基于變換光譜的任意兩波段光譜參數與NNI的相關性優于“三邊”參數和植被指數,其中由拔節期一階導數光譜組成的歸一化、比值光譜指數與NNI相關性最高。

本研究采用偏最小二乘回歸、隨機森林算法、支持向量機回歸和梯度增強回歸分別建立冬小麥的NNI模型,其中梯度增強回歸模型和隨機森林模型均未出現過度擬合現象。梯度增強回歸顯著提升了NNI的估算精度,這是因為梯度增強回歸通過多個決策樹構建更強大的模型,不斷迭代,決策樹深度小[29],預測速度快,參數設置比隨機森林算法和支持向量機回歸更敏感,模型精度更高。拔節期基于梯度增強回歸構建的NNI預測模型決定系數達到0.95,精度優于王仁紅等[7]基于線性內插法共邊位置對冬小麥NNI的估測(決定系數為0.86,均方根誤差為0.08)。不同于劉昌華等[13]的研究,本研究中拔節期基于梯度增強回歸的NNI模型取得了最佳驗證精度。如果在拔節期能夠準確估測冬小麥NNI,這對于科學精準施肥,對于提高冬小麥產量和改善冬小麥品質有著重要的意義[36]。本研究為拔節期冬小麥氮素的評估提供了理論和方法,這一結果還有待更多的數據集進行驗證。另外,計算NNI時,臨界氮濃度采用了同為研究關中平原地區冬小麥氮素的李正鵬等[21]的臨界氮濃度稀釋曲線模型,該模型是基于小麥品種小偃22所建,因此未來需要針對不同品種建立更為廣適的臨界氮濃度模型,以進一步增強NNI高光譜監測的普適性。

4 結論

本研究通過相關性分析法和逐步回歸法,分別篩選出各生育時期與冬小麥NNI敏感的解釋變量,利用偏最小二乘回歸、隨機森林算法、支持向量機回歸和梯度增強回歸分別建立冬小麥NNI模型。從拔節期到灌漿期,任意兩波段光譜參數與NNI均極顯著相關,相關性明顯優于“三邊”參數和植被指數,其中拔節期任意兩波段光譜參數與NNI的相關性高于其他生育時期,且基于一階導數光譜的歸一化光譜指數和比值光譜指數與NNI的相關系數最大。在各生育時期中,基于梯度增強回歸的NNI模型精度高于其他模型,其中拔節期該模型的精度最高,r2、RMSE和RPD分別為0.95、0.12和2.12,說明其具有較好的預測能力。

猜你喜歡
拔節期植被指數冬小麥
2021年山西省小麥返青拔節期主要病蟲發生趨勢預報
基于植被指數選擇算法和決策樹的生態系統識別
AMSR_2微波植被指數在黃河流域的適用性對比與分析
河南省冬小麥產量遙感監測精度比較研究
甘肅冬小麥田
拔節期弱光脅迫對揚麥15麥秸營養成分和體外發酵的影響
主要植被指數在生態環評中的作用
冬小麥和春小麥
冬小麥——新冬18號
冬小麥—新冬41號
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合