?

基于高光譜和參數優化支持向量機的水稻施氮水平分類研究

2021-01-04 07:41羅建軍楊紅云孫愛珍易文龍
中國土壤與肥料 2020年5期
關鍵詞:施氮反射率氮素

羅建軍,楊紅云,路 艷,萬 穎,孫愛珍,易文龍

(1.江西農業大學計算機與信息工程學院,江西 南昌 330045;2.江西農業大學軟件學院/江西省高等學校農業信息技術重點實驗室,江西 南昌 330045)

氮素是植物生長所必需的元素之一,缺少氮肥的施用會造成植株葉片面積減小,降低光合作用、葉綠素濃度和生物產量[1]。過量氮肥的施用不僅會使大田土壤中的氮素過多殘留,而且浪費了肥料,又污染了環境[2-3]。運用高光譜技術進行作物營養診斷,具有快速、便捷、無損害的優點,為實時監測作物氮素營養提供了新的技術手段和方法[4]。對此,多數研究者采用高光譜技術對水稻進行氮素營養研究表明,水稻冠層和葉片高光譜能夠很好地反映其氮素營養狀況。例如唐延林等[5]研究表明,隨著施氮水平的提高,水稻冠層和葉片光譜的差異顯著,其可見光范圍的反射率有所下降,近紅外區的反射率有所增加。Wang 等[6]發現水稻冠層高光譜反射率與不同氮含量具有顯著相關性,可大致區分嚴重缺氮、適氮以及過氮的情況。Chu 等[7]運用高光譜技術,通過選用波長770 與752 nm 的反射率比值進行水稻葉片氮素積累量的判定,氮素積累量的判定模型效果較為優質。王樹文等[8]研究表明,水稻冠層光譜反射率與水稻的氮含量具有密切關系,采用高光譜技術能夠很好地進行水稻嚴重缺氮、適氮以及過氮的定性診斷。Du 等[9]采用基于光譜輻射和32 通道探測器的高光譜激光雷達(hl)技術進行特征波長反射率的選擇,發現其與水稻不同含氮水平具有很高的相關性。祝錦霞等[10]、劉江桓[11]、孫棋[12]都研究發現不同時期的水稻頂三葉葉片能夠很好地體現水稻植株的氮素含量;同時,張麗微等[13]研究表明,在水稻的分蘗期,合理適量的追施氮肥能夠提高水稻的產量,改良水稻的品質。因此,選用水稻分蘗期頂三葉葉片進行水稻氮素營養診斷,能夠很好地反映水稻氮素營養的缺失,并及時合理地追加施氮。支持向量機(SVM)是建立在統計學習理論中結構風險最小化基礎上的監督學習模型[14],在解決小樣本、非線性、高維數等模式識別問題時,支持向量機較其他建模方法來說具有更多的優點[15]。但支持向量機的模型性能主要受其誤差懲罰參數C 和核函數參數g 的影響。

本研究采用支持向量機進行水稻氮素營養狀況的定性診斷,并分別通過網格搜索算法、粒子群算法和遺傳算法進行參數優化,以尋求支持向量機的最優參數。通過采用高光譜技術,獲取水稻分蘗期頂三葉葉片的可見光到近紅外波段350 ~2 500 nm 的光譜反射率,并采用平滑處理和歸一化處理,消除噪聲和量綱的影響以及主成分分析方法去除數據冗余,為水稻氮素營養狀況的定性診斷研究提供一種更加有效、準確的方法,也為進一步研究水稻氮素營養高光譜診斷的定量分析奠定基礎。

1 材料與方法

1.1 試驗設計

水稻試驗于2018 年在江西省南昌市成新農場(116o15’E,28o92’N)進行,水稻田土壤pH 值為5.30、有機質19.46 g/kg、全氮1.02 g/kg、全磷0.48 g/kg、全鉀14.22 g/kg、堿解氮112.31 mg/kg,有效磷11.65 mg/kg,速效鉀123.84 mg/kg。

根據汪壽根等[16]研究表明,“中嘉早17”水稻在中氮肥水平(150 kg/hm2)處理最佳,其水稻產量達到最高。因此,本試驗選用“中嘉早17”水稻作為供試品種,施氮水平設4 個處理,分別為:第一類0 kg/hm2(不施氮)、第二類105 kg/hm2(低氮)、第三類150 kg/hm2(中氮)和第四類195 kg/hm2(高氮)。氮肥使用尿素(N 46%),按基肥∶分蘗肥∶穗肥5∶2∶3 施用。磷肥使用鈣鎂磷肥(P2O512%),鉀肥使用氯化鉀(K2O 60%),每種施氮處理下磷鉀施肥量相同。人工移栽前1 d 施用基肥,人工移栽后7 d 施用分蘗肥,在葉齡余數1.5 左右時施用穗肥[17]。水稻在4 月9 日 播 種,4 月28 日 移 栽。栽 插 密 度 為13.3 cm×26.6 cm,其他管理按照一般的高產栽培管理。

1.2 光譜數據獲取

在分蘗期(5 月17 日)進行水稻頂三葉葉片采集,4 種施氮各采集60 組,共240 組。分別選用每組葉片樣本的葉尖、葉中和葉枕3 個部位,使用光譜分析儀進行光譜反射率值的測量,其中3 個測量位置點分別位于距葉尖方向的葉片長度1/4、1/2、3/4 處。以3 個部位位置點的光譜反射率值的平均值作為每組樣本的光譜反射率值。光譜分析儀采用ASD 野外光譜分析儀FieldSpec 4,如圖1 所示。其測量波長范圍為可見光到近紅外波段(350 ~2 500 nm)。反射光譜均值處理在Viewspec Program 軟件中進行,且光譜測量每間隔15 min 進行一次標準白板矯正。

圖1 ASD 野外光譜分析儀FieldSpec 4

1.3 水稻葉片光譜數據預處理

1.3.1 平滑處理

由于數據中或多或少存在噪聲。因此,采用移動平均濾波器將原始數據進行平滑處理[18],平均濾波器的窗寬默認設置為5,平滑處理如公式(1)。

式中,x為原始光譜數據的波長反射率,y為平滑后數據的波長反射率,n為波長。

1.3.2 光譜數據歸一化處理

處理后的每種特征量綱有所不同,為能夠提高模型運行速率和模型準確率[19],使用公式(2)對平滑處理后的所有數據進行歸一化處理。

式中,xmax和xmin分別為原始光譜數據中的最大值與最小值,ymax和ymin分別為歸一化處理后光譜數據的最大值與最小值,分別取1 和-1。

1.4 光譜特征降維處理

各波段光譜反射率值間存在一定的相關性,增加了預測難度[20]。主成分分析(PCA)利用降維的思想,在損失很少信息的前提下,將多個變量轉化為少數幾個不相關的綜合變量[14,21]。本研究共獲取了2 151(350 ~2 500 nm)個波長變量,為提高算法運行效率,降低光譜數據的數據冗余,通過采用主成分分析的方法降低光譜數據的變量個數。統計學認為,累計貢獻率達到80%及以上[10],就能夠很好地表征出原始數據的特性。因此,獲取的變量方差累計貢獻率越高,就越能反映原始數據的特征性。

1.5 不同算法優化支持向量機模型的建立

支持向量機模型性能的主要影響因素包括誤差懲罰參數C 和核函數參數g 以及核函數類型[22]。本研究采用支持向量機對水稻氮素營養狀況進行定性診斷研究,同時選用徑向基核函數[23],徑向基核(RBF)函數如公式(3)所示??紤]到誤差懲罰參數C 和核函數參數g 對SVM 的性能有著很大影響[24],且合理選取不僅可以優化模型,而且能夠適用于小數據樣本集的模型建立。本研究分別選用網格搜索算法、粒子群算法和遺傳算法進行支持向量機模型的最佳參數選取。其中,網格搜索算法設定網格搜索的變量C 和g 的初始范圍為[2-8,28],搜索步距設為1,采用K-CV 方法對訓練集進行測試,其中K=3[25]。粒子群算法和遺傳算法優化支持向量機模型的變量C 和g 的變化范圍都設定為[2-8,28],最大進化數量設定為200,種群最大數量設定為20。

其中δ>0,為高斯核的帶寬。

2 結果與分析

2.1 不同施氮水平下的水稻光譜數據分析

將4 種施氮水平的240 組(各施氮水平60 組)光譜數據求取平均值,各施氮水平下的水稻葉片光譜如圖2 所示,不同施氮水平下的光譜變化趨勢相同,但在紅外區780 ~1 300 nm 4種施氮水平的光譜反射率有所不同,以第四類(高氮)施氮水平下的光譜反射率最高,第三類(中氮)施氮水平其次。在1 400 ~1 850 nm 及1 900 ~2 500 nm 左右都表現出第四類(高氮)施氮水平的光譜反射率最低,其次是第三類(中氮)施氮水平,第一類(不施氮)和第二類(低氮)施氮水平反射率值差別不大,二者(第三類、第四類)光譜反射率都高于第一類(不施氮)和第二類(低氮)施氮水平。由此表明應用水稻葉片光譜進行水稻氮素營養狀況分類識別具有可行性。

圖2 不同施氮水平下的水稻葉片光譜對比

2.2 光譜數據平滑處理分析

將240 組光譜原始數據進行平滑處理,平滑處理前后效果如圖3、4 所示。由圖3 可知,不同施氮水平的水稻葉片光譜反射曲線呈相同趨勢。在綠光區的550 nm 處,水稻葉片反射率出現波峰,在紅光區的680 nm 及短波紅外區的1 450和1 900 nm 處水稻葉片出現強烈吸收,形成波谷。該光譜反射現象與張亞彪等[26]的研究結果一致。由圖4 可知,經過平滑處理后的光譜反射曲線有效地消除了譜線平移、高頻隨機噪聲和光散射等因素的影響。

圖3 240 組樣本原始光譜

圖4 平滑處理后的水稻光譜

2.3 水稻葉片光譜數據特征降維分析

本研究采用主成分分析將平滑處理和歸一化處理后的光譜數據進行降維處理,由于光譜數據波長變量較多,本研究僅列出前30 個主成分的方差貢獻率,如圖5 所示。前3 個主成分相對較高,其中PC1 為62.310 2%、PC2 為26.326 2%和PC3 為6.418 46%,如圖5 所示。雖然前3 個主成分方差貢獻率較高,但從圖中可以看出,各類樣本點重疊嚴重,仍難以對4 類樣本進行區分,因此前3 個主成分并不能完全表征出原始數據的特征性。為能實現良好的水稻氮素營養狀況識別實驗效果,本研究選取前22 個主成分作為模型輸入數據,前22 個主成分累積貢獻度高達99.995 1%。

圖5 前30 個主成分的方差貢獻率

2.4 基于參數優化支持向量機的水稻氮素營養狀況分類識別模型分析

為探尋快速、便捷、無損的水稻氮素營養狀況定性診斷方法,將240 組樣本數據隨機分成兩組,分別為建模訓練集和建模測試集。其中160 組樣本作為建模訓練集樣本(每種施氮水平各40 組),80 組樣本作為建模測試集(每種施氮水平各20組)。本研究選用支持向量機模型(SVM 模型)進行水稻氮素營養狀況分類識別模型的建立,并以主成分分析降維后的22 維主成分作為模型的輸入數據。分別選用SVM 的默認參數[27]和網格搜索算法、粒子群算法、遺傳算法選取的最佳參數進行SVM 建模。其中,默認參數下的SVM 模型選擇誤差懲罰參數C 為1.000 0,核函數參數g 為10.000 0。4 類施氮水平(施氮由低到高)數據的模型輸出參數y 分別由1、2、3、4 代表。不同尋優方法選取最優參數的結果如表1 所示。由表可以看出,通過3 種參數優化的SVM 模型要優于默認參數下的整體識別效果,且基于遺傳算法的SVM 模型與另外兩種方法相比,尋優效果最佳,其誤差懲罰參數C 為2.261 4,核函數參數g 為7.568 3。

圖6 PC1、PC2 及PC3 得分散點分布

采用默認參數及3 種尋優方法進行支持向量機的水稻氮素營養分類識別模型建立,建模測試集各施氮水平識別效果如表2 所示。從整體來看,默認參數下的SVM 模型測試集平均識別效果最差,僅為87.500%,3 種尋優方法的SVM 模型測試集實驗效果較默認參數下的SVM 模型要好,均達到95.000%及以上,其中以基于遺傳算法優化SVM模型(GA-SVM)實驗效果最佳,高達98.750%,較基于網格搜索算法優化SVM 模型(Grid-SVM)和基于粒子群算法優化SVM(POS-SVM)分別高出3.75%和2.50%。從各施氮水平識別效果來看,默認參數下的SVM 模型在第二類(低氮)施氮水平上識別陷入局部最小,第二類(低氮)識別準確率僅為65.00%,其他3 類(第一類、第三類、第四類)施氮水平均達到95.000%,默認參數下的SVM 模型各施氮水平識別分類結果如圖7 所示。其他3 種參數優化的SVM 模型對第三類(中氮)、第四類(高氮)施氮水平都能夠很好地識別,達到100.000%,對第二類(低氮)施氮水平的識別都達到了95.000%。只有在第一類(不施氮)施氮水平上,識別效果產生了一定的差別?;谶z傳算法的SVM 模型較其他兩種優化算法優化的SVM 模型,僅第二類(低氮)施氮水平下的第40 組樣本被誤判為第三類(中氮)施氮水平;基于網格算法優化的SVM 模型中,第一類(不施氮)施氮水平下的第12、13 和14 組樣本被誤判為第二類(低氮)施氮水平,第二類(低氮)施氮水平下的第40 組樣本被誤判為第三類(中氮)施氮水平;基于粒子群算法優化的SVM 模型中,第一類(不施氮)施氮水平下的第12 和14 組樣本被誤判為N1 施氮水平,第二類(低氮)施氮水平下的第40 組樣本被誤判為第三類(中氮)施氮水平;而基于遺傳算法優化的SVM 模型僅將第二類(低氮)施氮水平下的第40 組樣本被誤判為第三類(中氮)施氮水平。3 種優化算法優化SVM 模型的各施氮水平識別分類結果如圖8、9、10 所示。

表1 不同參數尋優方法選取的最優參數及實驗效果

表2 不同施氮水平下的預測集識別效果對比 (%)

圖7 默認參數支持向量機模型的預測集識別分類結果

圖8 基于網格搜索算法優化支持向量機模型的預測集識別分類結果

圖9 基于粒子群算法優化支持向量機模型的預測集識別分類結果

圖10 基于遺傳算法優化支持向量機模型的預測集識別分類結果

3 討論

水稻冠層葉片光譜特征能夠為快速、便捷、無損地診斷氮素營養提供有利依據[28]。同時,建立水稻氮素營養的光譜診斷模型,可以快速診斷水稻氮素狀況,對指導有效施肥、合理施氮具有重要的現實意義[29]。因此,本研究通過光譜特征,利用機器學習方法建模進行水稻施氮水平分類識別,通過本研究的結果能夠為進一步的水稻氮素營養診斷定量分析提供支持,且本研究方法可以為作物氮素營養診斷識別研究提供一定的參考價值。而且,通過參考高產施肥方案,可指導農戶科學合理施肥[30]。

前人研究中,顧清等[31]提取了水稻葉片光譜和形狀特征,采用支持向量機方法進行水稻氮素營養狀況分類識別建模,其模型對于過氮水平樣本難以識別;周瓊等[23]采用遺傳算法優化支持向量機方法進行水稻氮素營養狀況分類識別中,能夠很好地區分缺氮和過氮水平樣本,但非低氮且非高氮的兩類施氮水平樣本卻不易區分。楊紅云等[32]采用高光譜技術和支持向量機方法建立了水稻氮素營養狀況分類識別模型,其模型解決了水稻各類施氮水平樣本難以識別的問題,且測試集平均識別準確率達97.5%。本研究同樣采用高光譜技術和支持向量機方法建立水稻氮素營養狀況分類識別模型,同時考慮到支持向量機懲罰參數C 和核函數參數g 的選擇問題,并分別采用網格搜索算法、粒子群算法和遺傳算法對支持向量機的參數進行優化選擇。本研究的結果表明,建立的該模型不僅能夠解決各施氮水平樣本難以識別的問題,而且基于遺傳算法優化支持向量機所建立的水稻氮素營養分類識別模型較楊紅云等[32]的效果更佳,預測集平均識別準確率達98.750%,高出1.250%,僅第二類(低氮)的第40 組樣本被誤判為第三類(中氮)。

獲取的原始光譜數據中必然存在數據噪聲,各波長原始光譜反射率間必然存在相關性。因此,有必要對原始光譜數據進行有效的預處理。本研究中通過采用平滑處理和歸一化處理消除噪聲和量綱的影響,以及采用主成分分析方法對光譜數據進行降維,以減少各波長光譜反射率間的相關性。通過模型的氮素營養診斷識別準確率來看,雖通過本研究方法能夠達到較為理想的效果,但在未來的研究中,需要引入更多的消除噪聲和降維的方法,以實現更具通用性和實用性的水稻氮素營養診斷模型。降維處理可嘗試使用連續投影算法(SPA)[6,33]、因子分析[34]等方法,去噪處理可嘗試使用多元散射校正(MSC)[35-36]、變量標準化校正(SNV)以及基線校正的方法[18]。

本研究采用高光譜技術和支持向量機方法進行水稻氮素營養狀況分類識別,屬于水稻氮素營養診斷的初步性研究,改善之處尚多。研究中僅以2018 年的“中嘉早17”作為供試樣本,所建立的水稻氮素營養分類識別模型在其他年限和水稻品種中的應用性還需要進一步研究。本研究僅獲取水稻分蘗期頂三葉葉片的4 個施氮水平葉片高光譜數據,樣本數目相對較少,僅有240 組。為能夠使得水稻氮素營養分類識別模型更具有通用性與實用性以及提高樣本的容錯率,在未來的研究中,將獲取更多年份、水稻品種及葉位等的高光譜數據進行研究,并且提高模型建立的樣本總量,以及增加水稻氮素營養診斷的施氮水平數目,為進一步積極探索水稻氮素營養診斷的定量分析奠定理論基礎,也為科學施肥,提高氮肥利用率,保證作物高產穩產提供理論依據。

4 結論

本文選用水稻分蘗期頂三葉葉片原始光譜數據,采用平滑處理去除光譜數據噪聲、歸一化處理消除光譜數據的量綱影響,同時采用主成分分析的方法減少各波長光譜反射率間的相關性。最后,分別采用網格搜索算法、粒子群算法和遺傳算法優化的支持向量機進行水稻氮素營養診斷模型的建立。研究結果表明,通過采用3 種優化算法優化的SVM模型進行水稻氮素營養高光譜診斷具有一定可行性,都優于默認參數下的SVM 模型。其中,應用遺傳算法優化的SVM 模型進行水稻氮素營養診斷最佳,各施氮水平測試集識別準確率分別為100%、95%、100%和100%,其預測集平均識別準確率達98.750%,僅第二類(低氮)的第40 組樣本被誤判為第三類(中氮)。說明利用高光譜技術進行水稻氮素營養水平的診斷具有一定的可行性。因此,基于遺傳算法優化參數的支持向量機模型應用于水稻氮素營養的缺失識別具有一定優勢。為實時、快速、準確地實現水稻氮素營養診斷研究提供了一種新思路和方法,以指導合理施氮,提高水稻的產量。

猜你喜歡
施氮反射率氮素
利用鏡質組反射率鑒定蘭炭與煤粉互混樣的方法解析
商品條碼印制質量檢測參數
——缺陷度的算法研究
車燈反射腔真空鍍鋁反射率研究
不同產量潛力小麥品種氮素積累與轉運的差異
硅基膜材緩控釋肥在紅壤中的氮素釋放特征研究
不同生育期大豆品種氮素積累特性研究
施氮水平對油菜生育后期氮素吸收積累和分配的影響
基于地面邊緣反射率網格地圖的自動駕駛車輛定位技術
施氮對不同耐氮性甘薯品種干物質積累與分配及產量的影響
施氮量及氮肥運籌對超級粳稻生長發育和氮素利用特性的影響
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合