?

水稻葉片SPAD 值高光譜成像估測

2020-11-16 02:18孔慶明賈銀江施玉博蘇中濱
東北農業大學學報 2020年10期
關鍵詞:染病反射率光譜

康 麗,高 睿,孔慶明,賈銀江,施玉博,蘇中濱*

(1.東北農業大學電氣與信息學院,哈爾濱 150030;2.大連工業大學信息科學與工程學院,遼寧 大連 116034;3.國網哈爾濱供電公司,哈爾濱 150000)

葉綠素含量是作物生長重要理化指標,可表征作物生長狀況,為農業遙感、生態監測等領域重要生物量衡量指標。傳統葉綠素含量檢測結果精確,但工序繁瑣、破壞性大、效率低。研究表明,SPAD(Soil and plant analyzer development)值可替代傳統方式衡量葉綠素含量[1],應用于科研及生產。但目前SPAD值測量設備必須逐點接觸測量,耗時長、工作量大。近年來光譜檢測技術[2],尤其高光譜檢測技術,以其“圖譜合一”特色兼具快速、無損、綠色等優勢被廣泛應用。在葉綠素含量估測方面,程志慶等以不同水肥脅迫楊樹葉片為研究對象,驗證SPAD值表示楊樹葉片葉綠素含量,并建立SPAD值高光譜估測模型[3];于滋洋等通過6個氮梯度處理試驗獲取樣本,利用隨機森林模型綜合葉綠素敏感波段和水分吸收因素,對水稻SPAD值作高光譜估測[4];于雷等在大豆鼓粒期采集80個不同田塊大豆葉片,經IRIV算法篩選獲得光譜特征波長變量,構建大豆葉片SPAD值估測模型[5];董哲等對大田不同區域不同葉位隨機采樣,基于全譜和光譜特征參數建模估測玉米葉片SPAD值[6];岳學軍等采集嫩綠、淺綠、深綠3種生長狀態龍眼葉片,基于高光譜圖像和卷積神經網絡預測葉片葉綠素含量分布[7]。

以上研究主要基于不同水肥脅迫、區域、生長位置或生長狀態等情況下葉綠素含量變化。當作物遭到病蟲災害侵染后其葉片葉綠素含量發生變化,對于病蟲災害狀態下作物葉綠素含量高光譜估測研究相對較少。Wang等基于連續小波變換對冬小麥凍害葉片作SPAD值估測[8];謝傳奇等通過人為接種病菌,研究病害番茄葉片SPAD值高光譜估測[9]。周曉等通過人為投蟲,建立多個稻縱卷葉螟蟲害水稻冠層SPAD值高光譜估測模型[10]。目前作物病害狀態下葉綠素含量估測研究主要基于人工接種病菌,自然發病研究鮮有報道。本研究以水稻葉片為研究對象,自然發病為前提,采集健康和稻瘟病染病葉片,基于高光譜技術,采用不同特征變量選取方法,運用多種模型構建算法,構建水稻葉片SPAD值估測模型,并通過對比分析獲得最優模型。旨在為冠層、區域尺度估測提供研究基礎,為實時定量監測水稻健康狀況、評估病害影響提供理論支持。

1 材料與方法

1.1 數據采集

1.1.1 樣本采集

試驗地位于黑龍江省哈爾濱市方正縣水稻研究院試驗大田。試驗品種為東農426,試驗區面積760 m2。為獲取稻瘟病自然發病樣本,試驗區不作病蟲害防治處理,其他田間管理正常。通過田間觀測調查,水稻拔節期出現明顯發病植株,采集染病及健康葉片放入保溫箱,立即帶回試驗區內實驗室測量,最終獲得有效樣本共計242片,其中健康葉片92片,染病葉片150片。

1.1.2 高光譜圖像采集及SPAD值測定

高光譜圖像獲取采用美國HeadWall公司高光譜成像系統。系統主要由高光譜相機、載物臺、鹵素燈光源、光源箱、采集器、計算機等部件組成。測量光譜范圍400~1 000 nm,光譜分辨率2.4 nm,采樣間隔3 nm。鏡頭垂直向下固定高度為45 cm,曝光時間30 ms,將待測葉片平鋪在移動平臺黑紙板上采集圖像。經多次調整,載物臺移動速度設置為3.0 mm·s-1。為消除因光源強度分布不均、鏡頭中暗電流等因素所產生影響,采集圖像前作反射率標定,公式為:

式(1)中,Rw為掃描標準白板獲取標準圖像,Rb為關閉快門并蓋上鏡頭蓋獲取暗場圖像,Rr為待校正高光譜圖像,R為校正后高光譜圖像。圖1中(a)、(b)分別為健康葉片和染病葉片高光譜圖像(前端顯示圖像為643.921、552.054和472.041 nm波段合成)。

葉片SPAD值采用型號為TYS-3N植物養分測定儀與高光譜圖像采集同步測量。分散選取葉片葉脈兩側各3個點(染病葉片需包含病斑)測定葉綠素含量,計算所有測量點平均值作為該葉片SPAD值。

1.2 高光譜數據獲取及樣本劃分

利用ENVI5.3軟件選取葉片高光譜圖像葉脈兩側各3個矩形區域(染病葉片需包含病斑)為感興趣區域,計算區域內所有像素點光譜反射率平均值,得到該葉片高光譜數據。為降低由儀器、環境等因素產生噪聲對模型干擾,采用Savitzky-Golay(SG)卷積平滑算法對全部樣本高光譜數據作預處理。SG平滑算法既可有效消除噪聲又不丟失有效信息細節,是高光譜數據處理中最常用預處理方法。

將242個水稻葉片樣本高光譜數據按照SPAD值升序排序,每隔2個樣本選取1個,共取81個樣本(染病48、健康33)作為驗證集,其余161個作為建模集(染病102、健康59),建模集、預測集和總體樣本描述性統計如表1所示。

表1 SPAD值描述性統計Table 1 Descriptive statistics of SPAD value

1.3 特征變量選取

高光譜數據包含光譜波段多、數據量大,通常存在數據冗余、共線性甚至部分數據與所求不相關等情況,為保證建模精度、降低模型復雜度、提高運算速度,研究采用高光譜特征參數、競爭性自適應重加權(Competitive adaptive reweighted sampling,CARS)和主成分分析(Principle component analysis,PCA)3種方案對高光譜數據作水稻葉片SPAD值特征變量選取。

選用對綠色植物特征體現最明顯“紅邊”、綠峰反射率、紅谷反射率高光譜特征參數作分析建模?!凹t邊”參數包括紅邊幅值Dr、紅邊位置λr和紅邊面積SDr3個參數。紅邊幅值Dr和紅邊位置λr指紅邊(680~760 nm)內一階導數光譜最大值及其對應波長位置;紅邊面積SDr指在紅邊波段內一階導數光譜積分。綠峰反射率Rg即綠光(510~560 nm)內光譜反射率最大值;紅谷反射率Rr即紅光(650~690 nm)內光譜反射率最小值。

CARS是一種將蒙特卡羅采樣與偏最小二乘法(Partial least squares,PLS)模型回歸系數相結合實現特征波長選擇的方法。每次計算自適應加權采樣回歸系數權重,選取PLS模型中回歸系數絕對值權重較大、剔除權重較小變量;以剩余變量為新子集重新建立PLS模型計算、選取、剔除;經多次運算,最終利用交互驗證選取均方根誤差最低子集為特征波長。

PCA為常用數據壓縮、特征提取算法。PCA算法通過正交變換使具有相關性變量轉換為相互無關變量,保留有用信息同時充分解決數據冗余、共線性等問題,實現數據降維、特征變量提取。變換后用幾個新變量即主成分(Principle component,PC)代替原變量,在最大限度保留原變量信息同時,將主要信息集中在前幾個互不相關且正交PC中。

1.4 模型構建與精度驗證

為充分考慮高光譜數據中與水稻葉片SPAD值相關線性、非線性信息,選用偏最小二乘法回歸(Partial least squares regression,PLSR)線性建模算法、支持向量機(Support vector machine,SVM)和反向傳播神經網絡(Back propagation neural network,BPNN)非線性建模算法構建水稻葉片SPAD值高光譜估測模型。PLSR可用于解決科技領域常規回歸模型難以解決問題[11],在計算過程中同時考慮光譜矩陣X變量和理化性質Y變量作用,有效消除自變量之間多重共線性干擾。SVM是一種以統計學習理論為基礎機器學習算法,采用結構化風險最小化準則,保證樣本誤差最小同時縮小模型泛化誤差上界以提高模型泛化能力,具有精度高、運算速度快、泛化能力強等優點,適用于解決小樣本、非線性及復雜關系建模[12]。BPNN是由非線性變換神經單元組成一種前饋型神經網絡,主要采用誤差反向傳播算法不斷修正網絡連接權值,使實際輸出值與預測值之間誤差最小,可實現輸入和輸出任意非線性映射。

模型精度驗證指標采用建模決定系數(Rc2)、預測決定系數(Rp2)、建模均方根誤差(RMSEC)、預測均方根誤差(RMSEP)及預測集相對誤差(RE)。Rc2、Rp2越大、RMSEC、RMSEP越小、RE越小,模型精度越高,預測效果越好。

高光譜數據獲取、處理及分析主要使用ENVI5.3、The Unscrambler X 10.4、MATLABR2019a及SPSS 25等軟件完成。

2 結果與分析

2.1 葉片光譜特征分析

染病和健康葉片在400~1 000 nm波段光譜曲線總體輪廓相同,均明顯呈現綠色植物光譜特征:綠光波段560 nm附近有明顯反射峰即“綠峰”,紅光波段680 nm附近出現反射率低谷即“紅谷”,700~760 nm光譜反射率急劇增強,760 nm后反射率變化趨緩。

通過分析染病和健康葉片平均光譜反射率差異顯著,如圖2所示。在530~570 nm波段染病葉片光譜反射率明顯低于健康葉片,綠峰波段附近差異最大;580~720 nm波段染病葉片光譜反射率高于健康葉片;730~900 nm近紅外區染病葉片光譜反射率低于健康樣本,760 nm附近差值最大。產生差異主要原因是:當葉片感染稻瘟病后,病菌致使葉綠素含量降低,葉片光合作用減弱,導致葉片對綠光反射能力下降,反射率降低;葉綠素、胡蘿卜素等葉色素含量降低,導致葉片對紅光吸收能力減弱,反射率增大;病菌不斷侵染致使葉片細胞間隙甚至結構發生變化,導致葉片在近紅外波段反射能力下降。

2.2 基于高光譜特征參數建模預測

計算“紅邊”、綠峰反射率、紅谷反射率高光譜特征參數值并與葉片SPAD值作相關性分析。結果顯示紅邊位置λr與SPAD值呈正相關,相關系數為0.4783,紅邊面積SDr、紅邊幅值Dr、綠峰反射率Rg、紅谷反射率Rr均與SPAD值呈負相關,相關系數分別為-0.2127、-0.5122、-0.7392、-0.6519。5個參數均與SPAD值0.01水平顯著相關,因此以這5個高光譜特征參數為自變量,建立SPAD值偏最小二乘回歸(PLSR)模型記為PLSR(Characteristicparameters)。模型建模集和預測集 Rc2、Rp2分別為0.7249、0.6777,RMSEC、RMSEP分別為2.4081、2.6984,預測集RE為5.50%,預測集散點圖如圖3(a)所示。

PLSR屬于線性建模方法,為將光譜非線性特征納入模型中,采用支持向量機(SVM)和反向傳播神經網絡(BPNN)作非線性建模。SVM模型類型選用nu-SVC,核函數為Radial basis function,采用十折交叉驗證,核函數參數利用網格搜索獲得最優分類預測結果,結果如圖2(b)所示。BPNN經反復訓練確定模型主要參數:隱含層數為1,學習速率為0.1,動量因子為0.9,最大允許誤差為0.0001,隱含層節點數為5,使用梯度下降優化算法,預測結果如圖3(c)所示。

由圖 3 可見,SVM(Characteristicparameters)模型、BPNN(Characteristicparameters)模型預測集決定系數Rp2分別為0.7305、0.7545,較 PLSR(Characteristicparameters)提高 7.79%、11.33%,均方根誤差RMSEP分別為2.4355、2.3318,較PLSR(Characteristicparameters)降低9.74%、13.58%,相對誤差RE分別為4.84%、4.57%,較PLSR(Characteristicparameters)降低12%、16.91%,二者預測精度均高于PLSR模型。

2.3 CARS特征波長選擇及建模預測

2.3.1 CARS特征波長選擇

采用CARS對高光譜數據作SPAD值特征波長選擇,選擇過程見圖4,采樣次數設置為50。由圖4(a)可見,隨采樣次數增加變量個數逐步減少;PLS模型交叉驗證RMSECV值隨采樣次數增加先降后升,見圖4(b);由圖4(c)中星號位置可知,當采樣次數達38次時,RMSECV值最低,表明已去除與SPAD值不相關或共線性變量,此后,RMSECV值逐步變大,尤其39次后陡然上升,表明與SPAD值相關部分變量被剔除,模型性能變差。因此,選擇第38次采樣獲得變量為特征波長,包括442.407、507.603、569.835、756.532、883.961 和969.901 nm共6個,分布見圖5。

2.3.2 模型構建

通過CARS選取6個特征波長為輸入,分別采用PLS、SVM和BPNN 3種建模算法構建水稻葉片SPAD值估測模型CARS-PLSR、CARS-SVM和CARS-BPNN,預測結果見圖6。由圖6可見,CARS-PLSR模型預測精度在3個模型中最低,預測集決定系數Rp2為0.7067,均方根誤差RMSEP為2.5908;CARS-SVM模型預測精度略高于CARS-PLSR模型,預測集決定系數Rp2為0.7264,均方根誤差RMSEP為2.4512;CARS-BPNN模型精度最高,較前兩個模型提高明顯,其預測集決定系數Rp2為0.7629,均方根誤差RMSEP為2.2871,較精度最低CARS-PLSR模型分別提高7.95%、11.72%。

2.4 PCA特征提取及建模預測

2.4.1 PCA特征提取

采用主成分分析對所有葉片樣本高光譜數據作特征提取,表2為前8個主成分(Principle component,PC)特征值和累積貢獻率??梢姷谝粋€主成分貢獻率占比最大,為71.96%,后續每個主成分占比少,但累積貢獻率增加,前8個主成分累積貢獻率已達99.21%,表達接近全部光譜特征信息。主成分個數選擇常規標準是方差累積貢獻率≥85%或者特征值≥1。由表2可知,前2個PC累積貢獻率為88.75,滿足≥85%標準;第5個PC特征值為1.764,第6個主成分特征值為0.664,前5個主成分滿足特征值≥1。分別以前2、5個主成分為自變量建立多元線性回歸模型,二者建模決定系數Rc2分別為0.6049、0.7407,后者優于前者,因此選擇前5個主成分作為特征變量繼續建模分析。

表2 前8個主成分特征值和累積貢獻率Table 2 Eigenvalues and the cumulative contributions of the first eight principal components

2.4.2 模型構建

以PCA選取前5個主成分為輸入,分別采用PLSR、SVM和BPNN算法構建水稻葉片SPAD值估測模型PCA-PLSR、PCA-SVM和PCA-BPNN,預測結果見圖7。

由圖7可知,3個模型中預測精度最低是PCAPLSR模型,其預測集決定系數Rp2為0.6980,均方根誤差RMSEP為2.6002。PCA-SVM模型、PCABPNN模型預測精度均高于PCA-PLSR模型,二者預測集決定系數Rp2分別為0.7642、0.8082,較PCA-PLSR分別提高9.48%、15.79%,二者均方根誤差RMSEP分別為2.2807、2.0783,較PCA-PLSR降低12.29%、20.07%。

2.5 模型比較

以上基于高光譜特征參數、CARS選擇特征波段和PCA提取特征變量,采用PLSR、SVM和BPNN構建水稻葉片SPAD值高光譜估測模型,建模集及預測集詳細結果如表3所示。

由表3可知,非線性模型中,PCA-SVM、PCABPNN模型精度分別高于CARS-SVM、CARSBPNN、SVM(Characteristicparameters)和 BPNN(Characteristicparameters),而線性模型中,PLSR(Characteristicparameters)和PCA-PLSR模型精度略低于CARS-PLSR,說明PCA提取特征變量相對較好保留與葉片SPAD值相關非線性信息,而CARS選擇特征波段相對較好保留與葉片SPAD值相關線性信息。相同特征變量選取算法下,SVM、BPNN模型精度均高于PLSR模型,BPNN模型精度全部高于SVM模型,如以CARS提取特征波段為輸入模型中,CARS-SVM、CARS-BPNN精度高于CARS-PLSR, CARS-BPNN精度高于CARSSVM,說明相對于線性建模方式,非線性建模方式,尤其BPNN相對更適用于水稻葉片SPAD值估測建模。

表3 SPAD值估測模型建模集和預測集結果Table 3 Calibration and prediction sets results of estimation models SPAD value

所有模型中,PCA-BPNN模型建模集和預測集各項指標均優于其他模型。在樣本建模集擬合度和精度方面,PCA-BPNN模型建模集決定系數Rc2為0.8712、均方根誤差RMSEC為1.6479,與相對精度最低PLSR(Characteristicparameters)模型相比,分別優化20.18%、30.57%;在預測樣本擬合度和精度方面,PCA-BPNN模型預測集決定系數Rp2、均方根誤差RMSEP、相對誤差RE分別為0.8082、2.0783、4.18%,比PLSR模型分別優化19.26%、22.98%、24%。CARS-BPNN模型建模集精度僅次于PCABPNN,決定系數為0.8468、均方根誤差RMSEC為1.7971,但預測集精度明顯較PCA-BPNN低,Rp2、RMSEP、RE分別低5.61%、10.05%、10.77%。因此,PCA-BPNN為本研究最優模型。

3 討論與結論

以大田水稻葉片為研究對象、自然發生稻瘟病為前提,分析染病及健康水稻葉片高光譜數據,分別以高光譜特征參數、CARS和PCA提取特征變量為輸入數據,運用PLSR、SVM和BPNN算法,構建并對比分析葉片SPAD值高光譜估測模型,研究結果如下:

獲取并分析染病及健康水稻葉片高光譜數據,染病葉片和健康葉片平均光譜反射率總體輪廓相似,平均光譜反射率530~570 nm、730~900 nm波段染病葉片低于健康葉片,在580~720 nm波段染病葉片高于健康葉片,符合綠色植物遭到病蟲害侵染后光譜特征,與Ashourloo等和Lu等研究結果一致[13-14]。

采用高光譜特征參數、CARS和PCA作特征提取,CARS選擇特征波段較高光譜特征參數和PCA提取特征變量保留與葉片SPAD值相關線性信息多,PCA保留非線性信息較CARS和高光譜特征參數多,相對于線性建模方式,非線性建模方式尤其BPNN更適用于水稻葉片SPAD值建模。最優模型為PCA-BPNN,建模集和預測集Rc2、Rp2分別為0.8712、0.8082,RMSEC、RMSEP分別為1.6479、2.0783,預測集RE為4.18%。對比其他SPAD值高光譜估測研究,預測精度比雷祥祥等提高[15],但與李媛媛等研究精度存在差距[16],主要是由于大田環境相對復雜、影響因素多,自然發病位置及狀態相對人工接種發病更難以精確控制。

限于時間、環境等條件,本研究未開展大范圍試驗,今后將增加試驗地域和時間跨度,擴大樣本空間,完善數據采集、分析處理等,進一步提升水稻葉片SPAD值估測精度,以實現為水稻生長狀況實時定量精準監測提供技術支持,為水稻精準化、智能化種植提供理論依據。

猜你喜歡
染病反射率光譜
利用鏡質組反射率鑒定蘭炭與煤粉互混樣的方法解析
基于三維Saab變換的高光譜圖像壓縮方法
偶感
商品條碼印制質量檢測參數
——缺陷度的算法研究
車燈反射腔真空鍍鋁反射率研究
基于3D-CNN的高光譜遙感圖像分類算法
活著
基于地面邊緣反射率網格地圖的自動駕駛車輛定位技術
愛 情
苦味酸與牛血清蛋白相互作用的光譜研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合