?

基于時序高光譜和多任務學習的水稻病害早期預測研究

2023-01-05 03:55曹益飛徐煥良吳玉強范加勤馮佳睿翟肇裕
農業機械學報 2022年11期
關鍵詞:葉枯病時序波長

曹益飛 徐煥良 吳玉強 范加勤 馮佳睿 翟肇裕

(1.南京農業大學人工智能學院,南京 210095;2.南京農業大學工學院,南京 210031;3.南京農業大學植物保護學院,南京 210095)

0 引言

水稻是人類重要的糧食作物之一,目前,約有56億人(占世界人口的80%)以水稻為主食[1-2]。水稻白葉枯是水稻三大病害之一,嚴重影響了水稻的產量,在稻田中分布不均勻、病菌來源廣、傳播途徑多、侵染時間長,發展傳播情況復雜[3]。近年來,白葉枯病的暴發面積約占總種植面積的1/3,平均病株率約為10%,給我國糧食安全帶來巨大威脅[4]。水稻白葉枯病由病原體引起,是一種在整個水稻生長期存在的細菌病害,主要浸染葉片,也可侵染葉鞘[5]。一般在26~30℃、相對濕度85%以上、多雨、光照不足、風速大的氣候條件下發生流行[6],且在發病初期,不易觀察到明顯病癥,但根據植物病理學理論[7],在白葉枯發病期,水稻葉片內部化學成分發生了變化,使得患病葉片對不同光譜波段的吸收率和反射率發生改變。隨著光學技術的發展,高光譜成像技術為獲取植物內部變化信息提供了可能[8-9]。在白葉枯病害脅迫下,水稻葉片將經歷兩個階段,包括無癥狀階段和有癥狀階段[5,10]。為了實現水稻白葉枯病害發病率和潛伏期的預測,則需要采集適宜條件下水稻葉片由無癥狀到有癥狀變化的整個階段的時序高光譜圖像。

目前,高光譜成像已被用于監測各種作物病害,如大豆炭疽病[11]、小麥白粉病[12]、水稻紋枯病[13]等病害的早期監測,很少有水稻白葉枯病的早期監測預警研究。高光譜成像技術在獲取作物葉片海量光譜信息和空間信息的同時也帶來了巨大計算量的挑戰,深度學習是解決該難題的一個重要研究方向[9,14]。為了通過水稻葉片時序高光譜圖像對適宜條件下白葉枯病水稻葉片的發病率(即接種過白葉枯病菌的水稻葉片病害區域占葉面積的比例)和潛伏期(即從接種操作開始到出現癥狀的時間)進行預測,將發病率和潛伏期設為兩個任務。如果分別使用兩個模型來分別預測病害發病率和潛伏期,就會出現占用過多計算和存儲空間的問題。多任務學習(Multi-task learning, MTL)具有共享特征、相互輔助的特點[15]。

近年來,以長短期記憶網絡(Long-short term memory, LSTM)為代表的深度學習算法對時序數據的分析得到了廣泛的應用。研究表明,對于時間序列數據,LSTM的性能優于深度前饋神經網絡[16]。LSTM可以通過記憶單元和門控機制捕獲長期依賴關系,有效地從包含時間信息的數據中學習順序模式[17]。SU等[18]基于時序多光譜圖像對小麥黃銹病進行時空監測,為農田尺度黃銹病的早期監測提供了重要指導。KIM等[2]結合環境條件和長短期記憶遞歸神經網絡對水稻稻瘟病進行早期預測,預測病害發生準確率達到67.4%。VERMA等[19]利用視頻流數據分析和LSTM卷積神經網絡來預測水稻病害,結果表明基于模糊特征構建的預測模型取得了很好的預測效果。以上研究大多關注病害發病率,而忽視了作物病害潛伏期,因此無法及時指導作物病害防治策略的制定。

本研究結合時序高光譜圖像與深度學習建立水稻白葉枯病早期預測模型。該預測模型基于時序高光譜數據,融合多任務學習與LSTM網絡,實現白葉枯病發病率和潛伏期的預測。通過連續采集健康和發病初期的葉片高光譜數據,探索利用隨機森林(Random forest, RF)和主成分分析(Principal component analysis, PCA)從原始高光譜中提取光譜特征;利用基于全波段光譜數據集(232個波長)以及不同降維方法得到的時序高光譜特征數據集訓練MTL-LSTM模型;利用鯨魚優化算法(Whale optimization algorithm, WOA)優化MTL-LSTM模型,并評估模型優化前后的性能,以期為科學防治作物病害提供思路,為病害預測提供技術支持。

1 預測模型建立

使用白葉枯病脅迫下的水稻葉片時序高光譜圖像構建早期病害發病率和潛伏期的預測模型。

1.1 水稻種植及實驗地情況

為了確保水稻葉片在感染白葉枯病之后到出現明顯病斑之前,有足夠時間來觀測無明顯癥狀的水稻葉片高光譜的變化,本實驗選擇高抗白葉枯水稻品種作為實驗對象。溫室實驗于2020年在南京農業大學溫室實驗基地進行。種植前挑選飽滿種粒,浸種、催芽,水稻種植在填充有水稻粘土的塑料杯(直徑35 cm×高32 cm)中。首先,在溫室內培育幼苗(圖1a),然后分別移栽到塑料杯中,每杯3株水稻(圖1b),共計50杯。為了模擬水稻在自然生長環境中的管理實踐,在移栽之前施用基礎營養肥料(包括CO(NH2)2,150 kg/hm2;P2O5,135 kg/hm2;K2O,18.3 kg/hm2),并在分蘗開始階段第2次追肥(N,150 kg/hm2)。為了監測水稻白葉枯病在條件適宜情況下的發病天數,將幼苗移栽后,放在自然環境下生長,根據需要進行灌溉,以確保每個塑料杯中的土壤始終被淺層水覆蓋,直到接種病菌前一周轉移到溫室。溫室由兩層透明材料組成,配備了空調和加濕設施,為白葉枯病菌的人工接種提供合適的環境條件。

圖1 不同生育期水稻苗栽培示意圖

1.2 實驗材料制備及數據采集

1.2.1實驗材料制備

本實驗所接種的白葉枯病菌由南京農業大學植物保護學院提供,為稻黃單胞菌稻致病變種(Xanthomonasoryzaepv,oryzae,Xoo),病菌通常由水稻的傷口或水孔侵入水稻葉片,進入木質部進行繁殖,并由葉片向葉鞘侵染[20]。實驗材料制備具體操作過程如下:首先,取出于-70℃保存的菌株,在超凈工作臺上使用滅菌槍頭吸取菌液,隨后轉移至平板培養基(牛肉提取物0.3%、肉蛋白胨1%、蔗糖1%和瓊脂2%)上,用滅菌接種環涂布均勻,置于28℃培養箱中培養48 h,此時細菌呈現亮黃色。然后,用磷酸鹽緩沖液稀釋,采用比濁法將細菌培養液稀釋至每毫升約9×109個細菌。最后,將所有水稻樣本按照比例1∶4分配,其中40杯采用常見的剪葉法使病菌侵染葉片,用已消毒的手術剪刀蘸取菌液,剪掉分蘗期每株水稻劍葉和倒二葉尖端1 cm長的部分,完成病菌接種,所有病菌接種操作均在病菌懸浮液制備后3 h內完成;同時,另外10杯作為參照組,即用已消毒的手術剪刀蘸取純凈水進行相同的剪葉操作。在適宜條件下,病菌侵入至癥狀表現只需3~5 d。同一品種苗期到分蘗期抗病能力較強、分蘗末期抗病力下降、孕穗期和抽穗期最易感病。最后,將接種病菌的所有水稻植株放回溫室繼續培育。為了確保病菌成功侵染葉片,且環境條件適宜病害發展,需要嚴格控制環境變量,控制溫室內溫度為26~30℃、相對濕度超過90%、光照周期為14 h,為采集病害脅迫下水稻葉片的時序高光譜圖像做準備。

1.2.2數據采集

本實驗采用上海五鈴光電科技有限公司的推掃型高光譜成像系統的內部組件,主要包括成像鏡頭、鹵素燈光源、電控步進載物臺等,如圖2所示。

圖2 高光譜成像系統內部構成圖

高光譜成像系統主要部件參數如表1所示。采集軟件由Spectral-image成像軟件和HSI Analyzer分析軟件組成。

表1 高光譜成像系統主要部件參數

時序高光譜圖像采集過程:以病原菌接種當天為初始點,每隔24 h對樣本進行高光譜成像實驗,直至所有感染葉片出現明顯病斑結束實驗(本實驗7 d全部出現明顯病斑)。實驗中,固定每天采集時間(12:00—14:00)和儀器光照強度(150 lx)、相機垂直角度(90°)、物距(27 cm)等因素,確保采集數據的時序一致性。最終,按照上述流程,共采集連續7 d的高光譜數據,包括60×7個對照葉片和240×7個病害葉片的時序高光譜數據。

1.3 光譜校正與預處理

使用1.2.2節中所述的高光譜成像系統采集水稻病害葉片在波段378.28~1 033.05 nm范圍內的高光譜圖像。由于成像系統本身及其他因素的影響,獲取的高光譜圖像具有不穩定性。因此,需要對高光譜圖像進行黑白校正,具體技術細節參照文獻[21]。利用ENVI 5.1x(Research System Inc, boulder, Co.,美國)提取校正后水稻葉片高光譜圖像中的感興趣區域(Region of interest, ROI),圖3為ROI選取示意圖,其中紅框區域為選定的待分析ROI。

圖3 ROI選取示意圖

如圖3所示,為了更好地表征無癥狀區域的光譜,每個ROI包含9個小紅框,計算每一個小紅框中所有光譜的平均光譜,共計9條平均光譜作為該ROI的光譜樣本對多任務進行預測,包括水稻葉片白葉枯病害的發病率。由于白葉枯病菌可以通過葉脈傳播,越靠近接種點病害的脅迫癥狀越明顯,因此選擇靠近接種點處的ROI作為待分析的對象。在水稻高光譜數據采集完成后,通過分析高光譜圖像,對水稻葉片發病率和潛伏期進行統計。一方面,通過計算水稻葉片病害面積占整個水稻葉面積的比例來計算水稻葉片發病率。由于采用人工剪葉的方式接種病菌,且白葉枯病菌是沿著維管束侵染葉片,假設侵染速度相同,故可以用發病區域的長度占葉片長度的比率近似為病害面積占整片水稻葉面積的比率,圖4為白葉枯病菌侵染的水稻葉片,紅色框為發病區域。另一方面,通過目視檢測的方法,統計水稻潛伏期(如從病害接種到出現明顯癥狀的時間為 4 d,則將病害潛伏期記為 3 d,接種第1天不計)。

圖4 白葉枯病菌侵染的水稻葉片

利用ENVI 5.1x提取尺寸為50像素×50像素的ROI光譜圖像作為該葉片的樣本,并提取每個ROI的平均光譜,每個ROI的9條平均光譜如圖5所示。由圖5可以看出,高光譜存在噪聲,尤其是小于450 nm波段和大于950 nm波段。常見方法是刪除噪聲較大的波段[22],本研究為了消除光譜信號中的隨機噪聲,提高采樣信號的信噪比,截取450~950 nm之間的波段進行分析,使用Savitzky-Golay(SG)平滑濾波器減少隨機噪聲(核大小為5×5×5,多項式階數為3)。

圖5 不同狀態下水稻葉片ROI的9條平均光譜

1.4 高光譜數據降維

考慮到待分析的高光譜圖像涵蓋450~950 nm之間的所有光譜信息,共計232個波長,其特點是相鄰波長之間存在高維冗余,給計算速度帶來了巨大挑戰。為解決這個問題,在對采集到的高光譜原始數據的處理過程中,對數據進行降維操作是有效的方法,在不丟失有效光譜信息的基礎上降低后續計算的成本。常見的高光譜數據降維方法有特征提取和波段選擇。選用常見的主成分分析法[23]對高光譜進行特征提取,同時利用隨機森林算法[24]提取對病害敏感的特征波長對高光譜圖像進行波段選擇。

1.4.1基于PCA的光譜特征提取

PCA算法是一種常用的數據壓縮方法,常用于高維數據降維[25]。PCA可以提取原始高光譜數據的主成分(Principal components, PCs)。本文中主成分分析的主要思想是將232維光譜特征映射到k維(k<232)。與簡單地從原始空間中移除不太重要的維度特征相反,通過將原始空間中的特征映射到新空間中,這些k維特征可以被視為主成分。本研究中,每個ROI包含9條光譜,預處理后每條光譜包含232個波長,即預處理后的高光譜數據的特征個數為232,主成分求解步驟如下:

(1)將預處理后的高光譜數據按列組成232行9列的光譜矩陣X。

(2)將X的每一行(即每一個波段光譜反射率)進行零均值化,即減去這一行的均值。

(3)求出光譜矩陣X的協方差矩陣。

(4)計算協方差矩陣的特征值及每個特征值對應的特征向量。

(5)將特征向量按對應特征值大小從上到下按行排列成矩陣,取前k行組成矩陣P,即為該ROI預處理后的光譜矩陣降維到k維后的數據。

1.4.2基于RF的光譜特征提取

RF算法隨機替換每個特征,對特征替換后生成的新袋外數據進行隨機森林測試,預測誤差率會發生變化[26]。特征波長對病害敏感性越高,被替換后的預測誤差率就越大。本文中,每條光譜有232個波長,即232個特征。通過這種方式,根據每個特征波長替換前后的錯誤率進行評分,從而獲得具有高重要性評分的特征波長[27]。為了降低原始高光譜數據的維數,本文根據重要分數選擇了不同數量的特征波長。隨機森林中決策樹數為Ntree,設為200,原始光譜特征數為d,設為232。每個特征Xj(j=1,2,…,d)的重要性得分計算步驟如下:

(1)計算第i個決策樹對應的袋外數據(Out-of-bag, OOB)OOBi的袋外誤差樣本(Out-of-bag-error, ErrOOB)ErrOOBi的數量。

(5)特征波長Xj的重要性得分Sim(Xj)計算公式為

(1)

利用PCA和RF對預處理后的高光譜進行降維處理,分別構建了全光譜波長數據集(232個波長)、RF特征波長數據集(10個波長)和PCA光譜特征數據集(10個主成分)共3個數據集,將其作為模型的輸入。

1.5 WOA-MTL-LSTM模型建立

本文旨在利用水稻病害葉片的時序高光譜數據預測在適宜條件下水稻葉片白葉枯病發病率和潛伏期。LSTM網絡是目前最常見的時序數據分析算法,本文擬利用MTL-LSTM對水稻病害時序高光譜進行建模,實現對水稻葉片白葉枯病發病率以及潛伏期的多任務預測。運用鯨魚優化算法對MTL-LSTM網絡進行優化,以獲得最優的病害預測模型來預測水稻葉片白葉枯病發病率和病害潛伏期。

1.5.1多任務學習

MTL是一種歸納遷移方法,能充分利用隱含在多個相關任務訓練信號中的特定領域信息。MTL通??煞譃橛补蚕砗蛙浌蚕韮煞N方式[28]。硬共享是通過共享不同任務間共用底部的隱層參數來實現特征提取與輸出,軟共享的形式則較為多樣,每個任務都具有單獨的參數,如兩個任務不進行參數共享,但對不同任務的參數增加L2范數的限制。硬共享網絡不容易陷入過擬合,但如果任務差異較大,模型結果較差。軟共享網絡通常參數較多,結構比較復雜,線上部署困難[29]。本文基于時序高光譜對適宜條件下感染白葉枯病害的水稻葉片的發病率(任務1)和潛伏期(任務2)進行預測,均屬于回歸任務,有較大相關性,故本文構建了參數硬共享網絡對水稻病害發病率和潛伏期進行預測。

在MTL中,每個任務的數據分布和重要性往往是不同的。MTL損失函數可以通過不同任務的平方損失函數的加權求和得到。損失值計算公式為

LMTL=αl1+βl2

(2)

(3)

α+β=1

(4)

式中LMTL——多任務學習模型損失值

l1、l2——發病率和潛伏期預測損失值

y1i——發病率實際值

y2i——潛伏期實際值

n——樣本數α、β——權重

1.5.2MTL-LSTM神經網絡

LSTM是一種改進的循環神經網絡(Recurrent neural networks, RNN),主要用于解決長序列訓練過程中梯度消失和梯度爆炸問題[30]。與普通的RNN相比,LSTM在時間序列預測方面有更好的表現,LSTM網絡善于利用數據中的時間特征來學習歷史數據的相關性,從而提高預測精度。LSTM模型的核心思想,分別為記憶元組和非線性的門單元,其中記憶元組用于保持系統的狀態,非線性的門單元用于在每一個時間點調節流入和流出記憶元組的信息。

在LSTM網絡中,LSTM單元的輸入變量有:前一個單元的狀態ct-1、前一個單元的輸出ht-1、當前單元的輸入xt,輸出變量有:當前輸出ht及當前狀態ct。LSTM網絡通過輸入門、遺忘門和輸出門來維持和更新神經網絡中細胞的狀態[31],如圖6所示。

圖6 LSTM結構圖

由于LSTM神經網絡包含時間記憶單元,適用于處理和預測時間序列數據中的間隔和延遲事件,有利于捕捉時序高光譜的長期和短期依賴關系[32]。在本研究的病害預測任務中選擇LSTM網絡單元組成子任務層,并基于此構建MTL-LSTM網絡。LSTM網絡最大訓練次數為100,學習率設為0.01,最小性能梯度為0.000 1,MTL-LSTM網絡的結構如圖7所示,構建由Embedding層、LSTM網絡層和Pooling層組成的多任務學習結構。將時序高光譜數據按病菌接種天數表示為x={x1,x2,…,x7}作為輸入,xi的大小為9n,n為處理后的光譜特征數(對于全光譜n記為232,對于光譜特征n記為10)。將相同位置ROI中的每一條光譜的反射率序列線性映射到一個向量中,然后應用LSTM對時序高光譜進行建模,獲取每一天光譜的表示向量h={h1,h2,…,h7}。通過共享LSTM層參數,得到不同病害接種天數時的LSTM網絡輸出特征,通過池化得到新的特征a={a1,a2,…,a7},輸入到不同的全連接層,進而實現水稻白葉枯病害發病率和潛伏期的預測任務。

圖7 MTL-LSTM網絡結構圖

1.5.3鯨魚優化算法

鯨魚優化算法是一種新型的群智能算法,其基本思想來源于座頭鯨氣泡網狩獵策略,該策略融合了座頭鯨收縮包圍獵物和螺旋狩獵方式的局部開發能力,具有搜索能力強、收斂速度快以及能夠跳出局部最優等特點[33]。本實驗鯨魚優化算法被用于優化MTL-LSTM網絡模型的參數,每條鯨魚被看作是一種優化策略,其位置的維數對應MTL-LSTM網絡待優化參數的個數,鯨魚在不斷更新自身位置的過程中能夠獲得MTL-LSTM網絡的最優參數組合。

1.5.4WOA-MTL-LSTM模型設計

LSTM網絡在挖掘時序數據方面具有明顯的優勢,本文利用MTL-LSTM網絡預測水稻發病率和病害潛伏期。實踐證明,MTL-LSTM網絡隱含層神經元個數m以及時間步長s的選擇對預測精度有不可忽略的影響[34]。

目前,MTL-LSTM網絡的隱含層神經元個數m只能由經驗公式確定大致范圍,無法獲得準確最優神經元個數m。時間步長s就是循環單元結構的個數,若時間步長s過小則會失去不同時刻間信息的關聯性,若時間步長s過大則會減弱神經網絡的學習能力。因此,本文通過鯨魚優化算法對MTL-LSTM網絡的神經元個數m及時間步長s進行尋優?;邛L魚優化算法的MTL-LSTM模型(WOA-MTL-LSTM模型)預測白葉枯病發病率和潛伏期的流程圖如圖8所示。

圖8 WOA-MTL-LSTM模型流程圖

具體步驟如下:

(1)基于水稻病害葉片時序高光譜構建MTL-LSTM網絡,隨機初始化MTL-LSTM網絡隱含層神經元個數m和時間步長s。

(2)設置鯨魚種群位置的上下界,確定生成鯨魚種群數量X、最大迭代次數和鯨魚個體空間維度,將變量(m,s)組合作為鯨魚算法待優化參數。

(3)計算每個個體的適應度,以MTL-LSTM訓練得到的平均損失函數LAvg作為模型的適應度函數,平均損失函數LAvg定義為

(10)

通過公式(10)計算每一個個體的適應度,標記為最優個體位置。

(4)隨機生成[0,1]之間的捕食行為概率p,若p<0.5,則直接進行下一步判斷,反之,則收縮包圍獵物。

(5)若感知距離控制參數|A|>1,鯨魚根據彼此位置隨機搜索獵物,反之,鯨魚個體位置進行螺旋更新。

(6)判斷經過鯨魚優化算法得到的模型損失值是否小于MTL-LSTM訓練得到的平均損失函數LAvg,若滿足,則得到最優的神經元個數m和時間步長s;若不滿足,則更新參數并重新進行訓練。

(7)利用最優參數的WOA-MTL-LSTM模型對水稻葉片白葉枯病發病率和潛伏期進行預測。

1.6 模型驗證和精度評價

為了評估基于時序高光譜的WOA-MTL-LSTM多任務學習模型的預測性能,將數據集按照比例 8∶2 劃分為訓練集和測試集,并進行5次10折交叉驗證。將決定系數R2、均方根誤差(Root mean square error, RMSE)和相對誤差(Relative error, RE)作為評價指標,評估不同模型的預測性能,從而選擇最佳預測模型。

2 結果與討論

實驗基于Tensorflow和Keras開源深度學習框架實現。操作平臺硬件配置包括NVIDIA GeForce RTX 2080Ti GPU,搭載AMD Ryzen 5-1600 @ 3.20 GHz六核處理器,內存為64 GB。軟件環境為Windows 10操作系統,選用Matlab 2016b及Python 3.7編程環境。構建基于時序高光譜和MTL-LSTM及WOA-MTL-LSTM預測模型,對水稻葉片白葉枯病發病率以及潛伏期進行預測,并比較不同模型的預測性能。

2.1 病害脅迫下水稻病害葉片光譜分析

本研究截取波段450~950 nm范圍內,共計232個波長。經過SG平滑后,不同ROI光譜中的噪聲大大降低,消除了大小差異和不同信息結構的干擾,SG平滑后的光譜如圖9所示。

圖9 SG平滑后的9條平均光譜

由圖9可以看出,無癥狀ROI的RGB圖像和健康ROI的RGB圖像與有癥狀ROI的RGB圖像在顏色上有較大差異,可以通過目視檢測進行分類。而無癥狀ROI的RGB圖像與健康ROI的RGB圖像則無法通過目視檢測進行區分。對于不同狀態的ROI對應的光譜差異較大,尤其無癥狀ROI與健康ROI在波段500~650 nm之間的光譜反射率差異最為明顯,健康ROI的反射率明顯低于病害ROI的反射率,這說明具有完整組織結構的健康葉片ROI包含更多的光合色素,如葉黃素、葉綠素和類胡蘿卜素,導致在波段500~650 nm之間的吸收率更高[35]。病害脅迫下,葉片的內部結構隨著潛伏期增加而逐漸被破壞,對可見光的吸收逐漸降低,在波段450~720 nm間的反射率呈逐漸上升趨勢。綠峰波段光譜反射率隨葉片內部結構被破壞而逐漸升高,而紅谷波段反射率逐漸下降。在波段750~950 nm范圍內光譜曲線變得平坦且重疊較多,這與ZHANG等[36]的研究結果一致。根據前人的研究,細菌引起的葉片內部結構損傷首先會降低近紅外范圍內的光譜反射率,且水分等生物質的損失可能最終導致反射率上升[37]。

2.2 光譜降維結果分析

為了分析水稻病害樣本的時序高光譜的時序性特點,需要對時序高光譜數據進行降維處理。本文首先對數據進行主成分分析,主成分分析不僅可以降低數據維度,而且能夠通過樣本在各因子空間的得分確定所屬的類別,新變量可以更加直觀地表征原樣本的差異。

圖10a為經過預處理的光譜的前3個主成分得分示意圖??梢钥闯?,將光譜的232個波長映射到全新的正交平面,可以很好地區分樣本所屬類別,且前3個主成分得分累加為98.63%,但是映射到新的正交平面則失去了光譜的波長屬性。為了盡可能多的保留原光譜的信息,本文選擇累計得分超過99%的前10個主成分作為高光譜降維后的待分析樣本。為了克服主成分分析將特征映射到新的正交平面而失去光譜波長屬性的缺陷,從高光譜所有波長中提取對病害敏感的波長子集。本文利用隨機森林算法提取高光譜中對水稻白葉枯病敏感性高的前10個光譜波長,如圖10b所示,從左到右,波長重要性得分逐漸降低,排序為1的波長(667.02 nm)重要性得分最高,為0.118 6,排序為2的波長(651.89 nm)重要性得分為0.117 9,依次遞減。在保留所需要信息的同時還降低了數據維度,從而減少了計算量。由圖10b可以看出,敏感性較高的光譜波段主要集中于530~700 nm之間,這和健康ROI的光譜曲線與病害ROI光譜曲線之間的差異存在較強相關性,這與ZHANG等[36]發現的水稻白葉枯病害敏感波段范圍重合。

圖10 基于PCA和RF提取SG平滑后光譜特征示意圖

2.3 基于WOA的模型參數優化

將水稻病害葉片按照比例8∶2劃分為訓練集和測試集,采用WOA算法對多任務學習LSTM網絡的隱含層神經元個數m和時間步長s進行尋優,可以得到最優的MTL-LSTM網絡參數。圖11為WOA參數尋優過程中平均損失值LAvg收斂曲線。由圖11可知,WOA在迭代周期為76時收斂到LAvg最小值。此時,隱含層神經元個數m為10,時間步長s為4,WOA獲取到MTL-LSTM網絡的最優參數。

圖11 基于WOA參數尋優的LAvg收斂曲線

2.4 基于時序光譜特征的模型預測性能分析

為了驗證WOA優化MTL-LSTM多任務學習模型的性能,將典型的MTL-LSTM多任務學習模型與WOA優化的MTL-LSTM多任務學習模型進行性能比較。為了避免偶然性且客觀地進行評價,采取5次10折交叉驗證法,將5次獨立重復訓練仿真結果平均值作為最終參考依據。同時,為了驗證通過PCA和RF提取光譜特征的有效性,比較了基于全光譜波長數據集和PCA及RF提取光譜特征數據集構建的模型的預測性能。

基于全光譜波長數據集(232個波長)構建的模型對水稻白葉枯病害發病率及潛伏期預測的性能如表2所示。由表2可以看出,對發病率和潛伏期的預測性能,基于全光譜波長數據集的WOA-MTL-LSTM模型的測試集決定系數R2分別為0.90和0.84,RMSE分別為0.38和2.50,RE分別為0.47%和1.34%;比MTL-LSTM模型決定系數R2均上升0.05,RMSE分別下降0.06和0.05,RE分別下降0.36個百分點和0.34個百分點。

表2 基于全光譜構建的不同模型的預測性能

基于隨機森林提取的前10個特征波長構建的MTL-LSTM和WOA-MTL-LSTM網絡對水稻葉片白葉枯病發病率以及潛伏期的預測性能如表3所示。由表3可以看出,WOA-MTL-LSTM網絡對兩個任務的預測性能優于MTL-LSTM網絡對兩個任務的預測性能。WOA-MTL-LSTM網絡對發病率和潛伏期的測試集決定系數R2分別為0.93和0.85,RMSE分別為0.34和2.12,RE分別為0.33%和1.21%。

對比表2和表3可以發現,基于RF提取的特征波長構建的模型的預測性能優于全光譜波長構建的模型的預測性能,前者的建模時間比后者減少約98%,決定系數最大提升0.04,驗證了特征波長的有效性,表明隨機森林算法可以有效地從高光譜數據中提取特征波長,降低高光譜數據維度,這與SPEISER等[26]的研究結果相符。發病率和潛伏期預測的R2為0.89和0.80,RMSE為0.35和2.35,RE為0.76%和1.53%,滿足水稻病害預測的要求。

表3 基于前10個特征波長構建的不同模型的預測性能

基于PCA提取的前10個主成分對水稻葉片白葉枯病發病率以及潛伏期預測的性能如表4所示。由表4可知,基于時序高光譜前10個主成分構建的WOA-MTL-LSTM網絡對白葉枯病發病率和潛伏期的預測性能最優,測試集決定系數R2分別為0.91和0.83,RMSE分別為0.37和2.61,RE分別為0.46%和1.33%,性能優于MTL-LSTM網絡的預測性能。

表4 基于前10個主成分構建的不同模型的預測性能

比較表3和表4可以發現,基于隨機森林提取的前10個特征波長構建的WOA-MTL-LSTM對兩個任務的預測性能優于基于PCA提取的前 10個主成分構建的WOA-MTL-LSTM對兩個任務的預測性能,且前者建模時間少于后者的建模時間。對發病率的預測性能,測試集的決定系數R2上升0.02,RMSE下降0.03,RE下降0.13個百分點。對潛伏期的預測性能,測試集的決定系數R2上升0.02,RMSE下降0.49,RE下降0.12個百分點。說明基于隨機森林提取的前10個特征波長不僅保留了高光譜的光譜特性,而且可以完整地表征時序高光譜的信息。此外,WOA-MTL-LSTM網絡比MTL-LSTM網絡在預測水稻病害發病率和潛伏期時表現出更高的預測精度,說明WOA可以有效確定MTL-LSTM網絡神經元個數和時間步長,更有效地提取時序高光譜的信息,這與YANG等[32]的研究相符合。

3 結論

(1)RF能有效降低原始高光譜數據的維度,縮短建模時間。與使用全光譜波長構建的模型相比,利用RF提取的特征波長構建的模型可以縮短98%的訓練時間;與PCA提取的主成分相比,基于RF提取的特征波長構建的模型具有更優的預測性能和可解釋性。實驗結果表明,對水稻白葉枯病害敏感的波長主要集中在波段530~700 nm之間。

(2)基于時序特征波長構建的MTL-LSTM模型對發病率和潛伏期的預測均取得了良好結果,對發病率和潛伏期預測的R2為0.89和0.80,RMSE為0.35和2.35,RE為0.76%和1.53%,滿足水稻病害預測的要求。

(3)利用WOA算法對MTL-LSTM模型進行優化,提升了MTL-LSTM的預測性能,并縮短了建模時間?;谇?0個特征波長構建的WOA-MTL-LSTM模型對發病率和潛伏期預測測試集的R2分別為0.93和0.85,RMSE分別為0.34和2.12,RE分別為0.33%和1.21%。相較于優化前,WOA-MTL-LSTM網絡對發病率和潛伏期預測的R2均提升0.05。實驗表明WOA可以有效確定MTL-LSTM網絡的最佳神經元個數以及最佳時間步長,進而提升模型的預測性能。

猜你喜歡
葉枯病時序波長
顧及多種弛豫模型的GNSS坐標時序分析軟件GTSA
一種波長間隔可調諧的四波長光纖激光器
清明
杯中“日出”
多年生稻白葉枯病抗性評價
水稻白葉枯病的發生及防治
基于不同建設時序的地鐵互聯互通方案分析
基于針孔陣列型的單次曝光雙波長疊層成像*
基于FPGA 的時序信號光纖傳輸系統
紅掌帚梗柱孢葉枯病菌的鑒定
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合