?

復雜環境下的植物病害識別新型研究

2021-11-22 08:53劉子曦李鴻翔杜智雄
計算機技術與發展 2021年11期
關鍵詞:病斑病害神經網絡

劉子曦,李鴻翔,馮 澳,杜智雄,倪 銘

(四川農業大學 信息工程學院,四川 雅安 625014)

0 引 言

農業在國民經濟中占有重要地位,在農業生產中植物病害對農作物的產量、質量會產生巨大的影響[1]。植物病害會導致糧食減產,造成巨大經濟損失,對糧食安全產生威脅。此外,在抑制病蟲害時,大規模的農藥濫用、誤用也對生態環境造成了極大的危害[2]。因此,針對植物病蟲害的防治工作顯得尤為重要。

目前國內外對復雜環境下的植物病害識別的研究主要集中在復雜環境下病害葉片圖像分割、葉片病斑特征提取、葉片病害識別三方面。在病害圖像分割方面,李艷雪等[3]選擇DBSCAN算法,成功地分割出向日葵葉片病害部分圖像。秦豐等[4]通過聚類算法和監督分類方法,進一步提取病斑圖像的顏色特征、紋理特征和形狀特征。Zhang等[5]通過超像素聚類將整個彩色葉圖像分為多個緊湊且均勻的超像素,然后對病變部位通過EM算法從每個超像素中快速且準確地分割出病害像素,從而得到有效的圖像分割。在病斑特征提取方面,胡秋霞[6]提出了基于顏色矩和小波變化的加權特征提取方法,顯著地提高了識別正確率。師韻等[7]針對蘋果葉片病害,克服了經典植物病害識別方法中特征提取的難題,提高了識別效果。吳昊昱[8]研究茶樹病害時,運用深度遷移學習的方法提取出病斑特征,防止小樣本下的過擬合問題。在葉片病害識別方面,周麗娜[9]利用葉綠素熒光光譜,構建混合核函數進行稻葉瘟病害的識別。Huang[10]使用灰度共生矩陣描述病斑紋理,RGB顏色以及灰度值描述病斑顏色,根據上述特征建立人工神經網絡,實現了對蝴蝶蘭病害的識別。宋凱等[11]利用Haar小波提取病斑特征向量,之后利用核函數為徑向基函數的支持向量機實現對玉米病害的分類。

隨著計算機硬件設備性能的不斷發展,以及大數據時代的到來,以卷積神經網絡為代表的深度學習算法在圖像識別領域發揮了重要的作用[12-13]。越來越多的研究者開始將卷積神經網絡應用于智慧農業領域,進行植物病害識別。Amara等[14]使用LeNet作為神經網絡架構,實現了復雜環境下對香蕉葉片病害的識別。Wang等[15]使用卷積神經網絡識別出病害種類以及病害嚴重程度。劉媛[16]使用Faster-RCNN算法,利用復雜環境下的植物病害圖像數據集,端到端地實現復雜環境下的葡萄葉病斑的提取,并且根據病斑實現對病害識別。

從上述國內外研究情況來看,雖然目前在三個方面均取得了一定的成果,但是由于農田背景信息包括地理環境、土壤環境、光照環境、水環境等,機器視覺技術難以實現無監督地從復雜環境下提取葉片。同時由于病斑顏色與土壤顏色類似,且與葉片顏色差距較大,因此在使用基于顏色、閾值的圖像分割算法時,會將病斑從葉片圖像中分割出去,無法進行后續對病斑特征提取等操作。

針對上述問題,文中建立了一個在復雜環境下具有無監督性、準確度高、泛用性好、訓練效率高等特點的植物病害識別模型。以褐斑病、霜霉病、灰霉病等病害為例,通過基于RPN算法(region proposal network,區域生成網絡)的復雜環境下病害葉片定位檢索、基于Chan-Vese算法的復雜環境下病害葉片圖像分割算法、基于遷徙學習的病害識別模型進行深入研究與分析,在植物病害識別的應用上具有很好的適用性。

1 基于RPN算法的復雜環境下葉片檢索

由于植物病害葉片的背景復雜,不同的土壤信息、光照信息等的變化均會對復雜環境下的葉片分割帶來影響。因此,選用RPN算法首先在復雜環境下對葉片進行檢索定位。

1.1 RPN算法和Faster-RCNN模型

Faster-RCNN[17]是Ren等在R-CNN[18]、Fast-RCNN[19]基礎上改進的目標檢索模型。Faster-RCNN模型的輸出包括物體邊界框,每個邊界框中物體的類別,邊界框內物體類別的概率。相比于R-CNN,Fast-RCNN模型中通過選擇性搜索的方法來檢測物體,Faster-RCNN模型利用RPN算法可以更加迅速準確地檢測物體。

根據Faster-RCNN模型,在將輸入數據輸入RPN算法之前,需要先將數據濃縮提取特征,即對數據進行卷積操作。將原始圖片輸入卷積神經網絡中,經過多次卷積、池化操作之后,可獲得高度濃縮的圖像特征。RPN算法設置了三種比例與三種尺寸的固定大小的九種邊界框。通過將九種邊界框作為滑窗在特征圖上滑動獲得預測物體位置的參考邊界框。將每一個邊界框,輸入兩個神經網絡,一個負責分類,一個負責控制邊界框位置調整。再利用兩個神經網絡獲得分類結果以及邊界框位置,運用NMS算法消除對同一物體的多個邊界框,最后只保留結果最好的邊界框。RPN算法結構如圖1所示。

圖1 RPN算法結構

1.2 訓練參數設置

PlantVillage是由賓州州立大學建立的大型農業問答論壇,其中包含多種簡單背景下的植物病害圖片數據集,并且面向所有用戶開放。文中下載褐斑病、灰霉病、霜霉病三種圖像作為訓練數據,其中褐斑病482張,灰霉病651張,霜霉病827張,共計1 960張,如圖2所示。

(b)灰霉病

(c)霜霉病

使用這些簡單背景下的葉片數據集對RPN模型進行訓練。在模型訓練時,設置參數包括控制模型收斂的梯度下降優化參數,控制訓練數據集的輸入數據參數,控制RPN算法效果的RPN參數。

模型訓練參數如表1所示。

表1 模型訓練參數設置

1.3 復雜環境下葉片檢索結果

從百度圖片等公開圖片網站上下載復雜環境下的褐斑病、灰霉病、霜霉病各150張,即一共450張作為測試數據。由于VGG-16模型擁有簡便的模型網絡和較好的泛化能力,目前常用作特征提取模型。將測試圖像輸入VGG-16模型以及RPN算法,得到的結果如圖3所示。

(a)褐斑病

(b)灰霉病

(c)霜霉病

2 基于Chan-Vese算法的復雜環境下葉片圖像分割

水平集方法[20]是一種計算曲面算法的數值計算方法,其可以在笛卡爾網絡上對曲面進行數值計算而不需要對曲面參數化。由于水平集方法可以方便地獲取物體的拓撲結構,因此近年來水平集方法在圖像分割方面有了廣泛的應用。Chan-Vese算法[21]在水平集方法基礎上,簡化了水平集方法,可以有效地分割含有噪音、弱邊緣的圖像?;谝陨咸攸c,Chan-Vese算法可以較好地從復雜環境下分割包含完整病斑的葉片。由于復雜環境下的圖像顏色信息復雜,基于顏色、閾值的機器視覺算法難以取得較好的效果,因此文中使用基于區域的Chan-Vese算法對復雜環境下的葉片圖像進行分割。

2.1 水平集方法

利用水平集算法進行圖像分割本質上是將二維的圖像分割轉換為三維的平面相交問題,將兩曲面相交的曲線作為圖像分割的邊界,利用圖像信息約束曲面演化,通過不斷地迭代運算最終得到圖像分割邊界。水平集方法主要包含三個要素:對初始相交曲線的定義,控制曲面演化PDE方程,對PDE方程的數值求解。

設在t時刻,兩曲面相交的曲線為C(t),設符號距離函數為:

φ(x,y,t)=±d

(1)

意為在t時刻,點(x,y)距離曲線C(t)最短的距離為d。通常設置在曲線C(t)內的點距離為負,反之為正。

水平集曲面函數演化遵從哈密頓-雅可比方程,即:

(2)

式中,F表示曲線C(t)上各個點演化的速度,其演化方向為曲線各點的法線方向。從上式可以看出,只要速度F變化平滑,則φ(x,y,t)始終保持平滑。在此基礎上,通過約束速度F來約束曲面演化。最終的輪廓為零水平集:

φ(x,y)=0

(3)

2.2 Chan-Vese算法

Chan-Vese算法在水平集方法的基礎上,并不通過顯式地控制速度來控制曲面演化,而是通過構建一個能量函數來約束整體區域。該能量函數的定義為輪廓內與輪廓外圖像的灰度值的方差之和最小,并且增加輪廓長度使輪廓收斂。設圖像中有一閉合曲線,則能量函數表示為:

(4)

式中,c1表示輪廓內,c2表示輪廓外,u(x,y)表示圖像灰度值,u1表示輪廓內灰度平均值,u2表示輪廓外灰度平均值。則設:

(5)

(6)

當F1≈0且F2≈0時演化停止。

采用水平集方法對式(4)求解,使用零水平集表達輪廓線。引入Heaviside函數以及Dirac函數:

(7)

(8)

則能量函數的水平集方程為:

(9)

利用變分法將式(9)最小化,結合Euler-Lagrange方程,得到如下偏微分方程:

δ(φ)[-λ1(1-u1)2+λ2(1-u2)2]

(10)

針對上式可以使用梯度下降法自動檢測灰度不同的目標區域,并且使能量函數達到全局最小。

2.3 復雜環境下葉片圖像分割參數設置與結果

文中設置初始零水平集為以圖片中心為圓心,圖片對角線長度的三分之一為半徑的圓形。設置Chan-Vese算法迭代計算次數為800次。水平集函數的懲罰項系數mu設置為1,平滑項的系數nu設置為0,空間步長設為1,時間步長設為0.1。

將RPN算法所獲得的圖片輸入Chan-Vese算法,將零水平集內的圖像保留,零水平集外的圖像設為黑色,得到的圖像分割結果如圖4所示。

圖4 復雜環境下的分割結果

根據圖4可以發現,經過800次迭代計算,Chan-Vese算法可以取得較好的葉片圖像分割效果。它保留了葉片中央完整結構,包括葉片脈絡、病斑顏色、病斑形狀等。通過Chan-Vese算法獲取的葉片中央完整結構可以用于下一步遷移學習模型病害識別。

3 基于遷移學習模型的葉片圖像識別

3.1 遷移學習

設域為D,包括兩個內容:

D={X,P(X)}

(11)

其中,X表示特征空間,包含了所有可能的特征取值;P(X)表示特征空間內的某種特定的特征采樣實例。

設任務為T,其同樣包括兩部分:

T={Y,f(X)}

(12)

其中,Y表示標簽空間,即所有標簽組成的向量空間;f(X)為預測函數,根據輸入數據的特征和標簽學習而來。

由于針對不同學習目標的神經網絡的淺層網絡具有相似特征[22],因此可以利用遷移學習算法將針對源任務的神經網絡淺層網絡遷移到針對目標任務的神經網絡中。遷移學習在使用中,相比于重新學習,具有初始時期更好的表現、模型收斂更快、最終效果更好等優點[23]。

由于傳統神經網絡模型對數據集的質量與數量要求較高,且在訓練過程中對硬件資源需求較高,訓練時間較長,不利于模型推廣使用。遷移學習模型在已預訓練模型的基礎上,使用簡單背景下的病害葉片數據集訓練模型。相比于傳統模型,遷移學習可以更快速地完成模型訓練,獲得較好的識別效果。因此,文中使用遷移學習模型進行葉片病害的識別。

3.2 葉片病害識別參數設置與模型訓練

ResNet-101模型根據模型訓練過程中的殘差對網絡進行擬合,在ImageNet圖像識別中取得了較好的分類效果,對深度學習網絡在精度與速度上取得了較好的優化效果。文中選用ResNet-101作為預訓練模型,使用簡單背景下的病害葉片數據集對該網絡進行訓練。

遷移學習模型參數包括梯度下降優化參數以及訓練參數,具體參數設置如表2所示。

表2 遷移學習模型參數設置

續表2

經過迭代訓練后,遷移學習模型與ResNet-101模型的損失值如圖5所示。

圖5 遷移學習與ResNet-101訓練過程損失值對比

根據圖5可以發現,經過相同的迭代訓練后,遷移學習模型相比于ResNet-101模型,擁有更快的收斂速度,在收斂后擁有更低的模型損失值。因此,文中使用遷移學習模型可以更快收斂,取得更好的模型識別效果。

3.3 葉片病害識別結果

將基于Chan-Vese算法分割得到的圖像輸入遷移學習模型。作為對照,將未經本文上述處理的圖像輸入ResNet-101模型進行識別,識別結果如表3所示。

表3 文中方法與ResNet-101模型結果對比

根據表3可以發現,文中方法在上述識別的平均正確率為90.4%,顯著優于ResNet-101模型的正確率50.2%。對比文中方法在三種樣本中的表現,可以發現相比于灰霉病和霜霉病,褐斑病可以獲得更好的效果。

4 結束語

隨著信息技術的發展,智慧農業也在快速發展,其在對農業生產的遠程控制、遠程診斷、災害預警等領域起到了重要的作用。然而智慧農業在復雜環境下的植物病害識別方向的研究仍然存在魯棒性較差,易丟失病斑信息,所需數據集復雜,對硬件設備要求高等缺陷。因此,文中建立了一個基于深度學習算法和遷移學習模型的植物病害識別模型。通過實驗測試發現,該模型針對褐斑病、霜霉病、灰霉病這三種病害葉片的識別正確率分別為92.0%,90.7%,88.7%,平均識別正確率達到90.4%,優于傳統的ResNet-101模型。

猜你喜歡
病斑病害神經網絡
基于神經網絡的船舶電力系統故障診斷方法
早春養羊需防六大病害
“早春魚瘟”、黃顙魚“過春”、病害一線快速精準診斷……實戰干貨來啦
MIV-PSO-BP神經網絡用戶熱負荷預測
小麥常見三種病害咋防治
春季番茄常見病害防治技術
基于改進Hopfield神經網絡的對地攻擊型無人機自主能力評價
三次樣條和二次刪除相輔助的WASD神經網絡與日本人口預測
套袋對檸檬果實外觀品質的影響
Ophiognomonia castaneae協同板栗褐緣葉枯病病原菌致病作用的研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合