?

基于改進多元宇宙算法的番茄病害圖像識別*

2023-06-05 01:35王磊袁英高玲
中國農機化學報 2023年5期
關鍵詞:膨脹率黑洞正確率

王磊,袁英,高玲

(黃河水利職業技術學院電氣工程學院,河南開封,475004)

0 引言

番茄在人們日常蔬菜類農產品中的消耗量較大,番茄在種植過程中易受各種環境因素影響,導致各種病害發生,因此及早識別病害的種類有利于采取有效的防治措施[1]。

James等[2]使用k均值聚類對六種不同類型的番茄病害樣品分割,具有良好的分割效果。卷積神經網絡(Convolutional Neural Network,CNN)對番茄病害識別具有較好的效果[3],但是卷積神經網絡識別效果依賴于參數的設定,訓練過程中有許多的超參數與權值需要優化。Wu等[4]提出VAE網絡模型,用多尺度殘差學習模塊代替單尺度卷積核來豐富提取的特征,用于擴展訓練集以訓練識別模型。Abbas等[5]使用遷移學習和C-GAN合成圖像檢測番茄病害,利用條件生成對抗網絡生成番茄植物葉片的合成圖像,模型使用遷移學習在合成圖像和真實圖像上進行訓練,將番茄葉子圖像分為10類疾病。Brahimi等[6]應用CNN轉移和深度學習提取的番茄特征,所有獲得的特征通過SVM和KNN進行分類。Fuentes等[7]使用不同分辨率的相機設備在現場拍攝的圖像來檢測番茄植株中的病蟲害。Rangarajan等[8]提出基于深度學習的AlexNet和VGG16net架構,分析了圖像數量和超參數對分類精度和執行時間的影響。多尺度AlexNet(Multi-Scale AlexNet,MSAN)神經網絡模型[9],去除神經網絡局部響應的歸一化層、卷積核依據尺度改變、更改全連接層,番茄葉部病害早中晚期的平均識別準確率達到 92.7%。注意力神經網絡模型(Attentional Neural Network,ANN)通過注意力特性設置注意力并行模塊對番茄特征提取[10],利用數據殘差構建PARNet模型,識別準確率優于VGG16、ResNet50等網絡結構。注意力殘差機制(Attention Residual Mechansm,ARM)卷積神經網絡模型[11],設置多層注意力模塊,通過分層抽取病害信息,能夠解決早期病特征不易提取問題,識別結果高于其他模型。多尺度和注意力機制(Multi-Scale And Attention Mechanism,MSAM)神經網絡模型[12],增加番茄病害信息,同時抑制干擾信息,利用遷移學習減少過擬合發生,番茄常見葉片圖像分類準確率較高。深度殘差網絡的神經網絡模型(Deep Residual Network,DRN),利用貝葉斯算法降低了深度學習網絡的訓練難度[13],殘差單元提高過深層次病害識別網絡模型性能,最終模型對番茄4種病害識別準確率達到 95%以上。Fuentes等[7]結合VGG等深度特征提取器,構建基于區域的卷積神經網絡、基于區域的全卷積網絡及單鏡頭多盒檢測器訓練端到端系統,對9種番茄病害進行識別。

以上算法是對卷積神經網絡結構的改變,沒有對卷積神經網絡的參數優化,在訓練過程不易獲得最佳參數。本文提出改進宇宙算法與卷積神經網絡(Improved Multi Verse Optimizer and Convolutional Neural Network,IMVOCNN)結合進行番茄病害識別,對番茄病害多特征進行提取,通過改進宇宙算法優化卷積神經網絡參數,仿真驗證算法的有效性。

1 改進宇宙算法

1.1 基本宇宙算法

Mirjalili等[14]提出智能優化算法多元宇宙(Multi Verse Optimization,MVO),模擬宇宙中的物質在黑洞、白洞和蟲洞共同作用下的膨脹或收縮行為。多元宇宙中的物質通過蟲洞在白洞與黑洞之間轉移,白洞擁有較強的斥力,能夠將物質釋放;黑洞擁有較強的引力,能夠將物質吸收。膨脹率較高的宇宙具有白洞特性,而膨脹率較低的宇宙具有黑洞特性,因此宇宙大部分物質從高膨脹率物體向低膨脹率的物體移動,物質隨機移動的通道為蟲洞。最終宇宙個體在萬有引力作用通過位置的更新使得整個宇宙達到平衡狀態。

1.2 改進宇宙算法

1.2.1 基于多方向的多元宇宙空間結構模型

目前多元宇宙算法沒有考慮多元宇宙空間結構,物質在白洞向黑洞移動方向單一,算法在后期的宇宙多樣性無法保證,使得數據尋優存在盲目性,導致算法無法獲得全局最優解。為了使得物質移動具有多方向性,增加空間通道蟲洞的端口數量,這樣相當于宇宙可以進行加速膨脹。蟲洞兩端的端口數量可有不同,這樣多個宇宙的物質從白洞向黑洞轉移過程中,每個宇宙具有各自的通道,端口終端的宇宙物質可并行進入各自的黑洞,宇宙膨脹將加速進行,不再受擁擠通道數量的約束;若主通道只有某個宇宙物質在膨脹轉移,則端口終端全部為該宇宙開放;白洞側的端口數量多于黑洞側的端口數量,這是因為宇宙物質初始時從白洞出發的速度較慢,離黑洞越近則速度越快,為了提高通道利用率而不過多的增加通道數量,白洞側的端口數量與黑洞側的端口數量之比在[1.5,2]之間。這樣在蟲洞多端口結構下,每次迭代進化增加了多元宇宙空間物質轉移的效率。

1.2.2 基于雙向運動的宇宙信息轉移模型

基本宇宙算法物質從高膨脹率物體向低膨脹率物體移動,這種運動的方向只有宇宙物質的膨脹率改變時才能改變[15],但是宇宙的膨脹率是一個非線性逐漸增大的過程,不易使低膨脹率物體向高膨脹率物體移動,這種宇宙信息轉移運動具有單一性,不利于宇宙信息的多樣性形成。增加宇宙的雙向運動,即在原有運動方向的基礎上,設置宇宙的反向運動,有部分物質從低膨脹率物體向高膨脹率物體逆向移動,逆向移動宇宙物質被選擇概率如式(1)所示。

(1)

式中:R——逆向移動宇宙物質從黑洞移到最近白洞的距離,R≠0,km;

xλ,t——第λ個黑洞周圍的第t個宇宙;

N——宇宙數量總規模,個;

f(xλ,t)——xλ,t的適應度。

這樣黑洞與白洞相隔越近的物質,越易被移動,從而使得逆向移動宇宙加速移動,消耗較少的時間可以達到白洞。

0.7≤p(xλ,t,R)<1的宇宙才進行逆向交流,0

(2)

式中:rand——隨機因子,服從均勻分布,rand∈[0,1];

n——黑洞總數;

hij——白洞i到黑洞j的間距,km;

l——白洞迭代進化次數;

γ——宇宙t的信息正向交流系數,γ∈[0.5,1];

rt——宇宙t的膨脹系數,rt∈[0,1]。

易非不知道怎么得罪他們了,她愣在門口,自我檢討了好久,也沒想到自己錯在哪里了。她只得換了拖鞋,含著眼淚,回到了自己的小房里。她栓了門,打開電腦,給陳留在QQ上留了言——同在一個屋檐下,易非連給他打電話的空間都沒有。

(3)

式中:hi′j′——黑洞i′到白洞j′的間距,km;

m——白洞總數;

l′——黑洞迭代進化次數;

γ′——宇宙t′的信息逆向交流系數,γ′∈[0,0.5];

r′t′——宇宙t′的收縮系數,r′t′∈[0,1]。

1.2.3 基于非線性調節的膨脹率修正

宇宙在膨脹過程中,其自身的膨脹率r屬于固定不變[16],這不利于宇宙的進化尋優,因此在宇宙的初始階段,應增大宇宙的膨脹率,以便宇宙能夠以較大的膨脹率r進行全局探索;而在宇宙的后期尋優階段,應減小宇宙的膨脹率r,使得宇宙能夠進行局部開發,以便在較優解周圍獲得最優解。通過非線性調節對宇宙的膨脹率r修正如式(4)所示。修正后的膨脹率κ隨T′/T變化如圖1所示。

圖1 κ隨T′/T變化

κ=r×Z×T′/T

(4)

式中:T′——宇宙進化迭代次數;

T——宇宙進化迭代總次數;

Z——z形隸屬函數。

從圖1可以看出,κ隨T′/T非線性遞減變化,T′/T的比值越小,κ取值越大,T′/T的比值越大,κ取值越小,這樣便于宇宙在不同的迭代時候使用不同的膨脹率。

2 番茄病害識別

2.1 特征提取

在卷積神經網絡識別番茄病害的過程中,病害特征提取起到了決定性作用[17],番茄病害特征在紋理、顏色和形狀等以及在不同時期具有差異性,并且病害在番茄葉片上分布相對局部。對番茄病害的紋理特征提取5個,用于描述病斑表面結構,包括灰度共生矩陣的角二階矩、對比度、逆差分矩、相關性和熵。對番茄病害的顏色特征提取9個,包括彩色系中RGB值,色度系中RGB相應的比例值,與HIS顏色系中HIS值。對番茄病害的形狀特征提取5個,包括圓形性、矩形度、球狀性、偏心率、伸長度。將紋理特征、顏色特征、形狀特征共計19個特征值作為卷積神經網絡的輸入。

2.2 卷積神經網絡關鍵函數選擇

卷積神經網絡設計中的關鍵函數為激活函數與損失函數[18-19]。

激活函數為Sigmoid,如式(5)所示。

(5)

損失函數為交叉熵損失函數,如式(6)所示。

(6)

式中:ys——第s個訓練樣本xs的標簽;

K——輸出分類總數;

yb——第b個訓練樣本xb的標簽;

B——訓練樣本總數。

交叉熵損失函數值越小,則實際輸出概率與期望輸出概率的差異度就越小。

2.3 優化卷積神經網絡參數

由于卷積神經網絡性能嚴重依賴于權重等參數,不同權重參數值往往使得網絡表現不同性能,同時權重參數的較小誤差在通過多層的反向傳播使得誤差放大,最終使得調整出來的權值和閾值與理想值相差遠,導致卷積神經網絡不收斂,訓練時間過長。在多元宇宙優化卷積神經網絡參數時,卷積神經網絡中需要訓練的參數當作多元宇宙算法中的一個宇宙,將訓練卷積神經網絡得到的交叉熵損失函數值作為改進多元宇宙的適應度值,如果多元宇宙的適應度值收斂到一定閾值范圍內,停止算法尋優。

利用統計學斯皮爾曼相關系數ρ確定多元宇宙的優化次數。當ρ越接近1時,即可確定優化最小閾值。

(7)

式中:xp——優化隨機變量集合X中的元素,個;

yp——優化隨機變量集合Y中的元素,個;

M——隨機變量總數;

p——隨機變量標號;

dp——xp、yp排序之間差值。

計算識別精度的穩定度V如式(8)所示。

(8)

式中:accuracyk[u]——第k次迭代的第u個宇宙的識別精度,%。

N——宇宙總數;

μ——識別精度均值;

σ——識別精度方差。

當宇宙在最優位置附近尋優時,利用識別精度的穩定度最小化準則,如果相鄰兩次的穩定度V保持不變,此時最優值已接近極限,繼續逼近最優值已無意義。

算法流程如下:(1)隨機初始化多元宇宙參數;(2)隨機初始化卷積神經網絡權重,訓練卷積神經網絡;(3)交叉熵損失函數值作為宇宙的適應度;(4)宇宙體雙向運動更新宇宙信息;(5)判斷是否滿足識別精度的穩定度,則進行步驟(5),否則進行步驟(4);(6)輸出識別結果。

3 試驗仿真

數據集采用Plant leaf diseases dataset中的Tomatoes,涉及番茄的病害類型有細菌斑、早疫病、晚疫病、葉霉菌、葉斑病、蜘蛛螨,病害典型圖像如圖2所示,每種類型200幅圖像,共計1 200幅,其中訓練集900幅圖像,測試集300幅圖像。

圖2 番茄病害圖像

試驗PC配置:CPU為Intel Core i7-7800X @ 3.50 GHz、內存16 GB、IntelH61主板,集成Nvidia GeForce GT 720,Matlab2014實現仿真。多元宇宙數量為400個,蟲洞的單側端口最大數量為6個,γ=0.85,rt=0.35,γ′=0.15,rt′=0.25,T=300。卷積神經網絡結構包含4個卷積層,卷積核尺寸大小分別設置為3×3,3×3,5×5和5×5,3個池化層,2個全連接層和1個識別層。

3.1 卷積神經網絡算法訓練與測試

卷積神經網絡算法結構包括:輸入層、卷積層、池化層、激活層、損失層、全連接層,其中輸入層為三通道,卷積層通過3×3卷積核進行特征提取,移動步長為1,池化層采用最大值池化方法,激活層函數采用Sigmoid函數,損失層函數采用交叉熵損失函數,全連接層將獲取的番茄病害圖像特征信息轉化為各個病害分類的概率,Softmax最終給出番茄病害識別結果。對卷積神經網絡算法訓練階段設置最大訓練次數為50,通過交叉熵損失函數和識別正確率來驗證訓練、測試的效果,交叉熵損失函數值越小,識別正確率越大,則多元宇宙優化卷積神經網絡算法越好。圖3、圖4分別給出了訓練集和測試集交叉熵損失函數、識別正確率曲線結果。

圖3 交叉熵損失函數曲線結果

圖4 識別正確率曲線結果

從圖3可以看出,隨著迭代次數的增加,優化前、優化后訓練集、測試集的交叉熵損失函數值曲線呈現下降的趨勢,逐漸趨于穩定,但是多元宇宙優化后的交叉熵損失函數值小于優化前,說明優化能夠使得輸出概率與期望輸出概率差異性降低。從圖4可以看出,隨著迭代次數的增加,優化前、優化后訓練集快速上升,然后逐漸穩定在較高的識別正確率,但是多元宇宙優化后的識別正確率值大于優化前,說明優化能夠提高番茄病害的識別正確率。

3.2 各種算法對番茄病害識別

在番茄病害識別過程中,涉及的算法有:CNN、MSAN、ANN、ARM、MSAM、IMVOCNN,各個算法的訓練時長、運行時占用內存如表1所示。

表1 不同算法訓練時長、占用內存對比Tab. 1 Comparison of training time and memory occupied by different algorithms

從表1可以看出,IMVOCNN算法訓練時長較短,運行時占用內存較少,這樣便于番茄病害識別。

通過蒙特卡羅30次仿真試驗,識別正確率結果和識別消耗時間如表2所示。對番茄病害細菌斑、早疫病、晚疫病、葉霉菌、葉斑病、蜘蛛螨識別區域如圖5所示。

表2 不同算法對番茄病害識別正確率結果Tab. 2 Accuracy results of various algorithms for tomato disease recognition

圖5 番茄病害識別區域結果

從表2可以看出,本文算法對番茄各種病害識別正確率較高,細菌斑平均值為97.34%,早疫病平均值為97.03%,晚疫病平均值為97.08%,葉霉菌平均值為97.14%,葉斑病平均值為97.12%,蜘蛛螨平均值為97.20%。其他算法識別對番茄病害識別正確率小于本文算法,這是因為改進宇宙算法用于卷積神經網絡的損失函數優化中,降低了卷積神經網絡參數難于設置問題,在保證收斂速度的前提下,明顯提升了算法的全局搜索能力,提高了識別正確率。

從表3可以看出,本文算法對番茄各種病害識別消耗時間較少,細菌斑平均值為1.03 s,早疫病平均值為1.01 s,晚疫病平均值為1.02 s,葉霉菌平均值為1.02 s,葉斑病平均值為1.01 s,蜘蛛螨平均值為1.03 s,其他算法識別對番茄病害識別消耗時間大于本文算法,不利于番茄實時識別的需求。

表3 不同算法對番茄病害識別消耗時間結果Tab. 3 Time consuming results of various algorithms for tomato disease recognition

4 結論

1) 為了提高番茄病害識別效果,提出了一種基于改進多元宇宙算法進行番茄病害圖像識別,多元宇宙中增加空間通道蟲洞的端口數量,宇宙進行加速膨脹。

2) 改進多元宇宙算法對番茄各種病害識別正確率較高,細菌斑識別正確率比CNN、MSAN、ANN、ARM、MSAM算法提高了3.33%、2.83%、2.26%、1.44%、0.88%;早疫病識別正確率比CNN、MSAN、ANN、ARM、MSAM算法提高了2.9%、2.41%、1.92%、1.15%、0.53%;晚疫病識別正確率比CNN、MSAN、ANN、ARM、MSAM算法提高了2.86%、2.37%、1.87%、1.10%、0.48%。

3) 改進多元宇宙算法對番茄各種病害識別消耗時間較少,細菌斑識別消耗時間比CNN、MSAN、ANN、ARM、MSAM算法減少了0.53 s、0.45 s、0.36 s、0.30 s、0.23 s;早疫病識別消耗時間比CNN、MSAN、ANN、ARM、MSAM算法減少了0.51 s、0.44 s、0.38 s、0.29 s、0.25 s;晚疫病識別消耗時間比CNN、MSAN、ANN、ARM、MSAM算法減少了0.55 s、0.47 s、0.35 s、0.32 s、0.24 s。

猜你喜歡
膨脹率黑洞正確率
化學改良紅黏土作用模型研究
HAYDON黑洞
門診分診服務態度與正確率對護患關系的影響
5500萬光年之外的“黑洞”,是如何被拍到的
黑洞什么樣,有圖有真相
用快速砂漿棒法評價Li2CO3與硝酸鹽對ASR的長齡期抑制效果
飲用水處理用活性炭反沖膨脹率測定與研究
生意
品管圈活動在提高介入手術安全核查正確率中的應用
生意
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合