?

基于區分深度置信網絡的病害圖像識別模型

2017-11-28 09:50宋麗娟
中成藥 2017年11期
關鍵詞:置信圖像識別區分

宋麗娟

1.西北大學 信息科學與技術學院,西安 710127 2.寧夏大學 信息工程學院,銀川 750021

基于區分深度置信網絡的病害圖像識別模型

宋麗娟

1.西北大學 信息科學與技術學院,西安 710127 2.寧夏大學 信息工程學院,銀川 750021

對枸杞病害進行及時、準確地檢測識別對于病害的監測、預測、預警、防治和農業信息化、智能化建設具有重要意義。研究提出了一種基于區分深度置信網絡的枸杞病害圖像分類識別模型。首先,把枸杞葉部病害圖像通過自動裁剪方式獲得包含典型病斑的子圖像,再采用復雜背景下的圖像分割方法分割病斑區域,提取病斑圖像的顏色特征、紋理特征和形狀特征共計147個,結合區分深度置信網絡和指數損失函數建立了病害識別模型。實驗結果表明,該方法對于病害圖像識別效果較好,與支持向量機相比,基于區分深度置信網絡的病害圖像識別模型高效地利用了底層圖像特征的高層表示,解決了沒有足夠標注數據時的圖像識別問題。

病害圖像;區分深度置信網絡;指數損失函數

1 引言

自然圖像的識別和分類是充分挖掘自然圖像中的底層特征,將不同類別的圖像區分開來。針對不同的需求環境,出現了不同的圖像識別和分類方法。Li等人提出了一種基于貝葉斯的增量學習方法,這種方法只需要很少的訓練圖片,在101類圖像分類實驗中取得了很好的結果[1]。Yu和Wong集成多個分類器分別利用不同的底層和高層抽象特征對圖片進行分類,設計了一系列規則將多個分類器的結果進行匯總[2]。Lu等人給出了一個新的圖像分類表示方式,首先用期望最大方法提取特征,然后用訓練自適應增強(Adaboost)分類器選擇最有區分性的特征[3]。范建平等人主要利用概念相關性來指導圖像分類器的訓練[4]。

在寧夏地區,枸杞病害不同時期、同一部位的病癥多變、情況錯綜復雜,客觀上存在很大的識別、預警困難,針對大田環境、復雜環境(葉片的遮擋和重疊、果實的傾斜和變形、多變的光照因素、雜草和泥土等)下的枸杞圖像,背景信息量巨大,病害復雜程度高,枸杞病害葉片與健康(無病害)枸杞葉片之間的灰度差異不大等,如何有效地將病害目標和復雜背景分割開來是極具挑戰的問題;而且,枸杞病害的生理信息機理決定了病害種類的規律性和穩定性,例如,在形態結構、尺寸大小、顏色紋理上的差異性很大,不存在兩片完全一樣的枸杞葉片;不存在兩塊完全相同的病害區域,不同的枸杞病害和同一種枸杞病害在不同的發病時期上所呈現出來的病理特征,從顏色、形狀、紋理上也不盡相同,要想達到最好的病斑分割效果,就需要提取不同的枸杞病害在不同的病理時期的關鍵特征。傳統的病害病斑圖像分割多是基于聚類算法的方法[5-7],對于復雜背景下的病害分割分割效果不好。傳統的圖像識別方法不足以將病斑圖像和復雜背景進行分離,利用病斑圖像的多特征融合,構建復雜背景下的枸杞病害識別模型,具有重要的理論意義。

本文針對枸杞葉片病害的5類病斑圖像,研究一種基于區分深度置信網絡的枸杞病害圖像識別和分類算法,高效地利用底層圖像特征的高層表示。

2 病斑圖像的特征提取和優化

在田間環境下采集具有典型癥狀病斑的枸杞葉片病害圖像共計1 000張,其中65張白粉病圖像、305張灰斑病圖像、290張癭螨病圖像和340張炭疽病圖像,獲取的病害圖像的分辨率為3 088×2 056像素。首先,對原始病害圖像進行預處理,采用自動裁剪方法從每一張枸杞病害圖像中裁剪出含有一個或多個病斑的子圖像,然后采用復雜背景下的圖像分割方法,分割效果如圖1所示,得到枸杞葉片病害的5類病斑圖像(包括無病斑圖像)共計1 201張,對所有樣本圖像劃分為訓練圖像集和測試圖像集。

圖1 復雜背景下的病斑分割

然后,充分挖掘枸杞葉片的5類病斑圖像的特征信息,提取病斑圖像的顏色特征、紋理特征和形狀特征共計147個,其中顏色特征總計36個,包括R、G、B、H、S、V、L*、a*和b*共9個顏色分量的灰度圖像的灰度均值m(9個)、方差σ2(9個)、標準差 s(9個)、偏度 S(9個)、峰度 K(9個)和熵ER(9個);紋理特征總計99個,包括R、G、B、H、S、V、L*、a*和b*共9個顏色分量的灰度圖像的Hu不變矩(63個)、能量均值(9個)、慣性矩均值(9個)、相關均值(9個)和熵均值(9個);形狀特征總計12個,包括偏心率、形狀復雜性、圓形度、緊密度、矩形度和二值化病斑圖像的Hu不變矩(7個)。下面給出一幅病斑圖像的灰度均值如表1所示,方差如表2所示,標準差如表3所示,偏度如表4所示,峰度如表5所示,熵如表6所示。

表1 RGB、HSV和L*a*b*模型下枸杞病斑區域和無病區域的均值

表2 RGB、HSV和L*a*b*模型下枸杞病斑區域和無病區域的方差值

表3 RGB、HSV和L*a*b*模型下枸杞病斑區域和無病區域的標準差值

表4 RGB、HSV和L*a*b*模型下枸杞病斑區域和無病區域的偏度值

表5 RGB、HSV和L*a*b*模型下枸杞病斑區域和無病區域的峰度值

表6 RGB、HSV和L*a*b*模型下枸杞病斑區域和無病區域的熵值

為了避免不同特征的取值范圍的差異對病斑類型識別的準確性的影響,需要對病斑圖像的147個特征的取值范圍進行歸一化操作[8],使得各特征值均小于1,公式如(1)所示:

其中,Xi為第i個特征值,Xinormal為第i個特征的歸一化值,Ximin為訓練圖像集中第i個特征的最小值,Ximax為訓練圖像集中第i個特征的最大值。

對枸杞葉片病害的5類病斑圖像(無病斑、白粉病圖像、灰斑病圖像、癭螨病圖像和炭疽病圖像)的147個特征進行歸一化操作后,采用主成分分析PCA方法,把147個特征映射成50個綜合特征,用這50個特征來反映病斑圖像的信息,最終實現特征優化。

3 區分深度置信網絡深層架構

3.1 區分深度置信網絡

區分深度置信網絡(Discriminative Deep Belief Networks,DDBN)是一個全連接定向的多層神經網絡,如圖2所示。

圖2 區分深度置信網絡架構

其中,包括一個輸入層,N個隱藏層和頂部的一個類別標簽層,輸入層h有D個單元,等同于數據x中特征的個數,類別標簽層有C個單元,等同于標簽數據y中的類別數。W={ω1,ω2,…,ωN+1}是深層架構中需要學習的參數。X是一個樣本數據集,表示為X=[x1,x2,…,xL+U]。其中,L是已標注圖像的數量,U是未標注圖像的數量,D是每個數據的特征個數,X的每一列是一個數據x。一個擁有所有特征的數據可以看作是空間RD中的一個向量,其中第 j個坐標對應第j個特征。

在區分深度置信網絡深層架構中,定義能量狀態(hk-1,hk)為:

hk-1發生的概率是:

其中Z()

θ是歸一化常數。

hk和hk-1的條件概率是:

第t個單元為1的概率是包含hk-1和的邏輯函數:

第s個單元為1的概率是包含hk和的邏輯函數:

其中,邏輯函數為:

對隱藏層產生的概率的對數相對于模型參數ωk進行求導,通過CD方法得到[9]:

最后,對參數ωk進行調整:

其中,?是沖量,η是學習率。

計算得到參數ωk后,隱藏層可以在一個數據x從h0輸入后,通過公式(11)得到hkt()x。

參數空間ωN是用服從正態分布的隨機數初始化的。

3.2 損失函數

為了使用L個標注數據來優化參數空間W,從而使得區分深度置信網絡深層架構具有更好的區分能力,即轉化為優化問題:

其中

T為損失函數,合適的損失函數可以提高分類器的區分能力。常見的損失函數有對數損失函數、合頁損失函數[10]和指數損失函數。

對數損失函數可以正確地分類數據,但是類別之間的分界線距離每個類別的優化目標位置很遠,這樣會出現過度優化,過度優化會增加錯誤分類點的個數。合頁損失函數一般在數據分類邊界線(x)=(x)比較近時會停止優化,是SVM的損失函數,如果有足夠的支持向量,那么則該類優化可行。

本文的基于區分深度置信網絡的病害圖像識別分類器采用的是指數損失函數,運用指數損失函數的典型分類器是AdaBoost算法,指數損失函數在實際的數據集中表現良好[11]。指數損失函數的具體形式如下:

其中,r=hN(xij)yij,不同損失函數的比較如圖3所示,本文所提出的分類器使用指數損失函數。

圖3 損失函數的比較

4 基于區分深度置信網絡的病害識別算法

針對沒有足夠標注數據時的枸杞病害識別問題,從病斑圖像提取了顏色特征、紋理特征和形狀特征等底層特征,通過底層特征的逐層特征變換,得到更加抽象的高層特征,從而發現更易于分類或預測的特征表示。

結合區分深度置信網絡和指數損失函數,建立枸杞病害識別模型。建立的基本過程分為:第一步,構建深層架構,L+U個訓練數據被用來尋找N層網絡的參數空間{ω1,ω2,…,ωN-1} ;第二步,基于梯度下降方法的監督學習,利用反向傳播機制將深層架構的參數空間進一步優化,使用共軛梯度算法對深層架構進行訓練。所以,本文研究的是一種半監督學習方法,有效地將無監督學習的抽象能力和監督學習的區分能力相結合。

病害識別模型訓練完成后,當輸入一個新的病斑圖像x,可以根據該模型的輸出h的值來判斷x所屬的病斑類別。

4.1 病害識別算法流程

基于區分深度置信網絡的病害圖像識別算法流程如下所示。

病害圖像識別算法流程

輸入 樣本圖像集X,類別集Y,隱藏層h,層數N

每一層的單元個數D1,D2,…,DN,

迭代次數Q

參數空間W={ω1,ω2,…,ωN}

偏置b,c,沖量?,學習率η

已標注圖像的個數L,未標注圖像的個數U

輸出 包含訓練后參數空間W的深層架構

1.構建深層架構

for k=1;k〈=N-1 do

for q=1;q〈=Q-1 do

for u=1;u〈=L+U do

計算非線性正向和反向狀態:

更新參數和偏置:

end

end

end

2.基于梯度下降方法的監督學習

4.2 實驗測試與分析

通過前期圖像處理獲得枸杞葉片病害的5類病斑圖像共計1 201張,其中100張無病斑圖像、75張白粉病圖像、330張灰斑病圖像、340張癭螨病圖像和356張炭疽病圖像,病斑圖像的樣例如圖4所示。

圖4 病斑圖像的樣例

首先,對每一張病斑圖像提取它的顏色特征、紋理特征和形狀特征共計147個,然后通過特征優化得到每一張病斑圖像的50個主要特征。選擇標注圖像數據時,標注的個數在2~75之間變化,確保每類病斑至少有一個標注數據。

實驗中,每張病斑圖像的分辨率是20×20,區分深度置信網絡深層架構為50-50-50-200-5,表示輸入層的結點個數為50,即輸入每張病斑圖像的50個特征,輸出層的結點個數為5,即病斑類別為無病、白粉病、灰斑病、癭螨病和炭疽病5類,三個隱藏層的結點個數分別為50、50和200。第一階段,訓練每一層的迭代次數為30,學習率為0.1,初始沖量為0.5,迭代5次后,沖量變為0.9;第二階段,使用共軛梯度下降算法,迭代次數為20,每次迭代中使用3次線性搜索。

使用4.1節算法輸入新的病斑圖像x,可以根據該模型DDBN輸出x所屬的病斑類別,該分類器DDBN的分類性能與代表性的KNN、SVM[10]和NN[12]分類器相比較,使用不同數量的已標注圖像來比較各個分類器的分類錯誤率。已標注圖像的個數分別設為5、25、50和75,每類病斑至少有一個是已標注的。比較實驗的結果如表7所示。

表7 不同分類器在不同數量的已標注圖像的分類錯誤率%

在不同數量的已標注圖像的分類器比較實驗中,DDBN的分類結果總是優于其他的分類方法,在沒有足夠的已標注圖像時表現出了穩定的、優越的分類性能。本文研究的識別模型不但表明了深層架構在自然圖像識別任務中的有效性,也為深層架構解決困難的學習問題理論提供了實驗驗證[13-15]。

5 結論

本文結合區分深度置信網絡和指數損失函數建立了病害識別模型,實現了枸杞病害圖像的快速的、有效的識別和分類,首先對枸杞病害圖像進行預處理,建立“白粉病”、“灰斑病”、“炭疽病”和“癭螨病”四種病害類別的圖像樣本集,然后對圖像樣本集中各類別圖像的顏色特征、紋理特征和形狀進行提取和優化,建立區分深度置信網絡深層架構,利用深層架構建立病斑特征與病斑圖像類別之間的映射關系,本文研究的方法高效地利用了底層圖像特征的高層表示,解決了沒有足夠的標注數據時的圖像識別問題。

[1]Li F,Fergus R,Perona P.Learning generative visual model from few training examples:An incremental Bayesian approach tested on 101 object categories[C]//CVPR Workshop on Generative-Model Based Vision.New York,NY,USA:Elsevier Science Inc,2004:1-9.

[2]Yu Z,Wong H S.Image classification based on the baggingadaboost ensemble[C]//International Conference on Multimedia and Expo.Naples,Italy:IEEE,2008:1481-1484.

[3]Lu F X,Yang X K,Zhang R,et al.Image classification based on pyramid histoshoji tanaka,yuichi iwadate,seiji inokuchi and attractiveness evaluation based on the physical gram of topics[C]//International Conference on Multimedia and Expo.Piscataway,NJ,USA:IEEE,2009:398-401.

[4]Fan Jianping,Shen Yi,Yang Chunlei,et al.Structured max-margin learning for inter-related classifier training and multilabel image annotation[J].IEEE Transactions on Image Processing,2011,20(3):837-854.

[5]毛罕平,張艷誠,胡波.基于模糊C均值聚類的作物病害葉片圖像分割方法研究[J].農業工程學報,2008,24(9):136-140.

[6]Omrani E,Khoshnevisan B,Shamshirband S,et al.Potential of radial basis function based support vector regression for apple disease detection[J].Measurement,2014,55:512-519.

[7]Dubey S R,Jalal A S.Fusing color and texture cues to identify the fruit diseases using images[J].International Journal of Computer Vision and Image Processing,2014,4(2):52-67.

[8]秦豐,劉東霞,孫炳達,等.基于圖像處理技術的四種苜蓿葉部病害的識別[J].中國農業大學學報,2016,21(10):65-75.

[9]Chen E K,Yang X K,Zha H Y,et al.Learning object classes from image thumbnails through deep neural networks[C]//International Conference on Acoustics,Speech and Signal Processing.Las Vegas,Nevada,USA:IEEE,2008:829-832.

[10]Collobert R,Sinz F,Weston J,et al.Large scale transductive SVMs[J].Journal of Machine Learning Research,2006,7:1687-1712.

[11]Friedman J H,Hastie T,Tibshirani R.Additive logistic statisticalview ofboosting[J].Annals ofStatistics,2000,28:337-407.

[12]Mitchell T M.Machine learning[M].Columbus OH,USA:McGraw-Hill Science/Engineering/Math,1997.

[13]Bengio Y,Lamblin P,Popovici D,et al.Greedy layer-wise training of deep networks[C]//International Conference on NeuralInformation Processing Systems.Canada:NIPS Foundation,2006:153-160.

[14]Weston J,Ratle F,Collobert R.Deep learning via semisupervised embedding[C]//International Conference on Machine Learning.Helsinki,Finland:ACM,2008:1168-1175.

[15]Girshick R,Donahue J,Darrell T,et al.Region-based convolutional networks for accurate object detection and segmentation[J].IEEE Transactions on Pattern Analysisamp;Machine Intelligence,2016,38(1):142-158.

SONG Lijuan

1.School of Information Science and Technology,Northwest University,Xi’an 710127,China 2.School of Information Engineering,Ningxia University,Yinchuan 750021,China

Recognition model of disease image based on discriminative deep belief networks.Computer Engineering and Applications,2017,53(21):32-36.

To detect and identify the disease of Chinese Wolfberry in time and accurately is very important on the disease monitor,prediction,early warning,treatment and the construction of agricultural information and intelligence.The deep architecture of disease image classification and identification is proposed based on discriminative deep belief networks.First of all,this paper automatically crops the leaf disease image of Chinese Wolfberry into the sub-image containing typical spots,and then researches segmentation under complex background and the image feature extraction,the features is a total of 147 on color feature,texture feature and shape feature.Disease recognition model is established with discriminative deep belief networks and exponential loss function.Experimental results show that,the method has good effect on image recognition.Compared with the support vector machine,the disease image recognition model based on discriminative deep belief network not only can effectively use the high-level representation of low-level image features but also can solve the problem of data annotation image recognition.

disease image;discriminative deep belief networks;exponential loss function

A

TP391.4

10.3778/j.issn.1002-8331.1707-0506

國家自然科學基金(No.61363018);寧夏高等學??茖W技術研究項目(No.NGY2014055,No.NGY2016016)。

宋麗娟(1978—),女,博士生,副教授,研究領域為圖像處理與機器視覺,E-mail:slj@nxu.edu.cn。

2017-08-01

2017-09-30

1002-8331(2017)21-0032-05

猜你喜歡
置信圖像識別區分
靈活區分 正確化簡
融合有效方差置信上界的Q學習智能干擾決策算法
置信職業行為在護理教育中的研究現狀
基于模糊深度置信網絡的陶瓷梭式窯PID優化控制
基于Resnet-50的貓狗圖像識別
高速公路圖像識別技術應用探討
怎么區分天空中的“彩虹”
圖像識別在物聯網上的應用
圖像識別在水質檢測中的應用
區分“我”和“找”
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合