?

基于卷積神經網絡的玉米種子質量檢測

2024-03-25 01:58劉琳茜楊亞寧
大連民族大學學報 2024年1期
關鍵詞:玉米種子殘差灰度

劉琳茜,楊亞寧

(大連民族大學 信息與通信工程學院,遼寧 大連 116605)

玉米多種植于中國東北部地區,是中國重要的糧食作物和飼料作物。近年來,中國玉米播種面積及其產量呈現穩步上升態勢, 2020年中國玉米產量占比達到23.02%,位居世界第二。由于玉米種子顆粒小,除了存在發霉、破損等問題還極易與微小雜質混合,所以玉米行業發展更離不開玉米種子品質的篩選。

國內許多學者對玉米種子品質篩選展開了相關研究。閆彬等[1]提出采用的基于小波變換模極大值的邊緣檢測算法凸顯玉米種子的裂紋區域平均準確率達到90.6%,該方法局限于檢測種子是否存在裂紋,無法判斷是否存在發霉和其他病變;范曉飛等[2]提出基于改進YOLOv4的目標檢測模型,同時結合四通道多光譜圖像,綜合評價指標達到93.09%,但該方法僅實現了同時對多粒玉米種子品質好、壞的分類;王林柏等[3]提出一種基于分水嶺算法結合卷積神經網絡對玉米種子進行品質檢測的方法,綜合評價指標達到94.39%,該方法采用分水嶺算法將多粒種子進行分割,耗時較長,僅實現對玉米種子質量好、壞的分類。并未對質量存在問題的玉米種子進行是否存在雜質的分類。

為提高玉米種子質量檢測的精準率,以單顆玉米種子為研究對象,利用數據增強[3]的方法對原始數據集擴充,結合Resnet50模型對玉米實現分類,與傳統卷積神經網絡(CNN)[4]模型不同的是加入了殘差模塊,可以有效減少計算量,提高準確率,實現對玉米種子品質的檢測。通過實驗數據對比,選擇綜合評價指標最優的模型,為玉米播種技術發展提供新的思路。

1 數據集分析及評價指標

1.1 數據集分析

研究的數據來源于公開數據庫,原始數據集共842張,包括“Good_seed”180張、“Bad_seed”202張、“Side_by_side”460張。使用數據增強的方式,擴大數據集如圖1。其中包括對圖像進行隨機角度的旋轉;對圖像亮度進行調整;對圖像進行隨機裁剪,缺失部分選用黑色像素塊填補;對圖像加入椒鹽噪聲、高斯噪聲;對圖像隨機刪除一個矩形區域,通過黑色像素塊填補(Cutout)等方法進行數據增強。

圖1 數據增強后的數據集

數據集如圖2。通過數據增強方法最終得到“Good_seed”1 399張、“Bad_seed”981張、“Side_by_side”2 956張,總計5 336張。其中“Bad_seed”包括不同程度發霉的玉米種子、顆粒不完整的玉米種子和變異的玉米種子;“Side_by_side”包括玉米須、玉米葉、其他小顆粒雜質等。

圖2 數據集

1.2 評價指標

對建立的玉米種子質量檢測的模型進行評估見表1。評估標準包括召回率(Recall)、精確率(Precision)以及綜合評價指標(F1)三個指標。

表1 實驗評價指標公式對照表

(1)TP(真正例):樣本是正例,預測結果為正例;

(2)FP(假正例):樣本是反例,預測結果為正例;

(3)TN(真反例):樣本是反例,預測結果為反例;

(4)FN(假反例):樣本是正例,預測結果為反例;

2 研究方法分析

研究過程如圖3?;叶忍幚黼A段,將原始圖像先分解成由紅色(Red)、綠色(Green)和藍色(Blue)構成的色彩空間,后轉換成由色調(Hue)、飽和度(Saturation)和明度(Value)構成的三通道圖像。使用腐蝕、膨脹對圖像進行預處理,為增強原圖像中發霉部分和沒有發霉部分的對比度,采用圖像增強技術。使用均值濾波器mean_image對圖像進行濾波,通過計算窗口區域像素的平均值來代替原值,對灰度圖像的灰度值進行平滑處理。使用算子進行濾波,得到濾波后的圖像灰度值,對比原圖像,計算得到新的灰度值。新的灰度值等于原灰度值減去濾波后的灰度值乘上對比系數加原圖像灰度值。最后采用Blob分析的方法完成區域的篩選以及背景的分割。缺陷分類檢測采用深度學習的方法進行模型訓練。

圖3 研究過程概況

卷積神經網絡(CNN)是一種帶有卷積結構的深度網絡模型,通過卷積結構的堆疊達到降低網絡占用量。標準的CNN包括輸入層(Input)、卷積層(Conv)、池化層(Pool)、全連接層(Fc)和分類層如圖4。

圖4 CNN過程示意圖

卷積層可以提取出圖像的特征如公式(1)所示,輸入224×224×3的圖像,經過64個7×7的卷積核進行卷積計算,其中參數:補零圈(padding)為3,步長(stride)為2,則輸出為112×112×64的特征圖。卷積核越大,感受野越大,不同的感受野可以重疊,因此得到的圖像信息越多,得到的特征越明顯,卷積示意圖如圖5。

圖5 卷積示意圖

卷積參考公式:

(1)

式中,函數g作為功率器,f為圖像信號。

最大池化(max-pooling,MP)方法如公式(2)所示,保留主要的特征,經過池化后的圖像尺寸變為56×56×64,如圖6。最大池化參考公式:

圖6 最大池化原理示意圖

(2)

全連接層中各節點與上一層神經元節點連接,起到分類作用。分類層選用Softmax分類器其原理如公式(3)所示,對概率分布進行歸一化處理,從而達到分類的目的。

Softmax定義:

(3)

2.1 對SqueezeNet模型描述

SqueezeNet是Han[6]等人提出的輕量級CNN模型,該模型通過使用多個1×1卷積核代替3×3卷積核,從而達到參數計算量的優化。其模型結構如圖7。其中每一層卷積采用了1×1和3×3的混合卷積核,步長(stride)均為1,3×3卷積補零圈(padding)參數為1?;旌暇矸e核中間采用Concat函數[6]連接,計算通道數量,增加原圖像的特征數,實現多尺度特征融合。卷積層與激活函數相結合,輸出后進行最大池化,細化特征。

圖7 SqueezeNet模型

2.2 對Resnet50模型的描述

經過對CNN的不斷研究,從Le Net 的5層卷積發展到Google Net 22層卷積,研究發現一味地擴大網絡層數會出現隨機梯度消失的問題。為解決這一問題,深度殘差網絡Resnet50誕生。Resnet50模型與VGG等其他傳統CNN模型相比增加了殘差模塊如圖8。設W1、W2分別代表兩層Weight layer的權重,通過引入恒等映射將底層特征x與上層網絡相聯系,假設網絡輸入為x1,H(x)表示恒等映射,f表示relu激活函數,則輸出x1+1可以表示為公式(5):

圖8 殘差網絡結構

y1=H(x1)+F(x1,W1),

(4)

x1+1=f(y1)。

(5)

殘差模塊分為恒等殘差塊(Identity Block)和卷積殘差塊(Conv Block)。Resnet50的詳細模型框架如圖9。其中輸入圖像尺寸為224×224×3,經過一個7×7的卷積層,補零圈(padding)為3,步長(stride)為2,輸出為112×112×64;經過一個2×2的最大池化層(maxpool)步長為2,輸出為56×56×64;經過四個Block(依次為:Conv2_x、Conv3_x、Conv4_x、Conv5_x),其中虛線代表經歷一個1×1的卷積殘差塊;最后經過平均池化層以及全連接層達到提取特征分類的作用。

圖9 Resnet50模型

每一層卷積、池化層后加入激活函數和BatchNorm。其中激活層采用ReLu函數,相較于sigmoid和tanh函數,ReLu函數具有收斂速度快的優點。ReLu函數的導數在負半區顯示為0,可以達到單側抑制的效果,大大提高計算效率。BatchNorm對上一節點輸出數據進行歸一化。

對神經網絡各層結點的激活值求解后,計算樣本與神經網絡輸出層之間的殘差[7]以及隱藏層各層的殘差如公式(6)和(7)所示,最后計算每層網絡的權重和偏置的偏導數如公式(8)和(9)所示。使用優化算法即梯度下降法不斷迭代,對權重和偏置值不斷更新優化,使損失函數達到最小值,完成神經網絡的訓練。

δ(nl)=-(y-h(nl))·f′(w(nl-1)h(nl-1)+b(nl-1)),

(6)

δ(i)=-((wi)Tδ(i+1))·f′(w(i-1)h(i-1)+b(i-1)),

(7)

(8)

(9)

式中:δ(i)表示第i層的每個神經元節點的殘差值;h(i)表示第i層神經元輸出值;w表示權重;b表示誤差;J(x)函數表示損失函數;(x,y)代表單一樣本。

3 實驗結果分析

根據采集的圖像總數,設置參數見表2。受硬件設施限制,訓練的數據樣本個數(BatchSize)均設為24;學習率(LearningRate)決定如何對梯度進行加權;在更新損失函數參數時,動量[8](Momentum)規定了先前梯度如何對權重更新。如果超參數“weight prior”非零,則將正則化項添加到損失函數中。

表2 參數設置

按照數據集拆分比例不同,將實驗分成見表3所示的三組。對三組數據分別使用SqueezeNet訓練模型和 Resnet50訓練模型訓練。模型訓練過程采用每經歷4次迭代對損失函數(Loss)下降曲線和錯誤率(top1_error)曲線進行圖像繪制。圖10~15分別表示Resnet50模型和SqueezeNet模型訓練的損失函數下降曲線(紅色曲線)和錯誤率下降曲線(藍色曲線)

表3 實驗分組

圖10 第一組數據與迭代次數之間的關系

圖11 第二組數據與迭代次數之間的關系

圖12 第三組數據與迭代次數之間的關系

圖13 第四組數據與迭代次數之間的關系

圖14 第五組數據與迭代次數之間的關系

圖15 第六組數據與迭代次數之間的關系

根據數據集的劃分,隨機從驗證集中抽選出10%的玉米種子圖像對第一組和第二組分別進行數據評估,如表4。綜合評價指標分別為:96.45%和92.15%;隨機從驗證集中抽選出20%的玉米種子圖像對第三組和第四組分別進行數據評估,綜合評價指標分別為:94.70%和92.24%;隨機從驗證集中抽選出30%的玉米種子圖像對第五組和第六組分別進行數據評估。綜合評價指標分別為:94.99%和93.49%。結合損失函數下降曲線和錯誤率下降曲線,最終采用Resnet50模型,將90%數據集用于訓練,10%數據集用于測試,最終結果最優。

表4 評價結果 %

4 結 語

經多組實驗對比發現,將Resnet50模型應用于玉米種子質量檢測中可以有效提高和檢測準確率。除了可實現玉米種子好、壞的分類,還可以實現排除與玉米種子極為相似的雜質,綜合評價指標達到96.45%,相較于傳統卷積模型SqueezeNet有所提高,該方法有望為玉米播種技術的發展提供了新的便利。

猜你喜歡
玉米種子殘差灰度
不同條件下對濟寧地區玉米種子萌發特性的研究
采用改進導重法的拓撲結構灰度單元過濾技術
基于雙向GRU與殘差擬合的車輛跟馳建模
影響玉米種子發芽率的因素及對策
基于灰度拉伸的圖像水位識別方法研究
基于殘差學習的自適應無人機目標跟蹤算法
基于遞歸殘差網絡的圖像超分辨率重建
基于最大加權投影求解的彩色圖像灰度化對比度保留算法
基于灰度線性建模的亞像素圖像抖動量計算
玉米種子生產存在的問題及管理辦法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合