?

基于DCGAN和1DCNN的小樣本煙葉霉變識別方法研究與應用

2023-02-22 09:14黃越輝陳達暢
電大理工 2023年4期
關鍵詞:鑒別器電子鼻煙葉

黃越輝 李 捷 陳達暢

(武漢輕工大學,湖北武漢 430023)

0 引言

煙葉作為一種經濟作物,在我國廣泛種植。煙葉從農田采收到制成卷煙,需要1~2 年的時間,煙葉吸濕性強,富集霉菌生長所需要的營養物質,極易發生霉變從而影響經濟價值。目前,檢測煙葉霉變的方法主要分為三種:①人工視覺、嗅覺和感官評吸。②光譜儀采集近紅外光譜。③霉菌培養計數。這三種方法存在繁瑣、費時、成本高等缺點。因此,在煙葉霉變快速檢測中需要一種操作簡單、結果準確、易攜帶的檢測方法。

當前隨著電路工藝的突飛猛進,電子鼻越來越小型化,電子鼻技術在農業、環境、食品等行業有廣泛的應用。尹遜玉[1]利用BP 神經網絡進行數據分類以實現對不同品質咖啡的識別。李爽[2]使用LIBSVM 對養殖場空氣進行檢測識別,從而調控雞舍養殖環境。陶懷亮[3]使用PCA 降維后,用Arduino分類器鑒別花椒品種的方案。

近些年,電子鼻檢測設備逐漸使用人工智能識別技術用于識別和區分各種作物的霉變。隨著深度學習技術的不斷發展,科研人員更多地應用電子鼻技術并結合人工智能算法來快速檢測經濟作物的質量。羅禮純[4]使用殘差神經網絡模型識別大黃魚新鮮度。張珊珊等[5]提出一種小型的基于通道注意力的卷積神經網絡(Channel Attention Convolutional Neural Networks,CA-CNN)的深度挖掘特征方法用于中國白酒真假鑒別。王首程等[6]采用電子舌和電子鼻結合密集卷積網絡— 極限學習機(DenseNet Extreme Learning Machine,DenseNet-ELM)模型對陳醋釀造年限進行快速檢測。

基于已有研究,針對小樣本煙葉霉變識別檢測,使用深度學習作為霉變檢測識別方法。但深度學習,如卷積神經網絡(Convolutional Neural Networks,CNN)等需要大量樣本作為數據集進行訓練,而在實際樣本采樣中,由于開發周期短,難以采集到所有品種的煙葉。因此本文提出一種基于深度卷積對抗生成網絡(DCGAN)和一維卷積神經網絡(1DCNN)相結合的模型DCGAN-1DCNN 來識別煙葉的霉變狀態,利用DCGAN 對小樣本霉變數據進行擴充,結合卷積神經網絡學習霉變特征,從而實現對煙葉霉變檢測的廣譜性,并設計了一套便攜式電子鼻設備作為DCGAN-1DCNN 模型的煙葉霉變數據集采集和識別方法測試驗證裝置。

1 算法原理

1.1 DCGAN算法原理

DCGAN 由GAN 和CNN 兩個網絡結合構成,融合了CNN 網絡提取目標特征的能力以及GAN網絡的學習能力,具有較強的網絡穩定性。DCGAN 實際上是一個博弈論的方法,由兩個神經網絡相互博弈學習生成性能更好的模型,即由生成器網絡模型(Generative Model,G)和判別器網絡模型(Discriminative Model,D)進行二元博弈訓練[7]。其流程如圖1 所示,將幅度分布服從高斯分布,功率譜密度服從均勻分布的隨機噪聲(Z)輸入生成器中,生成器輸出新產生的樣本G(Z)。將G(Z)和原始數據(x)傳輸到鑒別器D中,鑒別器D對G(Z)和x進行區分,原始數據輸出結果為D(x),新產生樣本輸出結果為D(G(Z)),將輸出結果反饋給生成器,生成器根據結果不斷優化的同時,鑒別器也在不斷更新參數,在兩者博弈中,鑒別器的目標是D(x)→1,D(G(Z))→0。生成器的目標是D(G(Z))→1,因此,DCGAN優化的目標函數如公式(1)所示

圖1 DCGAN結構框圖

1.1.1 DCGAN生成器原理

深度卷積對抗生成網絡的生成器,實質上是由多個二維轉置卷積層(Conv2d_transpose)、批量歸一化(Batch Normalization)、激活函數(ReLU)的堆疊,圖2 是DCGAN 模型生成器網絡的具體結構,生成器結構可總體分為三個部分,第一個部分中包括全連接操作(Linear)、reshape 操作、批量歸一化操作和非線性激活函數(ReLU),第二個部分中包括二維轉置卷積操作、批量歸一化操作和非線性激活函數(Re-LU),第三個部分中包括二維轉置卷積操作和非線性激活函數(Tanh)。

圖2 DCGAN生成器網絡結構

1.1.2 DCGAN鑒別器原理

深度卷積對抗生成網絡的鑒別器,其實是利用CNN 網絡結構進行的分類識別,和傳統CNN 結構不同的是,通過設置二維卷積的步長來代替傳統CNN 結構中的池化層,從而可以大幅縮減訓練參數。圖3 給出了DCGAN 模型鑒別器網絡的具體結構,鑒別器網絡總體分為二個部分,第一部分包括二維卷積操作、批量歸一化操作和非線性激活函數(Leak ReLU),第二個部分包括reshape 操作、全連接操作(Linear)、Sigmoid函數輸出鑒別結果。

圖3 DCGAN鑒別器網絡結構

1.2 1DCNN算法原理

一維卷積神經網絡通過多個濾波器對輸入數據進行多次卷積與池化運算,從而自適應提取數據內部的高級特征[8]。1DCNN 精簡輸入模型前的數據預處理,可將原始數據直接輸入模型中,識別準確率高。其結構由輸入層、卷積層、池化層、全連接層和輸出層組成,如圖4所示。卷積層由多個卷積核構成,通過反向傳播算法得出卷積核參數[9],卷積層的作用是提取目標更深層的特征,通過設置卷積核的步長在輸入信號中依次滑動來實現。卷積運算如公式(2)所示:

圖4 1DCNN結構框架圖

式中,f為激活函數,Mj為輸入時設定,l為輸入的長度,Xl-1i為輸入信號的待卷積區域,Wlji為卷積核矩陣,bj為提高網絡表達能力而設置的卷積核偏置系數。

池化層的作用是對卷積層輸出進行采樣,減少系統的計算量,同時可以防止系統過擬合,提升網絡泛化能力,目前主流使用最大池化和平均池化兩種方法。

Droupout 層作用是隨機失活一半神經元,其作用是防止模型過擬合,提升模型泛化能力。

全連接層的作用是整合卷積層和池化層所提取的目標局部特征,輸出一維矩陣給輸出層。

輸出層使用激活函數,其又稱歸一化指數函數。激活函數可以增強網絡的表達能力,常用的函數有Sigmoid 函數、Tanh 函數、ReLU 函數。Softmax 函數是二分類函數Sigmoid 在多分類上的推廣如公式(3)所示,作用是將二分類的結果以概率的形式表現出來。

式中,x為樣本,P(y|x)為j= 1時的概率。

2 DCGAN和1DCNN算法融合

為了解決因實驗樣本不同而導致模型訓練數據集較少的問題,需要利用生成對抗網絡來擴充數據集。傳統GAN 網絡的生成器采用從隨機噪聲中映射到數據分布的映射關系,生成與真實數據樣本相似的假數據,這種方式很難采集到樣本更深層的特征,訓練時容易導致模式崩潰。針對這個問題,DCGAN 網絡的生成器使用轉置CNN 網絡,通過增加卷積的層數,更好地提取樣本的深層特征。

傳統CNN 網絡對數據可以進行較好的分類識別,但是由于維度較多,存在計算量大的問題,本文主要對氣體傳感器信號進行分類識別,均為黑白一維圖像,故采用1DCNN 便能很好地進行分類識別。

針對這些問題,本文提出一種基于DCGAN-1DCNN 的分類器方法,利用DCGAN 擴充樣本數據集,1DCNN 對數據集分類識別,來檢測煙葉霉變問題,網絡結構如圖5 所示。將MEMS 氣體傳感器采集的原始電壓信號轉換成二維灰度圖像,再將二維灰度圖像分成訓練集和測試集兩部分,利用DCGAN 擴充訓練集,得到煙葉霉變的增強數據集,將增強數據集和測試集輸入一維卷積神經網絡中進行訓練,得到霉變識別模型。

圖5 煙葉霉變檢測方法框架

3 實驗驗證

3.1 煙葉霉變識別硬件平臺設計

本研究采用ARM架構的STM32F103系列作為主控MCU 芯片。由MCU 的ADC 對氣體傳感器陣列進行電壓采集獲得響應數據,將采集獲得的數據打包通過Wi-Fi 藍牙模塊或USB 通信模塊發送至上位機,用訓練完成的煙葉霉變識別模型對煙葉霉變氣體數據進行分類識別。針對煙葉霉變所產生的揮發性化合物,參照楊蕾[10]對霉變煙葉揮發性及半揮發性成分分析,確定待測目標氣體主要為甲烷、VOC、氫氣、乙醇、丙酮5 種,綜合考慮傳感器成本、功耗、體積、靈敏度,故選擇GM-502B、GM-512B、GM-402B、GM-302B、GM-702B 這5 個MEMS氣體傳感器、一個溫濕度傳感器組成氣體傳感器陣列,如表1。

表1 傳感器參數

根據氣體傳感器陣列和STM32F103 數據手冊要求,完善其他外圍電路以及系統軟件設計后,完成煙葉霉變便攜式電子鼻樣機,經功能測試,符合設計要求,圖6 給出了煙草霉變識別便攜式電子鼻的實物圖。

圖6 便攜式電子鼻實物圖

3.2 數據獲取

3.2.1 數據集采集

本實驗的煙葉來源:湖南某煙廠提供的醇化1 年左右的正常煙葉樣本。將煙葉樣本分成20 份,將其中10 份樣本放入模擬高溫高濕環境,加快煙葉霉變速度,總計得到10 份霉變煙葉樣本。

采集設備為本文設計的便攜式電子鼻,實驗參數設置嚴格按照表2,實驗過程如下:

表2 實驗參數設置

(1)初始條件下,取一定量的煙葉置于取氣瓶中靜置10 min,保證煙葉可揮發氣體充滿取氣瓶。

(2)數據采集前,打開氣泵,使用潔凈空氣對氣室進行清洗90 s。

(3)數據采集時,將MCU 的ADC 設置為0.1 s采集一次,每個樣本的采集時長設置為30 s。

本文設計的煙葉霉變便攜式電子鼻一共有5 個MEMS 傳感器,將MCU 的ADC 采集間隔設置為0.1s,每份樣本重復采集5次,因此可以得到原始數據集100 個。其中霉變數據集50 個,編號為0;未霉變數據50個,編號為1。煙葉數據集結構如表3所示。

表3 數據集介紹

3.2.2 數據集增強

由于原有煙葉霉變數據集數量太少,不足以支撐1DCNN 網絡訓練出泛化性能較好的卷積神經網絡,故使用DCGAN 增強原有數據集。經過多輪迭代后,DCGAN 生成800 張數據圖像,生成的煙葉霉變二維灰度圖像可以提升1DCNN在訓練時的泛化能力。

將新生成的煙葉數據集加入原始數據集,并打亂數據集標簽順序,新的數據集結構及數量如表4所示。

表4 增強后的數據集

3.3 模型訓練

將增強后的數據集輸入1DCNN 中進行訓練,損失函數選用交叉熵函數,網絡迭代次數設置為100次。損失函數:

其中,yi表示真實樣本i的標簽,未霉變為1,霉變為0,Pi表示預測樣本i被預測為未霉變的概率。

將預測值與真實值進行比較,得到實際正類預測為正類(True Positive,TP),實際正類預測為負類(False Negative,FN),實際負類預測為正類(False Positive,FP)和實際負類預測為負類(True Negative,TN)的數量,準確率(accuracy) 是所有實際正類預測為正類(TP)占所有被檢索樣例(TP+FN+FP+TN)的數量,可以用式(5)表示:

將DCGAN-1DCNN與CNN、BP、SVM等多種不同訓練方法進行對比實驗,實驗結果如表5 所示。從表中可以得出,雖然這幾種電子鼻識別算法準確率均在90%以上,但是DCGAN-1DCNN 識別準確率更高,因此作為小樣本煙葉霉變識別在電子鼻上的應用更為合適。

表5 不同算法對比

4 結論

本文在DCGAN 網絡的基礎上融合1DCNN網絡來解決小樣本煙葉數據集難以支撐深度學習訓練的問題,利用DCGAN 擴充小樣本數據集后,使用1DCNN 來分類識別。在設計的煙葉霉變便攜式電子鼻上進行數據采集、驗證、對比實驗,其中DCGAN-1DCNN 識別準確率最高可達96.2%,高于CNN、BP、SVM,并且將其應用到煙葉霉變便攜式電子鼻上。

猜你喜歡
鑒別器電子鼻煙葉
基于多鑒別器生成對抗網絡的時間序列生成模型
關于新形勢下煙葉生產可持續發展的思考
衛星導航信號無模糊抗多徑碼相關參考波形設計技術*
電子鼻咽喉鏡在腔鏡甲狀腺手術前的應用
煙葉主要真菌病害的發生與防治
飛到火星去“聞味兒”——神奇的電子鼻
陣列天線DOA跟蹤環路鑒別器性能分析
一種降低造紙法再造煙葉平滑度的方法
電子鼻在烤雞香氣區分中的應用
湘西上部煙葉化學成分特征及聚類分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合