?

高光譜成像的非煙物質分類識別研究

2022-07-06 08:59李智慧梅吉帆李輝李嘉康盧敏瑞王芳張騰健堵勁松洪偉齡徐大勇
中國煙草學報 2022年3期
關鍵詞:波長煙葉預處理

李智慧,梅吉帆,李輝,李嘉康,盧敏瑞,王芳,張騰健,堵勁松,洪偉齡,徐大勇*

高光譜成像的非煙物質分類識別研究

李智慧1,梅吉帆1,李輝1,李嘉康1,盧敏瑞2,王芳2,張騰健2,堵勁松1,洪偉齡3,徐大勇1*

1 中國煙草總公司鄭州煙草研究院,河南鄭州市高新區楓楊街2號 450001;2 福建武夷煙葉有限公司,福建南平市邵武市紫金大道1號 354000;3 福建中煙工業有限公司技術中心,福建省廈門市集美區濱水路298號 361021

【】利用高光譜成像技術和機器學習方法對煙葉中的非煙物質進行分類識別?!尽渴褂每梢姟t外高光譜成像技術,采用歸一化(Normalization)、標準正態變化(SNV)、多元散射校正(MSC)、一階導數(FD)、卷積平滑(SG)對光譜數據進行預處理,通過連續投影變換(SPA)和主成分載荷(PCA loadings)進行特征波長選擇,并應用隨機森林(RF)、Softmax和支持向量機(SVM)建立分類模型?!尽縎NV為最佳光譜預處理方法,SPA選擇特征波長建立的SVM模型為最優模型,訓練集和測試集正確率分別為99.82%和99.47%?!尽扛吖庾V成像技術結合SPA-SVM模型可以有效分類識別煙葉中的非煙物質。

高光譜成像;非煙物質;連續投影算法;特征波長;支持向量機;分類

非煙物質俗稱雜物,指煙葉中非煙草類物質[1],通常在采收、烘烤、收購等環節混入,影響煙葉原料的使用價值和卷煙產品質量。其中,石頭、金屬、玻璃等非煙物質會損壞加工設備、危害操作人員身體健康,塑料,橡膠,尼龍等化工制品類非煙物質燃燒后產生有害氣體,嚴重影響消費者身體健康[2-4]。目前,工業企業主要采用人工除雜、風選除雜、金屬探測除雜和光電除雜等方法[5]去除生產中混入的非煙物質。但上述除雜方法均存在不足,人工除雜工作量大、易疲勞、受限于操作人員技術熟練程度,風選除雜和金屬探測除雜只能剔除與煙葉比重相差大、有磁性的非煙物質,光電除雜不易識別顏色和質地與煙葉相似的非煙物質,如黃色紙板、其他植物葉子等[6-8]。因此,開發一種能夠同時識別多種非煙物質的在線檢測方法,具有重要的現實意義和應用需求。

高光譜成像技術是一種將圖像和光譜結合的測量技術,以連續和窄帶光譜記錄目標區域的發射或者反射輻射能量,包含了像素級分辨率的空間和光譜特征信息,廣泛應用于遙感、農業、食品安全、環境檢測等領域[9]。高光譜圖像包含了上百個波段地物特征光譜信息和空間圖像信息,構成了高光譜圖像的三維數據立方。采用機器學習和深度學習方法分析高光譜數據的光譜和圖像空間的特征信息可以有效地進行地物識別和分類[10]。近年來,高光譜成像技術已成功應用到煙草病蟲害監測[11-13]、煙葉化學成分含量分析[14-18]等方面。王梅等[19]研究了不同病害程度煙葉的高光譜特征,建立了煙葉病害程度診斷模型。Frederico等[20]采用偏最小二乘方法分析煙葉近紅外高光譜數據,建立了煙葉常規化學成分含量的模型,具有良好的精度。Marcelo等[21]利用近紅外高光譜成像技術,利用支持向量機判別分析開發了烤煙和白肋煙的分級系統,實現了在線判定煙葉質量。Luis Rodríguez-Cobo等[22]通過分析了煙葉中10種非煙物質的高光譜數據,建立了分層時間記憶范式的非煙物質分類方法。Conde等[23]采用光譜成像技術和神經網絡方法實現了對煙葉原料混入的雜物分類。以上研究結果表明,兼具光譜波段多、高空間分辨率特點的高光譜成像技術完全能夠實現非煙物質的分類和識別。

目前,國內采用高光譜成像技術進行非煙物質識別的應用研究相對較少。工業企業在打葉復烤生產線、片煙切絲前仍存在其他除雜方法無法識別的小尺寸、理化性質接近的非煙物質。本研究確定了高光譜圖像數據最佳預處理方法,利用機器學習方法建立全光譜波段和特征波長的非煙物質分類模型,以識別工業生產中混入的非煙物質,提升煙葉純凈度,為開發工業非煙物質的儀器設備提供理論依據和數據支撐。

1 材料與方法

1.1 樣品

供試煙葉和非煙物質樣本均由福建武夷煙葉有限公司提供,煙葉品種為紅花大金元,等級為C3F。生產線常見且影響較大的5種非煙物質,分別為塑料匝繩、尼龍布、麻繩、紙片、植物葉子。非煙物質樣本的尺寸約為3 cm×3 cm,去除表面污漬以保證采集的像元光譜接近其真實像元光譜。

1.2 高光譜數據采集

高光譜成像系統主要包含消色差鏡頭(HSIA- OLE23)可見—近紅外高光譜相機(GaiaField-V10E- AZ4)、電動移動平臺、4個50 W的鹵素燈、SpecView圖像采集軟件和計算機等??梢?近紅外高光譜相機光譜采集范圍為362~1008 nm,光譜分辨率為2.6 nm,共計256個波段,采集參數通過SpecView軟件控制,設置相機曝光時間為11 ms,調節電動移動臺的推掃速度為1.35 cm/s。在暗箱系統環境下進行整個高光譜數據的采集,并且采用4個50 W鹵素燈調節光源強度,避免圖像飽和度過高和外界環境干擾。高光譜數據采集后,需要對采集的高光譜數據進行黑白板校正,以消除光照強度和相機暗電流帶來的噪聲影響。通過采集99%標準校正白板獲取白板標定圖像,通過遮擋鏡頭獲取黑板標定圖像,由公式(1)對采集的高光譜圖像進行校正。

其中,R為校正后的高光譜圖像,I為原始樣品高光譜圖像,B為黑板高光譜圖像,W為白板高光譜圖像。

1.3 高光譜數據預處理

獲取的高光譜圖像一共包含了256個維度的煙葉、非煙物質和背景的圖譜信息。首先選擇高光譜圖像的感興趣區(Region Of Interest, ROI)光譜數據和對光譜數據進行預處理,降低背景信息干擾和數據處理的復雜性。ROI的選取步驟為:(1)對比樣品區域和背景區域像素點的光譜值,發現751 nm波段圖像的背景與樣品光譜值差異最大,選取該波段圖像作為掩膜數據,利用最大類間方差法進行二值化構建掩膜;(2)在掩膜圖像中,樣品區域變為1,而背景區域變為0。利用構造好的掩膜圖像對原始高光譜圖像進行掩膜,只保留樣品區域信息。圖1給出了700 nm、546 nm和435 nm 3個波長合成偽彩圖的煙葉ROI提取過程,其中圖1(c)紅色部分為選擇的ROI。

注:(a)偽彩圖;(b)751 nm灰度圖;(c)選取的感興趣區。

高光譜數據的采集會受到儀器狀態、檢測環境、操作水平等因素的干擾,本實驗采用歸一化(Normalization)、標準正態變換(Standard Normal Variate, SNV)、多元散射校正(Multivariate Scattering Correction, MSC)、一階導數(First Derivative, FD)和Savitzky-Golay(SG)分別對ROI的光譜進行預處理操作,降低外界環境的影響,提高數據信噪比。

Normalization預處理可以消除指標之間的量綱影響;SNV可以去除樣品表面分布不均、顆粒散射而產生的噪聲影響;MSC可以降低由于漫反射導致的光譜數據差異,增強與有效成分所對應的光譜信息;FD能夠去除光譜曲線基線漂移,并使光譜曲線變化更加顯著;SG利用平滑處理結合合適的多項式次數和平滑移動窗口數,對移動窗口內的光譜特征進行數據擬合,以消除基線漂移、傾斜等噪聲,本研究中多項式次數設置為5,平滑移動窗口數設置為9。

1.4 特征波長提取

采用隨機抽樣的方法提取預處理后ROI內所有像素點的光譜數據,獲取每類樣品ROI內500個像元光譜反射率值作為500個樣本,煙葉樣本和5種非煙物質共計3000個樣本。采用Kennard-stone法將樣本以3:1的比例劃分為訓練集和測試集,訓練集和測試集的樣本數量分別為2250個和750個。

為了降低高光譜中冗余信息對數據建模的影響,避免維數災難,進一步提高模型精度和時效性。運用主成分載荷(Principal Component Analysis loadings, PCA loadings)和連續投影算法(Successive Projections Algorithm,SPA)對測試集數據進行特征波長提取。PCA loadings可以反映主成分與原始光譜波段間的相關性,根據波長在不同主成分下的載荷系數不同,載荷系數越大,該波段對主成分的貢獻率越大,選取主成分載荷系數圖中的具有局部極小值、極大值的波長作為特征波[24]。SPA是一種使光譜數據矩陣冗余度最小化的前向波長選擇算法,通過連續投影分析數據,選擇具有最低共線性的變量組合作為特征波長[25]。

1.5 分類模型的建立與評價

隨機森林(Random Forest, RF)作為一種集成學習算法,通過構建多棵決策樹,組合多棵決策樹的建模結果共同得出最終預測結果,具有運算速度快,對異常值和噪聲有很好的容忍度,在處理大量數據表現好等優點[26]。經對比不同子樹數量的性能后,本研究最終選擇RF模型的子樹數量為150。Softmax分類器是邏輯回歸在多分類問題上的擴展,與只能進行二分類的邏輯回歸分類不同,結果以概率的形式解決多分類問題[27]。Softmax作為一種有監督分類器,在分類時計算量小,速度快,可與多種淺層、深層神經網絡結合。本研究對Softmax模型的正則化參數選擇L2,通過網格搜索算法選擇合適的損失函數優化算法和正則化系數C,其調參范圍分別為{newton-cg, lbfgs, sag, liblinear}和10-5~105。支持向量機(Support Vector Machine, SVM)是通過找出最大決策邊界,實現對數據進行分類的分類器,采用核函數,將數據向高維空間映射時并不增加計算法復雜性,可克服特征多、非線性、小樣本的問題[28]??紤]到像素點光譜數據的非線性,本研究選擇rbf作為SVM模型的核函數,通過網格搜索算法選擇合適的正則化系數C和核系數γ來優化模型,正則化系數C和核系數γ的調參范圍分別為10-5~105、10-5~103。

本研究分別使用RF、Softmax、SVM機器學習方法建立了不同光譜預處理方法的煙葉和非煙物質分類模型,以分類模型在訓練集和測試集內部的平均正確率作為評價指標,以確定最佳預處理方法和最優分類模型。

2 結果與討論

2.1 煙葉和非煙物質的平均反射光譜

對光譜數據信噪比進行評價,光譜范圍在400 nm前和1000 nm后的數據信噪比較低,因此選取光譜范圍為400~1000 nm的數據進行后續分析,共計236個波段。將每類500個樣品光譜取均值得到煙葉非煙物質的平均光譜反射率。煙葉與非煙物質的平均光譜曲線如圖2所示,塑料匝繩和尼龍布在590 nm處具有反射峰,故基于此可與煙葉區分。煙葉、植物葉子、紙制品和麻繩作為植物類或植物類制品有著相似的光譜波形,在420 nm處有吸收谷,500~700 nm反射率呈現上升趨勢,在950 nm處有小的反射率峰存在,但是在某些波段范圍反射率存在較為明顯的差異,即6類別樣本類間光譜特性差異較大。

圖2 煙葉和非煙物質的平均反射光譜

2.2 樣品主成分分析

主成分分析通過正交變換將線性相關的變量組合成新的相互無關的新變量,可獲取不同類別樣品的主成分得分分布,定性判斷不同類別樣本的可分性。對煙葉和非煙物質的反射光譜數據主成分分析可知,前3主成分的貢獻率分別為80.36%,12.92%,5.83%,累積貢獻率超過了99%,表明前3主成分能夠包含絕大部分的原始光譜信息。6類樣品在前3主成分的得分分布如圖3所示??梢钥闯?,同一類別的分布較廣泛,但煙葉和非煙物質各自分別聚集在一起,進一步說明煙葉和非煙物質具有良好的可分性,可利用高光譜成像技術進行有效地識別。

圖3 六類樣品在前3主成分得分分布圖

2.3 高光譜數據預處理結果

基于5種預處理方法的種分類模型結果如表1所示,基于不同預處理建立的煙葉和非煙物質分類模型,平均分類正確率均達到了96%,因此利用高光譜成像技術對煙葉和非煙物質進行分類識別是可行的。在幾種預處理方法中,采用SNV預處理建立的分類模型在訓練集和測試集的平均分類正確率均為最高,故可以得出相比原始光譜和其他預處理方法,SNV的預處理方法為最優。因此在后續的高光譜數據分析中,選擇SNV預處理方法對原始光譜數據進行預處理,以降低噪聲影響,提高數據的有效性。

表1 基于不同預處理光譜的模型識別結果

Tab.1 Model classification results based on different spectral pretreatments

2.4 特征波長的選擇

在訓練集數據利用PCA loadings進行特征波長的選擇。圖4為主成分1(PC1),主成分2(PC2),主成分3(PC3)的權重系數曲線圖,其中的波峰、波谷表明對應的波長占主要貢獻。為了確保特征波長的選擇更加可靠,如果在3條曲線中占2個及以上的波峰或波谷,則選擇其為特征波長。如圖5所示,544 nm和582 nm在3條曲線各自都對應波峰或波谷,說明了以上2個波段能夠反映6類樣品光譜信息的差異;440 nm、486 nm和518 nm在PC1和PC2的權重曲線里對應有2個波峰或波谷;由于660 nm對應1個波峰,且PC2和PC3在該波段存在較大曲線斜率的變化,故選取其為特征波長;3條曲線均在803 nm后變化變小,故將803 nm作為特征波長。因此,共篩選出7個特征波長為440 nm、486 nm、518 nm、544 nm、582 nm、660 nm和803 nm。

圖4 PC1,PC2和PC3的載荷系數圖

利用SPA將SNV預處理后的光譜數據降低波長變量維度,選取特征波長組合的原則是均方根誤差(Root Mean Square Error, RMSE)最低時對應的波長變量組合。不同變量集的RMSE值如圖5所示,當波長變量小于6時,RMSE值下降趨勢明顯,當波長變量大于6時,RMSE值在最小值附近趨于穩定。因此,所選出的6個波長變量對應的波長即為選定的特征波長。圖6展示了基于煙葉光譜曲線波長算法選擇的結果,其中波長選擇索引分別為46、59、75、113、158、228,對應的特征波長為513 nm、545 nm、585 nm、680 nm、796 nm、980 nm。

圖5 均方根誤差隨SPA中特征波長數變化曲線

圖6 SPA特征波長選擇結果

2.5 建模結果與分析

基于PCA loadings和SPA算法篩選出的特征波長作為輸入變量,采用RF、Softmax以及SVM分別建立各自的分類模型,并與全光譜數據的分類模型進行比較。以訓練集和測試集各自內部的平均正確率來評價模型的優劣。

表2 各分類模型的判別分析結果

Tab.2 Discrimination results of various classification models

不同特征提取方法基于3種算法的識別精度如表2所示,根據測試集的識別結果,各模型的平均準確率均較高,分類模型準確率均在98.53%以上?;赟VM模型的測試集識別準確率均高于RF和SoftMax模型,說明基于SVM建立的識別模型為最優模型。SPA-RF、SPA-Softmax和SPA-SVM模型測試準確率均不低于PCA loadings-RF、PCA loadings-Softmax和PCA loadings-SVM,表明基于SPA篩選的6個特征波長更能反映煙葉與非煙物質的光譜信息的差異,是優于PCA loadings的特征波長選擇方法。對比9種建模方法可以看出,未經變量選擇的SVM分類模型性能最優,訓練集正確率達到了100%,測試集正確率達到了99.6%。但是該方法輸入變量多,模型相對復雜。相比經SPA變量選擇后,建立的SVM模型訓練集和測試集的識別正確率分別為99.82%,99.47%,識別正確率與全光譜變量建立的SVM模型差異較小,且輸入變量僅為6個,減少了97.5%的變量數。采用SPA提取特征波長,去除了全光譜波長中自相關性高的波長,提高了模型的運算速度,保持判別正確率的同時降低了模型的復雜度,因此將SPA-SVM作為最優模型。

2.6 降維模型可視化檢測

為了可視化待測樣品分類結果,評價降維模型識別效果,利用SPA-SVM降維模型對預測圖進行像素級分類,結果如圖7所示。圖7b中紅色部分為煙葉,其絕大部分像元被正確分類,SPA-SVM降維模型將待分類對象識別為各自的類別,煙葉與非煙物質能較好的地區分,但也存在一些像元被誤識別,特別是煙葉輪廓處,其原因可能是輪廓處像元是煙葉和背景的混合像元,背景和煙葉像元光譜的重合疊加導致光譜的相似性,從而導致誤分類。從圖2可以看出,煙葉與紙制品的平均光譜波形十分相似,并且選擇的6個特征波段只有440 nm具有區分度,故導致了煙葉某些像元誤識別為紙制品。麻繩一部分像素點的誤識別成植物葉子可能是由于麻繩較細且形態有較大的突起,光分布不均勻和同一樣本到探測器距離的變化,從而導致同一樣品光譜的可變性增大,造成誤識別的發生。從表3也可以看出,降維模型在測試集數據上存在將個別的煙葉像元和植物葉子判別為紙制品、麻繩判別為植物葉子,側面解釋了待測數據可視化圖里出現誤識別像元的原因??傮w來看,可視化結果較好,基于特征波長建立的降維模型,識別煙葉和非煙物質類別具有可行性。

注:圖7a為煙葉和5種非煙物質的偽彩色圖像;圖7b為分類結果可視化圖像。

表3 SPA-SVM模型測試集混淆矩陣

Tab.3 Confusion matrix of test set based on SPA-SVM model

續表3

真實類別True labels預測類別Predicted label 植物葉子Plant leaf紙制品Paper product麻繩Hemp rope尼龍Nylon塑料匝繩Plastic rope煙葉Tobacco leaf總計total預測準確Accurate prediction準確率/%Accuracy 麻繩Hemp rope 124 124124100 尼龍Nylon 125 125125100 塑料匝繩Plastic rope 125 125125100 煙葉Tobacco leaf 123123123100 總計total12512512512512512575074699.47

3 結論

本研究利用可見-近紅外高光譜成像技術,采用5種方法對光譜數據進行預處理,結果表明SNV預處理方法最好。利用PCA-loadings和SPA算法選擇特征波長,基于全波長和特征波長變量建立非煙物質的RF、SoftMax及SVM分類模型,結果顯示基于全光譜、PCA-loadings和SPA建立的RF,SoftMax和SVM模型的測試集和測試集均高于98.5%,說明煙葉與非煙物質具有較好的可分性?;谌庾V建立的分類模型均略優于基于PCA-loadings和SPA建立的分類模型,SPA建立模型均略優于PCA-loadings建立的分類模型。經SPA進行變量篩選后建立的SVM模型,保證較好正確率的同時極大地降低了模型運算量。同時SPA-SVM模型在驗證圖像數據的檢測結果可視化證明,基于SPA-SVM模型對煙葉和非煙物質進行分類識別具有極強的可行性,為特征光譜成像儀器開發提供了理論基礎和技術支持。

[1] 張長華,趙紅楓,胡偉,等. 煙葉原料中主要非煙物質的成因分析[J]. 中國煙草科學,2013, 34(1): 90-93.

ZHANG Changhua, ZHAO Hongfeng, HU Wei, et al. Origin of impurities in tobacco leave[J]. Chinese Tobacco Science, 2013, 34(1): 90-93.

[2] 劉玉蘭,熊應偉,楊生南,等. 談低次煙葉凈化的重要性[J]. 煙草科技,1986(3): 26-27.

LIU Yulan, XIONG Yingwei, YANG Shengnan, et al. On the importance of low-grade tobacco purification[J]. Tobacco Science & Technology, 1986(3): 26-27.

[3] 顧健偉. 煙葉復烤企業非煙物質控制[J]. 南方農業,2014, 8(18): 190-192.

GU Jianwei. Controlling of non-tobacco related material in tobacco redrying enterprises[J]. South China Agriculture, 2014, 8(18): 190-192.

[4] 齊永杰,李群嶺,徐文兵,等. 論煙葉中非煙物質的來源與控制[J]. 農業與技術,2015, 35(13): 189-191.

QI Yongjie, LI Qunling, XU Wenbing, et al. On the source and control of non-tobacco related material in tobacco leaves[J]. Agriculture and Technology, 2015, 35(13): 189-191.

[5] 劉配文,溫圣賢. 打葉復烤等環節中非煙雜物的控制措施[J]. 作物研究,2013, 27(S1): 51-53.

LIU Peiwen, WEN Shengxian. Control measures of non-tobacco related material in threshing and redrying[J]. Crop Research, 2013, 27(S1): 51-53.

[6] 楊俊杰,陶文華. 基于激光分揀技術的煙草異物剔除系統[J]. 機械制造與自動化, 2019, 48(6):214-216.

YANG Junjie, TAO Wenhua. Tobacco sorting system based on laser sorting technology[J].Electrical automation,2019, 48(6): 214- 216.

[7] Garcia-Allende P B, Conde O M, Mirapeix J, et al. Quality control of industrial processes by combining a hyperspectral sensor and Fisher's linear discriminant analysis[J]. Sensors & Actuators B Chemical, 2008, 129(2): 977-984.

[8] Mehl P M, Chen Y R, Kim M S, et al. Development of hyperspectral imaging technique for the detection apple surface defects and contaminations[J]. Journal of Food Engineering, 2004, 61(1): 67-81.

[9] Adebayo S E, Hashim N, Abdan K, et al. Application and potential of backscattering imaging techniques in agricultural and food processing[J]. Journal of Food Engineering, 2016(169): 155.

[10] Wang C, Liu B, Liu L, et al. A review of deep learning used in the hyperspectral image analysis for agriculture[J]. Artificial Intelligence Review, 2021, 54(3): 5205-5253.

[11] 喬紅波,蔣金煒,程登發, 等. 煙蚜為害特征的高光譜比較[J]. 昆蟲知識,2007(1): 57-61.

QIAO Hongbo, JIANG Jinwei, CHENG Dengfa, et al. Comparison of hyperspectral characteristics in tobacco aphid damage[J]. Chinese Bulletin of Entomology, 2007(1): 57-61.

[12] Qga B, Li S, Tz C, et al. Early detection of tomato spotted wilt virus infection in tobacco using the hyperspectral imaging technique and machine learning algorithms[J]. Computers and Electronics in Agriculture, 2019(167): 168-169.

[13] Prabhakar M, Prasad Y G, Desai S, et al. Hyperspectral remote sensing of yellow mosaic severity and associated pigment losses in Vigna mungo using multinomial logistic regression models[J]. Crop Protection, 2013, 45: 132-140.

[14] 李向陽,于建軍,劉國順. 利用光譜反射率預測烤煙葉片煙堿含量[J]. 農業工程學報,2008(8): 169-173.

LI Xiangyang, YU Jianjun, LIU Guoshun. Predicting leaf nicotine content of flue-cured tobacco using hyperspectral reflectance[J]. Transactions of the Chinese Society of Agricultural Engineering, 2008(8): 169-173.

[15] Sun J, Zhou X, Wu X H, et al. Identification of moisture content in tobacco plant leaves using outlier sample eliminating algorithms and hyperspectral data[J]. Biochemical and Biophysical Research Communications, 2016, 471(1): 226-232.

[16] Yu K Q, Fang S Y, Zhao Y R. Heavy metal Hg stress detection in tobacco plant using hyperspectral sensing and data-driven machine learning methods[J]. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2020, 245: 118-917.

[17] Jia F F, Liu G S, Liu D S, et al. Comparison of different methods for estimating nitrogen concentration in flue-cured tobacco leaves based on hyperspectral reflectance[J]. Field Crops Research, 2013, (150): 108-114.

[18] Li X Y, Liu G S, Yang Y F, et al. Relationship between hyperspectral parameters and physiological and biochemical indexes of flue-cured tobacco leaves[J]. Agricultural Sciences in China, 2007, 6(6): 665-672.

[19] 王梅. 發病煙草的高光譜特征及其病害程度診斷模型研究[D]. 山東農業大學,2013.

WANG Mei. Hyperspectral Characteristics and Diagnostic Motels of Diseases Tobacco[D]. Shandong Agricultural University, 2013.

[20] Frederico L.F. Soares, Marcelo C.A. Marcelo, Liliane M.F. Porte, et al. Inline simultaneous quantitation of tobacco chemical composition by infrared hyperspectral image associated with chemometrics[J]. Microchemical Journal, 2019, 151: 104225.

[21] Marcelo M, Soares F, Ardila J A, et al. Fast inline tobacco classification by near-Infrared hyperspectral imaging and supporting vector machines-discriminant analysis[J]. Analytical Methods, 2019(11): 19661-975.

[22] Rodriguez-Cobo, Luis & Garcia-Allende, P. Beatriz & Cobo, et al. Raw Material Classification by Means of Hyperspectral Imaging and Hierarchical Temporal Memories. Sensors Journal, IEEE. 2012(12): 2767-2775.

[23] PB García-Allende, Conde O M, Cubillas A M, et al. New raw material discrimination system based on a spatial optical spectroscopy technique[J]. Sensors & Actuators A Physical, 2007, 135(2): 605-612.

[24] Jiang J B, Qiao X J, Li H. Use of near-infrared hyperspectral images to identify moldy peanuts[J]. Journal of Foiod Engineering, 2016, 169: 284-290.

[25] 洪涯,洪添勝,代芬, 等. 連續投影算法在砂糖橘總酸無損檢測中的應用[J]. 農業工程學報, 2010, 26(S2): 380-384.

HONG Ya, HONG Tiansheng, DAI Fen, et al. Successive projections algorithm for variable selection in nondestructive measurement of citrus total acidity[J]. Transactions of the Chinese Society of Agricultural Engineering, 2010, 26(S2): 380-384.

[26] Breiman L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32.

[27] 蔣怡,黃平,董秀春,等. 基于Softmax分類器的小春作物種植空間信息提取[J]. 西南農業學報, 2019, 32(8): 1880-1885.

JIANG Yi, HUANG Ping, DONG Xiuchun, et al. Spatial information extraction of spring crops based on softmax classifier[J]. Southwest China Journal of Agricultural Sciences, 2019, 32(8): 1880-1885.

[28] Tao D L, Xiao Z T, Zhang F F, et al. Cloth defect classification method based on SVM[J]. International Journal of Digital Content Technology & Its Applications, 2013, 7(3): 614-622.

Research on classification and recognition of non-tobacco related material (NTRM) based on hyperspectral imaging technology

LI Zhihui1, MEI Jifan1, LI Hui1, LI Jiakang1, LU Minrui2, WANG Fang2, ZHANG Tengjian2, DU Jinsong1, HONG Weiling3, XU Dayong1*

1 Zhengzhou Tobacco Research Institute of CNTC, Zhengzhou 450001, China;2 Fujian Wuyi Leaf Tobacco Co., Ltd., Nanping 354000, China;3 Technology Center, China Tobacco Fujian Industrial Co., Ltd., Xiamen 361021, China

The NTRM in tobacco leaves were recognized and classified using hyperspectral imaging technology and machine learning. Hyperspectral imaging system was used to collect spectral data of 400~1000 nm band tobacco leaves and NTRM. Five preprocessing methods were used to preprocess the original spectra, and standard normal variate (SNV) was selected as the best preprocessing method. Successive projection algorithm (SPA) and Principal component analysis loadings (PCA loadings) were used to screen out 6 characteristic wavelengths. Random forest (RF), Softmax and support vector machine (SVM) were employed to establish identification models based on characteristic wavelength and full spectrum. The results showed that SVM model of the full spectrum had the best recognition results, and the recognition accuracy of samples in the calibration set and test set were 100% and 99.6%, respectively. SPA method was superior to PCA loadings algorithm, and identification rates of SPA-SVM model calibration set and test set were 99.82% and 99.47% respectively. Hyperspectral imaging combined with SPA-SVM model demonstrate the efficient classification and recognition of NTRM in tobacco leaves.

hyperspectral imaging; non-tobacco related material; successive projections algorithm; characteristic wavelength; support vector machine; classification

Corresponding author. Email:xdyong@126.com

福建中煙工業有限責任公司科技項目“卷煙產品及原料高光譜特征分析與應用技術研究”(D2020248)

李智慧(1997—),碩士研究生,主要研究方向:煙草物料高光譜成像技術檢測,Tel:15139486607,Email:690638340@qq.com

徐大勇(1982—),Tel:13526654802,Email:xdyong@126.com

2021-08-19;

2022-04-21

李智慧,梅吉帆,李輝,等. 高光譜成像的非煙物質分類識別研究[J]. 中國煙草學報,2022,28(3). LI Zhihui, MEI Jifan, LI Hui, et al. Research on classification and recognition of non-tobacco related material (NTRM) based on hyperspectral imaging technology[J]. Acta Tabacaria Sinica, 2022, 28(3). doi:10.16472/j.chinatobacco.2021.T0146

猜你喜歡
波長煙葉預處理
KR預處理工藝參數對脫硫劑分散行為的影響
一種波長間隔可調諧的四波長光纖激光器
求解奇異線性系統的右預處理MINRES 方法
貴州主產煙區烤煙上部煙葉質量的差異
提高煙葉預檢水平的措施探討
杯中“日出”
污泥預處理及其在硅酸鹽制品中的運用
不同成熟度煙葉烘烤過程中大分子物質代謝動態研究
關于新形勢下煙葉生產可持續發展的思考
基于預處理MUSIC算法的分布式陣列DOA估計
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合