?

基于高光譜圖像的小麥脫氧雪腐鐮刀菌烯醇含量等級鑒別

2016-10-31 02:56杜瑩瑩陳小河徐劍宏沈明霞
食品工業科技 2016年17期
關鍵詞:波長毒素光譜

杜瑩瑩,陳小河,梁 琨,*,徐劍宏,沈明霞,盧 偉

(1.南京農業大學江蘇省智能化農業裝備重點實驗室,江蘇南京 210031;2.江蘇省農業科學院食品質量與檢測研究所,江蘇南京 210014)

?

基于高光譜圖像的小麥脫氧雪腐鐮刀菌烯醇含量等級鑒別

杜瑩瑩1,陳小河1,梁琨1,*,徐劍宏2,沈明霞1,盧偉1

(1.南京農業大學江蘇省智能化農業裝備重點實驗室,江蘇南京 210031;2.江蘇省農業科學院食品質量與檢測研究所,江蘇南京 210014)

以6種不同脫氧雪腐鐮刀菌烯醇(DON)含量等級的小麥樣本為研究對象,利用高光譜圖像結合化學計量學方法實現DON毒素含量的鑒別。采集180份小麥樣本高光譜圖像,利用改進格拉姆斯密特算法(MGS)與遺傳無信息變量消除算法(GAUVE)對400~1021 nm波段光譜信息提取特征波長,分別利用線性判別分析(LDA)、隨機森林(RF)、支持向量機(SVM)、最鄰近結點(KNN)算法建立模型預測小麥脫氧雪腐鐮刀菌烯醇含量等級。結果表明,利用MGS算法和GAUVE算法能有效地提取特征波長,降低波長變量數,提高運算速率,4種算法建模時準確率均高于85%,其中MGS-SVM模型鑒別效果最優。研究表明,高光譜圖像結合化學計量方法與現有檢測方法相比,可以快速無損地鑒別6種不同小麥DON毒素含量,為小麥DON毒素快速、無損、智能檢測提供研究方法。

小麥,高光譜圖像,脫氧雪腐鐮刀菌醇,識別模型

小麥是中國的第二大糧食作物,也是世界上最主要的農作物。赤霉病是小麥的主要病發癥之一,而脫氧雪腐鐮刀菌稀醇(DON)是引發小麥赤霉病的主要真菌毒素,DON毒素不僅對小麥細胞組織有毒害作用,感染小麥作為食品或飼料時對人和牲畜的健康也將造成危害[1-3]。為了避免DON毒素對人畜造成潛在的健康風險,含DON毒素超標的小麥必須在加工之前被處理掉。目前高效液相色譜法(HPLC)和氣相色譜(GC)可以精確地對小麥中的DON毒素進行定性定量分析,但是操作繁瑣、重現性較差。而且這兩種方法所需色譜儀、檢測器等價格昂貴,樣品處理比較復雜,操作時需要專門的技術人員,不便推廣應用,也不適合大批量樣品的檢測[4]。

近年來,高光譜成像技術在農產品無損檢測中的應用發展迅速。外國學者Barbedo等提出了使用高光譜成像技術檢測鐮刀菌素頭疫病(FHB)小麥,利用基于高光譜圖像的處理算法,采用數學形態學操作和光譜波段操作實現對小麥FHB的快速自動檢測[5]。薛利紅等提出了基于可見近紅外高光譜的菠菜硝酸鹽快速無損測定研究,利用PLS和PCR模型較好地預測了菠菜硝酸鹽含量[6];柴阿麗等實現了基于高光譜成像和判別分析的黃瓜病害識別,采用逐步判別分析和典型判別分析兩種方法進行降維,利用選擇的光譜特征參數建立病害識別模型,為實現可見光譜范圍內黃瓜病害的田間實時在線檢測提供了可能[7];王志輝等實現了基于葉片高光譜特性分析的樹種識別,利用光譜微分法對原始光譜數據進行處理,選擇差異較大的波段用于鑒別不同樹種,利用歐氏距離和所選擇的波段檢驗識別不同樹種[8]。這些學者的研究成果為本文實現小麥的DON含量快速無損分類識別奠定了理論基礎。

因此,本文基于高光譜成像技術,結合化學計量學方法實現小麥赤霉病感染DON含量等級的快速鑒別。分別采用改進格拉姆斯密特(MGS)與遺傳無信息變量消除(GAUVE)算法提取特征波長,基于特征波長分別建立基于線性判別分析(LDA)、隨機森林(RF)、支持向量機(SVM)、最鄰近結點(KNN)的四種識別模型,實現小麥DON含量的快速、無損、智能鑒別。這對保障小麥食用安全具有重要的意義。

1 材料與方法

1.1材料與儀器

小麥6種不同毒素含量的小麥樣本均來自江蘇省農業科學研究院食品檢測研究所。樣本DON毒素含量測定:稱取5.0 g小麥粉于100 mL錐形瓶中,加入25 mL的提取液(乙腈∶水=84∶16),置于180 r/min振蕩搖床30 min后,2500 r/min離心,5 min后取上清液;將凈化柱連接到固相萃取裝置上,加入3 mL的提取液過柱,流速2 mL/min,對柱子進行活化,取3 mL提取的樣品過柱,流速1 mL/min,收集濾液;重復洗滌1次后,把兩次的濾液合并至氮吹儀吹干后,加入1 mL色譜純甲醇重溶,過0.22 μm微孔濾膜,轉移至進樣瓶,然后利用AB SCIEX 公司型號為3500 QTRAP色譜儀-液相色譜質譜聯用儀進行毒素含量測定。

液相色譜條件為,流動相:A:5 mmol/L醋酸銨水,B:甲醇,按表1的梯度濃度進行操作,流速:0.6 mL/min,進樣量:5 μL。毒素檢出限為20 ppb。

表1 DON含量檢測梯度濃度

6種小麥樣本檢測DON毒素含量依次為:0.00、432.50、929.33、1394.93、2195.75、3115.00 ppb,分別標為類別1、類別2、類別3、類別4、類別5、類別6,將每個類別的小麥每稱重30 g作為一個樣本,并依次標號。6個類別共180份小麥樣本,每個類別30個樣本,其中22個樣本為建模集樣本,8個樣本為驗證集樣本,最終建模集樣本有132個,驗證集樣本有48個。

圖1為高光譜圖像采集系統圖。GEV-B1621M-TC000型CCD照相機美國Imperx公司;Imspector型光譜儀芬蘭Specim公司;鏡頭德國schneider公司;21V/150W線性鹵素燈光源美國Illumination公司。

圖1 高光譜圖像采集系統Fig.1 Hyperspectral imaging system

1.2實驗方法

1.2.1高光譜圖像采集與校正高光譜成像波段為358~1021 nm。為了得到清晰的無畸變圖像,在高光譜圖像采集前,經反復測試后將曝光時間設置為30 ms,傳送帶速度為3 mm/s,樣本與鏡頭的距離為250 mm。樣本圖像采集時,將約30 g小麥樣本平鋪于白紙上,并置于移動平臺表面以獲得高光譜圖像信息。為了消除光源強度分布不均和暗電流噪聲的影響,需要對圖像進行黑校正和白校正,獲得最終的高光譜圖像。

1.2.2高光譜數據的提取利用美國RSI公司的ENVI 4.8軟件對高光譜數據進行提取。首先確定每個樣本的感興趣區域(ROI),統一手動選取樣本中每粒小麥的輪廓區域內光譜信息作為感興趣區域。將每個樣本ROI區域的平均反射率值作為該樣本原始光譜數據,在美國MathWorks公司出品的MATLAB R2012a中進行后續處理。

1.2.3數據處理與建模提取的波段光譜信息存在與DON毒素含量等級無關的冗余波段,為了消除這些波段,提高模型效率,需要對預處理后的數據進行特征波長提取。本文利用改進格拉姆斯密特算法(MGS)和遺傳無信息變量消除算法(GAUVE)兩種方法提取特征波長,以消除冗余信息提高模型的魯棒性。其中,MGS特征波長提取算法是根據投影原理在原有正交基的基礎上構造一個新的正交基,得到第一特征波長后,循環迭代直到特征波長數達到要求[9]。而GAPLS算法[10]是一種有效的全局搜索算法,可用于高光譜特征波長的選擇與優化。由于遺傳算法對初始種群的選取和遺傳操作算子的執行過程帶有較強隨機性,通過遺傳算法選出的特征波長存在局部重復,經遺傳算法提取得到的特征波長數一般較多。為了使特征波長數進一步減少,本文將采用UVE算法[11]對經GAPLS提取得到的特征波長進行二次篩選。本文分別利用線性判別分析(LDA)、隨機森林(RF)、支持向量機(SVM)及最鄰近結點(KNN)算法建立小麥赤霉病感染DON含量等級的識別模型,并比較不同模型的識別精度,以實現小麥赤霉病快速、無損、智能檢測。其中LDA[12]分類算法又稱Fisher分類算法,它通過尋找一個最好直線方向及實現最好方向投影變換使各類樣品投影到直線后最好地分開,完成分類過程。RF算法是一種包含多個隨機形成的決策樹的分類器,輸出類別由個別樹的輸出類別的眾數決定,本文RF[13]算法中最佳決策樹棵樹由窮舉法獲得。SVM算法是通過統計學習理論進行模式分類的,算法中的懲罰參數和核函數參數的選擇對SVM分類結果有很大影響,本文采用交叉驗證和網格搜索[14]的方法確定最佳懲罰參數和最佳核函數參數。KNN[15]是以同類樣本在模式空間相互靠近為依據的分類算法。近鄰數K值的大小對分類結果有影響,本文將采用交叉驗證的方法確定近鄰數K的值。

2 結果與分析

2.1樣本光譜特征

實驗所采用光譜儀采集的波長范圍為358~1021 nm,小于400 nm波段存在大量干擾噪聲,因此采用400~1021 nm波段范圍內的286個波長作為后續數據處理區域。圖2為180個樣本在400~1021 nm波段范圍的感興趣區域平均反射光譜曲線,從圖中可以看出所有樣本的光譜曲線輪廓基本相同,從436 nm到696 nm反射率值迅速上升,從496 nm到884 nm反射率上升速度放緩,866 nm之后曲線趨于平穩。為了探明小麥不同DON毒素含量與高光譜數據之間的相關性,為鑒別小麥DON毒素含量鑒別提供理論依據,分析了不同種類的DON毒素含量與反射光譜的相關性,圖3為6種不同種類DON含量與光譜反射率的相關性分析,可見在416 nm之前DON含量與光譜反射率成負相關,在416 nm之后DON含量與光譜反射率成正相關。416~478 nm之間相關系數隨波長迅速增加,478~679 nm相關系數隨波長緩慢下降,679 nm之后相關系數平緩上升,在1021 nm處達到最大值0.372。為消除光線等干擾造成的噪聲影響,采用SNV算法對原始光譜數據進行預處理,圖4為SNV預處理后的光譜反射率曲線,預處理后算法可以消除樣本籽粒大小、表面散射和光程差異對光譜的影響[16]。

圖2 所有小麥樣本反射光譜曲線Fig.2 Raw spectra of all wheat samples

圖3 DON含量與光譜反射率相關性Fig.3 The correlation between DONcontent and spectral reflectance

圖4 SNV算法預處理后建模集光譜Fig.4 Spectra of calibration set after SNV

2.2樣本特征波長提取

2.2.1基于MGS特征波長提取本實驗通過MGS算法得到的9個特征波長(406、408、422、430、436、440、767、771、778 nm)。這些波長集中在400~450 nm和750~800 nm之間,說明藍光和紅光與分類信息相關。MGS算法篩選后,波長數僅為原波長數的3.1%,大大壓縮了用于后續建模的特征波長數量。

2.2.2基于GAUVE特征波長提取經GAPLS算法提取特征波長后,波長變量降到了65個。采用UVE算法對65個特征波長進行二次篩選,篩選結果如圖5所示,圖中垂直實線左邊表示65個波長變量,實線右邊表示加入的65個隨機噪聲變量。兩條虛線為上下閾值,閾值的取值設定為隨機變量最大穩定值的0.99倍。閾值內為無信息變量,閾值外為被選中的特征波長。處理后得到了14個特征波長(408、410、414、422、443、463、476、480、482、505、577、681、756、888 nm),RMSECV值為0.458。因此GAUVE算法進行特征波長提取后,特征波長數量為原來的4.9%,有效減少了后續建模的特征波長數量。

圖5 UVE算法選擇的特征波長Fig.5 Wavelengths selected by UVE

2.3模型建立

為了實現小麥6種不同DON毒素含量的鑒別,將MGS提取得到的9個特征波段的反射光譜數據作為輸入,分別建立線性判別分析(LDA)、隨機森林(RF)、支持向量機(SVM)、最鄰近結點(KNN)模型,模型的識別結果如表2所示。在利用RF算法建模時,利用窮舉法得到RF算法最佳決策樹棵數為100。建立基于SVM算法的鑒別模型,采用交叉驗證和網格搜索的方法確定最佳懲罰參數為4,最佳核函數參數為4。采用交叉驗證的方法確定KNN算法近鄰數K為3。由表2可知,4種模型算法的建模集樣本的準確率和驗證集樣本的準備率均到達90%以上,其中SVM算法的預測集識別率最高為97.92%,RF的建模集識別率最高為100.00%。分類識別結果說明經MGS算法提取特征波長結合LDA算法、RF算法、SVM算法、KNN算法建模能有效的鑒別6種小麥DON毒素含量。

表2  基于MGS算法特征波長提取后識別準確率(%)

將GAUVE優選的14個特征波長作為輸入,分別建立LDA、RF、SVM、KNN模型,分類識別結果如表3所示。其中RF算法中的決策樹棵樹為150;SVM算法中的最佳懲罰因子為64,最佳松弛變量為0.25;KNN算法中的近鄰數K為5。由表可知SVM算法識別效果最好,建模集樣本準確率為99.24%,預測集樣本準確率為95.83%。LDA算法識別效果稍差,建模集樣本準確率為92.42%,預測集分類準確率為87.5%??傮w上4個模型識別準確率均達85%以上,分類識別結果說明經GAUVE算法提取特征波長結合LDA算法、RF算法、SVM算法、KNN算法建模能有效的鑒別6種小麥DON毒素含量。

表3 基于GAUVE算法特征波長提取后識別準確率(%)

綜上,比較MGS與GAUVE算法提取特征波長建模后的分類識別效果,MGS算法提取特征波長建模的分類識別效果優于GAUVE算法,這說明MGS算法得到的特征波長反映的有效信息高于GAUVE算法,相比較之下GAUVE算法處理后光譜包含了更多的噪聲信息。經比較發現,MGS與GAUVE算法得到的特征波長大部分不相同。這是因為MGS算法在選擇出一個特征波長的同時消除了這個特征波長對后續特征波長選取的影響,因此兩種算法得到的特征波長在后半部分存在較大差異。兩種算法得到的均是包含較多與DON含量相關信息的波長,因此這些波長在后續建模中都有重要作用,且MGS算法得到的特征波長作用更大。此外MGS提取得到9個特征波長比GAUVE提取得到的14個特征波長少了5個,因此MGS算法提取的特征波長在模型中的計算速度快于GAUVE算法。在模型的建立中,SVM算法在MGS與GAUVE提取得到的特征波長建模中均取得了最優的分類識別效果,且基于MGS特征提取方法下的SVM模型分類識別效果為所有模型中的最優,這是因為在小樣本數據和非線性情況下,SVM算法具有更好的魯棒性。表4和表5分別為SNV-MGS-SVM和SNV-GAUVE-SVM模型的識別混淆矩陣。由表可知,類別3與類別6小麥存在信息重疊,在分類過程中易被錯分。

表4 基于SNV-MGS-SVM算法識別模型混淆矩陣

表5 基于SNV-GAUVE-SVM算法識別模型混淆矩陣

3 結論

高光譜圖像鑒別了6種不同小麥DON毒素含量時,利用MGS算法和GAUVE算法能有效的提取特征波長,降低了波長變量數,提高了運算速率,其中MGS算法提取得到的特征波長數少于GAUVE算法,對模型簡化效果更好。LDA算法、RF算法、SVM算法、KNN算法建模時準確率均較高,其中MGS算法得到的特征波長建模后分類識別效果均優于GAUVE算法,其中SNV-MGS-SVM算法為最優分類識別效果,建模集分類識別率為99.24%,預測集分類識別率為97.92%。高光譜圖像結合化學計量方法,可以避免現有定量檢測方法的繁瑣過程,快速地鑒別6種不同小麥DON毒素含量,為小麥DON毒素快速、無損、智能檢測提供研究方法。

[1]Dillmacky R,Jones R K. The effect of previous crop residues and tillage on fusarium head blight of wheat[J]. Plant Disease,2000,84(1):71-76.

[2]劉新瓊. 小麥赤霉病菌毒素研究進展[J]. 湖北植保,1997(3):23-24.

[3]Mirocha C J,Xie W,Xu Y,et al. Production of trichothecene mycotoxins by Fusarium graminearum and Fusarium culmorum on barley and wheat[J].Mycopathologia,1994,128(1):19-23.

[4]江湖,熊勇華,許楊,等. EDC法制備黃曲霉毒素B_1人工抗原的研究[J]. 食品科學,2005,26(7):125-128.

[5]Barbedo J G A,Tibola C S,Fernandes J M C. Detecting Fusarium head blight in wheat kernels using hyperspectral

imaging[J]. Biosystems Engineering,2015(131):65-76.

[6]薛利紅,楊林章. 基于可見近紅外高光譜的菠菜硝酸鹽快速無損測定研究[J]. 光譜學與光譜分析,2009,29(4):926-930.

[7]柴阿麗,廖寧放,田立勛,等. 基于高光譜成像和判別分析的黃瓜病害識別[J]. 光譜學與光譜分析,2010,30(5):1357-1361.

[8]王志輝,丁麗霞. 基于葉片高光譜特性分析的樹種識別[J]. 光譜學與光譜分析,2010,30(7):1825-1829.

[9]謝傳奇,方孝榮,邵詠妮,等. 番茄葉片早疫病近紅外高光譜成像檢測技術[J]. 農業機械學報,2015,46(3):315-319.

[10]Leardi R. Application of genetic algorithm-PLS for feature selection in spectral data sets[J]. Journal of Chemometrics,2000,14(5-6):643-655.

[11]Centner V,Massart D L,Noord O E D,et al. Elimination of uninformative variables for multivariate calibration[J]. Analytical Chemistry,1996,68(21):3851-3858.

[12]Mika S,Ratsch G,Weston J,et al. Fisher discriminant analysis with kernels[J]. Neural Networks for Signal Processing IX,1999(9):41-48.

[13]Rodriguez-Galiano V,Mendes M P,Garcia-Soldado M J,et al. Predictive modeling of groundwater nitrate pollution using Random Forest and multisource variables related to intrinsic and specific vulnerability:a case study in an agricultural setting(Southern Spain)[J]. Science of the Total Environment,2014,476-477(4):189-206.

[14]Minowa Y. Verification for generalizability and accuracy of a thinning-trees selection model with the ensemble learning algorithm and the cross-validation method[J]. Journal of Forest Research,2008,13(5):275-285.

[15]Cover T,Hart P. Nearest neighbor pattern classification[J]. IEEE Transactions on Informat,1967,13(1):21-27.

[16]Barnes R J,Dhanoa M S,Lister S J. Standard Normal Variate Transformation and De-Trending of Near-Infrared Diffuse Reflectance Spectra[J]. Applied Spectroscopy,1989,43(5):772-777.

Identification of deoxynivalenol content in wheat based on the hyperspectral image system

DU Ying-ying1,CHEN Xiao-he1,LIANG Kun1,*,XU Jian-hong2,SHEN Ming-xia1,LU Wei1

(1.Jiangsu Province Engineering Lab for Modern Facility Agriculture Technology and Equipment,Nanjing Agricultural University,Nanjing 210031,China; 2.Institute of Food Quality and Safety,Jiangsu Academy of Agricultural Sciences,Nanjing 210014,China)

Identification of wheat samples with six different levels of deoxynivalenol(DON) content by hyperspectral images,integrating stoichiometric method was studied in this paper. Hyperspectral images of 180 wheat samples were obtained,a Modified Gram-Schmidt algorithm(MGS)and a genetic uninformative variable elimination algorithm(GAUVE)were used to select sensitive wavelengths across the wavelength range of 400~1021 nm. Linear discriminant analysis(LDA),random forest(RF),support vector machine(SVM)and the K-nearest neighbors algorithm(KNN)models were established and developed to predict the DON content level of wheat samples. The results indicated that the MGS algorithm and GAUVE algorithm efficiently select the sensitive wavelengths,reduce the number of wavelength variables,and improve the operation rate. The accuracy rate of LDA algorithm,RF algorithm,SVM algorithm and KNN algorithm were found to be higher than 85%. Among all the identification models studied,MGS-SVM model obtained the best identification accuracy. This study research indicated that hyperspectral images combined with a stoichiometric method can accurately identify wheat kernels with six different levels of DON content,hence,offering a methodology for rapidly,non-destructively,intelligently detecting of wheat’s DON toxin.

wheat;hyperspectral image;deoxynivalenol;identification model

2016-03-16

杜瑩瑩(1994-),女,在讀本科生,研究方向:農產品無損檢測,E-mail:duyingying2016@126.com。

梁琨(1983-),女,博士,講師,主要從事農產品無損檢測方面的研究,E-mail:lkbb2006@12.com。

國家自然科學青年基金項目(31401610);中央高?;究蒲袠I務費專項資金(KJQN201557);江蘇省農業科技創新基金(CX(16)1059);江蘇省科技支撐項目(BE2014738);江蘇省農業科技自主創新項目(CX(14)2126)。

TS201.1

A

1002-0306(2016)17-0054-05

10.13386/j.issn1002-0306.2016.17.002

猜你喜歡
波長毒素光譜
基于三維Saab變換的高光譜圖像壓縮方法
What Makes You Tired
一類具有毒素的非均勻chemostat模型正解的存在性和唯一性
毒蘑菇中毒素的研究進展
雙波長激光治療慢性牙周炎的療效觀察
日本研發出可完全覆蓋可見光波長的LED光源
嚴苛標準方能清洗校園“毒素”
星載近紅外高光譜CO2遙感進展
便攜式多用途光波波長測量儀
苦味酸與牛血清蛋白相互作用的光譜研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合