?

化學計量學結合中紅外光譜的濃香型白酒分類研究

2023-03-22 09:51周瑞陳曉明張莉麗張良許德富張宿義代小雪毛洪川謝菲代漢聰宋艷郭佳陳雯月
食品與發酵工業 2023年5期
關鍵詞:酒樣濃香型白酒

周瑞,陳曉明*,張莉麗,張良,許德富,張宿義,代小雪, 毛洪川,謝菲,代漢聰,宋艷,郭佳,陳雯月

1(西南科技大學 生命科學與工程學院,四川 綿陽,621000)2(瀘州老窖股份有限公司,四川 瀘州,646000) 3(四川省綿陽市豐谷酒業有限責任公司,四川 綿陽,621000)

濃香型白酒作為我國特有的傳統固態蒸餾酒,在漫長的發展過程中形成了獨具匠心的釀造工藝及酒體風格,在世界范圍內受到了廣大白酒消費者的一致好評[1]。白酒酒度是酒體是否達標的判定條件之一,在GB/T 10345—2007《白酒分析方法》中,對于酒度的測定主要有酒精計法和密度計法,整個檢測過程需要人工采樣以及肉眼目測后再查表換算,較為煩瑣。在檢測一線如何對大批量酒樣進行快速地判別對酒度的真實性鑒定具有重大意義[2]。白酒品牌是消費者對產品標識的第一概念,也是白酒企業的生存之本,但一些不良商家常常以次充好,這對相關企業造成巨大困擾。因此,為了保證消費者與企業的共同利益,實現對不同品牌白酒的無損檢測是十分必要的。

紅外光譜分析技術因其具有無損、高效、可實時在線分析等特點,已被廣泛應用于白酒內在品質指標的定量分析以及白酒品牌的鑒識之中[3-4]。近、中紅外光譜皆有映現有機物分子振動信息的功能,但大多數典型官能團的振動峰都位于中紅外區,其波數范圍為4 000~400 cm-1,具有吸收強度大、信息易提取以及分子選擇性好等優點[5]。近年來,中紅外光譜技術結合化學計量學手段在判別分析中取得了一系列研究進展,XIAO等[6]基于中紅外光譜結合偏最小二乘判別分析(partial least squares discrimination analysis,PLS-DA)對2種牛奶進行識別,正確率達95.2%。PEI等[7]也利用中紅外光譜結合PLS-DA和隨機森林對196份野生云南蘑菇的產地進行追溯,鑒別正確率為100%?;谥屑t外光譜結合化學計量學可對光譜信息進行有效提取并建立模型,且辨別效果較好,但在當前研究中卻鮮有將中紅外光譜結合化學計量學對白酒的品牌、香型、酒度和產地等進行識別。

本研究基于中紅外光譜結合化學計量學手段對不同酒度和品牌的濃香型白酒進行判別分析,采用平滑濾波(Savitzky-Golay, S-G)和標準正態變換(standard normal variate, SNV)方法對光譜進行預處理,選擇主成分分析比較光譜預處理效果后,再結合蚱蜢算法優化支持向量機(grasshopper optimization algorithm-support vector machine, GOA-SVM)和誤差反向傳播神經網絡(back-propagation artificial neural network, BP-ANN)為濃香型白酒品牌鑒別以及酒度鑒定提供理論依據。

1 材料與方法

1.1 試驗材料

試驗選擇由瀘州老窖公司提供的不同酒度濃香型酒樣以及市場購買的不同品牌濃香型酒樣,樣品信息如表1所示。

表1 濃香型白酒樣品Table 1 The detail of the strong-flavor Baijiu samples

1.2 儀器與設備

IR Spirit傅里葉變換衰減全反射中紅外光譜儀,日本島津公司。

1.3 試驗方法

1.3.1 中紅外光譜采集

本次試驗在(20±2)℃下進行,提前0.5 h打開儀器進行預熱后,設置中紅外儀器參數:測定模式:透過率;掃描次數32;分辨率8 cm-1;波數范圍4 000~400 cm-1。將酒樣置于ATR附件上,以空氣作為參比,扣除大氣背景影響。為了減少因試驗操作而導致的誤差,要保證環境的干燥,每測試完1個酒樣,要擦拭干凈。酒樣經平行測定3次后,取3次光譜的平均值作為酒樣的最終光譜數據,每條原始光譜記錄了1 263個透過率值。

1.3.2 光譜預處理

采集的原始光譜數據包含由其他因素所產生的各種干擾信號,在創建定性定量模型之前,進行光譜預處理能夠消除無關信息的干擾并提取物質的有效信息,對后續建立模型的精度具有重大影響。S-G是通過多次測量光譜信息數據求平均值來減低隨機誤差和提高信噪比的方法,SNV方法被用于消除因樣品粒徑大小分布不均勻所導致的光譜差異[8]。本次試驗將平滑的窗口大小設置為21,分別基于S-G與SNV方法對光譜進行預處理,并根據不同樣品選擇其最適光譜預處理方法后再進一步進行判別分析。

1.3.3 樣本集的劃分

采用Kennard-Stone方法根據不同樣品間的歐氏距離將建模酒樣按7∶3劃分為訓練集和測試集,在構建BP-ANN的模型過程中,測試集還將被劃分為驗證集,占總樣本數的15%。

1.3.4 主成分分析

主成分分析作為化學計量學中分析中紅外光譜數據的常見方法之一,其核心思想是利用方差最大原則,對光譜數據多個自變量進行線性擬合,將高維的數據映射到低維的空間中,并期望在所投影的維度上數據的方差最大,以此使用較少的數據維度,但同時保留較多的原數據點的特性[9]。經主成分分析后得到各成分的累積貢獻率,在此基礎上,繪制基于前3個主成分的各類型酒樣聚類圖。

1.3.5 GOA-SVM

GOA是一種新型的元啟發式算法,由SAREMI等[10]于2017年提出,該算法具有很強的全局搜尋能力和局部探尋能力,擁有算法簡單、利于實現和配制參數少等優點[11]。支持向量機能很好的預防欠學習與過學習的發生,在解決實際問題中屬于較好的化學計量學方法之一,臺灣大學林智仁等開發了支持向量機的訓練與預測工具箱——LIBSVM 3.24,此處基于該工具箱進行判別分析。

在本次研究中,分別將LZLJ 38%vol、45%vol、52%vol、73%vol的酒樣標簽設置為“1”“2”“3”“4”,以便于后續判別分析模型的建立,創建模型的流程如圖1所示。

圖1 構建GOA-SVM判別分析模型流程圖Fig.1 Flow chart of establishing GOA-SVM discriminant analysis model

采用GOA算法進行支持向量機參數尋優后,構建GOA-SVM模型,設置其最大迭代次數為100,種群大小為20,c的優化范圍為10-5~103,g的優化范圍為10-5~103,交叉驗證折數為5,選擇徑向基核函數。使用MATLAB R2018b中Mapminmax函數對光譜數據進行歸一化,將數據范圍映射至[0,1]。

1.3.6 誤差反向傳播人工神經網絡

構建BP-ANN模型時,傳遞函數使用purelin,訓練次數設置為1 000次,學習速率設置為0.01,動量因子設置為0.01,最小性能梯度設置為1e-6,最高失敗次數設置為6,使用MATLAB R2018b中Mapminmax函數對光譜數據進行歸一化處理,將數據范圍映射至[-1,1]。

如圖2所示,在本研究中BP-ANN的結構包含1 263個輸入,3個輸出,10個隱含層。不同品牌酒樣的透過率值所形成的1 263×50的數據矩陣作為BP-ANN的輸入層神經元,將“1”,“2”和“3”分別設置為“LZLJ 52%vol”“FG 52%vol”和“WLY 52%vol”的標簽后作為BP-ANN的輸出層神經元。

圖2 BP-ANN模型結構示意圖Fig.2 Schematic diagram of the structure of the BP-ANN model

1.4 數據處理

使用MATLAB R2018b軟件自編的S-G和SNV方法對光譜數據進行預處理后,再構建GOA-SVM與BP-ANN模型進行判別分析,Origin 2021進行主成分分析并繪制聚類圖。

2 結果與分析

2.1 原始光譜分析

由于各酒樣中水分以及微量有機成分的不同,造成中紅外光譜存在一定的差異,這為白酒的分類鑒別提供了良好的數學基礎。為進一步解析不同類型酒樣的原始光譜特征,分別對各類酒樣的光譜數據進行平均,得到6條不同類型濃香型白酒的平均光譜,如圖3所示。2 981、1 654、1 046 cm-1等附近有特征峰,不同酒樣特征峰的透過率值大小存在明顯差異,可對部分酒樣進行區分,但在諸如2 000~1 200 cm-1等波數范圍之間,還是很難通過光譜圖對不同酒樣進行分類。與此同時,原始光譜中存在較為明顯的譜峰堆疊等現象,需對光譜做進一步處理。

圖3 平均后光譜Fig.3 Spectrum after averaging

2.2 光譜預處理

由圖4可知,經S-G處理后的光譜在4 000~3 600 cm-1和2 400~1 200 cm-1等波數范圍間較原始光譜得到了良好的區分,且經S-G處理后的全光譜差異性較SNV更為明顯,二者的高頻噪聲和譜峰堆疊等現象都得到改善。直接用肉眼觀察光譜預處理的效果雖具有一定的合理性,但卻帶有人為主觀的因素,可能導致錯誤地評判光譜預處理效果,于是需要結合化學計量學對預處理的好壞做進一步分析比對[12]。

a-S-G處理后光譜;b-SNV處理后光譜圖4 光譜預處理效果Fig.4 Spectral preprocessing effect

2.3 基于光譜預處理的主成分分析

如圖5所示,繪制不同酒度以及不同品牌酒樣基于前3個主成分的三維聚類得分圖,可以看出不同類型濃香型白酒的聚類效果都較好。不同光譜預處理下PC1、PC2和PC3的累積貢獻率分別達到了98.3%、97.9%、99.7%和96.1%,這說明前3個主成分能很好地反映整體數據集的有效信息。

由圖5-a可知,經S-G處理后,僅有LZLJ 45%vol與LZLJ 52%vol可實現100%區分,其余2類酒樣有部分重疊。由圖5-b可知,經SNV處理后,LZLJ 45%vol與LZLJ 73%vol可實現100%區分,其余2類酒樣的95%置信橢圓幾乎完全重疊,區分效果很差。因此,針對不同酒度酒樣的光譜數據,S-G預處理效果更好。由圖5-c和圖5-d可知,SNV較S-G處理更好,WLY 52%vol得到區分。鑒于主成分分析不能完全區分不同酒度以及不同品牌濃香型白酒,故在選擇最適光譜預處理方法的基礎上,需進一步選擇其他化學計量學手段來建立識別不同酒度和不同品牌濃香型白酒的新方法。

a-不同酒度S-G處理后;b-不同酒度SNV處理后;c-不同品牌S-G處理后;d-不同品牌SNV處理后圖5 基于光譜預處理的主成分分析Fig.5 Principal component analysis based on spectral preprocessing

2.4 基于GOA-SVM的不同酒度濃香型白酒分類

使用GOA智能優化算法,基于訓練集數據矩陣進行支持向量機參數尋優。如圖6所示,GOA優化算法的收斂速度很快,在c=1 000,g=1e-05時,5折檢驗下訓練集的辨別正確率為100%。

因此,基于徑向基核函數,構建c=1 000,g=1e-05的SVM模型后,對4種酒度濃香型白酒的30組測試集數據進行分類。圖7表明,以S-G處理后的全光譜數據作為輸入特征構建的GOA-SVM模型,對4種不同酒度濃香型白酒的識別效果極好,測試集分類的正確率可達100%。

圖7 基于GOA-SVM的不同酒度濃香型白酒分類結果Fig.7 Classification results of strong-flavor Baijiu with different alcoholic strength based on GOA-SVM

2.5 基于BP-ANN的不同品牌濃香型白酒分類

BP-ANN通過擬合不同品牌酒樣與透過率值間的數據來建立判別分析模型,其擬合回歸系數R值表示輸入特征與輸出類型之間的相關性[13]。在BP-ANN模型的建立過程中,所有酒樣的70%作為訓練集,15%作為驗證集,15%作為測試集。圖8所示的回歸分析展示了輸出類型與實際類型的擬合程度, BP-ANN模型的訓練集、驗證集、測試集和總體數據集的R值分別為0.999 78、0.999 43、0.994 82和0.999,這表明訓練好的模型具有極佳的預測能力。

圖8 BP神經網絡模型回歸曲線Fig.8 Regression curve of BP neural network model

由圖9可知,訓練后的BP-ANN模型對測試集酒樣的分類效果很好,預測值與實際期望值高度吻合,3類品牌白酒的分類正確率達100%。

圖9 基于BP-ANN的不同品牌濃香型白酒分類結果Fig.9 Classification results of different brands of strong-flavor Baijiu based on BP-ANN

3 結論與討論

在中紅外光譜分析研究中,光譜預處理方式和建模方法的選擇是提高模型預測精確度的關鍵,實際處理光譜數據時,還可運用智能算法提取最適光譜特征來不斷優化與改善預測模型[14]。本文基于中紅外光譜結合化學計量學對不同類型濃香型白酒進行判別分析,采用S-G平滑與SNV對光譜進行預處理后,再基于主成分分析比較光譜預處理效果。試驗結果表明,S-G處理后的光譜數據經主成分分析對不同酒度酒樣區分較好,SNV處理則對不同品牌酒樣區分更好。

在構建模型前,按Kennard-Stone算法將優化后的光譜數據劃分為訓練集和測試集后,建立GOA-SVM和BP-ANN分類器。在實際使用過程中,支持向量機通常會聯合智能優化算法,對自身在參數、核函數選擇以及使用條件上進行尋優,以提升分類能力,降低誤差[15]。試驗結果表明,基于S-G處理后的全光譜數據結合GOA尋優算法建立的SVM分類器對不同酒度濃香型白酒的判別正確率為100%。

BP-ANN是一種簡單的前向分層神經網絡,其通過逆向傳播來更正網絡中的權值和閾值,具有極強的自主學習能力?;贐P-ANN的3層網絡原理設計的非線性分類器原理簡單,實現方便,通過測定酒樣所得光譜數據對濃香型白酒進行分類屬于典型的非線性問題,BP-ANN對其有很好的預測分類能力。但BP-ANN中也存在收斂速度過慢,易陷于局部極小和隱含層節點數不確定等瑕玷,為克服BP-ANN中的缺陷,在實際應用中也可使用一些優化算法對BP-ANN中的學習速率,動量因子和隱含層節點數進行優化,以加快收斂速度,具體優化算法視樣本而定。在本研究中,試驗結果表明基于SNV處理后光譜結合BP-ANN分類器可以很好地區分3種不同品牌濃香型白酒,辨別正確率為100%。

本試驗雖只選取了部分不同酒度、品牌濃香型白酒進行建模分析,但相關試驗結果仍表明中紅外光譜技術結合化學計量學對不同酒度、品牌濃香型白酒的分類鑒別是可行的。在“中國制造2025”、工業“4.0”等大背景下,涉及白酒的質量控制、產地溯源、市場監管和售后管理等都將走向信息化和智能化,然而當前許多企業仍習慣采用傳統的檢測方法,導致相關便攜式設備的開發尚未得到足夠重視。因此,在今后研究中可基于更大的樣本量,著重開發精確度較高的便攜式中紅外光譜檢測儀并結合化學計量學手段為白酒的產地溯源、酒度鑒定和品牌區分等提供數字化方案。

猜你喜歡
酒樣濃香型白酒
白酒陳化工藝在清香白酒中的應用
超高壓處理對低醇沙棘蜂蜜酒品質的影響
避雨栽培對“桂葡6號”葡萄酒花色苷組成及含量的影響
推動白酒行業生產方式升級(二)
煙葉濃香型示范基地建設技術
太白酒
南陽煙區濃香型特色烤煙品種的篩選
一起自制白酒引起甲醇食物中毒的調查報告
利用Zeta電位分析蝎酒穩定性
常備白酒巧祛病
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合