?

主成分分析研究白酒基酒香氣成分

2020-08-06 10:41杜晉葉馬立娟1杜麗平1
中國釀造 2020年7期
關鍵詞:基酒己酸丙酸

杜晉葉,史 暢,馬立娟1,,杜麗平1,*

(1.天津科技大學省部共建食品營養與安全國家重點實驗室,天津 300457;2.天津科技大學生物工程學院,天津 300457;3.中央財經大學綠色金融國際研究院,北京 071001)

白酒是我國傳統蒸餾酒,主要成分乙醇和水約占總質量的98%左右,風味物質占2%左右,但風味物質對白酒品質卻有巨大的影響[1]。成品酒的質量和等級與基酒的品質和等級關系密切。不同等級的基酒勾調出的成品酒具有不同風味和口感,價格也差別較大[2]。

傳統固態白酒生產采用微生物自然接種制曲,開放式生產作業,固態發酵釀造,甑桶蒸餾的方式[3]。釀造過程在微生物作用下會產生醇類、醛類、酯類、酸類、酚類等香氣物質[4-5],微生物生長、發酵的環境條件不同,產生的香氣成分濃度也會不同[6],蒸餾過程條件控制的細微差別,也會使白酒中香氣物質的相對比例不同,白酒中香氣成分濃度不合理或者比例失調都會造成白酒基酒的質量差異[7]。

主成分分析(principal components analysis,PCA)法是將原始變量重新組成一組新的互相無關的幾個綜合變量,進而代替原始變量的一種統計方法[8-9]。在酒類、茶葉、煙草等的分析中得到了廣泛應用。安會敏等[10]采用主成分分析(PCA)法,構建出臨滄工夫紅茶化學成分含量的質量評價模型。姚瑤等[11-12]采用主成分分析法分析了成熟期四個產地赤霞珠果實品質差異及各產地的最適采收期。錢沖等[13]運用聚類分析和主成分對不同香型的白酒進行了分析,結果表明:主成分分析的分類效果不如聚類分析,但能反映白酒風味組分與香型之間的關系。

本文以白酒廠評定基酒等級的16種主要香氣為基礎,對248個優質基酒和237個普通基酒,分別進行4次隨機取樣,每次取樣60個,進行主成分分析,對優質基酒和普通基酒4次取樣的主成分分析結果進行比較,探討樣本數據對主成分分析的影響,為將主成分分析應用于白酒風味數據挖掘提供依據。

1 材料與方法

1.1 數據來源

490個基酒酒樣的色譜分析數據(每個酒樣包含己酸乙酯、乙酸乙酯、丁酸乙酯、乳酸乙酯、庚酸乙酯、戊酸乙酯、丙酸乙酯、乙酸、丙酸、丁酸、己酸、乳酸、正丙醇、異丁醇、異戊醇、甲醇共計16個指標的含量),某白酒廠提供。

1.2 方法

1.2.1 樣本選取

剔除異常樣本后,剩余普通基酒樣本237個,優質基酒樣本248個,使用R軟件分別在1~237和1~248范圍內生成四組隨機數,每組60個。從普通和優質基酒樣本中各自抽取對應序號的樣本,得到4組優質基酒和4組普通基酒樣本。

1.2.2 數據預處理

通過數據預處理可以消除PCA分析過程中因各指標量綱、量級差異造成的誤差。采用Microsoft Excel和R軟件進行基酒酒樣的色譜分析數據標準化,得到標準化矩陣Zij

式中:xij為第i個樣本對應的第j項指標數值,為第j項指標的平均值,sj為第j項指標的標準差。

數據標準化后,相關系數矩陣即為樣本協方差矩陣如下:

式中:rij代表第i個和第j個指標之間相關系數,zki和zkj分別為第k個樣本的第i個和第j個指標的對應值。

1.2.3 主成分分析[14-16]

主成分分析的基本思想是將原來眾多的具有一定相關性的指標X1,X2,…,Xp(比如p個指標),重新組合成一組較少個數的互不相關的綜合指標Fm來代替原來指標。綜合指標既能最大程度的反映原指標X1,X2,…,Xp所代表的信息,又能保證新指標之間保持信息不重疊。將白酒基酒16個香氣成分進行線性組合,轉換成幾個信息互不重疊的綜合指標Fm來代替原來指標。

具體步驟如下:

(1)計算特征值確定主成分

特征值和貢獻率是選擇主成分的依據,根據線性方程組理論,相關系數矩陣R的行列式為0,則特征方程(|R-λIp|=0),式中λ為特征向量,Ip為單位矩陣。按照的標準確定主成分個數,使得信息利用率達到85%以上。

(2)建立載荷矩陣

載荷系數是主成分Fi與原始指標Xm的相關系數,可以反映原始指標與主成分之間的相關性,載荷系數絕對值越接近1,則相關性越強。利用R軟件輸入相關系數矩陣和計算命令,計算載荷矩陣Aij=[aij]m×p,aij為第i個主成分和第j個指標的相關關系。

(3)主成分F值的計算

將因子載荷Aij矩陣變換為主成分系數矩陣后Qij=[αij]m×p帶入多項式,得到各主成分關于原始指標的表達式如下:

式中:α1p為第1個主成分中第p個指標的因子得分,α2p為第2個主成分中第p個指標的因子得分,αmp為第m個主成分中第p個指標的因子得分,X1……XP為樣本原始指標名稱,F1、F2…Fm分別代表第一,第二,…,第m個主成分。

計算白酒基酒香氣成分的綜得分F如下:

式中:βi,i=1,2,…,m為第i個主成分所對應的貢獻率。

2 結果與分析

2.1 優質基酒主成分分析

主成分分析能夠降低數據的維數,減少建模、預測的計算時間,同時又能保留數據的大部分信息。將從248個優質基酒中抽取的4組樣本中的己酸乙酯、乙酸乙酯、丁酸乙酯、乳酸乙酯、庚酸乙酯、戊酸乙酯、丙酸乙酯、乙酸、丙酸、丁酸、己酸、乳酸、正丙醇、異丁醇、異戊醇、甲醇等16個指標的含量數據分別按照1.2.3步驟進行標準化,將原來具有一定相關性的16個指標重新組合成互不相關的綜合指標(即主成分)。數據處理采用R語言軟件,結果見表1~5。

2.1.1 主成分數目確定

確定主成分數目的方法有累計貢獻率法和特征值平均數法,本研究采用累計貢獻率法,取主成分的累計貢獻率達到85%以上時主成分的數目。由表1 可知,本研究在優質基酒抽取的4組樣本,前6個主成分的累積貢獻率都>85%,保證了綜合變量能包括原始變量的絕大多數信息。

2.1.2 主成分載荷與優質基酒成分關系分析

主成分載荷是主成分Fi與原始指標Xi的相關系數,可以反應原始指標與主成分之間的相關性,載荷系數絕對值越接近1,則相關性越強。

由表1、表2 可知,從優質基酒中抽取的第1組樣本的第一主成分貢獻率達到37.33%,其中丁酸(0.900)、己酸乙酯(0.873)、丁酸乙酯(0.804)、乙酸(0.780)、乙酸乙酯(0.725)的載荷系數為正且都>0.50,說明這些成分是第一主成分的主要評價指標,乳酸乙酯、丙酸、異丁醇載荷系數為負,呈負相關;第二主成分貢獻率為18.27%,其中載荷系數絕對值大于0.50的有:異丁醇(0.670)、異戊醇(0.618)、己酸(0.538)載荷系數為正,呈順序正相關,丙酸(-0.647)、戊酸乙酯(-0.532)等載荷系數為負,呈負相關。第三主成分貢獻率10.16%,與異戊醇(0.592)、異丁醇(0.512)載荷系數>0.50,呈正相關;第四、五、六主成分貢獻率分別為:8.60%,7.29%和5.29%,其中第四主成分與丙酸(-0.627)呈現較強的負相關;第五主成分與乳酸乙酯(0.742)有很強正相關性,與乙酸乙酯(0.3892)正相關;第六主成分與甲醇(0.553)有較強正相關性,與乙酸(-0.3044)、乳酸(-0.447)負相關。

表1 優質基酒樣本主成分分析的特征值及累積貢獻率Table 1 Characteristic value and cumulative contribution rate of PCA for high-quality base liquor

表2 第1組優質基酒樣本主成分載荷Table 2 Principal component load of high-quality base liquor in group 1

由表1、表3可知,優質基酒第2組樣本的第一主成分貢獻率38.95%,與丁酸(0.889)、己酸乙酯(0.809)、丁酸乙酯(0.807)、庚酸乙酯(0.745)、乙酸(0.742)呈正相關,與乳酸乙酯(-0.509)等呈負相關。第二主成分貢獻率18.98%,與異戊醇(0.599)、異丁醇(0.559)、己酸(0.558)呈順序正相關,與丙酸(-0.701)、正丙醇(-0.600)、戊酸乙酯(-0.516)呈負相關。第三主成分貢獻率10.25%,與異戊醇(-0.609)、異丁醇(-0.571)呈負相關。第四、五、六主成分貢獻率分別為:7.40%,6.84%和4.33%,其中第四主成分與丙酸(-0.467)呈現較強的負相關。第五主成分與乳酸乙酯(0.602)、乙酸乙酯(0.442)有較強正相關性。第六主成分與甲醇(0.463)有較強正相關性。

表3 第2組優質基酒樣本主成分載荷Table 3 Principal component load of high-quality base liquor in group 2

由表1、表4可知,優質基酒第3組樣本的第一主成分貢獻率為36.98%,與丁酸(0.886)、己酸乙酯(0.840)、丁酸乙酯(0.837)、乙酸(0.765)、呈順序正相關,與乳酸乙酯(-0.435)、異丁醇(-0.403)、異戊醇(-0.168)、丙酸(-0.165)呈負相關;第二主成分貢獻率18.41%,與異戊醇(0.694)、己酸(0.625)、異丁醇(0.545)呈順序正相關,與丙酸(-0.574)、丙酸乙酯(-0.562)呈負相關;第三主成分貢獻率為9.95%與異丁醇(0.660)、異戊醇(0.530)、丙酸(0.505)正相關;第四主成分貢獻率為8.68%,與乳酸(0.462)、丙酸乙酯(0.451),甲醇(0.426)正相關。第五主成分與乳酸乙酯(0.784)、乙酸乙酯(0.589)有很強正相關性,貢獻率為8.25%;第六主成分與甲醇(-0.614)有很強負相關性,貢獻率為4.23%。

表4 第3組優質基酒樣本主成分載荷Table 4 Principal component load of high-quality base liquor in group 3

表5 第4組優質基酒樣本主成分載荷Table 5 Principal component load of high-quality base liquor in group 4

表1、表5顯示出,優質基酒第4組樣本的第一主成分貢獻率33.25%,與丁酸(0886)、丁酸乙酯(0.880)、己酸乙酯(0.794)、戊酸乙酯(0.776)、乙酸(0.726)、呈順序正相關。與乳酸乙酯(-0.363)、異丁醇(-0.337)、異戊醇(-0.133)呈負相關。第二主成分貢獻率23.86%,與己酸(0.782)、異戊醇(0.680)、異丁醇(0.680)呈順序正相關,與丙酸(-0.589)、丙酸乙酯(-0.561)呈負相關。第三主成分與甲醇(0.515)、乙酸乙酯(0.506)呈正相關,與丙酸(-0.517)呈負相關,貢獻率為9.72%。第四主成分貢獻率為8.77%與異丁醇(0.522)、異戊醇(0.571)、丙酸(0.519)、甲醇(0.383)正相關。第五主成分貢獻率為8.00%,與乳酸乙酯(0.692)、乙酸乙酯(0.431)有很強正相關性。第六主成分與甲醇(0.496)有很強正相關性,貢獻率為4.60%。

2.1.3 小結

綜合上述結果得出:優質基酒4組樣本的前6個主成分累積貢獻率均達到85%以上;4組樣本的第一、第二主成分相關物質都比較穩定,且第一、第二主成分的累計貢獻率達到55%以上,包含了樣品的主要信息。第一主成分中丁酸、己酸乙酯、丁酸乙酯在4組樣本中載荷系數均大于0.8,穩定地排在前3位,為第一主成分的主要評價指標,這也說明優質基酒中丁酸、己酸乙酯、丁酸乙酯等成分的含量穩定,另外除了丙酸、異丁醇、異戊醇的載荷系數絕對值相對較小以外,其他成分的相對載荷系數都比較大說明第一主成分囊括了基酒的絕大部分信息;第二主成分中己酸、異戊醇、異丁醇載荷系數在四組樣本中均在前3位為主要評價指標,戊酸乙酯、丙酸、正丙醇、丙酸乙酯在四組樣本中的載荷系數的絕對值也比較大但呈現負相關,也是第二主成分所包含的重要信息;第三主成分中異丁醇、異戊醇在第1、第3組樣本中載荷系數最大呈正相關,但在第2組樣本中載荷系數絕對值最大,但呈負相關,這可能是由于高級醇及其相關的其他物質含量在各組樣本的含量不穩定造成的;其他幾個主成分在4組樣本中,略有差異,但共同點比較明顯如:第四主成分中的丙酸乙酯,第五主成分與乳酸乙酯、乙酸乙酯;第六主成分中的甲醇,可作為對應主成分的評價指標。

2.2 普通基酒主成分分析

從237個普通基酒中抽取的4組樣本,分別將每組樣本的60個樣品中的己酸乙酯、乙酸乙酯、丁酸乙酯、乳酸乙酯、庚酸乙酯、戊酸乙酯、丙酸乙酯、乙酸、丙酸、丁酸、己酸、乳酸、正丙醇、異丁醇、異戊醇、甲醇等16個指標的含量數據按照1.2.3步驟進行標準化,將原來具有一定相關性的16個指標重新組合成互不相關的綜合指標。數據處理采用R語言軟件,計算結果見表6~10。

2.2.1 主成分數目確定

由表6可知,普通基酒4組組樣本中,前6個主成分的累積貢獻率都>85%,綜合變量能包括原始變量的絕大多數信息。

2.2.2 主成分載荷與普通基酒成分關系分析

由表6、表7可知,從普通基酒中抽取的第1組樣本的第一主成分貢獻率為30.39%,與丁酸(0.896)、己酸乙酯(0.803)、戊酸乙酯(0.745)、丁酸乙酯(0.694)等呈順序正相關,與乳酸乙酯(-0.288)、異丁醇(-0.538)呈負相關;第二主成分貢獻率為16.01%,與己酸(0.577)、己酸乙酯(0.459)、庚酸乙酯(0.425)呈順序正相關與正丙醇(-0.808)、丙酸乙酯(-0.559)、丁酸乙酯(-0.495)呈負相關;第三主成分與丙酸(-0.764)呈現負相關貢獻率為15.86%;第四、五、六主成分貢獻率分別為:10.58%、7.34%、5.69%,其中第四主成分與異戊醇(0.820)、異丁醇(0.672)有很強正相關性。第五主成分與乳酸乙酯(0.754)正相關。第六主成分與甲醇(-0.565)有很強負相關性。

表6 普通基酒各組樣本主成分分析特征值及累積貢獻率Table 6 Characteristic value and cumulative contribution rate of PCA for ordinary base liquor

表7 第1組普通基酒樣本主成分載荷Table 7 Principal component load of ordinary base liquor in group 1

由表6、表8可知,普通基酒第2組樣本的第一主成分貢獻率30.03%,與丁酸(0.896)、己酸乙酯(0.878)、戊酸乙酯(0.801)、庚酸乙酯(0.792)呈正相關,與乳酸乙酯(-0.321)、異丁醇(-0.391)、異戊醇(-0.351)呈負相關;第二主成分貢獻率17.90%,與正丙醇(0.832)、丙酸乙酯(0.794)、丁酸乙酯(0.557)、戊酸乙酯(0.359)呈順序正相關,己酸(-0.650)、庚酸乙酯(-0.391)、丁酸(-0.308)呈負相關。第三主成分貢獻率為13.32%,與丙酸(-0.541)負相關。第四主成分與異戊醇(-0.605)、異丁醇(-0.660)、丙酸(-0.586)有很強負相關性,貢獻率11.19%;第五、六主成分貢獻率分別為:7.85%和5.31%,其中,第五主成分與乳酸乙酯(0.786)有很強正相關性,第六主成分與甲醇(-0.718)有很強負相關性。

表8 第2組普通基酒樣本主成分載荷Table 8 Principal component load of ordinary base liquor in group 2

由表6、表9可知,普通基酒第3組樣本的第一主成分貢獻率為32.57%,與戊酸乙酯(0.843)、乙酸(0.802)、丁酸(0.788)、丁酸乙酯(0.767)、己酸乙酯(0.758)呈順序正相關與異戊醇(-0.478)、異丁醇(-0.617)、乳酸乙酯(-0.288)呈負相關。第二主成分貢獻率20.06%,與己酸(0.689)、己酸乙酯(0.508)、丁酸(0.473)、庚酸乙酯(0.425)呈順序正相關與正丙醇(-0.786)、丙酸乙酯(-0.697)、丙酸(-0.548)呈負相關。第三主成分貢獻率為13.90%,與丙酸(-0.646)負相關。第四主成分與異戊醇(0.805)、異丁醇(0.684)正相關,貢獻率為9.82%;第五主成分貢獻率為6.84%,與乳酸乙酯(0.584)有很強正相關性。第六主成分與甲醇(-0.804)有很強負相關性,貢獻率為5.99%。

表9 第3組普通基酒樣本主成分載荷Table 9 Principal component load of ordinary base liquor in group 3

表10 第4組普通基酒樣本主成分載荷Table 10 Principal component load of ordinary base liquor in group 4

由表6、表10可知,普通基酒第4組樣本的第一主成分貢獻率為30.00%,與丁酸(0.840)、己酸乙酯(0.795)、乳酸(0.690)、丁酸乙酯(0.662)呈順序正相關。與異戊醇(-0.681)、異丁醇(-0.518)、乳酸乙酯(-0.416)呈負相關。第二主成分貢獻率17.69%,與正丙醇(0.626)、丙酸乙酯(0.595)、庚酸乙酯(0.547)呈順序正相關與乳酸乙酯(-0.416)呈負相關。第三主成分與丙酸(-0.814)負相關,貢獻率為13.62%。第四主成分貢獻率為9.30%,與異丁醇(0.527)、異戊醇(0.700)正相關。第五主成分與乳酸乙酯(0.730)有很強正相關性,貢獻率為7.85%。第六主成分與甲醇(-0.607)有很強負相關性,貢獻率為6.25%。

2.2.3 小結

綜合上述結果可以得出:普通基酒4組樣本的前6個主成分累積貢獻率均達到85%以上,前2個主成分的累積貢獻率略低于優質基酒;4組樣本的6個主成分均不太穩定,4組樣本中第一主成分中載荷系數≥0.8的有:丁酸、己酸乙酯、丁酸乙酯、戊酸乙酯、乙酸,其中丁酸在四組樣本中的載荷系數都大于0.8,己酸乙酯在第1、第2組中>0.8,在第4組中接近0.8,戊酸乙酯在第2組和第3組中>0.8,乙酸僅在第3組中>0.8,4組樣本的第一主成分評價指標不同,共同的僅為丁酸,說明普通基酒不同組樣本中己酸乙酯、丁酸乙酯、戊酸乙酯、乙酸成分含量差異較大,穩定性差;第二主成分中己酸在第1、第3組樣品中載荷因子最大,為正相關,而在第2、第4組中載荷因子絕對值最大,但是負相關,正丙醇則相反,在第1、第3組樣品中載荷系數絕對值大,為負相關,而在第2、第4組中載荷因子為最大,為正相關,己酸和正丙醇可以作為該主成分的主要評價指標,但規律相反;第三主成分載荷系數較大的成分在4組樣本中均為:乙酸乙酯、乳酸和甲醇可以作為第三主成分的評價指標,第四主成分異丁醇和異戊醇在四組樣本中載荷因子的絕對值均表較大,可以作為第四主成分的評價指標,但也存在有的組正相關,有的組負相關的問題;乳酸乙酯則可認為是4組樣本第五主成分的評價指標;第六主成分甲醇的載荷系數絕對值最大,均為負相關可作為4組樣本中第六主成分的評價指標。

2.3 優質基酒和普通基酒的比較

2.3.1 碎石圖的直觀檢驗

碎石圖是根據原始數據相關矩陣特征值的大小即主成分方差大小的順序,畫出主成分方差隨主成分個數變化的散點圖。根據碎石圖的形狀也可以對主成分分析的適用性進行判斷。碎石圖的形狀理論上應該像個山崖,從第一個主成分開始,曲線迅速下降,然后下降變得平緩,最后變成為近似一條直線,近似直線上的散點就像山腳下的碎石,因此得名。顯然,碎石圖的彎曲的程度越明顯,越像個山崖,越適合進行主成分分析;相反,則不適合進行主成分分析[17-18]。使用R軟件繪制優質基酒和普通基酒的碎石圖,其結果見圖1。由圖1可以看出,優質基酒主成分分析效果好于普通基酒。優質白酒的碎石圖在第一主成分后下降迅速,尤其是第一、二、三主成分后斷崖更為明顯,這就解釋了優質基酒隨機抽取的4組樣本中,組成第一、二主成分各因子中載荷系數大于0.8的成分比較穩定。普通白酒的碎石圖在第一主成分后下降平緩,沒有明顯斷崖,故4組樣本中,主成分組成的各因子載荷系數較大的成分不穩定。

圖1 優質基酒及普通基酒的主成分碎石圖Fig.1 Gravel diagram of principal components of high-quality base liquor and ordinary base liquor

2.3.2 基酒主成分得分

計算優質基酒和普通基酒的綜合評分,繪制直方圖后使用高斯核密度估計得到概率密度結果見圖2。由圖2可知,優質白酒主成分綜合得分(F值)更為集中,密度分布圖出現明顯的尖峰厚尾現象[19-20],F值的方差為0.560較小,說明樣本之間的差異較小,這說明優質基酒樣品成分穩定,香氣成分含量范圍比較集中;普通基酒的分布與之相比則較為分散,計算F值的方差為0.925較大,說明樣本間差異較大,香氣成分含量范圍沒有優質基酒集中,但可進行進一步挖掘,提高優質酒率。

圖2 優質基酒與普通基酒的概率密度圖Fig.2 Probability density diagram of high-quality base liquor and ordinary base liquor

3 結論

本研究以白酒廠基酒中酸、酯、醇等16種香氣成分數據為基礎,對優質基酒和普通基酒,分別進行4次隨機抽樣,進行主成分分析,結果表明:優質基酒樣4次抽樣主成分分析結果比較穩定,普通基酒4次抽樣其主成分分析結果差異較大。在利用主成分進行白酒風味數據分析時,對數據的分布進行分析,以保證結果的準確性和可靠性,進而通過挖掘數據信息,找出影響產品質量的關鍵點,控制釀造過程提高產品質量。

猜你喜歡
基酒己酸丙酸
丙酸氟替卡松、孟魯司特、地氯雷他定治療咳嗽變異性哮喘的臨床研究
己酸的生產應用研究進展
正丁醇/丙酸與腐殖酸相互作用的NMR研究
飼料中丙酸、丙酸鹽的測定方法改進研究*
那些外購基酒的白酒企業
2021年茅臺酒基酒生產目標發布
窖泥高產己酸菌的分離篩選及發酵性能測試
食醋固態發酵中丙酸含量變化及生成機理研究
濃香型窖泥功能菌的培養工藝改進試驗
窖泥中己酸菌的篩選及其運用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合