?

拉曼光譜結合UVE-SVR算法預測加熱食用油反式脂肪酸的含量

2020-03-17 05:53于慧春付曉雅劉云宏白喜婷
核農學報 2020年3期
關鍵詞:曼光譜大豆油拉曼

于慧春 付曉雅 殷 勇 劉云宏 白喜婷

(河南科技大學食品與生物工程學院,河南 洛陽 471003)

反式脂肪酸(trans fatty acids,TFAs)是順式脂肪酸在一定條件下發生異構化所形成的至少含有一個反式構型雙鍵的不飽和脂肪酸的總稱,被稱為“餐桌上的定時炸彈”[1-2],存在于高溫煎炸后的食用植物油、氫化產品、速溶產品、反芻動物的肉脂肪組織及乳脂中[3]。TFAs是食用油高溫加熱過程中不可忽視的產物,其對健康的危害可能比氫化產品中的TFAs 更大[4]。因此,開展食用油TFAs的檢測研究,對食品安全及制定油品的行業標準有著積極的意義。

目前,食用油中TFAs的常規檢測方法主要包括氣相色譜法[5]、液相色譜[6]和紅外吸收光譜法[7]等,這些分析方法檢測精度較高,但預處理過程復雜,耗時較長[8],且預處理過程直接影響最終檢測結果,難以滿足實際生產及市場監管的需求[9],而拉曼光譜技術(raman spectrocscopy technology,RAMAN)采用非彈性散射對樣品進行分析,無需前處理,簡單方便。近年來,RAMAN 在農產品、食品品質檢測及真偽鑒定方面引起越來越多的關注。在食用油檢測方面,主要是通過提取拉曼光譜的特征峰,建立食用油中與其品質相關的某些組分的預測模型,如飽和脂肪酸、油酸、亞油酸[10]及其他單不飽和脂肪酸(monounsaturated fatty acids,MUFA)和多不飽和脂肪酸(polyunsaturated fatty acids,PUFA)[11-12]等,通過對組分的預測,從而實現對食用油品質的快速檢測及鑒別。此外,運用激光拉曼檢測時,由于樣品的性質通常是由各組成成分聯合影響所決定,所以只對個別峰進行分析不足以體現樣品的性質,因此,需要綜合考慮一些峰的峰面積、形狀或移頻等特征[13],但當被測樣品光譜數據量較大,峰值較多時,直接對所有光譜的峰值特征進行分析建模,會增加模型的復雜性,影響模型的穩定性[14]。所以,在建立模型時需要對拉曼光譜的有效信息進行準確的提取,而關于這方面的研究報道較少。目前,有關激光拉曼技術對食用油中TFAS含量的檢測研究報道較少,尤其是針對長時間加熱后食用油中TFAS含量變化方面的檢測研究更少。因此,本研究嘗試采用無信息變量消除法(uninformative variable elimination,UVE)對拉曼光譜信息進行變量篩選,剔除對模型沒有貢獻的光譜,然后使用Fisher 判別分析(fisher discriminant analysis,FDA)方法對其進行定性判別分析,隨后運用支持向量回歸機(support vector regression,SVR)、BP神經網絡(back propagation neural network,BPNN)、偏最小二乘回歸(partial least-squares regression analysis,PLSR)方法分別建立基于篩選變量和全譜數據的不同食用油和不同加熱時間的TFAS含量的預測模型,并對結果進行對比分析,以期為長時間使用的煎炸油中TFAS含量的定性及定量研究提供借鑒。

1 材料與方法

1.1 食用油樣品制備

福臨門菜籽油、道道全大豆油和福臨門玉米油均購于大張超市,規格900 mL 瓶裝。檢測時取30 mL 油樣,倒入陶瓷坩堝中,在電爐上加熱,用水銀溫度計測量其溫度。當溫度達到190℃時,開始計時并調節電路電壓,使溫度波動不超過±5℃。分別在加熱時間為0、30、60、90、120、150 min時,取油樣5 mL 并冷卻至室溫,于-20℃條件下保存備用。

1.2 食用油中反式脂肪酸含量的測定

參考GB 5009.257-2016[15]的測定方法。

1.3 拉曼光譜采集

采用XploRA ONE 共焦顯微拉曼光譜儀(法國),激光光源波長785 nm,功率375 mW,光譜采集范圍200~3 500 cm-1,激光功率50%,掃描點數36個,于室溫(20~25℃)條件下測定樣品的拉曼光譜圖。6個加熱時間段的樣品,每個樣品設3 次重復。為了盡可能全面的獲取樣品信息,每個樣品分別均勻采集36個點,即每個樣品得到36 條拉曼光譜,進而使用激光拉曼儀器自帶的LabSpec 6 數據處理軟件對光譜基線進行多項式擬合,以去除熒光背景。

1.4 數據處理

1.4.1 無信息變量消除 UVE是基于分析PLSR 系數的算法,能夠有效去除無關波長變量。在PLSR 模型中,拉曼光譜矩陣變量X和TFAS含量矩陣Y存在如下關系[16]:Y=Xb+e,其中,b為回歸系數向量,e為誤差向量。將與拉曼光譜矩陣變量數目相同的隨機變量矩陣加入到光譜矩陣中,通過PLSR 交叉驗證剔除無關變量,得到回歸系數矩陣,利用回歸系數向量的平均值與其對應的標準差相除,進而確定篩選變量閾值,大于閾值的篩選變量即為優選特征變量[17]。

1.4.2 Fisher 判別分析 為了說明篩選變量能夠有效提高拉曼光譜對加熱食用油的鑒別能力,選用FDA方法作為模式判別工具[18],并用FDA對不同加熱時間的3種食用油樣品進行判別分析,通過對其訓練集及其預測集鑒別正確率的分析與對比,來表明變量篩選的必要性。

1.4.3 支持向量機回歸 SVR是一種較新的多元統計分析方法,最初用于解決模式識別中的分類問題[19],隨著VAPNIK對ε 不敏感損失函數的引入,支持向量機已被推廣到非線性系統的回歸估計,通過核函數的選擇進一步提高其學習性能[20]。分別以篩選后的3種食用油的拉曼光譜作為輸入,以樣品中TFAS含量為輸出,建立SVR 預測模型,對樣品中TFAS含量進行預測。

1.4.4 偏最小二乘回歸 PLSR分析在建模過程中集中了主成分分析、典型相關分析和線性回歸分析的特點,預測能力強且模型簡單[21]。采用PLSR方法,對樣品的拉曼光譜矩陣X和TFAS含量矩陣Y同時進行分解,有效消除多個變量之間的共線性,從而獲得最佳的校正模型[22]。

1.4.5 BP 神經網絡 BPNN 模型結構包括輸入層、隱層和輸出層,是對人腦活動的抽象、簡化和模擬,能學習和存貯輸入信號與輸出信號之間的非線性映射關系[23]。BPNN 輸入層的神經元數等于每種食用油篩選出的拉曼光譜數,輸出層的神經元數為1,而隱層需采用試湊法進行多次嘗試,建立基于BPNN的TFAS含量預測模型。

2 結果與分析

2.1 食用油加熱樣品的TFAS含量

在進行TFAS含量檢測時,以反式亞油酸含量、反式亞麻酸含量和反式油酸含量的總和表示總TFAS含量。由表1可知,隨著加熱時間的延長,菜籽油、大豆油、玉米油中TFAS含量均逐漸增加。食用油中不同的TFAs的形成和含量的改變與其脂肪酸組成有關[24]。順式脂肪酸含量較多的食用油經過加熱后對

表1 3種食用油中的反式脂肪酸含量Table1 TFAs content in three vegetable oils/(g·100g-1)

應的TFAs含量也會變多[25]。而大豆油中含有豐富的油酸、亞油酸與少量的亞麻酸,其中亞油酸的含量超過總脂肪含量的50%,且在加熱過程中生成TFAs的難易程度(從易到難)依次為反式亞麻酸>反式亞油酸>反式油酸[26],因此大豆油中TFAS含量增加明顯。

2.2 食用油加熱樣品的拉曼光譜

由圖1可知,食用油拉曼光譜存在較強的熒光背景,為了去除熒光背景的干擾,使用激光拉曼儀器自帶的軟件處理系統,采用迭代多項式擬合基線矯正方法對光譜基線進行擬合、去除熒光背景,再使用MATLAB(R2014a)軟件進行標準正態變量變換(standard normal variable,SNV)。由圖2可知,SNV 有效消除了背景信息的干擾,增強了光譜與TFAs 成分相關的光譜信息。

圖1 激光拉曼采集的648 條原始圖譜Fig.1 Laser raman acquisition of 648 original spectra

圖2 預處理后的648 條拉曼圖譜Fig.2 648 raman spectra after pretreatment

表2為圖2中食用油各譜峰所代表組分的官能團信息。其中,969 cm-1與trans(C=C)的彎曲振動相關[27],870 cm-1和1 080 cm-1是-CH2長鏈骨架的伸縮振動峰,1 302 cm-1是-CH2的卷曲振動,1 438 cm-1代表-CH2的剪式振動,1 263 cm-1和1 656 cm-1分別是不飽和脂肪酸cis(=C-H)和cis(C=C)的基團振動峰,1 745 cm-1譜峰是酯鍵羰基的伸縮振動峰[28]。上述幾個特征峰幾乎是所有食用油拉曼譜圖的共同特征,不同油脂的拉曼譜圖只是在1 656、1 263、969 cm-1處的譜峰相對強度有細微變化。由于TFAs中含有大量C-C 化學鍵,因此,在拉曼光譜中有較強的吸收信息。此外,反式雙鍵的存在,使得TFAs 在分子結構上與飽和脂肪酸、順勢不飽和脂肪酸等存在不同[29]。分子結構的變化會在吸收光譜中表現出來,相關研究表明,油脂中的TFAs和順式脂肪酸的拉曼位移不同[30]。

表2 拉曼位移信息Table2 Raman shift information

2.3 UVE 篩選變量分析結果

為優化預測模型,增加預測模型的穩定性,采用UVE方法對預處理后的全譜數據進行變量篩選,將無信息的變量去除,針對菜籽油、大豆油和玉米油分別從全部波長中篩選出75、153和23個波長變量作為特征變量進行定性和定量分析。

圖3-A為菜籽油篩選出的75個變量(特征波長)。研究表明,菜籽油中TFAs 主要由反式亞麻酸與少量的反式亞油酸組成,在加熱過程中二者的含量均明顯增加,所以變量主要集中在969、1 263、1 302、1 656 cm-1附近。圖3-B為大豆油篩選出的153個變量。新鮮的大豆油中不含有反式油酸,僅含有少量的反式亞油酸與反式亞麻酸,在加熱過程中TFAs 主要由反式亞油酸與反式亞麻酸組成,隨著加熱時間的延長也會出現少量的反式油酸,所以變量主要集中在969、1 263、1 302、1 438、1 656 cm-1附近。圖3-C為玉米油所篩選的23個變量。玉米油中TFAs 主要為反式油酸、反式亞油酸和反式亞麻酸3種,隨著加熱時間的延長,反式亞油酸與反式亞麻酸的含量明顯增加,所以變量主要集中在969、1 263、1 302、1 656 cm-1附近。此外,969 cm-1為trans RHC=CHR 彎曲振動的特征峰,可以作為反式脂肪的特征峰;1 263 cm-1為Cis c-HR 伸縮振動的特征峰;1 302 cm-1為-CH2扭曲振動的特征峰;1 438 cm-1為-CH2剪式彎曲振動的特征峰;1 656 cm-1為Cis RHC=CHR 伸縮振動的特征峰。

2.4 UVE-FDA 定性鑒別模型建立

將通過UVA 篩選出的變量,分別作為FDA的輸入變量,進行分析,其中,每個樣品的36 條拉曼光譜中24 條作為訓練集,12 條作為測試集,結果見圖4-A-2、-B-2、-C-2。為對比分析,將全波段(200~3 500 cm-1)激光拉曼光譜作為FDA的輸入變量,進行分析,結果見圖4-A-1、-B-1、-C-1。通過對比可知,不同加熱時間(0、30、60、90、120、150 min)下,采用全譜信息,菜籽油、大豆油、玉米油3種油不同加熱時間的樣品重疊嚴重,而經UVA方法變量篩選后,3種食用油的樣品均有較好的分類效果,同類間聚集度較高,表明分類效果有所提高。由表3可知,不同加熱時間下,經變量篩選后,大豆油、玉米油和菜籽油的FDA 判別平均正確率均在90%以上,明顯高于基于全譜的FDA 判別平均正確率。

2.5 定量預測模型分析結果

分別應用SVR、BPNN和PLSR方法建立基于全部變量及特征變量對菜籽油樣品中TFAs含量的預測模型,其最優模型見圖5。對于BPNN,其訓練函數為trainscg 函數,隱層神經元函數為logsig 函數,輸出層神經元函數為tansig 函數,隱層神經元的個數為10時,訓練結果較好。由表4可知,基于全部變量信息菜籽油中TFAs的預測模型,訓練集R2與測試集R2相差較大,存在過擬合現象。使用UVE 篩選的75個變量建立SVR、BPNN與PLSR 預測模型,測試集R2較全部變量模型均有不同程度的提高。其中,UVE-SVR 預測模型的測試集R2相對最高,且RMSEC和RMSEP 更低,其預測模型性能優于其他2個預測模型。

同樣建立大豆油不同加熱時間后TFAs含量的預測模型,最優預測模型見圖6。由表5可知,采用全部變量建模時,3種預測模型均達到了較好的預測效果,其中SVR與PLSR 預測結果均達到90%以上,SVR 模型和PLSR 模型的預測相關系數相近,但前者測試集的RMSEP (0.004 8) 小于后者測試集的RMSEP(0.008 1),說明SVR 預測精度高于PLSR 模型。采用UVE 篩選過后的153個變量建模時,SVR 模型測試集的R2(0.954 8)高于PLSR 模型的R2(0.920 2)和BPNN 模型的R2(0.906 0),且SVR的RMSEP(0.001 9)遠低于其他2種模型。表明基于特征變量的SVR模型預測效果優于PLSR 模型與BPNN 模型。

圖3 食用油篩選出的特征波長Fig.3 Characteristic wavelength of edible oil screening

玉米油中反式脂肪酸最優建模結果見圖7。結合表6可知,在全部特征變量下,訓練集的R2較高,但測試集的R2較低,說明試驗建立的模型存在過擬合現象,而3種預測模型的RMSEP 均較大,說明模型的穩定性有待進一步提高。采用篩選的23個特征變量建模時,SVR與BPNN 預測模型的R2相近,但SVR 模型測試集的RMSEP(0.014 5)小于BPNN 模型測試集的RMSEP(0.080 2),其預測精度高于BPNN,說明基于特征變量的SVR 模型預測效果優于PLSR 模型與BPNN 模型。

圖4 食用油全部變量篩選變量后FDA 預測集Fig.4 Prediction set of FDA after all variables and selected variables of edible oil

表3 3種食用油FDA 判別正確率Table3 Three edible oil FDA classification results /%

表4 菜籽油預測模型結果Table4 Results of rapeseed oil prediction model

表5 大豆油預測模型結果Table5 Results of soybean oil prediction model

圖6 大豆油UVE-SVR 訓練集與預測集結果Fig.6 Soybean oil UVE-SVR training set and prediction set results

圖7 玉米油UVE-SVR 訓練集與預測集結果Fig.7 Corn oil UVE-SVR training set and prediction set results

表6 玉米油的預測模型結果Table6 Results of corn oil prediction model

3 討論

本研究將激光拉曼技術應用于不同加熱時間下食用油TFAs含量的檢測,為食用油TFAs的快速檢測方法研究提供借鑒。本試驗結果表明,隨著加熱時間的延長,食用油(菜籽油、大豆油、玉米油)中TFAs含量也隨之增加,尤其順式脂肪酸含量較多的食用油,經加熱后其TFAs含量增加更明顯。與玉米油和菜籽油相比,大豆油含有豐富的油酸、亞油酸及少量的亞麻酸,其中亞油酸含量超過總脂肪含量的50%,因此,大豆油中TFAs含量增加明顯,這與蘇德森等[31]的研究結論一致。在檢測方法上,Li 等[32]和董晶晶等[33]分別采用近紅外光譜對食品油中TFAs含量進行檢測,并且分別基于全光譜或部分光譜信息建立TFAs含量的預測模型,但未對有效光譜信息進行篩選,故數據量大,計算繁瑣。孫通等[34]利用UVE對全波段光譜進行變量篩選,建立食用植物油中腐霉利含量的分類模型,判別正確率提高至98.7%,取得了良好的分類效果。因此,本研究嘗試將UVE與SVR 相結合的方法,進行食用油中TFAS含量的預測。為提高模型的穩健性,將UVE 用于拉曼光譜信息的分析處理,對3種食用油的拉曼光譜信息進行特征篩選,不僅簡化了計算,還明顯提高了模型的定性與定量分析能力。

本研究僅對不同種類食用油不同加熱時間后的激光拉曼光譜特征進行了分析,未對其特征峰所生成的映射圖進行考查,其映射圖可能還含有豐富的有用信息,可對其作進一步研究。如,先融合樣品的拉曼光譜和圖像信息,再結合適合的建模方法,以達到進一步提高模型精度和穩健性的目的。

4 結論

本研究利用激光拉曼技術對不同加熱時間下食用油TFAs含量進行快速定性和定量檢測分析,并通過光譜預處理、變量選擇及建模方法對預測模型進行優化。結果表明,在定性分析中,采用UVE 分別篩選菜籽油、大豆油和玉米油的特征變量,基于篩選特征變量的3種油的FDA 判別平均正確率均在90%以上,明顯高于基于全譜數據的FDA 判別平均正確率,表明了對拉曼光譜所采集信息進行優化篩選的必要性。在定量預測中,基于篩選變量的菜籽油、大豆油和玉米油最優預測模型(SVR)的訓練集R2分別為0.990 3、0.992 4和0.988 4,測試集R2分別為0.952 6、0.954 8和0.958 5,進一步證實,去除冗余信息可以有效提高模型的穩健性和精度。本研究為不同加熱時間食用植物油中TFAs含量的快速無損定量檢測研究提供了參考。

猜你喜歡
曼光譜大豆油拉曼
館藏高句麗鐵器的顯微共聚焦激光拉曼光譜分析
Preoperative maximal voluntary ventilation, hemoglobin, albumin, lymphocytes and platelets predict postoperative survival in esophageal squamous cell carcinoma
大豆油會影響小鼠神經系統(2020.1.22 科技日報)
拉曼光譜技術在食品質量安全檢測中的應用
吹奏千年的巴拉曼
我國大豆油進口需求的決定因素分析
菜籽油中主要脂肪酸成分的檢測分析
實用拉曼光譜引論
純大豆油價格創近三年來新低
拉曼光譜在頭頸腫瘤外科中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合