?

近紅外光譜法快速無損測定奶粉的脂肪含量

2017-12-26 07:40何佳艷李亭郭長凱胡蝶鄒婷婷王瑩
食品與發酵工業 2017年10期
關鍵詞:奶粉光譜脂肪

何佳艷,李亭,郭長凱,胡蝶,鄒婷婷*,王瑩

1(北京工商大學 北京市食品風味化學重點實驗室/食品添加劑與配料北京高校工程研究中心,北京,100048)2(吉林省食品檢驗所,吉林 長春,130022)

近紅外光譜法快速無損測定奶粉的脂肪含量

何佳艷1,李亭1,郭長凱1,胡蝶1,鄒婷婷1*,王瑩2

1(北京工商大學 北京市食品風味化學重點實驗室/食品添加劑與配料北京高校工程研究中心,北京,100048)2(吉林省食品檢驗所,吉林 長春,130022)

將11種奶粉原樣配制及組成77個奶粉樣本,以脂肪含量為檢測指標,結合偏最小二乘法開展近紅外光譜定量分析研究。2次異常光譜剔除,識別出異常樣本(14,52,76)并予以剔除。74個奶粉樣本進行平滑、導數和標準變量變換等6種光譜預處理,確定標準正態變量變換結合Norris一階導為最佳光譜預處理方式,其交叉驗證均方根誤差為0.354 7,交叉驗證相關系數平方達到0.990 8;最佳前處理光譜結合3種波段選擇方法優化模型性能,與全光譜模型形成對比,確定隨機蛙跳(random frog,RF)為最佳波段選擇方式,其模型的訓練集和測試集相關系數平方分別為0.997 2和0.997 0,訓練集和測試集均方根誤差分別為0.186 2和0.198 2。結果表明:采用蒙特卡羅異常光譜剔除(Monte-Carlo sampling,MCS),光譜預處理結合隨機蛙跳波段優化技術可提高奶粉脂肪近紅外定量模型的泛化性和預測能力。

近紅外光譜技術;無損檢測;脂肪;蒙特卡羅異常光譜剔除(Monte-Carlo sampling,MCS);隨機蛙跳(random frog,RF)

奶粉營養豐富,包含人體所需的蛋白質(氨基酸)、脂肪酸、碳水化合物和維生素等營養物質,而且易被人體消化和吸收,奶粉還可長期貯藏、攜帶便利,備受大眾青睞。脂肪是奶粉中重要的營養成分,也是直接反映奶粉質量的重要指標,測定奶粉中脂肪含量是保證奶粉質量的重要內容。近幾年來,頻頻曝光的乳制品質量問題,使得廣大消費者對乳制品安全憂心忡忡。所以,高效快速地檢測乳制品品質,控制乳制品質量是解決問題的關鍵。目前,奶粉脂肪含量測定的常規方法多為化學檢測技術,此類方法雖然精度高,但耗時費力,操作過程相對復雜,而且會對樣品造成破壞。與化學分析方法相比,近紅外光譜技術具有快速無損分析、無污染綠色環保等特點,在食品領域得到廣泛應用[1-7],其中也應用于乳制品領域的研究[8-11],包括乳制品中營養成分檢測的研究,例如脂肪酸及多不飽和脂肪酸含量[12-15]、蛋白質和脂肪含量等研究[16-19]。

近紅外光譜法(near infrared spectroscopy,NIR)是指波數在12 800~4 000cm-1的電磁波,對物質分子中C—H,N—H,O—H等含氫基團的倍頻和合頻吸收。長波近紅外光譜采集波數范圍10 000~4 000 cm-1的樣品光譜,所得譜圖包含豐富的樣品信息和噪音信號(如儀器噪音、環境干擾等),譜圖復雜,重疊嚴重,通常將結合化學計量學提取樣本特征信息,并可采取異常值剔除、光譜預處理等方法進行模型優化。全光譜數據通常包含幾千個變量進行PLS模型構建,其數據量大,即包含所有相關和無關數據信息,相對耗時長,其模型準確性受無關信息變量影響。有效波段的選擇[20-25],能簡化建模數據,提取關鍵特征波段信息,改善預測性能。波數篩選方法包括蒙特卡羅無信息變量消除(Monte Carlo uninformative variable elimination,MC-UVE),隨機蛙跳(random frog)和競爭自適應重加權采樣(competitive adaptive reweighted sampling,CARS)算法等。

本文結合近紅外光譜和偏最小二乘法檢測奶粉中脂肪含量,首先采用蒙特卡洛奇異光譜剔除,然后,進行平滑、導數等光譜前處理,最后對最優光譜進行波段篩選,壓縮建模數據量,從而實現快速分析,并且提高模型的穩健性和預測能力。

1 材料與方法

1.1 實驗材料

不同品牌不同種類不同批次的奶粉原樣共11個樣品,購于大型超市,奶粉原樣脂肪測定值見表1。脂肪含量以中華人民共和國國家標準GB 5413.3—2010測定值為參考值。

表1 不同品牌奶粉脂肪含量表Table 1 Fat content of different brands of milk powder

1.2 樣品配制

將11個奶粉原樣以不同比例混合制成66個樣品,包括奶粉原樣總計得到77個樣本,樣本濃度為16.70~28.46 g/100g,平均值為21.84 g/100g。

1.3 儀器與軟件

尼高力6700傅立葉紅外光譜儀(配有積分球、光纖漫反射探頭、樣品杯等附件及OMNIC和TQ Analyst軟件)賽默飛世爾科技公司。光譜數據處理采用Matlab-R2010軟件和libPLS代碼包,libPLS代碼由公共平臺下載:http://www.libpls.net/.

1.4 測量條件與原始光譜圖

近紅外光譜儀開機并預熱穩定1 h,保持實驗室的溫度和濕度穩定,溫度一般控制在25 ℃;采用漫反射光譜法,將樣品置于樣品杯:設置光譜儀測定參數:光源為白光,光柵為12,波數范圍10 000~4 000 cm-1,分束器CaF2,采集次數為64次,分辨率8 cm-1。取平均值作為該樣本的原始光譜。圖1-a為77個樣本的近紅外原始光譜圖,沒有基線分離和銳峰的譜峰,每個近紅外譜圖都是若干個不同基頻的合頻和倍頻譜帶的組合,大量的是重疊譜峰和肩峰。最終從近紅外光譜譜圖提取的是弱信息,需進行光譜預處理和波段篩選并結合化學計量學方法。

圖1 77個奶粉樣品的近紅外漫反射光譜圖(a)和74個經Norris一階導前處理的奶粉樣品光譜圖(b)Fig.1 The raw spectra of 77 milk powder samples (a) and preprocessed spectra using Norris+1st derivative of 74 milk powder samples (b)

1.5 模型性能評估

2 結果與分析

2.1 奇異樣本剔除和樣品分組

構造穩健的奶粉脂肪含量模型,依賴于精準的光譜數據。首先,最重要的是光譜數據中奇異樣本的剔除。校正模型建立時,異常樣本的存在嚴重影響模型的預測精度。所謂的異常樣本是指樣本光譜或濃度標準值具有較大誤差的樣本。剔除異常樣本能有效提高模型的穩健性、范化和預測能力,所以,剔除異常值是近紅外光譜法定量分析過程中模型建立的重要環節。常用的異常值剔除方法有:濃度殘差剔除、馬氏距離(mahalanobis distance,MD)、蒙特卡洛采樣算法(Monte-Carlo sampling,MCS)、杠桿值法(leverage)等。其中,MCS算法是一種基于預測殘差的異常樣本識別方法,通過預測殘差對異常樣本的敏感特性,降低異常樣本的掩蔽效應。文中根據樣品的預測殘差分布圖進行異常樣本的剔除。通常,MCS算法將異常樣本分為三類:第一,Y軸方向上的獨立變量點,遠離正常的Y軸上的點分布,造成較大的誤差平方和;第二、X軸方向上的獨立變量點,遠離X軸上正常點的分布;第三、同時遠離X和Y軸方向的異常點。

采用蒙特卡洛采樣(Monte-Carlo sampling,MCS)診斷奇異樣本,通過各樣本標準偏差和預測誤差平均值對近紅外光譜數據進行異常值檢驗,位于高均值或高標準偏差的樣本最有可能是奇異樣本。文中共隨機采樣1 000次,各樣本均得到一組預測殘差,計算各樣本預測殘差的均值和方差,繪制均值-方差分布圖,如圖2所示。

a:一次MCS;b:二次MCS圖2 樣本均值-方差分布圖Fig.2 The result of variance of residuals versus mean of residuals on milk powder

圖2-a顯示,1個樣本光譜(76)被判斷為異常值,屬于第三類異常值,同時遠離X軸和Y軸正常分布點,具有較大的預測誤差均值和方差。為進一步剔除潛在異常值,進行了二次異常樣本剔除,結果表明,一次異常樣本的剔除并未剔除所有的異常值,如圖2-b所示,其中包含了兩類異常值,樣本52屬于遠離Y軸正常分布點的異常樣本,樣本14屬于遠離X軸正常分布點的樣本,都應予以剔除。因此,經2次異常樣本剔除,共剔除3個異常值,將采用74個樣本進行以下的分析。

74個樣本隨機分成2組,一組為訓練集(training set,50個),另一組為測試集(test set,24個),保證2組樣品濃度均勻。訓練集和測試集樣本濃度分布情況見表2,訓練集濃度范圍16.70~28.46 g/100g,平均值為21.78 g/100g,測試集濃度范圍16.90~28.46 g/100g,平均值為21.99 g/100g。

表2 訓練集和測試集奶粉脂肪含量分布表 單位:g/100gTable 2 Fat content of training set and test set

2.2 光譜數據前處理

除了有用的光譜信息,光譜還包含一些噪音信息,如樣本本身,儀器、環境等造成的基線漂移,光散射等干擾信息。為了建立可靠的光譜模型,通常進行光譜前處理進行干擾信息的削弱和有用信息的篩選。文中共采用6種光譜前處理方法,主要是平滑和導數處理。其中,平滑是最常用的降噪方法,其實質是一種加權平均法,強調中心點的中心作用,常用的有Savitzky-Golay平滑(S-G平滑)和Norris平滑。Savitzky-Golay卷積平滑可以降低譜圖的數據分辨率,并平滑掉小的譜峰。Norris平滑常用于增加被寬譜帶覆蓋的尖峰。導數光譜可有效地消除基線和其他背景的干擾,分辨重疊峰,提高分辨率和靈敏度,常用的有光譜的一階導數(FD)和二階導數(SD)。

訓練集50個奶粉樣品的原始光譜,不同的光譜前處理方法結果如表3所示,其中,標準正態變量變換結合Norris一階導(SNV+N+FD)是最佳的預處理方式,模型相關系數平方達到了0.9908,交叉驗證均方根誤差為0.3547,最佳主成分數為6,模型泛化能力較強。圖1-b是Norris一階導光譜圖,顯然強化了特征峰,特征峰主要集中于波數為4 400 cm-1和5 800 cm-1附近。

表3 近紅外光譜預處理結果Table 3 The results of different data preprocessing

注:(1) FD、SD:一階、二階導數;(2) SNV:標準正態變量變換;(3)SG、N:Savitzky-Golay卷積平滑、Norris平滑。

2.3 全光譜和波長選擇模型

蒙特卡羅無信息變量消除將蒙特卡羅過程和無信息變量消除相結合,充分利用樣本之間的內部相關性,對高維光譜數據中波長變量的貢獻進行評價,根據每個波長的貢獻值設定一閾值,消除其中無信息的波長。CARS算法根據達爾文的“適者生存”原則,經多次自適應加權采樣技術(ARS)篩選出模型中回歸系數絕對值大的波長點,去除權重小的波長點,最后通過交叉驗證(CV)選出交叉驗證均方差值最低的子集。隨機蛙跳算法基于利用少數變量多次迭代高維數據,計算每個變量的選擇頻率,決定該變量的重要性,有效建立預測模型。與全光譜數據建模相比,具有以下特點:(1)改善了預測性能;(2)減少了建模波數變量數;(3)突出變量與濃度相關性大的變量。結果如表4和圖3所示。

表4 不同變量篩選方法的模型參數比較Table 4 Comparison of parameters with different variable selection method

圖3 不同波長選擇方法選擇的變量分布圖Fig.3 The distribution of the selected variables obtained variables using different wavelength selection methods

如表4所示,MC-UVE算法從全光譜3 112個建模變量中提取57個關鍵變量用于建模,訓練集交叉驗證均方根誤差和交叉驗證相關系數平方分別為0.371 9和0.989 8,校正模型校正均方根誤差和校正相關系數平方分別為0.286 9和0.993 2。CARS算法從全光譜3 112個建模變量中提取233個關鍵變量用于建模,訓練集交叉驗證均方根誤差和交叉驗證相關系數平方分別為0.229 0和0.996 1,校正模型校正均方根誤差和校正相關系數平方分別為0.069 1和0.999 6。如圖3所示,雖然CARS算法選取的波數點較多,但其獨立選點的特點使結果優于UVE算法的連續選點。如表4所示,RF算法僅使用10個變量建模,訓練集交叉驗證均方根誤差和交叉驗證相關系數平方分別為0.213 1和0.996 7,校正模型校正均方根誤差和校正相關系數平方分別為0.186 2和0.997 2。如圖3所示,雖然RF算法選取的波數點較少,但其結果最佳,表明其選取了最佳的波數點進行建模。綜上所述,與MC-UVE和CARS算法相比, RF算法使建模變量數顯著較少,剔除了高維變量中的無關信息變量,優化了建模過程,簡化了模型。

2.4 測試集對模型的外部驗證

測試集作為未知樣品對校正模型性能的驗證是近紅外光譜模型泛化性評估的必備步驟。圖4-a是最佳光譜前處理全光譜(SNV+Norris一階導+3 112個波數點)的校正集和測試集模型參考值和預測值相關性圖,圖4-b是最佳光譜前處理結合最佳波段選擇(SNV+Norris一階導+RF算法)的校正集和測試集模型參考值和預測值相關性圖。顯而易見,RF算法使模型的預測精度更高。

a:全光譜模型;b:采用隨機蛙跳選擇10個波數點圖4 脂肪含量參考值與預測值關系圖Fig.4 The correlation between the predicted values and measured values

3 結論

本文將快速高效、綠色無損的近紅外光譜技術結合偏最小二乘法測定奶粉中的脂肪含量,研究結果表明,蒙特卡羅異常光譜剔除、光譜預處理結合隨機蛙跳波段優化技術后,最終模型結果具有最高的交叉驗證相關系數和最低的交叉驗證均方根誤差,建模數據量大大減少,克服了高維數據空間的繁瑣,模型性能得到優化,模型更加可靠穩健。

[1] 陳辰,魯曉翔,張鵬,等. 玫瑰香葡萄貯藏期間糖酸品質的近紅外檢測[J]. 食品與發酵工業, 2015, 41(6):175-180.

[2] 鄒婷婷,何佳艷,齊慶璇,等. 采用正交投影偏最小二乘法快速無損分析乳粉蛋白質含量[J]. 食品與發酵工業, 2016, 42(4):179-182.

[3] 馮敘橋,匡立學,宮元娟,等. 近紅外無損檢測寒富蘋果可溶性固形物含量(TSS)[J]. 食品與發酵工業, 2013, 39(4):200-204.

[4] 王雁飛. 近紅外漫反射光譜法快速定量分析八角茴香中八角茴香油[D]. 長春:吉林大學, 2010.

[5] 孫通, 江水泉. 基于可見/近紅外光譜和變量優選的南水梨糖度在線檢測[J]. 食品與機械, 2016, 32(3):69-72.

[6] YUN Yong-huan, WEI Yang-chao, ZHAO Xing-bin, et al. A green method for the quantification of polysaccharides in Dendrobium officinale[J]. Rsc Advances, 2015, 5(127):105 057-105 065.

[7] YANG Mei-yan, NIE Shao-ping, LI Jing, et al. Near-infrared spectroscopy and partial least-squares regression for determination of arachidonic acid in powdered oil[J]. Lipids, 2010, 45(6):559-565.

[8] 褚瑩. 基于近紅外光譜技術實現羊奶新鮮度檢測及摻假檢測的研究[D]. 楊凌:西北農林科技大學, 2012.

[9] MELFSEN A, HARTUNG E, HAEUSSERMANN A. Accuracy of milk composition analysis with near infrared spectroscopy in diffuse reflection mode[J]. Biosystems Engineering, 2012, 112(3):210-217.

[10] INGLE P D, CHRISTIAN R, PUROHIT P, et al. Determination of protein content by NIR spectroscopy in protein powder mix products.[J]. Journal of Aoac International, 2016, 99(2):360-363.

[11] MADALOZZO E S, SAUER E, NAGATA N. Determination of fat, protein and moisture in ricotta cheese by near infrared spectroscopy and multivariate calibration.[J]. Journal of Food Science and Technology, 2015, 52(3):1 649-1 655.

[12] 穆同娜, 莊勝利, 趙玉琪,等. 近紅外光譜法快速檢測嬰兒配方奶粉中的脂肪酸含量[J]. 現代食品科技, 2015, 31(4):278-281.

[13] 莊勝利, 孫繼紅, 穆同娜,等. 應用近紅外光譜結合偏最小二乘法快速測定乳粉中多不飽和脂肪酸的含量[J]. 食品科技, 2014, 39(6):267-271.

[14] WANG Yan-wen, WU Ding, KOU Li-ping, et al. A Non-destructive method to assess freshness of raw bovine milk using FT-NIR spectroscopy[J]. Journal of Food Science and Technology, 2015, 52(8):1-6.

[16] 張華秀,李曉寧,范偉,等. 近紅外光譜結合CARS變量篩選方法用于液態奶中蛋白質與脂肪含量的測定[J]. 分析測試學報,2010, 29(5):430-434.

[17] 朱向榮, 單楊, 李高陽,等. 近紅外光譜法快速測定液態奶中蛋白質和脂肪含量[J]. 食品科學, 2011, 32(12):191-195.

[18] 匡靜云, 管驍, 劉靜. 原料乳中蛋白質與脂肪的近紅外光譜快速定量研究[J]. 分析科學學報, 2015, 31(6):783-786.

[19] 張華秀. 近紅外光譜法快速檢測牛奶中蛋白質與脂肪含量[D]. 長沙:中南大學, 2010.

[20] 劉智超, 蔡文生, 邵學廣. 蒙特卡洛交叉驗證用于近紅外光譜奇異樣本的識別[J]. 中國科學:化學, 2008, 38(4):316-323.

[21] BIN Jun, AI Fang-fang, FAN Wei, et al. An efficient variable selection method based on variable permutation and model population analysis for multivariate calibration of NIR spectra[J]. Chemometrics& Intelligent Laboratory Systems, 2016, 158(15):1-13.

[22] LI Hong-dong, LIANG Yi-zeng, XU Qing-song, et al. Key wavelengths screening using competitive adaptive reweighted sampling method for multivariate calibration[J]. Analytica Chimica Acta, 2009, 648(1):77-84.

[23] WU Di, PENG Cheng-nie, He Yong, et al. Determination of calcium content in powdered milk using near and mid-infrared spectroscopy with variable selection and chemometrics[J]. Food and Bioprocess Technology, 2012, 5(4):1 402-1 410.

[24] 陳立旦, 趙艷茹. 可見-近紅外光譜聯合隨機蛙跳算法檢測生物柴油含水量[J]. 農業工程學報, 2014, 30(8):168-173.

[25] YUN Yong-huan, LI Hong-dong, WOOD L R, et al. An efficient method of wavelength interval selection based on random frog for multivariate spectral calibration[J]. SpectrochimicaActa Part A Molecular &Biomolecular Spectroscopy, 2013, 111(7):31-36.

Rapidnondestructivedeterminationofmilkpowerfatcontentbynear-infraredspectroscopy(NIR)

HE Jia-yan1,LI Ting1,GUO Chang-kai1,HU Die1,ZOU Ting-ting1*,WANG Ying2

1(Beijing Key Laboratory of Flavor Chemistry/Beijing Higher Institution Engineering Research Center of Food Additives and Ingredients,Beijing Technology and Business University, Beijing 100048,China)2(Jilin Institute For Food Control,Changchun 130022,China)

Eleven milk powers were diluted into 77 samples. Choosing fat content as the index, the near-infrared spectrum quantitative analysis combined with the partial least squares method were used. Abnormal samples (14, 52 and 76) shall be recognized and removed through twice abnormal spectrum removals. Seventy four milk power samples were studied by six spectrum pretreatments such as smoothing, derivative and standard variable transformation. The best pretreatment method was the standard normal variable transformation combined with Norris first order derivative, which root-mean-square error of cross validation was 0.354 7 and correlation coefficient square of cross validation reached 0.990 8. The established model performance improved by optimal pretreatment spectrum with three band selections. Random Frog (RF) was the optimal band selection method after comparing with the full-spectrum model, which correlation coefficient square of training set and test set were 0.997 2 and 0.997 0 respectively. The root-mean-square of training set and test set were 0.186 2 and 0.198 2 respectively. The result is that Monte-Carlo sampling (MCS), spectrum pretreatment and band optimization technology can improve the generalization and prediction in milk power fat dectection near-infrared quantitative model.

near-infrared spectroscopy; non-destructive testing; fat; Monte-Carlo sampling(MCS) outlier detection; random frog(RF)

10.13995/j.cnki.11-1802/ts.013921

碩士研究生(鄒婷婷為通訊作者,E-mail:zou2010@aliyun.com)。

2017-01-23,改回日期:2017-05-08

猜你喜歡
奶粉光譜脂肪
減肥后脂肪去哪兒了
基于三維Saab變換的高光譜圖像壓縮方法
脂肪竟有“好壞”之分
脂肪的前世今生
反派脂肪要逆襲
奶粉危機
妹妹的奶粉錢
你家奶粉只能沖著喝?這些媽媽們把奶粉做成了這個樣子!
星載近紅外高光譜CO2遙感進展
苦味酸與牛血清蛋白相互作用的光譜研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合