?

基于近紅外光譜的杏仁蛋白軟糖理化指標快速無損檢測

2020-11-09 04:16陳素彬
食品與機械 2020年10期
關鍵詞:定標總糖波長

陳素彬

(南充職業技術學院,四川 南充 637131)

杏仁蛋白軟糖是重要的食品和食品生產原料,可用作蛋糕內餡、糕面及富有色彩的糕點裝飾,制作小杏仁蛋糕、杏仁餅及餅干。杏仁蛋白軟糖富含蛋白質、單不飽和脂肪酸、維生素E、纖維和鎂等物質,不僅能改善食品的風味、口感和外觀,而且還具有很高的醫用價值。

根據GB/T 20977—2007《糕點通則》之規定,杏仁蛋白軟糖的理化指標應包括干燥失重(水分)、蛋白質、粗脂肪和總糖,其中總糖含量檢驗方法為其附錄A給出的斐林氏容量法;水分含量按GB 5009.3—2016《食品安全國家標準 食品中水分的測定》的第一法測定。這些方法的優勢為準確度高、重復性好、設備成本較低,適用于仲裁檢驗,但需用儀器設備和化學試劑較多,具有操作復雜、耗時長、污染環境等缺點[1],致其測定結果易受人為因素影響,不利于食品生產中的大樣本快速檢測。近年來,隨著化學計量學方法的發展和儀器研制水平的提高,近紅外光譜(Near infrared spectroscopy,NIRS)分析方法檢測高效、操作簡便、無化學污染、支持多成分同時測定等優勢日益凸顯,作為一種非破壞性的“瞬間分析”技術[2],被越來越多地應用于食品行業的各種定性和定量分析,但目前中國尚未見以NIRS法檢測杏仁蛋白軟糖組分的報道。

NIRS法是一種間接定量分析技術[3],在確保樣品光譜和待測成分參考值準確性的情況下,其預測結果取決于所建定標模型的質量。在實際應用和相關研究中,通常采用隨近紅外光譜儀器附送的OPUS、TQ Analyst、QUANT等分析軟件[4-5],以偏最小二乘法(Partial least squares,PLS)進行建模和預測。對于食品營養成分、品質指標檢測,李路等[6]用PLS法和BP神經網絡法建立了大米總糖、水分等成分的近紅外檢測模型,其決定系數(R2)均大于0.9、相對標準差均小于2.6%。陳沖等[7]建立了冬棗水分、糖分無損檢測的PLS和主成分回歸(Principal component regression,PCR)分析模型,其水分預測PLS模型的相關系數(R)為0.997 45、校正均方差(Root mean square error of calibration,RMSEC)為0.044 5、預測均方差(Root mean square error of prediction,RMSEP)為0.367,糖分預測PLS模型的相關系數(R)、RMSEC和RMSEP分別為0.960 78,0.853,1.64。何云嘯等[8]建立了諾麗果粉在真空冷凍干燥過程中水分含量與紅外光譜的定量模型,當水分含量在5.00%~9.00%時模型的R2為0.98、交互驗證均方根誤差(Root mean square error of cross validation,RMSECV)為0.26。賈柳君等[9]利用近紅外光譜分析技術對葡萄酒的主要成分進行定量分析,其總糖預測模型的R2、RMSEP和相對分析誤差(Residual predictive deviation,RPD)分別達到0.943 5,0.263 6,4.21。這些研究為應用NIRS分析技術進行食品營養指標檢測提供了有益參考,但未充分運用化學計量學方法和軟件技術優化模型性能,主要體現在:① 忽略了異常樣本和不同的樣本集劃分結果對模型預測能力和穩健性的影響,未進行異常樣本判斷和樣本集劃分方法選擇。② 根據譜圖外觀或待測成分對應的化學基團選擇變量區間,建模波長較多,模型運算量大而運行效率較低;或用組合方法優選特征波長,增加了建模過程的復雜性。

1 材料與方法

1.1 材料與儀器

杏仁蛋白軟糖:南充多家糕點企業;近紅外光譜儀:NIRSystems 6500型,丹麥FOSS公司。其光源為鎢鹵燈,波長范圍400~2 500 nm,檢測器為硅(400~1 100 nm)和硫化鉛(1 100~2 500 nm);取點間隔2 nm,掃描速度1.8次/s,掃描次數32,工作溫度15~32 ℃。配有往復移動式樣品池,以標準陶瓷片為參比。

1.2 樣品采集與制備

按GB/T 20977—2007規定之方法和數量,在南充糕點企業采集杏仁蛋白軟糖樣品32個,用四分法縮減、混勻后分成4份,取其中2份為試驗樣品,分別用于水分、總糖含量參考值測定和光譜數據采集。試樣裝入廣口瓶,保存在冰箱中。

1.3 待測成分含量參考值測定

1.3.1 水分 稱取試樣8 g(精確至0.000 1 g),按GB 5009.3—2016的第一法測定。

1.3.2 總糖 準確稱取樣品2.0 g,按GB/T 20977—2007附錄A的斐林氏容量法測定。

1.4 NIRS定標模型的建立

1.4.1 樣品近紅外光譜采集 依次將試樣裝入樣品杯,以近紅外光譜儀掃描。設置波長范圍450~2 448 nm、間隔2 nm,每個試樣重復裝樣、掃描10次,取其平均值為樣品光譜。

1.4.2 NIRS定標模型建立及其性能評價 以KS法將樣品按2∶1劃分為定標集和驗證集。用定標集光譜數據和水分含量參考值建立PLS定標模型,并將驗證集光譜數據代入該模型預測相應的樣品水分含量;用同樣方法建模、預測驗證集樣品的總糖含量。

(2)制定相應的優惠政策。如高速公路服務區旅游廁所建設減免收投資許可證、行政事業單位免收公廁拆遷建設管理費用等。

以校正決定系數(Rc2)、預測決定系數(Rp2)、RMSEC、RMSEP和RPD為評價指標,分析所得水分和總糖測定的NIRS定標模型性能。

1.5 NIRS定標模型的優化

1.5.1 異常樣本剔除 以蒙特卡洛采樣法(Monte Carlo sampling,MCS)從全部樣本中抽取80%為校正集、其余為驗證集,建立PLS模型進行預測,計算各樣本的預測殘差。重復該過程使全部樣本被預測,計算各樣本預測殘差的均值(MEAN)和標準差(Standard deviation,STD),繪制全部樣本預測殘差的MEAN-STD分布圖,圖中位于均值和標準差較高區域的樣本即為異常樣本[10]。

1.5.2 光譜變換處理與樣本集劃分 以多種算法分別對定標集和驗證集光譜數據進行變換處理,包括均值中心化(Mean centralization,MC)、薩維茨基—戈萊平滑(Savitzky-Golay smoothing,SG)、標準正態變量變換(Standard normal variable,SNV)、去趨勢(De-trending,DT)和多元散射校正(Multiple scattering correction,MSC)以及基于MC的組合算法;同時分別以KS法和SPXY法按2∶1劃分樣本集,用變換處理后的光譜數據與相應待測成分參考值分別建立PLS模型預測水分和總糖含量,比較其性能指標以確定最優光譜預處理和樣本集劃分方案。

1.5.3 特征波長選取 用MCS法抽取80%樣本構成校正集、其余為驗證集,建立PLS模型進行預測,計算波長j對目標的貢獻|bj|和權重wj,以指數遞減函數計算波長點的保留率ri=ae-ki(a、k為常數,i為采樣次數);去掉|bj|較小的波長點,用自適應重加權采樣(Adaptive reweighted sampling,ARS)法由m×ri個波長點中得到樣本優選子集(m為波長點數),取相應光譜數據建立PLS模型,計算其RMSECV。重復此過程200次,取最小RMSECV值對應的優選子集為特征波長。

1.5.4 優化模型建立與預測 從樣本集中剔除異常樣本,用選定方案進行數據預處理、劃分樣本集、選取特征波長光譜,得到優化的定標集和驗證集,以PLS方法分別建模、預測水分和總糖含量。將所得預測結果與相應成分的參考值對比,計算其平均回收率,并通過配對樣本t檢驗判斷其差異性。

1.6 NIRS定標模型優化性能對比

1.7 軟件工具

1.7.1 待測成分參考值測定 數據記錄、結果計算和數據統計用Microsoft Excel 2010完成。

1.7.2 NIRS定標模型建立和優化 初始模型的建立、預測用The Unscrambler X 10.4完成,模型優化用MATLAB R2019a編程、作圖實現。

1.7.3 樣品光譜圖形繪制 用OriginPro 2019b完成。

2 結果與分析

2.1 NIRS定標模型建立和預測

2.1.1 樣品近紅外光譜采集結果 32個樣品的近紅外光譜如圖1所示。

從圖1可知,所有杏仁蛋白軟糖樣品的光譜特征較為相似,譜線較分散、譜圖較寬,表明各樣品組成基本一致、其成分含量差異較明顯;樣本光譜在1 100,1 288,1 652,1 848 nm左右存在明顯波谷,而在1 010,1 208,1 468,1 724,1 938 nm左右有較明顯的波峰,這些波段區域含有較多特征光譜信息。同時還可看到,樣品光譜譜帶較寬,基線漂移和譜帶重疊嚴重,尤其2 150~2 448 nm波段的光譜信噪比較低,故建模時應對原始光譜進行變換處理;譜圖中有2條譜線的走勢明顯離群,疑其為異常樣本,宜在建模時剔除。

圖1 樣品近紅外光譜

2.1.2 NIRS定標模型預測結果分析 用全部樣本、全光譜、無預處理分別所建水分、總糖含量測定的NIRS定標模型預測結果如表1所示。

2.2 NIRS定標模型的優化

2.2.1 異常樣本剔除結果分析 馬氏距離法、主成分得分法、光譜殘差檢驗法等傳統方法判斷異常樣本,皆需根據經驗設定閾值,且難以判斷多個異常點。試驗采用MCCV法,可根據光譜數據和待測成分之間的關系及異常值對模型穩健性的影響,同時篩選出兩個方向的異常點,并以全部樣本的預測殘差MEAN-STD分布圖直觀地反映其整體分布情況,其結果如圖2所示。

表1 NIRS定標模型預測結果

圖2 全部樣本預測殘差MEAN-STD分布圖

從圖2(a)可看出,全部樣本預測殘差的均值和標準差分布較分散,其中位于高均值區域的樣本依次為13、24、25和19號,位于高標準差區域的樣本依次為21、22和23號,反映出在模型的多次運行中,這些樣本的水分含量預測準確度或(和)穩定性與總體相差較大,剔除之將使所建模型的準確性和穩健性得到改善。因樣本總數較少,實際建模時僅剔除預測殘差均值和標準差都較大的13和21號樣本即可;在圖2(b)中,樣本預測殘差的均值和標準差分布較集中,位于高均值區域的樣本為21和30號,位于高標準差區域的樣本依次為21、23和22號,因此建模時宜剔除離群最遠的21和30號樣本。

2.2.2 光譜變換處理與樣本集劃分

(1) 樣本集劃分結果比較:在濃度梯度(Concentration gradient,CG)、隨機(Random sampling,RS)、KS和SPXY等幾種常用樣本集劃分方法中,KS法在實際檢測和相關研究中采用最多;SPXY法則在計算樣品間距時同時考慮了光譜和參考值變量,能有效覆蓋多維向量空間,從而改善所建模型的預測能力。試驗將30個正常樣本分別用KS法和SPXY法按2∶1劃分樣本集,得定標集樣本20個、驗證集樣本10個,其結果如表2 所示。

表2 兩種方法劃分樣本集的結果

由表2可知,用KS法劃分水分測定模型的樣本集較好,所得定標集與驗證集樣本的水分含量區間分別為[6.8,18.6]、[7.0,18.1],前者完全涵蓋了后者;其水分含量平均值(13.52,13.92)和標準差(3.62,3.64)都相差很小,表明定標集和驗證集樣本數據分布相似度高,適合于建立水分含量預測模型。

總糖測定模型則以SPXY法劃分樣本集較好,相應定標集和驗證集樣本的總糖含量區間分別為[32.7,68.7]、[33.2,68.2],前者亦完全涵蓋后者;其驗證集樣本的總糖含量平均值小于定標集、標準差大于定標集,表明驗證集樣本數據分布于定標集數據區域內,且其較分散、多態性好,有利于建立一個預測能力強、泛化性能好的總糖測定模型。與之相比,KS法劃分的定標集中未包含總糖含量值最小的樣本,將對所建NIRS定標模型性能產生不利影響。

(2) 光譜變換處理結果比較:近紅外光譜吸收較弱、重疊嚴重,且存在樣品物理性狀不均、光的散射及儀器噪聲等不利因素影響,致使掃描所得原始光譜信息復雜、信噪比低,以之直接建模難以獲得預期的結果。試驗分別嘗試了多種光譜變換處理算法,其相應PLS定標模型的預測結果如表3所示。

從方法原理的角度講,MSC算法能有效消除樣品顆粒大小及其分布不均產生的散射影響,增強光譜與數據之間的相關性;MC變換可增加樣品光譜之間的差異,從而提高模型的穩健性和預測能力。就實際效果看,試驗將二者組合應用于半固體狀的杏仁蛋白軟糖樣品光譜預處理,取得了優于其他各種方法的效果。

2.2.3 建模波長選取結果分析 試驗樣品的原始NIRS光譜包括1 000個波長,其中存在大量冗余信息和共線性變量,勢必增加建模的復雜性和計算量,影響模型的預測精度和運行速度,因此建模時需選取能充分反映待測成分信息的特征波長,以簡化模型、提高其性能。在無信息變量消除法(UVE)、連續投影算法(SPA)及遺傳算法(GA)等眾多方法中,試驗采用CARS法進行建模特征波長優選[11],所得結果如表4所示。

由表4可知,用CARS法結合PLS模型篩選后,水分定標模型保留了8個波長變量,僅占全波長的0.8%。其中4個集中在1 590~1 692 nm波段,正好位于以1 652 nm 為中心的波谷內;另外4個中有2個位于1 938 nm 處的波峰區域、1個位于1 468 nm處的波峰附近、1個位于1 848 nm處的波谷區域。顯然,選出的8個波長與樣品譜圖的特征基本相符,相應的光譜數據能夠表達杏仁蛋白軟糖樣品中水分的主要信息。

總糖定標模型選取15個波長變量,僅為全波長的1.5%。其中7個集中在1 550~1 566 nm波段,另外8個中有3個位于1 848 nm處的波谷區域、2個位于1 208 nm 處的波峰區域、2個位于2 094~2 098 nm波段、1個位于1 010 nm處的波峰區域。對照圖1可知,所選波長全部位于信噪比較高、特征變化顯著的譜區,即第一個波峰(1 010 nm)和最后一個波峰(1 938 nm)范圍,相應的樣品光譜數據所含總糖信息足以滿足建模要求。

2.2.4 優化模型建立與預測結果分析 將前述各項優化成果綜合應用,以PLS法所建樣品水分和總糖含量的NIRS定標模型預測結果如表5所示。

由表5可知,得益于多項優化技術的綜合應用,樣品水分含量定標模型的預測殘差為-0.4%~0.5%,其絕對值均小于0.5%;總糖含量定標模型的預測殘差為-0.9%~1.0%,其絕對值均不大于1.0%。將預測值與參考值之比作為預測回收率,算得兩個模型的平均回收率分別為99.5%,99.9%,表明其可用于預測杏仁蛋白軟糖的相應成分含量。

表3 各種預處理方法的建模預測結果

表4 NIRS定標模型特征波長選擇結果

表5 優化的NIRS定標模型預測結果

分別將水分、總糖定標模型的預測值與參考值進行配對樣本t檢驗,在設置置信水平95%的情況下,結果分別為P=0.83>0.05、P=0.84>0.05,說明95%概率下兩組數據無顯著性差異,兩個模型可分別滿足杏仁蛋白軟糖水分、總糖含量快速準確測定的要求。

2.3 NIRS定標模型優化性能對比分析

從初始模型開始,到運用多項技術方法完成模型優化,各階段分別所建杏仁蛋白軟糖水分、總糖含量預測的NIRS定標模型性能對比如表6所示。

表6 NIRS定標模型優化性能對比

同時,由于建模波長變量大幅度縮減,大量非待測成分信息得以消除,使得優化模型的計算量顯著降低,其運行速度也隨之加快。在采用相同方法進行同類檢測時,參照試驗所選特征波長采集樣品光譜,可極大節省其工作量。

3 結論

由此可見,試驗所建杏仁蛋白軟糖水分、總糖含量的NIRS定標模型均有較高的精度和運算速度,其性能指標優于同類試驗模型,并達到國際谷物科技協會用于實際檢測的標準,適用于杏仁蛋白軟糖理化指標的快速檢測。但因時間所限,試驗采集樣品數相對較少,以及未嘗試非線性建模和更多波長選擇方法,下一步將對此進行研究。

猜你喜歡
定標總糖波長
近紅外定標法分析黏/錦/氨三組分纖維含量
一種波長間隔可調諧的四波長光纖激光器
我國為世界大豆精準選種“定標”
杯中“日出”
基于針孔陣列型的單次曝光雙波長疊層成像*
基于子空間正交的陣列干涉SAR系統相位中心位置定標方法
基于深度學習的在軌輻射定標方法研究
黃酒中總糖與還原糖含量測定方法比較
傳統客家黃酒的發酵條件優化
避雨栽培對川農泡椒1號品質的影響
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合