?

原料乳中蛋白質與脂肪的近紅外光譜快速定量研究

2015-10-17 03:25匡靜云
分析科學學報 2015年6期
關鍵詞:原料光譜脂肪

匡靜云, 管 驍*, 劉 靜

(1.上海理工大學醫療器械與食品學院,上海 200093;2.上海海事大學信息工程學院,上海 200135)

隨著生活水平不斷提高,人們對乳制品的需求量日益增加。而隨著我國乳業的迅速發展,乳制品的質量及安全也越來越受到重視。原料乳作為乳制品的基本原料,對乳制品的質量有重要影響。因此,原料乳的質量檢測是控制乳制品質量中最為重要的環節。蛋白質與脂肪是牛奶中最主要的營養成分,根據最新的國家標準,鮮奶中蛋白質與脂肪含量應分別高于2.9%和3.1%[1,2]。

近紅外光譜(NIRS)是近年來迅速發展起來的一項快速無損檢測技術,該技術所含信息極其豐富,但由于有機物分子在近紅外區的倍頻與合頻的吸收較弱、譜帶復雜、重疊嚴重,因此準確提取有效的光譜信息存在一定難度。隨著現代化學計量學方法的發展,為較好解決上述問題帶來轉機[3]?;瘜W計量學方法可提取復雜且譜峰重疊的光譜信息,結合適當的光譜預處理及建模方法,可以有效除去噪聲,解決光譜共線問題,得到準確可信的預測模型[4]。已有研究對原料乳中某單項指標建立了近紅外光譜模型,并得到較高的準確度,但由于原料乳受產地、環境以及人為操作等因素影響,其組成成分存在差異。目前,很少有研究對原料乳中不同成分指標同時建立預測模型,這是近紅外光譜技術在實際運用中的主要障礙之一[5 - 7]。

在近紅外光譜分析中,合理地運用化學計量學手段可以有效提高模型質量。目前運用最多的方法是偏最小二乘法(Partial Least Squares,PLS)以及神經網絡算法(Neural Networks)[8]。本文通過對采集的大量含有不同濃度蛋白質與脂肪的原料乳近紅外漫反射光譜進行馬氏距離(Mahalanobis Distance)剔除異常光譜,并結合主成分分析(Principal Component Analysis,PCA)提取得到有效特征變量,進一步利用反向傳播神經網絡(Back Propagation Neutral Network,BPNN)對蛋白質與脂肪的含量同時建模,結果表明該方法可以快速有效地預測不同原料乳樣品中的多種成分含量。

1 實驗部分

1.1 主要儀器

MPA型傅里葉變換漫反射近紅外光譜儀(德國,BRUKER公司);RH-SC-10精密恒溫水槽(南京潤鴻實驗設備有限公司);XHF-D高速分散器(寧波新芝生物科技股份有限公司)。

1.2 試樣制備

本實驗獲得的原料乳共50份,分別來自上海、江蘇等地的5個牧場,各樣本的蛋白質、脂肪含量測定均在本實驗室分別通過凱氏定氮法與蓋勃法測定。為獲取蛋白質與脂肪含量變化范圍更廣的樣本,通過對不同批次原料乳中摻入不同含量的去離子水,共獲得250組含有不同含量的蛋白與脂肪的原料乳樣本,其蛋白與脂肪的含量分別在0.525%~3.58%和0.688%~3.95%范圍內。

1.3 近紅外光譜采集與數據處理

實驗環境溫度穩定在25 ℃,環境相對濕度為45%。采集樣本光譜前,將樣本通過高速分散器均質60 s。近紅外光譜儀預熱10 min,設定分辨率為8 cm-1,掃描次數為64次,每次實驗均通過內部系統校檢,以保證獲得光譜可靠性,完成后用光纖探頭伸入樣本中下部,每組樣本采集光譜10次,取10次光譜作為原始光譜數據。原始光譜譜區范圍4 000~12 501 cm-1,共有2 203個數據點。數據采集軟件為OPUS 6.5,數據處理分析軟件為Matlab R2009b和SPSS17.0。

2 結果與討論

圖1 代表性原料乳近紅外光譜圖Fig.1 Near infrared spectrum of representative raw milk samples

2.1 光譜的篩選及預處理

部分原料乳的代表性近紅外光譜圖如圖1所示。由圖可知,原料乳在4 000~5 500 cm-1、6 000~7 600 cm-1、7 800~8 800 cm-1、9 200~10 500 cm-1等波數區間均有較強的特征吸收。

為防止各樣本的光譜采集存在偶然誤差,對每個樣本均進行了10次重復采集光譜,不可避免地出現了異常光譜。本實驗采用馬氏距離剔除異常光譜。它是一種有效計算兩個未知樣本集的相似度的方法。光譜的馬氏距離是指樣本光譜與平均光譜樣本集的距離,計算公式如式(1):

(1)

對光譜數據標準化處理后,每個樣本的馬氏距離大小由式(2)決定:

(2)

馬氏距離可用來衡量一個樣本對于整個標準樣品集的影響。在近紅外光譜分析中,hii表達了樣本i對模型影響的大小,如果hii太大,對模型穩定性不利,說明i樣本可能異常。

本實驗中每組樣本共采集光譜10次,將hii的閾值定為平均值的2倍,將超出范圍的數據剔除后,再取每組光譜數據的平均值,作為該樣本的最終圖譜。隨后對得到的光譜進行平滑處理,達到減低噪音對光譜影響的目的,最后將處理后的光譜作為進行下一步分析的最終圖譜[9]。

2.2 特征信號提取

建立定量分析模型時,光譜信息的主因子數關系到模型的穩定性,主因子數太小模型會出現擬合不充分,主因子數太多會出現過擬合的現象[10]。因此本實驗對不同光譜區間分別進行主成分分析,以主成分數與主成分累積比例為指標選擇最佳主成分。假若某光譜區間主成分信息難以提取,則說明該區間不適合分析,由此逐步縮小光譜區間范圍,篩選出最具代表性的主成分值,確定最佳預測光譜區間。最終本實驗共確定出7個主成分因子,來自4個區間。如表1所示,其中在12 501~10 511 cm-1范圍內,有多個蛋白與脂肪的吸收峰與反射峰,因此主成分提取率較高,而在6 600~7 000 cm-1范圍內水的吸收峰影響嚴重,提取主成分相對困難[11]。

2.3 反向傳播神經網絡

表1 主成分分析結果

人工神經網絡有多種模型,其中誤差反向傳播模型目前應用最為廣泛。該網絡結構包括輸入層、隱含層和輸出層,每層由若干個神經元(又稱節點)組成,每個神經元均包含一定信息量,各層次神經元之間由連接權重實現相互聯接,但層次內神經元之間無連接,神經元的信息經輸入輸出轉換函數實現信息輸出[12]。本實驗首先將250組樣本隨機劃分為訓練集以及測試集,其中訓練集225組,測試集25組,隨后分別采用不同的隱含層數、隱含層節點個數、中間函數以及建立模型,并采用檢驗集樣品來對模型的預測效果進行評定,評價參數選用預測相關系數R2、預測均方根差(RMSEP)。結果如表2所示。由表2中數據不難發現,在節點個數相同,傳遞函數固定的情況下,預測準確度與迭代次數成正比,而節點個數和中間函數與預測結果并無明顯規律。由表2發現,當節點個數為8,傳遞函數為trainrp,迭代參數700次時,模型預測的準確度最高,其中對蛋白質與脂肪的預測模型R2分別為0.9883、0.9878,預測均方根差(RMSEP)為1.83%、1.85%。這表明此時預測值與化學測定值之間相關性最大,說明了該模型同時對蛋白與脂肪的預測能力非常優秀。

表2 BP模型對蛋白質與脂肪預測結果

3 結論

本文利用近紅外光譜結合化學計量學方法對原料乳中蛋白質與脂肪進行定量分析,經過光譜異常值剔除、平滑預處理以及選擇最有效的光譜區間和最適合的主成分因子數,通過反向傳播神經網絡建立模型,所得模型對蛋白質與脂肪預測相關系數R2分別為0.9883、0.9878,預測均方根差(RMSEP)為1.83%、1.85%,表明該方法可以對原料乳中蛋白質與脂肪含量進行準確的預測。下一步工作將圍繞獲取更多樣本光譜作為建模數據,以進一步提高模型的預測能力以及穩定性,使該方法可實際運用于對原料乳的質量在線檢測。

猜你喜歡
原料光譜脂肪
減肥后脂肪去哪兒了
基于三維Saab變換的高光譜圖像壓縮方法
脂肪竟有“好壞”之分
脂肪的前世今生
水磨石生產原料的制備(三)
水磨石生產原料的制備(二)
反派脂肪要逆襲
嚴把原料采購關,才是對養殖負責
星載近紅外高光譜CO2遙感進展
以鐵泥為原料合成Fe2O3 并制備LiFePO4/C
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合