?

熒光光譜結合支持向量機測定食用色素純度

2016-06-05 14:58陳國慶朱焯煒徐瑞煜
光譜學與光譜分析 2016年12期
關鍵詞:胭脂紅色素食用

張 毅、陳國慶*、朱 純、朱焯煒、徐瑞煜

1. 江南大學理學院、江蘇 無錫 214122 2. 江蘇省輕工光電工程技術研究中心、江蘇 無錫 214000

熒光光譜結合支持向量機測定食用色素純度

張 毅1,2、陳國慶1,2*、朱 純1,2、朱焯煒1,2、徐瑞煜1,2

1. 江南大學理學院、江蘇 無錫 214122 2. 江蘇省輕工光電工程技術研究中心、江蘇 無錫 214000

采用一種由原點矩法改造所得的特征壓縮算法對熒光光譜數據進行預處理、將處理后的數據與加權最小二乘支持向量機(WLS-SVM)算法結合、建立魯棒回歸模型、用以預測實際食用色素粉末的純度。以亮藍和胭脂紅這2種色素為例論述該方法對實際食用色素粉末純度的預測效果。首先、利用FLS920熒光光譜儀測量獲得兩種色素的標準樣本和實際樣本在最佳激發波長下的熒光發射光譜數據、利用由原點矩法改造所得的特征壓縮算法對獲取的熒光光譜數據進行壓縮和變換、一方面縮短了算法的運算時間、另一方面也提高了模型的預測精度。將預處理后的熒光光譜數據輸入加權最小二乘支持向量機中建立濃度預測模型、該模型對亮藍、胭脂紅實際樣本溶液給出的預測光譜與它們的實測光譜吻合程度好、半高峰寬區間內的平均決定系數分別為0.662和0.931。所有亮藍、胭脂紅溶液的預測濃度和標稱濃度之間具有良好的線性關系、相關系數分別為0.997和0.992。由此通過多項式擬合得到的亮藍、胭脂紅粉末的預測純度分別為61.0%和72.3%。

光譜學; 合成食用色素; 純度軟測量; 加權最小二乘支持向量機

引 言

食品安全問題逐漸成為全社會關注的焦點。目前我國食品中添加食用色素的行為非常普遍。食用色素又稱著色劑、是以調節食品色澤為主要目的的一類食品添加劑、一直被廣泛的應用于食品工業及醫藥和化妝品生產。食用色素分合成色素和天然色素兩種、其中、合成食用色素因色澤鮮艷、著色力強、價格低廉等特點而被廣泛使用[1]。但是許多合成食用色素有一定毒性、如胭脂紅、誘惑紅等色素超標攝入、會有致畸、致癌的可能性[2]。我國對合成食用色素使用有嚴格的用量和用法規定、但仍有不少商家為了贏利、不管消費者的健康、無視有關法規濫加濫用。即使某一種食品中色素含量是合格的、但若消費者在生活中大量食用多種含有同樣色素的食品、仍然有可能導致攝入的色素總量超標、給健康帶來危害。因此在對合成食用色素使用的監管中、其含量的測定就顯得尤為重要。

目前檢測食用色素含量的方法主要有:高效液相色譜法[3-6]、毛細管電泳法[7]、示波極譜法[8]等、這些方法都有各自的優勢、但也存在操作繁瑣、檢測耗時、檢測成本高、結果重現性差等缺點。因此、有必要尋找一種可靠、便捷的測定合成色素含量的方法、給食品行業中合成食用色素的監管提供參考。

熒光光譜技術由于檢測成本低、靈敏度高、對樣本無損、得到廣大學者的認可[9-10]。又因為所有合成色素均為熒光物質、它們在短波長光激發下,均能產生強的或較強的熒光[11]、所以本文利用該技術對合成色素進行定量分析。但光譜儀獲取的熒光光譜數據的數據量往往較大、這不僅會增加回歸算法的運算時間而且會影響回歸算法的預測精度。因此本文利用由原點矩法改進所得的特征壓縮算法先對原始光譜數據進行降維處理。同時考慮到熒光光譜儀激發光光強存在正常的無序抖動現象、導致被測樣品的熒光強度不夠穩定、可能會出現離群點。相關文獻[12-15]的研究結果表明離群點對預測模型的精度有很大影響、特別是小樣本建模問題、這種影響尤為突出。因此本文采用加權最小二乘支持向量機(weighted least squares support vector machine、WLS-SVM)[16]算法對降維后的數據進行回歸建模、該算法可以增強預測模型的魯棒性、其在熒光光譜檢測領域的應用鮮見報道。用上述方法對某糖果廠實際生產中使用的2種合成食用色素粉末的純度進行預測、取得了較為滿意的預測效果。

1 算法原理

1.1 基于WLS-SVM的回歸算法[16]

WLS-SVM是由LS-SVM發展而來的。對于一個訓練數據集{(x1,y1),(x2,y2),…,(xN,yN)}、其中xi∈Rn,yi∈R、基于LS-SVM的回歸算法[17-19]主要是通過非線性變換將訓練樣本集映射到高維特征空間、然后在高維空間進行線性回歸、最后映射回原空間完成輸入空間的回歸估計、其線性回歸函數可表示為

g(x)=wTφ(x)+b

(1)

式中φ(x)為核空間映射函數、w為權向量、b為偏差。

在基于LS-SVM的回歸算法中,將回歸問題轉化為二次優化問題

使得

yi=wTφ(xi)+b+ei,i=1,2,…,N

(2)

式中J(w,e)為目標函數、γ為懲罰系數、其值的大小決定了對誤差的懲罰力度、ei為松弛變量。應用Lagrange法可以將式(2)的二次優化問題化簡為求解線性方程組問題、最終可得基于LS-SVM的回歸函數為

(3)

其中α=[α1; …;αN]為Lagrange乘子向量、k(·,·)為滿足Mercer條件的核函數。

但對于樣本中離群點、基于LS-SVM的回歸算法所采用的誤差平方和評價函數會導致不穩健的預測結果。針對此問題、在基于LS-SVM的回歸算法的基礎上、用權值因子vi對每個樣本的松弛變量ei進行加權就能得到穩健的預測結果、這就是基于WLS-SVM的回歸算法。加權處理后、優化問題變為

使得

(4)

(5)

表1 WLS-SVM算法中常用的權值因子函數

1.2 a/b-熒光期望法

本文對原點矩法(屬于三維熒光光譜特征參量法[21])進行改造得到了一種新的特征壓縮方法、將其命名為:a/b-熒光期望法。該方法對某一樣本數為N的樣本集的二維熒光光譜數據集(本文所用的二維熒光光譜數據為最佳激發波長下的發射光譜)作如下處理:

(2)挑選出第i個樣本的發射光譜中熒光強度大于等于a/b峰高(a/b為0~1之間的分數)的所有數據點(每個數據點都含有發射波長em和該發射波長下的熒光強度Intensity(em)這兩個信息)、構成數集Di,a/b; 將區間[Di,a/b中最小的em、Di,a/b中最大的em]稱為第i個樣本的a/b-標尺、記作Ri,a/b、i=1,2,…,N。

(2)選取N個樣本的a/b-標尺的交集作為整個樣本集的a/b-標尺、記作Ra/b。

1.3 決定系數

在回歸分析中、決定系數是判斷模型擬合效果的重要指標。其計算公式為

(6)

2 實驗與結果分析

2.1 儀器與試樣

實驗儀器為英國EdinburghFLS920熒光光譜儀、梅特勒AB-135S電子天平、Thermo移液槍。

試樣為符合國家計量標準的亮藍溶液標準物質(GBW(E)100162)、胭脂紅溶液標準物質(GBW(E)100161)(濃度均為1mg·mL-1); 某糖果廠實際生產中使用的合成食用色素粉末:亮藍、胭脂紅。

2.2 方法

以超純水作為溶劑將亮藍標準溶液和胭脂紅標準溶液按表2所示的濃度各配制出31個樣本、分別記作亮藍標準樣本集和胭脂紅標準樣本集。

表2 標準樣本的濃度

假設合成食用色素粉末的純度為100%、用電子天平分別稱取2種色素粉末適量、記錄下數值。用超純水配制出標稱濃度為100 μg·mL-1的亮藍實際溶液和胭脂紅實際溶液、將它們按表3所示的標稱濃度各配制出10個樣本、分別記作亮藍實際樣本集和胭脂紅實際樣本集。

表3 實際樣本的濃度

從4個樣本集中各取一個樣本、分別測量它們的三維熒光光譜、2種色素標準樣本的熒光光譜特征參數見表4。為了提高光譜數據采集和光譜數據分析處理的效率、按照表5所示的熒光光譜儀測量參數對2種色素標準樣本和實際樣本進行二維熒光光譜的測量、每個樣本測量三次取平均值、4個樣本集的二維熒光光譜如圖1所示。

表4 熒光光譜的特征參數

表5 熒光光譜儀測量參數

2.3 基于WLS-SVM算法對合成食用色素純度的預測

2.3.1 訓練樣本集的選取

為了訓練用于預測各實際樣本濃度的回歸模型、將標準樣本集作為訓練樣本集。并構造數據集{(x1,y1),(x2,y2),…,(x31,y31)}、其中xi為標準樣本集中第i樣本的二維熒光光譜數據、yi為第i標準樣本的濃度。

2.3.2 訓練樣本集數據的預處理

圖1 四個樣本集的二維熒光光譜圖

2.3.3 基于WLS-SVM的魯棒回歸模型的建立

文中基于WLS-SVM的回歸模型采用的核函數是徑向基(RBF)核函數; 權值函數選用Hampel、該權值函數的參數設置如下:c1=2.5和c2=3; 采用k-fold交叉驗證法確定模型系數、k設為3。同時將訓練數據集輸入回歸模型對其進行訓練、多次迭代后得到魯棒回歸模型。

2.3.4 對合成食用色素粉末純度的預測

沿用亮藍(胭脂紅)標準樣本集的3/4-標尺計算出10個亮藍(胭脂紅)實際樣本的3/4-熒光期望、構成預測數據集輸入魯棒回歸模型、對10個亮藍(胭脂紅)實際樣本溶液的濃度預測結果如表6所示。

表6 實際樣本的預測濃度

圖2 使用本文方法的預測效果(亮藍實際樣本)

圖3 使用本文方法的預測效果(脂胭紅實際樣本)

將濃度與實際樣本預測濃度相同的標準樣本的二維熒光光譜稱為該實際樣本的預測光譜。由于預測濃度與標準樣本集中31個濃度接近的實際樣本個數有限、只能從亮藍(胭脂紅)實際樣本集中選擇個別樣本、比較它們的實測光譜和預測光譜、兩種光譜的比較效果如圖2(圖3)所示。

由上述預測效果圖可知、實測譜線和預測譜線吻合程度較好。引入曲線吻合程度的評價參數對譜線在3/4-標尺和1/2-標尺(即半高峰寬區間)上的吻合程度進行評價、在3/4-標尺上的評價參數表征了峰值點附近譜線的吻合程度、可以反映局部細節的預測效果; 在1/2-標尺上的評價參數表征了峰腰以上譜線的吻合程度、可以反映宏觀整體的預測效果。必須同時考察這兩個標尺上的評價參數才能客觀、真實地反映譜線的吻合程度。評價結果見表7。表中亮藍(胭脂紅)實際樣本在3/4-標尺、1/2-標尺上的平均決定系數分別為:0.530、0.662(0.948、0.931)、而且由表7中的平均相對誤差穩定、由此說明由本文的方法給出的預測光譜和實測光譜吻合程度較好、即所建的魯棒回歸模型的預測結果可靠。

表7 實際光譜和預測光譜在3/4-標尺和1/2-標尺上的吻合程度的評價結果

對所有的亮藍(胭脂紅)實際樣本溶液的預測濃度和標稱濃度進行一次多項式擬合。選用的擬合函數為:F(x)=p1x+p2、由于當假定濃度為0時、真實濃度必為0、所以該真實濃度和標稱濃度之間的函數關系必經過原點、所以在擬合時將p2設為0。擬合結果為亮藍:F(x)=p1x+p2、p1=0.610 1、p2=0、p1的95%置信區間(0.595 4,0.624 8); 胭脂紅:F(x)=p1x+p2、p1=0.722 5、p2=0、p1的95%置信區間(0.695 5,0.749 5)。圖4為擬合效果、擬合優度見表8。

圖4 擬合結果

由表8可知、亮藍、胭脂紅實際樣本溶液的預測濃度和標稱濃度的相關系數分別為0.997和0.992、說明兩種色素的預測濃度和標稱濃度之間具有良好的線性關系、由此說明本文的方法可以有效的預測合成食用色素粉末的純度。用該方法對亮藍、胭脂紅合成食用色素粉末的預測純度分別為:61.0%和72.3%。

表8 擬合優度

3 結 論

為了減小樣本采集過程中可能引入的離群點對回歸模型預測精度的影響、本文采用了WLS-SVM算法來構建回歸模型。為了進一步的提高回歸模型的預測精度和處理數據的效率、本文采用了一種由原點矩法改造所得的特征壓縮方法—a/b-熒光期望法。利用熒光光譜數據結合a/b-熒光期望法、WLS-SVM算法所建的魯棒回歸模型對亮藍、胭脂紅實際樣本溶液的濃度預測準確、預測譜線和實測譜線的吻合程度好、半高峰寬區間內的平均決定系數分別為0.662和0.931。而且所有的亮藍、胭脂紅實際樣本的預測濃度和標稱濃度之間具有良好的線性擬關系、相關系數分別為0.997、0.992。由此說明該方法可對某糖果廠實際生產中所使用的亮藍、胭脂紅合成食用色素粉末的純度給出可靠的預測、預測純度分別為61.0%和72.3%。該方法操作簡單、成本低、測量周期短、測量結果可靠??蓪⒃摲椒☉糜趯κ称分泻铣墒秤蒙氐暮繙y定、為食品行業中合成食用色素的監管提供參考。

[1] CHEN Guo-qing(陳國慶). Jiangnan University Doctoral Dissertation(江南大學博士論文),2010:23.

[2] LI Run,CHEN Guo-qing,et al(李 潤、陳國慶、等). Spectroscopy and Spectral Analysis(光譜學與光譜分析),2014、34(1):111.

[3] Li W J,Zhou X,Tong S S,et al. Talanta,2013、(105):386.

[4] NING Shang-yong、GAO-Jie,et al(寧尚勇,高 潔、等). Chinese Journal of Analysis Laboratory(分析試驗室),2008、(4):72.

[5] ZHANG Yu-lin,MA Jing-yuan,et al(張予林,馬靜遠、等). Journal of Northwest A & F University·Natural Science Edition(西北農林科技大學學報·自然科學版),2011、(1):186.

[6] ZHANG Wan,WANG Tan,et al(張 婉,王 覃、等). Food Science(食品科學),2011、(4):177.

[7] Del Giovine L,Bocca A P. Food Control,2003、14(3):131.

[8] WANG Yu-tian,XU Jing,et al(王玉田,徐 婧、等). Chinese Journal of Lasers(中國激光),2014、41(12): 1215002.

[9] LIU Jing,LIU Wen-qing,et al(劉 晶,劉文清、等). Acta Optica Sinica(光學學報),2013、33(9): 0930001.

[10] SONG Xin,JI Shuang-li,et al(宋 新,紀雙利,等). Chinese Journal of Food Hygiene(中國食品衛生雜志),2009、(5):422.

[11] CHEN Guo-qing(陳國慶). Jiangnan University Doctoral Dissertation(江南大學博士論文),2010: 32.

[12] Pell R J. Chemometrics and Intelligent Laboratory Systems,2000、(52):87.

[13] Daszykowski M,Kaczmarek K,Vander Heyden Y,et al. Chemometrics and Intelligent Laboratory Systems,2007、85(2):203.

[14] Mφller S F,von Frese J,Bro R. Journal of Chemometrics,2005、19(10):549.

[15] Kruger U,Zhou Y,Wang X,et al. Journal of Chemometrics,2008、22(1):1.

[16] Suykens J A K,Van Gestel T,De Brabanter J,et al. Least Squares Support Vector Machines. Singapore:World Scientific,2002. 149.

[17] Suykens J A K,De Brabanter J,Lukas L,et al. Neurocomputing,2002、48(1):85.

[18] Suykens J A K,Vandewalle J. Neural Processing Letters,1999、9(3):293.

[19] Shim J,Hwang C,Nau S. Advances in Natural Computation,2006. 157.

[20] De Brabanter K,Karsmakers P,Ojeda F,et al. LS-SVMlab Toolbox User’s Guide. ESAT-SISTA Technical Report 10-146,2010: 33.

[21] SHANG Li-ping,YANG Ren-jie(尚麗平,楊仁杰). Site Fluorescence Spectrum Technology and Application(現場熒光光譜技術及其應用). Beijing:Science Press(北京:科學出版社),2009、1(5):217.

*Corresponding author

Soft Measurement of the Purity of the Synthetic Edible Pigment Powder Using Fluorescence Spectroscopy Combined with SVM

ZHANG Yi1,2、CHEN Guo-qing1,2*,ZHU Chun1,2、ZHU Zhuo-wei1,2、XU Rui-yu1,2

1. School of Science、Jiangnan University、Wuxi 214122、China 2. Jiangsu Provincial Research Center of Light Industrial Optoelectronic Engineering and Technology、Wuxi 214000、China

The feature compression algorithm which was reformed from the original Moment method was used for the pre-processing of the fluorescence spectral data,then combined the data and the Weighted Least Squares Support Vector Machine(WLS-SVM) algorithm to establish a robust regression model,which is used for forecasting the purity of edible pigment powder. In this paper,brilliant blue and ponceau 4R served as an example to discuss the method of forecasting effect of edible pigment powder purity. The emission fluorescence spectra of two edible pigment at the optimal excitation wavelength were measured by FLS920 fluorescence spectrometer. The compression and transformation of the fluorescence spectral data was acquired by the feature compression algorithm reformed from the Original Moment method. On the one hand the feature compression algorithm shortened the operation time,on the other hand it improved the prediction accuracy of the model. Then,the concentration prediction model was established after inputting the fluorescence spectral data pre-processed into the Weighted Least Squares Support Vector Machine. The model gave anastomotic predicted spectral data with the actual experiments of the brilliant blue and ponceau 4R,and the average coefficient of determination in the half peak width was 0.700 and 0.930 respectively. There was a good linear relationship between the predicted and the nominal concentration of the brilliant blue and ponceau 4R,and the correlation coefficients were 0.997 and 0.992 respectively. It can be concluded that,the predicted concentration of the brilliant blue and ponceau 4R powder were got the results of 61.0% and 72.3% respectively.

Spectroscopy; Synthetic edible pigment; Soft measurement of purity; Weighted least squares support vector machine

Sep. 3,2015; accepted Jan. 25,2016)

2015-09-03、

2016-01-25

國家自然科學基金項目(61178032、61378037)、中央高?;究蒲袠I務費專項資金項目(JUSRP51517)資助

張 毅、1990年生、江南大學理學院碩士研究生 e-mail:zy137927643@126.com *通訊聯系人 e-mail:cgq2098@163.com

O436

A

10.3964/j.issn.1000-0593(2016)12-3978-08

猜你喜歡
胭脂紅色素食用
色素熱舞
“聽話”的色素
冷凍食品,如何選購和食用?
胭脂紅
豆制品食用指南
甜油的生產及色素控制
胭脂紅示蹤劑在評價壓裂液返排中的應用
天然色素及紅色素的研究進展
寂寞胭脂紅
關于一道江蘇學業水平測試題的討論
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合