?

基于SVM的大豆油脂色澤近紅外光譜分析

2015-12-20 01:39王立琦李貴濱葛慧芳于殿宇
中國糧油學報 2015年8期
關鍵詞:色澤油脂光譜

王立琦 崔 月 張 歡 劉 飛 李貴濱 葛慧芳 于殿宇

(哈爾濱商業大學計算機與信息工程學院1,哈爾濱 150028)(東北農業大學食品學院2,哈爾濱 150030)

基于SVM的大豆油脂色澤近紅外光譜分析

王立琦1崔 月1張 歡2劉 飛2李貴濱1葛慧芳1于殿宇2

(哈爾濱商業大學計算機與信息工程學院1,哈爾濱 150028)(東北農業大學食品學院2,哈爾濱 150030)

針對羅維朋比色計在油脂色澤測定中存在的問題,提出了一種基于支持向量機(SVM)的大豆油脂色澤近紅外光譜分析方法。首先采用C-SVM對3種不同羅維朋黃值的大豆油脂進行模式識別,設計出適合油脂色澤近紅外光譜識別的SVM分類器,識別正確率達到100%。然后利用ε-SVR對不同羅維朋黃值的大豆油脂近紅外光譜數據與羅維朋紅值進行回歸,分別建立了不同級別大豆油脂色澤的SVM校正模型,預測誤差均在0.2個羅維朋單位以內。研究表明,利用近紅外光譜技術實現油脂色澤的定性定量分析是可行的,為進一步實現油脂色澤在線監測和調控提供參考。

近紅外光譜 油脂色澤 支持向量機

色澤是植物油脂的重要質量指標之一,油脂色澤的深淺,主要取決于油料所含脂溶性色素的種類及含量、油料籽品質的好壞、加工方法、精煉程度和油脂貯藏過程中的變化等。一般來說,油脂精煉程度越高,顏色越淡,而油料品質劣變和油脂酸敗會導致油色變深。所以,測定油脂色澤對改善油脂加工工藝條件和評定油脂品質具有重要意義。

常用的油脂色澤檢測方法有目視法、重鉻酸鉀法和羅維朋比色計法等。我國國家標準規定用羅維朋比色計法測定油脂色澤(GB/T 22460—2008)[1]。用羅維朋標準色片與油樣的色澤進行比較,色澤深淺用羅維朋黃值和紅值表示,此法也是目前國際上通行的檢驗方法。但是羅維朋比色計只能在實驗室手動操作,不能實現連續化和自動化,難以滿足現代社會對食用油質量簡便、快速、現場化的測定要求[2]。20世紀90年代,日本、加拿大等國相繼開展了油脂色澤自動測定儀的研究工作[3-5],但都因與目視羅維朋比色計之間未能形成良好的相關性而沒有在實際中獲得應用。Sun等[6]、陳彩虹等[7]采用計算機圖像處理方法測定油脂色澤。張敏等[8]設計了基于DSP和數字圖像處理技術的油脂質量快速檢測儀。采用計算機圖像處理技術避免了人為的主觀誤差,多次測定同一油脂色澤的重復性較好,但RGB顏色空間是設備相關的,且羅維朋標準色片與RGB顏色體系的回歸還是一個值得深入探討的問題。

雖然近年來關于近紅外光譜分析在顏色識別中的應用已有少量研究成果[9-12],但到目前為止還鮮有將其應用到油脂色澤檢測的研究報道,因此本研究以大豆油為檢測對象,對油脂色澤近紅外光譜分析的可行性進行深入研究,以期尋找到一種快速簡便測定油脂色澤的新方法,進而實現油脂脫色工段的在線監測和調控。

1 材料與方法

1.1 油脂樣本采集及色澤測定

表1為從大豆油質量指標(GB 1535—2003)中截取的大豆油脂色澤標準。

表1 大豆油脂色澤標準

研究所用油脂樣本均采集自油脂加工企業,按國際通行的羅維朋比色計法測定油脂色澤,篩選出不同級別大豆油脂樣本120個,其色澤統計值如表2所示。

表2 大豆油脂色澤樣品的羅維朋值

1.2 樣本光譜采集及預處理

利用美國Thermo Nicolet公司Antaris傅里葉變換近紅外光譜儀對大豆油脂樣本進行透射光譜掃描,波長范圍4 000~12 000 cm-1,分辨率 4 cm-1,樣品池采用直徑為8 mm透明玻璃管,以空氣作參比,掃描次數64次,為減小光譜數據的測量誤差,每個樣本測量3次,再以3次的平均值作為最終的光譜值,其譜圖如圖1所示。

圖1 油脂色澤樣品的近紅外光譜圖

根據近紅外光譜吸收的原理,被測樣品的顏色一定會對光譜產生影響。樣品顏色不同時,無論是在含有紅外活性分子的波段還是在不包含紅外活性分子的波段,光的透過率都會發生變化,這就會導致所測到的光譜整體縱向偏移,顏色不同,偏移量不同。理論上,圖1中從4 000~12 000 cm-1中任何一段的吸光度都會隨著油脂色澤的變化產生不同偏移,利用任何一段建立色澤近紅外光譜判別函數都可行,但在4 000~9 000 cm-1波段分布著油脂其他含氫基團的倍頻與合頻吸收,難免對色澤分析產生干擾,而9 000~12 000 cm-1是與紅色最接近的短波近紅外波段,其他基團的吸收非常微弱,幾乎只有顏色造成的譜線偏移,因此,從中截取9 000~10 500 cm-1波段進行建模,以達到對不同級別油脂色澤的正確識別。為了避免所做的譜圖預處理削弱顏色特征,本研究只采用平滑處理,利用Savitzky-Golay平滑處理后的光譜如圖2所示。

1.3 建模方法及軟件工具

圖2 Savitzky-Golay平滑光譜

依據表1的國標,大豆油共分4個等級,一、二級大豆油為微黃或無色,三、四級大豆油為黃色或棕黃色。一級油固定黃20,紅<2.0;二級油固定黃35,紅<4.0;三級油固定黃70,紅<4.0;四級油固定黃70,紅<6.0。只有先識別出到底屬于哪一類“黃”,才能定量分析它的羅維朋紅值。因此大豆油色澤的近紅外光譜分析既涉及定性分析又包括定量分析,定性分析是定量分析的前提,只有先實現油脂色澤的等級分類,定量分析才有意義。

由于支持向量機(Support Vector Machines,SVM)既可用于模式識別又可用于定量校正[13],而且是專門針對小樣本建立的統計學習方法,在涉及到小樣本數、非線性和高維數據空間的模式識別問題上表現出了許多傳統模式識別算法所不具備的優勢,非常適合大豆油脂色澤檢測問題,因此采用SVM對大豆油脂色澤近紅外光譜分析進行深入研究。

這里以羅維朋黃值作為類別,所以是一個三分類問題。但SVM本質上是二值分類器,因此本課題首先把一級油和二級油作為一類,三級油和四級油作為一類進行二值分類;分開以后,三級油和四級油不必再細分,因為它們都是“黃70”,到底屬于三級油還是四級油要靠對羅維朋紅值的定量回歸結果判定。而一級油和二級油必須再進一步細分,因為它們的羅維朋黃值不同,分開以后再分別建立不同的定量校正模型對其羅維朋紅值進行測定。

本研究利用在Matlab中調用LIBSVM軟件包[14]實現SVM的訓練和預測過程,定性分析采用CSVM,定量分析采用ε-SVR。

2 結果與討論

2.1 基于C-SVM的油脂色澤定性分析

2.1.1 深色油和淺色油分類

首先將32個一級油和32個二級油合成一類稱為淺色油,共64個樣本,從中抽出20個做驗證集,剩下44個作為訓練集;將26個三級油和30個四級油合成一類稱為深色油,共56個樣本,從中抽出16個做驗證集,剩下40個作為訓練集;兩類合在一起共84個訓練集樣本,36個驗證集樣本。

對于特定的問題,SVM的預測能力與所采用的核函數有很大關系,不同的核函數形成不同的算法。關于核函數的選擇,目前尚無比較成熟的方法,許多文獻認為在分類問題中,徑向基是首選的核函數。為了判斷到底哪種核函數適合油脂色澤分類,固定懲罰因子C為默認值1,調整γ值到最佳,表3列出了不同核函數對分類結果的影響。

表3 深色油和淺色油的分類結果

從表3可以看出,分類效果最差的是線性核函數,識別率為0,說明該問題屬于線性不可分;其次是Sigmoid和多項式核函數,雖然訓練集識別率都達到90%以上,但驗證集識別率相對較低;最適合油脂色澤分類的還是徑向基核函數,訓練集識別率和驗證集識別率都達到100%,因此決定選用徑向基核函數對2種淺色油脂進一步分類。

2.1.2 一級油和二級油分類

在32個一級油樣品中抽取10個作為驗證集,剩下22個作為訓練集,同樣在32個二級油樣品中也抽取10個作為驗證集,剩下22個作為訓練集,2類合在一起共44個訓練集樣本,20個驗證集樣本。采用徑向基核函數,固定懲罰因子C為默認值1,調整建立不同的SVM分類器以獲得最佳泛化能力,分類結果見表4。

表4 一級油和二級油的分類結果

可以看出,當γ值大于20時,訓練集識別率和驗證集識別率一直都保持100%,根據在所建模型對外部預測率盡可能高的前提條件,以支持向量數最少為原則,確定γ取25,支持向量數為9時的SVM為最佳模型。

2.2 基于ε-SVR的油脂色澤定量分析

在實現了油脂色澤的定性模式識別,即按羅維朋黃值不同實現了油脂色澤分類后,接下來的問題就是確定羅維朋紅值,即對不同黃值的油脂分別建立近紅外光譜數據與羅維朋紅值回歸校正模型。特別是對于深色油脂,黃值都是70,需要根據紅值大小確定到底是屬于三級油還是四級油,這時定量分析意義更大。

2.2.1 三級油和四級油色澤定量分析

在ε-SVR回歸模型中,合理選擇設計參數的值,對于保證支持向量機的性能至關重要。參數ε表明了對誤差的期望,ε越小,回歸函數估計的精度越高,但支持向量數越多;ε越大,支持向量數越少,但回歸精度越低。根據油脂色澤實際檢測精度要求,ε取默認值為0.1即可;通常認為,懲罰因子C的取值過小,易使訓練誤差變大,取值過大,又會使系統的泛化能力變差;對于核參數γ,如果取值過小,則訓練誤差小而測試誤差大,為過學習現象;如果取值過大,則訓練誤差和測試誤差都很大,為欠學習現象。目前尚無較好的方法確定C和γ,通常都是采用大范圍搜索試驗尋找模型最優解。

在56個深色油樣品中,選擇44個樣品做為訓練集,12個樣品做為驗證集。以徑向基核函數為例,探討懲罰參數C和核參數γ選擇。根據訓練集決定系數R2、校正誤差均方根RMSEC,預測集決定系數R2及預測誤差均方根RMSEP的數值來確定最佳參數。由于C與γ組合數目眾多,無法以表格形式給出,故采用圖3~圖4的三維立體圖來顯示變化趨勢。

圖3 lgC、lgγ和RMSEC關系圖

圖4 lgC、lgγ和RMSEP關系圖

圖3顯示了訓練集的校正誤差均方根RMSEC與C和γ之間的關系,可以清晰地看出,隨著C的增大RMSEC減小,而γ的變化對RMSEC沒有影響,從而可以得出,C變化影響的主要是SVM的自預測能力,在固定γ的情況下,C越大,模型的自預測能力越高,但是它與SVM的實際預測能力之間的關系則不確定。圖4顯示了預測誤差均方根RMSEP與C和γ之間的關系,然而從圖4中無法看出三者之間有比較明顯的變化規律,但是對每一個不同的C值,都有一個使RMSEP達到最小的γ值。經過篩選最后確定,當C取1 000,γ取0.000 005時,模型的預測能力最好,校正集和預測集決定系數分別為0.992 5和0.990 1,RMSEC和 RMSEP分別為 0.078 5和0.094 3。驗證集樣本的預測結果見表5,真實值與預測值之間的誤差均在0.2個羅維朋單位以內,且根據紅值的范圍確定了油脂等級。

表5 “黃70”樣品的羅維朋紅值預測值與真實值

2.2.2 一級油色澤定量分析

在32個一級油樣品中,選擇25個樣品做為訓練集,7個樣品做為驗證集。方法同上,采用徑向基核函數,經過篩選最終確定當C取1 000,γ取0.1時,模型的預測能力最佳,校正集和預測集決定系數分別為0.985 2和0.978 9,RMSEC和RMSEP分別為0.061 6和0.065 3。驗證集樣本的預測結果見表6,真實值與預測值之間的誤差均在0.2個羅維朋單位以內。

表6 “黃20”樣品的羅維朋紅值預測值與真實值

2.2.3 二級油色澤定量分析

在32個二級油樣品中,同樣選擇25個樣品做為訓練集,7個樣品做為驗證集。方法同上,采用徑向基核函數,經過篩選最終確定當 C取1 000,γ取0.005時,模型的預測能力最佳,校正集和預測集決定系數分別為0.982 5和0.974 7,RMSEC和RMSEP分別為0.058 7和0.076 9。驗證集樣本的預測結果見表7,真實值與預測值之間的誤差均在0.2個羅維朋單位以內。

表7 “黃35”的羅維朋紅值預測值與真實值

3 結論

本研究首先采用C-SVM對3種不同羅維朋黃值的油脂進行分類,設計出不同級別油脂的SVM分類器,識別正確率達到100%。在此基礎上,對不同黃值的油脂利用ε-SVR對近紅外光譜數據與羅維朋紅值進行了回歸,建立了不同級別油脂的SVM回歸校正模型,預測誤差均在0.2個羅維朋單位以內。研究表明,利用近紅外光譜分析技術實現油脂色澤快速檢測是完全可行的,該方法可有效避免人為主觀誤差,重復性好,精確度高,有利于實現油脂色澤的在線監測和調控。

[1]GB/T 22460—2008,動植物油脂 羅維朋色澤的測定[S]

[2]馬利.油脂脫色工程的自動測控技術研究[D].鄭州:河南工業大學,2007:1-5

[3]Wan P J,Pakarinen D R.Comparison of visual and automated colorimeter for refined and bleached cottonseed oils[J].Journal of the American Oil Chemists’ Society,1995,75:455

[4]Wan P J,Pakarinen D R,Hron R J.Refining testmethod for the determination of cottonseed oil color[J].Journal of the American Oil Chemists’Society,1996,73:815

[5]Wan P J,Hurley TW,Guy JD,et al.Final report-1996 international collaborative study ofoil color-automatedmethod versus visualmeasurements[R].Champaign:American Oil Chemists’Society Press,1996

[6]Sun Fengxia,Zhou Zhanming.Determination of oil color by image analysis[J].Journal of the American Oil Chemists'Society,2001,78(7):749-752

[7]陳彩虹,唐懷建,羅松明.油脂顏色測定的研究[J].河南工業大學學報,2005,26(5):75-77

[8]張敏,祁金剛,劉保垣,等.基于TMS320VC6412的玉米油脂質量快速檢測儀器的設計[J].長春師范學院學報,2006,25(1):37-39

[9]管力明,胡更生,林劍.近紅外光譜在印刷品顏色檢測中的應用[J].中南大學學報,2009(6):1655-1659

[10]劉勛.NIRS結合計算機圖像處理技術分析油菜籽粒色及數學模型的創建[D].西南大學,2010(5):20-21

[11]文建萍,陳興苗,孫旭東,等.可見近紅外漫反射光譜法測定贛南臍橙的表面色澤[J].安徽農業科學,2007,35(36):11805-11806

[12]梁家杰,潘濤,陳星旦,等.白砂糖色值近紅外光譜分析的波段選擇[J].紅外技術,2009,31(2):90-94

[13]Belousov A l,Verzakov S A,Von Frese J.Applicational aspects of support vector machines[J].Journal of Chemometrics,2002,16:482-489

[14]Chih-jen Lin.LIBSVM:A library for support vectormachines[EB/OL].www.csie.ntu.edu.tw/-cjlin/libsv.

Near-Infrared Spectroscopy Analysis of Soybean Oil Color Based on SVM

Wang Liqi1Cui Yue1Zhang Huan2Liu Fei2Li Guibin1Ge Huifang1Yu Dianyu2
(School of Computer and Information Engineering,Harbin University of Commerce1,Haerbin 150028)(School of Food,Northeast Agricultural University2,Haerbin 150030)

The paper has been aimed at the problems of Lovibond tintometer in determination of oil color.The experiment has presented a near-infrared spectrum analysismethod for soybean oil color detection based on SVM.First,three categories of soybean oil with different Lovibond yellow values were recognized by C-SVM.The SVM classifierswhichmight be suitable for near-infrared spectral recognition of soybean oil colorwere designed then.The recognition correct rate had achieved 100%.Second,for the oils with different Lovibond yellow values,the regressions between near-infrared spectral data and Lovibond red valueswere conducted byε-SVR.The SVM correction models for different grade soybean oil color were established respectively.The prediction errors could be controlled within 0.2 Lovibond Unit.The research demonstrated that itwould be feasible to use near-infrared spectrum technology to realize qualitative and quantitative analysis of oil color.Themethod proposed in the paper can be a reference for further implementing on-linemonitoring and control of oil color.

near-infrared spectroscopy,oil color,Support Vector Machines(SVM)

TQ646

A

1003-0174(2015)08-0115-05

國家自然科學基金(31271886),黑龍江省高??萍汲晒a業化前期研發培育項目(1253CGZH22),哈爾濱商業大學博士科研啟動項目(12DL023)

2014-03-24

王立琦,女,1966年出生,教授,測試計量技術及儀器

于殿宇,男,1964年出生,教授,糧食、油脂與植物蛋白工程

猜你喜歡
色澤油脂光譜
基于三維Saab變換的高光譜圖像壓縮方法
人生的色澤
肉雞配用油脂飼料有啥方法
西裝新色
高光譜遙感成像技術的發展與展望
T-501色澤分析方法的建立
A taste of Peking duck
Al-Zr-CeO2固體酸催化劑的制備及其油脂環氧化性能
基于GPU的高光譜遙感圖像PPI并行優化
苦味酸與牛血清蛋白相互作用的光譜研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合