?

化學計量學方法在食品分析中的應用

2017-08-23 10:06李鶴東王亞棋付海燕鄭福平
食品科學技術學報 2017年3期
關鍵詞:計量學校正矩陣

陳 峰, 李鶴東, 王亞棋, 付海燕,,*, 鄭福平,3

(1.克萊姆森大學 食品營養和包裝科學系, 美國 克萊姆森 29634; 2.中南民族大學 藥學院, 湖北 武漢430074; 3.北京工商大學 北京食品營養與人類健康高精尖中心, 北京 100048)

?

化學計量學方法在食品分析中的應用

陳 峰1, 李鶴東2, 王亞棋1, 付海燕1,2,*, 鄭福平1,3

(1.克萊姆森大學 食品營養和包裝科學系, 美國 克萊姆森 29634; 2.中南民族大學 藥學院, 湖北 武漢430074; 3.北京工商大學 北京食品營養與人類健康高精尖中心, 北京 100048)

化學計量學是由數學、統計學、化學及計算機科學交叉形成的具有獨特魅力的重要新興學科。作為其核心理論體系的模式識別和多維校正方法,在海量數據信息挖掘與處理、分析信號分辨與解析中,體現了突出的優勢,并能攻克傳統分析方法難以處理的復雜難題,已廣泛應用于食品分析領域。系統介紹了化學計量學核心理論方法及其在食品分析中的應用及研究進展,詳細分析了模式識別和多維校正方法的基本原理及優缺點,指出了目前化學計量學方法在食品分析領域研究中需要解決的問題并對其未來發展方向進行了展望。

化學計量學; 食品分析; 模式識別; 多維校正

食品分析的核心任務是通過對反映食品特征品質(如食品營養活性成分、外源的農藥獸藥殘留、非法添加的違禁物質、內源的霉菌毒素等指標,以及食品分級分類、摻偽假冒等)的量測數據性質和信息進行甄別和定性定量分析,進而為評判食品質量好壞和食用安全性提供依據[1]。食品種類繁多、成分復雜,各種食品安全與質量問題屢有發生,因此,發展快速、高效、簡便的食品分析方法至關重要。目前,一些現代分析技術,如色譜- 質譜聯用技術[2]、近紅外光譜技術[3]、中紅外光譜技術[4]、原子光譜技術[5]、電子鼻技術[6]、電子舌技術[7]等,均已成功應用在現代食品分析領域。但歸根結底,無論需要處理的食品問題怎么變化,各種現代分析儀器或檢測技術獲得的是食品中具有不同內涵性質的各種類型的信息數據,而化學計量學針對數據信息挖掘與處理,特別是對復雜體系隱含信息的提取,能提供強大的手段,因此,化學計量學必然會在解決食品分析問題中發揮重要的作用。

化學計量學是20世紀70~80年代興起的一門交叉學科。它基于數學、統計學、化學及計算機科學的方法和原理,設計優化實驗,挖掘與處理、分辨與解析實驗量測數據的信息,從而獲取復雜分析體系中隱含的有用信息[8]?;瘜W計量學包括實驗設計、信號解析、模式識別、多元分辨和多維校正等理論體系,擁有廣闊的應用領域,其中,模式識別和多維校正理論及其應用是化學計量學中最為重要并且最具發展潛力的領域之一。

本文介紹了化學計量學處理的分析對象即數據結構類型,重點闡述用于處理相應數據結構類型的化學計量學中經典的模式識別和多維校正方法的基本原理,評述各種方法間的適用性和優缺點,詳細介紹了化學計量學方法在食品分析中的應用,簡要分析了化學計量學方法在食品分析領域中還需進一步解決的問題并對其未來的發展進行展望。

1 化學計量學方法處理的不同數據結構類型

化學計量學這一學科的創始人之一,美國化學家Kowalski教授,基于張量代數理論,對實驗過程中所獲得的各種不同量測數據進行過簡單的分類。隨著日益復雜的數據產生,其張量數據結構分類也在不斷地得到總結和歸納[9-11]。圖1形象地描述了各種儀器和檢測技術所獲取的原始張量數據結構類型,并區分了數據的“階”和“維”的概念,以及模式識別與多維校正所適應于處理的相應張量數據類型。這里針對于單個樣品數據的結構類型為“階”,而針對于具有相同結構類型的多個樣品在一個維度方向延展組合的數據集為“維”(見圖1),故“維”比“階”高1個維度,而提取不同結構類型數據集中隱含信息的方法需要依靠不同的化學模式識別及多維校正方法。當“零階儀器”(如單波長光度計、離子選擇性電極等)量測一個實驗樣本只產生一個響應值時,該數據類型為標量,即零階張量;多個實驗樣本下該結構類型數據組合的樣本數據集為矢量,相對應處理該數據集的化學計量學方法為零階校正方法,如標準曲線法;類似地,“一階儀器”(如紫外- 可見分光光度計、熒光分光光度計、紅外或近紅外光譜儀、拉曼光譜儀以及核磁共振等各類光譜儀、單通道HPLC、電化學掃描儀或傳感器陣列等)量測一個實驗樣本獲得的數據類型是矢量,即一階張量,多個實驗樣本下該結構類型數據組合的樣本數據集為矩陣,相對應處理該數據集的化學計量學方法為一階校正方法或模式識別方法;同樣地,“二階儀器”(如各種色譜HPLC/GC、液相色譜毛細管電泳分離技術(HPLC/CE)與二極管陣列檢測器聯用儀(HPLC/DAD)、激發- 發射熒光儀(EX- EM)等)量測一個實驗樣本獲得的數據類型是矩陣,即二階張量,多個實驗樣本下該結構類型數據組合的樣本數據集為三維數陣,相對應處理該數據集的化學計量學方法為二階校正方法。近年新發展起來的“三階儀器”(如全二維氣相色譜或全二維液相色譜與二極管陣列或質譜聯用儀(GC- GC/LC- LC- DAD/MS)等)的使用,使量測一個實驗樣本獲得的數據類型變成一個三維響應數陣,即三階張量,而多個實驗樣本下該結構類型數據堆疊組合的樣本數據集為四維數陣,相應的處理該類數據集的化學計量學方法為三階校正方法。三階校正甚至更高階校正方法的理論體系是化學計量學中的難點和盲點,目前仍處于起步階段。

圖1 化學計量學方法處理的分析數據結構類型示意Fig.1 Schematic diagram of data structure processed by chemometric method

1.1 模式識別

模式識別是利用統計學、信號處理、數學算法等工具,根據量測對象的特征性質進行數據挖掘和信息提取,進而對所研究的物質或現象進行聚類和分類判斷的方法[12]。模式識別方法適用于樣品數據集為矩陣數據的處理。根據方法基本原理,可分為多類聚類方法、判別分析方法和一類分類的類模型方法。多類聚類方法是將不同類別樣品根據不同的計算依據,如樣本在空間分布的距離進行相似類聚、相異分離;判別分析方法是根據訓練集樣品進行學習,將兩類或多類樣品按照訓練的目標函數進行多類樣品識別和分類,但當未知的樣品屬于訓練集之外的類別時,判別分析方法將導致錯誤的判別結果;一類分類的類模型方法則只需訓練集中僅包含目標類樣品,通過建立目標類的類模型,達到從非目標類樣品中的目標類樣品識別。圖2給出了判別分析方法對兩類或多類和類模型對一類分類示意圖。圖2將化學計量學方法中常用的模式識別方法基本原理和優缺點進行了歸納,為在食品分析應用中選擇相應的模式識別方法分析和解決問題提供了理論支持和依據。

圖2 判別分析方法對兩類或多類和類模型對一類分類示意Fig.2 Schematic diagram of two or multi -class by discrimination analysis method and one -class classification by class -modeling techniques

1.1.1 多類聚類和判別分析方法

1) 主成分分析

主成分分析(principle component analysis, PCA),是一種基于將原始變量轉換為互不相關的新特征變量之間的線性組合,并使其包含最大樣本方差,用較少的指標和變量特征反映和描述樣本的固有變異性及原始變量的特征,從而達到簡化和降低特征空間維數的建模方法[13]。PCA方法雖然可通過較少的幾個顯著主成分,最大化地保留和表征原始變量特征,但因其降維后的新組合信息量描述的是每個樣品的矢量空間分布,因而該算法在降維這一過程中,有時會丟失有助于判別各樣品間差異信息的變量特征,導致類內和類間的樣品分類出現混亂。

2) K最近鄰分類算法

K最近鄰(K -nearest neighbor, KNN)分類算法是一種原理最為簡單的聚類分類技術[14]。該算法原理為將樣本定義在距離特征空間里,如果一個樣本的最接近的K個“鄰居”(即相鄰樣本)中的絕大多數均屬于同一個類別,則可決策該樣本也屬于這個類別,且具有該類別中其他樣本的特性。由于KNN方法對于樣品所屬類別的判定不是通過判別類域的方法進行決策,而是通過依靠該樣品周圍少量的相鄰樣本,因而不需要估計參數,不需要訓練,適合對交叉重疊、稀有事件進行分類。該方法簡單、易于理解和實現,但該算法在分類時的主要缺點是當每類樣本數量不平衡時,如一個類的樣本數很多,而其他類樣本數很少,則可能導致每當輸入一個新樣本時,該樣本的K個鄰居樣本中,數量多的類的樣本將會占多數;另一個缺點是在大訓練集中尋找最近鄰點時,需要對每一個待分類的樣本計算其到全體已知樣本的距離,才能求得它的K個最近鄰點。此過程所需時間可能很長,容易造成“維數災”,導致分類結果精度低。

3) 偏最小二乘判別分析

偏最小二乘判別分析(partial least squares discriminant analysis, PLSDA)方法是經典的多類判別分析方法,該方法基于同時分解預測量測矩陣X和類別矩陣Y提取因子,并將因子按它們間相關性從大到小進行排列,再通過交互驗證確定隱變量個數,參與回歸建模。該方法將樣品集編碼為類別矩陣Ym×n(類別矩陣中的所有第i類樣品的第i個元素編碼均為1,其余元素編碼均為0),然后基于類別矩陣的每一列關聯預測矩陣Xm×v,進行回歸建模,求解回歸矩陣Rv×n,見式(1)。

Ym×n=Xm×vRv×n。

(1)

由求得的回歸矩陣Rv×n與所需預測的未知樣品的量測矩陣再進行回歸關聯,即可計算得到未知樣品的類屬矩陣Yp,見式(2)。

Yp=XpRp×k。

(2)

最后,再根據已知類別矩陣的編碼位置,解碼類屬矩陣中最大元素所在的位置,若最大元素出現在第i個位置,則可將該樣品甄別為第i類[15]。

該方法在多類分類判別分析中性能穩健,可以減少變量間多重共線性產生的影響,但是有時會由于樣品的組成和變量性質間缺乏相關關系,使模型受到無用信息變量的干擾,從而導致判別分析精度降低甚至錯誤。

4) 移動窗口偏最小二乘判別分析法

移動窗口偏最小二乘方法(moving window partial least -squares discriminant analysis, MWPLSDA)是在偏最小二乘判別方法基礎上引入變量挑選的策略。該方法的原理是基于虛擬設置一個尺寸大小為包含變量數為w的窗口在量測矩陣變量區間連續移動(即移動的窗口內所包含的建模變量數w為從窗口起點j到終點(j+w-1)個變量),基于移動窗口中的變量構建一系列的 PLSDA子模型,并計算在不同隱變量數時,這一系列窗口中分類子模型的殘差平方和,最后將不同隱變量PLSDA子模型的殘差平方和對窗口作圖,即可依據殘差平方和最小的原則挑選出少而精的量測矩陣變量區間,重新組合構建新的PLSDA模型[16]。該方法能最有效提取有利于分類的變量特征差異信息,從而消除一些非線性物理擾動或非成分相關等各種因素干擾,既能減小模型復雜度,又能提高模型精度,還能極大提高運算建模速度。但是,該方法不能完全避免和克服變量區間中存在變量信息重疊的問題,從而有時可能對PLSDA模型分類精度改善不明顯。

5) 人工神經網絡

人工神經網絡(artificial neural network, ANN)是通過模擬人腦結構,以對大腦的生理研究成果為基礎,并基于數理方法進行簡化抽象和模擬的一種智能仿生的自適應運算模型和信息處理系統[17-20]。該算法作為分類聚類運算時可分為有監督學習和無監督學習兩種方式。其中,有監督學習的原理是將訓練樣本輸入到網絡,并將網絡輸出和期望的目標值相比較,獲得誤差值,據此控制連接權重值連接強度的調整,經過多次訓練中不斷朝誤差減小的方向收斂,自適應計算出一個確定的權重值,進而獲得滿意精度的網絡輸出值;無監督學習的原理則不給輸入網絡訓練樣本,直接根據已建立的聚類進行自組織的權重值調整,學習規律的變化服從連接權值的演變方程。該算法不依賴于精確的數學模型,能擬合強的非線性關系,具有并行性、容錯性、非線性、自組織學習和自適應處理能力等特點,但該算法常易陷入過擬合和局部最優,在某種程度上限制了它的實際使用。

6)支持向量機

支持向量機(support vector machine, SVM)是Vapnik等[21]于1995年首先提出的基于統計學理論的一種新的非常有潛力和廣闊應用前景的分類模式識別方法[22-24]。該方法的本質是解決一個二次規劃問題,并最終可轉化為凸優化問題,且在運算過程中基于統計學習理論的VC理論和采用結構風險最小化原理,能保證算法收斂的全局最優性,從而使得該方法建模時基本不受到訓練樣本數的影響,即使在其訓練樣本建模數量較少時,該算法依然表現出良好的泛化能力。但是,該方法通常都需要計算和存儲Hessian矩陣,當數據量較大時,訓練速度極大地受到訓練集規模的影響,求解過程所需計算資源很大,有時會出現計算阻滯,這樣使得SVM建模求解時更適合于處理樣本數較小的實驗體系。此外,該方法性能直接受到模型中所選擇的核函數的影響,而對于選擇最佳的核函數構建針對特定問題的SVM模型仍是一個難題。因此,作為一種新興的技術,SVM目前在實際應用中也有一定的局限性。

1.1.2 一類分類的類模型方法

模式識別方法中的多類聚類和判別分析方法通常是對兩類或幾類、多類樣品進行學習和預測。在實際分析問題中,這些方法難以對層出不窮的摻雜、假冒樣品進行完備的采樣和學習,因此對兩類、多類樣品的分類遠遠不能滿足無目標檢測的要求。特別是由于非法添加物數不勝數、層出不窮,以及受原產地域保護產品的干擾影響,也不可能對所有其他產地與產品完全采樣,很難建立全面的常規檢測體系和制度。這種食品安全檢驗中的缺陷在國內外引發了多次嚴重的食品安全危機,引起公眾對農產品和食品安全性的普遍擔憂,因此,發展“無目標”檢測方法,是幫助解決此類問題的一個有效補充手段?;瘜W計量學中的一類分類(one -class classification)的類模型方法(class -modeling techniques)[25-29]對于該類問題的解決提供了強有力的分析手段。該類方法僅對我們感興趣的一類樣品(如地理標志產品、純正食品)的代表性樣品進行充分采樣、檢測和表征,對測量信號建立類模型,通過對未知樣品測量信號的分析,進一步發現假冒、摻雜引起的(很可能是比較細微的、僅憑肉眼難以分辨的)信號差異,最終目的是盡可能全面地檢出已知或未知的各種摻雜。傳統的一類分類的類模型方法主要有以下幾種:1)基于軟獨立模型類簇法(soft independent modelling of class analogy, SIMCA)[30]及其變種;2)基于多元正態分布和Hotelling的TZ統計量的非均勻分布類(unequal dispersed classes, UNEQ)模型[31];3)基于各種勢函數和概率密度估計的類模型方法[32];4)基于人工神經網絡(artificial neural network, ANN)的類模型方法[33]。其中,傳統的一類分類的類模型方法中最為經典的SIMCA算法由于其簡便性、有效的數據降維和對誤差分布的較少假定,獲得了廣泛的應用,已被收入大多數化學計量學教科書中。但是,SIMCA在實際應用中仍然遇到一些困難,主要在于:1)顯著主成分數對其性能影響很大,太少的主成分數不能充分描述化學成分的變化,太多的主成分數則往往導致模型的過擬合;2)SIMCA決策區間的估計也存在一定困難,主要原因是殘差的相關性和由此引起的自由度估算不準確;3) SIMCA的隱變量側重于解釋類內樣品的最大方差,并未考慮同類樣品的投影應盡可能互相接近而有效避免與類外樣品相重疊,造成了隱變量降維與分類性能優化的脫節,以及SIMCA模型性能的退化。

在傳統一類分類的類模型基礎上,近年來提出了一種基于支持向量機(SVMs)的類模型方法,即支持向量數據描述算法(SVDD)[34]。SVDD在模型參數規范化的同時,使類內樣品的主體到類中心的距離最小化。由于SVDD立足于已獲得廣泛認可的SVMs,又有比較清晰的幾何意義,受到較多關注。但是,SVDD也存在一些問題[35]:1) SVDD中的參數,如規范化參數、高斯核函數的寬度參數在很大程度上依靠經驗選取,尚沒有客觀的估計方法;2) SVDD容易發生過擬合。此外,還提出了以經典的PLS回歸為基礎的一類偏最小二乘(one -class partial least square, OCPLS)方法[36],OCPLS隱變量是類內樣品向類中心的投影,并考慮了訓練集樣品特征數據陣的方差解釋和類內樣品投影的緊密性,并對未知樣品在給定顯著性水平下的決策區間進行一類分類,該方法目前發展了MATLAB的OCPLS工具包[37]。但是,該方法在隱變量的構造和回歸計算中,若存在奇異樣品,可能會導致模型的嚴重偏差。

1.2 多維校正

多維校正方法是化學計量學最為核心的理論部分,它立足于創新性地構建定量分析的基礎理論,發展針對不同結構類型量測數據的相應校正方法,通過構建的多維校正模型從不同結構類型數據的海量信息中最大限度地提取隱含的有用信息進行定量表征,從而解決各種復雜的實際分析體系中的問題和難題[38]。將化學計量學方法中常用的多維校正方法基本原理和優缺點進行歸納,為在食品分析應用中選擇相應的多維校正方法分析和解決問題提供理論支持和依據。

1.2.1 一階校正

一階校正方法用于處理和解析樣本集為矩陣結構類型的量測數據,是目前化學計量學理論中最為成熟且應用最廣泛的校正方法[38]。一階校正方法的代表性算法主要有P -矩陣法、K -矩陣法、主成分回歸(PCR)和偏最小二乘回歸(PLS)等。其中P -矩陣法和K -矩陣法在求解過程中涉及到矩陣求逆,這就要保證量測矩陣與樣品性質響應矩陣均為滿秩矩陣這一前提,而實際量測數據變量數通常都會多于樣品中的組分數,這就存在矩陣虧秩而導致不確定性的解析結果。針對矩陣虧秩,PCR是基于量測矩陣的奇異值分解(SVD),然后采用顯著的奇異值重構量測矩陣,從而能獲得較為穩健的解析結果。PLS是在PCR基礎上進一步發展,該方法基于量測矩陣和響應矩陣同時進行SVD,這種求解方式能克服一些非線性擾動因素影響,從而使得模型精度更高和穩健性更好。但是,一階校正因其在對矩陣分解時,存在矩陣雙線性分解旋轉的不確定性,其缺點是如果校正集樣品中未對預測集樣品中的其他干擾進行校正建模,則會出現依干擾程度的不同產生不同程度的預測偏差和錯誤。因此,為保證一階校正給出有物理意義的可靠解,必須要滿足校正集樣品包含預測集樣品的所有響應組分和性質。

1.2.2 二階校正

二階校正方法用于處理樣本集為三維數陣的結構類型的數據,是目前化學計量學理論中發展潛力巨大的校正方法。二階校正方法針對一階校正所出現的不足,利用基于特殊性結構的三維數陣分解具有唯一性的優點,從而可以得到具有明確物理意義的唯一解,即可從未知和未校正的背景中提取目標分析物的信號。因此,二階校正方法比一階校正方法具有一個明顯的優勢,無需要求校正集樣品包含預測集樣品中的各種未知干擾,即著名的數學分離“二階優勢”[38]。依據三維數陣分解的不同原理,可將二階校正方法分為主要的三類:第一類是基于特征值分析的非迭代類算法,典型的代表性算法有秩消失因子分析(rank annihilation factor analysis, RAFA)算法[39]、廣義秩消失因子分析(GRAM)算法[40]和直接三線性分解算法(direct trilinear decomposition,DTLD)[41]。這類算法的優點是對組分數估計不敏感,可以實現未知干擾下目標分析物的定量分析,但缺點是因該類算法對不嚴格服從三線性成分模型或包含較大噪聲的三維數陣進行三線性分解時方差較大,故對信噪比低的分析體系建模解析時,可能因復數解而出現嚴重偏差。第二類是基于展開形式迭代的最小二乘(ALS)擬合類算法,平行因子分析(parallel factor analysis , PARAFAC)是該類算法中的經典代表[42]?;趪栏褚饬x上的最小二乘原理的PARAFAC優點是對噪聲影響不敏感,能對三線性成分模型進行最優擬合,模型偏差較小。缺點是該算法對初始值和組分數敏感,易陷入局部最優,且通過展開形式計算,收斂速度較慢。第三類是基于切片形式的矩陣雙廣義逆運算方式類算法,其經典代表有交替三線性分解(alternating trilinear decomposition, ATLD)算法[43],該方法基于對切片矩陣對角元素和廣義逆求解結合的方式,充分結合了 PARAFAC 和 DTLD 的優點,兼具對組分數不敏感和收斂速度快的雙重優點。在該算法基礎上,研究者們針對不同三維數陣數據特點,發展了一系列性能優良的基于切片形式的ATLD變種算法[44],例如:自加權交替三線性分解(self -weighted alternating trilinear decomposition,SWATLD)算法[45]、交替懲罰三線性分解(alternating penalty trilinear decomposition, APTLD)算法[46]等。

1.2.3 三階校正及高階校正

三階校正及高階校正用于處理樣本集為四維數陣甚至更高維數陣的結構類型的數據,是目前化學計量學多維校正領域中的前沿難點理論。三階校正方法是通過引入額外一維的維度優勢,克服二階校正方法在解決復雜體系中存在高共線或嚴重基體效應時會出現較大偏差甚至錯誤的問題[47]。目前,已報道的方法有基于數陣展開形式的四維平行因子分析(four -way parallel factor analysis, Four -way PARAFAC)法[48]、基于數陣切片形式的交替懲罰四線性分解(alternating penalty quadrilinear decomposition, APQLD)法[49]、歸一化自加權交替四線性分解(regularized self -weighted alternating quadrilinear decomposition, RSWAQLD)法[50]及基于數陣不完全展開和切片形式相結合的交替加權殘差約束四線性分解(alternating weighted residual constraint quardrilinear decomposition, WRCQLD)算法[51]等。三階校正方法在充分發揮“二階優勢”的基礎上,還具有二階校正不能比擬的維度優勢。

由于能直接產生四階及更高階張量數據的儀器比較少見,而通過加入時間或pH值等維度構建更高維數據的實驗工作量很大,所以關于更高階校正方法的研究相對較少?,F有的高階校正大多拓展自迭代類的三階校正方法,如交替五線性分解(alternating quinquelinear decomposition, AQQLD)[52]、約束交替多線性分解(constrained alternating multilinear decomposition, CAMLD)[53]、展開的偏最小二乘結合殘差多線性(unfolded partial least -squares with residual multilinearization, U -PLS/RML)[54]等。更高維校正方法與三維校正方法一樣具有“二階優勢”,同時也具有一些額外的其他優勢——“高階優勢”。由于目前研究有限,高維校正方法的更多潛能還有待在理論和實際分析應用中進一步探索和發現。

2 化學計量學方法在食品分析中的應用

2.1 多類聚類和判別分析方法在食品分類和判別分析中應用

多類聚類和判別分析方法在解決食品品質分級分類和判別分析問題中具有很高的應用價值,如用于食品品質精細分級和不同品牌分類、原產地溯源識別研究等;不同等級或劣質產品通??筛鶕庾V、色譜、傳感等現代分析儀器獲得的樣品指紋譜圖或指標成分參數,再利用多類聚類和判別分析方法進行聚類分析或特征提取,構建模型來識別出不同樣品的屬性類別。Fu等[55]利用FT- NIR結合偏最小二乘判別分析(PLSDA)實現了不同貨架期及霉變葵花籽、大豆的判別分析,此外,還利用FT- NIR結合群聚策略的PLSDA方法實現了25種不同原產地的龍井的快速判別[56];Liu等[57]利用“Turn -off”熒光傳感結合PLSDA實現了29種不同物種、不同產區和不同等級綠茶的高靈敏識別。Wu等[58]利用HPLC結合主成分分析(PCA)和逐步線性判別分析(S- LDA)實現不同種類茶葉的判別分析;Lu等[59]利用UPLC- MS和FIMS指紋圖譜結合PLSDA用于判別不同產地的中國枸杞;Bajoub等[60]利用HPLC- ESI- IT MS結合線性判別分析(LDA)實現不同產地橄欖油的判別分析;研究者們利用FT- NIR、E -nose、UV- VIS 結合多類聚類和判別分析方法實現了不同產地松仁、藏紅花,不同種類蘋果,不同品牌的烈酒和醋的分類和判別[61-64];Xiao等[65]利用SBSE- TD- GC- MS和E -nose結合主成分分析及聚類分析(CA)實現不同產地黃酒的判別分析;Yu等[66]基于PCA和判別分析(DA)分析GC/MS、E -nose數據實現不同年限黃酒的判別; Chen課題組利用GC- MS結合主成分分析對不同制備方法下柚皮精油感官評價數據降維,分析原始精油組以及經過光照作用、氧氣作用和熱處理等精油組間風味特征的差異,并通過聚類分析對各組精油的香氣值進一步分析,將各組精油中揮發性風味成分分為5類,闡釋了不同精油組成分變化與風味變化的關系[67];該課題組利用相同的化學計量學方法還成功研究了不同處理方式的柚子汁風味成分變化與風味關系[68],不同提取方式的柚子皮的香氣物質變化特性[69]。表1列舉了模式識別中多類聚類和判別分析方法在食品分類和判別分析中的一些應用。

表1 多類聚類和判別分析方法在食品分類和判別分析中的應用

2.2 一類分類的類模型方法在食品摻假無目標分析中應用

食品非法添加、摻雜與假冒的檢測是世界性難題?!坝心繕藱z測”方法,只有在預先獲知或懷疑某成分可能存在時,才能展開相關的“被動”檢測。針對“有目標”檢測的不足,發展“無目標”檢測方法是一種解決食品摻假問題的有效途徑。Xu等利用光譜技術結合OCPLS的算法對花生油[70]、芝麻油[71]、糯米粉[72]、全脂奶粉[32]、蜂膠[73]、西湖藕粉[74]、酸奶[75]、板藍根[76]、葛根粉[77]和道地香菇[78]等中的各種非法添加的摻假物進行無目標檢測,取得了較滿意的結果。Zhang等[79]應用一類支持向量機對芝麻油進行無目標檢測。一類分類的類模型方法在食品摻假無目標分析應用中的例子[80],見表2。

2.3 一階校正方法在食品定量分析中的應用

一階校正方法是多維校正理論體系中最為成熟的校正方法。一階校正可以同時分析多個待分析物,并且不要求分析檢測技術對待分析物的響應信號具有完全的選擇性。一階校正方法構建的數學模型比較簡單,數學原理容易理解并且計算方法容易實現,在食品定量分析中得到廣泛的應用。表3列舉一階校正方法在食品中定量分析的一些應用實例。Fan等[81]利用“Turn -off”熒光傳感結合基于改進的支持向量機,實現在綠茶和污水等復雜基質中多種農藥殘留的同時定量表征和分析;Yang等[82]利用傅里葉變換近紅外光譜(FT- NIR)結合偏最小二乘回歸(PLSR)測定中草藥中農殘的含量;Hou等[83]利用表面增強拉曼光譜(SERS)結合PLSR定量分析單組分和混合的食品防腐劑含量;有文獻報道,利用NIR高光譜成像結合包括PCR和PLSR兩種多元回歸方法對加拿大小麥中的蛋白質含量和硬度值進行建模分析,并比較兩種一階校正方法對其預測性能的差異[84],以及魚油微囊補充劑中蛋白質含量[85];Qin等[86]利用太赫茲光譜結合PLSR對抗生素鹽酸四環素粉末和溶液進行無損預測分析;許多研究者們用高光譜成像(HSI)成功實現了在食品中的各種營養成分、色素成分等的高靈敏的定量分析[87-90];Xiao課題組利用PLSR很好地表征了甜橙精油、蔓越莓、榴蓮酒中香氣物質與感官評價得分間的相關關系[91-93]。值得指出的是,目前一階校正在食品定量分析應用中,共性的特點是需要有足夠代表性的樣品校正集來應付未知待測樣本所有的預期變化。

表2 一類分類的類模型方法在食品摻假無目標分析中的應用

表3 一階校正方法在食品定量分析中的應用

2.4 二階及高階校正在食品復雜基質未知干擾共存下對目標分析物的應用

二階校正具有“數學分離”代替或簡化“物理和化學分離”的“二階優勢”,可以實現食品安全檢測所要求的現場、快速和實時分析,因此具有廣闊的應用前景。近年來,具有“二階優勢”的化學計量學多維校正方法已被廣泛應用于食品復雜基質中目標分析物的定量研究,表4列舉了一些二階及高階校正方法在各種食品復雜基質中多組分被分析物的同時定量分析的研究工作。例如:El -Sheikh等[94]采用紫外光譜(UV) 結合pH值變化產生三維數據,基于平行因子分子(PARAFAC)和基于殘差雙線性的雙線性最小二乘(bilinear least squares/residual bilinearization, BLLS/RBL)方法,實現了在未知干擾共存下4種軟飲料中人工合成色素檸檬黃、誘惑紅、日落黃、胭脂紅和亮藍的直接同時定量分析,并與色譜分析的結果相比較,結果表明,分析所得的定量結果準確和可靠。Alarcn等[95]采用激發- 發射矩陣(excitation -emission matrix, EEM)熒光結合基于殘差雙線性的展開偏最小二乘方法(unfolded partial least squares/residual bilinearization, U -PLS/RBL)和PARAFAC方法實現了在未知干擾共存情況下食用橄欖油和葵花籽油中7種多環芳烴的定量分析,獲得了與液相色譜- 熒光檢測一致的定量結果,這種數學分離的方法具有簡單、快速和綠色的優勢,與色譜分析相比,極大地縮短了分析時間,減少了有機溶劑的消耗。Boeris等[96]利用HPLC- DAD測定了果汁、水果和蔬菜等復雜食品基質中5種農藥的殘留量。在簡單的等度洗脫條件下,復雜食品樣品的色譜洗脫曲線中出現了色譜峰共流出、洗脫時間漂移、色譜峰形變化和未知背景干擾等。即便如此,利用基于二階校正的多元曲線分辨交替最小二乘(MCR- ALS)無需將食品中各種內源干擾與目標分析物5種農殘色譜峰進行峰的精細優化和分離,依然得到了準確的定量結果。Lozano等[97]采用超高速高效液相色譜與激發- 發射矩陣(EEM)熒光光譜檢測器聯用(UPLC- EEM)技術對多個樣本測量并構建四維數據陣,結合PARAFAC、基于殘差三線性的展開偏最小二乘(unfolded partial least squares/residual trilinearization, U -PLS/RTL)和基于殘差三線性的多維偏最小二乘(multi -way partial least squares/residual trilinearization,N -PLS/RTL)方法對數據進行解析,無需樣本物理和化學繁瑣的分離預處理步驟,即使在有熒光響應的其他干擾物共存的情況下,成功實現了橄欖油中葉綠素a和b以及脫鎂葉綠素a和b的直接和快速同時定量分析。Rubio等[98]基于標準加入法引入實際樣品提取物不同稀釋倍數作為第四維度,構建與三維熒光相結合的四維數據陣,采用four -way PARAFAC進行數據分析,在分析物光譜互相重疊且與基質背景光譜也重疊的情況下,實現了卷心菜中氨基甲酸酯類農藥的定量分析,同時還識別出了不同稀釋倍數下卷心菜基質的響應和影響情況。Yu等[99]在簡單的等度洗脫條件下,采用HPLC- DAD結合三線性分解方法測定了蜂蜜中的12種喹諾酮類物質的含量。盡管各被分析物喹諾酮類物質間出現了嚴重的峰共流出問題,同時蜂蜜基質中也存在各種未知干擾物,借助二階校正方法的“二階優勢”依然實現了對蜂蜜中12種喹諾酮類物質的直接同時定量分析。Zhang等[100]采用HPLC- DAD結合二階校正方法的策略,極大地簡化了樣本的預處理過程,實現了5種蜂蜜中9種多酚類物質的同時定量分析。Wang等[101]在不經提取,直接稀釋植物油樣本后采用HPLC- DAD方法,在6 min內使10種抗氧化劑全部流出,然后結合交替懲罰三線性分解(APTLD)方法對獲得的HPLC- DAD數據進行解析,在有重疊峰、未知背景干擾和基線漂移的情況下,快速實現了5種植物油樣本中10種抗氧化劑的同時數學分辨和定量表征。上述二階及高階校正方法在各種復雜食品分析問題中的研究表明,與傳統的化學分析方法相比,基于二階及高階校正的化學計量學方法應用于復雜食品體系分析時有諸多優勢,必將在食品化學、食品分析等學科中獲得越來越多的實際應用。

表4 二階及高階校正方法在食品復雜基質中多組分被分析物的同時定量分析

3 評論和展望

在食品分析研究的過程中,化學計量學方法在數據解析和分析中發揮了重要的作用,為分析復雜的食品體系提供了一個有別于傳統食品研究的新思路。特別是基于二階校正及更高階校正的化學計量學方法,能夠利用數學分離代替或部分代替物理及化學分離,進而直接進行食品中多個組分的同時分辨和直接定量表征和分析,為滿足食品實際生產過程和質量安全監控等要求提供了一條簡單、快速、有效的綠色節能新途徑。然而,目前采用化學計量學進行食品分析的研究和應用還有待進一步擴大深度和空間。因此,新的檢測技術和新的化學計量學分析方法對豐富食品分析的內容,顯得極其重要。新的檢測技術例如高光譜成像技術、納米材料傳感新技術,為食品分析注入了新的活力,并在食品領域有著極大的潛在應用前景。除此之外,進一步擴大各種分析儀器的“數據融合技術”,并根據分析樣品不同維度的物理和化學信息,反映出相比于單獨儀器技術更全面的樣品信息,對于深度闡釋和揭示食品的整體理化特性和作用機制等具有重要意義?;瘜W計量學將一些優化策略如變量篩選、穩健分析計算等引入到現有的經典算法中,提出一些新的具有普適性應用模式的化學計量學方法,可以改善現有方法的一些缺點,簡化分析模型、縮短分析時間、擴大模型的適用性、提高模型的準確度和精度,也將進一步推動化學計量學在食品分析中各種實際應用的發展。

4 結 論

化學計量學是分析化學的前沿研究方向之一,并被成功引入食品分析領域,為解決食品分析中的諸多問題和難題提供了強有力的數據解析工具和分析方法。目前,化學計量學在食品分析中的應用日趨廣泛,但由于食品種類繁多和成分復雜,仍然有待做更多和更深入的研究工作,以期在實際應用中更好地完成食品分析的任務和目標。鑒于化學計量學方法的各種優勢,研究者們應充分借助化學計量學的不同方法,擴大其在食品分析中的應用范圍,開拓新的應用領域,促進食品分析方法的發展和實際應用研究;同時,研究者們也應發展更多適應于處理各種現代新儀器分析方法和新檢測技術所產生的、海量的、不同結構類型數據的化學計量學新理論,使其在食品分析領域中具有更為廣闊的應用前景。

[1] DZANTIEV B B, BYZOVA N A, URUSOV A E, et al. Immunochromatographic methods in food analysis [J]. Trends in Analytical Chemistry, 2014, 55(55): 81-93.

[3] POREP J U, KAMMERER D R, CARLE R. On -line application of near infrared (NIR) spectroscopy in food production [J]. Trends in Food Science & Technology, 2015, 46(2): 211-230.

[4] KAROUI R, DOWNEY G, BLECKER C. Mid -infrared spectroscopy coupled with chemometrics: a tool for the analysis of intact food systems and the exploration of their molecular structure -quality relationships -a review [J]. Chemical Reviews,2010,110(10): 6144-6168.

[5] BUTLER O T, CLOUGH R, COOK J M, et al. Current trends: a perspective from 30 years of atomic spectrometry updates[J].Journal of Analytical Atomic Spectrometry, 2016,31:32-34.

[6] LOUTFI A, CORADESCHI S, MANI G K. Electronic noses for food quality: a review[J]. Journal of Food Engineering, 2015, 144: 103-111.

[7] KANG B S, LEE J E, PARK H J. Electronic tongue -based discrimination of Korean rice wines (makgeolli) including prediction of sensory evaluation and instrumental measurements [J]. Food Chemistry, 2014, 151: 317-323.

[8] LAVINE B, WORKMAN J. Chemometrics [J]. Analyti -cal Chemistry, 2010, 82(12): 4699-4711.

[9] SANCHEZ E, KOWALSKI B R.Tensorial calibration: I. first -order calibration [J]. Journal of Chemometrics, 1988, 2(4): 247-263.

[10] WU H L, NIE J F, YU Y J, et al. Multi -way chemometric methodologies and applications: a central summary of our research work [J]. Analytica Chimica Acta, 2009, 650(1): 131-142.

[11] OLIVIERI A C, ESCANDAR G M, GOICOECHEA H C, et al. Fundamentals and analytical applications of multi -way calibration[M]. Amsterdam: Elsevier, 2015:7-8.

[12] BRERETON R G. Multivariate pattern recognition in chemometrics [J]. Chemometrics & Intelligent Laboratory Systems, 2015, 149: 90-96.

[13] WOLD S, ESBENSEN K, GELADI P. Principal component analysis[J]. Chemometrics and Iintelligent Laboratory Systems, 1987, 2(1-3): 37-52.

[14] LUO W, HUAN S, FU H, et al. Preliminary study on the application of near infrared spectroscopy and pattern recognition methods to classify different types of apple samples [J]. Food Chemistry, 2011, 128(2): 555-561.

[15] FU H Y, HUAN S Y, XU L, et al. Moving window partial least -squares discriminant analysis for identification of different kinds of bezoar samples by near infrared spectroscopy and comparison of different pattern recognition methods [J]. Journal of Near Infrared Spectroscopy, 2007, 15(2): 291-297.

[16] FU H Y, HUAN S Y, XU L, et al. Construction of an efficacious model for nondestructive identification of traditional Chinese medicines Liuweidihuang pills from different manufacturers using near infrared spectroscopy and moving window partial least -squares discriminant analysis [J]. Analytical Sciences, 2009, 25(9): 1143-1148.

[17] BOGER Z, GUTERMAN H. Knowledge extraction from artificial neural network models[J]. Journal of Renewable and Sustainable Energy, 2015, 4(5): 3030-3035.

[19] CUBEDDU A, RAUH C, DELGADO A. Hybrid artificial neural network for prediction and control of process variables in food extrusion[J]. Innovative Food Science & Emerging Technologies, 2013, 21: 142-150.

[20] KHAJEH M, BARKHORDAR A.Modelling of solid -phase tea waste extraction for the removal of manganese from food samples by using artificial neural network approach[J]. Food Chemistry, 2013, 141(2): 712-717.

[21] VAPNIK V N. The nature of statistical learning theory [M]. New York: Springer -Verlag, 1995:267-290.

[22] BARBOSA R M, NELSON D R. The use of support vector machine to analyze food security in a region of Brazil[J]. Applied Artificial Intelligence, 2016, 30(4): 318-330.

[23] BAO Y, LIU F, KONG W, et al. Measurement of soluble solid contents and pH of white vinegars using VIS/NIR spectroscopy and least squares support vector machine[J]. Food and Bioprocess Technology, 2014, 7(1): 54-61.

[24] SOHRABI M R, DARABI G. The application of conti -nuous wavelet transform and least squares support vector machine for the simultaneous quantitative spectrophotometric determination of myricetin, kaempferol and quercetin as flavonoids in pharmaceutical plants[J]. Spectrochimica Acta Part A: Molecular & Biomolecular Spectroscopy, 2016, 152:443-52.

[25] BRERETON R G. One -class classifiers[J]. Journal of Chemometrics, 2011, 25(5):225-246.

[26] FORINA M, OLIVERI P, LANTERI S, et al. Class -modeling techniques, classic and new, for old and new problems[J]. Chemometrics & Intelligent Laboratory Systems, 2008, 93(2):132-148.

[27] FORINA M, OLIVERI P, JGER H, et al. Class modeling techniques in the control of the geographical origin of wines[J]. Chemometrics & Intelligent Laboratory Systems, 2009, 99(2): 127-137.

[28] OLIVERI P, EGIDIO V D, WOODCOCK T, et al. Application of class -modelling techniques to near infrared data for food authentication purposes[J]. Food Chemistry, 2011, 125(4): 1450-1456.

[29] MARINI F, MAGRA L, BUCCI R, et al. Class -modeling techniques in the authentication of Italian oils from Sicily with a protected denomination of origin (PDO)[J]. Chemometrics & Intelligent Laboratory Systems, 2006, 80(1): 140-149.

[30] WOLD S, SJ?STR?M M. Comments on a recent evalua -tion of the SIMCA method[J]. Journal of Chemometrics, 1987, 1(4): 243-245.

[31] FORINA M, LANTERI S, SARABIA L. Distance and class space in the UNEQ class -modeling technique[J]. Journal of Chemometrics, 1995, 9(2):69-89.

[32] FORINA M, ARMANINO C, LEARDI R, et al. A class -modelling technique based on potential functions[J]. Journal of Chemometrics, 1991(5): 435-453.

[33] POLONOVSKI M. Multilayer feed -forward artificial neural networks for class modeling[J]. Chemometrics & Intelligent Laboratory Systems, 2007, 88(1): 118-124.

[34] FORINA M, OLIVERI P, CASALE M, et al. Multivariate range modeling, a new technique for multivariate class modeling: the uncertainty of the estimates of sensitivity and specificity[J]. Analytica Chimica Acta, 2008, 622(1):85-93.

[35] SRIVASTAVA C. Support vector data description[J]. Machine Learning, 2004, 54(1):45-66.

[36] XU L, YAN S M, CAI C B, et al. One -class partial least squares (OCPLS) classifier[J]. Chemometrics & Intelligent Laboratory Systems, 2013, 126(11): 1-5.

[37] XU L, GOODARZI M, SHI W, et al. A MATLAB toolbox for class modeling using one -class partial least squares (OCPLS) classifiers[J]. Chemometrics & Intelligent Laboratory Systems, 2014, 139: 58-63.

[38] ARANCIBIA J A, DAMIANI P C, ESCANDAR G M, et al. A review on second and third -order multivariate calibration applied to chromatographic data[J]. Journal of Chromatography B, 2012, 910(23):22-30.

[39] LORBER A. Features of quantifying chemical composition from two -dimensional data array by the rank annihilation factor analysis method[J]. Analytical Chemistry, 1985, 57(12):2395-2397.

[40] SANCHEZ E, KOWALSKI B R. Generalized rank annihilation factor analysis[J]. Analytical Chemistry, 1985, 58(2):496-499.

[41] LI S, GEMPERLINE P J. Eliminating complex eigenvectors and eigenvalues in multiway analyses using the direct trilinear decomposition method [J]. Journal of Chemometrics, 1993, 7(2): 77-88

[42] FABER N M, BRO R, HOPKE P K. Recent developments in CANDECOMP/PARAFAC algorithms: a critical review[J]. Chemometrics & Intelligent Laboratory Systems, 2003, 65(1):119-137.

[43] WU H L, SHIBUKAWA M, OGUMA K. An alternating trilinear decomposition algorithm with application to calibration of HPLC- DAD for simultaneous determination of overlapped chlorinated aromatic hydrocarbons[J]. Journal of Chemometrics, 1998, 12(1): 1-26.

[44] ZHANG S, WU H, YU R. A study on the differential strategy of some iterative trilinear decomposition algorithms: PARAFAC- ALS, ATLD, SWATLD, and APTLD[J]. Journal of Chemometrics, 2015, 29(3):179-192.

[45] CHEN Z P, WU H L, YU R Q. On the self -weighted alternating trilinear decomposition algorithm -the property of being insensitive to excess factors used in calculation[J]. Journal of Chemometrics, 2001, 15(5):439-453.

[46] XIA A L, WU H L, FANG D M, et al. Alternating penalty trilinear decomposition algorithm for second -order calibration with application to interference -free analysis of excitation -emission matrix fluorescence data[J]. Journal of Chemometrics, 2005, 19(2):65-76.

[47] SMILDE A K, TAULER R, HENSHAW J M, et al. Multicomponent determination of chlorinated hydrocarbons using a reaction -based chemical sensor. 3. medium -rank second -order calibration with restricted Tucker models[J]. Analytical Chemistry, 1994, 66(20):3345-3351.

[48] RUBIO L, SARABIA L A, ORTIZ M C. Standard addition method based on four -way PARAFAC decomposition to solve the matrix interferences in the determination of carbamate pesticides in lettuce using excitation -emission fluorescence data[J]. Talanta, 2015, 138:86-99.

[49] XIA A L, WU H L, LI S F, et al. Alternating penalty quadrilinear decomposition algorithm for an analysis of four -way data arrays[J].Journal of Chemometrics, 2007, 21(3/4): 133-144.

[50] KANG C, WU H L, YU Y J, et al. An alternative quadrilinear decomposition algorithm for four -way calibration with application to analysis of four -way fluorescence excitation -emission -pH data array[J]. Analytica Chimica Acta, 2013, 758(1):45-57.

[51] FU H Y, WU H L, YU Y J, et al. A new third -order calibration method with application for analysis of four -way data arrays[J]. Journal of Chemometrics, 2011, 25(8):408-429.

[52] QING X D, WU H L, ZHANG X H, et al. A novel fourth -order calibration method based on alternating quinquelinear decomposition algorithm for processing high performance liquid chromatography -diode array detection -kinetic -pH data of naptalam hydrolysis[J]. Analytica Chimica Acta, 2015, 861: 12-24.

[53] CHAO K, WU H L, SONG J J, et al. A flexible trilinear decomposition algorithm for three -way calibration based on the trilinear component model and a theoretical extension of the algorithm to the multilinear component model[J]. Analytica Chimica Acta, 2015, 878:63-77.

[54] MAGGIO R M, PEA A M D L, OLIVIERI A C. Unfolded partial least -squares with residual quadrilineari -zation: a new multivariate algorithm for processing five -way data achieving the second -order advantage. Application to fourth -order excitation -emission -kinetic -pH fluorescence analytical data[J]. Chemometrics & Intelligent Laboratory Systems, 2011, 109(2):178-185.

[55] FU H Y, JIANG D, ZHOU R, et al. Predicting mildew contamination and shelf -life of sunflower seeds and soybeans by Fourier transform near -infrared spectroscopy and chemometric data analysis[J/OL].(2016 -11 -18)[2017 -02 -21].http:∥link.springer.com/article/10.1007/s12161-016-0726-9.

[56] FU H Y, YIN Q B, XU L, et al. Challenges of large -class -number classification (LCNC): a novel ensemble strategy (ES) and its application to discriminating the geographical origins of 25 green teas[J]. Chemometrics & Intelligent Laboratory Systems, 2016, 157:43-49.

[57] LIU L, FAN Y, FU H Y, et al. “Turn -off” fluorescent sensor for highly sensitive and specific simultaneous recognition of 29 famous green teas based on quantum dots combined with chemometrics[J/OL]. (2017 -02 -08)[2017 -02 -11].http:∥www.sciencedirect.com/science/article/pii/S000326701730123X.

[58] WU Q J, DONG Q H, SUN W J, et al. Discrimination of Chinese teas with different fermentation degrees by stepwise linear discriminant analysis (S -LDA) of the chemical compounds [J]. Journal of Agricultural & Food Chemistry, 2014, 62(38):9336-9344.

[59] LU W, JIANG Q, SHI H, et al. Partial least -squares -discriminant analysis differentiating Chinese wolfberries by UPLC -MS and flow injection mass spectrometric (FIMS) fingerprints [J]. Journal of Agricultural & Food Chemistry, 2014, 62(37):9073-9080.

[60] BAJOUB A, AJAL E A, FERNNDEZ -GUTIéRREZ A, et al. Evaluating the potential of phenolic profiles as discriminant features among extra virgin olive oils from Moroccan controlled designations of origin[J]. Food Research International, 2016, 84:41-51.

[61] LOEWE V, NAVARRO -CERRILLO R M, GARCA -OLMO J, et al. Discriminant analysis of Mediterranean pine nuts (PinuspineaL.) from Chilean plantations by near infrared spectroscopy (NIRS)[J]. Food Control, 2017, 73: 634-643.

[62] WU X, WU B, SUN J, et al. Classification of apple varieties using near infrared reflectance spectroscopy and fuzzy discriminant C -means clustering model[J/OL].(2016 -01 -12)[2017 -02 -21].http:∥onlinelibrary.wiley.com/doi/10.1111/jfpe.12355/pdf.

[63] YIN Y, HAO Y, BAI Y, et al. A Gaussian -based kernel Fisher discriminant analysis for electronic nose data and applications in spirit and vinegar classification[J]. Journal of Food Measurement & Characterization, 2017,11(1): 24-32.

[64] D’ARCHIVIO AA, MAGGI M A. Geographical identification of saffron (CrocussativusL.) by linear discriminant analysis applied to the UV -visible spectra of aqueous extracts[J]. Food Chemistry, 2017, 219:408-413.

[65] XIAO Z, DAI X, ZHU J, et al. Classification of Chinese rice wine according to geographic origin and wine age based on chemometric methods and SBSE- TD- GC- MS analysis of volatile compounds[J]. Food Science & Technology Research, 2015, 21(3):371-380.

[66] YU H, DAI X, YAO G, et al. Application of gas chromatography -based electronic nose for classification of Chinese rice wine by wine age[J]. Food Analytical Methods, 2014(7):1489-1497.

[67] SUN H, NI H, YANG Y, et al. Investigation of sunlight -induced deterioration of aroma of pummelo (Citrusmaxima) essential oil[J]. Journal of Agricultural and Food Chemistry, 2014, 62(49): 11818-11830.

[68] NI H, HONG P, JI H F, et al. Comparative analyses of aromas of fresh, naringinase -treated and resin -absorbed juices of pummelo by GC -MS and sensory evaluation[J]. Flavour and Fragrance Journal, 2015, 30(3): 245-253.

[69] SUN H, NI H, YANG Y, et al. Sensory evaluation and gas chromatography -mass spectrometry (GC- MS) analysis of the volatile extracts of pummelo (Citrusmaxima) peel[J]. Flavour and Fragrance Journal, 2014, 29(5): 305-312.

[70] XU L, CAI C, DENG D. Multivariate quality control solved by one -class partial least squares regression: identification of adulterated peanut oils by mid -infrared spectroscopy[J]. Journal of Chemometrics, 2011, 25(10):568-574.

[71] DENG D H, XU L, YE Z H, et al. FTIR spectroscopy and chemometric class modeling techniques for authentication of Chinese sesame oil[J]. Journal of the American Oil Chemists’ Society, 2012, 89(6):1003-1009.

[72] XU L, YAN S M, CAI C B, et al. Untargeted detection of illegal adulterations in Chinese glutinous rice flour (GRF) by NIR spectroscopy and chemometrics: specificity of detection improved by reducing unnecessary variations[J]. Food Analytical Methods, 2013(6):1568-1575.

[73] XU L, YAN S M, CAI C B, et al. Untargeted detection and quantitative analysis of poplar balata (PB) in Chinese propolis by FT- NIR spectroscopy and chemometrics [J]. Food Chemistry, 2013, 141(4):4132-4137.

[74] XU L, SHI P T, YE Z H, et al. Rapid analysis of adulterations in Chinese lotus root powder (LRP) by near -infrared (NIR) spectroscopy coupled with chemometric class modeling techniques [J]. Food Chemistry, 2013, 141(3): 2434-2439.

[75] XU L, YAN S M, CAI C B, et al. The feasibility of using near -infrared spectroscopy and chemometrics for untargeted detection of protein adulteration in yogurt: removing unwanted variations in pure yogurt [J/OL].(2013 -06 -01)[2018 -02 -11].https:∥www.hindawi.com/journals/jamc/2013/201873/abs/.

[76] XU L, FU X S, FU H Y, et al. Rapid detection of exogenous adulterants and species discrimination for a Chinese functional tea (banlangen) by Fourier -transform near -infrared (FT- NIR) spectroscopy and chemometrics[J]. Journal of Food Quality, 2015, 38(6):450-457.

[77] XU L, SHI W, CAI C B, et al. Rapid and nondestructive detection of multiple adulterants in kudzu starch by near infrared (NIR) spectroscopy and chemometrics[J]. LWT -Food Science and Technology, 2015, 61(2): 590-595.

[78] XU L, FU H Y, YANG T M, et al. Enhanced specificity for detection of frauds by fusion of multi -class and one -class partial least squares discriminant analysis: geographical origins of Chinese shiitake mushroom[J]. Food Analytical Methods, 2016, 9(2): 451-458.

[79] ZHANG L, LI P, NA W, et al. Multivariate adulteration detection for sesame oil[J]. Chemometrics & Intelligent Laboratory Systems, 2017,161:147-150.

[80] FU H Y, LI H D, XU L, et al. Detection of unexpected frauds: screening and quantification of maleic acid (MA) in cassava starch (CS) by Fourier transform near -infrared (FT -NIR) spectroscopy[J]. Food Chemistry, 2017, 227: 322-328.

[81] FAN Y, LIU L, SUN D, et al. “Turn -off” fluorescent data array sensor based on double quantum dots coupled with chemometrics for highly sensitive and selective detection of multicomponent pesticides[J]. Analytica Chimica Acta, 2016, 916: 84-91.

[82] YANG T M, ZHOU R, JIANG DU, et al. Rapid detection of pesticide residues in Chinese herbal medicines by Fourier transform infrared spectroscopy coupled with partial least squares regression[J/OL]. (2016 -11 -14)[2017 -02 -11]. https:∥www.hindawi.com/journals/jspec/2016/9492030/abs/.

[83] HOU M, HUANG Y, MA L, et al. Quantitative analysis of single and mix food antiseptics basing on SERS spectra with PLSR method[J]. Nanoscale Research Letters, 2016, 11(1):1-8.

[84] MAHESH S, JAYAS D S, PALIWAL J, et al. Compari -son of partial least squares regression (PLSR) and principal components regression (PCR) methods for protein and hardness predictions using the near -infrared (NIR) hyperspectral images of bulk samples of Canadian wheat[J]. Food and Bioprocess Technology, 2015, 8(1):31-40.

[85] VONGSVIVUT J, HERAUD P, ZHANG W, et al. Rapid determination of protein contents in microencapsulated fish oil supplements by ATR -FTIR spectroscopy and partial least square regression (PLSR) analysis[J]. Food and Bioprocess Technology, 2014, 7(1):265-277.

[86] QIN J, XIE L, YING Y. Determination of tetracycline hydrochloride by terahertz spectroscopy with PLSR model[J]. Food Chemistry, 2015, 170:415-422.

[87] CHENG J H, SUN D W. Partial least squares regression (PLSR) applied to NIR and HSI spectral data modeling to predict chemical properties of fish muscle[J/OL].(2016 -07 -12)[2017 -02 -11].http:∥link.springer.com/article/10.1007/s12393-016-9147-1.

[88] XIONG Z, SUN D W, XIE A, et al. Potential of hyperspectral imaging for rapid prediction of hydroxyproline content in chicken meat[J]. Food Chemistry, 2015, 175:417-422.

[89] XIONG Z, SUN D W, XIE A, et al. Quantitative determination of total pigments in red meats using hyperspectral imaging and multivariate analysis[J]. Food Chemistry, 2015, 178:339-345.

[90] CHENG J H, SUN D W, PU H B, et al. Suitability of hyperspectral imaging for rapid evaluation of thiobarbituric acid (TBA) value in grass carp (Ctenopharyngodonidella) fillet [J]. Food Chemistry, 2015, 171(4):258-265.

[91] XIAO Z, MA S, NIU Y, et al. Characterization of odour -active compounds of sweet orange essential oils of different regions by gas chromatography -mass spectrometry, gas chromatography -olfactometry and their correlation with sensory attributes[J]. Flavour and Fragrance Journal, 2016, 31(1): 41-50.

[92] ZHU J C, CHEN F, WANG L Y, et al. Characterization of the key aroma volatile compounds in cranberry (VacciniummacrocarponAit.) using gas chromatography -olfactometry (GC- O) and odor activity value (OAV)[J]. Journal of Agricultural and Food Chemistry, 2016, 64(24): 4990-4999.

[93] ZHU J C, CHEN F, WANG L Y, et al. Comparison of aroma -active compounds and sensory characteristics of durian (DuriozibethinusL.) wines using strains ofSaccharomycescerevisiaewith odor activity values and partial least -squares regression[J]. Journal of Agricultural and Food Chemistry, 2015, 63(7): 1939-1947.

[94] EL -SHEIKH A H, AL -DEGS Y S. Spectrophotometric determination of food dyes in soft drinks by second order multivariate calibration of the absorbance spectra -pH data matrices[J]. Dyes & Pigments, 2013, 97(2):330-339.

[96] BOERIS V, ARANCIBIA J A, OLIVIERI A C. Determination of five pesticides in juice, fruit and vegetable samples by means of liquid chromatography combined with multivariate curve resolution[J]. Analytica Chimica Acta, 2014, 814(9):23-30.

[97] LOZANO V A, PEA A M D L, DURN -MERS I, et al. Four -way multivariate calibration using ultra -fast high -performance liquid chromatography with fluorescence excitation -emission detection: application to the direct analysis of chlorophylls a, and b, and pheophytins a, and b, in olive oils[J]. Chemometrics & Intelligent Laboratory Systems, 2013, 125(1): 121-131.

[98] RUBIO L, SARABIA L A, ORTIZ M C. Standard addition method based on four -way PARAFAC decomposition to solve the matrix interferences in the determination of carbamate pesticides in lettuce using excitation -emission fluorescence data[J]. Talanta, 2015,138:86-99.

[99] YU Y J, WU H L, SHAO S Z, et al. Using second -order calibration method based on trilinear decomposition algorithms coupled with high performance liquid chromatography with diode array detector for determination of quinolones in honey samples[J]. Talanta, 2011, 85(3):1549-1559.

[100] ZHANG X H, WU H L, WANG J Y, et al. Fast HPLC- DAD quantification of nine polyphenols in honey by using second -order calibration method based on trilinear decomposition algorithm[J]. Food Chemistry, 2013, 138(1):62-69.

[101] WANG J Y, WU H L, CHEN Y, et al. Fast analysis of synthetic antioxidants in edible vegetable oil using trilinear component modeling of liquid chromatography -diode array detection data[J]. Journal of Chromatography A, 2012, 1264: 63-71.

(責任編輯:葉紅波)

Applications of Chemometrics in Food Analysis

CHEN Feng1, LI Hedong2, WANG Yaqi1, FU Haiyan1, 2,*, ZHENG Fuping1,3

(1.DepartmentofFood,NutritionandPackagingSciences,ClemsonUniversity,Clemson,SC29634,USA; 2.SchoolofPharmaceuticalSciences,South-CentralUniversityforNationalities,Wuhan430074,China; 3.BeijingAdvancedInnovationCenterforFoodNutritionandHumanHealth,BeijingTechnologyandBusinessUniversity,Beijing100048,China)

Chemometrics is a novel and unique interdisciplinary technique that integrates mathematics, statistics, chemistry and computer science. Pattern recognition and multivariate calibration method, as the core aspects of the technique, have exhibited overwhelming advantages in massive data mining and processing, as well as resolution and analysis of analytic signals. In addition, it is able to solve complex problems which are difficult to be solved by conventional analytic methods, resulting in the method to be widely used in many research fields, including food analysis. This paper reviews the fundamental principles of chemometrics in regards of its advantages and disadvantages,applications, and recent progresses. Furthermore, the review has pointed out problems which need to be solved in current researches, and highlighted the prospective aspects of the technique.

chemometrics; food analysis; pattern recognition; multivariate calibration

2017 -02 -02

國家自然科學基金資助項目(21576297);國家重點研發計劃項目(2016YFD0400500)。

陳 峰,男,教授,博士生導師,主要從事食品風味營養與質量安全控制方面的研究;

10.3969/j.issn.2095 -6002.2017.03.001

2095 -6002(2017)03 -0001 -15

陳峰,李鶴東,王亞棋,等.化學計量學方法在食品分析中的應用[J]. 食品科學技術學報,2017,35(3):1-15.

CHEN Feng, LI Hedong, WANG Yaqi, et al. Applications of chemometrics in food analysis[J]. Journal of Food Science and Technology, 2017,35(3):1-15.

TS201.2

A

*付海燕,女,副教授,主要從事化學計量學及其在復雜體系中創新性應用方面的研究,通信作者。

猜你喜歡
計量學校正矩陣
基于CiteSpace的醫藥語料庫文獻計量學分析
針刺治療失眠癥的文獻計量學分析
劉光第《南旋記》校正
在Lightroom中校正鏡頭與透視畸變
機內校正
初等行變換與初等列變換并用求逆矩陣
基于科學計量學的公安院??蒲信c評價
矩陣
矩陣
矩陣
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合