?

近紅外光譜技術快速檢測甜葉菊中綠原酸含量

2023-09-01 01:39未俊豐高偉程遠欣呂興娜吉桂珍石文杰
食品與發酵工業 2023年16期
關鍵詞:甜葉菊綠原波長

未俊豐,高偉,程遠欣,呂興娜,吉桂珍,石文杰*

1(晨光生物科技集團股份有限公司,河北 邯鄲,057250) 2(河北省植物資源綜合利用重點實驗室,河北 邯鄲,057250)

甜葉菊原產于南美洲高山草地,是菊科多年生草本植物,也是天然甜味劑的主要來源之一[1-2]。甜葉菊中含有豐富的功能性成分,如甜菊糖苷、黃酮類、綠原酸類等[3]。有研究表明,甜葉菊中的綠原酸含量可達到1.7%~7.2%,是綠原酸重要的來源之一[4]。綠原酸是一種重要的代謝物質,具有抗菌、抗病毒、增高白血球、保肝利膽、抗腫瘤、降血壓、降血脂、清除自由基和興奮中樞神經系統等作用,目前已成功應用于食品、飲料、保健、醫藥、日用化工等多個領域中[5-6]。

近紅外光譜檢測技術是一種操作簡單、快速、綠色、可滿足大批量樣品檢測的方法,已廣泛應用在農業、醫藥、食品、工業等領域[7-8]。張楠楠等[9]應用近紅外光譜技術對土壤鹽分進行了分析,模型的交互驗證殘差均方根(root mean square error of cross validation,RMSECV)和相關系數分別為0.016 8和0.987 5,取得了較為理想的實驗結果;張孝紅等[10]利用漫透射近紅外光譜對小麥面粉中的嘔吐毒素進行了建模分析,模型的相關系數和均方根誤差為0.876和0.21,識別準確率達到了90%;劉秋芳等[11]采用近紅外光譜對石腦油分子組成進行了測定,建立了石腦油的族組成和單體烴分布比例預測模型,研究表明所建的模型的預測值與實測值吻合度高,預測準確性好。近紅外光譜在甜葉菊檢測中也有應用,湯其坤等[12]研究了使用近紅外光譜技術直接掃描甜葉菊干葉片,建立了甜菊苷和萊鮑迪苷A的檢測模型;高樂樂等[13]研利用近紅外光譜分析技術結合化學計量學方法對甜菊糖吸濕過程進行表征、解析,從而揭示吸濕過程中水的吸附方式和鍵合作用;通過吸濕過程光譜并采用外部參數正交算法消除樣品中水分的影響,建立甜菊糖中萊鮑迪苷A含量的快速分析方法。目前甜葉菊中綠原酸含量的測定主要是通過高效液相色譜法,該方法雖然結果較為準確,但是其操作復雜繁瑣,分析時間較長,成本較高,難以滿足大批量樣品的測定[14]。因此需要一種新的快速檢測方法,用來測定綠原酸含量。張蘋蘋等[15]基于漫反射近紅外光譜法建立了甜葉菊中甜菊糖苷、綠原酸和水分的模型。但研究中未對光譜預處理和特征光譜選擇方法的深入研究和探討。本研究利用近紅外光譜技術,對144個甜葉菊樣本原始光譜進行了不同方式的預處理,隨后使用多個波長選擇算法提取特征波長,最后采用偏最小二乘法建立預測模型進行比較,對近紅外檢測綠原酸的光譜處理和波長選擇進行了比較和研究,以期為近紅外檢測檢測綠原酸過程中光譜預處理和特征波長選擇提供參考。

1 材料與方法

1.1 樣本收集

收集不同品種、不同種植地區的154個樣本(包括甘肅、新疆、內蒙、河北等產地,包括普興1號、普興3號、普興6號等品種)。

1.2 儀器與設備

波通 DA7250型近紅外分析儀,波通瑞華科學儀器(北京)有限公司;安捷倫1260液相色譜儀,安捷倫科技(中國)有限公司;CLF-02100克密封形手提式中草藥粉碎機,溫嶺市創力藥材器械有限公司;SQP 電子天平,賽多利斯科學儀器(北京)有限公司。

1.3 化學真實值測定

確定的待檢樣品在混樣機中混合15 min,充分混勻。平行準確稱取2份1.0~1.1 g(精確至0.1 mg)甜葉菊粉末樣品于150 mL或250 mL錐形瓶(廣口或磨口)中,用50 mL移液管準確加入100 mL純凈水。用天平準確稱取樣品瓶和液的總質量m1(精確至0.01 g),然后使用保鮮膜密封錐形瓶瓶口,置于(80±2) ℃水浴鍋中水浴萃取1 h。水浴完成后取出錐形瓶,取下保鮮膜,擦干錐形瓶表面水滴,置于天平上補足樣品質量至m2(m2和m1質量差應小于0.1 g),搖勻樣品液,過0.45 μm濾膜后,裝液相小瓶進行檢測。留樣需4 ℃保存(樣品液需在8 h內進液相檢測)。

1.4 近紅外光譜采集

將上述確定的待檢含量樣品混合完全后裝入樣品杯中,輕輕壓平,將樣品杯放入旋轉臺上,采集樣品漫反射光譜信息。

1.5 模型預處理和特征波長選擇

為提高建立模型的準確性和精度,減少光譜中摻雜的干擾信息、噪聲和大量的冗余,建模前需要對原始光譜進行預處理[16-17]。本研究使用的預處理算法包括:無光譜處理(original)、標準正態變換(standard normal variate,SNV)、多元散射校正(multiplicative scatter correction,MSC)、Savitzky-Golay卷積平滑(SG)、SNV+MSC、MSC+SG、SNV+SG、SNV+去趨勢校正(de-trending,DT)[18]。

由于光譜中存在著大量的干擾信號,如果使用全光譜建模,必定會降低模型的準確性和精度。因此在建模之前,需要找到真正能反映目標成分的波長或波段,改善模型的各項性能,降低計算成本[16]。本研究使用的特征波長選擇算法包括:競爭自適應重加權采樣法(competitive adapative reweighted sampling,CARS)、無信息變量消除法(uninformative variables elimination,UVE)和連續投影算法(successive projections algorithm,SPA)[19-22]。

1.6 模型建立及評價

本研究使用偏最小二乘法(partial least squares,PLS)創建近紅外模型,通過交互驗證相關系數(correlation coefficient in cross validation,RCV)和RMSECV來判斷模型的準確性,一般來說,RCV越大,RMSECV越小,模型的準確性和可信度就越高[23]。用驗證集相關系數(correlation coefficient in validation,RP)和驗證集殘差均方根(root mean square error of prediction,RMSEP)來驗證模型的精度,RP越大,RMSEP越小,模型的準度就越高,預測效果就越好[23]。

2 結果與分析

2.1 剔除異常樣本

異常樣本會影響模型的準確性和精度,因此在建模前需要剔除異常樣本。本研究使用馬氏距離法(mahalanobis distance,MD)剔除異常樣本,其可以計算2個未知樣本集的相似度,排除變量之間的相關性的干擾[24]。

2.2 樣本集的劃分

本研究共使用了144個實驗樣本,按照4∶1的比例隨機劃分為建模集和驗證集,即建模集的樣本數量為115個,驗證集的樣本數量為29個(表1)。

表1 樣本劃分統計表

2.3 原始光譜及預處理

光譜在測量的過程中會產生噪聲和散射,因此在建模前需要對原始光譜進行預處理(圖1)。預處理算法包括:SNV、SG平滑和MSC。由表2可知,與原始光譜相比,每一種預處理算法下的模型都有一定的提升,表明在建模之前進行光譜預處理是非常有必要的。每個預處理下所建立模型的RCV均大于0.9,RMSECV均小于0.352,說明每個預處理均有較好的預測能力。但是每個預處理的模型評價參數之間的差異較小,因此選擇所有的預處理算法進行后續的特征波長算法建模。

a-綠原酸原始光譜圖;b-SG平滑處理后的光譜圖;c-SNV處理后的光譜圖;d-SNV+SG平滑處理后的光譜圖;e-SNV+MSC處理后的光譜圖;f-MSC處理后的光譜圖;g-MSC+SG平滑處理后的光譜圖;h-SNV+DT處理后的光譜圖

2.4 特征波長的篩選

2.4.1 基于UVE特征波長篩選

無信息變量消除法算法可有效去除與目標物質無關的波長,降低模型計算量,提高模型準確性。與原始光譜建模效果相比,篩選之后每一種預處理算法下的模型性能均有一定幅度的提升,直接對原始光譜進行UVE特征波長篩選的建模效果依然是最差的(表3)。在7個預處理算法中,MSC+SG平滑算法提升效果最為明顯,該算法只使用了22.7%的波長RMSECV卻提升了25.26%,該模型的RMSECV、RCV、RMSEP和RP分別為0.263 1、0.945 3、0.247 2和0.952 1。

表3 UVE特征波長篩選結果

2.4.2 基于CARS特征波長篩選

競爭自適應重加權采樣法是一種結合蒙特卡洛隨機抽樣與PLS模型回歸系數的特征變量選擇方法,可有效篩選出最佳波長組合。從表4可知,每一種預處理算法下的模型的RCV均小于0.307,RMSECV均大于0.925,均優于原始光譜的建模效果。通過比較不同預處理算法的建模效果,SNV+SG平滑算法優化效果最好,該算法只使用了23.18%的波長RMSECV縮小了23.52%,該模型的RMSECV、RCV、RMSEP和RP分別為0.269 2、0.942 7、0.245 2和0.952 8。

表4 CARS特征波長篩選結果

2.4.3 基于SPA特征波長篩選

連續投影算法是一種矢量空間共線性最小化的前向變量選擇算法,它的優勢在于提取全波段的幾個特征波長,能夠消除原始光譜矩陣中冗余的信息,可用于光譜特征波長的篩選。經過SPA算法篩選之后,2個預處理算法下的模型性能不僅沒有得到提升,反而有所下降,其他預處理算法的模型性能只有小幅度提升(表5)。相對其他預處理算法的建模效果,MSC+SG平滑算法的建模效果最好,該算法只使用了6.38%的波長RMSECV縮小了19.63%,該模型的RMSECV、RCV、RMSEP和RP分別為0.300 5、0.928 6、0.298 7和0.930 0。

表5 SPA特征波長篩選結果

2.5 最佳模型篩選

基于不同特征波長選擇算法的建模結果,3種波長選擇算法對模型性能均有一定的提升,UVE和CARS對模型性能的提升效果比較明顯,提高幅度也大致一致,SPA對建模效果的優化稍差(表6)。經過特征波長篩選之后,RMSECV和RMSEP均有所降低;RCV和RP均有所升高。MSC+SG平滑預處理算法和UVE特征波長選擇算法的結合下,RCV達到最大,RMSECV值最小,說明此時所建立的模型效果最佳。預測效果如圖2所示。

圖2 UVE-PLS模型甜葉菊綠原酸預測結果

表6 不同特征波長選擇算法的建模結果

3 結論與討論

本研究利用近紅外光譜技術結合PLS對甜葉菊綠原酸含量的光譜數據進行了近紅外模型分析。使用了7種預處理算法和3種特征波長選擇算法,每一種預處理算法下的模型都有一定的提升,證明了在建模之前進行光譜預處理的必要性。因為甜葉菊樣本顆粒的不均勻、采集樣本的條件不一致等因素影響,會對原始光譜產生影響,如果直接采用原始光譜及所有波長點建模效果會比較差,因此建模前有必要對樣本進行預處理并對波長進行選擇。MSC+SG平滑和SNV+SG平滑預處理效果接近,都比單一預處理效果好,SG平滑主要起到降低數據噪聲的作用,有效地提高了數據的信噪比。SNV和MSC雖然計算方式不一致,但都能起到消除顆粒大小不均勻,光程變化等因素的影響。UVE和CARS都大幅度減少建模使用的波長數量,從而降低模型的復雜度和計算量。UVE選擇的波長數建模主因子數更少,可以有效避免過擬合。連續投影算法下雖然也可以大量減少波長數量,但是波長減少一些有用信息也被剔除,導致光譜信息嚴重不足,模型的性能只有小幅度提升。

通過不同預處理算法和特征波長選擇算法建模后評價參數的比較,確定了綠原酸含量最佳的偏最小二乘法模型。預處理算法為:MSC+SG平滑,特征波長選擇算法為UVE,共選擇了32個特征波長,此時所建立的模型效果最佳。模型的RMSECV、RCV、RMSEP和RP分別為0.263 1、0.945 3、0.247 2和0.952 1。建模集、交叉驗證和驗證集的相關系數均大于0.94,殘差均方根均小于0.27,模型的準確性和精度都較高,表明使用近紅外光譜技術快速檢測甜葉菊綠原酸含量是可行的。

為進一步提高預測模型的準確性和精度,應該擴大樣本數量,增加樣本的多樣性,使其滿足不同來源甜葉菊樣本的綠原酸含量預測。另外還可使用其他預處理算法和特征波長選擇算法,使模型的準確性和精度得到提升。

猜你喜歡
甜葉菊綠原波長
HPLC-PDA雙波長法同時測定四季草片中沒食子酸和槲皮苷的含量
蔓三七葉中分離綠原酸和異綠原酸及其抗氧化活性研究
綠原酸對3T3-L1前脂肪細胞分化的抑制作用
甜葉菊化學成分及藥理活性研究進展
北方地區甜葉菊的成株移栽室內采種技術
金銀花中綠原酸含量不確定度的評定
雙波長激光治療慢性牙周炎的療效觀察
基于GIS的武威市涼州區甜葉菊種植適宜性評價
日本研發出可完全覆蓋可見光波長的LED光源
甜葉菊及其糖苷的研究與發展探索
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合