?

中寧枸杞品種的近紅外光譜快速鑒別

2023-11-08 06:11龍若蘭李朵李佩佩胡娜馮丹孫菁
食品與發酵工業 2023年20期
關鍵詞:積分球枸杞光纖

龍若蘭,李朵,李佩佩,胡娜,馮丹,孫菁*

1(中國科學院西北高原生物研究所 青海省青藏高原特色生物資源研究重點實驗室,青海 西寧,810008) 2(中國科學院西北高原生物研究所 中國科學院藏藥研究重點實驗室,青海 西寧,810008) 3(中國科學院大學 生命科學學院,北京,100049)

枸杞子為茄科(Solanaceae)植物寧夏枸杞(LyciumbarbarumL.)的干燥成熟果實[1],系著名藥材和保健品,具有抗腫瘤、防衰老、降血脂、抗氧化等功效[2-5]。作為一種“藥食兩用”的植物資源,隨著生活水平的提高和保健觀念的增強,國內外市場對于枸杞的需求逐漸擴大。枸杞主要以枸杞干果的形式在市場中流通,另外,枸杞果酒、果汁和籽油等相關附加值產品也深受消費者的喜愛[6]。目前,我國枸杞主產區的絕大多數栽培品種均引自寧夏枸杞系列品種[7]。研究表明,不同品種或不同產地的枸杞果實在多酚、糖類、維生素、氨基酸等[8-12]化學成分含量等方面具有較大差異,從而對口感、風味[13]及品質[14]產生不同程度的影響。例如,枸杞多糖含量可作為枸杞果酒的釀造工藝的衡量指標[15],枸杞營養成分含量是枸杞品質評價的指標之一[16]。因此,開展不同品種枸杞的快速、準確判別,有利于根據不同枸杞品種的差異有針對性地開展枸杞資源的利用,提高資源的利用率。

目前,鑒別不同枸杞品種的方法主要有感官判斷和化學方法[17],但是視覺和感官判斷通常存在較大誤差,化學方法則需要對樣品進行粉碎、提取等處理,導致對樣品的破壞性較大。近紅外光譜(near infrared spectrum,NIR)分析技術具有快速、無損、準確等優點,已被成功應用到不同品種和不同產地枸杞的鑒別工作中。例如,許春瑾等[18]利用近紅外光譜技術建立了枸杞的產地判別模型,許生陸等[19]建立了枸杞總糖含量快速準確的檢測方法,所建的2種模型效果均較好。但以上工作皆未對枸杞品種分辨展開研究。同時,不同種植區的枸杞品質之間存在較大差異[20],目前暫未有產自柴達木盆地的不同中寧枸杞的紅外判別方法報道??梢?亟需建立一種快速且準確的鑒別不同枸杞品種方法,方便生產實踐的應用。

因此,本文以12個不同品種的中寧枸杞為研究對象,在譜圖解析的基礎上,利用近紅外光譜技術結合化學計量學方法,建立了不同光譜采集方式下的中寧枸杞品種判別模型,實現了枸杞品種的快速直觀識別,所建方法在生產實踐中具有較好的推廣應用價值,為具體生產實踐提供了一種更為準確快捷的檢測方法。

1 材料與方法

1.1 材料

12個不同品種中寧枸杞樣品于2021年成熟期采自青海省柴達木盆地,由青海大學樊光輝副研究員分別鑒定為大麻葉枸杞、蒙杞1號、寧菜杞、寧杞2號、寧杞3號、寧杞4號、寧杞5號、寧杞6號、寧杞8號、寧杞9號、青黑杞1號和中科綠川1號。每個品種分為3份樣品,共得到36份樣品。樣品經真空冷凍干燥后,粉碎,裝入自封袋后置于干燥器中避光備用。

1.2 儀器與設備

iS50傅里葉變換紅外光譜分析儀,美國Thermo Fisher公司,配有NIR-光纖和NIR-積分球漫反射附件;LGT-10C真空冷凍干燥機,四環福瑞科儀科技發展(北京)有限公司;粉碎機。

1.3 實驗方法

1.3.1 光譜采集

利用傅里葉變換紅外光譜儀的積分球漫反射附件和光纖探頭附件分別采集樣品的NIR-積分球光譜和NIR-光纖光譜。采集條件均為掃描次數64次,分辨率4 cm-1,光譜采集范圍10 000~4 250 cm-1。光譜采集前預熱儀器至少30 min,待儀器穩定后使用,采集過程中實時扣除CO2和水的背景干擾,每份樣品采集3次,取平均譜圖待分析用。實驗室溫度保持在25 ℃左右,濕度控制在35%以下。

1.3.2 模型建立與評價

在TQ analyst軟件中將樣品對應的品種賦值到光譜,再將樣品光譜按照2∶1的比例隨機分為校正集和驗證集。以建模方法:距離匹配(distance match,DM)、判別分析(discriminant analysis,DA),光程類型:Constant、多元散射校正(multivariate scattering correction,MSC)、標準正態變換(standard normal variate,SNV),譜圖類型:原譜圖、一階導數譜圖(first derivative spectrum,D1)、二階導數譜圖(second derivative spectrum,D2)為因素設計3因素3水平正交試驗表(表1)進行正交試驗。其中,原譜圖時不采用平滑處理,D1和D2時進行Norris平滑處理。

表1 建模條件水平因素表Table 1 Modeling condition level factor of variety discrimination model

根據正交試驗下建模條件的組合,記錄不同建模組合條件下模型的校正集、驗證集和樣本集的誤判數,以公式(1)~公式(3)分別計算模型的識別率、預測率和準確率,以此為指標判斷模型效果。以準確率最高的建模條件組合為實際最優組合,對正交試驗結果進行極差分析,得出理論最優組合。將實際最優組合與理論最優組合進行比較,選出最佳建模條件,同時利用相關系數法(correlation coefficient)確定建模波段。最后,利用優化后的建模條件和建模波段建立品種判別模型。比較2種采集方式下模型的效果,建立品種鑒別模型。識別率、預測率、準確率計算分別如公式(1)、公式(2)、公式(3)所示:

(1)

(2)

(3)

利用Python軟件,采用支持向量機(support vector machine, SVM)方法建立模型,以識別率、預測率和準確率為指標評價模型。

1.4 數據處理

對2種NIR采集方式下的譜圖特征吸收峰進行歸屬,對譜圖進行分析,比較不同采集方式下NIR的異同。其次,分別利用TQ analyst和Python軟件,借助DM、DA、SVM等化學計量學分析方法建立不同光譜采集方式下的中寧枸杞品種判別模型,比較不同采集方式下品種判別模型效果的差異。

2 結果與分析

2.1 近紅外光譜特征分析

不同采集方式下的原始光譜如圖1所示。其中,圖1-a為NIR-光纖光譜,圖1-b為NIR-積分球光譜。由圖1-a可以看出,不同采集方式下的近紅外光譜譜圖變化趨勢一致,說明2種不同的采集方式所獲得的光譜信息基本一致。而不同樣品表現出不同的吸光度,其差異說明各樣品化學成分含量不同,光譜數據符合建立紅外品種判別模型要求。

a-NIR-光纖光譜;b-NIR-積分球光譜圖1 不同品種中寧枸杞的原始光譜圖Fig.1 Original spectra of different varieties of L.barbarum

不同品種中寧枸杞的NIR-光纖光譜有8 249、6 770、6 339、5 775、5 665、5 155、4 740、4 322 cm-1等8個系列特征峰,NIR-積分球光譜有8 277、6 759、6 355、5 791、5 681、5 156、4 735、4 261 cm-1等8個系列特征峰。二者的特征峰吸收位置基本相似。

由于近紅外光譜測定的樣品通常為不經過提純等預處理的復雜樣品,各種成分混在一起,即使是單純物質的近紅外光譜,其譜峰也常有重疊,復雜物質的近紅外光譜,其譜峰重疊更為嚴重[21]。因此,對各特征峰進行歸屬,結果發現8 249 cm-1和8 277 cm-1附近為—CH2的二級倍頻吸收,6 770 cm-1和6 759 cm-1附近為醇羥基O—H的一級倍頻吸收,6 339 cm-1和6 355 cm-1附近為N—H的一級倍頻伸縮振動,5 775 cm-1和5 791 cm-1附近為—CH3中C—H的一級倍頻吸收,5 681 cm-1和5 665 cm-1附近為—CH2中C—H的一級倍頻吸收,5 155 cm-1附近為水羥基O—H的合頻吸收,4 740 cm-1和4 735 cm-1附近為N—H的合頻吸收峰,4 322 cm-1和4 390 cm-1附近為—CH3和—CH2中C—H的合頻吸收[22]。

為深入分析譜圖特征,利用一階導數進行了譜圖處理,擴大種間差異性,結果如圖2所示。其中,圖2-a為NIR-光纖一階導數譜圖,圖2-b為NIR-積分球一階導數譜圖。由圖2可知,譜圖經過一階導數的處理后,各樣品的NIR-積分球譜圖差異擴大,且樣品的譜圖間差異大于NIR-光纖譜圖。

a-NIR-光纖一階導數光譜;b-NIR-積分球一階導數光譜圖2 不同品種中寧枸杞的一階導數譜圖Fig.2 First derivative spectra of different varieties of L.barbarum

2.2 不同采集方式下枸杞品種判別模型

2.2.1 DM、DA模型

將樣品的近紅外光譜輸入TQ analyst軟件,按照1.3節方法進行實驗。利用正交試驗優化NIR-光纖、NIR-積分球建模條件,并對試驗結果進行極差分析,結果如表2所示。

表2 建模條件優化結果Table 2 The results of modeling condition optimization

由表2各水平的K值可知,NIR-光纖模型的理論最優組合為A2B3C2,即No.17(DA+SNV+D1)。由R值可知,建模方法是影響判別模型的主要因素,其次為譜圖類型,光程類型對模型建立的影響最小。以DA+SNV+D1為建模條件,建模波段為9 880~4 364 cm-1建立品種判別模型,模型識別率、預測率和準確率均為100.00%。NIR-光纖品種判別模型可用于識別不同品種的中寧枸杞。

NIR-積分球除No.1樣品外,在其他建模條件下的識別率、預測率和準確率均為100.00%。以DA+SNV+D1為建模條件,建模波段為9 880~4 364 cm-1建立品種判別模型。同一品種樣品在空間的同一區域聚集,不同品種間各自分開,表明模型的分類效果較好,可以快速準確判別不同品種中寧枸杞。

2.2.2 SVM模型

將樣品的紅外數據輸入Python軟件,在SVM方法下建立2種采集方式下的物種判別模型。其中,NIR-光纖模型的識別率為79.16%,預測率為83.33%,準確率為80.56%;NIR-積分球模型的識別率、預測率和準確率均為100%,二者驗證集的分類情況如圖3所示。由圖3可知,NIR-光纖模型在驗證時將蒙杞1號和寧杞5號分類錯誤,而NIR-積分球模型均識別正確,效果明顯優于NIR-光纖模型。

a-NIR-光纖模型分類圖;b-NIR-積分球模型分類圖圖3 NIR-光纖和NIR-積分球品種判別模型分類圖Fig.3 Classification diagram of NIR-optical fiber and NIR-integrating sphere model

3 討論

一階導數處理能有效提升譜圖的信噪比,擴大譜圖間差異,有利于提升模型識別效率[23-24]。NIR-積分球一階導數譜圖差異大于NIR-光纖一階導數譜圖,表明積分球漫反射采集方式更適合枸杞樣品,所采集的光譜質量更優,由近紅外譜圖上更能呈現不同品種枸杞間的差異。

SVM在解決小樣本、非線性和高維模式識別問題中表現出許多特有的優勢,被廣泛應用于分類識別[25]。針對紅外光譜的分類特征點較多且復雜的特點,SVM可以通過將特征映射到核空間中降低問題的復雜性,提高分類的準確率[26],使得分類效果在眾多算法模型中脫穎而出。作為一種二元分類模型,SVM在其他藥材的的定性鑒別上也取得了良好的效果[27-28]。因此,本研究采用了SVM作為建模方法進行分類。研究結果也表明,使用SVM開發的分類模型具有很強的魯棒性,可以高置信度地對中寧枸杞的品種進行分類。

比較DM、DA、SVM品種判別模型,均表現為NIR-積分球的分類判別結果優于NIR-光纖結果,雖然二者的準確率均為100.00%,但NIR-積分球模型的區分效果明顯優于NIR-光纖模型,在3D空間中無交叉,空間投影也相互獨立,分類效果更好,表明NIR-積分球采集方式更適用于不同品種中寧枸杞的分類鑒別。耿姝[29]以三七粉末樣品為例,對NIR-積分球和NIR-光纖2種采集方式下的原始光譜及建模效果進行了分析,發現二者的光譜峰形基本一致,但積分球下的光譜更光滑,信噪比更高,譜圖質量更優,且所建模型也以積分球模型效果更佳,這與本研究結果一致。

選擇更合適的光譜采集方式,結合適當的預處理方法,輔以化學計量學方法等“輔助分析手段”,能有效地提取樣品的光譜信息,進而提高模型整體性能[30-31]。

4 結論

利用近紅外積分球漫反射和光纖探頭2種采集方式獲取了不同品種中寧枸杞的近紅外光譜,并對2種譜圖進行了分析,結合化學計量學方法,建立了品種快速識別模型,主要結論如下:a)2種采集方式下的一維近紅外譜圖峰形基本一致,但經過一階導數處理后,樣品在積分球采集方式下得到的光譜圖間差異擴大,且差異程度大于光纖探頭模式的譜圖;b)NIR-積分球模型效果優于NIR-光纖模型,識別率、預測率和準確率均達到100%。研究表明,近紅外光譜技術在定性檢測中是可行的,所建立的模型可準確地鑒別不同品種中寧枸杞,且積分球漫反射附件采集得到的光譜效果優于光纖探頭附件。

猜你喜歡
積分球枸杞光纖
是酸是堿?黑枸杞知道
積分球球內溫度對光通量測量值的影響
FIBBR King-A系列HDMI光纖線
寧夏六月枸杞紅
采枸杞
高品質的忠實還原 FIBBR Ultra Pro2 HDMI光纖線
枸杞到底是怎么養生的?
一條光纖HDMI線的誕生長飛/長芯盛FIBBR工廠走訪實錄
全國產1550nm 窄脈寬光纖放大器
基于積分球數據的面陣航測相機影像輻射校正
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合