?

基于近紅外光譜技術聯合極限學習機的藍莓貯藏品質定量模型建立

2022-09-08 01:37朱金艷朱玉杰馮國紅曾明飛劉思岐
食品與發酵工業 2022年16期
關鍵詞:花青素藍莓可溶性

朱金艷,朱玉杰,馮國紅,曾明飛,劉思岐

(東北林業大學 工程技術學院,黑龍江 哈爾濱,150040)

藍莓果實富含花青素、維生素C、可溶性固形物等營養成分,具有防止腦神經老化、抗癌、軟化血管、緩解視疲勞、提高人體免疫力等功能[1],被譽為“水果皇后”,深受消費者青睞。由于藍莓果皮薄且軟,易受到損傷,從而被病原菌侵染,致使品質發生劣變,影響其采摘之后的貯存和銷售。目前對于藍莓果實采摘后諸多品質指標的檢測多以傳統化學方法為主,檢測過程耗時長且復雜,化學試劑還會污染藍莓果實,因此創建一種高效且無損的藍莓品質檢測方法十分有必要的。

隨著化學計量學的發展和計算機技術的進步,近紅外光譜技術憑借其無損、高效、可實時檢測等特點,已普遍應用在食品加工業[2-4]、制藥工業[5]、石油化工工業[6]等領域。極限學習機(extreme learning machine,ELM)是一種單隱含層前饋神經網絡算法,神經網絡結構中輸入層和隱含層間的連接權值以及隱含層神經元的閾值是隨機產生的,并且產生之后訓練網絡時不需要對其做出調整,只需要設置隱含層神經元個數便能獲得唯一最優解[7-8],大大提升了學習效率。羅一甲等[9]利用近紅外技術建立了葡萄總酚多元散射校正結合競爭性自適應重加權算法與遺傳算法的ELM模型,得到預測集相關系數(correlation coefficient of prediction,Rp)和均方根誤差(root mean square error of prediction,RMSEP)分別為0.901 3和1.686 8,實現了對葡萄總酚含量的預測。BUREAU等[10]對杏果的可溶性固形物含量基于近紅外光譜建立了偏最小二乘(partial least squares,PLS)模型進行分析,得到的RP和RMSEP分別為0.92和0.98%。CAYUELA[11]使用近紅外光譜儀對油桃品質進行了檢測,建立了果實的可溶性固形物、硬度、單果重和顏色指數PLS預測模型,得到R值分別為0.95、0.94、0.91、0.81,RMSEP 值為6.78%、8.77%、10.39%和8.8%。

目前基于近紅外光譜技術對藍莓的研究較多,但利用ELM建立藍莓貯藏品質模型的研究鮮有報道。因此本研究以遼寧丹東產“瑞卡”藍莓為研究對象,低溫4 ℃貯藏條件下,利用光譜儀采集第0、3、6、9、12天藍莓樣本的近紅外光譜,并通過理化實驗獲取可溶性固形物、維生素C和花青素含量真實值,對光譜進行預處理后運用聯合區間偏最小二乘法(synergy interval partial least squares,SiPLS)篩選出能代表全譜的少量波長,旨在建立近紅外ELM模型實現對藍莓果實貯藏期間的可溶性固形物、維生素C和花青素含量無損檢測,以期推動近紅外光譜分析技術在無損檢測藍莓的營養成分方面的研究進展,為鮮食藍莓低溫貯藏品質無損快速定量檢測提供參考。

1 材料與方法

1.1 材料

藍莓品種:瑞卡。2021年6月10日從遼寧丹東購置,挑選出大小和成熟度一致且無損傷的藍莓作為實驗樣品,按20個果實一組,分成150組,裝于保鮮盒內,放置生化培養箱中4 ℃保存。

1.2 儀器與設備

LabSpec 5000光譜儀,美國ASD公司;LYT-330手持式折光儀,上海淋譽公司;UV-1801紫外可見分光光度計,北京北分瑞利分析儀器(集團)有限責任公司;SPX-70BⅢ型生化培養箱,天津市泰斯特儀器有限公司;TD6離心機,長沙湘智離心機儀器有限公司;LT202C電子天平,常熟市天量儀器有限責任公司。

1.3 試驗方法

1.3.1 光譜采集

采用LabSpec 5000光譜儀,使用二分光纖探頭,在儀器附帶軟件IndicoPro Version 3.1中采集藍莓樣品350~2 500 nm的近紅外漫反射光譜,掃描次數32,采集間隔1 nm。采集藍莓樣品光譜之前,先將光纖探頭對準白板進行空白校準,然后在藍莓果實赤道面每隔120°采集,在ViewSpecPro軟件中計算3次平均結果作為樣品的近紅外光譜,以每組中20個樣品的平均光譜作為該組樣本的光譜,共得到150組樣本光譜。

1.3.2 可溶性固形物含量測定

首先用蒸餾水對折光儀校正零點,然后用紗布包裹樣品擠出汁,吸取汁液滴于折光儀進行讀數,每組樣本測量3次取平均值作為該組樣本的可溶性固形物含量值。

1.3.3 維生素C含量測定

1.3.3.1 標準曲線制作

用天平準確稱取10 mg抗壞血酸(分析純)于100 mL的棕色容量瓶中,加2 mL 10%(體積分數)HCl混合均勻,用蒸餾水定容至刻度,得到維生素C標準溶液[12],然后吸取維生素C標準溶液0、2、3、4、5、6 mL到6個50 mL容量瓶中,加蒸餾水定容,借助UV-1801紫外可見分光光度計以蒸餾水為空白對照在243 nm處測定其吸光值[13],制作標準曲線。

1.3.3.2 維生素C含量測定

稱取2 g左右藍莓樣品于研缽中,加入2 mL 10% HCl進行研磨,轉移液體到試管中,加入蒸餾水定容到25 mL,振蕩搖勻。過濾后取濾液2 mL加入到有0.2 mL 10% HCl的試管中,再用移液器加入1% HCl溶液0.4 mL,用蒸餾水定容至10 mL。利用紫外可見分光光度計測定其在243 nm處吸光度,以蒸餾水為空白對照。計算如公式(1)所示:

(1)

式中:B,從標準曲線得到的維生素C含量,mg;V1,測定時吸取樣品液的體積,mL;V2,樣品液定容體積,mL;W,樣品質量,g。

1.3.4 花青素含量測定

1.3.4.1 標準曲線制作

參考王姍姍[14]的方法,精準稱取2 mg矢車菊-3-O-葡萄糖苷標準品放于20 mL棕色容量瓶中,用1%(體積分數)鹽酸-甲醇溶液定容得到標準溶液,避光保存。分別取上述溶液0、0.4、0.8、1.2、1.6、2.0 mL到試管中,加入1%鹽酸-甲醇溶液定容至10 mL作為待測液。利用紫外可見分光光度計測定530、600 nm處的吸光度,取差值作為其吸光度,制作標準曲線。

1.3.4.2 花青素含量測定

稱取藍莓果實2 g,加入1%鹽酸-甲醇溶液進行研磨,液體移至試管中,用1%鹽酸-甲醇溶液定容至20 mL,放置于生化培養箱中低溫(4 ℃)提取25 min[15]。浸提完畢后,放入離心機中離心10 min(4 000 r/min),取出上清液1 mL至試管中,加入蒸餾水稀釋至8 mL測定吸光度。計算如公式(2)所示:

(2)

式中:C,樣品質量濃度,μg/mL;V,樣品液體積,mL;n,稀釋倍數;W,樣品質量,g。

1.4 數據處理方法

將采集的藍莓樣本近紅外光譜數據導入ViewSpecPro軟件中,計算各組樣本的平均光譜作為該組樣本的近紅外光譜數據并導出文件,然后在Unscrambler X 10.4軟件中進行預處理。由于外界及光譜儀自身擾動的影響,獲得的藍莓光譜在350~550 nm 及2 300~2 500 nm波段噪聲較大,故選取550~2 300 nm波段作為建模的全波段。

藍莓樣品通過聯合X/Y的異常樣本識別方法(outliner samples detection based on joint X-Y distances,ODXY)算法剔除異常樣本數據后,用聯合X-Y距離樣本集劃分(sample set partitioning based on joint X-Y distances,SPXY)算法劃分驗證集和校正集,然后對光譜進行標準正態變換(standard normal variate,SNV)、多元散射校正(multiplicative scatter correction,MSC)、卷積平滑濾波處理(savitzky-golay smoothing,SG)等預處理以消除噪聲和雜散光對模型性能的影響,在預處理的基礎上采用SiPLS方法篩選出能代表全部光譜信息的特征波段,對光譜數據進行降維。以特征波段分別建立ELM和PLSR模型,利用校正集相關系數(Rc)、驗證集相關系數(Rp)、校正集均方根誤差(root mean square error of correction,RMSEC)、驗證集RMSEP對所建模型的精確性進行評估,分別得出各成分對應的最優模型。本研究中光譜數據的預處理均通過Unscrambler X 10.4軟件完成,在MATLAB 2016b中建立定量模型,利用Origin 2021軟件繪圖。

2 結果與分析

2.1 異常樣本剔除

藍莓樣本在進行光譜掃描和理化實驗的過程中,由于儀器異常、操作錯誤和環境的影響,存在個別樣本測量結果異常,考慮到光譜數據X和化學值Y之間的聯系,本研究采用ODXY進行異常樣本剔除[16],以提高模型精確度。通過MATLAB軟件對可溶性固形物、維生素C和花青素的150組樣本進行ODXY距離計算,分別有6、15、16個樣本距離明顯超過閾值,故判定為異常值將其剔除。

2.2 樣本集劃分

對藍莓樣本剔除異常值后,采用SPXY算法以4∶1的比例劃分校正集和驗證集,該算法在計算樣本間距離時能同時考慮了光譜吸光度和待測成分含量[17-18],最大程度地表征了樣本的分布,增強了模型的穩定性。劃分結果見表1,3個指標的校正集樣本含量范圍均較廣,包含了驗證集樣本的含量取值范圍,說明劃分的結果具有代表性,能夠用于構建藍莓果實的可溶性固形物、維生素C和花青素的近紅外定量模型。

表1 SPXY算法劃分校正集和驗證集結果統計Table 1 The result statistics of correction set and validation set are divided by SPXY algorithm

2.3 光譜分析

a-不同貯藏時間藍莓樣本平均光譜圖;b-藍莓原始光譜圖圖1 藍莓近紅外光譜圖Fig.1 Near-infrared spectrum of blueberry

2.3.1 光譜預處理

針對藍莓原始光譜重疊、光散射較為嚴重的問題,采用SNV、MSC、SG、一階導數(1st-D)、二階導數(2nd-D)等方法來消除背景干擾,校正樣本因散射引起的誤差,建模結果見表2。

對表2分析可以得出,經過預處理的模型交叉驗證均方根誤差(root mean square error of cross validation,RMSECV)均比原始光譜建模的值小,且相關系數也比原始光譜建模的高,說明各種預處理都能使模型穩健性提高??扇苄怨绦挝锝?nd-D+SNV處理得到的模型最好,Rc為0.896 1,RMSEC為0.869 5;維生素C最優預處理是2nd-D+SNV,Rc和RMSECV分別為0.716 5、1.162 2;花青素最優預處理是SNV,Rc和RMSECV為0.744 2、3.331 4。

表2 不同光譜預處理方法建模結果Table 2 Modeling results of different spectral pretreatment methods

2.3.2 SiPLS優選光譜特征波段

藍莓的光譜中除了含有能反映可溶性固形物、維生素C和花青素含量的特征信息外,也包含了大量無用信息。針對全譜建模時模型復雜度高、冗余波段嚴重影響校正模型的準確度的問題,運用SiPLS算法對全光譜篩選最優波段,以提高模型的預測效果[20]。將全光譜劃分為10個等寬子區間,表3列出了可溶性固形物、維生素C和花青素在各個區間里分別建立PLS模型時RMSECV從小到大的前4個區間的結果。

表3 可溶性固形物、維生素C和花青素劃分10個子區間建模結果Table 3 The results of modeling soluble solids,vitamin C and anthocyanins divided into 10 sub-intervals

運用SiPLS算法將4個區間進行組合建模,分析模型的最優波段,結果見表4??扇苄怨绦挝锏淖顑灲M合是6,8,9,10四個區間聯合,其RMSECV和Rc為1.305 7、0.712 6。維生素C的9,10兩個區間聯合最優,RMSECV為1.241 0,Rc為0.642 5?;ㄇ嗨卦?,8,9,10四個區間的聯合時模型最好,RMSECV和Rc分別為3.464 0和0.696 7。

表4 SiPLS建模結果Table 4 The result of the SiPLS algorithm building the model

2.4 ELM定量模型建立與分析

極限學習機作為一種神經網絡算法,其模型的性能受隱含層神經元個數影響很大,設置較大會使模型過擬合,同時也會增加網絡訓練時間;設置較小會使得模型欠擬合,均不利于藍莓各指標含量預測。因此,本研究采用從10開始以5為間隔增加到75逐步尋優的方法確定隱含層神經元個數[21]。本文激活函數選擇Sigmoid函數,以可溶性固形物、維生素C和花青素的校正集樣本經SiPLS篩選出的特征波段作為輸入,對應的含量值作為輸出建立ELM預測模型。

對可溶性固形物、維生素C和花青素以預處理后的全譜和經SiPLS篩選的特征波段分別建立PLSR、ELM模型的結果見表5。由表5可以看出,以全譜建立的ELM模型預測集相關系數為0.71~0.81,而PLSR的預測集相關系數只有0.62~0.74,說明本研究采用的ELM模型比PLSR方法預測精度更高,可以實現藍莓的可溶性固形物、維生素C和花青素含量在線快速檢測,并且經過SiPLS篩選后建立的ELM模型比全光譜建立的ELM模型所使用的變量數更少、預測效果更優,說明SiPLS方法對近紅外光譜建模方面有很大的潛力。

表5 不同算法建立的定量模型對比分析Table 5 Comparison and analysis of quantitative models established by different algorithms

可溶性固形物的最優模型為2nd-D+SNV-SiPLS-ELM,Rc為0.920 5,RMSEC為0.764 4,Rp為0.882 6,RMSEP為0.539 7;維生素C的最優預測模型為2nd-D+SNV-SiPLS-ELM,Rc、RMSEC、Rp、RMSEP分別為0.908 7、0.695 6、0.897 2、0.624 3;花青素的最優模型為SNV-SiPLS-ELM,Rc、RMSEC、Rp、RMSEP分別為0.942 1、1.671 0、0.869 3、2.041 4??扇苄怨绦挝?、維生素C和花青素的近紅外光譜ELM定量模型預測值與真實值分析見圖2~圖4。

圖2 ELM模型預測藍莓可溶性固形物含量Fig.2 The ELM model predicts the soluble solids content of blueberry

圖3 ELM模型預測藍莓維生素C含量Fig.3 The ELM model predicts the vitamin C content of blueberry

圖4 ELM模型預測藍莓花青素含量Fig.4 The ELM model predicts the anthocyanin content of blueberry

3 結論與討論

本文以遼寧丹東產“瑞卡”藍莓為研究對象,基于NIRS技術結合ELM算法對藍莓的可溶性固形物、維生素C、花青素含量建立了定量預測模型。通過分析MSC、SNV和1st-D等9種預處理方法對預測模型的影響,可溶性固形物和維生素C經2nd-D+SNV處理最優,花青素的最優預處理為SNV。針對全光譜建模時變量冗雜的問題,本研究在最優預處理的基礎上分別對可溶性固形物、維生素C和花青素進行SiPLS特征波段篩選,建立了SiPLS-ELM定量模型??扇苄怨绦挝?、維生素C和花青素分別篩選出701、351、701個特征波長,建立的SiPLS-ELM模型驗證集相關系數Rp分別為0.882 6、0.897 2、0.869 3;全譜-ELM模型Rp分別為0.765 5、0.713 2、0.805 0。

從預測精度分析,SiPLS-ELM模型比全光譜建立的模型精度更高,且使用的變量僅為全譜的1/5~2/5,這與丁姣等[22]建立Si-ELM模型檢測食醋中SSFSC 含量的研究結論一致。關婷予等[23]建立大米蛋白粉組成成分的ELM模型,預測精度與PLS模型相比平均提高33%;本研究構建的SiPLS-ELM模型RMSEP分別為0.539 7、0.624 3、2.041 4,與全譜-PLS模型相比,預測精度平均提高了50%。與劉小路等[24]建立的藍莓花青素PLS模型相比,本研究所建SNV-SiPLS-ELM模型預測相關系數提高了9%,預測誤差降低了27%。無論是建模效果還是驗證效果,相對于傳統的PLSR模型,本研究所建SiPLS-ELM模型均更為理想,ELM方法結合近紅外光譜技術在藍莓品質快速分析方面有極高的研究意義和應用價值。

本研究采集了藍莓在4 ℃貯藏12 d共150組樣本的數據進行建模分析,下一步研究會增加樣本數量,延長貯藏時間,建立普適性更強的模型,以實現對不同貯藏期藍莓果實可溶性固形物、維生素C和花青素含量的檢測。

猜你喜歡
花青素藍莓可溶性
山葡萄原花青素在食品中的穩定性研究
藍莓建園技術
射血分數降低的心力衰竭患者血清可溶性ST2與心臟重構的相關性
藍靛果花青素穩定性研究
藍莓采后立即追肥 謹防黃刺蛾介殼蟲
不同處理對刺葡萄愈傷組織花青素和原花青素生物合成的影響
西海岸的藍莓名片
甜甜的藍莓果
哇,變色啦!
0.8%的硼素用量對甜瓜最有利
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合