?

基于高光譜技術的鮮食水果玉米含水率無損檢測

2021-10-12 01:50廉孟茹張淑娟池江濤穆炳宇孫雙雙
食品與機械 2021年9期
關鍵詞:鮮食波長預處理

廉孟茹 張淑娟 任 銳 池江濤 穆炳宇 孫雙雙

(山西農業大學農業工程學院,山西 太谷 030801)

鮮食玉米含有豐富的蛋白質、脂肪、糖類、鈣、胡蘿卜素、維生素等營養成分[1],是人們餐桌上的美食。鮮食玉米籽粒含水率為70%左右時食用風味和營養最佳,此時為鮮食玉米的最佳收獲期。采收過早,干物質和各種營養成分不足、產量低、效益低;采收過晚會使鮮食玉米風味變差。而人工識別最佳采收期的玉米不僅費時費力,而且還會損傷鮮食玉米。

近年來,高新浩等[10]設計了一種基于機器視覺的鮮食玉米品質檢測分類器,實現了對不同品種、尺寸以及破損程度的鮮食玉米進行分類。但是還未有高光譜成像技術應用于鮮食玉米含水率無損檢測的報道。研究擬采用高光譜技術對鮮食水果玉米進行光譜數據采集并提取,通過比較不同預處理方法和特征波長提取方法,選用決定系數(R2)最大、均方根誤差(RMSE)值最小的處理方法作為鮮食水果玉米的最佳建模方法,以此實現對鮮食玉米含水率的預測。

1 試驗

1.1 材料

鮮食水果玉米樣本于2020年7月17日采摘自山西省榆次區北田鎮北田村,于當天運送至實驗室,選取尺寸大小均勻、無病蟲害的水果玉米144根,其標號,人工剝開玉米苞葉,去除玉米須,采集光譜信息及相關試驗。利用Kennard-Stone算法[11]將鮮食水果玉米樣本按3∶1的比例劃分為校正集和預測集。得到校正集玉米樣本108個,預測集玉米樣本36個。

1.2 主要儀器

高光譜分選儀:ZOLIX Gaia Sorter型,北京卓立公司;

電熱鼓風干燥箱:SY101-2型,天津市三水科學儀器有限公司。

1.3 光譜采集

采集光譜的波長范圍為900~1 700 nm。采集玉米的光譜信息,光譜分辨率為9 nm。設置曝光時間為20 ms,平臺移動速度為2 cm/s,樣本與鏡頭的距離為22 cm。提取樣本感興趣區域為50個像素點×50個像素點。為了消除光強變化和鏡頭中暗流對采后數據的影響以及計算掃描物體的相對反射光譜值,在光譜數據采集前先采集黑白板,并對高光譜采集后的數據進行黑白校正,計算公式為:

(1)

式中:

R——校正后的圖像;

I——原始圖像;

B——黑板校正圖像;

W——白板校正圖像。

1.4 含水率測定

鮮食玉米籽粒稱重后,置于105 ℃電熱鼓風干燥箱內干燥至恒重(6 h左右),測定玉米籽粒烘干后的質量[12],按式(2)計算玉米籽粒含水率。

(2)

式中:

W——鮮食玉米的含水率;

W1——烘干前玉米的質量,g;

W2——烘干后玉米的質量,g。

1.5 原始光譜

水果玉米的原始光譜圖如圖1所示。

圖1 水果玉米的原始光譜圖Figure 1 The original spectrum of fruit corn

從圖1可以看出,樣本集玉米光譜平均反射率曲線整體趨勢一致。玉米光譜900~1 700 nm的光譜范圍內時光譜反射率范圍大約為0.12~0.53,在波數為970,1 200,1 450 nm附近處有3處明顯的特征峰。970,1 450 nm附近的特征峰來源于O—H鍵的伸縮振動,與水分子的結構有關[13-14];1 200 nm附近的特征峰為液態水的組合頻吸收帶[15];1 450 nm是O—H鍵一級倍頻峰[16]。

1.6 鮮食玉米含水率的描述統計

通過使用直接干燥法測定的含水率頻率直方圖如圖2 所示。

從圖2和表1可以看出,鮮食水果玉米樣本的含水率分布在0.68~0.81。含水率的均值、中值和眾數都在0.75 附近,含水率分布大致符合正態分布。

圖2 水果玉米含水率頻率直方圖Figure 2 Frequency histogram of moisture contentof fruit corn

2 數據處理

2.1 光譜預處理

光譜數據預處理可以消除光譜數據采集過程中試驗儀器產生的噪聲、背景干擾、周圍雜散光干擾等因素對數據的影響[17],消除光譜數據中的冗余信息,提高模型的準確率。試驗采用變量標準化算法(SNV)、附加散射校正算法(MSC)、卷積平滑(SG)、去趨勢法(De-trending)、移動平均法(MA)和歸一法(Normalize)6種方法對玉米光譜數據進行預處理,并與原始光譜數據(RW)建模效果作對比,預處理后的光譜圖如圖3所示。

圖3 預處理后的光譜圖Figure 3 Spectrum after pretreatment

測定的玉米樣本含水率的描述性統計數據如表1所示。

表1 玉米樣本含水率描述性統計數據

對處理后的光譜數據建立偏最小二乘回歸(PLS)模型比較建模效果如表2所示。

表2 光譜預處理方法對PLS建模結果的影響

2.2 光譜數據建模

高光譜數據中包含了大量化學和物理信息,具有高維度和共線性問題,其中一些相關性不強的光譜信息會影響建模效果,不僅使建模時間增加,還會降低模型相關性[18-19]。為了更加高效準確地預測模型效果,需要對光譜數據進行特征波長的提取。選用連續投影法(SPA)、競爭性自適應加權重算法(CARS)和隨機蛙跳法(RF)3種方法來優選特征波長,并利用優選出的特征波長建立PLS回歸模型來比較建模效果。

2.2.1 SPA特征波長提取 采用SPA建模優選過程及所篩選出的最優波長如圖4和圖5所示。

由圖4和圖5可知,優選的變量數目從1到6變化時其對應的均方根誤差(RMSE)值在減??;變量數目超過6時,RMSE值開始增加;當變量數目為6時,RMSE值最小,為0.012 375,所以采用SPA建模方法優選出6個特征波長,分別為1 074,1 141,1 182,1 278,1 685,1 700 nm。

圖4 特征波長優選過程Figure 4 Feature wavelength optimization process

圖5 SPA提取的特征波長Figure 5 Feature wavelength extracted by SPA

2.2.2 CARS特征波長提取 采用CARS建模,設置蒙特卡羅采樣次數為50次,優選過程及所篩選出的最優波長如圖6所示。

從圖6(a)可以看出,隨著蒙特卡羅采樣次數從1次增加到50次,所采集的變量由254個減小到2個;從圖6(b)可以看出,交叉驗證均方根誤差(RMSE)的值呈由大變小再變大的趨勢,在第35次采樣時均方根誤差最小,最小值為0.011 3;圖6(c)為波長變量優選過程中各波長變量回歸系數的變化趨勢,第35次采樣時均方根誤差最小。由CARS模型運行結果提取出16個特征波長,分別為902,918,953,1 064,1 128,1 131,1 195,1 198,1 310,1 380,1 421,1 424,1 488,1 491,1 535,1 545 nm。

圖6 CARS提取的特征波長Figure 6 Feature wavelength extracted by CARS

2.2.3 RF特征波長提取 采用RF建模,為了減小隨機蛙跳法所產生的不穩定性,蒙特卡羅采樣次數應盡可能多,設置蒙特卡羅采樣次數為2 000次,優選過程及所篩選出的最優波長如圖7所示。

概率越大的變量對建模的貢獻率越大,從圖7可以看出,波段的選擇概率范圍為0.0~0.6,大部分變量的選擇概率值都很小,只有少數變量的選擇概率峰值比較突出,可被確定為特征波長,選擇概率大的數據坐標點有(3,0.224 0)、(57,0.242 5)、(73,0.300 0)、(75,0.273 0)、(76,0.245 0)、(93,0.232 5)、(98,0.215 0)、(132,0.211 5)、(167,0.213 5)、(186,0.537 0)共計10個,其對應的特征波長分別為902,1 074,1 125,1 131,1 135,1 189,1 205,1 313,1 424,1 485 nm。

圖7 RF提取的特征波長Figure 7 Feature wavelength extracted by RF

3 建模結果與分析

比較基于MSC預處理的3種特征波長的PLS建模結果與原始光譜的PLS建模效果如表3和圖8所示。

表3 不同特征波長提取方法對PLS建模效果的影響

圖8 3種特征波長的PLS建模與原始光譜的PLS建模預測效果

4 結論

研究基于去除苞葉的鮮食玉米進行光譜信息采集并建立含水率模型,該模型預測效果較好。但是針對田間未去除苞葉的鮮食玉米含水率的無損檢測模型還需進一步研究。

猜你喜歡
鮮食波長預處理
早春種好鮮食玉米有訣竅
種好鮮食玉米有訣竅
求解奇異線性系統的右預處理MINRES 方法
早春種好鮮食玉米有訣竅
杯中“日出”
高COD二噻烷生產廢水預處理研究
環境溫度和驅動電流對LED的峰值波長的影響
LED峰值波長對多光譜組合白光色參數的影響
超甜糯鮮食玉米育種有了新路
基于預處理MUSIC算法的分布式陣列DOA估計
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合