?

高光譜影像的鮮桃可溶性固形物含量預測模型

2021-11-11 05:23楊寶華高志偉
光譜學與光譜分析 2021年11期
關鍵詞:光譜信息鮮桃深層

楊寶華,高志偉,齊 麟,朱 月,高 遠

安徽農業大學信息與計算機學院,安徽 合肥 230036

引 言

鮮桃是一種營養豐富和風味甜香的水果,可溶性固形物含量(soluble solids content, SSC)作為影響鮮桃風味的重要成分,也成為衡量鮮桃品質的重要參考標準,因此,精準估測SSC對于鮮桃分級和評價具有重要的研究意義和應用價值。

目前,隨著傳感器和數據分析技術的快速發展,無損估測水果可溶性固形物含量被廣泛研究及應用。其中,近紅外光譜、多光譜、熒光譜、電子鼻等已經成功地檢測鮮果SSC[1-4]。然而,目前大部分研究基于單一特征檢測,從而限制了水果SSC預測模型的進一步探究。近年來,高光譜影像(hyperspectral image, HSI)不僅提供光譜維信息,還提供空間維信息,常常被廣泛用來檢測水果的SSC[5]。Fan等融合了光譜特征和紋理特征成功檢測蘋果的SSC[6],Li等利用高光譜影像估測鮮桃的SSC[7]。結果表明,基于高光譜影像特征估測SSC的可行性。然而,大部分研究僅基于光譜維信息,容易導致SSC估測模型過擬合。

隨著深度學習在不同領域的應用,為鮮桃SSC預測提供了新思路和新方案。堆疊自動編碼器(stacked auto-encoder,SAE)[8]作為深度學習方法,具有較強的特征能力,從而提高預測模型的精確性。因此,在這項研究中設計不同結構的堆疊自動編碼器,分別提取高光譜影像的光譜維、空間維及空-譜維信息的深層特征,為鮮桃SSC的定量分析提供技術路徑。

1 實驗部分

1.1 數據獲取

1.1.1 鮮桃樣本及SSC數據采集

2019年6月,在市場上購買了不同品種的成熟鮮桃樣本120個(黃金蜜桃、蟠桃和油桃各40個,單果重量在160~240 g之間)。所有鮮桃表面被清潔處理后放置于25 ℃ 的環境中保存12 h,使樣品溫度與室溫基本一致。

通過手持型折射計(Model: LYT-330, Shanghai Linyu Trading Co., Ltd., China)測量鮮桃樣本的SSC,其測量范圍為0~32°Brix,分辨率為0.2°Brix。測量鮮桃樣本SSC時,在樣品進行光譜采集部位對應的鮮桃果肉深度為5~8 mm處,取出果汁滴在折射計的檢測窗口,3次重復采集的均值作為鮮桃樣本SSC的真實值。所測樣本集SSC含量在6.0~14.2°Brix之間。共計120個樣本,按照3∶1劃分為校正集(90個)和驗證集(30個)。

1.1.2 高光譜影像采集

利用高光譜影像采集系統獲取鮮桃高光譜影像數據,該系統包括1個光譜成像儀(Imspector V17E, Spectral Imaging Ltd., Oulu, Finland)、1個攝像機為CCD相機(IPX-2M30, ImperxInc., Boca Raton, FL, USA),2個150 W的鹵素燈(3900, Illumination Technologies Inc., New York, USA),1個數據采集暗箱,圖像采集和分析軟件(Spectral Image Software, Isuzu Optics Corp., Taiwan, China)組成,反射式線性光道管和電控位移平臺(MTS120,北京光學儀器廠,中國),光源照射方向與豎直方向呈45°,整個采集系統置于暗箱內。

為了獲得高質量的圖像,鮮桃樣本的最高點到物鏡距離為220 mm,電動機控制速度和曝光時間分別設置為0.8 mm·s-1、2 ms, 系統的光譜分辨率和圖像大小分別為5 nm、636×838像素。為了盡可能降低圖像噪聲和暗電流的影響,掃描鮮桃樣本后,使用標準白色和深色參考圖像對獲得的高光譜數據進行校準。

1.2 基于堆棧自動編碼器-粒子群優化支持向量回歸模型

1.2.1 堆棧自動編碼器

自動編碼器(auto-encoder, AE)是一種運行在人工神經網絡上的基于無監督學習,由編碼器和解碼器兩部分構成,其功能就是對輸入樣本進行學習并在輸出中重構數據。通常將輸入數據通過非線性激活函數映射到隱含層的階段稱為編碼,將隱含層映射至輸出層稱為解碼。因此,AE就是一個小型的深度學習模型,該模型主要包括輸入層、隱含層和輸出層。

堆棧自動編碼器(SAE)是通過多個自動編碼器堆疊構成的[10]。按照無監督的方式,利用貪婪訓練的方法,對每個自動編碼器進行單獨訓練。編碼器相鄰層中,前一層的輸出結果既是該隱含層的輸出,也是后一隱含層的輸入。SAE通過逐層訓練可以從原始數據中獲得有效的特征,以減少原始信息的數據維數和干擾因素,避免因過高的維數和原始數據的共線性等問題而導致過擬合現象。因此,最后一個隱含層的輸出結果就是利用SAE提取原始信息的深層特征。

1.2.2 估測鮮桃SCC的模型構建及評價

精確地提取特征是模型構建的重要前提。為了獲取光譜信息和空間信息的特征,首先獲取鮮桃樣本的光譜數據,在鮮桃的鄰近赤道部位選定一個200×200 pixels的圖像感興趣區域(region of interest, ROIs),利用ENVI軟件提取該區域范圍內所有像素點的反射率;其次,利用HSI獲得每個鮮桃樣本的636×838×508圖像;然后,提取有效波段對應高光譜影像的特征。最后,為了提取空-譜特征,將光譜維和空間維的原始信息進行融合。

為了預測鮮桃SSC,設計了堆棧自動編碼器-粒子群優化支持向量回歸(stacked autoencoder-particle swarm optimization-support vector regression, SAE-PSO-SVR)模型。將光譜維、空間維和融合信息分別輸入到SAE模型,在SAE提取光譜信息、圖像信息和融合信息的深層特征基礎上,采用粒子群優化支持向量回歸(particle swarm optimization-support vector regression, PSO-SVR)模型估測鮮桃SSC,如圖1所示。其中,本研究設計的SAE結構包括三層隱含層,隱含層神經元節點數通過模型訓練及參數微調確定。第三層隱含層的輸出作為PSO-SVR模型的輸入變量。

圖1 基于堆疊式自動編碼器-粒子群優化支持向量回歸預測鮮桃可溶性固形物含量模型

最后,利用決定系數(coefficient of determination,R2)和均方根誤差(root mean square error, RMSE)作為解釋和量化預測鮮桃SSC模型的評價指標。實驗的硬件實驗環境配置如下:主板為Z370 HD3-CF,CPU 為 Intel Core i7-8700,顯存為8GB GDDR5,內存16 GB。軟件環境配置為:操作系統為 Windows 10(64 位),編程軟件和語言分別為 Anaconda3、matlab2017和python3.6,深度學習框架為 Keras。

2 結果與討論

2.1 基于鮮桃高光譜影像的信息獲取

圖2所示為從不同鮮桃樣本高光譜影像中提取的光譜反射率,該光譜曲線包含508個波段(908~1 735 nm),去除部分噪聲明顯的首尾波段,包括光譜曲線首端908~940 nm共21個波段,末端1 681~1 735 nm共34個波段。剩余的453個波段(942~1 680 nm)作為光譜信息。鮮桃樣本的光譜曲線可以有效地反映鮮桃中SSC等主要成分的化學信息,光譜反射強度與SSC含量存在一定的相關性。因此,含有不同SSC的鮮桃樣本在不同波段下的光譜反射率存在一定的差異。

圖2 鮮桃的高光譜原始曲線

為了獲取空間維信息,利用鮮桃樣本高光譜影像設置5個不同的感興趣區域(50×50 pixels)提取2 500維像素信息,取其平均值作為該樣本的空間信息。為了提取敏感空間信息,利用隨機森林(random forest, RF)選取相對重要性大于0.11的信息(如圖3所示),共計894個敏感空間信息作為SAE的輸入,輸出的結果就是高光譜影像的深層特征。為了獲取鮮桃高光譜影像的融合信息,將453維光譜信息和894維空間信息融合,共計1 347維融合信息。

圖3 鮮桃高光譜影像空間信息的相對重要性

2.2 基于SAE-PSO-SVR模型估測鮮桃可溶性固形物含量

為了對比不同SAE結構的預測效果,分別利用光譜信息、空間信息和融合信息設置不同的SAE結構提取深層特征,作為粒子群優化支持向量回歸(PSO-SVR)模型的輸入變量,構建鮮桃SSC的估測模型,結果如圖4所示。對于校正集, 基于光譜信息深層特征、圖像信息深層特征、融合信息深層特征的估測模型R2分別分布在0.723 4~0.826 9,0.739 2~0.802 6和0.758 3~0.873 3之間。對于驗證集, 基于光譜信息深層特征、圖像信息深層特征、融合信息深層特征構建的估測模型R2分別分布在0.677 5~0.782 5,0.685 5~0.776 6和0.693 7~0.820 9之間。其中,基于融合信息提取的深層特征估測鮮桃SSC的效果出色。尤其是,SAE模型結構為1347-750-550-400-100模型的R2達到0.873 3(校正集)和0.820 9(驗證集),比基于光譜信息的模型(SAE結構為453-300-200-100-40)R2提高5.3%和4.7%,比基于圖像信息的模型(SAE結構為894-800-700-500-100)R2提高8.1%和5.4%。

圖4 基于不同結構的SAE-PSO-SVR模型預測鮮桃SSC結果

隱含層神經元節點是 SAE模型的關鍵參數之一,設置合適的節點對提高模型精度起到重要作用。因此,根據鮮桃高光譜影像不同類型原始信息提取的深層特征,經過參數調整、數據訓練以選擇合適的SAE 模型。對于光譜信息,SAE模型設置了三種結構(453-300-200-100-40,453-350-250-150-50,453-350-250-100-60)。其中,利用隱含層為300,200和100的SAE提取深層特征進行鮮桃SSC預測的精度是最好的,比其他兩種SAE結構預測效果分別提高9.8%和13.4%。對于空間信息,SAE模型設置了三種結構(894-700-500-300-50,894-650-350-200-80,894-800-700-500-100),從模型訓練的結果表明第一層、第二層和第三層隱含層節點數為800,700和500的SAE模型表現較佳,比其他兩種模型的預測結果提高11.7%和8.6%。對于融合信息,SAE模型設置了三種結構(1347-800-400-200-40,1347-750-550-400-100,1347-700-500-360-150),其中,隱含層為750,550和400的SAE提取的深層特征預測鮮桃SSC的精度最高,比其他兩種結構提取的深層特征預測精度分別提高15.5%和6.6%。

2.3 鮮桃可溶性固形物含量可視化

為了直觀的表示鮮桃SSC,選擇成熟的黃金蜜桃、蟠桃和油桃作為測試樣本,利用SAE-PSO-SVR模型預測其SSC含量,可視化結果如圖5所示。從圖5中可以看出,第一行為鮮桃原始高光譜影像,第二行為不同品種鮮桃SSC含量的偽彩色圖。由圖例可以看出不同品種鮮桃樣本含有不同的SSC。其中,黃金蜜桃樣本的SSC含量范圍為6.0~13.6°Brix,蟠桃樣本的SSC含量范圍為6.5~14.2°Brix,油桃樣本的SSC含量范圍為6.0~14°Brix。由圖5還可以直觀看出,黃金蜜桃和油桃的SSC分布于鮮桃赤道及桃核中心部分,蟠桃的SSC主要分布于鮮桃核的四周區域。

圖5 不同品種鮮桃的可溶性固形物含量可視化

3 結 論

可溶性固形物含量是衡量鮮桃品質和風味的關鍵因素。提出了一種SAE-PSO-SVR模型估測鮮桃SSC。將深度學習理論應用到鮮桃可溶性固形物含量估測中,并將無監督訓練的SAE特征提取與有監督訓練的微調相結合。主要結論如下:

(1)通過對比不同隱含層神經元節點的SAE模型,表明基于網絡結構為1347-750-550-400-100模型估測效果最好。

(2)通過對比輸入不同信息的SAE模型估測效果,表明基于融合信息的模型精度最高(校正集R2=0.873 3,驗證集R2=0.820 9)。

(3)通過不同品種鮮桃樣本的SSC可視化,表明SAE-PSO-SVR模型具有較好的普適性?;赟AE提取鮮桃高光譜影像的光譜信息和空間信息深層特征,進一步通過融合信息的深層特征構建了基于SAE-PSO-SVR的鮮桃SSC估測模型,有效的提高了模型的估測精度。今后將利用不同深度學習方法驗證及檢測鮮桃的其他品質參數,如酸度、硬度及水分,為鮮桃等水果的無損檢測提供參考。

猜你喜歡
光譜信息鮮桃深層
村支書朋友圈里“帶貨” 村里“大久?!滨r桃售完
考慮各向異性滲流的重力壩深層抗滑穩定分析
基于光譜和Gabor紋理信息融合的油桃品種識別
SAM系統對TDCS數據的優化處理與深層應用
基于植被光譜信息的龜裂堿土堿化程度預測研究
萬畝鮮桃富一村
傅立葉變換光譜儀的研究現狀與光譜信息分析原理
桃之夭夭
對“醫患失去信任”的深層憂慮
一種基于區域生長的高分辨率遙感影像道路提取方法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合