?

基于無人機遙感的荒漠草原微斑塊識別研究

2023-01-19 03:54杜建民
關鍵詞:光譜斑塊卷積

張 濤,杜建民

(內蒙古農業大學 機電工程學院,內蒙古 呼和浩特 010018)

草原生態系統是我國第二大陸地生態系統[1],也是我國北方重要的生態屏障,在防風固沙、維持碳平衡等方面具有重要作用[2]。但受到人們過度放牧、開發以及氣候等因素的影響,內蒙古草原的生物群落遭到破壞,原本的草原植被群落逐漸被其他植被和灌木替代。這些植被與原本的植被相差較大、長勢稀疏,導致土壤長期暴露在外面,使得土壤逐漸沙化形成荒漠草原。草原荒漠化造成草原生物多樣性減少[3]、生產能力下降[4]、生態系統功能衰弱[5]等一系列問題,對當地牧民的經濟收入造成一定影響。

據統計,內蒙古自治區擁有草原面積8.8×107hm2,占全國草原總面積22%,全區土地面積的一半以上[6]。根據2015年全國荒漠化土地面積監測,內蒙古自治區荒漠化面積達6.09×107hm2,占全國荒漠化總面積23.3%,是我國草原荒漠化最嚴重的地區之一。2017年內蒙古自治區生態環境狀況公報顯示,內蒙古草原退化面積接近70%,嚴重威脅當地生態環境安全。因此,亟需探索一種高效、快速的先進方法對荒漠草原進行有效監測,為荒漠草原的動態監測和防治提供理論基礎。

荒漠草原微斑塊的識別與分類,是評價草原荒漠化的一個重要指標。傳統的荒漠草原動態監測主要有人工實地統計勘測以及衛星遙感監測。人工監測在時間、地域、面積等方面都有諸多約束,無法進行大范圍、高時效的荒漠草原監測;衛星遙感也常應用于植被覆蓋度估算,有相對成熟的理論基礎,但是由于衛星遙感的分辨率低等問題,面對荒漠草原微斑塊的識別無法滿足精度要求[7-8]。高光譜具有波段數多、分辨率高、特征信息豐富等特點[9-11],常被應用在農業監測[12]、水資源監測[13]、自然災害評估[14]等領域。目前康擁朝等[15]采用支持向量機結合最小噪聲分離法對地面微斑塊識別,探索支持向量機對地面微斑塊識的有效性;皮偉強等[16]提出SMPI方法對地面微斑塊識別,分步實現從植被到鼠洞的識別。朱相兵等[17]通過選取特征波長結合差值植被指數實現鼠洞與其他微斑塊之間的區分。綜上所述,一方面目前的荒漠草原微斑塊識別主要采用傳統機器學習方法和閾值法進行識別分類,在預處理階段過于繁瑣耗時,對于實驗對象屬于地面微斑塊的識別探索階段,還未探索空中遙感的微斑塊分類;另一方面也表明利用高光譜圖像對荒漠草原微斑塊識別的可能性。

卷積神經網絡是深度學習的代表算法之一,具有較強的特征提取能力,善于處理復雜多維數據問題,常被應用在計算機視覺、自然語言處理等領域。在遙感圖像的識別分類任務中,卷積神經網絡也表現出巨大潛力[18-19]。本文以內蒙古自治區烏蘭察布市四子王旗的荒漠草原為研究對象,通過使用無人機攜帶高光譜儀完成高光譜數據收集工作,并采用卷積神經網絡對不同的地物種類進行識別。為增強卷積神經網絡的特征提取能力,本文將不同卷積層的特征進行拼接,進而提出一種具有多層特征融合的2D卷積神經網絡(multilayer feature fusion 2D convolutional neural network, MFF-2DCNN)識別方法,為草原荒漠化的治理與預防提供理論基礎,以期實現智能化遙感草原退化監測。

1 材料與方法

1.1 研究區域

本文研究試驗區域設在內蒙古自治區烏蘭察布市四子王旗科研基地,地理坐標為東經111.88°、北緯41.78°。該區域處于內蒙古自治區中部,平均海拔高度1 456 m。氣候類型屬于中溫帶大陸性季風氣候,年均氣溫1~6 ℃;晝夜溫差大、白天日照足、無霜期短;降水量少而集中,年降水量280 mm。草地主要類型為短花針茅、冷蒿及無芒隱子草等,植被稀疏低矮,土壤類型以淡栗鈣土為主,屬于我國荒漠草原的典型代表[20]。

1.2 試驗器材

本研究采用四川雙利合譜科技有限公司研制的GaiaSky-mini型高光譜儀。成像系統采用內置掃描系統和增穩系統,單幅圖像采集時間為7 s。共設置采集波段數128個,光譜分辨率為3.5 nm,波長范圍在400~1 000 nm。無人機采用大疆M600 Pro,并使用A3 Pro飛行控制系統??諜C質量9.5 kg(含電池),最大載荷6 kg,滿載時可持續飛行16 min。無人機高光譜數據采集系統如圖1所示。

圖1 無人機高光譜數據采集系統Fig. 1 UAV hyperspectral data acquisition system

1.3 數據獲取

野外高光譜數據采集時間在2018年與2019年的7月份。為減少采集過程中陰影的影響,選擇采集時間為10:00-14:00,風力在3級以下的晴朗天氣,無云霧,自然光下采集。試驗區采集總面積為2.5 hm2,共放置10個地物樣方,樣方尺寸采用1 m×1 m,并采用地墊進行標記。此外,樣方內地物需包含鼠洞、植被和裸土三類地物。根據實驗區的草原植被長勢情況,設置無人機飛行高度為30 m。高光譜數據單幅圖像空間尺寸大小為696×709像素,波段數量為128,空間分辨為 1.73 cm。為提高采集數據的可用性,每個樣方拍攝不少于3次。

2 實驗原理

2.1 數據預處理

2.1.1 反射率校正

采集過程受諸多因素影響,需要將高光譜數據導入Spec VIEW軟件中進行篩選,對過曝光、欠曝光等成像不佳的數據進行剔除;然后,將篩選出的數據在Spec VIEW軟件中進行反射率校正;最后,根據反射率校正后的數據進行再次篩選,挑選出可用的數據。經反射率校正后的植被、裸土、鼠洞和其他(地墊和垃圾等)地物的光譜曲線如圖2所示。

圖2 地物光譜曲線Fig. 2 Spectral curves of ground features

由圖2可知,4類地物的光譜特征具有很好的光譜差異性,其中,植被的光譜特征由于葉綠素的影響,分別在562.29 nm和681.90 nm處形成一個反射峰和吸收峰,隨后反射率值陡增;裸土的反射率在619.20 nm之前隨著波長的增加而增加,之后降低至716.09 nm時趨于穩定;其他(地墊和垃圾等)的反射率在520.20 nm處形成一個峰谷,隨后開始陡增,直至到達619.20 nm時反射率達到最大值,之后降低至721.00 nm時趨于穩定;鼠洞的反射率在全波段上并無明顯變化,達到922.59 nm之后,由于噪聲的影響出現一些波動。

2.1.2 樣本標簽制作

高光譜的鄰近波段之間往往存在大量冗余信息,波段之間具有較強相關性。同時,高維度的特征還會產生Hughes現象,增加網絡的計算量,影響分類精度。因此,有必要對高光譜數據進行降維?;谥鞒煞址治?principal component analysis, PCA)的降維算法是應用最為廣泛的數據降維方法之一,常被應用于高光譜圖像的數據降維[21-22]。因此,本研究采用PCA降維算法,將高光譜數據從128個波段壓縮至30個波段,從而減少數據的冗余信息,消除特征之間的相關性。

考慮到網絡計算成本問題,同時將數據尺寸進行裁剪,最終獲得的高光譜數據空間尺寸大小為520×520像素。根據大量的地面調查和實際樣方中各個地物的分布情況記錄,通過ENVI 5.3對所采集的數據進行選擇和生成樣本,最終獲得植被、裸土、鼠洞及其他地物4類地物的樣本標簽,無人機高光譜假彩色影像和地面真值圖像如圖3所示,每類地物的樣本數量分別為144 121、123 888、65、2 326,共計270 400個樣本數據。植被樣本主要包括短花針茅、無芒隱子草、冷蒿和駝絨藜等,在草原中植被稀疏低矮,覆蓋面積最大;對于裸土樣本,主要是由于人類活動和氣候變化的共同影響致使草原植被退化,進而形成光禿的裸地,還有鼠類動物的挖掘行為形成的洞群土丘;鼠洞樣本是由于鼠類動物打洞造穴形成的洞群,大量洞群的出現加劇了草原的退化進程;其他樣本主要包括地墊和垃圾等地物,在后續討論中統稱為其他地物。不同地物樣本的RGB影像如圖4所示。本文將不同地物樣本隨機打亂,并每類選取2 000個樣本作為訓練集,不足2 000個樣本的按該類樣本總數的60%作為訓練集,其余作為驗證集。訓練集與驗證集的樣本分配情況如表1。

圖3 無人機高光譜假彩色影像和地面真值圖像Fig. 3 UAV hyperspectral false color image and ground truth image

圖4 不同地物樣本圖片Fig. 4 Photographs of different feature samples

表1 無人機高光譜數據選取訓練集和驗證集的數量Tab. 1 Number of training and validation sets selected for UAV hyperspectral data

2.2 MFF-2DCNN網絡結構

本文提出一種多層特征融合的2D卷積神經網絡(MFF-2DCNN)方法,對荒漠草原高光譜圖像進行分類,該方法的主要思想是將每一層卷積后的特征與最后一層的特征進行合并,加強不同層之間的特征重用,并采用2層全連接層進行分類。其中,第1層全連接主要是將合并后的特征進行線性融合,第2個全連接層主要進行高光譜圖像的分類。

網絡結構一共包含3層卷積,卷積層采用二維卷積核,前2層卷積之后均采用Batch Normalization加快網絡的收斂速度,之后再加入ReLU激活函數來提取數據的稀疏特征,從而提高網絡的分類準確率。卷積核尺寸越大,感受野也就越大,獲得的信息也越多。因此,將第1層卷積的卷積核尺寸設置為5×5,從而擴大卷積的感受視野來提取更多信息,而后2層則采用3×3卷積核提取細節特征,并設置每一層的卷積核個數分別為64、128、256。在神經網絡中,淺層網絡卷積分辨率高,提取的更多是細節特征,深層網絡分辨率低,提取的更多是語義特征[23]。為了將不同層之間的特征進行融合,在每一層卷積之后通過全局平均池化層將數據壓縮至C×1×1(其中C為通道數),最后將3層卷積之后的結果進行拼接傳入全連接層。在全連接層中,第1層全連接將拼接后的數據進行線性特征融合并壓縮至256維度的特征;第2層全連接對降維后的數據進行分類。由于全連接層中采用的是線性特征映射,因此對于全連接層需要采用ReLU激活函數增加模型的非線性,并采用Dropout防止訓練過程中的過擬合現象。具體網絡結構見圖5。

圖5 多層特征融合的2D卷積神經網絡模型結構Fig. 5 Structure of 2D convolutional neural network model for multi-layer feature fusion

3 實驗結果與分析

3.1 參數設定

實驗中所采用的計算機硬件配置為GeForce GTX 1050 Ti、i7-6700 CPU 3.40 GHz、內存16.0 GiB,軟件環境為Pycharm Pytorch 1.7。實驗采用總體精度(overall accuracy, OA)、Kappa系數作為模型的精度評價指標。實驗設置的數據集批處理大小為128;優化器選擇Adam;損失函數采用交叉熵損失函數;訓練迭代次數定為20次;學習率設置為0.000 1。經過多次實驗,最終確定鄰域輸入尺寸為9×9×30,此時對于荒漠草原地物的分類效果最佳。訓練過程中設置隨機種子為500,確保每一次訓練結果的穩定性。此外,為了緩解訓練樣本不均衡問題帶來的影響,在訓練過程中將對鼠洞樣本進行翻轉、模糊處理和加入噪聲等數據增強。

3.2 實驗結果

為了驗證本文所提方法的有效性,分別選取SVM、KNN、2D-CNN 3種高光譜分類算法進行對比。為保證實驗的公平性,所有實驗采用相同的預處理方法,并在同一個實驗環境下進行對比實驗。同時,為驗證本文將多層卷積特征融合后的優勢,將其與原始2D-CNN分類算法進行比較。本實驗使用混淆矩陣(如圖6)計算上述4種分類模型對不同地物的識別準確率,計算結果如表2所示。為觀察更為細致的分類效果,將鼠洞區域進行局部放大展示,各種實驗分類可視化對比如圖7所示。

表2 分類結果精度對比Tab. 2 Comparison of accuracy of classification results

圖6 本實驗分類模型的混淆矩陣Fig. 6 Confusion matrices for this experimental classification models

圖7 地面真值圖像和分類結果可視化圖Fig. 7 Ground truth image and visualization of classification results

3.3 實驗結果分析

由圖7可以看出,除KNN分類算法以外,其余3種分類算法在植被地物的分類上均表現出很好的分類性能。SVM和KNN 2種傳統的機器學習算法在總體分類效果上表現欠佳,其中KNN分類算法與地面真實標簽相比總體分類效果最差,而SVM分類算法相對于地面真實標簽總體分類效果有較大提升,但是從圖中還是可以明顯看出對于其他地物的分類上明顯存在諸多錯誤分類。對于2D-CNN分類算法,與傳統機器學習方法相比,效果提升明顯,但是從圖中可以看出有小部分植被錯誤地識別成了鼠洞。通過將2D-CNN不同卷積層的特征進行融合后的MFF-2DCNN分類算法,在分類效果上比2D-CNN有所提升,相對于地面真實標簽,4類地物類別都表現出很好的分類效果。

由表2可以看出,本文所提MFF-2DCNN分類算法的總體精度和Kappa系數在所有對比分類算法中表現最好,表明本文所提算法的有效性。對于荒漠草原地表微斑塊的識別,在4種分類算法中KNN分類算法識別效果最差,其總體分類精度為66.52%。SVM分類算法的總體精度為87.88%、Kappa系數為0.756 6;與KNN分類算法相比,總體精度和Kappa系數分別提升21.36個百分點和0.413 2。由此可見,SVM分類算法的總體識別精度較KNN分類算法提升較大,但是對于鼠洞地物的識別效果表現較差,分類精度僅為44.00%,主要原因是鼠洞樣本過于稀少,只有40個樣本參與訓練,同時也體現了SVM分類算法對于小樣本分類的不穩定性。2D-CNN分類算法的總體分類精度可達91.28%,其中鼠洞地物和其他地物的分類精度可達100%,其余兩類地物(裸土與植被)的分類精度也在90%以上。2D-CNN分類算法與SVM和KNN 2個傳統機器學習分類算法相比,總體精度和Kappa系數都有較大的提升,相對SVM分類算法分別提升3.4個百分點和0.069 1,相對KNN分類算法分別提升24.76個百分點和0.482 3。由此說明,卷積神經網絡相對于傳統機器學習具有較好的識別效果,能更好地提取無人機高光譜圖像的光譜特征和空間特征。本文提出的MFF-2DCNN分類算法在所有分類算法中總體分類性能最好,其中總體分類精度為92.23%、Kappa系數為0.843 7。MFF-2DCNN分類算法與未加入多層卷積特征融合的2D-CNN分類算法相比,OA值和Kappa系數分別提升0.95個百分點和0.018 0。由此可以看出,通過將不同卷積層的特征進行融合后,可以有效利用多層特征的輸出進行分類,加強不同卷積層之間的信息重用,從而提高網絡模型的特征提取能力,增強網絡模型的泛化能力。

由以上分析可以得出,與傳統機器學習算法相比,卷積神經網絡在荒漠草原的地表微斑塊上的識別分類更具優勢,尤其是在小樣本的分類識別中,卷積神經網絡也表現出理想的分類性能。而本文通過將不同卷積層進行特征融合后,加強了信息之間的重用,進一步提升了卷積神經網絡的分類能力。

4 結語

本文將無人機高光譜數據和卷積神經網絡結合,對荒漠草原微斑塊的分類實現從地面識別到空中識別,驗證了卷積神經網絡在荒漠草原微斑塊識別中的可行性。本研究通過對卷積神經網絡的不同卷積層進行特征融合,提出MFF-2DCNN識別方法,進一步增強了普通卷積神經網絡模型的特征提取能力,該方法具有更好的泛化能力,OA和Kappa系數分別可達92.23%、0.843 7,較SVM、KNN和2D-CNN 3種分類算法分別提升4.35、25.71、0.95個百分點的總體精度。今后將考慮采用不同的算法模型提升荒漠草原微斑塊的識別精度,并在此基礎上探索更加精細的荒漠草原退化指示物種的識別分類,為今后草原荒漠化監測和恢復治理提供新方法。

猜你喜歡
光譜斑塊卷積
基于三維Saab變換的高光譜圖像壓縮方法
頸動脈的斑塊逆轉看“軟硬”
基于3D-Winograd的快速卷積算法設計及FPGA實現
一篇文章了解頸動脈斑塊
高光譜遙感成像技術的發展與展望
microRNA-146a與冠心病患者斑塊穩定性的相關性
卷積神經網絡的分析與設計
從濾波器理解卷積
有頸動脈斑塊未必要吃降脂藥
基于傅里葉域卷積表示的目標跟蹤算法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合