?

基于深度神經網絡的高光譜遙感影像分類方法研究

2017-07-21 10:04胡華全范雯琦
裝備學院學報 2017年3期
關鍵詞:編碼器波段分類器

朱 江, 胡華全, 范雯琦

(1. 裝備學院 研究生管理大隊, 北京 101416; 2. 裝備學院 復雜電子系統仿真實驗室, 北京 101416; 3. 北京跟蹤與通信技術研究所, 北京 100094)

基于深度神經網絡的高光譜遙感影像分類方法研究

朱 江1, 胡華全2, 范雯琦3

(1. 裝備學院 研究生管理大隊, 北京 101416; 2. 裝備學院 復雜電子系統仿真實驗室, 北京 101416; 3. 北京跟蹤與通信技術研究所, 北京 100094)

分類是高光譜遙感影像處理中最為重要的一部分。針對現有影像分類方法存在預處理復雜、高維特征提取困難、分類不夠精確等缺陷,提出一種基于深度神經網絡的高光譜遙感影像分類算法。算法首先采用最大噪聲分數來降低特征空間維度,然后將自動編碼器與softmax多項邏輯回歸分類器組合成含有多隱藏層的神經網絡,對高光譜遙感影像進行非監督型深度特征提取與分類。實驗結果表明:與傳統的基于線性支持向量機分類方法相比,本算法可提取更高級的表達特征,并在較短的處理時間內實現較好的影像分類精度。

高光譜遙感;影像分類;深層神經網絡;自動編碼器;最大噪聲分數

高光譜遙感是通過光譜成像儀(imaging spectrometer)將光譜信息引入遙感成像中去的多維度空間-光譜信息感知技術[1]。由于低空間分辨率導致混合像元現象、波段間高相似性導致Hughes現象、端元與光譜不對應導致數據結構高度非線性等原因,使得高光譜影像分類一直都是具有挑戰性的熱點問題,眾多科研人員設計了多種不同類型的分類方法[2]。文獻[3]將分類器根據設計方法異同劃分為:監督類方法、非監督類方法、半監督類方法、混合類方法、集成類方法和多分類器融合方法6類。文獻[4]根據參與分類過程的特征類型及其描述不同,將分類器方法劃分為:光譜域特征分類、空間-光譜特征分類及多特征混合分類算法3類。本文則基于高光譜影像的統計特性,根據是否引入有標簽訓練樣本將分類器簡單劃分為監督類方法、半監督類方法和非監督類方法。

顧名思義,監督型分類方法通過訓練具有明確標識的像元來獲得最優模型,再利用該模型將全部像元映射到對應輸出,并對其結果進行簡單判斷從而達到分類目的,主要方法包括:基于支持向量機(Support Vector Machine,SVM)的分類[5]、基于核方法的分類[6]、基于統計模型的最大似然分類[7]和基于稀疏表示的分類[8]。半監督型分類方法利用少量已標記像元和大量未標記像元訓練樣本來構建有效的分類器,從而降低高光譜遙感影像分類中“不適定”問題的影響。其主要方法包括:自訓練分類[9]、合作訓練分類[10]、基于生成模型分類[11]、基于低密度分離分類[12]和基于圖的分類[13]等。相較于前2類方法,非監督型分類方法不需要任何標簽樣本或先驗知識,易于處理與實現,常見方法包括K均值聚類[14]和NLTV(Nonlocal Total Variation)法[15]。

深度神經網絡通過構建多隱藏層的神經元聯結從而提取目標高維數據的深度特征,自2006年Hinton提出后被廣泛用于分類當中[16]。對深度神經網絡的訓練可分為前段所述的監督型和非監督型。但當深度神經網絡通過監督型方式進行訓練時會面臨以下問題:(1) 實際中標簽數據稀缺,難以方便獲得;(2) 求解高度非凸優化問題時會存在大量局部極值;(3) 使用梯度下降法時會發生彌散問題。因此,本文提出一種基于非監督型多隱藏層的自動編碼器深度神經網絡算法:首先,通過最大噪聲分數(Maximum Noise Fraction,MNF)降低頻譜波段數量,去除冗余相似信息;然后,采用不需要標簽樣本的多隱藏層自動編碼器對影像進行深度特征提取,并在訓練完成后使用誤差反向傳播(error Back Propagation,BP)方法進行參數微調以避免局部極值;最后,借助softmax邏輯回歸分類器完成影像分類。

1 MNF方法和自動編碼器基本原理

1.1 MNF方法

高光譜遙感成像可以同時收集地物的二維空間信息和一維光譜信息,進而生成高光譜分辨率全波段連續的遙感影像。較高光譜分辨率的最大好處就是根據光譜信息可以更加精確的對地物進行分類識別。如圖1所示,不同波段下的高光譜影像組合成一個數據立方體,每一幅影像中像元記錄的信息是其對應瞬時視場(Instantaneous Field of View,IFOV)內地物的輻射信息,每個像元在不同波段中的輻射信息組成了一個連續光譜曲線。然而,由于在狹窄帶寬中存在數百個頻帶,且相鄰頻帶之間具有高相關性,導致了信息冗余與高維數據處理困難等問題,還會產生Hughes現象。因此在分類之前需要對高光譜影像進行降維預處理,即對高維度影像信息用低維度數據來簡化表征,在降低數據量的同時優化地物的特征提取。

圖1 高光譜遙感成像示意圖

MNF變換是一種簡便高效的高光譜影像降維方法,基本原理是通過正交線性變換將所有波段的數據投影到新的特征空間中使彼此互不相關,并按照各影像質量由大到小排列各成分,這里影像質量的衡量標準是信噪比(Signal to Noise Ratios,SNR)

(1)

式中:ai為變換矩陣中的第i個變換分量;N為噪聲矩陣;Y=S+N為影像矩陣,S為信號矩陣;ΓN為噪聲N的協方差矩陣;ΓY為影像Y的協方差矩陣。如果對ai標準化,則式(1)可轉換成如下最優化問題

(2)

通過轉換后就可以利用Lagrange乘數法來求解上式。

相比較于基于信息量排列的主成分分析(PrincipalComponentsAnalysis,PCA)降維方法,MNF變換可以有效克服當影像噪聲分布不均衡或噪聲協方差大于信號協方差時,基于信息量排列的PCA方法可能出現的、影像質量隨著主成分的增大而增大的情況。

1.2 自動編碼器

圖2 自動編碼器的基本結構

由圖2可知,自動編碼器通過對輸入的數據進行非線性變換,最終使得x≈y。圖2中自動編碼器的基本結構在數學上可以表示為

(3)

(4)

(5)

(6)

(7)

(8)

式中,?為學習速率,設置它的主要目的是避免目標函數陷入局部極小。

2 算法設計

首先,根據式(2)使用MNF方法對高光譜影像數據進行預處理,在降低原始影像頻譜波段數量的同時保留主要數據的特征信息。接下來,構建自動編碼器。為了降低所設計的深度神經網絡的復雜性,減少需要訓練的網絡參數,令編碼器的每一層都具有相同的權重

W(1)=W(2)=…=W(n)=W

(9)

為了提升神經網絡的學習能力,達到“深度”學習的目的,增加隱藏層層數顯然要比直接增加隱藏層神經元數量更加有效。因此,在本算法中設計了含有多隱藏層的神經網絡模型對影像特征進行提取與分類,即每次訓練一層的隱藏節點,訓練時將前一隱藏層的輸出作為本層的輸入,而本隱藏層的輸出則作為后一層的輸入。隱藏層層數根據實際影像數據來決定,這里先令n=1,根據式(3)~式(5)可得到h(1)和y的表達式

(10)

(11)

(12)

接下來,定義交叉熵代價函數

(13)

式中,m為被選取數據大小。則式中的損失函數可以表達成

(14)

式中,s為輸入數據的大小。

為了簡化式(10)和式(11),將其重新寫成

(15)

(16)

(17)

(18)

(19)

(20)

(21)

將上式全部代入到式(7)和式(8)中,可以得到

(22)

(23)

(24)

softmax(x) =P(y(i)=l|x,W,b) =

e(Wx+bl )∑je(Wx + bj )

(25)

最后用BP方法對softmax進行微調,直到模型的預測結果達到一個預期的準確率。整個算法設計可以概括為“預訓練+微調”的結構,先對每一層的各參數進行預訓練獲得本層的局部較優解,然后再將這些局部較優的結果綜合起來進行微調,進而尋求整個網絡的最優設置。具體算法的設計步驟如下:

步驟1 根據式(2)對原始數據進行MNF變換,降低冗余波段數量。

步驟4 根據式(25)對softmax多項邏輯回歸分類器進行訓練,得到預分類結果。

步驟5 使用BP方法對深度神經網絡模型進行微調,更新模型參數。重復步驟3和步驟4,直到網絡模型的配置達到最優。

3 實驗結果

a) 理想的地物分類結果 b) 基于線性SVM方法的地物分類結果 c) 基于本算法的地物分類結果圖5 Indian Pines影像數據分類結果

3.1 實驗測試集

為了驗證本文算法的有效性,實驗選取了國際上廣泛使用的標準高光譜測試集Indian Pines和測試集Italy Pavia。其中,Indian Pines測試集為1992年6月由機載AVIRIS光譜成像儀在美國印第安納州西北部地區的印第安松樹林上空拍攝,影像大小為145 × 145像素,幾何空間分辨率為20 m。在波長為0.4~2.5 μm的范圍內有220個波段,本次實驗去除了其中的20個包含強噪聲和水汽吸收的波段,即104~108、150~163和220波段。該測試集共包括草地、作物和建筑在內的16種地物。其中,第170波段的真實影像如圖3所示。

圖3 Indian Pines第170波段真實影像數據

Italy Pavia測試集為帕維亞大學使用ROSIS光譜成像儀,在帕維亞市的西北方位上空拍攝的。影像大小為610 × 610像素,幾何空間分辨率為20 m。在波長為0.43~0.86 μm的范圍內有115個波段,本次實驗去除了其中的12個包含強噪聲和水汽吸收的波段。該測試集共包括公路、樹木和屋頂在內的9種地物。其中,第13波段的真實影像如圖4所示。

圖4 Indian Pines第170波段的真實影像數據

3.2 實驗結果與分析

目前,在高光譜影像分類算法中應用最為廣泛的是基于SVM的機器學習方法,該方法原理簡單且特別是在高維模式識別中性能優秀[18]。因此,這里采用基于線性SVM的分類方法與本文算法進行對比。此外,實驗所用的計算機硬件環境為Intel Core i7-4600U,CPU 2.69G,顯卡Intel(R) HD,軟件環境為Windows10(64bit),編程軟件MATLAB 2014b。

由于整個測試集中的像素數量龐大,因此這里隨機選取了20%的樣本用于訓練,剩余80%的數據用于測試。深度神經網絡中層數和神經元數目的選取根據具體測試集來確定,針對Indian Pines測試集,如算法設計中所述設置深度神經網包含1個輸入層,2個隱藏層和1個輸出層。選取各層神經元個數分別為180、120、120、16。設置學習速率?=0.05,預訓練80次,微調200次。最終分類結果如圖5所示。針對ItalyPavia測試集,如算法設計中所述設置深度神經網包含1個輸入層,4個隱藏層和1個輸出層。選取各層神經元個數分別為90、70、70、70、70、9。設置學習速率?=0.05,預訓練80次,微調200次。最終分類結果如圖6所示。

對上述2個測試集經過重復10次實驗后本算法的平均分類準確度分別為90.54%和88.44%,線性SVM的平均分類準確度分別為79.22%和76.61%。此外,線性SVM方法處理數據平均花費時間分別為32.5s和40.5s,而本算法處理數據平均所用時間僅分別為15.2s和17.2s。但是,可以看出本算法在2種地物的交界處還存在較多分類錯誤的問題。綜上可知,在高光譜影像分類技術中引入深層神經網絡模型可以有效提高地物分類精度。

a) 理想的地物分類結果 b) 基于線性SVM方法的地物分類結果 c) 基于本算法的地物分類結果圖6 Italy Pavia影像數據分類結果

4 結 束 語

本文針對現有高光譜影像分類方法存在的不足,提出一種基于深度神經網絡的高光譜遙感影像空譜聯合分類算法。該算法具有以下優點:(1) 在預處理中引入MNF方法降低原始數據的波段維數,提高了計算處理速度;(2) 構建自動編碼器與softmax邏輯回歸分類器組合成多隱藏層神經網絡,可以更好地進行特征深度提取與地物精準分類。實驗結果表明:本算法在對高光譜影像處理中,無論是地物分類精度還是時間消耗上均優于傳統SVM分類方法,證明了算法的有效性和優越性。

下一步將嘗試對其他特征更復雜的影像進行分類從而驗證算法的普適性,針對大規模的高光譜遙感影像進行切割分塊處理。此外,還準備將本算法與其他分類方法相結合,組合成一個多分類器系統,從而達到比單一分類器更好的分類精度。

)

[1]PRASAD S,CHANUSSOT J,FOWLER J E,et al.Introduction to the issue on advances in hyperspectral data processing and analysis[J].IEEE Journal of Selected Topics in Signal Processing,2015,9(6):961-963.

[2]PLAZA A,BIOUCAS-DIAS J M,SIMIC A,et al.Foreword to the special issue on hyperspectral image and signal processing[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2012,5(2):347-353.

[3]CHUTIA D,BHATTACHARYYA D K,SARMA K,et al.Hyperspectral remote sensing classifications:a perspective survey[J].Transactions in GIS,2015,20(4):463-490.

[4]張兵.高光譜圖像處理與信息提取前沿[J].遙感學報,2016(5):1062-1090.

[5]MELGANI F,BRUZZONE L.Classification of hyperspectral remote sensing images with support vector machines[J].IEEE Transactions on geoscience and remote sensing,2004,42(8):1778-1790.

[6]BUI D T,TUAN T A,KLEMPE H,et al.Spatial prediction models for shallow landslide hazards:a comparative assessment of the efficacy of support vector machines,artificial neural networks,kernel logistic regression,and logistic model tree[J].Landslides,2016,13(2):361-378.

[7]RICHARDS J A.Remote sensing digital image analysis:an introduction[M].Berlin:Springer,2013: 47-50.

[8]WRIGHT J,MA Y,MAIRAL J,et al.Sparse representation for computer vision and pattern recognition[J].Proceedings of the IEEE,2010,98(6):1031-1044.

[10]ZHANG H,LI J,HUANG Y,et al.A nonlocal weighted joint sparse representation classification method for hyperspectral imagery[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2014,7(6):2056-2065.

[11]JACKSON Q,LANDGREBE D A.Adaptive Bayesian contextual classification based on Markov random fields[J].IEEE Transactions on Geoscience and Remote Sensing,2002,40(11):2454-2463.

[12]CHI M,BRUZZONE L.Semisupervised classification of hyperspectral images by SVMs optimized in the primal[J].IEEE Transactions on Geoscience and Remote Sensing,2007,45(6):1870-1880.

[13]CAMPS-VALLS G,MARSHEVA T V B,ZHOU D.Semi-supervised graph-based hyperspectral image classification[J].IEEE Transactions on Geoscience and Remote Sensing,2007,45(10):3044-3054.

[14]JAIN A K.Data clustering:50 years beyond K-means[J].Pattern Recognition Letters,2010,31(8):651-666.

[15]ZHU W,CHAYES V,TIARD A,et al.Unsupervised classification in hyperspectral imagery with nonlocal total variation and primal-dual hybrid gradient algorithm[J].IEEE Transactions on Geoscience & Remote Sensing,2017,55(5):1-13.

[16]HINTON G E,SALAKHUTDINOV R.Reducing the dimensionality of data with neural networks[J].Science,2006,313(5786):504-507.

[17]CHEN Y,LIN Z,ZHAO X,et al.Deep learning-based classification of hyperspectral data[J].IEEE Journal of Selected topics in applied earth observations and remote sensing,2014,7(6):2094-2107.

[18]WU Y,YANG X,PLAZA A,et al.Approximate computing of remotely sensed data:SVM hyperspectral image classification as a case study[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2016,9(12):5806-5818.

(編輯:李江濤)

Research on Hyperspectral Remote Sensing Image Classification Based on Deep Neural Networks

ZHU Jiang1, HU Huaquan2, FAN Wenqi3

(1.Department of Graduate Management,Equipment Academy,Beijing 101416,China; 2.Science and Technology on Complex Electronic System Simulation Laboratory,Equipment Academy,Beijing 101416,China; 3.Beijing Institute of Tracking and Telecommunications Technology,Beijing 100094,China)

Classification is the most important part of hyperspectral remote sensing image processing. With view to the setbacks of complex preprocessing, difficult extraction of high-dimensional features and not accurate classification existing in the current classification method, the paper raises an algorithm of hyperspectral remote sensing image classification based on deep neural networks. This algorithm first uses the maximum noise fraction to reduce the feature space dimension, then combines the auto-encoders and the multinomial logistic regression classifier sofemax into a neural networks with multiple hidden layers, to extract and classify the unsupervised deep features of hyperspectral remote sensing images. Experiments show that, in comparison with the traditional linear support vector machine (SVM) classification method, it can extract more advanced expression features and realize better image classification accuracy in a shorter processing time.

hyperspectral remote sensing; image classification; deep neural network; auto-encoder; maximum noise fraction

2017-04-17

部委級資助項目

朱 江(1990—),男,博士研究生,主要研究方向為高光譜影像處理。nudt1990@gmail.com

TP701

2095-3828(2017)03-0014-07

A DOI 10.3783/j.issn.2095-3828.2017.03.003

猜你喜歡
編碼器波段分類器
融合CNN和Transformer編碼器的變聲語音鑒別與還原
最佳波段組合的典型地物信息提取
學貫中西(6):闡述ML分類器的工作流程
設定多圈絕對值編碼器當前圈數的方法
轉爐系統常用編碼器選型及調試
基于樸素Bayes組合的簡易集成分類器①
舞臺機械技術與設備系列談(二)
——編碼器
基于特征選擇的SVM選擇性集成學習方法
基于PLL的Ku波段頻率源設計與測試
小型化Ka波段65W脈沖功放模塊
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合