?

融合光譜-空間信息的高光譜遙感影像增量分類算法

2015-12-23 02:30王俊淑,江南,張國明
測繪學報 2015年9期
關鍵詞:光譜信息空間信息形態學

引文格式:WANG Junshu, JIANG Nan, ZHANG Guoming,et al.Incremental Classification Algorithm of Hyperspectral Remote Sensing Images Based on Spectral-spatial Information[J]. Acta Geodaetica et Cartographica Sinica,2015,44(9):1003-1013.(王俊淑,江南,張國明,等.融合光譜-空間信息的高光譜遙感影像增量分類算法[J].測繪學報,2015,44(9):1003-1013.) DOI:10.11947/j.AGCS.2015.20140388

融合光譜-空間信息的高光譜遙感影像增量分類算法

王俊淑1,2,江南1,2,張國明3,李楊1,2,呂恒1,2

1. 南京師范大學虛擬地理環境教育部重點實驗室,江蘇 南京 210023; 2. 江蘇省地理信息資源開發與利用協同創新中心,江蘇 南京210023; 3. 江蘇省衛生統計信息中心,江蘇 南京210008

Incremental Classification Algorithm of Hyperspectral Remote Sensing Images Based on Spectral-spatial Information

WANG Junshu1,2, JIANG Nan1,2, ZHANG Guoming3, LI Yang1,2, Lü Heng1,2

1. Key Laboratory for Virtual Geographic Environment, Ministry of Education, Nanjing Normal University, Nanjing 210023, China; 2. Jiangsu Center for Collaborative Innovation in Geographical Information Resource Development and Application, Nanjing 210023, China; 3. Center of Health Statistics and Information of Jiangsu Province, Nanjing 210008, China

Abstract:An incremental classification algorithm INC_SPEC_MPext was proposed for hyperspectral remote sensing images based on spectral and spatial information. The spatial information was extracted by building morphological profiles based on several principle components of hyperspectral image. The morphological profiles were combined together in extended morphological profiles (MPext). Combine spectral and MPext to enrich knowledge and utilize the useful information of unlabeled data at the most extent to optimize the classifier. Pick out high confidence data and add to training set, then retrain the classifier with augmented training set to predict the rest samples. The process was performed iteratively. The proposed algorithm was tested on AVIRIS Indian Pines and Hyperion EO-1 Botswana data, which take on different covers, and experimental results show low classification cost and significant improvements in terms of accuracies and Kappa coefficient under limited training samples compared with the classification results based on spectral, MPext and the combination of sepctral and MPext.

Key words: hyperspectral remote sensing image; morphology; spatial information; spectral information; incremental classification

Foundation support: The National Natural Science Foundation of China (No.41171269); The National Environmental Protection Public Welfare Science and Technology Research Program of China (No.201309037); A Project Funded by the Priority Academic Program Development of Jiangsu Higher Education Institutions (No.164320H101); Data-sharing Network of Earth System Science (No.2005DKA32300); Program of Natural Science Research of Jiangsu Higher Education Institutions of China (No.14KJB170010); Colleges and Universities in Jiangsu Province Plans to Graduate Research and Innovation (No.1812000002A403)

摘要:提出了一種融合光譜和空間結構信息的高光譜遙感影像增量分類算法INC_SPEC_MPext。通過主成分分析(PCA)提取高光譜影像的若干主成分,利用數學形態學提取各主分量影像對應的形態學剖面(MP),再將所有主分量影像的形態學剖面歸并聯結,組成擴展的形態學剖面(MPext)。將MPext與光譜信息相結合以增加知識,最大限度地挖掘未標記樣本的有用信息,優化分類器的學習能力。不斷從分類器對未標記樣本的預測結果中甄選置信度高的樣本加入訓練集,并迭代地利用擴大的訓練集進行分類器構建和樣本預測。以不同地表覆蓋類型的AVIRIS Indian Pines和Hyperion EO-1 Botswana作為測試數據,分別與基于光譜、MPext、光譜和MPext融合的分類方法進行比對。試驗結果表明,在訓練樣本數量有限情況下,INC_SPEC_MPext算法在降低分類成本的同時,分類精度和Kappa系數都有不同程度的提高。

關鍵詞:高光譜遙感影像;形態學;空間信息;光譜信息;增量分類

中圖分類號:P237

基金項目:國家自然科學基金(41171269);環保公益性行業科研專項(201309037);江蘇高校優勢學科建設工程資助項目(164320H101);地球系統科學數據共享平臺項目(2005DKA32300);江蘇省高校自然科學研究面上項目(14KJB170010);江蘇省普通高校研究生科研創新計劃(1812000002A403)

收稿日期:2014-07-21

作者簡介:第一 王俊淑(1985—),女,博士生,助理研究員,研究方向為高光譜遙感影像智能信息提取。

1引言

高光譜遙感影像具有超高的光譜分辨率,對地物和物質類型的刻畫更加精細,類別區分度更高。其數據的高維特性決定了傳統的全色和多光譜分類難以直接運用于高光譜影像,勢必要針對其數據特點研究適合高光譜影像的分類方法。目前高光譜影像分類主要有兩種:一種是進行特征提取[1-2]或選取[3]后再分類,將大部分信息集中在少數幾個特征向量上,其本質和多光譜影像分類類似。此方法會損失許多重要的細節信息,特別是高光譜影像對地物精細表達這一優勢沒有很好體現。另一種是對原始高光譜影像直接分類[4],此方法主要存在以下問題:①容易引起Hughes現象;②分類過程中僅依賴標記樣本數據,訓練出的分類器容易過擬合;③需要大量標記樣本,樣本數通常是光譜維數的數倍甚至數十倍,而獲取標記樣本代價通常較高,相反未標記樣本數量充足并易于獲取,且蘊含了大量有用信息卻沒有得到充分運用,造成了數據資源的極大的浪費;④忽略了像元間的空間位置關系。

針對上述問題,本文結合自訓練半監督學習技術[5-8],根據高光譜遙感影像的特點,提出一種增量分類算法INC_SPEC_MPext。根據少量初始標記樣本,發掘高光譜數據豐富而廉價的未標記樣本所蘊含的信息,不斷從中學習新的知識來改善分類器性能。將光譜和空間信息相結合,以支持向量機(SVM)[9-12]作為基礎分類器。

2空間信息提取

將高光譜影像光譜與空間信息聯合[13-16]參與分類可以消除光譜分類結果中的噪點(椒鹽噪聲)現象。文獻[17—18]分別用馬爾可夫隨機場(MRF)和Monte Carlo模型提取空間紋理信息,聯合光譜信息優化分類。其缺點在于紋理信息提取算法的時間代價通常較高。與之相比,擴展形態學剖面信息提取具有較低時間和空間計算復雜度[19],更適合處理數據量和復雜程度較高的高光譜影像。具體的擴展形態學剖面信息提取過程如下:①利用主成分分析(PCA)提取影像若干主成分;②以每個主分量影像為基影像,用數學形態學方法提取開剖面和閉剖面,與基影像一起構成形態學剖面;③將所有主分量影像的形態學剖面進行矢量疊加,構成擴展的形態學剖面,即高光譜影像的空間信息。

影像I中像元x的形態學剖面(MP)[20-21]定義為

MP(x)=[CPn(x),…,I(x),…,OPn(x)]=

[0,n]

(1)

MPext=[MPPC1(x),MPPC2(x),…,MPPCq(x)]

(2)

以半徑為1,增量為3的圓形結構元為例,對兩個主分量影像分別進行兩次開剖面、閉剖面提取,最后組成擴展的形態學剖面如圖1所示。

通過擴展形態學處理,獲取了豐富的空間信息,可以對結構性的物質或物體進行區分,如橋梁和建筑物[19]。使用光譜信息可以對城區的非結構性物質加以區分,如植被和裸地。將空間與光譜信息結合可以優勢互補,大大增加分類的有效信息。

3基于光譜-空間信息的增量分類算法

INC_SPEC_MPext算法分別從光譜和空間兩個不同視角審視圖像。利用少量初始標記樣本,構建光譜分類模型Met和空間分類模型Mat,對未標記樣本進行分類預測。由于光譜域、空間域蘊含的圖像信息不同,兩個分類模型對未標記樣本的預測標記會有差異。通常情況下,兩個分類模型預測結果一致的樣本被正確分類的可能性更高。將二者預測結果一致的樣本作為置信樣本分別加入各自訓練集中,這是融合光譜、空間信息的第一步。再用擴大的訓練集重新訓練兩個分類模型,分別對剩余的未標記樣本分類預測,如此迭代地執行此過程。不斷增加訓練集樣本數量,并用擴大的訓練集重復訓練分類模型來對剩余未標記樣本分類,直至兩個分類模型再沒有預測一致樣本,迭代過程結束。再將光譜和空間信息進行矢量疊加融合,這是融合光譜、空間信息的第二步。將光譜、空間信息綜合考慮,利用初始標記樣本集和每次迭代過程中的新增置信樣本一起作為訓練集訓練分類器,對空-譜融合后的高光譜影像進行分類。整個分類過程是增量迭代地進行,直至所有樣本都獲得類別標記,增量分類算法結束。算法具體描述如下。

圖1 高光譜影像兩個主分量圖像的擴展形態學剖面MP ext (圓形結構元半徑為1,增量為3,進行兩次開閉操作) Fig.1 Extended morphological profiles for two principle components images of hyperspectral image with twice opening and twice closing, and circular structuring element was used with radius increment 3(r=1,4 pixels)

算法共進行兩次信息融合,一次是選擇置信樣本時,將光譜、空間信息分類結果一致的樣本加入訓練集;另一次是增量迭代過程結束后,對影像光譜、空間信息矢量疊加融合進行分類。算法借鑒了自訓練分類的思想,并對其置信樣本選取規則進行改進,摒棄按概率選取的策略,將分類模型Met和Mat預測一致的樣本加入訓練集,可以在一定程度上減少誤標記樣本的數量。另外,選取預測標記一致樣本所增加的信息量要高于按概率選取所增加的信息量。

4試驗驗證及精度評價

試驗選取不同傳感器、不同地區地表覆蓋類型的高光譜數據源AVIRISIndianPines和HyperionEO-1Botswana作為測試數據。兩幅高光譜影像具有很好的代表性。IndianPines數據具有較高的類間相似度,且裸地對處于生長早期的植被干擾嚴重,使IndianPines數據分類較為復雜。Botswana數據一些類別光譜特征具有很好的可分性,如水體、河馬草和裸沙,而有些類別則混合了不同類型的植被,如刺槐林地、刺槐灌木地、刺槐草原,類別間具有一定的重疊,如短豆木、混合豆木,導致了部分類別的類間相似度較高,相似的光譜特征和混合類的存在增大了Botswana數據的分類難度。兩組數據集各類別平均光譜曲線如圖2所示。

圖2 Indian Pines和Botswana數據集各類別平均光譜曲線(類別編號分別與表2和表6相對應) Fig.2 Average spectral signature for each class, for the two datasets(The class index corresponds to classes described in Tab. 2 and Tab. 6)

由于支持向量機(SVM)[22]適合于處理高維數據,對大規模數據分類速度較快,故將SVM作為本次試驗的基礎分類器。采用高斯核函數,即kσ(xi,xj)=exp(-‖xi-xj‖2/2σ2),i=1,2,…,n,xi和xj是光譜向量。將INC_SPEC_MPext算法分別與基于光譜、空間信息以及光譜和空間信息直接融合的SVM分類作比對,驗證增量分類算法的有效性。

4.1  Indian Pines數據試驗驗證及精度評價

使用機載可見光/紅外成像光譜儀(AVIRIS) 1992年6月獲取的美國印第安納州西北部地區IndianPines作為試驗區域,地表覆蓋類型混合了林地、農田、道路、房屋建筑等。標記樣本分布不均衡,部分類別樣本較少。各種農作物基本都處于生長初期,對地表的林冠覆蓋程度只有5%,裸地和作物殘渣對植被像元分類影響明顯。以上原因導致數據集類間相似度非常高,分類難度大大增加。IndianPines圖像大小145像素×145像素,波長范圍0.4~2.5μm,220個波段,空間分辨率20m,去除壞波段和水體吸收的波段,試驗中使用200個波段。圖3(a)所示為IndianPines數據灰度圖像。圖3(b)是其對應的地面參考圖,共有16種地物類別,10249個樣本。表1是其主成分所占百分比,數據顯示前3個主分量之和蘊含超過93%的方差信息。本試驗針對前3個主分量提取擴展形態學剖面,使用圓形結構元素,初始半徑是1,增量為3,對每個主分量進行3次開、閉操作,獲得的擴展形態學剖面維數是3×(2×3+1)=21維。隨機選擇1000個數據作為初始訓練樣本,約占總樣本數量的10%,各類別初始訓練樣本數和對應的測試樣本數如表2所示。

圖3 Indian Pines數據及地面真值 Fig.3 Indian Pines data and the ground truth

主分量所占總方差百分比/(%)主分量累積所占總方差百分比/(%)λ168.4968.49λ223.5392.03λ31.5093.52

表2Indian Pines數據集各類別訓練、測試樣本以及不同算法的總體分類精度、各類別測試精度
Tab.2Information classes and training-test samples and summary of the global and the class-specific test accuracies in percentage for different classification algorithms of Indian Pines data set

序號類別樣本訓練樣本測試樣本SPEC/(%)200維MPext/(%)21維SPEC+MPext/(%)221維INC_SPEC_MPext/(%)221維1苜蓿54110.8782.6110.8719.572玉米未耕地140128882.4272.9783.3383.823玉米略耕地8174968.0787.1179.1686.394玉米2421362.4572.1564.9875.535草地-牧場4843590.0689.0392.1391.306草地-林地7265898.2297.1299.1899.327收割后草地-牧場32550.0067.8650.0057.148干草堆4743199.5898.5499.79100.009燕麥21810.0010.0010.0015.0010大豆未耕地9587775.7285.4977.7884.9811大豆略耕地232222384.1591.2086.6492.4212收割后的大豆5853571.8456.3276.9074.8713小麥2118499.5193.1799.0299.5114林地124114196.0595.5797.3998.1015建筑物-草地-喬木-汽車3834862.9580.5768.1372.2816石頭-鋼制品-塔108389.2574.1993.5597.85OA/(%)樣本總數83.0585.7585.7888.97κ/(%)1000 9249 80.5783.6683.7387.37

為了測試本算法的分類結果,分4組試驗對Indian Pines數據分類結果進行比對,分別是:①使用原始光譜信息進行SVM分類;②使用提取的擴展形態學剖面(空間信息)進行SVM分類;③將光譜和空間信息矢量疊加融合進行SVM分類;④將光譜和空間信息融合后進行增量分類。其中,①和②分別使用光譜、空間信息作為SVM的輸入,③和④用光譜空間融合信息作為SVM的輸入,參數C和σ均由十折交叉驗證獲取。4組試驗所用的訓練樣本完全相同,且通過隨機選取策略獲得,剩余樣本全部作為測試樣本。試驗采用混淆矩陣進行分類結果精度評價,INC_SPEC_MPext算法對應的混淆矩陣如表3所示。

表3 Indian Pines數據集INC_SPEC_MP ext分類混淆矩陣

表2給出Indian Pines數據不同分類算法對應的總體分類精度、各類別平均分類精度(OA)及Kappa系數(κ)。Indian pines試驗數據具有一定的空間分布特征,提取的擴展形態學剖面能夠較好地反映樣本空間信息。因此,基于MPext的Indian Pines數據分類精度要優于光譜分類。將光譜和空間信息直接融合分類比光譜分類精度提高了2.73%,與MPext相比只提高了0.03%,說明對于Indian Pines數據,直接融合空-譜信息的分類效果優于光譜、空間單獨分類,但對空間信息分類精度提高有限。本文算法INC_SPEC_MPext融合了光譜和空間信息,與光譜、空間分類結果相比,總體精度(OA)分別提高了5.92%、3.22%,Kappa系數(κ)分別提高了6.82%、3.73%。同時,INC_SPEC_MPext對自訓練的置信樣本選取規則進行改進,不斷優選Met和Mat預測標記一致的樣本參與分類器訓練,增加了更多有用信息。與光譜和空間信息直接融合分類相比,INC_SPEC_MPext算法總體分類精度(OA)和Kappa系數(κ)分別提高了3.19%和3.66%。算法只需3次迭代即可選出所有Met和Mat分類預測標記一致的樣本。當結構元半徑取值為1,步長取值為3時,每次迭代Met和Mat預測一致樣本個數及對應的光譜、空間分類精度如表4所示。前兩次迭代過程中,Met和Mat分別有6979、818個預測標記一致的樣本,迭代至第3次時Met和Mat已沒有預測一致的樣本,此時將光譜和空間信息進行矢量疊加融合分類。從表4可以看出,INC_SPEC_MPext算法的分類精度隨著訓練集中樣本數量的增加而不斷提高,進一步驗證了增量分類算法的有效性。各算法對應的分類圖如圖4所示。

表4Indian Pines和Botswana數據集迭代次數t=3,結構元半徑r=1, 步長step=3時,對應的光譜、空間預測標記一致的樣本(新增樣本)個數及各自分類精度

Tab.4The number of spectral and spatial consistent label samples and classification accuracy corresponds to Indian Pines and Botswana data set when iterative timest=3, structure radiusr=1 and step value step=3

迭代次數tIndianPinesBotswana一致樣本個數(合并)SPEC/(%)MPext/(%)一致樣本個數(合并)SPEC/(%)MPext/(%)1697983.0585.75243092.1588.27281886.6287.8715694.6490.583#87.5588.23#95.1091.01

圖4 Indian Pines 數據不同算法對應的分類結果圖 Fig.4 Classification maps for different algorithms of Indian Pines data

另外,為了說明提取擴展形態學剖面數據時,結構元素參數對本文算法精度的影響,采用不同結構元素半徑和增量大小對Indian Pines數據集進行測試。結構元素半徑取值范圍{1,2,3,4},增量大小取值范圍{1,2,3,4},共計16組不同參數組合進行測試。圖5為不同算法對應的總體分類精度隨兩個參數變化的三維散點圖。從圖5可以看出無論哪種參數組合方式,本文提出的INC_SPEC_MPext算法都優于光譜、空間以及光譜和空間直接融合分類,能夠獲得更好的分類效果。圖6為不同參數組合情況下新增樣本的正確率及其與INC_SPEC_MPext算法總體分類精度的關系圖。雖然步長和結構元半徑取值不同會對分類精度具有一定的影響,但從圖中可以看出,INC_SPEC_MPext算法總體分類精度與新增樣本正確率呈正相關,即新增標記樣本正確率越高,則分類效果越好。同時,總體分類精度受新增訓練樣本的數量和知識增益的影響,會隨著新增標記樣本正確率不同呈現差異性。

圖5 Indian Pines數據集不同分類算法對應的總體分類精度隨結構元素參數變化散點圖 Fig.5 The scatter plot for global classification accuracy under different SE parameters and different algorithms of Indian Pines data set

圖6 Indian Pines數據集不同步長和結構元半徑組合時新增樣本的正確率及其與INC_SPEC_MP ext 算法總體分類精度關系圖 Fig.6 The plot for overall classification accuracy of INC_SPEC_MP ext algorithm corresponds to the correctness of incremental samples under different SE parameters of Indian Pines data set

4.2 Botswana數據試驗驗證及精度評價

第2個試驗數據是2001年5月由Hyperion EO-1傳感器獲取的Okavango三角洲地區高光譜影像。試驗所用樣本呈現了三角洲影像邊緣地區季節性沼澤、偶發性沼澤、枯林地的地表覆蓋類型,主要反映洪水對研究區植被的影響。其中類別3、4都是季節性淹沒的泛濫平原草地,而在其他的水文周期則呈現不同的地表覆蓋類型。類別9、10、11表示刺槐林地、灌叢帶和草原的不同類型混合,分別以面積占優的地物命名地類。影像大小610像素×340像素,空間分辨率30m,光譜范圍0.4~2.5μm,光譜分辨率0.01μm,242個波段。去除壞波段和低信噪比波段后,共145個光譜波段可用。圖7(a)所示為Botswana數據灰度圖像。圖7(b)是其對應的地面參考圖,共有14種地物類別,3248個樣本。表5是其主成分所占百分比,數據顯示前兩個主分量之和蘊含超過99%的方差信息。本試驗針對前兩個主分量提取擴展形態學剖面。試驗中采用圓形結構元素,初始半徑是1,增量為3,對每個主分量進行3次開、閉操作,擴展形態學剖面維數是2×(2×3+1)=14維。隨機選擇300個數據作為初始訓練樣本,約占總樣本數量的9%,各類別初始訓練樣本數和對應的測試樣本數如表6所示。

表5Botswana主成分特征值所占百分比

Tab.5Eigenvalues of principal components in percentage of Botswana

%

圖7 Botswana數據及地面真值 Fig.7 Botswana data and the ground truth

同樣分4組試驗對Botswana數據分類結果進行比對,分別是:①使用原始光譜信息進行SVM分類;②使用提取的擴展形態學剖面(空間信息)進行SVM分類;③將光譜和空間信息矢量疊加融合進行SVM分類;④將光譜和空間信息融合進行增量分類。其中,①和②分別使用光譜、空間信息作為SVM的輸入,③和④使用光譜空間融合信息作為SVM的輸入,參數C和σ均由十折交叉驗證獲取。4組試驗所用的訓練樣本完全相同,且通過隨機選取策略獲得,剩余樣本全部作為測試樣本。試驗采用混淆矩陣進行分類結果精度評價,INC_SPEC_MPext算法對應混淆矩陣如表7所示。

表6Botswana數據集各類別訓練、測試樣本以及不同算法的總體分類精度、各類別測試精度

Tab.6Information classes and training-test samples and summary of the global and the class-specific test accuracies in

percentage for different classification algorithms of Botswana data set

序號類別樣本訓練樣本測試樣本SPEC/(%)145維SPEC/(%)14維SPEC+MPext/(%)159維INC_SPEC_MPext/(%)159維1水體25245100.00100.00100.00100.002河馬草99293.0769.3192.0893.073泛濫草原12322897.6192.0399.6099.604泛濫草原22019580.9381.4089.7793.025蘆葦12524492.1993.3199.2697.406河岸2524476.5873.6175.8488.487火跡22423598.0798.8498.0798.848內島1918495.5764.5382.7672.919刺槐林地2928589.4979.9486.9496.8210刺槐灌木地2322591.9495.5697.58100.0011刺槐草原2827795.7497.7095.4198.3612短豆木1616595.5896.6998.3498.3413混合豆木2524389.9385.4594.0392.1614裸沙98697.89100.0098.96100.00OA/(%)樣本總數92.1588.2793.2695.14κ/(%)300294894.9690.8992.7094.73

表7 Botswana數據集INC_SPEC_MP ext分類混淆矩陣

表6給出Botswana數據不同分類算法對應的總體分類精度、各類別平均分類精度及Kappa系數(κ)。由于試驗采集樣本空間不連續,因此提取的空間信息有限,導致空間分類精度不如光譜分類,這是由試驗數據分布情況決定的。光譜和空間信息直接融合分類比光譜分類精度提高了1.11%,比MPext提高了4.99%。因此,光譜和空間信息直接融合的分類效果優于光譜、空間單獨分類。本文算法INC_SPEC_MPext通過融合光譜和空間信息,比光譜、空間單獨分類的總體精度分別提高了2.99%和6.87%。同時,INC_SPEC_MPext算法對自訓練的置信樣本選取規則進行改進,不斷優選Met和Mat預測標記一致的樣本參與分類器訓練,增加了更多有用信息。與光譜和空間信息直接融合分類相比,INC_SPEC_MPext算法總體分類精度(OA)和Kappa系數(κ)分別提高了1.88%和2.03%。算法只需3次迭代即可選出所有Met和Mat分類預測標記一致的樣本。當結構元半徑取值為1,步長取值為3時,每次迭代Met和Mat預測一致樣本個數及對應的光譜、空間分類精度如表4所示。前兩次迭代過程中,Met和Mat分別共有2430、156個預測標記一致的樣本。迭代至第3次時Met和Mat已沒有預測一致的樣本,此時將光譜和空間信息進行矢量疊加融合分類。從表4可以看出,INC_SPEC_MPext算法總體分類精度隨著訓練集中樣本數量的增加而不斷提高,進一步驗證了增量分類算法的有效性。

另外,為了說明提取擴展形態學剖面數據時,結構元素參數對本文算法精度的影響,試驗采用不同結構元素半徑和增量大小對Botswana數據集進行測試。結構元素半徑取值范圍{1,2},增量大小取值范圍{1,2,3,4},共計8組不同參數組合。圖8為不同算法對應的總體分類精度隨兩個參數變化的三維散點圖。從圖8可以看出無論哪種參數組合方式,本文提出的INC_SPEC_MPext算法都優于光譜、空間以及光譜和空間直接融合分類,能夠獲得更好的分類效果。

圖8 Botswana數據集不同分類算法總體分類精度隨結構元素參數變化散點圖 Fig.8 The scatter plot for global classification accuracy under different SE parameters and different algorithms of Botswana data set

圖9為不同參數組合情況下新增樣本的正確率及其與INC_SPEC_MPext算法總體分類精度的關系圖。雖然步長和結構元半徑取值不同會對分類精度具有一定的影響,但從圖中可以看出,INC_SPEC_MPext算法總體分類精度與新增樣本正確率呈正相關,即新增標記樣本正確率越高,則分類效果越好。同時,總體分類精度受新增訓練樣本的數量和知識增益的影響,會隨著新增標記樣本正確率不同呈現差異性。

圖9 Botswana數據集不同步長和結構元半徑組合時新增樣本的正確率及其與INC_SPEC_MP ext算法總體分類精度關系圖 Fig.9 The plot for overall classification accuracy of INC_SPEC_MP ext algorithm corresponds to the correctness of incremental samples under different SE parameters of Botswana data set

本文分兩次試驗分別針對不同地表覆蓋類型的高光譜影像進行了算法測試。Indian Pines數據空間分布特征明顯,提取的MPext信息分類精度優于光譜分類。而Botswana影像由于試驗樣本采樣不連續,導致空間分布特征沒有很好地保留,故提取的MPext空間信息分類精度不如光譜分類。針對這兩種具有代表性的數據試驗結果可以看出,與基于光譜、空間信息以及光譜和空間信息直接融合的分類方法相比,INC_SPEC_MPext算法在標記樣本數量有限條件下,通過最大限度利用未標記樣本蘊含的知識,不斷優化分類器學習能力,可以獲得更好的分類效果。

5結論

針對高光譜遙感影像標記樣本獲取成本高的問題,本文提出了高光譜遙感影像增量分類算法INC_SPEC_MPext,旨在充分利用大量未標記樣本所蘊含的知識的同時,以獲得更好的分類性能。與基于光譜分類相比,融合高光譜遙感影像的光譜和空間結構信息,使待分類高光譜數據的信息更加豐富,可以在一定程度上減輕同物異譜和異物同譜對分類的影響。同時,改進了傳統的自訓練算法,重新定義增量迭代過程中的置信樣本選取規則,將兩個分類模型預測一致的樣本加入訓練集,不斷優化分類器。修改后的規則可以使分類器獲取更多的知識,選取的樣本置信度更高。試驗結果表明,對于不同地表覆蓋類型的高光譜影像,當標記樣本數量不充足時,INC_SPEC_MPext算法將大量高置信度、高信息量的樣本加入訓練集,只需幾次迭代即可收斂。算法在降低分類成本的同時,總體分類精度(OA)和Kappa系數(κ)都有不同程度提高。同時,對源于自訓練算法本身的未標記樣本誤分現象,本算法雖然降低了誤標記樣本的數量,但并沒有將其完全消除。后續的研究需要對此作進一步合理的分析、研究和試驗,將誤標記樣本的數量控制在最小范圍。

參考文獻:

[1]KUO B C, LANDGREBE D A. A Robust Classification Procedure Based on Mixture Classifiers and Nonparametric Weighted Feature Extraction[J]. IEEE Transactions on Geoscience and Remote Sensing, 2002, 40(11): 2486-2494.

[2]LEE C, LANDGREBE D A. Feature Extraction Based on Decision Boundaries[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1993, 15(4): 388-400.

[3]LIU Chunhong, ZHAO Chunhui, ZHANG Lingyan. A New Method of Hyperspectral Remote Sensing Image Dimensional Reduction[J]. Journal of Image and Graphics, 2005, 10(2): 218-222. (劉春紅, 趙春暉, 張凌雁. 一種新的高光譜遙感圖像降維方法[J]. 中國圖象圖形學報, 2005, 10(2): 218-222.)

[4]LUO Jiancheng, ZHOU Chenghu, LIANG Yi, et al. Support Vector Machine for Spatial Feature Extraction and Classification of Remotely Sensed Imagery[J]. Journal of Remote Sensing, 2002, 6(1): 50-55. (駱劍承, 周成虎, 梁怡, 等. 支撐向量機及其遙感影像空間特征提取和分類的應用研究[J]. 遙感學報, 2002, 6(1): 50-55.)

[5]WANG Junshu, JIANG Nan, ZHANG Guoming, et al. Semi-supervised Classification Algorithm for Hyperspectral Remote Sensing Image Based on DE-self-training[J]. Transactions of the Chinese Society for Agricultural Machinery, 2015, 46(5): 239-244. (王俊淑, 江南, 張國明, 等. 高光譜遙感圖像DE-self-training半監督分類算法[J]. 農業機械學報, 2015, 46(5): 239-244.)

[6]ZHOU Zhihua, ZHAN Dechuan, YANG Qiang. Semi-supervised Learning with Very Few Labeled Training Examples[C]∥Proceedings of the National Conference on Artificial Intelligence. Cambridge, MA London: [s.n.], 2007, 22(1): 675-680.

[7]CHAWLA N V, KARAKOULAS G. Learning from Labeled and Unlabeled Data: An Empirical Study across Techniques and Domains[J]. Journal of Artificial Intelligence Research, 2005, 23(1): 331-366.

[8]LI Yuanqing, GUAN Cuntai, LI Huiqi, et al. A Self-training Semi-supervised SVM Algorithm and Its Application in an EEG-based Brain Computer Interface Speller System[J]. Pattern Recognition Letters, 2008, 29(9): 1285-1294.

[9]TAN Kun, DU Peijun. Wavelet Support Vector Machines Based on Reproducing Kernel Hilbert Space for Hyperspectral Remote Sensing Image Classification[J]. Acta Geodaetica et Cartographica Sinica, 2011, 40(2): 142-147. (譚琨, 杜培軍. 基于再生核Hilbert空間的小波核函數支持向量機的高光譜遙感影像分類[J]. 測繪學報, 2011, 40(2): 142-147.)

[10]MELGANI F, BRUZZONE L. Classifcation of Hyperspectral Remote Sensing Images with Support Vector Machines[J]. IEEE Transactions on Geoscience and Remote Sensing, 2004, 42(8): 1778-1790.

[11]MANTHIRA MOORTHI S, MISRA I, KAUR R, et al. Kernel Based Learning Approach for Satellite Image Classification Using Support Vector Machine[C]∥IEEE Recent Advances in Intelligent Computational Systems (RAICS). Trivandrum: IEEE, 2011: 107-110.

[12]DELL’ACQUA F, GAMBA P, FERRARI A, et al.Exploiting Spectral and Spatial Information in Hyperspectral Urban Data with High Resolution[J]. IEEE Geoscience and Remote Sensing Letters, 2004, 1(4): 322-326.

[13]LIANG Liang, YANG Minhua, LI Yingfang. Hyperspectral Remote Sensing Image Classification Based on ICA and SVM Algorithm[J]. Spectroscopy and Spectral Analysis, 2010, 30(10): 2724-2728. (梁亮, 楊敏華, 李英芳. 基于ICA與SVM算法的高光譜遙感影像分類[J]. 光譜學與光譜分析, 2010, 30(10): 2724-2728.)

[14]WU Jian. PENG Daoli. Vegetation Classification Technology of Hyperspectral Remote Sensing Based on Spatial Information[J]. Transactions of the Chinese Society of Agricultural Engineering, 2012, 28(5): 150-153. (吳見, 彭道黎. 基于空間信息的高光譜遙感植被分類技術[J]. 農業工程學報, 2012, 28(5): 150-153.)

[15]GAO Hengzhen, WAN Jianwei, WANG Libao, et al. Research on Classification Technique for Hyperspectral Imagery Based on Spectral-spatial Composite Kernels[J]. Signal Processing, 2011, 27(5): 648-652. (高恒振, 萬建偉, 王力寶, 等. 基于譜域-空域組合核函數的高光譜圖像分類技術研究[J]. 信號處理, 2011, 27(5): 648-652.)

[16]CHEN Shanjing, HU Yihua, SHI Liang, et al. Classificationof Hyperspectral Imagery Based on Ant Colony Compositely Optimizing SVM in Spatial and Spectral Features[J]. Spectroscopy and Spectral Analysis, 2013, 33(8): 2192-2197. (陳善靜, 胡以華, 石亮, 等. 空-譜二維蟻群組合優化SVM 的高光譜圖像分類[J]. 光譜學與光譜分析, 2013, 33(8): 2192-2197.)

[17]POGGI G, SCARPA G, ZERUBIA J B. Supervised Segmentation of Remote Sensing Images Based on a Tree-structure MRF Model[J]. IEEE Transactions on Geoscience and Remote Sensing, 2005, 43(8): 1901-1911.

[18]JACKSON Q, LANDGREBE D A. Adaptive Bayesian Contextual Classification Based on Markov Random Fields[J]. IEEE Transactions on Geoscience and Remote Sensing, 2002, 40(11): 2454-2463.

[19]FAUVEL M, BENEDIKTSSON J A, CHANUSSOT J, et al. Spectral and Spatial Classification of Hyperspectral Data Using SVMs and Morphological Profiles[J]. IEEE Transactions on Geoscience and Remote Sensing, 2008, 46(11): 3804-3814.

[20]CRESPO J, SERRA J, SCHAFER R W. Theoretical Aspects of Morphological Filters by Reconstruction[J], Signal Processing, 1995, 47(2): 201-225.

[21]FAUVEL M, TARABALKA Y, BENEDIKTSSON J A, et al. Advances in Spectral-spatial Classification of Hyperspectral Images[J]. Proceedings of the IEEE, 2013, 101(3): 652-675.

[22]CHANG C C, LIN C J. LIBSVM: A Library for Support Vector Machines[J]. ACM Transactions on Intelligent Systems and Technology (TIST), 2011, 2(3): 27.

(責任編輯:張艷玲)

修回日期: 2015-06-08

First author: WANG Junshu(1985—), female, PhD candidate, research assistant, majors in intelligent information extraction of hyperspectral remote sensing image.

E-mail: jlsdwjs@126.com

通信作者: 江南

Corresponding author: JIANG Nan

E-mail: njiang@njnu.edu.cn

猜你喜歡
光譜信息空間信息形態學
結合多層特征及空間信息蒸餾的醫學影像分割
基于光譜和Gabor紋理信息融合的油桃品種識別
基于植被光譜信息的龜裂堿土堿化程度預測研究
傅立葉變換光譜儀的研究現狀與光譜信息分析原理
基于作戰環的空間信息時效網關鍵節點分析模型
基于時效網絡的空間信息網絡結構脆弱性分析方法研究
醫學微觀形態學在教學改革中的應用分析
一種基于區域生長的高分辨率遙感影像道路提取方法
數學形態學濾波器在轉子失衡識別中的應用
巨核細胞數量及形態學改變在四種類型MPN中的診斷價值
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合