?

一種在線字典學習的高光譜圖像盲解混方法

2017-07-21 10:04宋曉瑞趙忠文
裝備學院學報 2017年3期
關鍵詞:字典光譜編碼

宋曉瑞, 趙忠文, 于 堯

(1. 裝備學院 研究生管理大隊, 北京 101416; 2. 裝備學院 復雜電子系統仿真實驗室, 北京 101416)

一種在線字典學習的高光譜圖像盲解混方法

宋曉瑞1, 趙忠文2, 于 堯1

(1. 裝備學院 研究生管理大隊, 北京 101416; 2. 裝備學院 復雜電子系統仿真實驗室, 北京 101416)

針對待處理高光譜圖像中所含地物光譜未知的情況,將在線字典學習的方法引入高光譜稀疏解混中,提出了一種基于在線字典學習和稀疏編碼的高光譜圖像盲解混方法。通過在線字典學習以及對稀疏編碼的統計,從訓練字典中篩選出與未知地物光譜最為接近的原子,作為待處理數據所含地物光譜的估計。仿真結果表明:這種方法的準確提取概率超過66%,有效提取概率超過89%,對地物光譜識別等相關研究有一定借鑒意義;另外,利用訓練字典和稀疏編碼可較好的重構混合像素光譜向量。

高光譜遙感;在線字典學習;稀疏編碼;地物光譜提??;稀疏解混

光學遙感作為現代戰場環境感知的重要技術手段,其技術發展進程是光譜分辨率不斷提高的過程,歷經全色(黑白)(panchronmatic)、彩色攝像(color photography)、多光譜(multispectral)掃描成像,至今已發展到高光譜分辨率遙感(hyperspectral remote sensing)階段。高光譜分辨率遙感,也稱高光譜遙感,是指用很窄(10-2λ)而連續的光譜通道對地物持續遙感成像的技術[1]。高光譜遙感在可見光到短波紅外波段的光譜分辨率高達納米(nm)數量級,通常具有波段多的特點,光譜通道數多達數十甚至數百個以上,且各光譜通道間往往是連續的。因此,高光譜遙感又被稱為成像光譜(imagingspectrometry)遙感,其在成像的同時記錄下上百個光譜通道數據,且從每個像素均可提取一條連續的光譜曲線。圖譜合一、光譜連續的特點,使得高光譜遙感圖像在軍事偽裝探測和戰場環境背景探測等方面有重要應用。

高光譜圖像的光譜分辨率雖然很高,但每個像素所對應的地物目標空間分辨率卻較低。由于空間分辨率不足,以及實際地物分布復雜多樣等因素的影響,混合像素普遍存在于高光譜遙感圖像中?;旌舷袼氐某霈F嚴重制約了高光譜圖像處理精度的提升,成為阻礙高光譜遙感技術發展的重要因素。針對這一問題提出的混合像素分解技術,已成為高光譜遙感圖像處理領域的一大研究熱點。

隨著壓縮感知和稀疏表示理論的不斷發展成熟,稀疏表示的思想也被引入到高光譜解混中。2009年,Iordache與Bioucas-Dias等[2]用光譜庫代替線性光譜混合模型中的端元集合,提出了基于稀疏表示的線性光譜混合模型。2011年,Bioucas-Dias等[3]1提出了SUnSAL(SparseUnmixingbyvariableSplittingandAugmentedLagrangian)算法,該算法利用交替迭代思想,通過變量分裂和增廣拉格朗日乘數法求解l1-范數下豐度系數的稀疏解。在此基礎上,又有學者陸續提出了SUnSAL-TV[4]、正交匹配追蹤[5](OrthogonalMatchingPursuit,OMP)以及SMP[6](SubspaceMatchingPursuit)等多種稀疏解混算法。文獻[7]中提出了一種基于反正切平滑的l0-范數稀疏解混算法,更好地解決了稀疏解混的NP(Non-deterministicPolynomial)難問題。文獻[8]提出了一種應用豐度矩陣加權核范數的低秩本地正則化稀疏解混算法,進一步提高了豐度系數的估計精度。

上述算法的基本思想為求解混合像素在過完備光譜庫下的稀疏表示,其特點為均要求過完備光譜庫已知。由于自然界地物光譜的復雜多樣性,通常存在某些甚至全部地物光譜未知的情況,在這種情況下如何進行混合像素解混以及地物光譜提取,具有十分重要的應用價值。

針對這一實際情況,本文將在線字典學習的方法引入到高光譜圖像稀疏解混問題中,提出一種基于在線字典學習與稀疏編碼的高光譜遙感圖像盲解混算法,其優勢在于利用稀疏編碼在光譜解混中的優良性能的同時,無須光譜先驗知識。該算法以高光譜遙感圖像為訓練集,通過在線學習的方法得到冗余字典,利用該冗余字典求解混合像素稀疏編碼,即豐度系數向量,最后利用統計方法得到未知地物光譜。因此,利用本文所提算法進行高光譜解混,除待處理圖像外,不再需要其他輸入。

1 基于稀疏表示的線性光譜混合模型

光譜混合從本質上可分為線性光譜混合(LinearSpectralMixtureModel,LSMM)和非線性光譜混合(NonlinearSpectralMixtureModel,NLSMM),多數情況下非線性光譜混合可通過線性化轉化為線性光譜混合。因此,線性光譜混合模型目前被大多數光譜解混算法采用。本文中所采用的光譜混合模型為線性光譜混合模型。

基于稀疏表示的混合像素分解算法是通過引入一個有效的過完備光譜庫,將混合像素光譜曲線表示成光譜庫中某幾種地物光譜的線性組合,如圖1所示。其模型為[9]

x=Dα+n

(1)

需要強調的是,考慮到模型的物理意義,豐度系數向量α應滿足非負及和為1的約束條件,即

(2)

0≤αi≤1

(3)

圖1 過完備光譜庫下混合像素的線性表示

由于α稀疏,式(1)可等價為l0范數最小化問題,即

(4)

式中,δ為一個極小常量。

基于稀疏表示的高光譜解混算法,基本思想可簡單理解為對多維數據的線性分解。因此,目前所研究的稀疏解混問題可等價為在已知過完備光譜庫的情況下,尋找方程最簡單的解。

2 基于在線字典學習與稀疏編碼的盲解混方法

從上一節對基于稀疏表示的線性光譜混合模型的討論中可知,得到稀疏編碼,即豐度系數向量的前提是用于光譜向量系數表示的過完備光譜字典D∈RL×k已知。當遙感圖像中存在未知地物光譜時,過完備光譜字典D顯然部分或全部未知。因此,需要先求得一個較好的字典,才能夠進行稀疏解混,得到各像素中端元豐度系數,并通過統計方法得到未知地物光譜曲線以用于進一步的研究,如地物識別等。

本文將一種適用于大數據集的基于隨機近似(stochasticapproximations)的在線字典學習優化算法引入高光譜稀疏解混中,可以使光譜字典學習速度大大提高,并有效地處理大規模訓練數據。利用高光譜遙感圖像中的部分混合像素光譜向量為訓練集,通過本文提出的光譜字典在線學習算法,求得用于稀疏解混的過完備光譜字典D。

利用在線學習得到的過完備光譜字典D,對遙感圖像中混合像素進行稀疏解混,得到稀疏編碼α。最后通過對稀疏編碼α進行統計分析,提取出未知地物光譜。

2.1 光譜字典在線學習算法

在給定混合像素光譜向量集合的條件下,字典學習的目標是找到一個冗余光譜字典,能夠運用較少數目的原子表示這些光譜向量。其數學描述如下:

(5)

式中:Np為訓練集中混合像素數目;l1-范數項誘導稀疏編碼,二次項為誤差,二者權值由正則化參數λ(正值)確定。

由于字典D和稀疏解α的聯合優化問題屬于非凸問題,而當固定式(5)中D和αi的其中一個時,問題將轉化為凸問題。解決這個問題較為便捷的方案是輪流固定D和αi,即交互地對D和αi進行最優化求解。

對αi求最優化是一個BPDN(BasisPursuitDe-Noising)問題,文獻[10]中利用最小角度回歸算法(LeastAngleRegression,LARS)求解。但由于αi的物理意義中要求滿足非負與和為1的約束條件,本文利用文獻[3]3提出的變量分解和增廣拉格朗日稀疏回歸方法(SUnSAL)解決該BPDN的最優化問題。

對字典D進行最優化求解,相當于最小化下面的問題。

(6)

圖2 光譜字典在線學習算法流程圖

式中:t為當前迭代次數;xj為從原始訓練集中隨機獲取的j個混合像素光譜向量組成的當前訓練集合。本文中對式(6)進行最小化時,采用投影塊坐標下降算法對字典進行列更新。

通過對在線字典學習原理的分析,可以得到光譜字典在線學習算法流程,如圖2所示。首先,從原始遙感圖像中選取若干個混合像素光譜向量作為原始訓練集;然后,從原始訓練集中隨機選取一系列混合像素光譜向量作為當前循環中所使用的訓練集,并按照一定順序根據該當前訓練集進行字典學習。對于當前訓練集中的每一個新元素,先通過求解BPDN問題計算稀疏編碼,然后對字典進行更新。

值得注意的是,該算法對初始化字典并不過分依賴,通常選取原始訓練集中k個混合像素光譜向量作為初始化字典。

2.2 稀疏解混算法

通過2.1節中在線字典學習的方法訓練得到過完備光譜字典后,可以對遙感圖像混合像素光譜向量進行稀疏編碼。由于訓練得到的字典D是冗余的,且各類干擾的存在使得式(4)中δ>0。此時,式(4)所描述的最優化問題是NP難問題[11],不能夠直接求解。為解決這一問題,可將l0-范數進行松弛化處理,利用l1-范數進行近似。因為J(x)=‖x‖1是凸的,所以可求得最優解[12]。近似后的問題被稱為LASSO(LeastAbsoluteShrinkageandSelectionOperator)問題[13],與BPDN問題是等價的。

由于稀疏編碼α的物理意義為豐度系數,需滿足非負與和為1的約束條件,且其求解問題與BPDN問題等價,因此,可同樣應用SUnSAL算法求解。需要特別強調的是,雖然在線字典學習與求解稀疏編碼中均應用了這一算法,但2次應用中算法關鍵參數,如正則化參數λ等,在設置上有很大不同,必須根據問題的不同設置合適的參數。

2.3 地物光譜提取

得到遙感圖像混合像素光譜向量的稀疏編碼α之后,通過對其進行統計分析,可在訓練得到的過完備光譜字典D中提取到遙感圖像中未知地物光譜曲線。其原理是:由于α的稀疏性,其大多數元素為0,不為0元素的坐標是所選擇的用線性表示混合像素光譜曲線的最優原子。當α的樣本足夠大時,統計被選擇次數最多的若干個字典原子,可認為這些原子所代表的是遙感圖像中未知地物光譜曲線。

(7)

式中:τi為被選擇次數第i多的原子的被選擇次數;φ為設定的閾值。閾值的選取通常與待處理高光譜遙感圖像有關。

需要說明的是,采用這種統計算法提取得到的地物光譜曲線并不一定與真實地物光譜完全一致,其誤差大小很大程度上取決于字典訓練的“好壞”程度。

3 仿真實驗

為驗證算法性能,仿真實驗中所使用的待處理數據為人工生成的模擬混合像素光譜向量,設為x。由于僅涉及光譜數據處理,因此模擬數據中不考慮空間維情況。

首先,從USGS(UnitedStatesGeologicalSurvey)礦物光譜庫中任意選取9種物質的光譜(光譜波段數L=224),作為生成模擬數據的真實地物光譜,如表1所示。

表1 模擬數據所選取的地物

假設每個混合像素均由2個真實地物光譜以任意豐度系數混合而成,豐度系數滿足非負且和為1的約束條件。模擬數據x中共包含10 000個混合像素光譜向量。

3.1 在線字典學習與稀疏解混

采用模擬數據x中的Np個數據作為原始訓練集,將光譜字典在線學習算法的參數設置如表2所示。

另外,光譜字典在線學習算法停止條件為:迭代次數達到200次。

圖4 提取地物光譜曲線、字典最優原子與真實光譜曲線的比較

完成參數設置及停止條件設置后,將原始訓練集作為算法輸入,按照本文所提出的光譜字典在線學習算法求解訓練字典,其算法流程如圖2所示。

求得稀疏編碼α后,可利用訓練字典D和稀疏編碼α重構模擬混合像素光譜向量,其與原數據之間的誤差如圖3所示。

圖3 重構混合像素光譜向量與模擬數據誤差示意圖

從圖3中可看出,重構的模擬混合像素光譜向量與原數據之間誤差較小,驗證了在線字典學習與稀疏解混算法的正確有效。

3.2 地物光譜提取

設閾值φ=1/3,通過式(7)解得Na=9,與生成模擬數據時所使用的礦物光譜數一致,驗證了統計算法的有效。將被選擇次數最多的9個字典原子,即提取到的地物光譜曲線,與真實光譜曲線進行比較,如圖4所示。

從圖4可看到,9個提取到的地物光譜中有6個和字典中最接近USGS真實光譜的原子完全重合,這說明了2個問題:(1)通過在線學習得到的字典D中包含與未知地物光譜近似一致(如圖4i))的原子;(2)通過2.3節中地物光譜提取方法可有效提取到字典中的最優原子。圖4a)、4b)、4e)中,提取到的地物光譜與USGS真實光譜之間存在不同程度的偏差,其原因是:訓練得到的字典D中無法找到與上述3個真實光譜近似一致的原子,導致稀疏編碼在選擇原子時無法找到字典中最優原子光譜,因此無法通過統計方法有效提取到真實光譜對應的字典中最優原子。即便如此,圖4a)、4b)、4e)中,提取到的地物光譜在光譜特征上與USGS真實光譜之間仍高度相似,對地物識別等相關研究也有一定幫助。

為定量評價待處理高光譜數據中地物光譜提取效果,計算字典中最優原子光譜和提取地物光譜與USGS真實光譜之間的均方根誤差,分別為Eatom和Esta,如表3所示。

表3 最優原子光譜和提取光譜與真實光譜之間的均方根誤差

從表3中可看到,圖4所示完全重合的6條光譜的2個均方根誤差值相同,進一步說明通過本文算法提取到了真實光譜所對應字典中的最優原子,且其均方根誤差值均小于0.01,與真實光譜近似一致。而圖3所示存在偏差的3條光譜,其Esta均大于Eatom,說明未能提取到真實光譜所對應字典中的最優原子,而較大的Eatom值則說明了訓練得到的字典中難以找到與真實光譜近似一致的原子。雖然如此,3條光譜的Esta值仍較小,也與圖3中光譜特征高度一致的特點相對應。

綜上所述,從仿真實驗結果看:在線字典學習可得到較好的字典,其中包含與真實地物光譜近似一致及特征高度相像的原子;提取得到的未知地物光譜與真實光譜之間誤差較小,其中準確提取的概率可超過66%,有效提取的概率達到89%,驗證了本文算法的正確性和有效性。

4 結 束 語

本文提出了一種基于在線字典學習和稀疏編碼的高光譜圖像盲解混方法,在待處理高光譜圖像中所含地物光譜未知的情況下,無須其他先驗知識,利用待處理圖像作為訓練集,通過在線學習得到較好的光譜字典,進而有效估計了未知地物光譜曲線,并得到較好的稀疏解混效果,為地物光譜識別等相關研究提供幫助。但如何實現已知部分地物光譜條件下效果更優的地物光譜提取及稀疏解混等問題,仍有待進一步解決。

References)

[1]童慶禧,張兵,鄭蘭芬.高光譜遙感:原理、技術與應用[M].北京:高等教育出版社,2006:38-39.

[2]IORDACHE M D,BIOUCAS-DIAS J M,PLAZA A.Sparse unmixing of hyperspectral data[J].IEEE Transactions on Geoscience & Remote Sensing,2011,49(6):2014-2039.

[3]BIOUCAS-DIAS J M,FIGUEIREDO M A T.Alternating direction algorithms for constrained sparse regression: Application to hyperspectral unmixing[C]//Hyperspectral Image and Signal Processing: Evolution in Remote Sensing (WHISPERS),2010 2nd Workshop on.IEEE.Reykjavik:IEEE,2010: 1-4.

[4]IORDACHE M D,BIOUCAS-DIAS J M,PLAZA A.Total variation spatial regularization for sparse hyperspectral unmixing[J].IEEE Transactions on Geoscience & Remote Sensing,2012,50(11):4484-4502.

[5]BRO R,DE JONG S.A fast non‐negativity‐constrained least squares algorithm[J].Journal of Chemometrics,1997,11(5):393-401.

[6]SHI Z,TANG W,DUREN Z,et al.Subspace matching pursuit for sparse unmixing of hyperspectral data[J].IEEE Transactions on Geoscience & Remote Sensing,2014,52(6):3256-3274.

[7]SALEHANI Y E,GAZOR S,KIM I M,et al.l0-norm sparse hyperspectral unmixing using arctan smoothing[J].Remote Sensing,2016,8(3):187.

[8]RIZKINIA M,OKUDA M.Local abundance regularization for hyperspectral sparse unmixing[C]// Signal and Information Processing Association Summit and Conference.Jeju:IEEE,2017:1-6.

[9]趙春暉,王立國,齊濱.高光譜遙感圖像處理方法及應用[M].北京:電子工業出版社,2016:83-91.

[10]MAIRAL J,BACH F,PONCE J,et al.Online dictionary learning for sparse coding[C]// International Conference on Machine Learning,ICML 2009.Montreal:DBLP,2009:689-696.

[11]NATARAJAN K.Sparse approximate solutions to linear systems[J].SIAM Journal on Computing,1995(24):227-234.

[12]ELAD M.Sparse and redundant representations: from theory to applications in signal and image processing[M].New York:Springer Publishing Company,Incorporated,2010:16-19.

[13]郝紅星.基于干涉相位圖像構建數字高程模型的關鍵技術研究[D].長沙:國防科學技術大學,2014:69-70.

(編輯:李江濤)

Blind Unmixing of Hyperspectral Images Based on Online Dictionary Learning

SONG Xiaorui1, ZHAO Zhongwen2, YU Yao1

(1. Department of Graduate Management, Equipment Academy, Beijing 101416, China; 2. Science and Technology on Complex Electronic System Simulation Laboratory, Equipment Academy, Beijing 101416, China)

In view of the unknown condition of the surface feature spectra in the hyperspectral images to be processed, with the introduction of an online dictionary learning into the hyperspectral sparse unmixing, this paper proposes a method of blind hyperspectral unmixing based on online dictionary learning and sparse coding. Atoms which are closest to the unknown surface feature spectra are selected from the training dictionary via the online dictionary learning and sparse coding statistics. They are used to estimate the surface feature spectra in the data to be processed. The simulation results show that the accurate extraction probability of this method is more than 66%, and the effective extraction probability is more than 89%. It can be used for reference in the research of spectral identification of ground objects. In addition, the training dictionary and sparse coding can be used to reconstruct the mixed pixel spectral vectors. Therefore, this method also works well in sparse unmixing.

hyperspectral remote sensing; online dictionary learning; sparse coding; surface feature spectrum extraction; sparse unmixing

2017-04-17

部委級資助項目

宋曉瑞(1990—),女,博士研究生,主要研究方向為高光譜遙感。sxrjmx@163.com

TP751

2095-3828(2017)03-0021-06

A DOI 10.3783/j.issn.2095-3828.2017.03.004

猜你喜歡
字典光譜編碼
基于三維Saab變換的高光譜圖像壓縮方法
基于3D-CNN的高光譜遙感圖像分類算法
生活中的編碼
高光譜遙感成像技術的發展與展望
《全元詩》未編碼疑難字考辨十五則
子帶編碼在圖像壓縮編碼中的應用
字典的由來
Genome and healthcare
大頭熊的字典
正版字典
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合