?

基于特征提取的SVM圖像分類技術的無人機遙感建筑物震害識別應用研究*

2022-02-05 13:43郭紅梅尹文剛魯長江肖本夫
災害學 2022年4期
關鍵詞:尺度空間特征向量關鍵點

張 瑩,郭紅梅,尹文剛,趙 真,魯長江,肖本夫

(1.四川省地震局,四川 成都 610041;2.武警警官學院,四川 成都 610213)

在獲取建筑物震害信息時,現場調查需統籌大量人力物力,且獲取信息的周期長、效率低,還面臨因地形等自然環境因素或交通、通訊中斷等災情因素導致難以開展的局限性[1]。為此,探索基于遙感等技術的震害信息獲取成為了研究熱點,其中,無人機遙感系統除具備機動靈活、快速高效等優點外,其采集的高分辨率影像作為圖像信息,能更加直觀地反映災區實際受災情況,已成為一種既方便快捷又能全面獲取建筑物震害信息的重要手段。而在遙感圖像中識別建筑物震害時,通常通過人工目視解譯或由計算機自動提取。在人工目視解譯方面,王曉青等[2]采用人機交互的震害提取方法對比震前震后的高分遙感影像,解譯了尼泊爾8.1級地震災區房屋建筑及其震害程度;鄧飛等[3]基于高分辨率無人機正射遙感影像,通過目視判讀對九寨溝7.0級地震極災區的損毀建筑物等進行了解譯。在計算機自動提取方面, LIU等[4]利用航空遙感數據,采用最大似然分類法對日本熊本5.0級地震震后建筑物的破壞進行了識別;杜浩國等[5]依托無人機高清遙感影像,提出一種改進的蟻群算法識別了漾濞6.4級地震的建筑震害情況。人工目視解譯法可精確提取震害信息,但耗費時間較多;現有的計算機自動識別方法可快速提取震害信息,但因存在易收斂于局部最優解等缺陷,導致識別精度提高受限。

近年來,隨著機器學習算法的不斷更新與優化,使隨機森林、支持向量機(SVM)等一些新的圖像分類技術得以應用。而遙感建筑物震害識別正是根據不同的建筑物震害圖像特征,按破壞等級進行圖像分類的過程。但震后,無人機一般以極震區為主開展震害調查,現場獲取的訓練樣本數量有限,在通過樣本訓練實現對高光譜遙感圖像的分類時,分類過程對樣本數量卻有較高要求[6]。通過相關實際應用表明,SVM分類方法不僅能解決遙感圖像分類中的小樣本問題,對于高光譜遙感圖像中因高特征維度造成的線性不可分問題也能有效解決,目前在遙感圖像分類中已被廣泛應用[7]。因此,針對實際問題,本文選用基于統計學習理論的SVM分類方法對圖像進行分類,實現對建筑物震害的識別。在此過程中,為進一步提高建筑物震害識別的速度和精度,首先將建筑物分布數據與無人機遙感圖像疊加,快速準確地鎖定圖像中的房屋建筑目標。然后,基于尺度不變特征轉換(SIFT)提取圖像特征,并通過視覺詞袋構建建筑物震害無人機遙感圖像特征向量標簽庫,將圖像的SIFT特征點集表達成統一維數的特征向量,作為SVM進行圖像分類的基礎。并以2021年9月16日發生的四川瀘縣6.0級地震為例,對方法的可行性加以驗證,結果表明:該方法可快速準確地從無人機遙感圖像中識別出建筑物震害情況。

1 建筑物震害無人機遙感圖像SIFT特征提取

1.1 建筑物圖像提取

在震后獲取的無人機遙感圖像中,部分地物與房屋建筑形狀、紋理等特征相似,極易在提取圖像特征對圖像進行分類,識別建筑物震害情況時造成干擾。而近年來,為提高地震等自然災害防治能力,實施了第一次全國自然災害綜合風險普查及地震易發區房屋設施加固等國家重點工程,從中匯集了各地最新、最全的建筑物分布數據。通過將這些數據與對應的無人機遙感影像疊加,可快速提取出圖像中的房屋建筑,準確鎖定目標。主要處理流程如圖1所示。

圖1 建筑物圖像提取流程圖

1.2 圖像SIFT特征提取

無人機遙感建筑物震害識別主要是利用圖像的紋理、邊緣、灰度等底層特征精確描述圖像內容,再根據提取出的不同結構類型在不同破壞等級下的圖像特征進行圖像分類[8]。但因光照條件、拍攝方法等因素的不同,使得底層特征往往難以精確描述圖像內容,導致圖像分類算法在進行分類時適應性不足,識別精度較低[9]??梢?,提高分類算法識別精度的關鍵在于對圖像特征的選擇,所選特征應盡量不受光照、拍攝角度、尺度變換的影響,具有較強的抗噪能力。在現有的圖像特征提取方法中,尺度不變特征變換(SIFT)作為一種圖像的局部性特征,對于光線、視角等改變及噪聲的容忍度高,能較好的滿足上述要求[10]。

因此,本文將SIFT方法應用于建筑物震害無人機遙感圖像的特征提取中,為實現算法的訓練,從歷史震例中收集了大量不同結構類型已判別標注了建筑物破壞等級的無人機遙感圖像,針對每張圖像,經預處理提取出圖像中的房屋建筑后,通過以下四個步驟實現對不同結構建筑物在不同破壞等級下圖像特征的精確描述:

(1)尺度空間極值檢測。為模擬圖像的多尺度特征,需在生成尺度空間后進行極值點檢測,而高斯卷積核是生成尺度空間的唯一線性核[11]。為此,針對建筑物震害無人機遙感圖像,定義尺度空間L(x,y,σ)是二維高斯濾波函數G(x,y,σ)和圖像I(x,y)的卷積[12]:

L(x,y,σ)=G(x,y,σ)×I(x,y);

(1)

(2)

式中:(x,y)是圖像的空間坐標,σ為尺度空間因子,決定圖像的平滑程度。為更準確地檢測極值點,定義高斯差分函數DOG算子為兩個相鄰尺度空間的差值[13]:

D(x,y,σ)=L(x,y,kσ)-L(x,y,σ)。

(3)

式中:k的取值由兩個相鄰尺度空間的倍數決定。若要在高斯差分金字塔的尺度空間中檢測極值點,則需先構建高斯金字塔。由式(3)可知,高斯差分金字塔由高斯金字塔組內每相鄰兩層的圖像相減獲得。在高斯差分金字塔的尺度空間中,每個檢測點都要與其各相鄰點逐一比較,從而得到D(x,y,σ)的局部極值點。若檢測點在與其相鄰的26個點中是極值點,則該點就可能是一個SIFT關鍵點,這些局部極值點將構成SIFT候選關鍵點的集合。

(2)關鍵點定位。通過尺度空間極值檢測將得到建筑物震害無人機遙感圖像的所有SIFT候選關鍵點,但要確定關鍵點,還需要進一步的處理。首先關鍵點與周圍的像素應有顯著差異;其次DOG算子較強的邊緣響應會導致不穩定邊緣響應點的存在。因此,根據候選關鍵點的位置和尺度,通過子像素插值及消除邊緣響應來剔除部分極值點,才能實現關鍵點的定位。將式(3)的高斯差分函數DOG泰勒展開得:

(4)

再根據HARRIS角點理論,處于邊緣的關鍵點具有較大的主曲率,而穩定的關鍵點則不會有這樣的變化,因而根據主曲率取值的大小即可判斷并消除邊緣響應[14]。

(5)

如式(5)所示,根據關鍵點位置的海森矩陣H可求出其主曲率γ,式中D由關鍵點在高斯差分金字塔尺度空間中X或Y方向連續求導兩次而得。通過實驗,當極值點主曲率γ取值為10,且滿足式(5)時,其穩定性將有效增強,進而消除邊緣響應。

經上述檢測后保留的極值點,即可確定為建筑物目標區域的穩定關鍵點。

在遙感影像中,一般將單體建筑物的震害劃分為“基本完好”“破壞”和“毀壞”三個等級。其中“基本完好”與中國《地震現場工作 第3 部分 調查規范:GB/T 18208.3-2011》[15]規定宏觀地面調查中建筑物震害等級的“基本完好” “輕微破壞”與“中等破壞”相對應;“破壞”與“嚴重破壞”相對應;“毀壞”與“毀壞”相對應。將無人機遙感圖像中不同破壞狀態的建筑物按破壞等級分類,以破壞的磚混結構房屋為例,在目標區域所提取的關鍵點如圖2所示。

通過這些關鍵點可以很好地描述不同破壞等級建筑物間的狀態差異,為構建建筑物震害無人機遙感圖像特征向量標簽庫提供穩定的“詞匯”信息。

(3)關鍵點方向分配。在定位關鍵點后,為使其具有局部結構的穩定方向,保持旋轉不變性,需根據其尺度及位置,結合在鄰域像素上梯度方向的分布特點,為每個關鍵點分配一個方向。任一關鍵點的梯度大小m(x,y)和方向θ(x,y)可表示為[16]:

m(x,y)=

(6)

(7)

根據式(6)計算梯度幅值,式(7)計算梯度幅角,再以關鍵點為中心,由此得到如圖3所示的關鍵點鄰域范圍和梯度直方圖:

圖3 關鍵點鄰域范圍和梯度直方圖

在圖3b所示的梯度直方圖中,關鍵點每隔45°變換一個次方向,共8個方向,橫軸為幅角,縱軸為累計的幅值,累計幅值最大的方向即可確定為關鍵點的主方向。

(4)SIFT描述符生成。由上述尺度空間極值點檢測并定位的關鍵點是只包含了圖像空間位置信息的實際像素點,在為其分配方向后,需將其進一步轉化為特征向量,即通過生成SIFT描述符,才能充分反映任意一張建筑物震害無人機遙感圖像在關鍵點處的像素梯度及方向信息,實現圖像的精確描述[17]。具體過程如圖4所示。

圖4 關鍵點SIFT描述符生成過程

在與關鍵點相鄰的8×8像素塊中,計算每個像素點的梯度大小及方向。再將該像素塊切分為16個2×2的子塊,對每個2×2子塊中的4個像素點梯度進行高斯加權,并投影至8個方向,把每個2×2的子塊描述成一個1×8維的特征向量,共16個子塊,由此,每個關鍵點都將由一個1×128 維的特征向量描述。

2 建筑物震害無人機遙感圖像特征向量標簽庫構建

由SIFT算法提取后的每張建筑物震害無人機遙感圖像都是大量關鍵點SIFT描述符的集合,每個關鍵點又是一個1×128 維的多維特征向量,僅能描述圖像的某部分特征,不便于計算機的自動識別和判斷。

隨著SIFT等穩定圖像特征提取算法的出現,視覺詞袋逐漸被引入遙感圖像分類等計算機自動識別和判斷中。其利用圖像中部分關鍵點的高度相似性,通過K-means聚類將所有SIFT特征點聚集為K個簇,K個聚類中心即為視覺單詞,作為特征向量標簽,得到由K個視覺單詞組成的特征向量標簽庫。以這些分類的視覺單詞作為標簽來描述建筑物震害無人機遙感圖像,不僅可突出不同結構類型在不同破壞等級下所包含關鍵點的差異,還有效降低了圖像特征向量的維度,可進一步提高計算機自動識別的效率[18]。

建筑物震害無人機遙感圖像特征向量標簽庫構建過程如圖5所示。

圖5 特征向量標簽庫構建過程

首先選取K個點作為初始聚類中心。在此通過自組織增量學習神經網絡(SOINN)對SIFT提取的圖像底層特征進行增量式學習,將初次聚類的結果作為K-means的初始聚類中心,避免直接使用K-means聚類時需反復試算和調整才能確定聚類中心的問題[19]。

每個特征點的特征向量X到第i個聚類中心的歐氏距離Di為:

(8)

式中:xj是向量X的第j維;kij是第i個聚類中心的第j維。

將特征點劃歸到距離其最近的聚類中心對應的簇中,在完成劃歸后,計算各個簇的新質心,作為新的聚類中心。若與原聚類中心間的距離小于預先設定的閾值,表明聚類完成,若大于預先設定的閾值,則重復上述迭代計算。

在聚類完成后,將得到由K個視覺單詞組成的特征向量標簽庫L=(l1,l2,…,lk),li為特征向量的標簽,描述性質相似的關鍵點組合成一類相似的特征。由此可見,根據建筑物震害無人機遙感圖像關鍵點特征向量聚類形成的視覺單詞,可理解為建筑物在不同破壞等級下的某種具體形態特征,以磚混結構房屋為例的部分視覺單詞示例如表1所示。

因此,每張建筑物震害無人機遙感圖像P均可由聚類形成的視覺單詞表示為P= (f1,f2,…,fk),其中fi是描述特定圖像時,視覺單詞li出現的次數。

3 建筑物震害無人機遙感圖像SVM分類器設計

支持向量機(SVM)在解決小樣本、高光譜遙感圖像中因高特征維度造成的線性不可分等問題時具有獨特的優勢[20]。其基本原理是求解一個能夠將訓練數據集正確劃分為兩類,且幾何間隔最大的分類超平面。

(9)

表1 視覺單詞示例

采用拉格朗日乘子法進行對偶優化,可求得其最優解ω*,b*。而對于非線性分類問題,SVM通過核函數進行非線性變換后,再構造分類決策函數f(x),根據分類決策函數值的大小來確定各樣本的屬性:

(10)

式中:SVs是支持向量的集合,代表與非零拉格朗日乘子對應的樣本,K(·)是核函數[23]。本文選取常用的線性核函數、RBF核函數、多項式核函數及Sigmoid核函數分別構造四種分類決策函數如下:

(11)

(12)

(13)

(14)

通過對模型進行訓練,采用分類準確率最高的核函數構造的分類決策函數,形成最終的SVM分類器,用于建筑物震害識別。

4 實例驗證與結果分析

4.1 實驗數據

2021年9月16日四川瀘縣6.0級地震發生后,經前期準備,應用大疆M300 RTK無人機搭載PSDK 102S五鏡頭傾斜攝影相機在震中瀘縣福集鎮大田社區及附近嘉明鎮團山堡村等受災嚴重的區域進行航拍。無人機主要技術參數及根據瀘縣地形情況和影像分辨率等要求設置的飛行參數如表2所示。

通過航拍采集的無人機影像和DSM數據如圖6所示。

圖6 無人機影像和DSM圖

4.2 實驗過程

對上述四川瀘縣6.0級地震中獲取的影像進行進一步的處理及分析,主要流程如圖7所示。

圖7 實驗流程圖

首先,將無人機遙感影像與建筑物分布矢量數據配準后疊加,得到三種破壞等級下的建筑物圖像共2 114張,隨機從每種破壞等級的圖像中選擇1 500張圖像作為訓練集,用于構建特征向量標簽庫,剩余的614張圖像作為測試集,驗證算法分類識別的準確度。

然后,提取圖像SIFT特征,利用K-means聚類將訓練集中1 500張圖像的SIFT特征點聚集為K個簇,經迭代計算,當K=150時,聚類達到預期效果,得到由150個視覺單詞構成的特征向量標簽庫,可將測試集中的圖像表示成一個K=150的多維特征向量。

最后,采用四種常用核函數構造的分類決策函數,對測試集中用多維特征向量表示的圖像進行分類識別,從中選取識別準確率最高的核函數構造的分類決策函數,形成最終的SVM分類器。

4.3 實驗結果及分析

通過實驗,不同核函數下SVM分類器對建筑物震害的總體識別準確率及訓練耗時如圖8所示。

圖8 不同核函數下SVM分類器的總體識別準確率及訓練耗時

表2 無人機主要參數

表3 不同核函數下SVM分類器對不同破壞等級的建筑物識別情況

由圖8可知,RBF核函數下的SVM分類器單張圖像識別時間最短,識別準確率也是四種核函數中最高的。統計不同核函數下SVM分類器對不同破壞等級的建筑物識別情況如表3所示。

可視化的分類結果如圖9所示。

圖9 不同核函數下SVM分類器分類結果

從圖9可見,線性核函數下的SVM分類器在三種破壞等級的建筑物震害識別中均易出現混淆,RBF核函數較其他核函數對分類中的混淆情況卻有明顯改善。這是因為三種破壞等級的建筑物震害圖像存在兩兩間部分特征相似的情況,關鍵點分布的趨近將導致線性不可分,而線性核函數主要用于線性可分的情形。RBF核函數則可將原樣本空間映射到無限維,在高維空間中,原本分布趨近的關鍵點得以分離,決策邊界更為多樣,由此可求解出更準確的分類超平面,從而有效提升識別準確率。因此,根據實驗結果,RBF核函數下的SVM分類器在建筑物震害無人機遙感圖像識別中較為適用。

為進一步分析造成識別錯誤的原因,將樣本中受災較重的大田社區及團山堡村部分無人機遙感圖像建筑物震害識別結果與實際情況對比,圖像識別結果有誤的情況示例如表4所示。

可見,當有外部干擾光線將建筑物破壞等級分類特征區域以外的部分打亮時,會使在圖像中提取的有效SIFT關鍵點發生改變,進而對識別建筑物震害情況造成較大干擾。

5 結論

本文提出一種基于特征提取的SVM圖像分類技術在無人機遙感建筑物震害識別中的方法,以四川瀘縣6.0級地震為例的實驗結果表明了該方法在建筑物震害無人機遙感圖像識別中的可行性。但從實驗過程來看,目前的方法只是基于SIFT特征進行分類,而SIFT特征的維數依舊較大,一定程度上影響了SVM對圖像分類識別的速度,因此,在后續研究中,可考慮將SIFT特征與SURF等維數較低的特征相結合,或對SIFT特征進行PCA降維處理,從而進一步提高圖像識別的速度,更好地滿足地震應急對災情實時性的需求。此外,從造成圖像識別錯誤的原因可見,應當考慮更穩健的特征點提取方案,以降低拍攝環境等外界因素對圖像識別的干擾,提高方法的適應性。

表4 圖像識別結果有誤情況示例

猜你喜歡
尺度空間特征向量關鍵點
二年制職教本科線性代數課程的幾何化教學設計——以特征值和特征向量為例
克羅內克積的特征向量
肉兔育肥抓好七個關鍵點
建筑設計中的防火技術關鍵點
基于AHP的大尺度空間域礦山地質環境評價研究
一類三階矩陣特征向量的特殊求法
居住區園林空間尺度研究
EXCEL表格計算判斷矩陣近似特征向量在AHP法檢驗上的應用
基于降采樣歸一化割的多尺度分層分割方法研究
機械能守恒定律應用的關鍵點
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合