?

MCJ-UNet:一種雙/多通道聯合InSAR相位解纏網絡

2024-01-21 13:15丁澤剛史一鵬陳浩龍陳之洲
雷達學報 2024年1期
關鍵詞:基線高程損失

丁澤剛 孫 濤 王 震* 趙 健 史一鵬 陳浩龍 陳之洲 王 巖 曾 濤

①(北京理工大學信息與電子學院雷達技術研究所 北京 100081)

②(衛星導航電子信息技術教育部重點實驗室(北京理工大學) 北京 100081)

③(北京理工大學重慶創新中心 重慶 401120)

1 引言

干涉合成孔徑雷達[1,2](Interferometric Synthetic Aperture Radar,InSAR)測量是一種強大的微波遙感技術,可通過兩(或多)幅存在空間基線的SAR圖像來獲取干涉相位,并基于相位信息解算目標高程,實現數字高程模型(Digital Elevation Model,DEM)的獲取。

相位解纏(Phase Unwrapping,PU)是InSAR處理的核心環節,解纏質量將直接影響DEM產品的精度。就單通道(單頻、單基線)相位解纏而言,其本質是一個病態問題。在單通道InSAR觀測構型下,僅可獲取目標場景的單一通道的干涉圖,相位解纏需基于相鄰像素的相位梯度積分進行。這一處理方式將嚴格受限于Itoh假設[3],該假設要求相鄰像素間的真實干涉相位差位于 (-π,π]區間,約束了相鄰像素間的高程差。當目標場景的高程變化劇烈時,將出現相位欠采樣問題,導致單通道相位解纏失敗[4]。

近年來,以多頻[5,6]、多基線[7]觀測構型為代表的多通道InSAR技術迅速發展[8],為上述問題的解決提供了有效途徑。不同于單通道相位解纏的相位梯度積分處理,多通道InSAR可借助干涉通道自由度的提升,利用不同通道間的高程模糊度差異直接獲取目標點的解纏相位,突破了Itoh假設的限制,有效提升了InSAR技術在測繪困難區域的適應性[9,10]。

目前,單通道相位解纏算法已較為成熟,主要包括路徑積分類、最小二乘類、網絡規劃類等。隨著多頻、多基線InSAR系統的快速發展,多通道相位解纏算法也已經過了大量系統的驗證,主要包括:基于干涉相位統計模型的最大似然估計(Maximum Likelihood Estimation,MLE)算法[11]、最大后驗(Maximum a Posteriori,MAP)估計算法[12]等;基于干涉相位算數性質的中國余數定理(Chinese Remainder Theorem,CRT)算法[13]、聚類(Cluster Analysis,CA)算法[14]等;以及由單通道相位解纏思路拓展而來的基于MLE的相位梯度積分算法[15]、基于鄰點集的相位梯度積分算法[16,17]、兩級規劃(Two-Stage Programming Approach,TSPA)算法[18]等。隨著上述算法的迭代更新,相位解纏技術正向著高時效、高精度和強適應的方向發展。

隨著高分辨、大幅寬InSAR系統的不斷推出,大規模干涉圖的高效解纏成為當前InSAR技術發展的瓶頸。因此,在處理效率方面具有突出優勢的深度學習技術成為當前相位解纏方法研究的熱點領域。目前的研究已經發展出部分可用于相位解纏的深度神經網絡,如基于枝切法的深度學習解纏方法[19]、PGNet[20]及DLPU[21]等。但上述所提到的基于深度學習的解纏方法均基于單通道解纏思路,在噪聲抑制及地形適應性方面仍有不足。在基于深度學習的多通道聯合相位解纏網絡方面,目前的研究較為有限,已有研究成果的典型代表為CANet[22]。該方法由CA算法拓展而來,通過深度卷積神經網絡(Deep Convolutional Neural Network,DCNN)完成像素簇聚類處理,為基于深度學習的多通道聯合相位解纏技術的可行性提供了例證。在該方法的處理中,并非將神經網絡直接用于獲取解纏相位或相位模糊數,而是用于完成聚類處理這一關鍵步驟。這一處理方式有效提升了聚類質量及效率,聚類結果則作為后續處理的輸入,以便結合較為成熟的相位梯度積分類算法獲取解纏相位。

作為多通道相位解纏與深度學習技術的另一種嘗試,本文的研究則聚焦于基于多通道干涉相位直接獲取相位模糊數,利用多通道相位間的相互約束進行解纏誤差抑制,并采用盡量簡單的后處理完成相位解纏。本文所提出的網絡為多通道聯合InSAR相位解纏網絡(Multi-Channel-Joint-UNet,MCJUNet),其構建的核心思路如下:首先,該網絡聚焦模糊數估計這一相位解纏中的核心環節,將相位解纏問題轉換為語義分割問題,并采用多輸出UNet網絡[23]完成對多通道模糊數的估計;其次,在網絡各解碼路徑的輸入和編碼路徑的輸出之間,引入擠壓激勵模塊(Squeeze-and-Excitation,SE)[24]動態調整特征信息權重,增強不同輸出通道對其所需信息的感知能力;最后,利用多通道相位關系和網絡輸出模糊數概率的特點,構建了多通道聯合約束下的相位殘差優化損失函數,以增強網絡對多通道相位特性的學習能力。此外,為避免語義分割結果在邊緣區域的細節誤差對解纏效果的影響,本文還提出一種基于多通道聯合約束的解纏誤差自修正方法,以保證解纏質量。

此外,需要說明的是,由于雙通道與多通道聯合相位解纏的機理及處理方法一致,本文針對MCJ-UNet的網絡構建原理解釋、網絡架構描述以及實驗驗證等均是在典型的雙通道(雙頻、雙基線)構型下進行的。針對雙通道向多通道相位解纏網絡的拓展,本文也在相應部分進行了說明。

2 InSAR相位解纏原理

2.1 單通道相位解纏原理及其局限性

通過存在空間基線的兩部SAR天線同時(或單部SAR天線重軌)觀測,可獲取同一場景的兩幅SAR圖像,并在此基礎上提取干涉相位。InSAR處理的核心即為對干涉相位的處理,其本質是通過干涉相位重構精確的觀測幾何,并通過幾何信息解算高程。其中,相位解纏是InSAR處理的關鍵環節,解纏相位與目標高程間的關系如式(1)所示:

其中,h為觀測目標高程,φ為解纏相位,Hamb為高程模糊度,該參數代表相位每變化 2π所對應的高程變化量,也是衡量InSAR系統的測高靈敏度的重要參考。在不考慮基線、波長等變化引入的空間去相干的前提下,高程模糊度越小,InSAR系統對目標高程變化的感知越敏銳,對應的干涉條紋也將越密集。高程模糊度的計算如式(2)所示:

其中,λ=c/f,λ為雷達系統波長,c為光速,r為斜距,θ為入射角,P代表不同的工作模式,單發雙收(雙天線)模式下P=1,自發自收(重軌)模式下P=2,B為垂直基線。結合式(1)及式(2)可知,基于系統參數及觀測幾何信息,通過解纏相位φ即可獲取目標高程h。

由式(2)可知,高程模糊度與頻率、基線都呈反比,InSAR系統的工作頻率越高,或基線越長,對應的高程模糊度越小,越容易獲取高精度的高程信息。然而,較高的頻率或者較長的基線均會導致空間相干性的降低,加劇相位噪聲,導致高程測量誤差。所以,傳統單通道InSAR常存在高程模糊度與空間相干性間的矛盾。

面向目標高程的有效提取,相位解纏成為In-SAR處理的核心環節。其中,纏繞相位φ與解纏相位φ之間存在如式(3)的關系:

其中,纏繞相位φ在 (-π,π]區間內,k為整數(即為模糊數)。相位解纏的目的即為通過纏繞相位φ求取與高程呈比例關系的解纏相位φ。然而,式(3)中存在k和φ兩個未知量,其解并不唯一,故其本質是一個不適定問題(病態問題)。

為實現單通道相位解纏,需采用鄰域聯合處理,并通過Itoh假設對該問題加以約束,即要求相位滿足連續性,相鄰像素間的真實相位差需位于(-π,π]區間。在該約束下,相位解纏可通過相鄰像素點間的相位梯度積分實現。

然而,在實際地形中,劇烈高程起伏將導致干涉相位無法滿足Itoh假設,使得單通道解纏失效。如圖1所示,A,B,C為相鄰的3個分辨單元,ΔφBA及 ΔφCB分別為B與A、C與B間的真實相位差,ΔφBA及 ΔφCB分別為B與A、C與B間的纏繞相位差,且 ΔφBA=ΔφBA,ΔφCB=ΔφCB。若已獲取A點的解纏相位,則基于 ΔφBA(相位差),通過路徑積分方式即可獲取B點的解纏相位。但是B,C兩點之間的高程存在劇烈的起伏,導致相位欠采樣,使得 ΔφCB超過 π。此時通過纏繞相位估計所得的相位梯度 ΔφCB將存在模糊,無法基于路徑積分方式獲取C點的解纏相位,導致解纏誤差積累,并最終引入高程反演誤差。因此,傳統單通道InSAR相位解纏方法難以適應高程起伏劇烈區域的處理。

圖1 相位解纏示意Fig.1 Schematic diagram of phase unwrapping

2.2 多通道相位解纏原理

為解決單通道相位解纏技術在地形劇烈起伏區域的適應性不足的問題,多通道InSAR系統及多通道相位解纏技術應運而生。其中,多通道InSAR有兩類主要的實現方式:多頻InSAR及多基線InSAR。就系統構建而言,多頻InSAR系統需要在單一搭載平臺上同時部署兩(或多)部頻率差較大的SAR載荷(如中國測繪科學研究院的CASMSAR[25]、中國科學院空天信息創新研究院的MSJosSAR[26]等),且各部載荷需同時工作,使得系統的硬件成本較高,實現也較為困難;而多基線InSAR系統則需在單一搭載平臺部署多部SAR天線(如中國科學院空天信息創新研究院的Array InSAR[27]系統、MV3DSAR[28]系統等),硬件成本將有所降低。此外,多基線InSAR也可通過單部SAR天線的多次重軌觀測實現,可通過時間代價進一步壓縮硬件成本,成為目前主流的多通道InSAR觀測模式。

無論采用多頻還是多基線InSAR觀測模式,其進行相位解纏處理的本質不變,均是通過頻率或基線的改變獲取目標區域在不同高程模糊度下的干涉圖,借助干涉通道自由度的提升規避相位解纏中的路徑積分問題,從而突破Itoh假設的限制,實現穩健的相位解纏。此處以雙通道InSAR為例,通過已獲取的不同高程模糊度對應的干涉相位,可以給出如式(4)的約束關系:

其中,Hamb1及Hamb2分別為通道1和通道2的高程模糊度,φ1及φ2分別為對應的解纏相位。將式(3)代入式(4)可得

其中,k1及k2分別為通道1和通道2的模糊數。在同一目標點的高程固定不變的前提下,模糊數及其對應的高程解算可視為解“同余方程”的問題,通過CRT算法即可求解[13]。此外,基于干涉相位的概率統計特性同樣可推導多通道相位間的約束關系,并由此推出了MLE算法(此處不再贅述)。為了實現相位解纏中的噪聲抑制,引入鄰域聯合處理或先驗統計模型的改進算法也被相繼推出,如閉合形式的CRT算法[29]、基于線性約束的MLE算法[11]、MAP算法等[12]。

然而,上述處理算法或涉及逐像素估計、逐窗口估計、逐窗口超參數迭代等處理,運算量較大,難以滿足大規模干涉圖的高效解纏需求。因此,本文考慮使用深度學習結合的方法,在保證精度的同時實現高效的解纏。

3 多通道聯合InSAR相位解纏網絡:MCJUNet

3.1 網絡構建原理

在相位解纏中,用于解纏處理的干涉圖呈條紋狀形式,干涉條紋(去除平地相位后)的密集程度由地形起伏形式及高程模糊度共同決定。地形起伏越劇烈,高程模糊度越小,對應的干涉條紋越密集,相位解纏也越困難。當干涉條紋過于密集,直至發生相位欠采樣時,單通道相位解纏隨之失效。

在多通道InSAR處理中,相位解纏可轉化為適定問題,其核心是在各通道的相互約束下獲取纏繞相位對應的模糊數k,并在此基礎上解算解纏相位,從而依據式(1)反演高程。

針對多通道干涉圖,其模糊數具有聚類特性,并主要表現為以下特點:每個干涉條紋對應一個模糊周期,該條紋內的所有像素具有相同的模糊數。圖2即示意了雙通道干涉圖及其模糊數的對比。其中,圖2(a)對應較大的高程模糊度,圖2(b)對應較小的高程模糊度,圖2(c)、圖2(d)分別對應圖2(a)、圖2(b)的模糊數。由對比可見,不同高程模糊度的干涉圖均呈現聚類現象,但聚類形式存在差異。具有較小高程模糊度(對應高頻點或短基線)干涉圖的干涉條紋更為密集,解纏相位及對應的模糊數跨度更大,使得模糊數聚類結果中的類別更多。

圖2 模糊數聚類示意Fig.2 Schematic diagram of the ambiguity number clustering

根據同一干涉條紋中所有像素都對應相同模糊數的特點,可以將模糊數k的求取轉化為語義分割問題[30],即:對應相同模糊數的像素點可歸入到同一個像素簇中,將此模糊數的值賦為這個像素簇的語義,根據語義的不同對像素進行分類。在這個過程中,可以采用深度學習方法,將圖2(c)、圖2(d)作為標簽用以訓練神經網絡,即可利用神經網絡完成對干涉圖模糊數的語義分割,實現每個像素的模糊數估計,從而獲取解纏相位。

3.2 網絡總體架構

基于3.1節的分析,相位解纏可轉化為語義分割處理。在可用于語義分割的深度神經網絡中,UNet網絡具有突出的輕量化和高性能優勢,可廣泛應用于各種場景[31]。所以,本文利用UNet神經網絡完成模糊數估計,實現相位解纏。針對UNet神經網絡而言,其網絡結構呈現為“U”形,可將淺層特征和深層特征緊密融合在一起。其中淺層特征主要用于捕捉圖像的邊緣輪廓等細節信息,有助于網絡學習纏繞相位跳變區域的特征。而深層特征則更專注于表達圖像的語義信息,可助力網絡學習相位與其鄰域像素相位的關系。通過充分融合鄰域像素的信息,UNet網絡能夠準確高效地進行模糊數的估計,從而為大規模干涉相位解纏提供有力支撐。

在多通道相位解纏中,為了獲得不同通道纏繞相位所對應的模糊數,此處采用了多輸出UNet神經網絡,并將所提出的網絡命名為MCJ-UNet,用以實現多通道干涉相位的聯合處理,并通過改進網絡結構及損失函數來保證解纏效果。圖3即為雙通道解纏網絡的結構示意。其中,纏繞相位φn1,φn2以及對應的高程模糊度比例(尺度縮放因子)是網絡的輸入,經過編碼路徑和兩個解碼路徑的處理,可完成對兩幅干涉圖的模糊數估計。

圖3 MCJ-UNet網絡結構圖Fig.3 The structure of MCJ-UNet network

為了描述清晰,此處將網絡的輸入順序規定為通道1干涉相位、通道2干涉相位以及尺度縮放因子。通道1的高程模糊度較大(對應短基線或低頻點),而通道2的高程模糊度較小(對應長基線或高頻點),即:Hamb1>Hamb2。尺度縮放因子(高程模糊度比例)的計算如式(6),并有α ∈(0,1)。

根據高程模糊度的定義,可以分別得到在多頻和多基線觀測構型下的尺度縮放因子,如式(7)和式(8)所示:

所構建的MCJ-UNet網絡的整體結構如圖3所示,該網絡采用了兩條相同的解碼路徑,并共享一條編碼路徑的輸出。編碼路徑主要負責對多通道干涉相位的特征進行提取,由5個子模塊組成,由淺入深的逐層提取干涉圖的特征信息,每個子模塊包括兩次卷積和一次池化過程。兩條相同構造的解碼路徑也包括5個子模塊,分別為上采樣反卷積,全尺度跳躍連接以及兩次卷積。

考慮到每條解碼路徑需要輸出不同的模糊數信息,因此需要的特征信息也各有側重,有鑒于此,在編碼路徑提取的特征信息和兩條解碼路徑間加入了SE通道注意力模塊,旨在增強網絡對不同特征通道的感知能力,SE模塊的構建原理如圖4所示。其核心功能是對每個特征通道進行自適應權重調整,通過學習每個特征通道的重要性來增強可用信息并減弱無關信息。在MCJ-UNet中,編碼路徑提取到的特征信息同時包含通道1和通道2的干涉相位,而對于各通道的解碼路徑,SE模塊的加入減弱了其他通道的干涉條紋輪廓等信息的權重,使得解碼路徑可以更加專注于對本通道的模糊數估計所需信息的提取,從而提高模型整體的表現能力。同時,相較于簡單的增加網絡的深度或寬度,SE不需要大幅增加網絡的參數量,可以用較小的計算代價實現更好的性能。

圖4 SE模塊Fig.4 SE module

3.3 基于多通道聯合約束的相位殘差損失函數

為了在相位解纏中充分利用不同通道間的干涉相位特性差異,提升信息獲取維度,MCJ-UNet對訓練過程中的損失函數進行了優化,在損失函數構建中引入了基于多通道聯合約束的相位殘差項。

圖5示意了網絡訓練過程。將UNet網絡用于語義分割任務時,網絡輸出的特征通道數等于像素分類的類別數。因此,在相位解纏處理中,需要考慮纏繞相位對應的模糊數(類別數)范圍,這將決定網絡輸出通道的數量。對于MCJ-UNet而言,每個解碼路徑的輸出特征通道數與數據集中的模糊數范圍相關聯。具體來說,假如數據集中所有纏繞相位對應的模糊數滿足k1∈(m1,m2),k2∈(n1,n2),則網絡兩條解碼途徑對應的輸出特征通道數應分別設置為M=m2-m1+1,N=n2-n1+1,以確保網絡能夠為每個可能的模糊數提供適當的預測,從而保證模型能夠有效地學習和解釋不同模糊數對應的纏繞相位信息。

圖5 網絡訓練流程圖Fig.5 Flowchart of network training

損失函數對于網絡的優化至關重要。在訓練MCJ-UNet的過程中,計算損失函數所用的標簽包括:多通道相位對應的模糊數k1,k2以及真實纏繞相位φ1,φ2。所用損失函數包括3個部分:LossCE1,LossCE2以 及 LossF(x)。其 中,LossCE1和 LossCE2表示網絡兩條解碼路徑的輸出與真實模糊數標簽之間構成的交叉熵損失[32],它可以度量模型輸出的模糊數概率分布和真實模糊數標簽之間的差異。交叉熵損失如式(9)所示:

其中,M為模糊數類別的總數,pi為網絡預測輸出,表示第i個特征通道對應的模糊數為真實模糊數的概率,yi為符號函數,當像素對應的真實模糊數為第r個類別的模糊數時,有

多通道相位殘差優化損失 LossF(x)是根據多通道相位之間的相互約束關系所建立的損失函數,旨在使網絡在估計模糊數的過程中結合多通道的相位關系,進行更加準確的模糊數預測。其具體的構成如式(11)所示:

其中,M1和M2為兩條解碼路徑的輸出特征通道數,對應于數據集中雙通道模糊數的類別數目。pi和pj分別為兩條解碼路徑對每個模糊數的預測概率,k1i為第1條解碼路徑的第i個特征通道對應的模糊數標簽值,k2j為第2條解碼路徑的第j個特征通道對應的模糊數標簽值,φ1,φ2為真實纏繞相位。相位殘差F(x)的表達式為

式(11)結合了多通道相位間的相互約束關系與語義分割網絡輸出不同類別的概率這一特點。在優化網絡模型的過程中,該損失函數會首先遍歷兩個輸出特征通道對應的模糊數組合,當遍歷到的模糊數組合為真實模糊數時,相位殘差F(x)的值會置為0,其他情況下,將相位殘差F(x)置為1。因此,為了最小化損失,當遍歷到的模糊數組合 (k1,k2)不是(或不全是)真實模糊數時,需要降低相位殘差前的概率乘積pi×pj的值,當遍歷到模糊數組合為真實模糊數時,需相應提高相位殘差前的概率乘積pi×pj。隨著相位殘差損失 LossF(x)的不斷下降,網絡會自適應學習多通道相位間的關系,提高真實模糊數的輸出概率。

根據3個部分的損失函數,總體損失函數可以表示為

式(13)中的γ和η為超參數,可以通過調整該值來控制每部分損失函數在總體損失函數中所占的比重。由于 LossCE1和 LossCE2對應不同的分類數,且LossF(x)與前兩者的計算方法也不同,因此對于同一網絡輸出的損失函數計算中,每部分損失函數的尺度也不同。因此,需要通過超參數的設置將每部分損失函數的值調整至同一尺度,以均衡各部分損失函數對網絡優化的貢獻,避免某個損失函數主導整個訓練過程。此處給出一種通過預訓練來確定超參數的方法,其目的在于通過預訓練的方式,觀察在模型能夠基本完成模糊數預測的情況下各部分損失函數比值。首先僅使用交叉熵損失LossCE1與LossCE2的和作為總體損失函數進行預訓練,即預訓練過程中損失函數的大小為LossCE1+LossCE2,當網絡基本收斂時,計算此時一個訓練輪次中三部分損失均值的比值,根據比值確定超參數,使得三部分損失函數可以調整至同一水平。

3.4 基于多通道聯合約束的解纏誤差自修正

由于MCJ-UNet可同時輸出不同通道對應的模糊數,基于單通道模糊數及對應的纏繞相位即可實現相位解纏。在不考慮相干性損失的前提下,高程模糊度越小,理論高程精度越高。因此,在基于所提出的網絡完成模糊數的估計后,可選擇高程模糊度較小的干涉通道(此處以通道2為例)進行模糊數補償,從而獲取解纏相位

MCJ-UNet的本質為語義分割網絡,分割結果中的不同像素簇的語義即為模糊數,分割邊緣為相位跳變位置。但是受相位噪聲的影響,語義分割邊緣難以保證完全精確,該類邊緣將出現部分像素的語義估計錯誤,從而導致相位解纏錯誤。相位跳變現象主要有兩種情況:平緩地形下相位 +π和-π間的跳變和陡峭地形引起的相位欠采樣。針對平緩地形區域,相鄰像素間的微小高程變化也可能會導致對應的纏繞相位在 +π和 -π間跳變。此時,該相鄰像素將對應不同的模糊數(即該像素間將存在語義分割的邊緣),邊緣語義分割誤差將導致解纏誤差。但是,語義分割的邊緣由模糊數的分布形式決定,該分布形式由高程模糊度及地形共同決定。由于不同通道間的高程模糊度不同,對應的語義分割邊緣將存在差異,即:在某通道存在邊緣誤差的區域,其他通道極有可能不存在該問題(如圖2(c)及圖2(d)所示),因此可以考慮利用這一特性和不同通道間的相位關系對此類誤差進行修正。而針對陡峭地形引起的相位跳變現象,可通過多通道相位間是否有差異來判斷該跳變是否由地形引入,針對均發生跳變的情況不進行誤差自修正的處理,以保證陡峭地形的邊緣細節。

針對上述問題,本節提出一種基于多通道聯合約束的解纏誤差自修正方法。該方法的核心思路為:以參考通道的解纏結果為基準,利用不同通道間的相位關系檢測存在解纏誤差的像素,并基于不同通道語義分割結果邊緣位置的差異,結合其余通道的解纏結果完成修正。由于實際地形中極少出現孤立像素形式的陡峭地形,某像素的解纏相位(或高程)將與鄰域若干像素相接近。所以,此處判斷是否采信某一通道解纏結果的標準即為解纏相位的鄰域梯度,該梯度越小,則表明該像素與鄰域像素越相似,其解纏相位的可靠性越高。

該方法的具體操作步驟如下:

步驟1 標記點提?。菏紫雀鶕?4),基于通道1獲取的解纏相位以及尺度縮放因子α,可獲得對應的通道2的參考解纏相位:

針對該相位差,其理論值應為0(無論是否為陡峭地形),即表示同一目標的不同通道的解纏結果一致。但實際處理中將受到相位噪聲的影響,若該數值較小,則可視為相位濾波等處理過程對某一通道的干涉相位造成細微損失,從而導致雙通道解纏結果的微小差異;若該數值較大,則表示某一通道的解纏結果存在誤差,需進行誤差修正。

此處以閾值φd為參考,標記干涉圖中所有|Δφ|>φd的位置,即可獲取所有可能解纏出錯的位置,并記為標記點。

步驟2 梯度計算:完成誤差標記后,需通過鄰域聯合處理來判斷所采信的通道。此處需計算不同通道的解纏相位中,各個標記點與周圍像素點均值之間的梯度,并記作δ1和δ2。

步驟3 誤差修正:首先設置替換閾值δd,若同時滿足 |δ1|<δd,|δ2|<δd,則比較δ1和δ2的 大小,并將 |δ1|<|δ2|位置上的相位值替換為通道1獲取的通道2參考解纏相位φ2cal。當δ1和δ2同時大于替換閾值δd時,視為兩個相位梯度都由(陡峭)地形引入,不做替換。

通過上述處理,即可完成基于多通道聯合約束的解纏誤差自修正。上述描述以雙通道為例,當相位解纏擴展到更多通道時,可以選擇標記點對應的梯度最小的通道的解纏相位值進行替換,以獲取更為準確的解纏相位。

3.5 MCJ-UNet的通道拓展

上述分析均基于雙通道相位解纏,此處對MCJUNet解纏推廣至多通道進行分析,并假設通道數量為n。

首先,需要對網絡模型進行調整,將網絡輸出通道數與解纏通道數對應,即網絡由1條解碼路徑與n條編碼路徑構成,每條編碼路徑負責1個通道的模糊數輸出。

其次,需要調整損失函數,多通道解纏網絡的總體損失函數由n+1項組成,前n項為n個輸出通道的輸出與真實模糊數計算所得的交叉熵損失,第n+1項為各通道與參考通道的相位殘差損失函數之和。對于各部分損失函數對應超參數的確定,可首先由各通道交叉熵損失函數之和對網絡進行預訓練,當網絡基本達到收斂時,計算一個訓練輪次中各部分損失均值的比值,根據該比值即可確定每一部分損失函數對應的超參數的值。

最后,需要對多通道聯合約束的解纏誤差自修正方法進行調整,即基于參考通道與其他所有通道的解纏相位分別完成標記點提取及梯度計算,并以梯度最小的通道為參考完成誤差修正,獲取多通道聯合解纏相位。

將MCJ-UNet中的雙通道相位解纏推廣至多通道時,網絡模型將增大,對應的損失函數計算量也將增加,使得網絡訓練需要耗費更長的時間。但是更多的通道數會為網絡提供更多的特征信息進行學習,且多通道的解纏信息也有助于多通道聯合約束下的解纏誤差自修正處理,以保證相位解纏的精度。

4 數據集構建

為了對所提出的MCJ-UNet網絡進行訓練,此處盡可能模擬不同類型的復雜地形[33],并構建了對應的多通道干涉圖及標簽數據。圖6-圖8示意了數據集的構造過程,具體步驟如下:

圖6 仿真地形構造示意Fig.6 Schematic diagram of simulated terrain construction

(a) 構建初始隨機地形:首先創建一個尺寸為L×L的初始矩陣,并對每個位置隨機賦高度值,其中L ∈[3,25],如圖6(a)所示。隨后,將初始矩陣插值擴展到 512×512,完成初始地形的構造,如圖6(b)所示。其中初始矩陣的邊長L的大小可以控制地形的復雜程度,L越大則構造的地形越復雜。

(b) 增添地形紋理:為了盡可能模擬真實地形,可在步驟(a)生成的光滑仿真地形上增添不規則的紋理。紋理的構造方式和地形構造類似,區別在于將初始矩陣的邊長L增大至 256×384的尺寸,但所賦高度值將降低,生成紋理后可將其增添到所構造的地形上。

(c) 生成多通道干涉圖:首先設置大小隨機的兩個高程模糊度Hamb1>Hamb2,并計算尺度縮放因子α?;陔S機生成的高程模糊度及所構建的地形高程,可獲取絕對相位,將絕對相位纏繞至(-π,π],即得到多通道干涉圖,如圖7(b)及圖7(e)(其局部放大圖如圖7(c)及圖7(f))所示,細節紋理的添加可使得訓練數據更接近實際地形下所獲取的干涉圖。

圖7 增添紋理前后纏繞相位對比Fig.7 Comparison of wrapped phase before and after adding texture

(d) 完成數據集構造:為盡可能模擬實際情況下所獲取的干涉相位,對獲取的纏繞相位增加隨機強度的高斯復噪聲,添加的相位噪聲信噪比均勻分布在-1~10 dB,添加噪聲后的干涉圖如圖8(a)及圖8(b)所示,該圖即可作為網絡輸入,每幅干涉圖對應的模糊數作為網絡標簽,如圖8(c)及圖8(d)所示。

圖8 多通道纏繞相位及標簽Fig.8 Multi-channel wrapped phase and label

為突出網絡多通道相位解纏的優勢,在數據集的構建過程中還增加了一些陡峭地形,以形成相位欠采樣數據:在步驟(a)中,可選擇初始矩陣的一部分數據進行插值擴展,另一部分不做插值只做擴展,后續步驟則不變。未做插值的部分將生成陡峭地形,供MCJ-UNet學習相位欠采樣情況下的多通道相位特性。

5 實驗與分析

為驗證所提出的MCJ-UNet網絡的有效性,此處分別開展了模擬地形仿真驗證、真實地形仿真驗證以及實測數據驗證。其中,模擬地形同時包含平緩及陡峭地形,以驗證所提MCJ-UNet在自然及人工場景下的解纏效果;真實地形仿真實驗采用了多頻(多基線)相位解纏實驗中常用的陡峭山地數據:Isolation峰地形數據,以驗證所提MCJ-UNet在真實陡峭地形下的解纏效果;實測數據驗證選用了TerraSAR-X重軌多基線干涉數據,該數據的尺寸較大,以驗證所提出的MCJ-UNet的相位解纏效率。

5.1 網絡設置

所提出的MCJ-UNet基于Pytorch 1.13.0及Python 3.9搭建,在NVIDIA Tesla A100 GPU上實現,GPU數量為2。網絡共包含2個干涉通道,干涉通道1的輸出特征通道數目設置為15,干涉通道2的輸出特征通道數目設置為25。訓練數據集采用第4節所述方法生成,共包含9000組訓練數據及1000組測試數據。訓練過程中,使用Adam優化算法[34]進行損失函數最小化,采用余弦退火學習策略[35],學習率最大值為10-4,最小值為10-6,batch size設置為8,訓練輪次為50次。網絡預訓練用時9587.39 s,根據預訓練結果將超參數設置為γ=0.8,η=0.1,網絡訓練耗時15236.20 s。

5.2 模擬地形仿真驗證

模擬地形仿真實驗采用雙頻InSAR構型,主要仿真參數如表1所示,兩個干涉通道的頻點分別為5.25 GHz及11.50 GHz,對應的尺度縮放因子為0.46。仿真所采用的DEM如圖9(a)所示,并在此基礎上增添了紋理細節,以逼近真實地形。模擬地形中同時包含平緩(左側)及陡峭(右側)區域,陡峭區域的邊緣已出現相位欠采樣問題。

表1 模擬地形仿真參數Tab.1 Simulation parameters of simulated terrain

圖9 仿真DEM及信噪比分布情況Fig.9 Simulated DEM and SNR distribution

根據仿真DEM所生成的頻點1、頻點2的參考解纏相位如圖10(a)、圖10(b)所示,生成的含噪聲干涉圖如圖11(a)、圖11(b)所示,其中所添加的信噪比隨相位空間分布的不同而變化,平緩(左側)區域上半部分添加噪聲信噪比為2 dB,下半部分添加噪聲信噪比為4 dB,陡峭(右側)區域添加噪聲信噪比(Signal-to-Noise Ratio,SNR)為5 dB,如圖9(b)所示。

圖10 雙頻點參考相位

圖11 雙頻點(含噪聲)干涉圖Fig.11 The interferograms of dual-frequency channels

首先,將濾波前的雙頻點干涉圖及對應的尺度縮放因子輸入訓練完成的MCJ-UNet,所獲得模糊數估計結果如圖12(a)、圖12(b)所示。之后,利用模糊數估計結果及濾波后干涉圖可獲取雙通道相位解纏結果,如圖12(c)、圖12(d)所示。最后,基于多通道聯合約束的解纏誤差自修正方法,即可獲取MCJ-UNet最終解纏結果。其余實驗的MCJ-UNet結果均根據上述步驟獲取,將不再贅述。其中,網絡的輸入采用的是濾波前的干涉圖,這是由于在網絡訓練階段已輸入不同水平噪聲的干涉圖作為訓練數據,神經網絡已經學習噪聲特征,使用濾波前的含噪聲干涉圖不會影響網絡的預測結果,反而可以盡量避免濾波處理對細節特征的損失,以保證網絡的輸出提供更細致的地形信息,便于解纏處理。

圖12 基于MCJ-UNet所獲取的模糊數估計結果Fig.12 Ambiguity number estimation results obtained based on MCJ-UNet

為了對比驗證所提出的MCJ-UNet的相位解纏效率及噪聲抑制效果,分別采用4種不同方法進行了處理,包括:傳統MLE算法、TSPA算法、CANet算法以及所提MCJ-UNet算法。在所涉及的針對干涉圖濾波的處理中,4種處理方法均采用Goldstein濾波算法[36],并在隨后的實驗中保持一致。為維持噪聲水平的一致性,同一組實驗選用相同大小的濾波參數。

4種方法的解纏結果如圖13所示,其中圖13(b)、圖13(d)、圖13(f)、圖13(h)分別為圖13(a)、圖13(c)、圖13(e)、圖13(g)相對于高頻點參考解纏相位(圖10(b))的解纏誤差。為了進行定量比較,表2列出了各解纏結果的主要評估指標:解纏相位均方根誤差(Root Mean Squared Error,RMSE)以及運行時間。其中,RMSE評估中的參考數據為仿真DEM對應的參考解纏相位,運行時間分為網絡運行時間及后處理所用時間,由于MLE和TSPA方法不涉及網絡處理,其后處理時間即為處理總時間(下述實驗相同)。

表2 各方法所獲取的仿真地形解纏相位評估結果Tab.2 Evaluation results of the unwrapped phase of simulated terrain obtained by different methods

圖13 仿真數據各方法解纏結果對比Fig.13 Comparison of results for different methods on simulated data

由圖13(b)可見,MLE算法由于噪聲抑制能力有限,解纏結果中存在明顯的相位跳變,出現了大量解纏誤差,且由于添加噪聲隨空間分布不同,解纏結果左側上半部分出現誤差的像素點明顯多于下半部分?;赥SPA獲取的解纏結果在圖中右下角正方形中出現了整體區域的解纏錯誤,這是由于TSPA方法在第一階段需要計算相鄰像素相位的梯度,而由于濾波原因導致此區域邊緣原有梯度信息遭到破壞,錯誤的梯度信息將正方形區域“包圍”。路徑積分處理會導致誤差的積累,從而使得TSPA在該區域的解纏出現誤差?;贑ANet和MCJ-UNet的方法均有效完成了干涉圖解纏,不同空間分布的噪聲并未造成解纏失效問題。且解纏誤差主要位于仿真地形的邊緣區域(如平緩與陡峭地形交界處),該誤差主要由濾波處理導致的細節損失引入。

表2所示4種方法的RMSE也與上述分析相符,TSPA由于部分區域的解纏失敗,因此解纏誤差較大,CANet和MCJ-UNet解纏精度相近,驗證了兩種方法在不同強度和不同空間分布的噪聲下的有效性。CANet的網絡處理時間及解纏精度略優于MCJUNet,而得益于更簡單的后處理步驟,MCJ-UNet的總體運行時間要優于CANet,在保證解纏精度的同時也具有高效性。

5.3 真實地形仿真實驗

真實地形仿真實驗采用美國Colorado州Isolation山峰區域的真實高程進行,其地形變化形式較為復雜,是多頻、多基線相位解纏算法驗證中較為經典的實驗數據[18,22],可以有效驗證所提方法在自然陡峭地形下的解纏效果。仿真參數如表3所示,真實地形參考高程如圖14(a)所示,圖14(b)、圖14(c)為根據仿真參數生成的含噪聲雙頻干涉圖,圖14(d)、圖14(e)為對應的濾波結果。圖15(a)為頻點2對應的參考解纏相位,圖15(b)、圖15(c)、圖15(d)、圖15(e)分別對應MLE,TSPA,CANet及MCJ-UNet這4種方法的解纏結果,圖15(f)、圖15(g)、圖15(h)、圖15(i)展示了4種方法解纏結果相對于參考相位的解纏誤差。表4列出了各方法解纏精度和處理時間的評估結果,以進行定量比較。

表3 真實地形仿真參數Tab.3 Simulation parameters of real terrain

表4 各方法所獲取真實地形仿真相位解纏評估結果Tab.4 Evaluation results of real terrain simulation phase unwrapping obtained by different methods

圖14 地形參考高程及多頻干涉圖Fig.14 Reference terrain height and multi-frequency interferograms

圖15 參考相位及各方法解纏結果對比Fig.15 Reference phase and comparison of unwrapped phase obtained by different methods

由圖15以及表4對比可知,基于逐像素處理的MLE方法噪聲魯棒性較差,解纏精度較低?;赥SPA方法和CANet方法獲取的解纏結果在圖中上部的陡峭區域均出現錯誤。針對本文所提出的MCJUNet方法,其單通道(通道1及通道2)的解纏精度均低于CANet方法,這是由于單通道解纏結果未進行誤差自修正處理,模糊數跳變區域的部分邊緣像素的分類誤差導致解纏錯誤。此外,精度評估采用通道2的參考解纏相位,由于通道1的高程模糊度較大,相比于通道2,其解纏相位經尺度縮放后對應的解纏誤差也越明顯,故解纏精度略低。雖然MCJUNet的單通道解纏結果精度低于CANet方法,但是在進行多通道聯合解纏誤差自修正后,其解纏精度明顯提升,已略優于CANet的解纏精度。

對上述處理結果進行詳細分析可知,在陡峭地形區域的左側,頻點1的含噪聲干涉圖中可見相位跳變現象(如圖14(b)白框及其局部放大所示)。由于MCJ-UNet采用濾波前的干涉圖作為網絡輸入,并且引入跳躍連接的U-Net神經網絡對此類輪廓信息較為敏感,因此在該區域內部獲得了正確的模糊數估計結果,僅在邊緣跳變區域出現了解纏誤差。TSPA和CANet方法均采用濾波后干涉圖作為輸入,并涉及梯度積分處理,存在誤差積累及細節損失。MCJ-UNet在陡峭邊緣區域的誤差是由于頻點1和頻點2的模糊數在該邊緣同時發生跳變,當邊緣位置的某些像素處的雙通道解纏相位均存在誤差時,所提出的解纏誤差自修正方法難以判別準確的解纏相位,部分像素的解纏誤差無法被有效修正。

對于真實地形下的仿真實驗,表4的評估結果顯示,MCJ-UNet的解纏精度優于其他3種方法,且處理時間較低。MCJ-UNet方法在真實地形仿真實驗與模擬地形仿真實驗的運行時間并未與像素點的數量呈正比,這是由于網絡運行時間包含了模型加載時間,當干涉圖尺寸較小時,模型加載時間在網絡運行時間的占比較高,干涉圖尺寸的影響不明顯。當MCJ-UNet用于更大規模干涉圖的相位解纏時,模型加載時間所占網絡運行時間比重將降低,處理時間將有所增加,但其解纏高效性的優勢將進一步突出。

5.4 實測數據驗證

實測數據驗證采用TerraSAR-X重軌多基線數據,觀測區域為中國山西太原東北部的系舟山山區。該區域屬于太行山脈中段分支,地形起伏明顯,可以充分驗證所提方法在實際處理中的應用效果。數據尺寸為4096×4096,覆蓋面積達到7 km×8 km,可有效評估所提方法在大尺寸干涉圖上的解纏效率。該數據主要參數如表5所示,圖16(a)為目標區域SAR圖像,圖16(b)為該區域的光學圖像。圖16(e)、圖16(f)分別為雙基線原始干涉圖,圖16(g)、圖16(h)為對應的去平地并濾波后的干涉圖,兩幅干涉圖對應的全圖平均相干系數分別為0.62(基線1)和0.58(基線2),圖16(d)即為基線2對應的相干系數圖。圖16(c)為基線2對應的該區域參考解纏相位,該相位以ALOS-DEM[37]高程數據為參考獲取,其網格尺寸為12.5 m,高程精度可達3~9 m[38],可以為不同方法的解纏精度評估提供有效參考。此外,通過該高程數據計算得到的該區域的最大地形坡度接近50°,屬于較陡峭地形。

表5 多基線InSAR實測數據主要參數Tab.5 Main parameters of multi-baseline InSAR real data

圖16 多基線InSAR實測數據Fig.16 Real InSAR data of multi-baseline

實測數據驗證采用前文所述4種方法進行比較,圖17(a)-圖17(d)對應4種方法的解纏結果,圖17(e)-圖17(h)為4種解纏結果相對于目標區域參考相位(圖16(c))的解纏誤差,表6展示了各方法解纏結果的評估指標。

表6 各方法所獲取實測數據解纏相位評估結果Tab.6 Evaluation results of unwrapped phase of real data obtained by different methods

圖17 實測數據各方法解纏結果對比Fig.17 Comparison of unwrapped phase obtained by different methods for real data

由于噪聲抑制能力有限,基于MLE方法獲取的解纏結果存在大量散點誤差?;赥SPA方法獲取的解纏結果在圖像右上角相干性較低且地形變化較為復雜的區域出現部分解纏錯誤,且由于干涉圖尺寸較大,TSPA解纏處理的時間成本明顯高于其他3種方法。CANet方法和本文所提MCJ-UNet方法解纏結果均未出現大面積誤差,解纏精度相當。MCJ-UNet的解纏誤差主要位于雙基線干涉圖模糊數跳變邊緣重合的位置,此處在進行多通道聯合解纏誤差自修正后仍存在少量像素的誤差殘留。但是,MCJ-UNet的雙通道相位解纏精度相比于單通道具有明顯提升,驗證了基于不同通道的模糊數分類邊緣的差異進行解纏誤差自修正的處理方法的有效性。此外,與5.3節的分析結論一致,由于精度評估采用通道2的解纏相位為參考,通道1的基線長度較短,對應的高程模糊度較大,所以在經過尺度縮放后,其相比通道2的解纏精度更低。

在針對解纏效率的詳細對比中,雖然CANet與MCJ-UNet的網絡運行時間相當,但MCJ-UNet的后處理時間具有明顯優勢,處理時間不足CANet后處理時間的5%,有效降低了大規模干涉圖解纏的時間成本。因此雖然MCJ-UNet解纏方法在解纏精度上和CANet方法相當,但是在處理效率方面表現更為突出,這意味著大規模干涉圖解纏或對實時性要求較高的場景下,MCJ-UNet方法將更具優勢。

6 消融實驗

為驗證所提網絡優化方法以及相位殘差損失函數的有效性,本節進行了消融實驗,對比在相同訓練條件下(如5.1節所述),各種方法在測試集上的模糊數分類準確率以及相應的訓練時間。對比方法分為網絡結構有無SE模塊以及損失函數有無多通道相位殘差項,實驗結果如表7所示,其中,方法4為本文所提方法。由表7數據可知,4種方法中通道1的模糊數分類準確率要優于通道2,這是由于通道1的分類數少于通道2,相應的分類難度較為簡單。對比方法1和方法3以及方法2和方法4,SE模塊的加入略微增加了網絡的訓練時間,但顯著提升了各通道模糊數的分類準確率,證明了其在網絡優化過程中的有效性。對比方法1和方法2以及方法3和方法4,多通道相位殘差優化損失的加入提高了網絡分類的準確率,同時對通道2的提升更加明顯,使得不同通道的分類準確率差距變小,證明了相位殘差損失結合多通道相位關系的有效性。由于損失函數計算量的增加,網絡訓練時長也相應增加,但是不會增加網絡結構的復雜度,也不會影響網絡處理時間,因此相較于準確率的提升,此處的網絡訓練時間的增加在可接受的范圍內。

表7 各對比方法的分類準確率及訓練時間Tab.7 Classification accuracy and training time of each comparison method

7 結語

面向InSAR相位解纏技術的高效應用,本文提出一種基于深度學習的多通道聯合相位解纏網絡:MCJ-UNet。該方法結合了多通道相位解纏思路和神經網絡模型,將相位解纏中的模糊數估計問題轉化為了語義分割問題,采用多輸出UNet完成處理。在網絡優化過程中,該方法引入了SE模塊以增強不同輸出通道對所需特征信息的感知能力,并引入了多基線相位殘差損失以增強網絡對多基線干涉相位間約束關系的學習。此外,為進一步抑制相位解纏誤差,該方法引入了基于多通道聯合約束的解纏誤差自修正處理,借助不同通道間的模糊數分類邊緣的差異進行解纏誤差的檢測及修正,實現了各通道解纏相位的有效融合,保證了相位解纏質量。

基于所提出的MCJ-UNet方法完成了模擬地形仿真、真實地形仿真及TerraSAR-X實測數據驗證。實驗結果表明,MCJ-UNet可有效實現多通道聯合相位解纏,在平緩及陡峭地形下均具有較強的適用性。就解纏精度而言,該方法優于MLE方法和TSPA方法,與同為基于深度學習的多通道相位解纏的方法CANet的精度相當。就解纏效率而言,由于采用直接估計模糊數的解纏方式,該方法的處理效率具有明顯優勢,將更適用于大尺寸干涉圖的解纏處理,也為基于深度學習的相位解纏提供了一種新的思路。

此處需要說明的是,由于網絡化處理中需要進行卷積操作,所輸入的數據尺寸需為32的倍數,針對于尺寸非32整數倍的數據,可以在邊緣進行補0操作。對于極大尺寸的數據(如數據尺寸超出處理平臺的并行處理能力),也可通過分割處理進行分別解纏。另外,需要注意的是,在網絡訓練過程中,需要數據集的模糊數分類范圍涵蓋解纏數據對應的范圍,所以在訓練時需要盡量生成較大模糊數區間的數據,或依據特定數據的模糊數范圍選擇對應區間的網絡進行處理,以保證解纏網絡的適用性。

未來的研究將繼續拓展所提出的網絡模型,以適應更為復雜的觀測地形,并聚焦強噪聲環境下的相位濾波處理,構建基于深度學習網絡的相位濾波及相位解纏一體化處理框架,以支撐InSAR技術的大規模高效應用。

利益沖突所有作者均聲明不存在利益沖突

Conflict of InterestsThe authors declare that there is no conflict of interests

猜你喜歡
基線高程損失
胖胖損失了多少元
適用于MAUV的變基線定位系統
8848.86m珠峰新高程
航天技術與甚長基線陣的結合探索
玉米抽穗前倒伏怎么辦?怎么減少損失?
GPS控制網的高程異常擬合與應用
一種改進的干涉儀測向基線設計方法
一般自由碰撞的最大動能損失
損失
SDCORS高程代替等級水準測量的研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合