?

基于深度神經網絡的探地雷達雜波抑制和根參數預測方法

2023-11-26 10:12李光輝馬嘉輝王哲旭
農業工程學報 2023年16期
關鍵詞:探地雜波半徑

李光輝,馬嘉輝,王哲旭,魏 槊

(江南大學人工智能與計算機學院,無錫 214122)

0 引言

根系在樹木生長過程中扮演著重要角色,具有吸收水分、運輸養分和固定植物體等功能。根系檢測有助于了解植物生長、健康狀況以及土壤中的物質循環[1-2],傳統方法(例如根鉆法、土壤剖面法等)多為破壞性檢測,有著操作復雜以及可能造成不可逆損傷的缺點。探地雷達作為一種無損檢測工具,相對于其他無損檢測技術(例如核磁共振法、電阻率層析成像和聲學方法等[3-4])具有攜帶方便、操作簡單、成本低廉等優點,近年來已廣泛應用于淺層地下物體檢測,但是由于樹木根系所處復雜環境導致數據的解譯仍然面臨挑戰[5-6]。

探地雷達由發射天線和接收天線組成,在被檢測地表以合成孔徑的方式沿檢測線平移,發射天線向地下發射特定頻率的電磁波,而根系和周圍土壤的相對介電常數分布,將導致接收天線接收到不同的反射電磁波信號。通過分析接收到的信號可以推測出地下根系的位置及根生物量等信息[7-9]。但是由于天線間的耦合、地面反射直達波、地下介質隨機分布的復雜性等因素[10-11],導致收集到的原始B-scan 數據中存在雜波,對目標信號的分析造成嚴重干擾,增加了地下根系的檢測和特征提取的難度。崔喜紅等[12]使用回歸模型來建立雷達波形振幅強度、時間跨度和根系直徑、生物量的統計關系,對于根直徑大于0.005 m 的情況下,R2值達到0.85。隨著深度神經網絡的發展,許多學者將其應用于探地雷達數據解譯,王澤鵬等[13]應用YOLOv3 強大的特征提取能力對根雙曲線進行感興趣區域劃分,識別準確率和召回率分別達到了96.62%和86.94%,然后使用隨機霍夫變換擬合雙曲線,根系參數預測的總平均相對誤差在10.57%以內。但目前對根參數的估計大多沒有考慮雷達信號受復雜土壤環境的影響,將土壤視為均勻介質,使用雙曲線擬合估計其平均介電常數,這導致檢測算法在不同土壤環境時魯棒性降低[14-16]。此外,探地雷達檢測數據通常需要經過預處理、感興趣區域框定、雙曲線信息提取等多個處理階段,容易導致誤差累積。

針對以上問題,本文提出了一種針對異質土壤介質下的基于深度神經網絡(deep neural networks,DNN)的探地雷達雜波抑制和根參數預測方法。該方法首先使用改進U-net 網絡實現雜波抑制,從原始B-scan 圖像中獲取僅含有目標樹根反射響應的純凈雙曲線,以去除環境噪聲和土壤固有異質性產生的干擾。然后將原始B-scan圖像和去除雜波后的純凈雙曲線圖像并行輸入參數估計網絡獲得根半徑和深度。最后,通過仿真試驗和埋根試驗證實該根系參數預測方法的精度和魯棒性。

1 試驗數據

本研究分為仿真和實地試驗兩部分,數據集由仿真數據及合成數據構成,用于模型訓練及測試,實地試驗數據用于驗證本研究方法不同條件下的有效性及魯棒性。

1.1 數據集構建

深度學習是數據驅動的方法,數據集對于訓練至關重要,真實試驗需要人工埋根,耗費人力物力,同時記錄的大量標簽存在誤差,而全部由仿真數據構成數據集,神經網絡將不能很好地適應真實數據,性能較差。為避免以上兩種問題,本文構建了一個仿真數據和合成數據的數據集用于網絡的訓練,既保證了數據集有著真實實地情況下的多樣性,也保證了標簽的準確性。

數據集由3 部分構成,均質仿真數據、異質仿真數據和合成數據各1 000 組。各部分數據中都包含了不同的根分布以及各種土壤情況,每組數據都包含有一個原始的B-scan 雷達圖像、其雜波圖像以及對應的根目標圖像。

1)均質仿真數據,使用基于時域有限差分(finite difference time domain,FDTD)方法求解麥克斯韋方程的開源軟件gprMax 生成,仿真場景如圖1 所示,模型尺寸為0.6 m×0.6 m×0.2 m,時間窗大小為15 ns,使用完全匹配層減小側反射,仿真數據參數如表1 所示。使用的天線是由地球物理探測公司(GSSI)制造的400 MHz商用GPR 天線,位于土壤表面5 cm 高度處,沿檢測線方向移動,每1 cm 發射一次電磁波并收集一次數據形成一個A-scan,共收集32 個A-scan 形成B-scan 圖像。無雜波B-scan 圖像由原始含根目標的B-scan 數據減去相同土壤條件下無根目標的B-scan 數據獲得,通過這種方式去除相同位置的雜波,無雜波圖像僅含有根目標反射回波信號。

表1 數據集參數設置Table 1 Parameters settings of dataset

圖1 數據集3 類型樣例Fig.1 Examples of 3 types of data sets

2)異質仿真數據,除土壤條件外,其余參數與第一部分相同,異質土壤模型采用Peplinski 混合模型[17],參數如表1 所示,土壤為50%沙土和50%黏土混合,沙土密度為2 g/cm3,黏土密度為2.66 g/cm3,含水率為0.1%~25%,相對介電常數和電導率區間分別為[3.82,9.99]和[0.01,0.07]。地下介質由以上參數范圍內50 種不同的異質土壤隨機分布構成。

3)合成數據,由于在真實情況下無法從原始B-scan圖像中獲得完美的雜波抑制圖像,所以使用第一部分中的根目標圖像和真實無樹根的土壤B-scan 圖像合成原始B-scan 圖像。真實數據采集使用美國 GSSI 公司的 SIR-3 000 型400 MHz 探地雷達掃描無樹根存在的土壤,如圖1 所示,每1 cm 記錄一個A-scan,獲得5 條長2.5 m,由2 500 個A-scan 組成的B-scan。將每個B-scan 分割為200 組32 個A-scan 組成的B-scan 并歸一化,與第一部分的根目標圖像相加,獲得含有真實土壤雜波分布的Bscan 圖像,與實際雷達圖相似。

數據集由3 部分共3 000 組數據構成,為保證輸入圖像尺寸的一致性,將所有圖像統一調整為64×64 像素大小。雖然探地雷達圖像大小具有實際物理意義,寬度表示B-scan 圖像由多少個A-scan 組成,長度表示雷達采集數據的時間窗大小,但本文B-scan 圖像中A-scan 數量及時間窗相同,所以對圖像大小的統一調整不會損壞雷達圖像所含的信息。最后將數據集按7:1:2 的比例分為訓練數據、驗證數據和測試數據。

1.2 實地數據采集

為驗證本文方法對實地數據的泛化能力,2023 年3月在江南大學操場沙坑進行人工埋根試驗,沙土環境便于挖掘,避免土壤挖掘產生的結塊和空氣間隙[13,18-19],2023 年6 月挖掘了實際泥土土壤中的真實根系。實地試驗數據采集同樣使用GSSI 公司的 SIR-3 000 型400 MHz探地雷達。選取相對介電常數和根相近的樹枝作為模擬根系,通過不同半徑、不同掩埋深度以及不同土壤含水率的埋根試驗,測試網絡對真實實測數據的有效性。測量根上中下多個位置求平均半徑得到,本文選取8 個不同半徑的根系開展試驗以驗證本文方法對半徑的預測效果,具體根參數如表2 所示。

表2 樣本根系數據Table 2 Data of sample roots

試驗分兩組,第一組為干燥環境,土壤含水率低,沙土地挖掘的兩個長方形試驗坑,如圖2a 和圖2b 所示,試驗坑A 深度約為50 mm,試驗坑B 深度約為150 mm,寬度均為400 mm,每條根埋入后單獨測量具體深度,和試驗坑深度不完全相同。兩試驗坑均埋入根R1、R2、R3、R4,測量時向沙土的不同部分噴灑不同量水,產生不同的含水率分布,由此模擬異質土壤相對介電常數分布。兩試驗坑反映了對于不同樹種、不同深度和不同半徑的預測效果。

圖2 試驗現場Fig.2 The site of experiment

第二組為強降雨后24 h 內,土壤含水率高,如圖2c和圖2 d 所示,試驗坑C 和試驗坑B 相似,但坑C 含水率更高,埋入根R5 和R6,試驗坑D 為實際泥土下樹根,挖掘出根記為R7 和R8。兩試驗坑反映了不同土壤環境下預測效果。

2 研究方法

2.1 模型構建

本文方法分為兩階段,網絡框架如圖3 所示,第一階段使用注意力機制改進的U-net 構成雜波抑制網絡以去除天線間的耦合、地面反射直達波、地下介質隨機分布的復雜性等因素導致的雜波,將原始B-scan 圖像輸入雜波抑制網絡,然后輸出僅包含根反射信號的圖像。第二階段將僅包含目標根信息的圖像與包含異質土壤信息的原始B-scan 圖像并行輸入根參數估計網絡,提取根反射信號以及異質土壤的特征,使用inception 結合全局和局部信息,最后通過全連接層輸出預測值。

圖3 本文方法網絡模型Fig.3 Presnted network model

本文方法與已有的預測方法的流程對比如圖4,雜波抑制網絡代替目前主流方法對原始數據進行的多次預處理過程。根參數估計網絡代替擬合雙曲線并提取其信息的步驟。降低了實際應用復雜性,避免誤差的累積。

圖4 流程圖對比Fig.4 Flow chart comparison

2.1.1 雜波抑制網絡

相比于市政工程方面[20-21]探地雷達應用于人造混凝土介質,土壤的異質性導致雜波和噪聲更為明顯,對目標回波的影響也更大。因此,對探地雷達原始數據進行雜波抑制是必要的。原始信號數據包含了目標回波及許多噪聲和雜波,可以表示為

式中Sr為原始信號,St為根目標產生的回波信號,Sc為雷達天線耦合及土壤異質性導致的雜波信號,雜波抑制網絡判斷原始B-scan 圖像每個像素是否為根目標產生的信號,將不屬于根目標的雜波信號去除以達到抑制雜波。

本文提出的雜波抑制網絡受U-net[22]啟發使用編碼-解碼結構,并使用注意力機制改進以適應探地雷達使用場景。U-net 具有能對小數據集訓練和對像素點分類以獲得高準確率分割的優點,適用于解決探地雷達圖像處理方法面臨的挑戰:圖像數據樣本少以及實際應用時雜波種類多干擾嚴重。

原始U-net 主要由三部分組成:編碼器、解碼器和跳躍連接。由于探地雷達數據中根反射區域比例較小,背景干擾嚴重。本文添加注意力模塊到跳躍連接部分,使其能自適應地對根目標區域增大權重,更好地保留根反射的雙曲線,減少雜波干擾。

編碼器部分由四個編碼塊組成,如圖5a 所示編碼塊包含兩個卷積塊和一次下采樣操作。卷積塊由卷積層,BN 層和激活函數組成,卷積核大小為3×3,步幅為1,填充為1,確保通過卷積核前后特征圖大小相同。批歸一化操作應用于卷積操作之后,用于穩定網絡中數據的分布,加速模型的訓練,并緩解梯度消失的問題。激活函數使用ReLU,其非線性映射能力可以增強模型學習能力。下采樣操作由MaxPooling 實現,池化核大小為2×2,步幅為2,每次將特征圖縮小為輸入的一半,這有助于提取更高層次的特征。

圖5 編碼-解碼模塊Fig.5 Encoding-decoding module

解碼器部分和編碼器類似,如圖5b 所示,由兩個卷積塊和一次上采樣操作組成的解碼塊 的4 次連續使用構成。上采樣操作使用雙線性插值實現,比例因子為2,將特征圖擴大為輸入的兩倍,恢復丟失的空間信息,提高圖像重建的精度。

使用注意力模塊代替跳躍連接,將編碼器壓縮后和解碼器解碼后的同尺寸特征圖作為共同的輸入,通過融合淺層和深層的特征學習權重信息,注意力模塊引導解碼器通過網絡學習的過程關注數據中根目標反射的回波信號。

注意力模塊結構如圖6 所示,其中X表示編碼部分輸入特征,Y表示解碼部分輸入特征,分別經過卷積和批歸一化操作后相加,再經過卷積塊得到權重信息,大小和輸入特征相同,通道數為1。權重信息代表了網絡對輸入特征各部分的關注程度。最后將權重信息與輸入解碼部分特征相乘,以獲得和輸入解碼部分特征相同大小和通道數的新特征。

圖6 注意力模塊Fig.6 Attention module

2.1.2 根參數估計網絡

為綜合考慮異質土壤對探地雷達信號的影響以及根反射雙曲線信息,本文提出一種雙通道根參數估計網絡,由殘差塊(resblock)和inception 塊組成。將原始探地雷達B-scan 數據和上一階段雜波抑制后的根目標圖像并行輸入,首先通過殘差塊,然后將2 個通道輸出的特征圖拼接,輸入到多任務分支,每個分支經過一個inception 模塊,最后通過多個全連接層(fully connected layer,FCL)將前面學習到的特征輸出為根深度和半徑。雙通道網絡充分利用異質土壤的背景信息和根目標反射的回波信息,提高根參數的預測精度。

殘差模塊(resblock module):雷達圖像中部分反射信號強度較小,相比其他反射無法被顯著觀察,但同樣包含著土壤和根系的重要信息,為避免經過連續的卷積后,這些信號特征的消失,導致根參數預測精度的降低,引入跳躍連接將經過第一次卷積后的特征與最后輸出的特征融合,保留淺層中重要信息的特征。如圖7 所示,殘差塊包含3 個連續的卷積層,每個卷積層后是ReLU 激活函數。

圖7 殘差模塊Fig.7 Resblock module

inception 模塊:由于地下根系位置和根半徑大小的隨機性,雷達圖像在不同位置有著不同形狀的雙曲線,并且網絡需要同時輸出根深度和根半徑,兩個根參數的信息尺度不同,根深度關注全局的空間尺度,而根半徑與局部信息相關性強。所以使用inception 塊以獲得不同的特征感受野,大的特征感受野捕捉具有高層次語義的全局信息,而小的特征感受野關注局部細節的特征,計算式如下

式中rη表示第 η 層感受野,rη-1表示第 η-1 層感受野,kη表示卷積核大小,sn表示步幅。

inception 模塊結構如圖8 所示,采用四分支結構,具有不同的特征感受野,分別為1×1、3×3、5×5、7×7以提取圖像中不同尺度特征。隨著卷積核大小增大,計算成本增加,使用連續兩個和三個大小為3 的卷積核代替5×5 和7×7 大小的卷積核。最后拼接4 個分支不同尺度的特征。

圖8 inception 模塊Fig.8 Inception module

為將圖像特征映射到輸出的根參數,最后將特征降至一維輸入4 個連續全連接層,各全連接層節點分別為1 024、256、64 和1,并在第一個全連接層添加dropout層,比例為0.5,隨機丟棄一半的節點數據,防止模型過擬合,增強泛化性能。

2.2 模型訓練與評估指標

2.2.1 試驗平臺與訓練參數

本文試驗平臺是Ubuntu16.02 系統搭載1 塊CPU 處理器(Intel Core(TM)i9-9900X @ 3.50 GHz)和2 塊12 G 顯存GPU(Nvidia RTX2080Ti×2),采用Pytorch作為深度學習框架,版本為1.7.1,CUDA 版本為10.1,軟件環境為python 3.8。

雜波抑制網絡和根參數估計網絡均使用均方誤差(mean squared error,MSE)作為損失函數,并采用Adam 最小化預測值與實際值間的均方誤差,動量為 0.9和權重衰減為1e-8,學習率分別為0.001 和0.000 8。兩個模型均迭代(epoch)100 次,模型每批次樣本數量(batch size)為16。

2.2.2 評估指標

對于雜波抑制,使用峰值信噪比(peak signal to noise ratio,PSNR)和結構相似性(structural similarity,SSIM)指標進行雜波抑制前后的定量分析。計算公式如下:

式中MAX為圖片最大圖像值,n為圖像像素數量,xi為抑制后圖像像素值,yi為目標圖像像素值,PSNR越大表示效果越好。

式中x、y為輸入的兩張圖片,l(x,y) 是亮度比較,c(x,y)是對比度比較,s(x,y) 表示結構比較,α、β、γ分別代表其各部分對于SSIM的權重,本文設置 α=β=γ=1,μx和μy分別代表x和y的平均值,σx和 σy分別表示x和y的標準差,σxy表示x和y的協方差,c1、c2、c3為常數,避免分母為零帶來的錯誤,本文c1=2.552,c2=7.652,c3=c2/2。SSIM越接近1 表示效果越好。

使用平均絕對誤差(mean absolute error,MAE)和決定系數(confficent of determination,R2)來評價模型對于根參數的預測效果。平均絕對誤差是指預測值與真實值之差的平均絕對值;決定系數用于評價回歸模型的擬合程度,決定系數越接近于1 表示擬合程度越好。

3 結果與分析

3.1 仿真數據結果

圖9 展示了對原始B-scan 圖像的雜波抑制效果。圖9a 顯示了含雜波的B-scan 圖像,圖9b~9f 分別給出了均值濾波(mean subtraction,MS)[23]、奇異值分解(singular value decomposition,SVD)[24]、魯棒主成分分析(robust principal component analysis,RPCA)[25]、U-net 以及本方法雜波抑制后的圖像。從圖9 可以看出,MS 對于不均勻雜波抑制效果較差,且對根目標反射雙曲線造成了一定的扭曲,基于子空間的奇異值分解(SVD)和魯棒主成分分析(RPCA)將圖像分解為對應目標、雜波和噪聲多個分量,但目標信息存在于多個分量中,分離效果不佳,仍有部分雜波混雜在根目標反射分量中,U-net 由于缺少注意力機制,與目標雙曲線重合的小部分雜波沒有被去除。與其他方法相比,本文方法幾乎去除了所有雜波,并保留了根反射的主要雙曲線信息。

圖9 仿真數據效果對比Fig.9 Comparison of simulation data effects

針對PSNR、SSIM和時間等指標,比較了各種算法的雜波抑制性能,對于測試集計算平均PSNR(dB)和平均SSIM以及計算用時(ms),比較結果如表3 所示。MS 處理時間最短,但效果最差,除RPCA 耗時較長外,其余方法處理時間相差不大,但本文方法具有最好的PSNR和SSIM。

表3 不同算法對比Table 3 Comparison of different algorithms

圖10 展示了本文方法在測試數據集上的預測效果,使用不包含在訓練集中的600 組數據??梢钥闯?,擬合程度較高,大部分預測數據與真實標簽差值較小。深度上93.3%的估計誤差在8 mm 以內。半徑上84.8%的估計誤差在3 mm 以內。

對比其他回歸模型,結果如表4。其他回歸模型沒有多任務分支,雖然可以更好地映射數據和單任務之間的關系,但是每組模型參數只能預測一個根參數,需要對根深度和根半徑分別訓練兩組模型參數,而本文方法只需要一組模型參數就可以同時預測根半徑和深度。訓練集和測試集下,本文方法的根半徑預測平均絕對誤差是1.7 mm,R2值為0.914,根深度預測的平均絕對誤差是6.3 mm,R2為0.989,優于其他常見回歸模型。這是因為其他回歸模型沒有關注異質土壤信息,導致對于不同環境下的魯棒性降低,土壤條件變化時無法將數據準確映射到預測值。由此可知,本文方法可以使用訓練好的模型實現快速而準確的預測根半徑和根深度的,提高應用效率。

表4 不同模型性能比較Table 4 Performances comparison of different models

3.2 實地埋根試驗結果

將實測B-scan 數據輸入訓練好的模型,雜波抑制效果如圖11 所示,圖11a 是原始B-scan 圖像,圖11b~11f 是MS、SVD、RPCA、U-net 以及本文方法的雜波抑制結果。MS、SVD、RPCA 只能去除部分雜波,U-net淡化了根反射雙曲線,可能導致目標根信息損失。本文方法在去除大部分雜波的同時,較完整地保留了目標根雙曲線。

根參數預測結果如表5 所示,本文方法對于實地試驗根半徑預測最大誤差為1.85 mm,平均相對誤差為6.21%;對于實地試驗根深度預測的最大誤差為13.6 mm,平均相對誤差為6.88%。因為實測數據多樣性相對于仿真數據集較弱,實地數據預測效果略優于本文方法在數據集上的預測效果。實地試驗根半徑基本覆蓋本文模型訓練時使用數據集設定范圍。并且使用不同樹種、不同土壤環境驗證,使用實測數據得到的預測結果證明了本文提出方法能夠成功預測根系半徑和深度,并且誤差較小接近真實值。

表5 樣本根系預測結果Table 5 The results of sample roots prediction

4 討論

4.1 數據集多樣性

深度學習模型預測準確性與數據集大小和構成密切相關,較為多樣的數據集能很大程度上提高模型的泛化能力。而探地雷達數據受探地雷達以及檢測目標環境等多方面共同影響。

1)雷達頻率:不同頻率的雷達各有優勢,高頻雷達在垂直方向上具有更高的分辨率,但傳播過程衰減嚴重,適合淺層根系檢測,降低雷達頻率可以獲得較大的探測深度,但是隨之降低的垂直分辨率可能導致無法解析根系上下表面,導致根半徑的預測結果相差較大,本文使用400 MHz 雷達。

2)土壤條件:檢測根系所在土壤結構含水率不同導致的異質性將產生嚴重的雜波,并導致反射雙曲線扭曲,本文提出雜波抑制網絡降低其影響,但暫時未考慮到多種地質結構分層土壤結構。

3)根系分布:本文埋根均垂直于雷達掃描路徑,實際根生長過程存在傾角會導致B-scan 圖像中雙去線形狀被拉伸變形。針對以上問題,開發一個多樣性更強,樣本更豐富的數據集是能夠為將來的研究工作帶來極大的幫助。

4.2 模型預測

本文使用B-scan 圖像預測根半徑和根深度,現有絕大部分雷達均是采集B-scan 數據,本文方法能方便地應用于商用探地雷達。但是含有較為集中局部信息的Ascan 數據和由多組B-scan 構成的C-scan 沒有被充分利用,根系所處垂直方向的A-scan 數據中根半徑和根深度相關信息比例較高,可以借助A-scan 數據提高模型預測性能,而C-scan 數據包含根系不同剖面的信息,利用信息豐富的C-scan 數據能夠分析樹根的方向角度。

5 結論

本文提出了一種基于神經網絡的探地雷達雜波抑制和根參數預測方法,實現了對于根半徑和根深度的準確預測。

1)針對探地雷達檢測異質土壤介質中雜波影響檢測精度的問題,提出了一種雜波抑制網絡,對收集到的原始B-scan 圖像進行雜波抑制,提取根目標反射雙曲線,有效去除了異質土壤環境導致的不利影響,在測試數據集上獲得了39.42 dB 的峰值信噪比以及0.991 的結構相似性,為第二階段根參數估計提供了高質量的雷達圖像數據。

2)提出了一種雙通道根參數估計網絡,實現對根深度和半徑的同時預測。在數據集上對于根半徑和根深度的平均絕對誤差分別為1.7 和6.3 mm,決定系數分別為0.914 和0.989,優于其他常見回歸模型。在實地試驗中,根半徑和根深度預測的最大誤差分別為1.85 和13.6 mm,總平均相對誤差為6.55%。證明本文預測方法準確預測根半徑和根深度,具有較高的魯棒性,能夠適應不同土壤環境。

猜你喜歡
探地雜波半徑
STAR2000型空管一次雷達雜波抑制淺析
基于超表面的探地雷達增強探測研究
全極化探地雷達系統
連續展成磨削小半徑齒頂圓角的多刀逼近法
基于探地雷達法的地下管線探測頻譜分析
一些圖的無符號拉普拉斯譜半徑
密集雜波環境下確定性退火DA-HPMHT跟蹤算法
熱采水平井加熱半徑計算新模型
相關廣義復合分布雷達海雜波仿真
微波雷達海雜波混沌特性分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合