?

非合作雙基地雷達弱目標KCF-TBD方法

2023-12-18 08:20源,宋杰,熊
雷達科學與技術 2023年6期
關鍵詞:航跡雷達基地

陸 源,宋 杰,熊 偉

(海軍航空大學信息融合研究所,山東煙臺 264001)

0 引 言

隨著現代戰場的電磁環境日益復雜,傳統的有源雷達由于其主動發射電磁波,往往容易被敵方發現,致使人們開始研究非合作雙基地雷達。非合作雙基地雷達是以非合作雷達為輻射源,基于雙基地雷達工作方式,開展目標探測的無源探測系統[1-3]。然而,非合作雙基地雷達由于輻射源的不確定性以及雙基地幾何模型的限制,其在探測的過程中面臨許多問題:例如同步過程中直達波參數估計時會產生誤差,接收通道會受其幾何模型的影響而存在較強的直達波和多徑干擾[4]。這些因素共同作用會導致目標信噪比低,探測過程中量測不連續,幀與幀之間的目標探測不穩定。

為了提高系統在低信噪比條件下的檢測性能,最簡單的辦法就是降低檢測門限,然而一味降低檢測門限就會導致雜波的進入,產生大量的虛警。為了實現目標的可靠檢測和穩定跟蹤,傳統的先檢測后跟蹤(Detect-Before-Track,DBT)方法變得難以勝任,因此人們提出了檢測前跟蹤(Track-Before-Detect,TBD)方法。該方法與傳統DBT方法不同,TBD 方法避免門限檢測從而保留目標原始量測,并通過集合多幀的方法增強了信噪比,在宣布檢測結果的同時估計出目標航跡[5-6]。近些年以來,已提出了許多關于有源[7]和無源[8]的TBD 方法。然而傳統的TBD 方法由于運算量較大,難以在實時性較高的系統中實現[9]。為了減少TBD 方法的計算量,Grossi 提出了一種兩階段的TBD 方法[10],可直接在檢測后的數據上進行,無需對整個狀態空間進行離散化處理,因此在實際系統中應用更廣泛。但是,制約上述TBD 方法跟蹤性能的關鍵因素包括值函數的選擇和目標運動模型的先驗知識[11],值函數體現了目標和雜波在信號、相關性、運動特性等方面的差異,而目標運動模型的先驗知識在一定程度上決定了跟蹤效果的好壞。

綜上,針對非合作雙基地雷達在實際目標探測的過程中面臨量測斷續以及幀與幀之間探測不穩定等問題,如何利用TBD 的方法實現目標的檢測與跟蹤,同時保證一定的實時性和泛化能力具有一定的研究意義。隨著如今視覺跟蹤獲得高度關注,核相關濾波以其效率高、速度快、識別能力強等諸多優點被廣泛應用于計算機視覺跟蹤[12]。因此,本文利用DP-TBD 值函數累積的思想,并結合核相關濾波器的跟蹤原理,提出了非合作雙基地雷達弱目標KCF-TBD 方法。本文所提方法可以在不依賴運動模型的基礎上實現對多個弱目標的檢測與跟蹤,并針對非合作雙基地雷達在實際掃描過程中,幀與幀之間探測不穩定,KCF 跟蹤框易漂移、丟失等問題,利用峰值旁瓣比(PSR)作為跟蹤過程穩定性的監測指標和值函數,使用深度學習修正跟蹤框的位置,提高了整個跟蹤過程的穩定性。

1 非合作雙基地雷達幾何模型及探測性能分析

圖1是非合作雙基地雷達的幾何關系,Tx為非合作雷達輻射源發射站,Rx為接收站,Tg為目標,Tx與Rx間距為基線距離L,θt和θr分別為發射站與接收站的目標方位角,Rt和Rr分別為目標到發射站與接收站的距離。雙基地距離差Rd=Rt+Rr-L。

圖1 非合作雙基地雷達幾何關系示意圖

通常情況下目標與接收機一般不被發射機天線主瓣同時覆蓋,直達波往往來自輻射源的旁瓣輻射,因此參考接收機對來自非合作輻射源的直達波的偵收大多數情況下為旁瓣偵收。雷達天線的旁瓣電平一般比主瓣的峰值低20~50 dB[13]。而目標散射回波與直達波相比,由于經過了一次反射,能量再次得到衰減,直達波與目標散射回波的功率相差十分懸殊。為了更加量化非合作雙基地雷達的探測性能,雙基地雷達距離方程尤為重要,其表達式為

式中:RtRr為非合作雙基地距離積;Pt為外輻射源發射功率;Tc為單次累積時間;Gt,Gr分別為發射天線和接收機天線功率增益;σ為目標雙基地RCS;Ft,Fr為發射、接收天線方向圖的傳播因子;k為玻耳茲曼常數;Lt,Lr分別為發射損耗和接收端的損耗;Ts為接收機系統噪聲溫度;Bn為帶寬;SNRmin為接收最小可檢測信噪比。非合作輻射源到目標的功率密度Ps如下式所示[14]:

將式(2)代入式(1),非合作雙基地雷達的距離方程可以進一步推導為

本文外場實驗所用的非合作雙基地雷達參數如表1所示。

表1 非合作雙基地雷達參數設置

為了方便計算,將發射、接收天線方向圖的傳播因子Lt,Lr統一記為系統損耗L;發射端和接收端的損耗Ft,Fr設定為1;單次累積時間Tc設定為1 s;非合作輻射源到目標的距離Rt為10 km,將表1 中的數據代入式(3)中,當目標距接收站的位置Rr為7.04 km 時,信噪比SNR為5 dB,目標信號較弱,并且會隨著目標與接收站之間距離的不斷增大而減小,例如當Rr為10 km 時,信噪比SNR將下降到1.95 dB。所以,對于弱目標的檢測,如果設置較高的門限將產生漏檢,如果設置較低的門限將產生大量的虛警。

2 KCF-TBD算法

2.1 KCF算法簡介

如今,計算機視覺目標跟蹤創新性地將傳統分類學習方法應用于計算機視覺,把跟蹤過程看作一個在線學習的問題[15]。KCF 作為采用這種思想的代表性算法,于2014 年由Henriques 和Caseiro提出,并應用了近十年。KCF 的本質是一種判別式跟蹤,主要是使用給出的樣本去訓練一個判別分類器,判斷跟蹤到的是目標還是周圍的背景信息。利用循環矩陣對樣本進行采集,使用FFT 對算法進行加速計算。其實質就是求解嶺回歸問題,假設目標函數是f(xi)=ωTxi,ω是映射關系中的權重系數,xi是樣本,yi是樣本xi對應的輸出值,加入正則項ν來防止過擬合,學習的目標函數為

為了進一步提升學習性能,xi和yi之間的關系可以用映射函數φ(xi)映射到更高維空間:

將式(5)代入式(4)中計算,優化的變量由ω變成了α。因此,對α求導后,嶺回歸問題的解可以由文獻[16]給出:

K為核空間的核矩陣,I為n*n的單位矩陣,α=[α1,α2,…,αn]T,y=[y1,y2,…,yn]T。由于K是循環矩陣,利用循環矩陣對角化的性質可得

通過式(7)學習到第一幀的權重α,那么第k幀的響應矩陣yk如下所示:

式中F和F-1分別表示傅里葉變換及其逆變換。將式(7)代入式(8)可以得到

通過上式可以看出第k幀的響應是由和共同作用的,它們分別是各自在頻域上的自相關和互相關,這一點和核相關濾波器的“相關”概念相符合。

2.2 KCF-TBD與傳統TBD之間的關系

傳統動態規劃檢測前跟蹤的核心思想就是在離散的空間中按照目標運動的先驗模型搜索所有可能的航跡,并估計出最佳的目標航跡。這里引入λ作為值函數,目的就是在所有可能的目標航跡組合中找到能夠使值函數λ達到最大值的目標航跡序列X1:K=(x1,…,xK),其中K表示整個航跡序列的掃描幀數,xK表示第K幀的目標狀態。所以值函數λ的選擇會對算法的結果產生重要的影響,一般值函數的選擇要能夠體現目標和雜波在信號、相關性、運動特性等的差異。在選定合適的值函數后,目標航跡序列可表示為

設定一個閾值γ,當某一個狀態序列累積的值函數大于閾值的時候就宣布檢測到航跡,并進行航跡回溯。

因此,對于KCF-TBD,同理可以提出KCF 跟蹤器生成值函數累積最大軌跡的命題。假設是KCF 跟蹤器在K幀中的狀態序列,那么這個狀態序列的累積和就是所有物理可行路徑中累積的最大值。

對于每一個KCF 跟蹤器,它在跟蹤框所有可能的擴展單元中進行搜索,得到響應矩陣yK。跟蹤器最終會選擇響應最大的矩陣進行下一幀的訓練和再檢測,在這個過程中每一次跟蹤器都會以最大響應作為目標跟蹤的結果。傳統的DP-TBD用整條路徑值函數累積的最大值來代表航跡,而KCF-TBD 用幀與幀之間響應最大值(值函數),代替了原先值函數的累積。從不等式的角度考慮,可得下式:

假設將響應矩陣yK取到最大值時記為,為了更加量化幀與幀之間的最大相應,引入峰值旁瓣比(PSR)[17]作為評價指標,其表達式如下所示:

式中gmax是中的最大值,在最大值周圍選擇一個矩形區域作為目標的峰值窗口,跟蹤框以內、峰值窗口以外被稱為旁瓣窗口,us和σs分別是旁瓣窗口的平均值和標準差。由于KCF 在實際應用中面臨的最主要問題是跟蹤框的漂移和丟失,產生這種問題的原因來源于兩個方面:一是跟蹤框的大小本身就是設計好的,在跟蹤過程中并不會發生變化,而實際的目標可能大小會發生變化,這樣就會導致濾波器模板的更新不匹配;二是跟蹤過程中遇到遮擋干擾等情況。因此,PSR不僅可以作為航跡累積的值函數,還可以隱含地反映跟蹤模板發生的變化,從而檢驗目標跟蹤的穩定性。這也就意味著KCF 跟蹤器檢測到目標時的PSR 可以作為值函數:

這也就證明了利用PSR 作為值函數的KCF 算法本質上就是一種最佳航跡搜索的決策方法。

2.3 KCF-TBD整體結構

通過以上兩小節的推導,本文所提的非合作雙基地雷達KCF-TBD整體框架如圖2所示。

圖2 KCF-TBD框架

首先,對輸入的前兩幀雷達原始數據進行低閾值的CFAR 檢測,分別形成第一跟蹤框集合和第二跟蹤框集合。由于傳統的DP-TBD 在目標數量較多的情況下會面臨數據處理壓力較大的問題,這里借用兩階段TBD 思想篩選出潛在的目標,減少運算量。然后,將兩個跟蹤框的集合進行IOU[18]判決,篩選出新的跟蹤框集合。進行IOU 判決的目的是篩選出潛在的運動目標,進一步減少跟蹤框集合的數量并同時生成相應的跟蹤模板。接著,后續的每一幀雷達數據依次輸入,并經過PSR判決。判決時,將當前幀的PSR 值和前三幀的均值進行比較,當浮動范圍超過一定值時判決不通過。最后,判決不通過的跟蹤框將由預測修正模塊給出的新跟蹤框替代,而后訓練生成新的跟蹤器模板重新跟蹤。反之,通過PSR 判決的多個跟蹤框將形成相應的航跡。

其中預測修正模塊是為了解決跟蹤過程中面臨的跟蹤框漂移和丟失問題。Shin 提出使用多個搜索窗口進行重新跟蹤并通過運動的矢量分析來確定一個首選的搜索窗口[19]。Shi 提出利用卡爾曼濾波來提升KCF 的跟蹤穩定性[20]。這些方法對KCF 長期跟蹤的穩定性有一定的提升,但是大多都是基于模型的預測,當實際的目標運動狀態和模型并不適配的時候跟蹤預測效果就會時好時壞。隨著深度學習在越來越多的領域被使用,特別是針對時間序列預測問題,相關學者提出了長短期記憶網絡(Long Short-Term Memory, LSTM)。由于LSTM 網絡本身較為成熟,所以本文直接在其輸出接上一層典型的MLP 結構對目標的位置進行預測。網絡結構如圖3所示,訓練時選擇均方誤差(MSE)作為誤差函數,自適應矩估計(Adam)作為優化器。其中網絡的輸入特征分別為連續s幀距離-方位平面跟蹤框的位置,輸出節點為網絡模型預測后s+ 1幀跟蹤框的位置。

圖3 模型網絡結構圖

3 實驗結果及分析

3.1 非合作雙基地雷達實驗場景與數據

本文采用的數據是非合作雙基地雷達對海目標探測系統實際外場實驗得到的真實數據,實驗場景在煙臺附近海域,其示意圖如圖4所示。其中選用的非合作雷達輻射源為L波段岸基對海雷達,實驗的探測目標是進出港口的船只,探測的主要區域由接收站定向天線所指的方向決定。

圖4 實驗場景

由于本文實驗在實際采集過程中獲取連續的多幀數據成本較高、數據量較大,所以預測模型中采用的訓練航跡數據在非合作雙基地對海探測系統可以探測到的范圍內進行生成,具體參數設置如表2所示。由于本系統探測的海域是近岸港口,目標船只的機動性通常較弱,所以利用均勻分布隨機生成CA 和CT 兩種模型共計1 000 條航跡構成數據集。

表2 數據集參數設置

實際非合作雙基地對海探測系統所得的矩陣是在距離-方位平面,目標在平面中由起伏的像素點構成,每一幀雷達圖像都是由1 051×800 個像素單元組成,其中800 是距離分辨單元(每個單元25 m),1 051是方位分辨單元(每個單元0.087 5°)。

3.2 神經網絡參數設置及序列長度選擇

網絡模型的參數設置如表3所示。

表3 網絡訓練參數

當網絡以上述參數訓練,輸入序列長度s設置為7 時,MSE 經過3 500 輪的訓練,下降到0.249 1。假設整條航跡由n個點組成,即[T1,T2,…,Tn],跟蹤穩定性檢測模塊檢測到KCF 跟蹤框在第j個點發生了偏移,這時預測網絡將前s個點作為網絡的輸入序列,即通過[Tj-s,Tj-s+1,…,Tj-1]預測第Tj個點。因此,輸入序列的長度s對預測的結果有一定的影響,在神經網絡參數不變的情況下通過改變輸入序列長度s來探究其對預測誤差的影響。圖5是序列長度取4~12時,訓練MSE誤差變化曲線。

圖5 序列長度s誤差變化曲線

從圖5可以看出,訓練MSE誤差隨序列長度的增加而不斷減少,這是因為序列長度越長其軌跡所包含的歷史信息就越為豐富,網絡預測的結果也會相對準確。輸入序列的長度在4~7時,MSE隨序列長度增加下降較快,在7~9 和10~13 時趨于平緩,并在9~10 時有明顯的下降。KCF 跟蹤器在初始階段,誤差累積較少,跟蹤較為穩定,而實測的40 幀數據也表明,跟蹤框出現丟失或偏移通常在10~35 幀之間。選擇較短的序列長度雖然可以避免短時間間隔內的跟蹤框的連續丟失,但是其MSE 誤差較大。選擇較長的序列長度雖然MSE 誤差較低,但是期間可能發生兩次跟蹤框丟失間隔小于序列長度的情況,并且序列長度在10~13之間的MSE 誤差上下趨于平緩。因此,選擇序列長度為6 時能夠滿足盡可能小的跟蹤誤差和跟蹤框間隔兩個條件。

3.3 跟蹤實驗及誤差分析

非合作雙基地雷達系統中由于時間、空間同步等問題,造成方位、距離上的誤差,從而引起目標位置的漂移。PSR 不僅可以作為判別跟蹤穩定性的指標,還等效為KCF-TBD 的值函數。圖6 是第32 幀的跟蹤結果圖,圖中弱目標的跟蹤框在長時間跟蹤的過程中發生了偏移,其中未標注上跟蹤框的目標被判定為靜止目標。

圖6 第32幀的距離-方位圖

圖7 是弱目標修正前后PSR 隨幀數變化的曲線,其中藍色線表示經過修正預測前的曲線,紅色表示經過修正預測后的曲線。修正前,PSR 在第23 幀之前在一個值附近上下波動,當目標受到干擾或目標回波數據變弱后出現了明顯的下滑。雖然下滑之后PSR 在1.07 附近趨于穩定,但實際上跟蹤框已發生偏移,而KCF 跟蹤器在錯誤的模板上進行更新迭代,因此PSR 再次趨于穩定。修正模塊在PSR 低于第一個臨界點時啟動,實際實驗中弱目標在第25 幀出現跟蹤框丟失,當預測模塊修正后,PSR有明顯的上升。

圖7 弱目標修正前后PSR對比圖

通過上面的分析可以看出選擇PSR 作為值函數與傳統的幅度值函數相比隱含地反映了跟蹤模板之間的變化,通過幀與幀之間的最大響應進行航跡回溯。值得注意的是,預測修正模塊也同樣發揮了重要的作用,它通過對目標運動軌跡的預測修正來消除跟蹤中出現的漂移和丟失問題。預測修正模塊與PSR 值函數的配合作用,進一步提高了目標跟蹤的穩定性和準確性。

為了探究KCF-TBD 的實際跟蹤效果,考慮采用一組使用非合作雙基地雷達采集到的雷達實測數據。該數據采集于煙臺港附近海域,記錄時間自2022-06-18T15:22:27共計40幀雷達數據。實驗采用DP-TBD作為對照組,仿真選用雷達距離-方位平面的振幅作為值函數,離散化狀態空間后選定目標狀態的轉移狀態數q=16。圖8 為選取的兩個單目標分別采用DP-TBD和KCF-TBD的跟蹤結果。

圖8 DP-TBD和KCF-TBD的對比跟蹤結果

其中黑色表示實際AIS 航跡,紅色表示DPTBD 跟蹤結果,綠色表示KCF-TBD 跟蹤結果。從圖8 可以看出,DP-TBD 在實際跟蹤過程中受雜波影響,值函數在滿足先驗運動模型的條件下依然會朝著錯誤方向進行累積,從而產生較大誤差。而KCF-TBD 在受雜波干擾時依然有較好的穩定性,總體偏差較小。

為了更加量化地來評定KCF-TBD 和傳統DPTBD 的差別,用RMSE 作為誤差的量化指標。RMSE 代表的是預測值和真實值之間的平均距離,在本次實驗中采用AIS數據作為真實值。

式中n為目標總數和xi分別為x方向的預測值和真實值和yi分別為y方向的預測值和真實值,誤差單位為像素。

圖9 是實測數據場景中多個目標平均RMSE隨幀數變化的曲線,設定RMSE的最大誤差像素為12。DP-TBD 從第10 幀開始丟失目標,在第31 幀又恢復了跟蹤,但在第37幀又丟失了目標,整個跟蹤過程的最小誤差也在10 個像素以上。而KCFTBD 在整個跟蹤階段都有更好的RMSE。圖10 顯示的是估計位置和真實位置在誤差閾值RMSE 內的幀數占總幀數的百分比。當設置RMSE 的閾值為12像素的時候KCF-TBD在所有幀中都成功跟蹤了目標,而傳統的DP-TBD 跟蹤準確率低于60%。在運行時間上DP-TBD 處理40 幀需要21.22 s,而KCF-TBD 只需要14.23 s,處理速度提升了33%。綜合來說,KCF-TBD 利用循環矩陣對角化的性質快速提取特征,相較于DP-TBD,能夠顯著提高計算速度。這使得KCF-TBD 在需實時跟蹤多個目標的場景下能夠更好地適應。其次,PSR作為值函數反映了幀與幀之間的最大響應和跟蹤的穩定性,當其和修正預測模塊結合時,相比于DP-TBD 能夠實現更加穩定和準確的跟蹤。圖11是非合作雙基地對海目標探測場景下,采用本文方法時的跟蹤軌跡。

圖9 多目標RMSE變化曲線

圖10 定位精度隨RMSE臨界值變化曲線

圖11 多目標跟蹤預測KCF-TBD結果

4 結束語

針對非合作雙基地雷達目標信噪比較低、幀與幀之間探測不完全等問題,傳統先檢測后跟蹤方法難以實現目標的穩定跟蹤。因此,本文利用DP-TBD 路徑搜索和值函數累積的思想,結合計算機視覺中的KCF,將峰值旁瓣比(PSR)作為累積的值函數和跟蹤穩定性的判別標準,并用深度學習的方法對跟蹤過程產生的漂移和丟失進行修正。本文所提方法和DP-TBD 相比,具有更快的計算速度和更小的跟蹤誤差。其中,PSR作為值函數等效于KCF 幀與幀之間響應的最大值,側面反映了目標的結構特性,有效避免DP-TBD 容易受雜波影響,產生錯誤累積的問題;同時KCF 利用循環矩陣進行搜索可以減少對先驗運動模型的依賴,使跟蹤的適應性更強。

猜你喜歡
航跡雷達基地
有雷達
流翔高鈣為黨建示范基地錦上添花
夢的航跡
雷達
我的基地我的連
自適應引導長度的無人機航跡跟蹤方法
視覺導航下基于H2/H∞的航跡跟蹤
基于空時二維隨機輻射場的彈載雷達前視成像
現代“千里眼”——雷達
基于航跡差和航向差的航跡自動控制算法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合