?

低軌衛星多目標無源定位到達時差分選方法*

2023-10-07 03:45歐陽鑫信
電子技術應用 2023年9期
關鍵詞:聚類網格密度

徐 鵬,雷 同,熊 煉,歐陽鑫信

(1.重慶郵電大學 通信與信息工程學院,重慶 400065;2.重慶郵電大學移動通信重點實驗室,重慶 400065;3.電子科技大學 信息與通信工程學院,四川 成都 611731)

0 引言

無源定位是指通過觀測站探測目標輻射源自身發出的電磁波或散射的非協作信號,然后通過估計待測目標的定位參數并求解其定位方程,最終得到目標的運動狀態及位置信息。同時由于觀測站不向外輻射信號,因此無源定位具備探測距離遠、隱蔽性強、反隱身能力強、生存力高等優勢,在現代信息化戰場中能有效提高定位系統的生存能力[1-3]。

無源定位系統可以分為單站無源定位系統和多站無源定位系統兩大類,其中單站定位系統通過單個觀測平臺持續觀測目標輻射源,逐漸積累定位信息,最終獲取目標位置信息,盡管其具有設備簡單、使用靈活的特點,但難以勝任戰場中的復雜電磁環境、實時定位的要求[4]。多站定位系統有雙觀測站定位、三觀測站定位等,其中較為常用的雙觀測站無源定位系統由兩顆相距較近且時鐘同步的低地球軌道(Low Earth Orbit,LEO)衛星、地面雷達接收站、定位數據處理中心等基本設施組成。該系統主要通過利用LEO 衛星的運行特性,即運行速度較快,可在一段時間范圍內觀測大量定位參數,如到達頻差、信號到達時差(Time Difference Of Arrival,TDOA)、接收信號強度、到達角度等參數,以確定輻射源及其載體平臺位置[5]。故相較于單站無源定位系統,多站無源定位系統具有定位時間短、定位精度高的優點[6-7]。

在LEO 衛星無源定位系統中,主要利用待定位目標的定位參數,通過求解相應的位置定位方程,得到目標的具體位置信息,最終實現目標定位跟蹤。但若存在多個待定位目標且數量未知時,不同目標的定位參數混合,需首先對獲取的觀測數據集進行定位參數分選,才能針對性獲取某個目標的準確位置信息,其中較為常用的方式為多站時差參數分選。

通過利用到達衛星的雷達輻射信號存在時差信息這一特征進行分選,在較短的時間范圍內衛星與輻射源的相對位置變化較小,因此其時差信息穩定,故利用時差信息作為定位參數進行分選的可靠性較高,可得到較為準確的目標位置信息[8]。

針對定位參數分選問題,學者們的現有研究提出了不同的方法和理論,并取得了一系列顯著成果[9-17]。文獻[18]提出了一種基于遞歸拓展直方圖的時差分選方法,該方法主要解決不同重頻形式雷達信號在直方圖中所對應的時差信息分布情況,但不足在于直方圖噪聲影響較大,容易造成后續分選出現漏分以及漏警的情況。文獻[19]提出了一種基于數據場聚類與時差結合的信號分選方法,其主要解決了多站時差分選方法中由于存在失配信號導致的高漏警率問題,在時差分選的基礎上通過K-means 聚類算法處理失配信號集合,但該方法無法有效降低虛警率和噪聲的影響,且該方法僅適用于凸狀簇數據。文獻[20]采用迭代和貪婪策略優化代價函數更新聚類簇中心,克服了K-means 算法對具有離群值的數據集聚類效果差的問題,但其在參數量較大時聚類效果欠佳。文獻[21]將數據集中的每個對象視為單個類,并計算類間的最小距離;合并類之間距離最小的類;然后,更新數據集并重新計算類間的距離;不斷迭代,直至最后只剩一個類。該算法解決了部分K-means 不能解決的非凸簇問題,但其時間復雜度較高,同時難以處理不同大小和不同形狀的簇,且該算法需要用戶定義簇數目作為最終聚類結果,難以勝任定位目標數未知的場景。文獻[22]通過數據集密度閾值來控制簇的擴張。通過將密度足夠高的區域劃為簇,且具有較低的噪聲敏感性,能夠在空間數據庫中發現任意形狀的聚類結果,但該類方法需處理每個數據對象,其運算效率較低,難以勝任大數據集。

綜上所述,上述定位參數分選方法均是在一定范圍內適用,局限性明顯、優缺點并存,能相應地解決具有某些特征的數據聚類分選問題。

為有效解決LEO 衛星多目標無源定位場景中的定位參數分選問題,本文基于網格和密度聚類方法的基本原理,并充分考慮定位場景中的數據集特征,同時引入網格密度波谷概念和位置相連原則解決目標間數據錯誤聚類問題,構建多目標TDOA 參數聚類分選模型實現定位參數分選,最終通過LEO 衛星定位場景下的多目標TDOA 數據檢驗本文方法的聚類效果。

1 衛星定位場景介紹

1.1 LEO 衛星定位原理

本文所考慮的定位場景主要由LEO 衛星、目標輻射源、數據處理中心等組成,如圖1 所示。

圖1 LEO 衛星定位示意圖

其中衛星同軌運行,均處于目標信號輻射范圍內,由于信號距衛星的路徑和徑向速度不同,當目標輻射源向外發送信號時,衛星間會先后接收到輻射源發送的信號,并將其傳輸給數據處理中心做進一步處理,根據式(1)可獲取TDOA 定位參數。

式中,c為光速;r1、r2分別為衛星的位置矢量;r為目標輻射源的位置矢量。

同時鑒于LEO 衛星移動速度較快,平均速度可達7 km/s,而待測目標速度一般為地表靜止或慢速運動目標,其速度相比衛星速度可以忽略,因此在一段時間范圍內,通過觀測多個目標輻射源可獲取大量TDOA 參數,并對其做聚類分選處理,最終通過相應的定位方程解算,便可得到各個目標的準確位置信息[23]。

1.2 TDOA 定位參數特征

為充分利用定位場景中目標輻射源的TDOA 數據集特征,并以此為基礎針對性設計聚類方案,本小節首先對數據集做TDOA 參數建模處理,具體步驟如下。

(1)根據LEO 衛星獲取的TDOA 定位參數,其中包含目標的觀測時間序列以及相應的TDOA 序列;在離散時間索引為k時,設xk表示第k個觀測參數的相對時間點,設yk表示相應的到達時差值;

(2)在二維平面上,以xk為橫坐標,yk為縱坐標,繪制時間軸與到達時差軸組成的平面圖,如圖2 所示。后續將利用該數據集做進一步分析。

圖2 待分選定位參數數據圖

根據上述步驟,本文通過多次仿真實驗對比與分析,提取實際衛星定位場景下的多目標TDOA 定位參數的基本數據集特征,主要特征總結如下:

特征1:平面上單個目標對應一條曲線。較短觀測時間范圍內,目標曲線呈現近似線性變化特征,隨著觀測時間變長,線性特征逐漸消失,呈現相對復雜的非線性變化特征。

特征2:數據集密度不同,各目標所含數據量存在差異。

特征3:曲線間的相對關系上,在觀測時間范圍內,可能出現平行、距離近等情況。

特征4:同一時間段內,不同曲線在TDOA 幅度上呈現分離狀態,兩條相鄰曲線被明顯的空白或稀疏區域拆分,空白或稀疏區域面積越大越能區分不同曲線邊界。

2 網格密度聚類

基于網格密度的聚類算法(Clustering Algorithm Based on Grid Density,CAGD)不僅具有密度聚類算法的特點,即能發現任意形狀的簇,而且具有網格聚類算法運行效率高的特點。且該算法對數據集中存在的噪聲數據敏感性低,具有較強的抗噪聲能力[24];同時,網格密度聚類算法具有較強的可擴展性,在數據集規模較大的情況下,其聚類質量仍能得到保障。

2.1 CAGD 算法流程

網格與密度聚類算法的結合,其主要算法思想是借鑒其各自聚類算法的優點,即通過劃分數據集空間,形成網格框架,并將數據對象映射入網格單元內尋找稠密網格單元間的相鄰網格,最終獲取數據集中一個類簇。CAGD 算法具體流程如下:

(1)由分割參數劃分數據集D的數據空間,得到網格單元集合G={g1,g2,g3,???,gn}。

(2)將數據集D中的所有數據對象xi映射到其對應的網格單元中。

(3)根據密度閾值參數,確定稠密網格單元和稀疏網格單元。

(4)在網格單元集合G中隨機選擇稠密網格,以稠密網格單元為聚類起點,查找此網格單元的最大連通區域qi,并從集合G中剔除找到的稠密連通單元格。

(5)以網格單元集合G內是否存在稠密網格單元為依據,若存在稠密網格,則需重復執行步驟(4),最終得到稠密網格單元的最大連通區域集合Q={q1,q2,q3,???,qn}。

(6)輸出最大連通區域集合Q,其中每一個qi中的數據即是一個類簇。

2.2 CAGD 算法應用

網格密度聚類算法在雷達信號分選、軌跡數據聚類[25]、流式數據聚類等場景均有應用,且在這些應用場景中其聚類質量較好,主要在于網格密度聚類算法相較于其他傳統聚類算法有著諸多優點,比如能找到任意形狀的簇且運行效率高,抗噪能力強等。但不同的應用場景,其數據集特征不同,因此所使用的網格密度聚類算法也有所差異,一般都是基于網格密度聚類的核心思想設計聚類分選方法,如在雷達信號分選場景,針對多密度雷達信號問題,設計了一種基于動態網格多密度聚類算法[26],在流式數據聚類場景中,同樣根據流式數據集的特征,采用基于網格密度的改進流式聚類算法[27]。因此,需根據不同的應用場景,基于網格密度聚類算法的核心思想,結合場景中的數據集特征,有針對性地設計聚類方案,才能有效解決本文中TDOA 定位參數的分選問題。

3 多目標TDOA 定位參數分選方法

本文根據場景中TDOA 數據集特征,借鑒網格密度聚類方法的核心思想,并以此為基礎進一步提出密度波谷概念及位置相連原則,構建定位參數分選模型,最終解決定位參數的聚類分選問題。

首先,以網格劃分數據集,對單位時間上的網格單元,基于網格密度聚類思想進行初步類簇分選,并以網格密度波谷位置對相應類簇做進一步拆分;然后根據位置相連原則,對不同單位時間的簇進行簇間合并,最終根據各類簇中的密度閾值及擬合參數確定TDOA 參數聚類結果。模型框架圖如圖3 所示。

圖3 多目標TDOA 參數分選模型框架圖

3.1 網格劃分

傳統密度聚類主要依據數據點對象鄰近區域的密度是否超過閾值,判斷是否將其作為核心點并將該點分到與之相近的類中。該方法克服了基于劃分聚類算法在非凸簇數據集的不足,可應用于在帶有噪聲的數據集中發現任意形狀的簇。但不足在于,基于密度的聚類算法需要處理數據空間中的每個數據點,其運行效率在數據量較多的情況下表現不佳。而網格聚類,通過引入網格單元結構,將需要處理的數據點映射入網格中,只需對網格單元做進一步處理,這在很大定程度上提高了運行效率。

因此,鑒于本文場景TDOA 參數量達到萬級,首先劃分網格框架,而將數據空間劃分為網格的主要目的是將數據集離散化,以較少的網格單元代替較多的原始數據對象,并對網格單元做進一步處理而不是獨立數據點。

本文數據空間的劃分采用網格劃分方法,其中劃分線(面)垂直于坐標軸,每個網格單元的大小一致,即均勻網格劃分的形式。同時,在劃分數據空間的過程中,網格步長參數ε及密度閾值Minpts 的設置極為重要。即,較大的ε可能會把不同類的數據聚為一類;反之,較小的ε會造成同類數據被聚為不同類,這都影響了聚類的精度,同時也增加了算法的難度,一般根據實際聚類情況合理調整參數。而密度閾值的設定,主要采取的方法為計算網格單元中網格密度的平均值,即Minpts 的值為:

式中,N為網格單元數量,Deni為網格單元密度。

3.2 單位時間參數分選

在網格框架下,將數據集中的每個對象映射到網格單元內,再根據定位參數特征4,可探測同一單位時間內不同曲線之間的空白或稀疏網格,得以初步界定不同曲線的邊界,并基于網格密度聚類基本原理,根據相鄰稠密網格單元,生成初步分選簇,如圖4 所示。

圖4 初步分選簇聚類結果

如圖4 所示,在7~8 s 時間范圍內根據空白網格位置及各稠密網格單元將數據劃分為分選簇1 和分選簇2。同時,根據定位場景中TDOA 定位參數特征1、特征3 可知,存在某一分選簇內包含多個目標數據的情況。本文通過利用目標TDOA 參數的線性變化特征,即在同一分選簇內若其數據未能擬合成一條誤差較小的曲線,判斷該簇包含多個目標數據,為保證聚類質量,則需對該類簇做進一步拆分處理,具體步驟如下。

(1)獲取單位時間內簇C中包含的網格單元數量N;

(2)若N≥3,則進一步計算該簇數據的均方根誤差:

式中,h(?)為該簇數據經最小二乘法所生成的擬合函數,表示該時間點處擬合到達時差與實際到達時差的歐氏距離,xi為該簇內某一數據點的時間值,yi為其對應的到達時差值,m為數據總量;

(3)若均方根誤差低于誤差閾值,則不對該簇拆分,反之需對其做進一步拆分處理。

其中誤差閾值可由式(4)計算所得:

式中,xmax代表該簇數據的最大時間值,xmin為最小時間值,β為該簇數據生成擬合函數的一階系數,α為誤差因子。

針對誤差大于所設閾值的分選簇,引入密度波谷概念,即目標間數據可由密度較低的網格單元區分,并作為該簇的密度波谷,故可通過此網格單元位置對該簇做進一步拆分處理,具體拆分步驟如下。

(1)統計該簇內各網格單位密度Deni;

(2)獲取密度波谷位置,即該網格單元編號i,并在該波谷位置對該簇做進一步拆分處理,最終在該單位時間內生成新的分選簇,如圖5 所示。

圖5 密度波谷拆分結果圖

3.3 目標數據簇間合并

考慮到在多目標LEO 衛星無源定位場景中,數據集分布存在明顯的線性變化特征,且各目標間數據有距離近、互相平行等情況,僅采用網格密度聚類算法,難以有效區分不同目標間數據,容易將不同目標數據聚為一個類簇,造成聚類質量較差的情況,如圖6 所示。

圖6 多簇位置相連

其中,如分選簇2 與分選簇5 和分選簇6 均存在相鄰網格,分選簇3 與分選簇4 及分選簇5 同樣均存在相鄰網格,即簇2 與簇5、簇6 位置相連,簇3 與簇4、簇5 位置相連。若僅采用傳統網格與密度聚類算法,會將其合并為同一個簇,并不符合定位場景中的參數分選需求,故本文引入位置相連原則,即結合競爭思想,充分利用TDOA 數據集特征,進一步計算分選簇各自對應的線性擬合參數,然后選擇雙方最為匹配的簇進行簇間合并,以此構建最大連通域,如圖7 所示。

圖7 部分簇間合并結果圖

根據上述思想并結合3.2 小節獲取的初步分選結果,可得到TDOA 參數的最終分選結果,具體步驟如下所示。

(1)將第一秒內的初步分選結果存入簇集合Cluster,并設置J=2;

(2)將第J秒內所有分選簇與Cluster 中的各簇根據位置相連原則進行簇間合并;

(3)第J秒處理完畢后,令J=J+1,重復執行步驟(2),直至J為最大觀測時間;

(4)搜索剩余未連接數據點,與已有簇的擬合曲線進行匹配,誤差小于門限的并入對應的簇中;

(5)在簇集合Cluster 中,根據各簇的密度閾值,判斷達到要求的簇作為最終聚類結果。

4 實驗仿真

本文實驗所采用的計算機硬件配置為Intel Core i5處理器(主頻2.4 GHz)、16 GB 內存;實驗的軟件環境為Windows 10 操作系統,采用MATLAB 編程實現。

4.1 仿真環境及參數設置

為驗證本文所構建模型的可行性和有效性,本實驗選取三組數據集進行測試。數據集均為模擬實際LEO衛星定位場景下獲取的多目標輻射源信號的TDOA 參數。其中Data1、Data2 數據集中衛星高度均為500 km,Data3 衛星高度為750 km,各目標分布范圍為東經112°~120°、北緯10°~22°,并根據不同LEO 衛星觀測速率及精度生成TDOA 數據。為模擬噪聲環境,均加入5 %以數據集總量為基礎的干擾數據,其數值為在整體數據范圍內生成的均勻隨機數。同時,經過多次實驗證明分選模型中網格步長參數ε=1、密度閾值Minpts=3、誤差因子α=7 時聚類效果最佳。

4.2 聚類結果對比

鑒于數據集為非凸的,因此并不適用基于劃分或層次的聚類算法,故本文的對比算法主要采用網格與密度聚類算法,即DBSCAN 算法、CLIQUE 算法。且通過兩種常用的外部聚類評估指標對其聚類質量進行評價:純度、F 值,2 種指標的取值范圍均為[0,1],取值越大表示聚類結果和真實情況越吻合。

其中純度的定義如下:

其中,N表示總的樣本數;Ω={ω1,ω2,???,ωK}表示一個個聚類后的簇,而C={c1,c2,???,cJ}表示正確的類別;ωk表示聚類后第k個簇中的所有樣本,cj表示第j個類別中真實的樣本。

F 值的定義如下:

其中,p表示聚類準確率,r表示聚類召回率,β一般取值為1。

各數據集的詳細信息及實驗對照結果如表1 所示。

表1 聚類效果對比

為了更加直觀地對比本文方法和DBSCAN 算法、CLIQUE 算法的聚類質量,給出各方法的聚類結果圖,如圖8 所示。

圖8 聚類結果對比

從圖8 可以看出,本文方法在該定位場景下的TDOA 參數分選均優于對比聚類方法。在數據集Data1中,通過利用數據集的線性變化特征并結合位置相連原則,能有效實現定位參數分選。數據集Data2 和Data3中,部分目標數據相距較近,容易存在將不同目標數據聚為一類的情形,故利用目標間數據的密度差異,結合密度波谷位置對簇做進一步拆分處理,使得聚類效果更佳。

圖9、圖10 為本文方法與DBSCAN 及CLIQUE 方法的純度和F 值對比圖。

圖10 聚類F 值對比

通過表1、圖9 和圖10 可以得出,本文方法與DBSCAN 算法均優于CLIQUE 算法,同時通過圖9 可以看出,本文方法與DBSCAN 算法的聚類純度在數據集Data1 與Data2 內數值接近,其主要原因在于純度的總體計算思想主要為通過聚類正確的最大樣本數除以總的樣本數,因此,通過適當調整DBSCAN 算法的輸入參數便能最大程度分選出目標數據,即有著較高的純度,而F 值則是綜合考慮準確率和召回率,更具代表性。

為進一步驗證本文模型在實際定位場景中的聚類效果,本文利用實際衛星定位數據做對比實驗,該數據來源為合作研究所提供,原始數據如圖11 所示。

圖11 實際定位數據圖

鑒于實際定位場景中,目標數未知且不存在真實數據標簽,因此聚類評估采用內部評價指標,即本文采用輪廓系數驗證聚類質量,其定義如下所示:

其中,a(i) 表示目標數據i與同簇之間其他目標的平均距離,b(i) 表示目標數據i與不同簇之間的平均距離,S(i) 的取值范圍為[-1,1],該值越大表明目標與自己所在簇之間的匹配關系度越高,與其他簇的匹配關系度越低。

針對該實際數據,聚類結果如圖12 所示。

圖12 輪廓系數結果圖

從圖12 可以看出,本文方法在實際衛星定位場景中的聚類質量均明顯優于對比算法,具備一定的實際應用價值。

5 結論

針對LEO 衛星無源定位系統下目標數量多、定位參數混雜,難以通過現有單一聚類算法對其進行有效分選問題,本文結合網格與密度聚類的基本原理,確定簇的初始輪廓,并根據目標數據集特征,有選擇性地在密度波谷位置進一步拆分簇,從而解決不同目標數據被劃分為同一簇的問題。最終,針對多簇網格單元相鄰,通過位置相連原則合并屬于同一目標的簇,構建最大連通域得到最終定位參數分選結果。仿真實驗結果表明,本文方法在測試數據集中的聚類純度及F 值均能達到90 %以上,明顯優于對比聚類算法在該定位場景下的應用,很大程度上解決了LEO 衛星無源定位中多目標的TDOA 參數聚類分選問題,為實現進一步的目標定位跟蹤提供了有力保障。

猜你喜歡
聚類網格密度
用全等三角形破解網格題
『密度』知識鞏固
密度在身邊 應用隨處見
反射的橢圓隨機偏微分方程的網格逼近
“玩轉”密度
密度應用知多少
基于DBSACN聚類算法的XML文檔聚類
重疊網格裝配中的一種改進ADT搜索方法
基于高斯混合聚類的陣列干涉SAR三維成像
基于曲面展開的自由曲面網格劃分
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合