?

基于LSTM的輻射源個體識別技術分析

2022-11-25 03:34張文君張正位
艦船電子對抗 2022年5期
關鍵詞:輻射源時序特征提取

張文君,張正位

(1.中國船舶集團有限公司第八研究院,江蘇 揚州 225101;2.蘇州中材建設有限公司,江蘇 蘇州 215300)

0 引 言

隨著科學技術的飛速發展,現代戰爭已經從冷熱兵器時代跨入了信息化時代,戰爭的形態也就由現實可見的自然空間拓展到了不可被直接感知的電磁網絡空間。因此,在電磁網絡空間的戰爭中,電子偵察一直是研究的重點,它一方面是為了獲取更多更全面的信息,另一方面是為了能從獲得的信息中分析出敵方的威脅程度。而這其中涉及到的輻射源的個體識別問題,成為了研究者們的重點研究對象[1-3]。所以,如何從復雜的數據中獲取并識別出準確的信息是最終目標,也是目前該領域亟待解決的難題。

輻射源個體識別在電子對抗領域起著非常重要的作用,也是雷達偵察系統的重要組成部分。其數據的獲取主要是針對特定頻段的某一段特定信號進行采集,而采集到的數據也只是目標的一部分,并不能完全反映目標的特性,所以采用單一技術手段對其進行分析是不全面的。

傳統的輻射源個體識別是將采集到的信息與己方已有的輻射源個體進行匹配的技術。即首先必須有一個特征庫,當采集到信息之后,經過處理,與已有的特征庫進行比較、匹配,判斷其屬于哪一個輻射源個體,并盡可能判斷其屬于哪一類設備,分析該設備所具有的特點、功能、威脅程度等參數。但隨著雷達技術的迅猛發展,電磁空間環境越來越復雜,新功能的雷達以及多類型的雷達信號樣式也越來越豐富,各雷達設備的信號源個體調制方式也更加靈活,參數變化多樣,其發射的信號各有特點,對于某一類同種設備其本身之間所發出的信號也有差異,同時這些多樣的信號充斥在周圍空間中,形成了數量巨大的混合信號,也就增加了信號采集和個體識別的難度。所以,構建一種可以從復雜環境中準確識別輻射源個體的模型是現階段非常重要的任務。本文將從雷達輻射源個體識別的特征參數提取和雷達輻射源的個體識別分類進行分析討論,并針對目前所擁有的技術缺點進行補充改進,提高雷達輻射源個體識別效率。

1 輻射源特征參數提取

傳統的輻射源識別是提前對不同信號進行收集分類,形成一個完整的標準庫。在實際應用中,對于采集的信息先進行預處理,將其通過時頻變化,提取人為設定的一些特征與標準庫進行對比匹配,則可以判斷其屬于哪一類型的輻射源,流程如圖1所示。其中一個主要的環節是特征提取,與生物學中的指紋相似,因此也可稱為指紋特征。而一般輻射源特征提取的都是信號物理層特征,又稱為物理層識別[4]。在提取過程中,選擇哪種特征來區分不同個體是非常重要的,傳統上主要是通過提取暫態特征和穩態特征進行工作。

圖1 傳統輻射源識別流程

1.1 輻射源指紋特征分類

穩態特征一般容易獲取并且穩定,實用性較強。它是指系統在穩定的工作狀態下,信號自身所攜帶的特征。通常這類特征提取方法有:基于頻率源的特征提取[5];基于噪聲的特征提取[6];基于調制參數的特征提取[7];基于雜散特性的提取[8]等。在這些已成熟的方法中,基于雜散特征提取的方法性能較其他方法的性能更好,更具有普適性。針對雜散識別一般會用到高階統計量、譜相關和小波變換等方法,但是在具體應用中,一般都是盡可能多地提取特征,目的是更好、更精準地識別出個體類別??偟膩碚f,一般提取的指紋特征可以總結為以下3類[9]:信號統計參數、信號變換域、輻射源非線性的特征,其具體特征如圖2所示。

圖2 輻射源特征提取分類

暫態特征是指系統在工作中非穩定狀態下的非線性特征,因其出現的條件不穩定,持續時間短,因此,對于完整信號的獲取比較困難,外部噪聲干擾、環境等因素也會導致提取特征出錯,所以在工程領域利用暫態特征來進行個體識別的要求較高,很多研究者會放棄對該方向的研究。

1.2 輻射源特征提取方法

在上述輻射源特征提取分類中采用的特征提取方法,其大概可以總結為兩大類:一類是傳統的基于確定特性的統計特性的特征提取方法;一類是基于目前機器學習和深度學習等技術為主的自動特征提取方法。

基于統計特性的提取方法主要是人為標注所需要的具體特征,然后采用不同算法對其進行處理來獲得。常用的性能較好的算法有基于信號的高階譜、雙譜、小波包分解等變換域方法。比如高階統計量中的雙譜,其能夠在信號處理中消除高斯白噪聲對源信號的影響,同時能夠對輻射源個體的細微特征進行有效表征,但它也會造成數據的“維數災難”,因此需要對其進行降維處理。常用的降維方法有:軸向積分雙譜法[10-11](AIB)、主成份分析[11](PCA)、矩形積分雙譜[12](SIB)和選擇雙譜[13]等,每種降維方法都有著各自的優缺點,在實際應用中,一般會根據實際需求來選擇最適合的降維方法。

基于統計特性提取特征方法的缺點是部分算法需要提前知道信號的先驗概率,單一特征的使用不能反應整個輻射源個體的信息,某些特征在實際應用中會受到外界環境或者其他噪聲的影響,對于相似度非常高的輻射源個體可能會提取不到其異常特征,或某些算法只是針對某一個或者部分特征,不具有普適性,也不適用于如今復雜環境中的多輻射源個體識別,也就導致不能準確地識別出輻射源個體。所以為了解決這些問題,研究者們逐漸采用機器學習和深度學習技術來解決輻射源個體識別問題,并取得了一定的成績。

隨著機器學習技術的發展,很多研究者將其應用在輻射源個體識別中[14],可以提高工作效率,并在處理非線性數據上有一定的優勢。傳統的機器學習有決策樹、k近鄰法(KNN)、支持向量機(SVM)等等。如對于線性問題,采用SVM算法可以構建1個超平面對數據進行劃分,若遇到非線性問題,則可以采用核函數將數據映射到高維空間再進行分類識別。在此基礎上,將傳統的特征提取與機器學習相結合,如通過小波變換提取特征與SVM相結合來實現輻射源的個體識別[15],其結果表明在有噪聲的環境中模型間差異較小的情況下,通過SVM計算類間分離度,選出最優的小波組構成特征向量,獲得了較優的效果。

機器學習一般也是配合常用的特征提取技術使用,未曾真正做到自動特征的提??;而深度學習則是完全可以根據其源數據自動提取特征,不需要人為的標注特征,正是因為其方便性和處理結果的高識別率,所以在各領域倍受歡迎,如圖像識別[16]、語音識別[17]和機器翻譯[18]等領域均有重大突破?,F如今也有研究者將深度學習應用于輻射源個體識別,通過其自動提取輻射源的特征來構建相應的模型進行個體識別。如文獻[19]采用了深度置信網絡(DBN)訓練個體識別模型,然后對載頻特征、調制參數以及互調干擾特征進行了分類識別,驗證了模型的可行性;如采用卷積神經網絡[20](CNN)自動提取特征,通過反向傳播修正網絡模型的參數,實現對信號特征的智能化提取。

所以,基于機器學習的輻射源個體識別方法又可以總結為以下幾類[21]:基于傳統機器學習的輻射源識別方法,包括決策樹、SVM等;基于神經網絡的輻射源識別方法,主要包括有BP神經網絡、RBF神經網絡和向量神經網絡等;基于集成學習的輻射源識別方法,包括基于并行方式的Bagging方法和基于串行方式的Boosting方法;基于深度學習的輻射源識別方法,主要有CNN、DBN、稀疏自動編碼(SAE)[22]和長短時記憶(LSTM)等[23]方法。應用深度學習技術來進行輻射源個體識別是一種趨勢,可以解放勞動力,并能實現個體細微特征的提取,容易在個體識別上獲得比傳統方法更優的結果,同時其訓練好的識別模型可以適用于其他設備,具有良好的普適性。

2 基于LSTM的輻射源個體識別

基于傳統的輻射源個體識別技術主要分為2個步驟:一個是特征提取;一個是針對提取的特征進行識別分類。但是這種方法未能考慮到輻射源數據的時序性,其數據在產生過程中具有時序性,因此在被采集的過程中也具有時序性。正是考慮到數據的時序特性,所以當其被分段研究時,數據間的時序特性就會被破壞,導致個體識別時缺少了部分特征,丟失了數據之間的關聯特性,降低了個體識別的準確率。因此分階段討論的方法已經很難準確解決現階段復雜環境中的輻射源個體識別問題,需要找尋一種可以從整體上解決該問題并具有普適性和高準確率的方法。

在近些年的研究中,深度學習技術逐漸應用到該領域,如最基本的深度置信網絡和卷積神經網絡都在該領域有所應用,并取得了不錯的成績。這些深度學習模型的使用采取了自動提取特征并進行識別分類的方法,同時考慮到數據的時序性,決定采用處理時序性問題較好的模型循環神經網絡(RNN)和長短時記憶(LSTM)神經網絡[24-26],在序列預測和標記任務中已經證實了該方法的優勢。RNN是一種輸入為序列數據的結構模型,并且其所有的節點單元都是按照鏈式連接的一種遞歸神經網絡,該模型具有記憶功能,并可以共享參數,能非常高效地對非線性時序特征進行學習,這可以很好地處理具有時序關系的問題。但因為RNN是基于BP神經網絡的,所以在每次反饋時都有信息損失,當反饋時間過長,損失信息達到一定量時,初始狀態的信息就會退化,出現梯度消失[27],因此有了LSTM模型,其可以解決RNN出現的梯度消失問題。

2.1 LSTM算法

LSTM使用了特殊的神經元來保存并傳遞長時間的信息,主要是在RNN的基礎上加入了“門單元(gate)”,來控制特征信息的流通或阻隔。比如在t時刻需要判斷1條雷達信息的所屬類型,這時剛好t-n時刻有1個與之對應的特性,此時就可以將該t-n時刻的符號特征傳遞過來,做出有效判斷。整個LSTM由一系列的LSTM單元構成,有4個神經網絡層,其以一種非常特殊的方式進行交互,鏈式結構如圖3所示。

圖3 LSTM結構圖

圖3中,ft叫做遺忘門,表示1條雷達目標信號序列中上一個狀態Ct-1的哪些特征被用來計算當前的狀態Ct。其中ft是一個向量,向量的每一個元素都位于[0,1]之間:

ft=σ(Wf·[ht-1,xt]+bf)

(1)

it=σ(Wi·[ht-1,xt]+bi)

(2)

(3)

該候選值向量會被加入到當前狀態中,it決定候選值向量的更新,ft確定需要保留或丟棄的信息,得到最終信息:

(4)

最后,輸出門決定了最終輸出的是哪些信息:

Ot=σ(W0·[ht-1,xt]+b0)

(5)

將通過的數據輸入到tanh層中進行處理,輸出一個[-1,1]的數值,并將其與輸出門進行點乘,得到隱節點的輸出ht:

ht=Ot·tanh(Ct)

(6)

當訓練好LSTM時,發現門的值絕大多數都非常接近于0和1,其中?是LSTM重要的門機制,表示ft和Ct-1之間的單位乘的關系。通常會采用sigmoid函數作為激活函數,它的輸出是一個介于[0,1]之間的值,但是也可以采用其他的激活函數如relu,softmax等,不同的激活函數輸出范圍不同。

信號處理和特征提取可分為時域、頻域、聯合時頻域等其他脈內信息。因此,從以上這些維度或其他維度中盡可能獲取信號本身的特征,可以更深地挖掘到信號之間的內在信息,使得輻射源的個體識別更加精準。

由于輻射源數據的采集過程和數據本身之間都是具有時序關系的,所以在對部分數據進行分析時需要考慮其數據前后的關聯關系。因此,采集數據必須要盡量完整,其次對采集完的數據進行預處理,包括清洗、補充、歸一化等等,基于LSTM的輻射源個體識別的算法流程如圖4所示。

圖4 基于LSTM的輻射源個體識別算法流圖

2.2 基于LSTM的輻射源個體識別模型

該網絡模型由輸入層、隱藏層和輸出層三部分組成。首先是將采集到并預處理好的雷達目標數據進行特征提取構建行為鏈,用N元組(X,T,A,W,F,…,C,O)來描述和分析不同屬性特征之間的關系,元組中的每個屬性元素就是1個行為,所有的行為構成1條行為鏈。其中X表示某一條特定的信號,T表示脈沖到達的時間集合,A表示目標信號到達角度的集合,W表示脈沖寬度的集合,F表示目標載頻信息的集合,C設定為該目標信號可能產生的結果集合,O是與該信號相關的屬性的集合,等??梢垣@得但不限于如下的特征:脈沖到達時間(TOA)、脈沖幅度(PA)、脈沖寬度(PW)、載頻(RF)、到達角(DOA)、脈沖重復周期(PRI)、天線掃描周期(ASP)、最大強度值數量(NI)、3 dB峰值數量(NP)、角度對應最大幅度(AMM)、中值濾波瞬時頻率分布的標準偏差(WMF)、最大譜變化(MSV)等。將構建好的每一條行為鏈按時間順序輸入到LSTM網絡中的輸入層,然后到隱藏層經過多個單元LSTM結構對其進行特征提取,提取到的信息不斷向后流動,經過多個隱藏層的特征提取最后到達輸出層,輸出層根據內部關聯將其分類得到最后的識別個體。在整個訓練過程中,不斷通過學習更新每個單元的參數,使其在下一個階段得到的數據更為準確,最后當到達輸出層時可以得到最好的分類結果。

這種LSTM深度學習結構模型具有很強的學習泛化能力和預測能力,所以在實際應用中檢測輻射源個體時,可以根據部分數據推斷出所屬類型,即使遇到未在訓練過程中出現的數據,也能根據訓練好的模型給出較為合理的結果,所以也具有良好的普適性。

3 試驗及分析

實驗數據集采用仿真數據,總共8組,仿真總時間為1 s,其具體參數如表1所示,包含頻率、脈沖重復間隔、幅度、脈寬、方位和俯仰等特征的具體參數值以及每一類別數據仿真得到的數據量,仿真得到共31 331條數據,其中每組數據的數量分布如圖5所示。同時選取了前350條數據對7個類型參數分別可視化,如圖6所示。

表1 仿真參數設置

圖5 8組數據的數量分布圖

將31 331條數據按照6∶4的比例進行劃分,將其中18 798條數據作為訓練集進行模型訓練,12 533條數據作為測試集來測試模型的準確度。

圖6 仿真參數可視化

圖7 損失函數變化趨勢圖

仿真采用了3層神經網絡模型,第1層為輸入層,輸入維度為7,第2層為隱藏層,包含100個神經單元,輸出層為包含8個分類的全連接層,由于是8批目標,所以采用了softmax作為激活函數,損失函數采用了分類交叉熵categorical_crossentropy,訓練次數設置為15次。

模型在訓練過程中,從損失函數的變化趨勢來看,如圖7所示。隨著訓練次數的增加,模型在訓練集中的損失越來越小,而在測試集中,損失從一開始較大逐漸減小后又逐漸增大并趨于平穩,這說明了模型的過擬合。同樣在準確率的變化圖中可以看出,如圖8所示,隨著模型訓練次數的增加,訓練集中的準確率隨之增大,并逐漸趨于平穩,而測試集的準確率隨著訓練周期的增加,從最開始的較小逐漸變大后又變小并趨于平穩,也反映了模型過擬合。

圖8 準確率變化趨勢圖

由于訓練數據的不平衡,某些類別數據量多,如第1類數據有10 000條,而有的數據量太少,如第7類和第8類數據只有不到2 000,這種數據量之間的差別會造成模型準確率的不同,同時訓練數據只有1萬多條,數據量太少會造成模型的過擬合現象。但也從該實驗中驗證了該方法的可行性,后續可以增加數據量和平衡各類別的數據來進一步驗證。

4 結束語

本文討論了輻射源個體識別技術的發展情況,從傳統的輻射源個體識別方法到現階段復雜環境中對復雜輻射源個體識別的方法,了解了從傳統的特征提取和分類器設計兩步驟到機器學習、深度學習技術應用中的一體化個體識別,最后討論了對具有時序特性的輻射源數據采用LSTM模型來處理的可行性,介紹了數據輸入到輸出的算法流程,并通過仿真驗證了該方法的可行性。接下來會繼續討論時序模型的應用,同時考慮采用多個深度學習模型組合的方式(如CNN+LSTM)進行分析實驗,通過CNN的卷積進行特征提取,并將這些特征輸入到LSTM序列模型中,挖掘其之間的關聯關系,可以得到較高的準確率;或通過采用CNN+BLSTM+CTC的架構進行建模,CNN用來提取特征,BLSTM進行不定長數據的處理,然后用CTC進行去重定向,該類模型在處理序列問題上有很好的效果。

猜你喜歡
輻射源時序特征提取
顧及多種弛豫模型的GNSS坐標時序分析軟件GTSA
基于單站干涉儀測向法的未知輻射源定位技術*
清明
你不能把整個春天都搬到冬天來
基于博弈論的GRA-TOPSIS輻射源威脅評估方法
空間目標的ISAR成像及輪廓特征提取
基于Gazebo仿真環境的ORB特征提取與比對的研究
基于特征提取的繪本閱讀機器人設計方案
數字電視外輻射源雷達多旋翼無人機微多普勒效應實驗研究
基于Daubechies(dbN)的飛行器音頻特征提取
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合