?

不均衡樣本下的低分辨雷達目標識別算法

2021-11-17 03:12朱克凡王杰貴葉文強
計算機仿真 2021年3期
關鍵詞:識別率分段類別

朱克凡,王杰貴,葉文強

(1.國防科技大學電子對抗學院,安徽 合肥 230037;2.中國人民解放軍63768部隊,陜西 西安 710000)

1 引言

雷達目標識別(Radar Target Recognition,RTR)是雷達研究的一個重要方向。由于高分辨雷達研究成本高、周期長、難以普及,現役雷達大部分是低分辨雷達,且隨著脈沖壓縮技術的普及,傳統低分辨雷達也能擁有很高的徑向分辨力,能夠提取目標一維距離像等細微特征,基于低分辨雷達的目標識別技術研究仍然是雷達研究的一個重要熱點[1-3]。

傳統低分辨雷達目標識別是基于特征提取的目標識別,即首先基于回波起伏、極點分布以及調制譜特性等特征,對目標進行特征提取,然后采用貝葉斯、支持向量機(Support Vector Machine,SVM)、最近鄰分類、隱馬爾科夫模型等方法對目標進行分類識別。通過提取目標特征的方法可以實現對目標的分類識別,然而特征多為人工設計[4],屬于淺層特征,具有不完備性,不利于目標識別率的進一步提高,且特征往往只針對特定目標設計,方法的泛化性也存在不足。

自Hinton等人提出深度學習理論后,卷積神經網絡(Convolutional Neural Networks,CNN)作為該領域里的重要模型,由于能夠自學習數據深層本質特征,應用在目標分類識別領域,識別準確度可以獲得較大提升,較傳統方法有明顯優勢[5-8]。但基于深度學習的低分辨雷達目標識別方法往往需要足夠多且不同類別數量均衡的訓練樣本。在現代戰爭中,當雷達目標是先進的非合作目標或隱身目標時,對該目標通常難以獲取足夠多的訓練樣本,導致不同類別樣本數是極端不平衡的,目標識別率較低。

針對樣本不均衡問題,傳統低分辨雷達目標識別技術采用改進的SVM算法,如加權SVM(weighted SVM,WSVM)[9],代價敏感SVM(Cost-sensitive SVM,CS-SVM)[10]等,基于提取的特征進行目標識別,但由于識別特征本身具有不完備性,識別效果欠佳。文獻[11-13]利用合成少數類過采樣技術(Synthetic Minority Oversampling Technique,SMOTE)擴充少數類樣本數以平衡樣本集,提高識別率,但由于SMOTE算法使用噪聲合成新樣本,數據集擴充效果不理想。文獻[14]提出了焦點損失函數,通過大幅度降低簡單樣本的權重使網絡訓練側重于對困難樣本的識別,提高目標識別率。但由于訓練初期的網絡對不同類別樣本沒有識別能力,無難易之分,初期訓練過程受同類數量多的樣本主導,訓練緩慢且容易陷入傾向于將目標識別為樣本數多的類別的局部極值點。文獻[15]使用類別均衡交叉熵損失函數來自動平衡正負樣本產生的損失。但由于在交叉熵損失函數中添加類別均衡權重,相當于改變了原始數據分布,所以CNN擬合的分布較原始數據分布有偏差,識別效果提升有限。

針對以上問題,在樣本不均衡條件下,本文提出了基于分段損失函數的卷積神經網絡低分辨雷達目標識別算法,該算法首先通過CNN自動提取數據深層本質特征,然后使用分段損失函數計算誤差,最后將誤差反向傳播優化權值以提高識別效果。仿真結果驗證了本文算法的有效性和較傳統識別方法的優越性。

2 基于分段損失函數的卷積神經網絡低分辨雷達目標識別算法

2.1 CNN

CNN是一種深度前饋人工神經網絡,包括卷積層、池化層及全連接層,結構如圖1所示。卷積層采用不同的卷積核,在隱式地提取數據特征的同時減少了訓練參數;池化層對卷積層提取的特征進行降采樣,進一步減少訓練的數據量。全連接層將特征進行綜合,并可與Softmax分類器結合,在模式分類領域具有明顯優勢。

圖1 卷積神經網絡基本結構

2.2 分段損失函數

分類問題中常用的損失函數是交叉熵損失函數

(1)

由于交叉熵損失函數平等累加每一個樣本損失,當某一類樣本數較多時,就會在誤差反向傳播過程中起主要作用,不利于網絡的訓練。針對樣本不均衡問題,有兩種改進的交叉熵損失函數。

一是類別均衡交叉熵損失函數[15]

(2)

式中:βi表示類別i的均衡權重。

二是焦點損失函數[14]

(3)

式中:γ是焦點參數,γ≥0。

由于類別均衡交叉熵損失函數改變了原始樣本分布,使CNN擬合的分布較原始數據分布有偏差;而焦點損失函數,使CNN在初期訓練較慢且容易陷入傾向于將目標識別為樣本數多的類別的局部極值點?;诖?,本文提出了分段損失函數,在焦點損失函數的基礎上,訓練初期引入類別均衡交叉熵損失函數,類別均衡交叉熵損失函數的加入使初期網絡訓練較快,且對多類目標都有一定的識別效果,在分段點,結合類別均衡交叉熵損失函數訓練后的權重優于隨機初始化訓練后的權重,更容易避開傾向于將目標識別為樣本數多的類別的局部極值點;后期只使用焦點損失函數,專注于困難樣本,提高網絡的識別性能。同時,為了防止在分段點,由于損失函數的突變而過快或過多的扭曲權重,借鑒模擬退火思想,采用線性衰減的方式,引入衰減參數。

(4)

式中:αi是類別i的衰減參數,βi表示類別i的權重,M表示分段的迭代次數,n表示當前的迭代次數。則分段損失函數可以表示為

(5)

2.3 基于分段損失函數的CNN低分辨雷達目標識別算法

2.3.1 CNN結構

CNN最初是針對圖像數據設計,更適合于處理二維圖像。由于低分辨雷達目標信號是一維時序信號,無法直接將目標信號的采樣數據輸入CNN,常見方式是對數據進行時頻變換,將時序信號轉換為時頻圖像,文獻[16]提取信號全雙譜特征輸入CNN,文獻[17]提取信號時頻特性作為CNN的輸入。由于人工提取特征會損失數據信息,為保留目標全部差異信息,盡可能提高目標識別率,本文采取調整CNN結構的方式,設計了一維CNN結構,網絡結構如表1所示。

表1 一維CNN網絡模型結構

2.3.2 算法步驟

1)取大量雷達目標信號采樣數據作為訓練樣本輸入卷積層,使用多個初始權值不同的卷積核對輸入數據進行卷積,獲得數據的特征映射向量并輸入池化層;

2)池化層通過一維窗口,采用不重疊的步進方式,對特征向量進行下采樣處理,有效降低數據維度;

3)Dropout層按照設置的概率隨機地將輸入神經元置零以緩解過擬合現象;

4)根據網絡卷積層、池化層和Dropout層數量,重復步驟1)-3),對輸入數據進行多層卷積、池化和Dropout操作,并將第3次Dropout后的數據輸入到全連接層;

5)全連接層將輸入的多個特征整合成一維特征向量,并通過Softmax函數,輸出各類識別概率組成向量,取概率向量中值最大的作為本次識別結果;

6)將當前迭代次數 與分段迭代次數M比較,選取合適的損失函數,根據預測結果和真實標簽計算損失并反向傳遞;

7)根據預設的最大迭代次數循環步驟1)—6)將網絡訓練完畢。

3 實驗結果與分析

3.1 實驗數據集

3.1.1 低分辨雷達目標回波建模

現代雷達輻射源信號常采用脈沖壓縮信號,如相位編碼信號、線性調頻(Linear Frequency Modulation,LFM)信號等,使用脈沖壓縮技術可使雷達具有很高的徑向分辨力,當雷達目標的尺寸大于徑向分辨力時,運動目標占據多個距離單元,此時可以使用多散射點模型來模擬目標回波信號。

當雷達發射信號是LFM信號時,將與發射信號斜率相同的LFM參考信號作為本振信號,對接收到的回波信號進行變頻、采樣和幅度歸一化處理后,獲得的回波采樣數據為

(6)

3.1.2 數據集參數設置

實驗數據集由python編程軟件生成,仿真參數設置:LFM信號載頻為3 GHz,調頻周期為0.1 ms,調頻帶寬為100 MHz,中頻采樣頻率為5 MHz。數值仿真對地面目標進行目標識別,分別為卡車、摩托車和人。取1個調頻周期內的采樣數據作為1個樣本,通過計算可知樣本大小為1×500,類別標簽采用獨熱碼方式表示,維度是1×3。訓練樣本集與測試樣本集分別獨立產生,其中,訓練集卡車樣本數為30,摩托車為300,人為3000,共3330個樣本,測試集卡車樣本數為200,摩托車為200,人為200,共600個樣本。

3.2 分段損失函數參數選擇

分段損失函數中存在可變的類別均衡權重,焦點參數和衰減參數,在本文算法中,對類別均衡權重,焦點參數和衰減參數做如下選擇。

3.2.1 類別均衡權重

在類別均衡交叉熵損失函數中,設置類別均衡權重的目的是平衡各類目標數量差異對損失反向傳播的影響,所以權重值與各類別數目比例有關,常見的設置方式如下[15]

βiNi=βjNj

(7)

3.2.2 焦點參數

焦點參數的作用是大幅度減少樣本集中簡單樣本的權重,使CNN側重于對困難樣本的訓練。不同γ下的焦點損失值如圖2所示,其中預測概率指的是CNN將目標預測為真實標簽的概率。

圖2 不同γ下的焦點損失值

文獻[14]將預測概率高于0.6的樣本看作簡單樣本,從圖2可以看出,引入γ可以有效減少簡單樣本的損失,使CNN在訓練時側重于對困難樣本的識別,本文選擇γ=2作為焦點參數值。

3.2.3 衰減參數

衰減參數主要由分段的迭代次數M決定,M的不同會影響目標識別效果,當M=0時,分段損失函數退化為焦點損失函數。在同樣條件下對不同的分段迭代次數M進行對比實驗,識別效果如表2所示。

表2 不同分段迭代次數M下的識別效果

通過對比實驗,本文選擇M=100作為分段的迭代次數。

3.3 不同損失函數對識別效果的影響

為了驗證本文所提分段損失函數的有效性,對使用不同損失函數的CNN進行識別實驗。用添加高斯白噪聲的方法對數據進行加噪處理,實驗采用SNR=-4dB的仿真目標回波采樣數據作為網絡輸入,使用設計的一維CNN結構作為識別網絡。圖3是使用四種損失函數的CNN在不同迭代次數下的測試集識別率。

圖3 使用四種損失函數的CNN識別率

從圖3可以看出,分段損失函數結合了類別均衡交叉熵損失函數和焦點損失函數的優點,初期訓練速度較快,獲得較好的訓練權值,后期挖掘困難樣本,較焦點損失函數和類別均衡損失函數識別率有所提高,四種損失函數的平均識別率如表3所示。

表3 四種損失函數的平均識別率

為了更加直觀的展示不同損失函數的識別效果,各損失函數的混淆矩陣如圖4所示,圖5~圖8是接收者操作特征曲線(receiver operating characteristic curve,ROC)曲線和ROC曲線下方的面積(Area under the Curve of ROC,AUC)。其中混淆矩陣中每一列表示目標所屬的真實類別,每一行表示一維CNN的識別結果,標簽從上至下,從左至右依次為卡車,摩托車和人。

圖4 混淆矩陣

圖5 使用交叉熵損失函數的ROC曲線和AUC值

圖6 使用類別均衡交叉熵損失函數的ROC曲線和AUC值

圖7 使用焦點損失函數的ROC曲線和AUC值

圖8 使用分段損失函數的ROC曲線和AUC值

從圖4的混淆矩陣和圖5~圖8的ROC曲線和AUC值可以看出,基于交叉熵損失函數的CNN識別算法對卡車和摩托車的識別效果較差,通過使用類別均衡交叉熵損失函數或焦點損失函數,可以提高算法對卡車的識別效果,但仍然無法有效識別摩托車,且焦點損失函數更傾向于將分類錯誤的摩托車樣本識別為樣本數較多的人,而基于分段損失函數的CNN識別算法能夠有效識別三類目標,且在識別性能方面明顯優于其它算法,充分說明了本文所提分段損失函數的有效性。

3.4 基于分段損失函數的卷積神經網絡低分辨雷達目標識別算法的識別效果

為了進一步說明本文所提基于分段損失函數的CNN低分辨雷達目標識別算法的有效性和較傳統方法的優越性,將本文方法與其它五種方法進行比較,方法一是使用文獻[9]所提WSVM算法的傳統識別方法,其中WSVM算法基于目標的雷達散射截面積和一維距離像的中心矩特征進行識別,方法二是使用交叉熵損失函數的CNN低分辨雷達目標識別算法,方法三是使用類別均衡交叉熵損失函數的CNN識別算法,方法四是使用焦點損失函數的CNN識別算法,方法五是文獻[12]所提基于SMOTE和CNN的識別算法。同時為了驗證本文方法的魯棒性,通過添加高斯白噪聲的方法在不同信噪比條件下進行識別實驗,不同方法的識別效果如表4所示。

表4 不同方法的識別效果

從表4可以看出,本文方法在不同信噪比條件下的識別率最高,較傳統基于WSVM的識別算法識別率至少提高了10.38%,較基于交叉熵損失函數的CNN識別算法識別率至少提高了6.37%。

4 結論

針對樣本不均衡條件下,傳統低分辨雷達目標識別方法識別率較低的問題,本文提出了基于分段損失函數的卷積神經網絡低分辨雷達目標識別算法。首先通過CNN獲取數據深層本質特征,然后使用分段損失函數,使CNN在初期能夠更快訓練,獲得更好的權值,避開傾向于將目標識別為樣本數多的類別的局部極值點,在后期則側重于對困難樣本的訓練,最后將損失反向傳播,提高網絡識別性能。仿真結果表明本文所提算法較傳統識別方法有明顯優勢,使用分段損失函數能夠有效提高CNN在樣本不均衡條件下對低分辨雷達目標的識別效果。

猜你喜歡
識別率分段類別
2018年—2020年山西省普通高考成績分段統計表
一起去圖書館吧
分段函數的常見題型及其解法
簡析基于概率預測的網絡數學模型建構
例談分段函數單調性問題的解決
檔案數字化過程中OCR技術的應用分析
基于PCA與MLP感知器的人臉圖像辨識技術
尋求分段函數問題的類型及解法
科技文檔中數學表達式的結構分析與識別
人工智能現狀和發展
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合