?

一種改進的SSD紅外艦船目標檢測算法

2023-10-12 04:08婁樹理
關鍵詞:艦船特征提取紅外

王 巖,婁樹理

(煙臺大學物理與電子信息學院,山東 煙臺 264005)

海面艦船作為海上監測和戰時打擊的重點目標,能否快速準確地識別出海面艦船目標,極大地關系到行動成敗[1]。由于紅外艦船圖像受海雜波、云霧雨雪等因素影響,且目標與背景復雜多樣,如何快速準確地檢測出艦船目標,是紅外成像制導武器的關鍵問題和技術難題,一直是國內外研究熱點。

傳統的目標檢測算法大多基于滑動窗口和人工特征提取,存在計算復雜度高以及復雜場景下魯棒性差的缺陷。隨著深度學習的發展,目標檢測技術得到了很大的進步,增加了目標檢測算法的多樣性?;谏疃葘W習的目標檢測算法分為兩類:一類是兩階段目標檢測算法,如Faster R-CNN(Faster Region-based Convolutional Neural Networks)[2]和Mask R-CNN(Mask Region-based Convolutional Neural Networks)等[3],顧佼佼等[4]提出基于改進Faster R-CNN的紅外艦船目標檢測算法,馬嘯等[5]提出基于改進Mask R-CNN的艦船目標檢測方法,這類算法精度高,但是速度稍慢,難以用在瞬息萬變的海戰場上;另一類是單階段目標檢測算法,如SSD(Single Shot MultiBox Detection)[6]和YOLO(You Only Look Once)[7-10]系列等,這類算法實現了端到端的目標檢測,相比于兩階段目標檢測算法,其檢測速度更快,適用于海戰場的目標檢測。何維娟等[11]提出基于改進YOLOv3的遙感圖像艦船目標檢測方法;梁杰等[12]提出基于改進SSD的艦船目標精細化檢測方法,該方法利用旋轉的邊框回歸模塊,通過學習密集區域目標的幾何形變,預測目標的旋轉角度,最終以旋轉的矩形框獲得目標位置,此方法雖使精度得到一定提高,但降低了原有的檢測速度;謝曉方等[13]提出一種融合輕量級YOLOv4與KCF算法的艦船目標檢測算法,但是相比兩階段目標檢測算法,其檢測精度偏低。

針對海戰場艦船目標檢測精度和速度要求較高的技術難題,本研究提出一種改進后的SSD目標檢測算法,并通過實驗驗證其對紅外艦船目標的檢測精度與速度。

1 SSD目標檢測算法改進

1.1 SSD網絡結構改進

SSD算法的主干網絡為VGG網絡,此算法是將VGG末端的全連接層用卷積層代替,在此基礎上增加幾個額外的卷積層,獲取更多的特征圖層,并且使用VGG網絡和新增的卷積層獲得的特征圖進行獨立預測。SSD網絡結構如圖1,首先對輸入圖像進行大小調整,并作為模型的輸入;其次利用SSD算法的特征提取網絡獲得一系列特征圖層,其中低層特征矩陣關注較小目標的特征,高層特征矩陣關注較大目標的特征;最后對不同尺度的特征圖層設置不同比例和數量的先驗框,通過兩個卷積層預測默認邊界框的類別分數和位置偏移量,使用非極大值抑制篩選方法獲得最終的預測邊界框。

圖1 SSD網絡結構

為提高網絡檢測精度,本研究對SSD網絡結構進行改進,改進后的SSD網絡結構如圖2,首先對輸入的圖像進行Mosaic數據增強的預處理,通過引進主干網絡ResNet-50和添加的五個特征提取層進行特征提取;然后將提取出的特征圖作為輸入,利用ECANet通道注意力機制,進一步提高特征圖中語義和細節信息的抗干擾能力;最后對特征圖進行分類和邊界框回歸預測。

圖2 改進后的SSD網絡結構

1.2 SSD主干網絡改進

紅外艦船圖像主要反映艦船目標和海天背景的輻射能量差異,由于島嶼等物體輻射能量與海天背景也有較大差異,實際檢測時島嶼等物體會對艦船目標檢測形成干擾,并且實際紅外圖像中噪聲影響嚴重,這些因素降低了紅外艦船目標的檢測精度。使用SSD算法對艦船進行目標檢測時,VGG網絡提取的特征圖中語義和細節信息抗干擾能力弱,為了避免復雜背景和相似物體對艦船目標檢測的干擾,本研究將SSD特征提取網絡替換為網絡層數更深、細節信息更豐富的ResNet-50[14]網絡,并且對ResNet-50網絡加以修改,去掉Conv5對應的一系列層結構及其之后的層結構,并將Conv4的第一個殘差塊結構的步距由2改為1,由此得到尺度大小為38×38×1024的特征圖,殘差結構見圖3。

圖3 殘差結構

為了獲得不同感受野的特征圖,使其能夠提取不同尺度目標的特征信息,添加了一系列額外的層結構構成特征提取層(Addlayer)(圖4),并將每個特征提取層中的全連接層用1×1的卷積層代替。針對紅外艦船目標檢測速度要求高的問題,在特征提取網絡層中加入BN層,提高網絡的訓練速度。

圖4 特征提取層

1.3 Mosaic數據增強

對紅外艦船目標進行檢測時,SSD網絡對不同背景下的艦船目標檢測精度差異較大,為了使SSD網絡在不同情況下具有更好的魯棒性,在檢測前對圖像進行數據增強的預處理。在SSD網絡中加入Mosaic數據增強模塊[10],Mosaic數據增強將四張圖像進行拼接,每次讀取四張圖片,并分別對四張圖片進行翻轉、縮放、色域變化等,能夠豐富檢測物體的背景,并且在BN層計算時,能夠同時計算四張圖片的數據,提高網絡的檢測速率。圖5為圖像使用Mosaic數據增強方法的實例。

圖5 Mosaic數據增強實例

1.4 ECANet通道注意力機制

使用SSD算法檢測紅外艦船目標時,特征提取網絡提取的特征圖中有目標特征和相似的干擾特征,而相似的干擾目標在特征圖中與艦船目標具有同等重要性,不利于艦船目標在復雜背景下的檢測。為了增加特征圖對艦船目標的識別能力,降低復雜海戰場背景的影響,在SSD網絡中引入ECANet通道注意力機制[15],抑制干擾特征的影響,提高網絡注意力。

ECANet通道注意力機制(圖6),首先對輸入的特征層進行全局平均池化,利用1D卷積進行特征提取,經過Sigmoid激活函數獲得每一個特征點的權值,最后與輸入的特征層相乘,得到新的特征圖層。

圖6 ECANet通道注意力機制

圖6中H、W、C分別代表特征圖的高度、寬度和通道數,為上一個卷積層的輸出并且作為注意力機制的輸入,GAP表示全局平均池化,σ表示Sigmoid非線性激活函數,k表示卷積核大小。Sigmoid非線性激活函數的定義式為[16]

(1)

式中:z表示神經網絡上一層節點的輸出。k的數學表達式為[15]

(2)

式中:b取1,γ取2,|t|odd表示距離t最近的奇數。

1.5 基于余弦退火衰減法的學習率計算

SSD算法中使用梯度下降法優化目標函數時,學習率下降使模型更加接近Loss值的全局最小值,但目標函數有多峰的可能性,除了全局最優解之外還有多個局部最優解,這導致網絡訓練時,模型可能陷入局部最小值,因此使用余弦退火衰減法[17]計算學習率,突然提高學習率使其跳過局部最優解,從而找到全局最優解,提高網絡對艦船目標的檢測精度。

余弦退火的數學表達式為[17]

(3)

使用余弦退火學習率的SSD網絡損失和學習率如圖7。

圖7 SSD的網絡損失和學習率

從學習率曲線軌跡來看,改進后的SSD網絡優化目標函數時,模型會跳過損失值的局部最優解,尋找全局最優解,提高網絡對艦船目標的檢測精度。

2 實驗驗證與結果分析

2.1 實驗環境

本研究中算法的所有實驗均在Windows11操作系統中進行;處理器為AMD Ryzen 7 5800H with Radeon Graphics 3.20 GHz;NVIDIA GeForce GTX 3060(6 GB);深度學習框架為Pytorch 1.10.1;使用Python作為主要編輯語言。

紅外艦船數據集來源于實際采集圖像,該數據集共1263張艦船圖像,波段分別為3~5 μm和8~12 μm,圖像目標為艦船目標,部分海天背景中存在島嶼,圖像大小分別為320×240、621×471。數據集按7∶3的比例分為訓練集和驗證集,并且按照PASCAL VOC數據集的格式進行標注。

2.2 評價標準

評價標準采用平均精度(average precision, AP)和檢測速率(Frame Per Second, FPS),AP兼顧精確度(Precision)和召回率(Recall),常被用作評估模型的精度有效性,FPS為每秒檢測圖像的幀數,常被用作評估模型的檢測速度。所有類別的AP的均值為mAP,本研究中算法為單目標檢測,即AP=mAP。Precision為模型預測的所有目標中預測正確的比例。Recall是所有真實目標中模型預測正確的目標比例。IOU表示預測框與真實框的重疊程度。AP的定義式為

(4)

FPS越大,表明檢測速度越快,實時檢測的可行性越高。其定義式為

(5)

式中:Num(figure)表示樣本檢測數量;T表示檢測運行時間。

2.3 算法性能分析與比較

使用改進后的SSD算法在紅外艦船數據集上進行仿真實驗,為了評估改進后的SSD算法的有效性,選取了不同系列的紅外艦船圖片,與改進前的SSD算法進行仿真實驗對比,效果如圖8。

圖8 仿真結果對比

結果表明,改進前的SSD算法對單一背景中的艦船目標檢測效果較好,但對大面積島嶼干擾背景中的艦船目標檢測效果較差,出現誤檢情況。改進后的SSD算法檢測精度更高、抗干擾性更強,明顯降低了算法的誤檢率。為了更加準確地驗證改進后的SSD算法的可行性,分別使用改進前的SSD算法、改進后的SSD算法、ResNet-50網絡構架的Faster R-CNN算法、RetinaNet和Yolov4算法在紅外艦船數據集上進行仿真實驗??紤]到數據集存在人工制作誤差等因素,對比實驗使用IOU=0.75條件下的算法精度,結果如表1。

表1 不同算法檢測精度比較

通過比較可以發現,改進后的SSD網絡對紅外艦船目標的檢測精度最高、速度最快,與改進前的SSD算法、Faster R-CNN算法、RetinaNet和YOLOV4算法相比,AP分別提高6.5%、1.1%、6%和7.6%,FPS分別提高8、51、18和16。表明本研究中算法能夠提高網絡對艦船目標的檢測精度和速度,對于復雜背景下紅外艦船目標檢測具有較強的適應性和抗干擾性。

2.4 消融實驗

為了證明改進后的SSD算法對提高艦船目標檢測精度的可行性,在紅外艦船數據集上進行消融實驗,在SSD模型上依次添加ResNet-50模塊、Mosaic數據增強模塊、ECANet通道注意力機制模塊、余弦退火衰減學習率(Cos-lr)模塊,并通過比較檢測精度的差異,分析改進后的SSD每個模塊的性能,實驗結果如表2。

表2 不同SSD模型對艦船檢測的性能對比

模型在實驗中未使用該模塊。

實驗設置以傳統SSD為基線,將模型主干網絡替換為ResNet-50網絡,模型的AP比改進前的SSD提高3.4%,說明ResNet-50網絡語義信息更豐富,提取的特征圖中細節信息抗干擾能力更強。在此基礎上依次添加Mosaic數據增強模塊、ECANet通道注意力機制模塊、Cos-lr模塊,模型的AP較前者依次提高1.1%、1.7%、0.3%,說明了Mosaic數據增強模塊能夠豐富檢測物體的背景,提高網絡的魯棒性;ECANet通道注意力機制模塊可以抑制干擾信息的影響,提高網絡對艦船目標的檢測能力;Cos-lr余弦衰減學習率能夠優化網絡,提高網絡對艦船目標的檢測精度。改進后的SSD算法在檢測速度上也有一定的提升,能更好地用在瞬息萬變的海戰場上。

3 總 結

針對紅外圖像中的艦船檢測問題,提出一種基于改進SSD的檢測算法。該算法以SSD目標檢測算法為基礎,在此基礎上將主干網絡換為ResNet-50網絡,增強網絡的抗干擾能力;使用Mosaic數據增強方法,提高網絡的魯棒性;引入ECANet通道注意力機制,抑制干擾信息的影響,提高網絡注意力;使用Cos-lr來優化網絡,提高網絡的檢測精度。實驗結果表明,本研究中提出的檢測算法,平均精度達到98.8%,FPS達到55,可實現對紅外艦船目標快速精準的檢測。

猜你喜歡
艦船特征提取紅外
艦船通信中的噪聲消除研究
網紅外賣
閃亮的中國紅外『芯』
艦船測風傳感器安裝位置數值仿真
TS系列紅外傳感器在嵌入式控制系統中的應用
基于Daubechies(dbN)的飛行器音頻特征提取
Bagging RCSP腦電特征提取算法
基于快速遞推模糊2-劃分熵圖割的紅外圖像分割
艦船腐蝕預防與控制系統工程
基于MED和循環域解調的多故障特征提取
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合