劉夏揚,李晶,*,于華鵬,趙國新,楊淑潔
(1.北京石油化工學院信息工程學院,北京 102617; 2.軍事科學院國防創新研究中心,北京 100071; 3.浙江海洋大學海洋工程裝備學院,浙江 舟山 316022)
船舶噪聲信號的分類識別方向作為海洋勘測研究中不可或缺的技術之一,用各種神經網絡對船舶噪聲信號進行分類和處理的相關研究也日漸豐富[1]。能否在水下對各類目標進行快速無誤地識別,很大程度上影響了未來海軍艦艇的作戰能力。
船只噪聲信號的特征提取和分類中取得了大量高質量的研究成果[2-5]。由于聲波在水中傳播時,水介質的折射及聲波在水面、水底的反射,自發射點至接收點存在多個傳播途徑的現象,船只噪聲信號通常體現為時變信號[6],且船只在行進過程中受到復雜環境的干擾,對于船舶噪聲特征提取帶來了一定難度。以往的船舶噪聲大多都是以單一特征進行目標識別,但對于完整地表述船舶的特征信息這一要求,單一特征有部分局限性。利用不同方法對船舶信號特征進行提取,可以從不同方面反應船舶的特征。排列熵(Permutation Entropy, PE)由于其良好的魯棒性和精確性以及能夠捕獲所分析的時間序列的底層動態,近年來已被應用在特征提取方面。但PE只比較相鄰值,不考慮振幅,同時受等值的影響也很大,導致計算值與真實值存在偏差。為了解決這一問題,Fadlallah Bila[7]提出了加權排列熵(Weighted Permutation Entropy, WPE),引入考慮信號波動的加權因子。與PE相比,WPE對振幅信息更敏感,能有效檢測到信號的停滯區和突變區,并在許多領域得到了實際應用[8]。
長短期記憶網絡(Long Short-Term Memory,LSTM)是目前實際應用中高效的序列模型,該網絡對于解決循環神經網絡(Recurrent Neural Network, RNN)長時序樣本梯度爆炸及梯度消失的問題有著很好的效果。張亮[9]基于LSTM設計了自動區分計算機和人的圖靈測試,并取得較高的識別率;Debashis Das Chakladar等[10]提出了一種基于雙向長短期記憶(Bi-directional Long-Short Term Memory,BLSTM)和LSTM相結合的深度混合模型來處理腦電頻譜功率分類,效果甚佳。
針對船舶噪聲信號的特點,并利用排列熵對時序性信號的敏感性,筆者提出了基于時頻域特征和排列熵的船舶噪聲信號識別方法。利用小波新閾值去噪和希爾伯特-黃變換(Hilbert-Huang Transform,HHT)對信號進行預處理,采用反向加權排列熵對IMF進行篩選,繼而將保留的IMF的加權排列熵以及瞬時頻率等進行特征提取并篩選的方式得到信號特征,通過構建LSTM網絡,得到了理想的分類精度。
船舶噪聲信號包括機械噪聲、螺旋槳噪聲、水動力噪聲等。為了提高后續訓練速率和測試準確度,需要對信號進行預處理。
小波降噪的核心是:小波分解將原始信號分解出各層系數,給定特定閾值,系數的模大于或小于特定閾值時分別進行處理,處理完的小波系數再進行反變換重構得到降噪后的信號[11]。小波閾值去噪過程如圖1所示。
圖1 小波閾值去噪過程Fig.1 Flow chart of wavelet domain denoising
有用信號的小波系數幅值較大,噪聲的小波系數賦值較小,選擇合適的閾值處理小波系數極為重要。經典閾值函數為硬閾值函數和軟閾值函數,硬閾值函數[13]:
(1)
軟閾值函數:
(2)
(3)
式中:n為信號長度;σ為噪聲標準差。閾值可以保持局部特征,但重構信號平滑度不夠。軟閾值法可以得到平滑的信號曲線,但往往會使信號產生失真。采用一種新的閾值法,由Gao和Bruce引入收縮函數的變化,其克服了硬閾值和軟閾值的缺點。因此具有良好的去噪性能。公式如下[14]:
(4)
由于傳播過程的多途效應,往往體現的是時變信號,故在宏觀上是不平穩的。為了準確描述信號特征,使用經驗模態分解(Empirical Mode Decomposition, EMD)將信號分解為有限個本征模函數IMF,再求出各個IMF的瞬時頻率構建特征向量組[15-18]。
EMD可以看作是一個對原始信號的篩選過程,根據原始信號的特點及規則分為多個IMF。IMF要滿足以下2個條件:
(1)信號的極值點數量與零點數相等或兩者數量差值為1;
(2)信號的上包絡線和下包絡線得到的局部均值為0.
對信號x(t)具體分解過程如下:
(1)求取原始信號的極大值點和極小值點;
(2)用樣條差值法對極小值形成下包絡線xd(t),對極大值形成上包絡線xu(t),計算上下包絡的均值函數公式為[15]:
(5)
(3)檢查h1(t)=x(t)-m1(t)是否滿足IMF的條件,如果滿足則繼續下一步,否則對h1(t)繼續進行上面兩步操作,直到第n步結果h1n(t)滿足IMF條件,則可求得第1個IMF,即c1=h1n(t);
(4)得到第1個殘余函數r1(t)=x(t)-c1,接著以此類推,直到rk(t)為單調函數或者只有1個極值點為止。
(5)經過以上步驟的分解,原始信號可以表示為:
(6)
1.3.1 加權排列熵
加權排列熵(WPE)是對排列熵(PE)的一種改進,其計算步驟如下[7]:
輸入1個長度為N的時間序列X,嵌入尺寸m>2,延遲時間τ,然后從時間序列X中提取長度為m的所有可能的N-(m-1)個子序列,則X可以映射到:
=1,2,…,N-(m-1)τ
(7)
接著X按照遞增順序重新排列:
x(i+(j1-1)τ)≤x(i+(j2-1)τ)≤…≤
x(i+(jm-1)τ)
(8)
如果有2個元素相等:
(i+(j1-1)τ)=x(i+(j2-1)τ)
(9)
則他們的順序為:
x(i+(j1-1)τ)≤x(i+(j2-1)τ),(j1≤j2)
(10)
計算出每個子序列的權重值ωi:
(11)
(12)
Pω(πk)=
(13)
則WPE計算式為:
(14)
1.3.2 反向加權排列熵
反向加權排列熵(Reverse Weighted Permutation Entropy, RWPE)保持了WPE和反向排列熵(Reverse Permutation Entropy, RPE)的優勢,是一種包含距離和振幅信息的復雜性度量方法,其中RPE代表時序信號與白噪聲之間的距離[18]。EMD將信號分解為若干個IMF后,有效船舶信號占較大比重,但仍有部分IMF與原始信號的相關性較低,故通過計算每一個IMF的反向加權排列熵來確定每一個IMF是否包含重要信息。其定義如下[5]:
(15)
加權相對頻率的計算式為:
(16)
反向加權排列熵表示觀測信號與高斯白噪聲之間的距離[5],此時RWPE定義為:
(17)
其中:τ為延遲時間;m為嵌入維數;ωj為時序信號的權值。
與排列熵和加權排列熵相比,RWPE融合了振幅信息和距離信息,比PE具有更強的噪聲識別能力[18]。
對保留的IMF進行希爾伯特變換[19]:
(18)
接著構造解析信號:
zt(t)=ci(t)+jH[ci(t)]=ai(t)ejφi(t)
(19)
得到的幅值函數和相位函數分別為:
(20)
(21)
各IMF的瞬時頻率計算方法為:
(22)
將提取的瞬時頻率和瞬時幅值經過統計得到加權平均瞬時頻率,其計算式為:
(23)
式中:IFi(k)為第i個IMF中第k個點的瞬時頻率;Ai(k)表示第i個IMF中第k個點的瞬時振幅。
利用長短期記憶算法對預處理后的信號進行分類訓練。LSTM是在RNN的基礎上增加了一個單元狀態C。
LSTM記憶單元組織圖如圖2所示。
圖2 LSTM記憶單元組織圖Fig.2 Chart of Memory Cells of LSTM
由圖2可知,在T時刻,LSTM的輸入有3個:上一時刻的輸出值ht-1、上一時刻的單元狀態Ct-1以及當前網絡的輸入值xt;輸出有2個:t時刻的輸出值ht和當前時刻的單元狀態Ct。在t時刻,輸入門和輸出門都是關閉狀態,于是記憶單元把之前的狀態傳遞到t+1時刻,這樣就把第1個狀態記錄了下來。以此類推,時間步t時的記憶單元就被記錄了下來,解決了梯度消失的問題。
以上為單向LSTM的計算方式,其相比單向LSTM,雙向LSTM的隱藏層要保存2個單元狀態A、A′,A參與正向計算,A′參與反向計算,最終的輸出y取決于2個值。雙向LSTM的訓練單元如圖3所示。
圖 3 雙向LSTM訓練單元Fig.3 Training Unit of BILSTM
利用雙向LSTM進行訓練,相比單向LSTM訓練精度更好。
按照上述理論分析,船舶噪聲信號分類識別總體流程如圖4所示。
圖4 分類識別總體流程Fig.4 Flow chart of classification and identification
為了驗證船舶噪聲識別方法的有效性,使用了維戈大學提供的名為ShipsEar的真實水下船只噪聲數據庫。
實驗涉及四類船只目標,簡稱為A、B、C、D類,2 000個噪聲樣本作為實驗數據集。每個樣本分別采集于不同時間和環境,信號采樣率為50 kHz。選取的各類數據的原始時域波形如圖5所示。
圖5 四類信號類時域分析圖Fig.5 Four Class time domain waveform
為驗證新閾值的去噪能力,將原始信號視為未加噪聲信號x(t),加噪信號由原始信號和白噪聲疊加,信噪比為10 dB。利用小波變換將x(t)劃分為4階小波信號,sym4作為小波函數,并使用新閾值函數去噪。最后,將去噪后小波信號進行組合得到去噪后的信號s(t)。原始信號與去噪信號如圖6所示。以信噪比和均方根誤差來評價去噪效果。信噪比的計算式為:
(31)
圖6 原始信號與去噪信號Fig.6 Original signal and denoised signal
不同閾值方法的去噪能力如表1所示。
表1 不同閾值方法去噪能力比較
從表1中可以看出,新閾值法在保持較低RMSE值的同時,可以得到較高的信噪比。故新閾值法去噪性能更佳。某一信號去噪前后EMD分解圖如圖7所示。
圖7 原始信號和除噪后EMD分解對比圖Fig.7 Comparison between the EMD decomposition of original signal and the original signal after denoising
在經過信號分解算法處理的有噪信號得到的IMF中,并不是每個IMF都能對原始信號進行表征。有些成分是噪聲,需要在特征提取前排除。由文獻[18]可知,RWPE值越大,觀測值與白噪聲的距離越小。四類信號在求取IMF后每一類隨機選取100組IMF信號求RWPE平均值。四類船只信號中IMF的RWPE結果直方圖如圖8所示。該去噪方法區分原始信號中噪聲IMF是可行的。為了進一步驗證該方法的有效性,選取RWPE閾值為2和4的本征函數重構新信號。不同取值下加噪信號和重構信號的信噪比如表2所示。加噪信號的信噪比為10 dB。從表2中可以看出,當RWPE取值為4時,可以得到較高的信噪比。
表2 不同RWPE值下原始信號與重構信號的信噪比
圖8 EMD的RWPE結果的直方圖Fig.8 The histogram of the RWPE results for EMD
從數據集中隨機選出80%的信號作為訓練集,在訓練前使用訓練集的均值和標準差來標準化訓練集和測試集。由于輸入信號各有2個維度,將輸入序列大小設置為2;指定雙向LSTM層輸出大小為500;每次訓練迭代的小批量的數量設置為50;最大訓練次數設置為50。
為了進一步檢驗特征提取方法的性能,選用IMF與原始信號的能量比以及WPE加權能量比構建特征向量[25],進行分類實驗。
處理后的結果對應的識別結果如表3所示, 目標識別的結果混淆矩陣如圖9所示。
圖9 測試集效果混淆矩陣Fig.9 Test set classification effect of confusion matrix of Class A、B、C、D
表3 不同特征提取方法識別率對比
由表3中可以看出,以IMF和原始信號能量比為特征進行識別在多類的情況下并不實用,平均識別率為50%。在相同樣本的情況下,利用WPE對能量比進行加權后作為特征進行訓練,系統的平均識別率提升到92.12%,而特征提取方法訓練后的平均識別率為99.40%,說明提出的特征具有更好的性能。
使用提出的特征提取方法,A類船只的識別率達到100.0%,B類船只的識別率為99.3%,C類船只的識別率為98.5%,D類船只的識別率為99.8%。故對于船舶噪聲識別的效果是比較理想的。
提出了一種基于時頻域特征與排列熵的識別方法,經驗模態分解可以根據局部特征將多分量信號分解為一系列的IMF,并利用原始信號的時頻域特征有效提取船舶噪聲特征,并利用加權排列熵與加權平均瞬時頻率組成特征向量,并利用LSTM對不同類型的船舶噪聲信號進行識別。分析了不同特征識別的特點,并通過實驗證明了該方法的可行性。