?

基于小波包時頻圖特征和卷積神經網絡的水聲信號分類

2021-07-14 01:14陳德昊林建恒衣雪娟孫軍平江鵬飛李承幫
聲學技術 2021年3期
關鍵詞:波包時頻水聲

陳德昊,林建恒,衣雪娟,孫軍平,江鵬飛,李承幫

(1. 中國科學院大學,北京100049;2. 中國科學院聲學研究所北海研究站,山東青島266114)

0 引 言

傳統的水聲目標識別常采用線譜、DEMON譜、高階譜和希爾伯特-黃變換等特征提取方法,并采用專家系統和人工神經網絡實現分類驗證[1-7]。由于水下環境的復雜性,基于專家系統和人工神經網絡的分類結果魯棒性和泛化能力較差。程錦盛等[8]于 2018年將深度學習方法用于梅爾倒譜系數(Mel Frequency Cepstral Coefficient, MFCC)和Gammatone倒譜系數特征的深度提取和識別學習,得出卷積神經網絡在結合 Gammatone倒譜系數特征時可達到 99.8%的識別率。同時,文獻等[9-10]也將Gammatone倒譜系數作為16種水下聲信號的識別特征,得出了該特征有利于水下聲信號識別的結論。Feroze等[11]通過用256種特征組合和5種分類器對比研究了不同分類方案下的分類結果,得出過零率更適用于人為噪聲特征、梅爾倒譜系數更適用于魚噪聲特征的結論。Wei等[12]將基于梅爾倒譜系數的聲譜圖作為卷積神經網絡的輸入圖像特征,得出該分類方案可實現對水下聲信號有效分類的結論。盡管一維特征有著廣泛應用,但圖像特征仍有著較大的應用需求和應用價值。

時頻圖特征作為一種圖像特征,是水聲信號研究中比較容易獲取的一種特征,可以反映水下聲信號頻率隨時間變化的信息。常見的時頻變換方式有短時傅里葉變換、維格納分布和小波變換,小波變換相比前兩者有可自適應調節的時頻分辨率和更快速的算法。由于小波包分解具有比小波分解更為精細的非平穩信號分析能力,而水聲信號多為非平穩信號,所以基于小波包分解的時頻圖特征更適用于水聲信號。同時,卷積神經網絡由于具有強大的圖像識別能力,而且估計參數較少,所以可考慮作為時頻圖像特征的分類決策方法。因此,本文將三種水聲信號基于小波包分解的時頻圖作為特征信息輸入到具有七層結構的卷積神經網絡中進行深度特征提取和分類驗證,最后以混淆矩陣的形式評價分類結果并討論分析。

1 數據采集與處理分析

1.1 數據采集與預處理

1.1.1 數據采集

本文的魚聲信號采集于我國某海水養殖場網箱中的發聲魚群,采集設備為自容式水聽器。商船輻射信號采集于某淺海航道附近。風關噪聲使用潛標采集,實驗海況為2~3級,采集深度約為365 m。采集到的三類原始時域信號如圖1所示。

圖1 三類典型水聲信號Fig.1 Three types of typical underwater acoustic signals

1.1.2 預處理

對采集到的三類原始時域信號做以下預處理:

(1) 降采樣:由于三類信號的原始采樣率不同,為了使特征維度保持一致,本文將三類信號的降采樣率統一設為 4 000 Hz。(2) 分幀:為了減少計算量、擴大樣本數量和提高計算效率,本文對三類信號進行分幀處理,幀長設為800 ms,幀移設為400 ms。

將 800 ms的時域分幀信號作為原始樣本。由于三類原始樣本數量差異較大,為了保證樣本數量相對均衡和滿足實際的計算條件,隨機在每類信號中抽取6 000個樣本,共計得到18 000個原始樣本,三類信號的原始樣本集劃分如表1所示。

表1 三類信號的原始樣本集劃分Table 1 Partition of original sample sets of the three types of signals

2 特征變換與特征提取

小波變換引入了可自適應調節的時頻窗,可實現在低頻時具有較高的頻率分辨率,在高頻時具有較高的時域分辨率,故相比短時傅里葉變換具有更高的靈活性。由于在每層分解時增加了高通濾波器,所以小波包變換相比小波變換可以更加細致地觀察信號的非平穩特性。因此,本文考慮將小波包變換作為特征變換手段,將原始時域信號映射到小波包時頻變換域,并在此基礎上得到二維的小波包時頻圖像特征。

在本文的小波包分解中,選用“db6”小波基,分解層數設為5層。原始樣本是800 ms的時域信號,對每個原始信號樣本進行小波包分解,得到對應的小波包時頻圖?;谛〔ò纸獾娜愃侣曅盘柕臅r頻圖如圖2所示。圖2(a)~2(c)的二維時頻圖均是由大小為32×3 200的時頻分布矩陣組成。由圖 2中的三幅圖像及其他未展示的時頻圖像可知:在2 000 Hz以下的頻率范圍內,魚聲信號的頻率相對較高,商船輻射噪聲和風關噪聲的頻率較低。除此之外,魚聲信號相比商船輻射信號和風關信號瞬態性更強,商船輻射信號的有用頻段相比風關信號隨時間變化更明顯。因此,在有合適的分類決策方法條件下,該特征差異將有助于實現三類水聲信號的有效分類。

圖2 三種水聲信號的小波包時頻圖Fig.2 The time-frequency maps of wavelet packet of the three types of underwater acoustic signals

最后,將小波包時頻圖像作為訓練特征。特征樣本集按照 3:1:1的比例隨機劃分成訓練集、驗證集和測試集,并將訓練集樣本輸入到卷積神經網絡進行模型訓練。

3 分類決策方法與分類結果

卷積神經網絡(Convolutional Neural Network,CNN)作為強大的圖像識別工具,可以用較少的估計參數和更高的計算效率來實現圖像信號的有效分類。卷積神經網絡是一種經典的深度學習模型,由一個或多個卷積層和其他分類神經網絡組成。卷積神經網絡通過訓練算法不斷地對每一層神經元對應的權重進行迭代更新,以此得出不同種類信號對應的后驗概率,最后決定分類結果。與其他深度學習模型相比,卷積神經網絡在圖像識別方面能給出更優的結果。因此,本文選用卷積神經網絡作為分類器來對小波包時頻圖二維特征進行分類驗證。本文所搭建的卷積神經網絡的模型架構如圖3所示。

圖3 卷積神經網絡的分層架構Fig.3 Layered architecture of CNN

每一層的具體情況如下:

第一層是二維圖像輸入層,它的輸入圖像大小和小波包時頻圖大小保持一致,即均為32×3 200。其中,32和3 200分別指二維圖像對應矩陣的行數和列數。信道數和輸入圖像的信道數相等,均為1。同時,在該層對輸入特征進行了歸一化操作。

第二層是卷積層。通過用16個大小為[15, 15]的卷積過濾器以[3, 2]的步長實現對輸入圖像的卷積操作。卷積層的運算可以實現對輸入圖像的降維,并在維度降低的基礎上獲取小波包時頻圖的深度特征。

第三層是批歸一化層(Batch Normalization)。該層的設置是為了加快網絡的訓練速度,減少對網絡權重的敏感度。

第四層是線性修正單元層(Rectified Linear Unit, ReLU)。該層是在ReLU判決下將批處理單元和值小于0的值置為0。

第五層是全連接層。全連接層的運算公式為[13]

式中:是全連接層的輸出,X指輸入,W為權重矩陣,b表示偏差向量。設全連接層的輸出大小為3(和類別數相等)。

第六層是Softmax層。該層可得到預測類別的后驗概率。

第七層是分類輸出層。通過取Softmax層最大后驗概率對應的類別來決定最終的預測類別。

在實驗過程中,每次訓練之前均對每類信號有放回地隨機抽取6 000個原始信號樣本,然后進行小波包特征變換,得到18 000個觀測樣本和對應的18 000個標簽樣本。為了更加客觀地評估分類結果,本文將觀測樣本和標簽樣本按照相同的打亂順序進行多次洗牌操作,在此基礎上將觀測值樣本和標簽樣本按照 3:1:1的比例隨機劃分出訓練集(10 800個樣本)、驗證集(3 600 個樣本)和測試集(3 600個樣本)。每次劃分出來的驗證集和測試集均不參與模型訓練,且每次訓練出的網絡都是獨立不相關的。驗證集用于初步評估分類效果。當驗證集總體準確率達到97%以上時,再將訓練出的網絡模型在測試集中進行測試。

通過重復進行50余次的訓練、驗證和測試,發現每次分類結果在驗證集和測試集的總體準確率均可達到(98±1)%。因此,小波包時頻圖二維特征結合卷積神經網絡可考慮作為區分這三類水聲信號的有效分類方案。

圖4是某次分類輸出結果的混淆矩陣。由圖4可知,本次的分類模型輸出在驗證集有31個類別標簽預測錯誤,總體準確率達到了 99.1%。在測試集中有47個類別標簽預測錯誤,總體準確率達到了98.7%。

圖4 分類結果的混淆矩陣Fig.4 The confusion matrix of a certain classification result

因此,相比文獻[2-11]所用到的一維特征和文獻[12]中基于梅爾倒譜系數的聲譜圖而言,小波包時頻圖也可作為水聲信號分類的有效特征,在結合卷積神經網絡時可實現對魚聲信號、商船輻射信號和風關信號的有效分類。

4 結 論

水聲信號處理是目前水聲領域最活躍的研究方向之一。一方面,人們對水聲數據開發和利用的需求日益增加。另一方面,由于海洋環境的復雜性和海洋聲信號的多樣性,使得對水聲數據的采集和深度挖掘變得困難。因此,完成水下聲信號分類的任務需要由對少數水下目標分類逐步擴大到對更多的目標實現有效分類,同時需要考慮海洋背景噪聲和不同數據采集條件對分類系統性能的影響。

本文通過將基于小波包分解的時頻圖特征和卷積神經網絡相結合,選取了合適的小波包分解參數和卷積神經網絡模型訓練參數,實現了對三類水下聲信號的有效分類。由于該分類方案是基于實測的數據,所以分類結果可為實際應用提供參考。同時,由于數據量有限和計算條件的限制,該分類方案的泛化性能有待進一步驗證和提高。

猜你喜歡
波包時頻水聲
水聲單載波擴頻均衡技術研究
一種適用于水聲通信的信號水印認證技術
基于小波包的電力網沖擊接地電阻系統分析*
基于支持向量機和小波包變換的EOG信號睡眠分期
基于小波包分解和K最近鄰算法的軸承故障診斷方法
高聚焦時頻分析算法研究
基于稀疏時頻分解的空中目標微動特征分析
認知水聲通信系統中OFDM技術的應用
新型多功能水聲應答器電子系統設計
基于時頻分析的逆合成孔徑雷達成像技術
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合