?

一種適用于被動聲學監測系統的海豚回聲定位信號快速檢測方法

2024-01-17 07:16薛睿超牛富強
聲學技術 2023年6期
關鍵詞:海豚正確率信噪比

薛睿超,牛富強,2

(1.自然資源部第三海洋研究所,福建廈門 361005;2.廈門海洋職業技術學院,福建廈門 361005)

0 引言

被動聲學監測(Passive Acoustic Monitoring,PAM)系統可實現對海洋哺乳動物的長期監測,已廣泛用于海洋哺乳動物聲學研究和保護,尤其是對海豚聲信號的檢測、分類和定位[1-3]。多數PAM 系統的檢測目標為海豚用于定位、導航和覓食的回聲定位信號(click)[4],部分也可檢測海豚發出的哨叫聲信號(whistle)[5]。然而,并非所有海豚都會發出哨叫聲,例如喙鯨和鼠海豚[6]。因此,為了盡量多地覆蓋物種,應盡可能使用click 檢測器。click 信號與常見的脈沖信號(如爆炸聲脈沖)不同,其具有短時、寬頻、不規則等特性。不同的海豚物種之間,甚至在某些相同物種的個體之間,click信號的具體頻譜特性也不相同,這可能與個體體型大小有關,也可能與棲息地和獵物的不同有關。研究click信號的特性也有助于更好地了解不同海豚物種間的區別和聯系[7]。

海洋背景噪聲中廣泛存在大量瞬態噪聲,其與海豚click 信號很難區分,給人工提取和計算機提取造成了很大的困難。常規的click 信號檢測技術是能量檢測器[8-9],其依靠特定物種發聲信號序列的能量分布特征來區分click 信號和其他瞬態噪聲,但該方法易將瞬態噪聲判斷為海豚click信號,使得海豚click 信號檢測正確率降低。當該方法應用于長期PAM 系統中時,隨著監測時間的增加,誤檢數量也大幅增加。目前應用最廣泛的檢測方法的是時頻分析[10-14],根據頻帶、中心頻率和信號長度等特征建立檢測器,通過待測數據與檢測器的互相關度來檢測click 信號[6]。滿足一定條件時該方法還可對物種進行分類,但時頻分析是一個計算密集型的過程,特別是某些物種的click 信號需要400 kHz或更高的數據采樣率,龐大的計算量導致PAM 系統需要頻繁更換電池和存儲設備,減少了工作時間,然而PAM 系統對工作時間的要求通常都較長,需要將設備部署數周、數月或更長時間,因此減少信號檢測的算力需求對降低系統功耗和存儲壓力具有重大意義。近些年,機器學習技術[15-16]也被嘗試用來對海豚click 信號進行檢測識別,但需要大量的click 聲信號作為樣本進行訓練,當處理的信號類型在訓練樣本中沒有被覆蓋時,容易產生誤判。

另一方面,部分PAM 系統同時具有檢測后續工作,如在工程海域,檢測到海豚等動物的信號后將開啟聲學驅趕器,對動物進行驅趕。這些特別的應用場景對檢測正確率提出了更高的要求,如果頻繁發生錯誤檢測,會對環境造成不利影響以及系統資源的大量浪費。因此,研究適用于PAM 系統的海豚click信號的快速檢測技術具有重要意義。

本文提出了一種適用于PAM 系統的海豚回聲定位信號檢測方法。該方法在保證正確率的前提下,不需要進行FFT變換和頻域分析,從而大大提高了計算速度并有效降低系統算力消耗,從而延長PAM 系統的工作時間。該算法結合了海豚回聲定位信號的時域特征和生物活動特性,從而大幅提高了檢測正確率和工作效率。

1 信號檢測原理

1.1 信號特征分析

鯨豚類動物會發出多種咔嗒聲、口哨聲、唧唧聲等類似的聲音。其中海豚的click 信號是典型的寬頻短時脈沖信號,頻率分布范圍廣,在時、頻域上有明顯的識別特征。不同種類海豚間的聲信號形式相似,但規模不同。其聲特征隨海豚的個體、年齡、生存環境、物種等條件變化都有所區別,click信號的頻率范圍可從幾千赫到大約200 kHz,帶寬從單一頻率到100 kHz,脈沖長度從幾十微秒到幾毫秒。因此,具體應用時應根據目標物種和檢測環境對參數進行修正。

以野外環境中華白海豚發聲信號為樣本開展分析。圖1是廣西北部灣野外環境采集到的經過高通濾波處理(1 kHz)中華白海豚的click聲信號特征圖。從圖1(a)中時域波形圖看,經降噪后click信號表現為瞬態脈沖信號,信號長度約為0.3 ms,信噪比高,有明顯的識別特征。從圖1(b)中的頻譜圖看,click信號頻率覆蓋范圍從幾千赫到約250 kHz,頻率范圍極寬,能量較集中,中心頻率約為100 kHz,峰值頻率為90 kHz??紤]到與其他瞬態噪聲不易區分,檢測方法多從頻域入手,進行帶通濾波后,獲取時頻圖,再利用圖像識別的算法與噪聲進行區分。但圖像處理是個算力密集的過程,對長期被動監測系統以及實時監測場景并不十分適用。綜合考慮計算速度和檢測正確率,應結合常用脈沖信號的時域檢測方法以及信號特征進行處理。

圖1 海豚click信號的特征圖Fig.1 Characteristic figures of dolphin click signal

1.2 檢測流程

根據海豚click 聲信號的時頻特征,可使用信噪比(Signal Noise Ratio,SNR)計算方法進行初步信號檢測,再以計算機自動處理的方法代替人工,大大提高了檢測效率。海豚發聲信號處理流程圖如圖2所示。

圖2 海豚發聲信號處理流程圖Fig.2 Flow chart of dolphin voice signal processing

檢測方法分為以下步驟:

(1)為獲取信號與噪聲的信噪比,需先進行帶通濾波,再計算信噪比參數RSN:

其中:s代表含信號數據的時間序列,分母RMS是信號序列的均方根值(Root Mean Square,RMS),代表噪聲水平,取信號幅度的絕對值,再除以噪聲水平得到。

(2)設置信號檢測門限值TH,當信號數據滿足:

代表檢測到疑似信號數據;相反,所有小于TH的數據視作噪聲數據。信噪比判斷檢測的原理就是通過對信號幅度進行處理,放大有效信號和噪聲的差距,與門限值比較取得大于門限值的數據。

門限值的選擇將直接影響到檢測信號的數量,過高會造成大量遠距離和非主軸信號丟失,過低將大幅增加誤報率。因此,可將靜態門限值轉換成動態門限值,并根據不同環境背景噪聲的信噪比水平設置門限值大小,可以有效降低誤報率。動態門限TH的計算方法考慮了平均噪聲水平s(s=mean(RSN))、疑似信號的數量以及計算的總時間長度t,TH的計算公式為

(3)將幅度高于門限值的數據分組,每組數據組成一個完整的信號,并確定每個信號的起止位置。設置檢測窗口長度為dt,dt由兩個信號間的最小時間間隔決定。將所有滿足RSN>TH的數據位置存入數組X,以數組第一個數據時間為起點,時間記為t(1),第二個數據時間記為t(2),判斷t(2)-t(1)與dt的關系。如果t(2)-t(1)dt,將t(1)~t(n-1)記為第一個信號的時間數組。

1.3 信號篩選

1.2 節的檢測方法處理后可得到數據中所有脈沖形態疑似信號的相關信息,但這些信號中摻雜著大量瞬態噪聲信號,其形態與海豚click 信號極為相似,很難辨別。尤其在野外長時間測量的條件下,將導致非常高的系統誤報率。為進一步提高檢測正確率,本文根據海豚的信號特征和誤報案例,在盡可能不影響計算速度的條件下,提出了信號篩選的方法。

1.3.1 誤報因素分析

結合誤報案例綜合分析,導致高誤報率主要有以下影響因素:

(1)由于海豚距離的不確定,信號強度也有較大的變化,距離較近的海豚click 信號強度,往往海面/海底的一次反射強度已經大于遠處海豚的直達信號。

(2)野外采集環境不同于室內環境,存在大量預期外的寬頻干擾信號,包括人為噪聲、自然噪聲和生物噪聲,典型噪聲源如近海工程、養殖魚類和大量分布的螯蝦等。這些噪聲與海豚click 信號的形態非常相似,常規脈沖信號的檢測方法基本無法判斷。

(3)海豚常聚集活動,因此接收的聲信號偶爾會出現混疊的情況,使信號間隔難以判斷,可能造成誤報。

1.3.2 信號篩選方法

根據上述海豚click 信號的特點,考慮對疑似信號組采用以下篩選方法:

(1)控制信號時間長度

海豚click 信號的時間長度是很重要的信號特征,實際檢測中發現,一些瞬態噪聲信號往往表現出時間長度過長或極短,因此設置時間長度區間作為過濾條件是非常有效的手段。通過設置信號長度門限進行篩選,而干擾信號剛好處于符合時間長度范圍的概率較低,可以大幅降低誤報率。但該值在不同種類海豚間差別較大,應根據檢測目標進行調整。

(2)引入時間間隔參數

對提取結果進行分析,發現很大一部分誤檢信號來源是原信號的海面/海底反射信號。該類干擾信號在各信號特征上與原信號基本相同,因此很難去除。通過引入時間間隔參數,并設置信號間的最小間隔時間,可以有效抑制這類干擾的誤檢。另外,由于該類干擾是伴隨真實信號產生,因此對系統檢測正確率影響較小。

(3)孤立信號去除

click 信號往往是成串出現,因此孤立信號(指在信號前后一定時間范圍內沒有其他信號)極大可能是各種干擾信號,因此采用去除孤立信號的方法可以有效去除部分干擾信號。

進行信號篩選計算后,海豚click 信號算法優化處理效果如圖3所示。圖3中紅圈代表檢測到的疑似信號,虛線代表檢測閾值。通過圖3(a)~3(d)對比可以檢測算法的實際效果。如圖3(a)中共檢測到14個疑似信號,在圖3(b)中經過算法處理去掉了反射信號,僅剩7個疑似信號;同理,圖3(d)去掉了圖3(c)中高幅度的瞬態噪聲信號。

圖3 海豚click信號優化算法處理效果的對比圖Fig.3 Comparison diagram of the processing effects of the dolphin click signal optimization algorithm

2 實例分析

本節用以下實例進行說明。取一段野外環境中采集的含有海豚click 信號的數據段,長度為1 s。待處理的原始信號如圖4所示。該組數據內的click信號不成串,分布較分散,可能含有多只海豚同時發聲的混疊信號,且存在較多干擾,檢測難度大,可以有效檢測本文算法對異常信號的處理效果。通過觀察,數據段內可辨別出9個疑似信號,其中圖4(b)中的6 號信號由于信號幅度較高,含有一個明顯的反射信號,其反射信號的信噪比甚至大于其他正常信號。

圖4 待處理原始信號Fig.4 The raw signal to be processed

圖5分別展示了整段數據和單個信號的不同處理流程。其中圖5(a)~5(c)分別為:濾波后的時域波形圖,干擾信號被有效壓制;經過信噪比方法處理后的數據,每個信號由若干個數據點組成;經過信號篩選算法計算后的處理結果。圖5(d)~5(f)為上述單個信號的處理流程。最終剩下6個有效信號,其中每個信號的位置由峰值位置決定,如圖5(f)所示。

圖5 整段數據和單個信號處理程序示例圖Fig.5 Example diagrams of signal processing for whole data and individual signal

3 數據測試及分析

測試數據來源于項目組開展的海豚聲信號采集實驗。本文選取了同一設備采集的野外和室內兩種生存環境的海豚發聲信號以驗證方法的可靠性。野外采集數據來源于廣西沙田灣海域采集的中華白海豚發聲數據,室內養殖環境采集數據來源于漳州市天柱山海洋世界圈養的寬吻海豚發聲數據。采集使用的水聽器由國內某研究所生產,可滿足cilck 信號的頻段范圍且經過水聲一級計量站校準,信號采樣率為1 MHz。對野外環境和室內環境數據分類討論。

3.1 野外環境

野外記錄海豚發聲數據由于受海洋背景環境、所乘航船的擺動等影響,往往夾雜著復雜的環境噪聲,其中包含溫暖淺海中鼓蝦等生物的活動聲、水動力噪聲以及其他噪聲源如船只、水泵等的噪聲,海豚發出的哨叫聲也會對檢測造成干擾。從頻段分析,海豚click信號分布頻帶較寬,持續時間較短,是典型的脈沖信號;水下艦船輻射噪聲的頻率一般分布在500~1 000 Hz范圍內;海豚哨號信號頻率分布在幾千至幾十千赫,這些噪聲對信號檢測干擾較??;由海風、海流等引起的水動力噪聲頻譜一般分布于0.5~50 kHz之間,是海洋環境噪聲的主要噪聲成分,也是海豚click信號檢測的主要干擾源。

北海沙田灣調查采集到的中華白海豚信號如圖6(a)所示。該數據段存在非常大的幅度起伏,較難辨認信號。分析干擾產生的原因,一是采集環境為野外航船,采集設備隨水流擺動,自噪聲較強;二是水深較淺(一般小于100 m),在海面海底反射、海面風浪的作用下,背景噪聲成分復雜??偟膩碚f,原始數據中存在較大的電流偏置,并包含其他常見噪聲,包括擾動噪聲、采集系統的自噪聲、水動力噪聲,附近船舶的航行噪聲以及其他未知噪聲。為了最大程度去除干擾信號,首先降低信號的偏置電壓,進行50~150 kHz頻帶(中心頻率假設為100 kHz,降低高頻和低頻噪聲干擾,保存大部分信號)帶通濾波得到結果如圖6(b)所示。濾波后,部分干擾信號消失,該段數據中主要包含兩個信號串,每個信號串包含數十個click 信號。通過帶通濾波降噪,部分背景噪聲已經被消除,信號干擾情況顯著改善。

圖6 野外環境采集的海豚信號Fig.6 Dolphin signals collected in the field environment

3.2 室內環境

室內記錄到的數據相對野外采集數據,整體背景噪聲級較低,不存在水流、風浪的影響,信噪比較低的信號也能分辨出來,檢測時應注意門限閾值的設置。以天柱山海洋世界采集到的寬吻海豚發聲信號為例,信號波形如圖7所示。圖7(a)中為采集的原始數據的時域波形圖,該數據段存在一定強度的背景噪聲,根據現場條件推測,主要噪聲源為水池中動物的活動噪聲,換水、增氧、保溫等設備的工作噪聲。對原始信號進行50~150 kHz帶通濾波,得到結果如圖7(b)所示。濾波后,由于部分頻段被截止,信號強度略有下降,環境噪聲明顯下降。

圖7 室內環境采集的海豚信號Fig.7 Dolphin signal collected in indoor environment

3.3 分析和討論

選取了3段野外環境和3段室內環境采集的數據進行測試。所選數據中都含有海豚click信號串,信號采樣率為1 MHz。測試過程中使用本文的快速檢測算法提取信號,使用Adobe Audition軟件人工檢查篩選信號開展驗證,通過時頻特征辨別click信號,統計算法的檢測正確率。由于本文計算使用數字濾波器,PAM 系統為提高計算速度,可使用物理濾波器,因此分別統計了計算過程中濾波和實際計算所消耗的時間;并對數據進行了FFT變換處理(模擬頻譜處理)并統計計算時間作為對比。數據處理結果如表1所示。

表1 本文方法的檢測能力測試結果Table 1 Test results of the detection capability of the proposed method

對于不同環境下采集信號的測試結果,開展以下分析:

(1)對于野外環境信號,誤檢信號多為瞬態噪聲信號以及反射信號;遠距離的反射信號在現有條件下難以區分;超寬頻的瞬態噪聲仍然難以區分存在單個脈沖信號被刪除的情況。漏檢信號基本是低于信噪比門限的信號;信號密度越大,檢測正確率越高;開展功率譜分析可進一步提高檢測正確率,但會降低計算速度。

(2)對于室內環境信號,只存在極少量的瞬態噪聲信號;低背景噪聲使低信噪比的信號可提取。

(3)綜合分析,從計算速度上來看,不考慮濾波時間,本文算法的計算時間僅為FFT處理時間的1/20左右;野外和室內環境的數據處理速度沒有差別;數字濾波的時間大約是檢測計算時間的4 倍。以上的數據代表對明確含有目標信號的數據文件的處理結果,對于大批量只含有噪聲的數據誤報率會不斷增加。因此在后期處理中,可先人工篩選掉沒有信號的噪聲時段,再使用檢測方法,可以大幅提高檢測正確率;對于特殊應用場景,當對檢測正確率有較高要求時,可通過大幅提高檢測門限閾值保證正確率。

4 結論

本文提出了一種基于時域特征的海豚click 信號快速檢測方法,可實現從信噪比低、多干擾的海洋背景噪聲中快速檢測海豚click 發聲信號,具有計算速度快、準確度高的特點。本文所用方法不依靠FFT變換和頻譜分析,從而降低了算力需求,可適用于長期工作的PAM 系統。通過不同采集環境下的數據測試,本文算法對野外環境和室內環境采集的數據檢測正確率均達到90%以上。需要指出的是,文中使用的計算參數只適用于測試使用的中華白海豚和寬吻海豚的發聲數據,實際應用時根據目標種類和檢測環境對參數進行修正。另外,對其他種類的海豚,本文的方法可能會出現不適用的情況。本文方法可為海豚回聲定位信號的聲學被動長時間監測以及相關設備的研發提供技術支持。

猜你喜歡
海豚正確率信噪比
海豚
門診分診服務態度與正確率對護患關系的影響
基于深度學習的無人機數據鏈信噪比估計算法
海豚的自愈術
低信噪比下LFMCW信號調頻參數估計
低信噪比下基于Hough變換的前視陣列SAR稀疏三維成像
生意
品管圈活動在提高介入手術安全核查正確率中的應用
生意
保持信噪比的相位分解反褶積方法研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合