?

基于小波包分析的玻璃破碎聲音識別系統設計

2018-02-05 01:45,,
計算機測量與控制 2018年1期
關鍵詞:波包家居模板

,,

(電氣與信息工程學院,西安 710021)

0 引言

近年來,隨著物聯網、云計算等技術不斷發展,計算機、通信和控制技術已逐步應用到家庭生活中[1]?,F代家居一般使用防盜網和防盜窗實現安防功能,但若出現例如火災這類突發事件時,這類家庭無法及時做好逃生工作,存在著較大的安全隱患。所以在家庭裝修設計時,一般會預留幾個窗戶不安裝防盜網,這也為家庭留下了極大的安全隱患。

目前有相關學者在安防系統中利用視頻采集玻璃破碎的圖像并處理、單技術振動式傳感器檢測玻璃破碎等家居安防方面進行了相關研究,并已實現相關功能,但振動式傳感器體積大,安裝時需緊貼玻璃,不美觀[2]。國內對于家居的綜合安防比較少,并未涉及整個家居安防系統中玻璃破碎的檢測和管理。

玻璃破碎聲音包含了較多的信息量,且易于獲取,但它的識別存在著家居內背景聲音的干擾。由實驗可知,玻璃撞擊時的聲音無噪聲干擾的低頻段范圍在0~1 kHz,破碎時聲音高頻段范圍在5~15 kHz,它的聲音信號的頻譜包含相對豐富的高頻成分。家居內的背景聲音(酒瓶摔碎、敲門、閉門、拖鞋走路等)離玻璃較近,存在著背景聲音的干擾,酒瓶摔碎聲音頻段范圍在50 Hz~16 kHz,敲門的聲音頻段范圍在0~1 kHz,閉門的聲音頻段范圍在3~11 kHz,拖鞋走路聲音低頻段范圍在1~200 Hz,高頻段范圍在500 Hz~3 kHz。

針對玻璃破碎聲音和背景聲音時頻特性進行分析。傳統的聲音信號處理采用傅里葉變換,提取Mel頻率倒譜系數(MFCC)作為特征參數[3]。一般假設聲音信號是短時平穩的,用固定的傅里葉窗得到的,會使聲音的頻譜細節特征模糊,丟失一定的信息,且傅里葉變換揭示了信號在頻域的特征,但不能顯示出這些頻率出現的時刻[4]。此外,玻璃破碎聲音和酒瓶摔碎的聲音頻域上體現出較難區分的特征參數,而在時域上平均過零率、短時平均幅度分布等特征參數體現出較為明顯的差異。

小波變換通過有限個基函數在尺度-頻率域上對信號進行分析,在控制分辨率的同時,保留了時域信息,適合于時域和頻域相結合的信號分析系統,并且小波變換在分析頻段的恒Q(品質因數)特性與人耳聽覺對信號的加工特點相一致。而玻璃破碎聲音既同時包含低頻段和高頻段聲音頻譜。小波包分析是在小波變換的基礎上對高頻信號進行進一步的分析,得到小波能量系數[5]。

針對以上問題,文中設計了一個基于小波包分析的玻璃破碎聲音識別系統。采用小波包分析對家居內的聲音進行檢測與識別,從而更準確的判斷家居內聲音的類型和玻璃破碎的聲音,提高玻璃破碎聲音識別系統的識別率。

1 系統方案設計

考慮到識別系統安放的位置與玻璃之間的遠近對幅值和功率的影響,玻璃破碎聲音識別系統以長為7米,寬7米,高3米的家居為研究對象。識別系統安放在家居內窗戶的玻璃前,主要實現玻璃破碎聲音信號的采集、識別和報警功能。它的基本原理是從實時采集的家居內的玻璃破碎聲音中,提取能反映其特征的參數,建立模板匹配,與家居內的典型聲音(如酒瓶摔碎、敲門、閉門、走路等)進行分辨,得出識別結果。聲音采集模塊在實時監測家居內的聲音,如果家居內發生玻璃破碎,則在LCD觸摸屏上出現報警信息,若5秒內未在LCD觸摸屏上撤防,則判斷為非法入侵,系統自動通過GSM模塊向主人發送報警信息。利用此系統能夠實現家居內玻璃破碎的自動檢測,避免因非法入侵窗戶造成的財產損失,實現家居內安防系統管理的信息化。玻璃破碎聲音識別系統總體框圖如圖1。

圖1 玻璃破碎聲音識別系統總體框

2 系統硬件設計

玻璃破碎聲音識別系統以DSP C5402為主控器,玻璃破碎聲音識別系統硬件組成原理圖如圖2所示。

圖2 玻璃破碎聲音識別系統硬件組成原理圖

2.1 聲音采集模塊設計

針對玻璃破碎聲音和背景噪聲的頻段差異,本文擬采用拾音器獲取玻璃破碎的聲音,通過聲音放大器(MAX9814)進行放大,放大后的信號進入抗混疊濾波器(MAX7425)進行濾波,采集到聲音經過放大和抗混疊濾波后,通過A/D轉換,將數字信號送入DSP處理器中。

2.2 聲音處理模塊設計

聲音處理模塊由DSP處理器、存儲器、JTAG接口和串口組成。DSP處理器采用的是C5402定點低功耗系列,處理速度在80~400 MIPS,雙電源供電,提供擴展存儲器接口和A/D采樣接口。

2.3 通信模塊設計

國內的無線通訊方式主要有Zigbee、WIFI、藍牙和GSM(global system for mobile communication)等,考慮到現代人們使用手機較為廣泛,且利用手機短信方式傳輸信息非常方便,本文選用了安全性較高、抗干擾性較好、不受全球地理位置限制的GSM全球移動通信系統,滿足系統通信實時性的要求。GSM根據提供的數據傳輸速率又可以分為GPRS模塊、EDGE模塊、3 G模塊和短信模塊。本系統所使用的是純短信模塊,短信模塊只支持短信服務。

3 系統算法設計

玻璃破碎聲音識別算法分為聲音前端信號處理、模板訓練、特征系數提取和模板匹配4個階段。系統算法圖如圖3所示。

圖3 DSP處理聲音處理原理圖

3.1 聲音前端信號處理

在DSP聲音信號處理中,有一些共同的聲音信號需進行預加重、分幀、加窗等前端處理[6]。根據香農定理中所要求的,為了完全地表示采樣的模擬信號,聲音信號的采樣頻率至少為固有頻率的2 倍,背景聲音信號的頻率范圍在0~15 Hz內,玻璃撞擊時的聲音無噪聲干擾的低頻段范圍在0~1 kHz,破碎時聲音高頻段范圍在5~15 kHz,因此擬定采樣頻率為30 kHz。隨后進行A/D轉換,將模擬的聲音信號轉化為數字信號,再進行預加重,預加重可以充分提高玻璃破碎聲音信號的高頻特征,從而保持在整個頻帶中,低頻到高頻均可以用同樣的信噪比得到頻譜。預加重數字濾波器公式為:

H(z)=1-αz-1

(1)

其中:α指的是預加重系數,一般情況下接近數值1。

玻璃破碎的聲音信號是非平穩性的時域信號,但具有短時平穩特性,在對聲音處理的過程中,需對信號進行分幀,幀長取10~30 ms,得到聲音幀。聲音信號在分幀處理后,為了減少分幀處理所帶來的頻譜泄露,對分幀后的信號進行加窗處理。本文采用漢寧窗,一個N點的漢寧窗函數在時域表現形式如下:

(2)

其中:k=1,2,…,N。

3.2 特征系數提取

考慮到玻璃破碎信號的非平穩性瞬時間變化的特點,既想了解信號的頻譜特征,又想獲取這些頻率出現的時刻,因此,特征系數的提取需從時域和頻域兩個方面進行。

在時域分析中,系統對聲音信號的波形進行分析,選取短時平均幅度和短時過零率確定兩個門限。短時平均幅度是表示聲音信號一幀能量的多少。短時過零率是個比較低的門限,其數值比較小,對信號的變化比較敏感,它可以從背景聲音中找出聲音信號,判斷聲音的起始點和結束點。

(3)

(4)

(5)

在實驗中發現,家居內背景噪聲小時,用短時平均幅度識別較為有效,背景噪聲大時,用短時過零率有更加顯著地效果。

在頻域分析中,理論上可以采用任何形式的小波函數對玻璃破碎聲音信號進行分解[7]。小波包系數分解后尺度空間的能量分布是玻璃破碎聲音的本質特征,可用于系統識別分類。

由于變換域是離散有限長,家居內背景噪聲范圍集中在5 kHz以下,玻璃破碎的聲音主要集中在高頻部分,因此,需要對玻璃聲音高頻處和低頻處的細節信息進行劃分,同時為了減少特征維數便于計算方便和處理,本文采用離散小波包分析來提取尺度空間上的能量分布特征。首先對每一幀聲音信號進行離散小波包分析,根據變換后的小波包系數計算信號的高頻能量,確定當前幀的動態閾值。當檢測到當前幀為玻璃破碎聲音的起始點時,取一段時間較長的聲音段信號(通常取2 s時間長度的聲音),將該段聲音信號在時間軸反轉,再施以起始點檢測的算法確定終點,提取有效的聲音段。

(6)

設ψ0,0(t)=ψ(t)由上述離散小波分析定義信號s(t)的離散小波變換為:

Ws(m,n)=DWT[s(t)]==

(7)

玻璃破碎聲音信號的特征系數提取過程如圖4所示。

小波包分析提取特征信息的基本步驟為:

1)對聲音信號進行N層小波分解,重構出第N層的小波包系數S(N,0)、S(N,1)...S(N,2N-1)。即S(i,j),i=0,1,2…N,j=0,1,…2N-1。

2)求各頻帶下的總能量。第N層的各重構分解信號的能量定義為:

(8)

信號的總能量為:

ENj=EN0+EN1+EN2+...+EN2N-1

(9)

3)構建特征向量。當能量較大時,可以用第M層各分解信號的能量百分比Ej/E來構成能量特征向量,即:

T=[EN0/E+EN1/E+...+EN2N-1/E]

(10)

最后選擇部分尺度空間能量組成玻璃破碎聲音的特征向量,主要是選擇那些能量相對集中的尺度空間,這樣既能充分利用頻譜信息,使玻璃破碎聲音信號的主要能量特征得以增強,又能減小特征維數,加快分類速度。

3.3 模板訓練

在提取到聲音的特征參數后,需進行模板訓練,建立一個模板庫,所有作為模板的特征都應該保存在這個模板庫中,以便進行匹配。在模板訓練階段,首先確定訓練的玻璃破碎信號的樣本。系統對這些訓練樣本進行預處理,估計玻璃破碎聲音的最初模型參數,進行模型訓練,通過反復訓練迭代,確定玻璃破碎聲音信號的模型參數,建立玻璃破碎聲音信號的模板庫。

隱馬爾科夫模型(HMM)是處理聲音信號中廣泛應用的一種訓練和統計模型,由于玻璃破碎聲音信號是一種時變信號,而HMM能夠很好地表征時變信號[8],因此,利用HMM對玻璃破碎聲音進行建立模型。

HMM是一個雙內嵌式隨機過程,其中,一個隨機過程描述狀態的轉移,另一個隨機過程描述觀察值和狀態之間的統計對應關系[9]。HMM可以用一個五元數組:λ=(P,Q,a,M,A)描述,其中,P為模型中的狀態數目,Q為每個狀態可能的觀察值數目,a表示初始狀態概率,M表示狀態轉移概率矩陣,A=[aij]表示觀察概率矩陣。由于在算法識別過程中狀態數目和觀察值數目不變,HMM簡寫為:λ=(a,M,A)。

隱馬爾科夫有3種算法:前向-后向算法、Viterbi算法和Baum-Welch算法[10]。

Baum-Welch算法可以描述為:給定一個觀察值序列O=O1,O2,O3...OT和初始參數λ=(a,M,A),使觀察序列O相對于λ的的概率P=(O|λ)最大。

Viterbi算法可描述為:給定一個觀察值序列O=O1,O2,O3...OT和初始參數λ=(a,M,A),如何確定未知序列K=K1,K2,K3...KT的P=(K,O|λ)最大時的最佳狀態序列K*=K1*,K2*,K3*...KT*。

因此,在玻璃破碎聲音識別系統的隱馬爾科夫模型(HMM)訓練中采用Baum-Welch算法,HMM識別中采用Viterbi算法。對于要識別的玻璃破碎聲音信號,可算出玻璃破碎聲音特征通過每個HMM模型的概率P=(K,O|λt),其中輸出概率最大的模型作為識別結果。

3.4 模板識別

采用HMM的聲音檢測系統對玻璃破碎聲音進行模板匹配。采集到一段聲音,對它進行預處理,然后提取特征參數, 隨后將提取的每一幀玻璃破碎聲音信號的特征參數帶入HMM識別系統,利用Viterbi算法與已經建立的玻璃破碎聲音模板庫中的模板進行逐一的匹配比較,計算出匹配概率,通過匹配概率確定是否為玻璃破碎信號,輸出識別的結果。

4 實驗分析

4.1 實驗條件

本文實驗樣本一部分為家居內現場錄制,一部分為網上標準聲音下載,樣本精度為16 bit/ms,采樣頻率為30 kHz,使用MATLAB作為仿真平臺。采集的家居內的聲音包括玻璃破碎聲音和非玻璃破碎聲音,非玻璃破碎聲音包括家居內其他聲音(酒瓶 摔碎、敲門、閉門、走路、咳嗽等)。其中玻璃破碎聲音有100個樣本,非玻璃破碎聲音有200個樣本。玻璃破碎的原始信號圖如圖5所示,對該信號進行去噪處理如圖6所示。

圖5 玻璃破碎的時域信號圖

圖6 玻璃破碎的去噪圖

本來分別提取了3種參數(LPCC、MFCC和小波參數)進行對比實驗。LPCC參數采用遞推求解得到22階LPCC系數的方法,幀長25 ms。MFCC參數提取時數字濾波器組選24個,對處理過的聲音信號反離散余弦變換后得到12個小波包能量系數再計算其一階差分12個共24維。

在時域上對玻璃破碎聲音進行短時能量和短時過零率分析如圖7所示。

圖7 玻璃破碎聲音時域分析

可看出,家居內監測有異常聲音時短時能量大,沒有異常聲音時短時能量很小近似于零;當玻璃破碎時過零率大,玻璃破碎前過零率小。

小波包能量系數提取時將傳感器采集到的玻璃破碎聲音信號進行分幀處理,信號的分幀長度為25 ms,幀移為8 ms。通過實驗測試,劃分到5層的小波信號細節信息較為清晰,可達到精度16 bit/ms。因此,本實驗采用5層小波包分解,將聲音信號分解到高頻和低頻空間,再將高頻空間a1(n)和低頻空間d1(n)繼續分解低頻空間a2(n),一直分解到5層后得到d1(n)-d5(n)和a1(n)-a5(n)10個不同的頻率信號,得到小波在低頻和高頻處的細節信息,其中d1(n)-d5(n)和a1(n)-a5(n)可表征原信號所有的頻率信號。

設eNj為第j級尺度細節空間的能量,則5級尺度下能量組成的特征向量可表示為:

T=(EN0,EN1,EN2,EN3,EN4)

(11)

在HMM識別階段,一段聲音的每個音段都對應了一些狀態,每個狀態又代表了不同的聲音特征序列,玻璃破碎聲音特征序列用狀態圖如圖8所示。

圖8 玻璃破碎識別中的HMM圖

由圖可看出,聲音信號下一幀處于何種狀態的概率只取決于當前的狀態,而與以前的狀態無關。從一個狀態進入下一個狀態的概率為P,保留在本狀態的概率為1-P,將每幀所屬的狀態標明,就可將聲音特征序列轉化成為一個狀態的排列。用這個排列匹配一個特定的聲音段,得到一個觀察序列概率,最后選擇一個概率最大的觀察序列,即為家居內聲音識別的結果。

4.2 實驗結果

將實驗樣本分為訓練樣本和測試樣本:訓練為總數的90%,測試樣本為剩余10%的樣本。每組實驗做10次,列出每類聲音的平均識別率,最后對不同特征組合下的識別率進行比較。不同特征參數的識別結果如表1所示。

表1 不同特征參數的識別結果

由表1可知,對于相同的樣本,選取小波包系數作為特征時的正確率比選取MFCC作為特征的正碎聲音信號的非平穩性。從玻璃破碎聲音和家居內其他聲音的總識別率可以看出,選取小波包系數作特征參數時,用HMM模型能夠準確地分辨玻璃破碎聲音和非玻璃破碎聲音,說明玻璃破碎聲音和非玻璃破碎聲音信號的小波包系數存在較大的差異。

由以上實驗可得結論:利用特征參數小波包系數和隱馬爾科夫模型HMM對于玻璃破碎聲音的識別是可行的,識別率達93%。

5 總結

經過實驗測試表明:該系統能夠對家居內的玻璃破碎聲音進行采集和識別,系統易于安裝,靈活性好,且能夠有效、準確地監測家居內玻璃破碎聲音的信息,切實保障家居內財產安全,同時為國內非語音識別提供技術支持,具有一定的推廣價值。

[1]Zhu Qinghua.Analysis of Security Monitoring Technology in the Era of Internet of Things[J]. Value Engineering,2016,3(1):113-114.

[2]Rogers J.ADT Raising Old Allegations in New Suit against Vision Security[J].Enterprise/salt Lake City,2013,43 (15):4-8.

[3]李偉紅,田真真,龔衛國,等.改進的ESMD用于公共場所異常聲音特征提取[J].儀器儀表學報,2016,37(11):2429-2437.

[4]常 飛,喬 欣,張 申,等.基于MFCC特征提取的故障預測與評價方法[J].計算機應用研究,2015,32(6):1716-1719.

[5]張文霞,楊 元.小波包分析在故障特征提取與識別中的應用[J]. 信息通信,2012,11(03):14-15.

[6]郭莉莉.智能家居中語音識別系統的算法研究[A].中共沈陽市委、沈陽市人民政府、中國農學會.第十三屆沈陽科學學術年會論文集(理工農醫)[C].中共沈陽市委、沈陽市人民政府、中國農學會,2016:5.

[7]蔣翠清,李天翼.基于小波MFCC與HMM的列車鳴笛識別算法研究[J].中國管理信息化,2015,2(06):72-73.

[8]張芝旖,姚恩濤,石 玉.小波分析和MFCC融合的聲音信號端點檢測算法[J].電子測量技術,2016,39(07):62-66.

[9]韓寶珠.基于小波分析和在線極限學習機的滾動軸承故障診斷方法研究[D].北京:北京交通大學,2016.

[10]陳貴亮,周曉晨,李 晨,等.基于HMM的下肢表面肌電信號模式識別的研究[J].機械設計與制造,2015,4(1):39-42.

猜你喜歡
波包家居模板
鋁模板在高層建筑施工中的應用
高層建筑中鋁模板系統組成與應用
鋁模板在高層建筑施工中的應用
打造日常家居“氛圍感”
基于支持向量機和小波包變換的EOG信號睡眠分期
基于動態閾值函數的改進小波包遙測信號去噪方法
Inventors and Inventions
基于小波包的鍋爐爐管聲波信號自適應壓縮感知
臺北家居
《數碼家居》2009年下半年推薦榜
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合