?

希爾伯特黃改進算法在語音增強中的應用

2013-07-10 04:52楠,鄧
關鍵詞:增量小波信噪比

李 楠,鄧 舒

(東北電力大學信息工程學院,吉林吉林132012)

0 引言

語音是人類最重要的交流工具,在語音通信、識別等領域,語音信號常常受到傳輸系統或周圍環境的噪聲影響而使聽者無法識別出說話者的內容。目前,研究較多的語音消噪方法有譜減法、MMSE 譜估計法和小波方法等。譜減算法[1]在假設語音信號是短時平穩這一特性上提出,與實際語音特性有點不符,所以消噪后的結果不太理想,而且還會引入“音樂噪聲”;MMSE 譜估計法[2]必須要對語音頻譜進行統計估計,語音頻譜的估計結果對最后的消噪結果有很大影響,而且算法計算量較大;小波方法[3-4]對語音去噪結果受到小波基的限制,不同小波基產生的消噪結果也不相同,算法缺乏通用性。

希爾伯特黃變換(HHT)克服傳統方法上的不足,它是一種自適應時域分析方法,不需要選擇基函數來對信號進行分解,可以根據信號局部的時變特征進行時頻分解得到信號的瞬時頻率,能夠真實地描述信號的物理特征[5]?,F有HHT 語音消噪算法主要是以結合閾值算法來進行語音去噪[5-6],但是針對不同語音信號,選擇的閾值不同,不具有普遍性而且消噪結果并不令人滿意。本文利用奇異值分解(SVD)算法來改善這一問題,奇異值分解方法是一種非線性濾波方法,對于處理非線性、非平穩信號具有良好的數值穩健性,本文提出一種基于希爾伯特黃和奇異值分解的語音消噪方法,該方法的消噪效果優于傳統的方法。

1 希爾伯特黃變換

希爾伯特黃變換是一種分析非線性、非平穩信號的有效方法,這一方法提出了固有模態函數(IMF)的概念和經驗篩選(EMD)的方法。固有模態函數是一種簡單的振動模式,它是由經驗模態分解得到的。IMF 必須滿足以下兩個條件:

①在整個信號長度上,一個IMF 的極值點和過零點數目必須相等或至多只相差一個。

②在任意時刻,由極大值點定義的上包絡線與極小值點定義的下包絡的平均值為零。

經驗模態分解算法就是把信號分解成許多固有模態函數。具體步驟如下:

假設任意的信號s(t),首先求出信號的所有極大值點和極小值點,利用三次樣條插值得到信號的上、下包絡,求出上、下包絡線的平均值,即為m1,然后得到s(t)與m1差值記為c1,即

如果得到的差值c1滿足IMF 的兩個條件,就認為它是第1 個IMF 分量,記為h1。如果c1不滿足IMF的兩個條件,把c1作為新的數據,重復上面步驟,直到差值滿足IMF 的兩個條件,就認為它為第1 個IMF分量。將原信號減去第1 個IMF 分量,即

式中,r1稱為逼近分量,該過程為一次篩選。將r1視為新s(t),重復以上過程,就可以篩選出第2 個IMF分量h2,第3 個IMF 分量h3,…。篩選的終止條件是rn足夠小或它是一個單調函數,最后得到解釋式為

由此可知,信號是由多個單分量信號組成的,每一個IMF 分量反映了信號的特征尺度。通過EMD分解,把信號分解成不同的特征信號[6]。

2 奇異值分解算法

奇異值分解是一種非線性濾波,它把有用信號矩陣分解成一系列奇異值和奇異值矢量對應的時域子空間。首先,將帶噪信號構造成hankel 矩陣,然后,通過對hankel 矩陣進行奇異值分解得到有用信號的奇異譜,通過奇異譜確定奇異階數,這樣就能比較直觀地、自適應地對信號進行消噪。

假設帶噪信號為X=[x1,x2,x3,x4,…,xN],構造成hankel 矩陣Dm

其中,1 <n <N,而且n + m +1 = N;Dm∈?m×n。

根據奇異值分解理論,對Dm進行奇異值分解,存在一個m × l 維矩陣U、一個l × l 維矩陣Λ 和一個n ×l 維矩陣V,Dm= UΛVT。對角矩陣Λ 的主對角線元素Λ = diag(λ1,λ2,λ3,…),其對角陣的元素是Dm的奇異值,且λ1≥λ2≥λ3≥…λn≥0。

由于信息熵是考察信號所包含的信息量的指標之一,引用了奇異熵的概念,

式中,k 為奇異熵階次;△Ei為奇異熵在階次i 處增量,

奇異熵對于信號信噪比變化十分敏感,對于未受噪聲干擾的原始信號,在低階次的奇異熵增量就達到飽和,它的奇異熵增值平穩在一個合適的常數,這就說明信號的信息量達到飽和。帶噪信號的奇異熵增值隨著階次的增加而逐漸減少,這就說明信號的信息量受到噪聲的影響會隨著降噪階次的升高而下降,但最終也會達到飽和。信號信噪比越低,奇異熵增量的遞減的速度也就越快,達到飽和的速度也就越快。信號信噪比較高時,奇異熵增量值是緩慢減小,達到飽和度的速度比較慢。但對于同一信號,不管信噪比是高還是低,降噪飽和度階次是一樣的。所以,可以利用這一特點來準確的確定所需降噪的階次[7-13]。

3 基于HHT-SVD 的語音消噪新算法

3.1 帶噪語音信號模型

現實生活中的噪聲多是以加性噪聲為主,因此,只討論語音信號被加性噪聲污染的去噪模型

式中,y(t)是帶噪的語音信號;x(t)是純凈的語音信號;n(t)是白噪聲,白噪聲的均值與時間無關,它的功率譜密度是一個常數的隨機信號。

3.2 新算法的主要步驟及流程

該文根據EMD 分解得到語音信號的特性,提出基于HHT-SVD 的語音消噪算法。圖1 為本文算法的流程圖,算法步驟如下:

(Ⅰ)帶噪語音信號通過EMD 分解,得到具有不同頻率的單分量信號,即為IMF 分量。

(Ⅱ)通常前3 個IMF 分量為高頻分量,含有大量噪聲和語音清音部分,因此利用軟閾值進行處理。

(Ⅲ)剩下IMF 分量認為是較低頻分量,含有少量的噪聲信號,進行相空間重構的奇異值分解處理。

(Ⅳ)對各個IMF 分量進行EMD 重構,得到消噪后的語音信號。

圖1 HHT-SVD 的算法流程圖

4 仿真結果與分析

4.1 實驗1

實驗1 所選的純凈語音為女聲“one”,采樣頻率為10 kHz,16 bit 量化,采樣點數為8 000。將這段語音信號疊加上N(0,σ2)的高斯白噪聲。輸入信噪比為-4 的帶噪語音信號,如圖2 所示。將純凈語音信號和帶噪語音信號分別進行EMD分解后,得到各自的IMF 分量,如圖3 所示。限于篇幅,圖3 中只列出前8 個IMF 分量。經驗模態分解算法可以把語音信號分解成各個頻率不同的單分量信號。由圖3 對比可知:高頻分量信號中包含了大量的噪聲和少量有用的語音信號,通過分解得到波形可以發現少量的有用語音其實是語音信號清音部分,它的波形類似于白噪聲,頻率高,能量小。如果把高頻分量信號完全抑制會影響到語音信號的可懂性。

圖2 輸入信噪比為-4 的帶噪語音信號

圖3 純語音信號和帶噪語音信號的EMD 分解

EMD 分解得到的較低頻部分含有大量的語音信號和少量的噪聲含量,由于語音信號的濁音部分能量大多處于較低頻段內,因此,EMD 的分解在較低頻段內的語音信號是濁音信號,但是EMD 是根據信號自身特性進行自適應的分解,因此,分解出較低頻段內頻率相同的噪聲含量。

利用HHT-SVD 進行語音消噪處理時,SVD 降噪階次的確定是關鍵步驟,理論研究表明可以根據奇異熵的增量變化來確定SVD 的降噪階數。圖4 給出了各IMF 分量的奇異熵增量與降噪階數的關系。由圖4 可以看出:IMF1 ~IMF3 分量由于噪聲含量過大,使得奇異熵增量最后不能趨于一個常數,不能很好的確定降噪階數。所以本文針對IMF1 ~IMF3 利用軟閾值進行處理。對于IMF4 ~IMF11 分量奇異熵增量最后都能趨于一個常數,因此,可以根據奇異熵增量確定降噪階數,進行SVD 消噪。

圖4 輸入信噪比為-4 各階IMF 奇異熵增量

利用小波、傳統HHT 及小波算法對帶噪語音信號進行消噪,結果如圖5 所示。仿真結果表明:傳統的小波和HHT 方法不能大量的去除噪聲,而且消噪后的語音信號可懂度也受到了影響。本文的方法不但能大量的去除噪聲,而且還保留少量語音清音部分,提高語音的可懂度。

圖5 輸入信噪比為4 dB 的語音文本下本文方法與小波、傳統HHT 方法的比較

改變輸入噪聲方差σ2,可以得到不同的輸入信噪比的語音信號。不同算法的輸入信噪比與輸出信噪比的對比關系如表1 所示。在輸入信噪比較高的情況下,利用HHT-SVD 算法消噪后得到的輸出信噪比明顯高于小波和傳統HHT算法消噪后的信噪比。在輸入信噪比較低的情況下,利用HHT-SVD 算法消噪的效果略高于小波和傳統HHT 算法消噪的效果。因此,本文算法能夠有效的去除噪聲,而且去噪效果優于小波和傳統HHT 算法。

4.2 實驗2

表1 幾種算法的性能比較

實驗2 所選語音為女聲“你好”,采樣頻率為22 050 Hz,語音采樣點數為55 130。該語音是在實際環境中用Windows 錄音機錄制的一段語音信號,這段語音中的噪聲源由老舊風扇扇葉聲和舊電腦的系統聲音構成。對比結果如圖6 所示,與小波方法和傳統的HHT 方法相比,本文的方法也能夠大量的去除實際的帶噪語音信號里的背景噪聲,而且沒有降低語音的可懂度。

圖6 實際帶噪語音去噪算法對比

5 結束語

本文是將希爾伯特黃和奇異值分解算法相結合來對帶噪語音信號進行消噪處理,針對語音信號不同頻段特性,采用不同的消噪方法。高頻段采用軟閾值去噪,低頻段利用奇異熵增量值確定消噪階數后采用SVD方法去噪。仿真實驗表明:兩者結合消噪效果優于采用單一方法的去噪效果,輸出信噪比得到明顯提高,同時也改善了語音質量。

[1] Boll S F. Suppresion of Acoustic Noise in Speech Using Spectral Subtraction[J]. IEEE Trans Acoust Speech Signal Process,1979,27:113-120.

[2] Ephraim Y,Malah D.Speech Enhancement Using a Minimum Mean-square Error Short-time Spectral Amplitude Estimator[J].IEEE Trans Acoust Speech Signal Process,1984,32:1109-1121.

[3] 李野,吳亞鋒,劉雪飛.基于感知小波變換的語音增強方法研究[J].計算機應用研究,2009,26(4):1313-1315.

[4] 劉雅琴,周煒.基于小波變換的說話人語音特征參數提?。跩].河南科技大學學報:自然科學版,2005,26(4):44-46.

[5] 宋倩倩,于鳳芹.基于Hilbert-Huang 變換和聽覺掩蔽的語音增強算法[J].聲學技術,2009,28(3):280-283.

[6] Zou X J,Li X Y,Zhang R. Speech Enhancement Based on Hilbert-huang Transform Theory[J]. Proceeding of the First International Multisymposiums on Computer and Computational Sciences,2006(4):2581-2586.

[7] Xin L R,Feng W D,Pu H.On the Application of SVD in Fault Diagnosis[J].Proceeding of IEEE International Conference on Susytems,Man and Emetics,2003(4):3763-3768.

[8] Norden E H,Zhang S,Steven R L,et al.The Empirical Mode Decomposition and the Hilbert Spectrum for Nonlinear and Nonstationary Time Series Analysis[J].Proc R Soc Lond A,1998,454:903-995.

[9] 鐘佑明,秦樹人,湯寶平.Hilbert-Huang 變換的理論研究[J].振動與沖擊,2002,21(4):13-17.

[10] 胡謀法,董文娟,王書宏,等.奇異值分解通濾波背景抑制和去噪[J].電子學報,2008,36(1):111-116.

[11] 王太勇,王正英,胥永剛,等.基于SVD 降的經驗模式分解及其工程應用[J].振動與沖擊,2005,24(4):96-98.

[12] 梁霖,徐光華,侯成剛.基于奇異值分解的連續小波消噪方法[J].西安交通大學學報,2004,38(9):904-908.

[13] 王艷,金太東,杜明娟,等.改進的小波變換閾值去噪方法[J].河南科技大學學報:自然科學版,2007,28(3):46-48.

猜你喜歡
增量小波信噪比
兩種64排GE CT冠脈成像信噪比與劑量對比分析研究
提質和增量之間的“辯證”
構造Daubechies小波的一些注記
基于MATLAB的小波降噪研究
“價增量減”型應用題點撥
基于深度學習的無人機數據鏈信噪比估計算法
低信噪比下基于Hough變換的前視陣列SAR稀疏三維成像
基于改進的G-SVS LMS 與冗余提升小波的滾動軸承故障診斷
基于均衡增量近鄰查詢的位置隱私保護方法
保持信噪比的相位分解反褶積方法研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合