?

基于短時相位譜補償的非接觸語音檢測增強算法研究

2013-07-31 16:16薛慧君李盛路國華呂昊張楊焦騰于霄馬騰張華王健琪
中國醫療設備 2013年11期
關鍵詞:維納濾波背景噪聲語音

薛慧君,李盛,路國華,呂昊,張楊,焦騰,于霄,馬騰,張華,王健琪

第四軍醫大學 生物醫學工程學院,陜西 西安 710032

基于短時相位譜補償的非接觸語音檢測增強算法研究

薛慧君,李盛,路國華,呂昊,張楊,焦騰,于霄,馬騰,張華,王健琪

第四軍醫大學 生物醫學工程學院,陜西 西安 710032

語音是人類重要的生理信號,生物雷達能夠通過檢測喉部發音器官振動的微弱信息對語音進行非接觸采集,從而提供一種新型的非接觸語音獲取方法。但生物雷達所接收的含有語音信息的回波中還存在多種噪聲和雜波。本文采用離散短時傅立葉變換,在保持語音信號振幅譜不變的條件下通過改變相位譜來對信號譜進行重構,達到去除雷達語音信號中噪聲分量的目的。通過與經典的譜減法和維納濾波語音增強算法進行對比,此算法能夠在低信噪比條件下有效地降低噪聲分量,可提高生物雷達語音信號質量。

生物雷達;離散短時傅立葉變換;相位譜補償;語音檢測;非接觸檢測

生物雷達技術是近年來新興的一種非接觸式生理信息檢測技術,雷達天線發射電磁波照射人體后,人體生理活動所導致的人體微動信號加載到反射波中,再通過雷達技術、生物醫學信號處理技術以及計算機技術從雷達回波信號中檢測人體的生命參數,從而實現人體呼吸、體動、心跳等生命特征的非接觸探測。本實驗室采用生物雷達技術,通過檢測喉部發音器官振動的微弱信息對語音進行采集。生物雷達探測語音信號在一定程度上克服了麥克風的局限性,可實現遠距離探測,具有方向性強、非接觸等優點。雷達接收信號中,除了目標語音信號,還存在噪聲和雜波等各種干擾信號,所以在雷達信號處理中,如何去除噪聲干擾,保留雷達回波中清晰的語音信號是雷達語音增強的關鍵問題。

在語音增強領域,大多研究都致力于去除含噪語音信號中的噪聲部分,以提高信號的可懂度和語音質量。因此各種各樣的算法被用來實現語音增強,比如譜減法[1]、最小均方誤差估計[2]、維納濾波[3-4]、卡爾曼濾波[5]和子空間法等[6]。在雷達語音增強方面,李盛和田穎等人分別采用了 非 線 性 譜 減 法、 人 耳 聽 覺 掩 蔽[7-8]、 小 波 閾 值 熵[9]和 高階統計量[10]等算法來去除信號噪聲,這些算法雖然在一定程度上達到了去噪的目的,但實驗結果表明還需要進一步研究來提高雷達語音質量。經典的語音增強算法都在保持短時信號的相位譜不變的情況下來改變短時信號的振幅譜。本文通過改變含噪信號的相位譜而保持其振幅譜不變來生成一個新型復合頻譜[11]。由于噪聲信號主要存在于低頻部分,而重構后的信號譜中的低頻能量丟失較多,所以此種算法能夠達到去噪目的。

1 語音增強方法

1.1 生物雷達實驗系統

鎖相振蕩器產生穩定的 34 GHz、功率為 50 mW 的毫米波脈沖信號,經放大器進行放大,由 6 dB 的定向耦合器將其分為兩路:其中 1/4 mm 波信號送往混頻器作為參考信號;其余信號通過環形器到達平板天線進行輸出,天線輻射功率保持在 10~20 mW。天線發射微波束到達人體,雷達信號被人體的胸部和喉的振動信號調制,所反射的回波信號由同一天線進行接收,回波信號與參考信號通過雙平衡混頻器發出低頻信號,低頻信號通過放大、濾波、A/D 轉換輸入計算機進行進一步的信號處理。詳細的系統描述及實驗原理詳見參考文獻[7-8]。

1.2 相位補償算法

本文遵循信號分解—參量修正—信號重構的步驟來實現雷達語音增強[12-13]。算法流程,見圖 1。

圖1 雷達語音增強方法原理圖

(1)信號分解。使用離散短時傅立葉變換對雷達語音信號進行分解。含噪語音信號表達如公式 (1):這里語音信號可看成準平穩信號,其中,、

(2)參量修正。對含噪語音的相位譜進行修正。含噪雷達語音信號是一個實數信號,因此,它的短時快速傅立葉變換共軛對稱:。信號分解部分得出的可調復合譜由一個實函數進行補償,函數與頻率有關,見公式 (3)。

需要說明的是:補償過的相位譜只是通過一個實數信號得出的偽相位譜,并不具備真實相位譜的性質。補償的相位譜與含噪語音的振幅譜結合就組成一個可調復合譜信號,如公式 (5)。

圖2 矢量原理圖:離散短時傅立葉變換共軛對稱的變換

1.3 實驗數據采集

20名健康志愿者(被測試)參與語音測試實驗,志愿者包含 12 名男性和 8 名女性,年齡 20~30 歲。雷達天線與被測試者的距離保持在 2~20 m 之間,采用 5 句中文普通話作為語音測試材料(句子的長度在 5~20 個字),語音測試實驗在安靜的環境中進行,每位被測試者使用正常的音量和語速讀取語音材料。

2 結果與討論

為了驗證相位補償算法對雷達語音增強的效果,實驗過程中使用譜減法、維納濾波法作為對比算法。對比實驗是在含噪信號信噪比較低的情況下進行的。圖 3(a)為原始雷達語音信號,從中能夠觀察出語音信號中摻雜大量的背景噪聲。圖 3(b)為譜減法處理后的語音信號語譜圖,相比原始雷達語音信號,譜減法有效地去除了雷達語音中的噪聲成分,但在背景噪聲得到有效抑制的同時,語音信號也被 削 減 很 多,同 時 在 大 約 t=0 s 和 t=4 s 出 現 強 噪 聲 分 量。圖 3(c)為維納濾波去噪后的語譜圖,圖中噪聲成份得到了有效的去除,依然有部分語音信號被削減,但削減的程度少于譜減法處理后的結果。和譜減法類似,維納濾波處理雷 達語音信號 在 t=0 s 和 t=4 s 處 仍然出現 了 強噪聲分 量。圖 3(d)為本文采用的相位補償法去除雷達語音噪聲后的語譜圖,相比于前兩種去噪方法,可以看到不僅背景噪聲成分得到了很好地抑制,語音信號也丟失得很少。

圖3 雷達語音信號語譜圖

從聽覺方面評估去噪效果,原始語音具有明顯的背景噪聲,經譜減法處理后,干擾噪聲得到了有效抑制,但幾乎也聽不清語音信號的內容,在聽覺效果評估開始和即將結束能聽到很明顯的刺耳的聲音,說明在語音增強過程中產生了新的噪聲分量。原始雷達語音經維納濾波處理后,噪聲也得到有了效抑制,處理后語音仍然混沌不清,這說明語音成分也被部分去除。而且和譜減法類似,經維納濾波算法處理的語音中也產生了新的噪聲分量。最后,相位補償算法處理后的聽覺評估可以明確聽出背景噪聲得到了有效抑制,語音信號也被很好地保留。

3 結論

生物雷達實驗系統通過檢測人體喉部振動的微弱信息對語音進行采集,使用相位補償法對雷達語音信號進行去噪。與經典的語音增強方法不同,相位補償法保持語音信號的振幅譜不變,而對信號的相位譜進行修正,去除含噪語音信號中低頻成分(噪聲信號被認為含有較多低頻分量),進而達到去噪目的。為了進一步說明相位補償算法對于語音增強的效果,實驗中使用兩種經典算法,譜減法和維納濾波法與本算法進行了對比研究,結果表明:本算法有效地抑制了含噪信號中背景噪聲成分,雷達語音信號也被保留得較為完整,說明相位補償算法能夠有效的去除雷達語音信號中的噪聲成分。

[1] Boll SF.Suppression of acoustic noise in speech using spectral subtraction[A].IEEE Trans Acoust Speech Signal Process[C].1979,27:113-120.

[2] Ephraim D,Malah Y.Speech enhancement using a minimum mean-square error log-spectral amplitude estimator[A].IEEE Trans.Acoust.,Speech,Signal Process[J].1985,33:443-445.

[3] Wiener N.The extrapolation,interpolation,and smoothing of stationary time series with engineering applications[M].New York: Wiley,1949.

[4] Berouti M,Schwartz R,Makhoul J.Enhancement of speech corrupted by acoustic noise[J].In:Proc IEEE Internat Conf on Acoust Speech Signal Process(ICASSP)[J].1979,4:208-211.

[5] Paliwal ABK.A speech enhancement method based on Kalman filtering[A].IEEE Int Conf Acoustics,Speech,and Signal Processing[C].1987,12:297-300.

[6] Ephraim Y,Harry L.A signal subspace approach for speech enhancement[A].IEEE Trans Speech Audio Process[C].1995, 3:251-266.

[7] Li S,Wang JQ,Niu M,et al.Millimeter wave conduct speech enhancement based on auditory masking properties[J].Microwaveand Optical Technology Letters,2008,50(8):2109-2114.

[8] Li S,Wang JQ,Jing XJ.The application of nonlinear spectral subtraction method on millimeter wave conducted speech enhancement[J].Mathematical Problems in Engineering,2010,(2010):1-12.

[9] Li S,Tian Y,Lu G,et al.A new kind of non-acoustic speech acquisition method based on millimeter waveradar [J].Progress In Electromagnetics Research,2012,130:17-40.

[10] Tian Ying,Li S,Lv Hao,et al.Smart radar sensor for speech detection and enhancement[J].Sensors and Actuators A:Physical,2013,191(1):99-104.

[11] Kamil Wójcicki M M.Anthony Stark, James Lyons, Kuldip Paliwal.Exploiting Conjugate Symmetry of the Short-Time Fourier Spectrum for Speech Enhancement[A].IEEE Signal Process[C].Lett,2008,15:461-464.

[12] Crochiere R.A weighted overlap-add method of short-time Fourier analysis/synthesis[A].IEEE Trans Acoust, Speech, Signal Process[C].1980,28:99-102.

[13] Griffin D.Signal estimation from modified short-time fourier transform[A].IEEE Trans Acoust, Speech, Signal Process[C].1984,32:236-243.

Research on Non-contact Speech Enhancement Algorithm Based on Short-time Phase Spectrum Compensation

XUE Hui-jun, LI Sheng, LU Guo-hua, LV Hao, ZHANG Yang, JIAO Teng, YU Xiao, MA Teng, ZHANG Hua, WANG Jian-qi
College of Biomedical Engineering, The Fourth Military Medical University, Xi'an Shanxi 710032, China

As a kind of important physiological signals, speech signals can be detected through bioradar by detecting the weak information of human laryngeal vibration. Thus a new technology for obtaining non-contact speech signals is developed. However, various kinds of noises and clutter waves are also existed in the echoes accepted by bioradar. In this paper, discrete short-time Fourier transform was used to reduce the noise component by changing phase spectrum to reconstruct the signal spectrum while the amplitude spectrum of speech signals remained unchanged. Compared with traditional speech enhancement algorithms such as spectral subtraction and wiener filter, the proposed algorithm can effectively reduce the noise component under the condition of low signal-to-noise ratio, which indicated that the quality speech signals detected by biological radar can be enhanced.

bioradar; discrete short-time Fourier transform; phase spectrum compensation; speech detection; non-contact detection

R318.04;R197.39

A

10.3969/j.issn.1674-1633.2013.11.004

1674-1633(2013)11-0012-03

2013-09-05

國家自然科學基金項目(61371163, 61271102);陜西省國際合作重點項目(2013KW30-03)。

本文作者:前兩位作者對文章具有同等貢獻,因此應被視為共同第一作者。薛慧君碩士,主要從事語音信號獲取及處理。李盛博士,主要從事語音信號獲取及處理研究工作。

王健琪,教授,博士研究生導師。李盛,副教授,博士。

作者郵箱:sheng@mail.xjtu.edu.cn

猜你喜歡
維納濾波背景噪聲語音
環境背景噪聲對飛機噪聲監測結果的影響
利用背景噪聲研究福建金鐘庫區地殼介質波速變化
魔力語音
多級維納濾波器的快速實現方法研究
基于MATLAB的語音信號處理
自適應迭代維納濾波算法
基于MQ3與MP3的價廉物美的酒駕語音提醒器
對方正在輸入……
利用測地距離的三維人臉定位算法
應用背景噪聲成像研究祁連山地區地殼S波速度結構
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合