?

基于余弦過完備原子庫的語音信號MP稀疏分解

2011-01-23 09:06李雨昕
成都工業學院學報 2011年2期
關鍵詞:庫中余弦個數

李雨昕

(四川師范大學 成都學院,成都 611745)

語音通信在人類生活中扮演著極其重要的角色。為了保證語音信息的有效獲取,在實際應用中需要對語音信號進行去噪、增強、壓縮、編碼等一系列處理[1]。而這些處理的效果都依賴于信號的表示方式。通常的做法是將語音信號分解在一組完備的正交基上,該方法會導致用基的組合表示語音信號時表達的不簡潔性,即語音信號表示不是稀疏的。這將不利于語音信號的處理。Mallat S和Zhang Z首先提出信號在過完備庫上分解的思想[1]。信號在過完備庫上的分解,其分解結果將可以得到信號一個非常簡潔的表達(即:稀疏表示)。得到信號稀疏表示的過程稱為信號的稀疏分解。由于信號稀疏表示的優良特性,該表示方法已經被應用到信號處理的多個方面,如信號去噪[2]、信號識別[3]、信號時頻分布[4]等。目前,大多數的稀疏分解研究都是基于Gabor原子庫進行的,該原子庫上的信號稀疏分解計算量十分巨大,計算時間在現有計算條件下令人無法忍受。

針對此問題,本文在分析語音信號具有類似余弦信號周期性特性的基礎上,根據信號稀疏分解具有按照信號本身特點自適應地選擇原子,使所選原子與信號的非線性逼近誤差最小化的特點,選用余弦過完備原子庫,并在該原子庫上完成語音信號的稀疏分解。相比在Gabor過完備原子庫上的語音信號稀疏分解,在余弦過完備原子庫上的分解速度得到了一定程度的提高,同時對原子庫中原子個數的要求也有所降低。

1 算法描述

圖1是從實際錄制的語音信號中截取N=256的一段語音信號(為語音信號的長度)。從圖1中可以明顯地看出語音信號具有類似余弦信號的周期特征。

1.1 余弦過完備原子庫

根據語音信號具有類似余弦信號周期性特征,本文采用如下的過完備原子庫:

其中,n=0,1,…,N-1,N 為信號長度。也就是說原子 gγ的長度和語音信號的長度相同。原子應作歸一化處理,即│gγ│ =1,其中│·│表示原子的范數,其定義是在H=RN信號空間中信號到該空間坐標原點的距離。fm為頻率參量,按照需要的搜索精度均勻取值,m=0,1,…,M-1,M 為整個原子庫中原子的個數。M應遠遠大于語音信號的長度N,以保證原子庫的過完備性。原子參數γ由m單獨確定。當搜索的間隔越小,M的值越大,即原子庫中原子的個數越多。圖2是N=256,M=10 240時隨機抽取的過完備原子庫中的3個原子樣本。

圖1 N=256長的實際語音信號

1.2 基于余弦過完備原子庫的MP語音信號稀疏分解

通過以上分析可知,余弦過完備原子庫中的原子更加貼近語音信號的周期特征,因此本文設計基于余弦過完備原子庫的語音信號MP稀疏分解算法為:

1)設置分解參數。構造如式(1)所示的過完備原子庫。根據語音信號的長度N適當地選擇原子庫的大小M,保證M?N。

圖2 余弦過完備原子庫中的3個原子樣本

2)形成過完備原子庫。根據分解參數形成一系列的原子,最后形成整個過完備原子庫。

3)在過完備原子庫中尋找最為匹配的原子。算法采用常規的MP算法,求解如式代表的最優化問題。求得在過完備原子庫中與語音信號或語音信號殘差最為匹配的原子。

圖3 余弦過完備原子庫和Gabor過完備原子庫對比實驗1

4)完成一步分解。利用3)中尋找到的最佳原子,從語音信號或語音信號的殘差中去除其在該原子上的分量,完成一步分解。記錄此步最佳原子的參數,作為該步分解的結果。

5)分解完成。利用分解步數(相對應于原子的數目)判定分解是否完成。如果分解達到了事先規定的步數,就停止分解。

2 仿真實驗結果

仿真實驗使用的信號是從錄制的語音信號中分別截取長度N=256的2段語音信號。實驗中使用按式(1)構造的過完備原子庫。根據語音信號的長度N=256選取M=10 240(M?N),即形成的過完備原子庫中原子的個數為10 240。圖3和圖4給出了在Matlab環境下原始語音信號及其分別在余弦過完備原子庫和Gabor過完備原子庫MP稀疏分解為30個原子后重建的語音信號和語音信號殘差。表1和表2分別為圖3和圖4相應的語音信號基于2種原子庫MP稀疏分解為30個原子所用時間t及重建信號的MSE值比較,其中,為重建信號誤差的均方根值。

表1 基于2種原子庫的語音信號MP稀疏分解重建信號所用時間t和MSE值比較

圖4 余弦過完備原子庫和Gabor過完備原子率對比實驗2

表2 基于2種原子庫的語音信號MP稀疏分解重建信號所用時間t和MSE值比較

3 實驗結果分析

仿真實驗中僅用30個原子即可表示長度為256的語音信號,相對于正交分解需要使用256個基來說,充分說明該表示方法的稀疏性。

從圖3、圖4及表1、表2中可以看到重構信號很好的近似了原始的語音信號,說明了基于余弦過完備原子庫的語音信號MP稀疏分解算法的有效性。同時,還可以看到基于余弦過完備原子庫的語音信號MP稀疏分解后重建的語音信號比基于Gabor過完備原子庫的語音信號MP稀疏分解后重建的語音信號從信號的質量來講要稍微好些。實驗中所用的余弦過完備原子庫中原子的個數M=10 240。又因為N=256,根據文獻[3]中提供的計算方法可計算出Gabor過完備原子庫中原子的個數約為12萬個,其原子數量是余弦原子庫中原子數量的11.7倍。信號稀疏分解的計算量主要由形成原子庫的計算量和信號在過完備原子庫上分解的計算量這兩部分組成[5],該計算量巨大。而計算量過大、計算速度過慢和存儲空間要求過高也是制約信號稀疏分解應用的主要瓶頸。如果過完備原子庫中原子的數量減少,則信號在過完備原子庫中分解的計算量將大大減少,計算的速度也將大大提高,同時算法所需要的存儲空間也將降低。

4 結論

本文根據語音信號的特征選用余弦過完備原子庫,不僅能夠提高語音信號MP稀疏分解的速度,同時還降低算法所需的存儲空間,并提高了重構信號的質量。實驗證明余弦過完備原子庫更適合具有類周期特性的語音信號。

[1]MALLAT S,ZHANG Z.Matching pursuit with time-frequency dictionaries[J].IEEE Trans.on Signal Processing.1993,41(12):3397-3415.

[2]韓紀慶,張磊,鄭鐵然.語音信號處理[M].北京:清華大學出版社,2005.

[3]ARTHUR P L,PHILIPOS C L.Voiced/unvoiced speech discrimination in noise using Gabor atomic decomposition[C]//Proceedings of IEEE ICASSP.Hong Kong:[s.n.],2003:820-828.

[4]鄒紅星,周小波,李衍達.時頻分析:回溯與前瞻[J].電子學報,2000,28(9):78-84.

[5]王建英,尹忠科,張春梅.信號與圖像的稀疏分解及初步應用[M].成都:西南交通大學出版社,2006.

猜你喜歡
庫中余弦個數
街頭的人
怎樣數出小正方體的個數
等腰三角形個數探索
怎樣數出小木塊的個數
怎樣數出小正方體的個數
從今天開始
智能盤庫在自動化立體庫中的探索和應用
兩個含余弦函數的三角母不等式及其推論
實施正、余弦函數代換破解一類代數問題
分數階余弦變換的卷積定理
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合