?

基于TDOA和AOA算法的聲源定位模型的研究

2021-07-18 07:12黃子豪牛啟光王譯晨李鑫
電子制作 2021年12期
關鍵詞:聲源麥克風形狀

黃子豪,牛啟光,王譯晨,李鑫

(山東科技大學,山東濟南,250031)

0 引言

聲源定位是聽覺系統對發聲物體位置的判斷過程,它包括水平聲源定位和垂直聲源定位以及與發聲者距離的識別。對聲源方位的識別是人和動物對環境感知的一種基本方法,有利于動物捕捉獵物、尋找配偶和躲避危險。在聽覺言語交流過程中,有助于人們將注意力轉向或回避某聲源。在多聲源的復雜聲場中,聲源定位功能有助于從背景聲中鎖定聲學目標,分離有用信息。

1 問題背景

麥克風陣列是指由若干個麥克風按照一定的幾何形狀組合而成的陣列,相對于單個麥克風而言,具有定位準確,識別率高的特點。不僅可以提高聲源的接收信號,還具有定位跟蹤識別的特點。如今對麥克風陣列的研究依然是聲源定位系統的研究熱點,但是傳統的麥克風陣列定位系統存在誤差大、受噪音干擾大的特點,因此進一步提高聲源定位準確性,將聲源定位應用于更廣泛的領域,仍然需要突破傳統方法的弊端。

2 問題分析

首先確定麥克風陣列的最佳幾何形狀。將二元基陣、三元基陣、四元及其多元基陣構成的麥克風樹幾何形狀對聲源定位的準確性進行比較,根據分析可知,最佳的幾何形狀為正三角形時,定位的準確度最高且計算更為簡便。

建立基于TDOA 算法和AOA 算法改進的聲源定位模型,給定封閉大廳的具體長寬高,在此基礎上計算出聲源距離麥克風的角度范圍和各個麥克風到達聲源的距離范圍,最后根據所構建模型求解出聲源的具體坐標。

圖1 問題分析示意圖

3 構建麥克風陣列仿真模型

確定麥克風樹的幾何排列形狀,為了更好地用麥克風陣列,對聲源進行識別。本文針對不同的陣列形狀對聲源識別性能展開對比,可以得到最佳的麥克風陣列幾何形狀。麥克風樹組成的二維坐標系中的平面基陣模型如圖2 所示。

圖2 麥克風平面基陣示意圖

聲源坐標為p(x,y,z),聲速為常數c,聲波的傳播形式以直線傳播為主,聲源距離原點得距離是:平面基陣模型是由若干個陣元Si 組成。S0 為坐標原點并且是參考陣元,組成的平面基陣圖中得幾何關系進行定量表示為:

經過化簡可得:

二元基陣是在平面基陣的基礎之上,坐標原點仍然為參考陣元,其中另一陣元s1 的坐標設置為(x1,y1)。

在平面基陣的基礎上,可以列出二元基陣的時延估計方程為:

由上述式子可以看出,在二元基陣中對聲源進行定位時,在一個方程中出現了兩個未知量,因此這表明當使用二元基陣對聲源進行定位時,聲源位置的結果將會呈現線性分布狀態。

■3.1 三元基陣

和上述前提相似,同樣將坐標原點作為參考陣元,而在二元基陣的基礎上,新增陣元s3 的坐標為(x3,y3),并且s0,s1,s2,s3 不在同一條直線上,在平面基陣的基礎上,三元基陣的表達式為:

由三元基陣方程可以得,可以通過求解矩陣方程準確的確定聲源的具體位置。但是在實際當中,由于受到環境因素的影響,定位的結果和實際的聲源位置會產生一定的出入。而經過不同學者通過對數值模擬進行計算分析,得到了不同形狀下特征三元陣的目標定位誤差。得出了下面結論,如果要使整個平面的定位準確度不會出現較大的誤差,那么就應該優先考慮使用正三元基陣結構,也就是正三角形基陣結構。

■3.2 四元基陣及其多元基陣

坐標原點s0 依舊為參考陣元,其余三個陣元依舊不在同一條直線上,由平面基陣模型可得四元基陣的定位方程式為:

在上述方程組當中可以看出該式子存在約束條件。因此也就是說,在實際的定位計算過程當中,對兩兩不同的方程組進行求解時將會出現不同的解。這也將會使它的定位結果會偏離實際的聲源位置,會產生使定位結果面積擴大,也就是誤差增大的現象。

■3.3 對比分析確定陣列形狀

麥克風陣列有時會以某種規則的形式進行排列,而有時則是隨機的散布在某些區域當中。陣列的選取對聲源定位的精度影響非常大。常見的陣列形式主要是有直線形和十字形,還有線型。其中線型結構較為簡單,通過適當的計算可以準確的檢測出聲源的位置。

分別采用由二元,三元,四元及多元基陣組成的直線形三角形矩形和圓形麥克風數進行聲源定位識別測試。采用二元、三元、四元及其多元基陣組成的形狀分別為直線型、三角形、矩形和圓形對聲源進行識別。假設采樣時間為20s,采樣間隔為0.5s,運用MATLAB 求得多元基陣的聲源定位特點和準確度。

由表1 可以看出,由二元基陣構成的直線型陣列成線性分布,這也同時驗證了二元基陣推導式的正確性,四元基陣組成的矩陣陣列相較于二元基陣構成的直線形陣列的聲源定位功能更準確,偏移距離更小,誤差更小。因此四元及多元基陣組成的矩形陣列比二元基陣組成的直線形陣列更有優勢。

表1

而以三元基陣組成的正三角形陣列和其他三種基陣陣列相比,偏移距離更小,聲源定位區域更精確。因此三元基陣組成的正三角形陣列結構是聲源識別定位中最穩定,最準確的基陣.三元麥克風的幾何排列形狀如圖3 所示。

圖3 三元麥克風基陣排列圖形

4 構建基于TDOA 和AOA 算法改進的聲援定位模型

TDOA 法又稱為雙曲線定位法,通過監測信號到達麥克風的時間可以算出麥克風和聲源的距離。利用聲源到各個麥克風之間的距離,可以計算出聲源的具體坐標。

而無論是采用TDOA 法還是AOA 算法,都會存在定位過程中測量值誤差較大的問題。因此單獨使用聲源定位方法對目標進行定位時,都達不到理想的定位精度。為了更好更精確地計算出聲源的具體位置,可以將定位方法的某些結合起來使用,用一種定位方法的優勢之處來填補另外一種定位方法的不足,從而達到互補的效果,以取得更精確的定位結果。

將TDOA 定位方法與AOA 定位方法結合起來,假設各個麥克風的坐標分別為:mic1(x1,y1),mic2(x2,y2),mic3(x3,y3)。

分別測試聲源到達各個麥克風的距離和到達參考麥克風的距離差,計算出聲源和麥克風角度。

為了將人和麥克風的位置范圍限制在房間內,我們采用AOA 定位與TDOA 定位結合使用的方法構建模型。假定封閉空間的具體長寬高分別為20m、10m、10m。

極限情況1:假設聲源位于(10,20,0)時,麥克風1位于(0.05,0.15,1.8),麥克風2 位于(0.1,0,1.8),麥克風3 位于(0,0,1.8)時,取得最大AOA 角85.4°。此時聲源與麥克風1 之間的距離為22.26 米,與麥克風2 之間的距離為22.36 米,與麥克風3 之間的距離為22.43 米,此時可以明顯看出,麥克風1 與聲源距離最短,因此為基準麥克風。則聲源到達麥克風2 與到達基準麥克風的距離之差為0.1 米,聲源到達麥克風3 與到達基準麥克風的距離之差為0.17 米。

極限情況2:當聲源位于麥克風樹正下方時,仍設麥克風1 位于(0.05,0.15,1.8),麥克風2 位于(0.1,0,1.8),麥克風3位于(0,0,1.8),此時聲源應位于(0.05,0.05,0),此時取得最小AOA 角0°。計算求得聲源與麥克風1 之間的距離為1.803 米,與麥克風2 之間的距離為1.803 米,與麥克風3 之間的距離為1.803 米。

以上考慮了當AOA 角處于極限大小的兩種情況,在MATLAB 實際仿真中,當限制麥克風樹與人的范圍為假定房間的長寬高時,首先得出AOA 角的有效范圍能對人的位置做出更加精準的判斷。在假定情況下,我們實際算得,當AOA 角為85.4°時,聲源的估計位置為(8.77,17.96,0)。當AOA 角為0°時,聲源的估計位置為(8.77,17.96,0)。這與實際位置的偏差值為6%左右,在誤差允許范圍內,對于其他位置均可結合AOA 角與TDOA 算法進行較為精準的位置估計。

最終求解出當AOA 角最小為0 時的聲源坐標為(0.026,0.015,0),當AOA 角最大為85.4 度時的聲源坐標為(8.77,17.96,0)。

5 模型的優缺點

■5.1 模型的優點

將TDOA 算法和AOA 算法相結合,取長補短,彌補了各自算法的短板,將兩個算法進行結合。減免了計算過程的冗長復雜,有效地節省了數據的傳輸量和傳輸時間。不僅提高了運算效率,而且也提高了運算準確度。為后續的聲源定位算法奠定了堅實的基礎。

■5.2 模型的缺點

采用的聲源定位方法,其定位準確度主要取決于定位過程當中距離差的大小和范圍以及角度的范圍。這造成了麥克風陣列的空間分辨率不足可導致生源的混疊。從而造成對生源未知的錯誤估計。

使用的麥克風陣列定位算法計算量大且不便于移植。再者由于互相關函數是建立模型的基礎 并且是在沒有環境噪音的影響下產生的。因此對實際環境的考慮不全面,所求的數值較為理想,忽略了環境因素對聲源定位的影響。

6 模型的推廣

(1)對TDOA 模型算法進行改進之后,由于其在實際過程當中不受麥克風陣列位置的不確定性影響,故可以將三元麥克風陣列應用到移動機器人聲源定位過程中。

(2)改進后的模型具有敏感性大的特點??梢岳酶兄畔μ囟繕诉M行識別和跟蹤。這不僅是機器人領域的內容,同時也是軍事領域關注的重要熱點。

(3)由于模型可以準確地獲取目標聲源的位置信息,包括方位角、俯仰角和距離。而在實際應用過程當中,傳感器的噪聲干擾和聲源目標本身都具有較強的不確定性和未知性,這給定位精度帶來很大的困難。而改進后的模型恰好巧妙地避免了這一缺點。因此可以將模型運用到對聽覺感知的研究和語音辨別理解等領域上。

7 結束語

聲源定位技術不論是在日常生活中或是工業生產中應用都十分廣泛,可以用于聲音的識別和噪聲聲源的定位等問題,目前聲學產品也進入大規模的研發模式,聲源檢測和定位系統也逐漸成為熱門的研究課題,這對于我國聲學領域的研究起到了積極的推動作用。

猜你喜歡
聲源麥克風形狀
虛擬聲源定位的等效源近場聲全息算法
一種基于麥克風陣列用于分離單極子和偶極子聲源的方法
近場相干聲源三維定位MUSIC算法?
室內聲音導航系統
麥克風的藝術
訊飛輸入法也能離線語音輸入
火眼金睛
讓重力控制麥克風
分一半
麥克風
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合