?

基于FPGA+DSP架構的數字音頻處理技術研究

2018-01-15 06:18
單片機與嵌入式系統應用 2018年1期
關鍵詞:話音數字音頻信噪比

(中國電子科技集團公司第十研究所,成都 610000)

引 言

音響中心是機載航空電子系統的重要功能單元,它完成飛行員機內通話、機外通話、指揮引導、飛行狀態告警等任務,對飛機的安全和指揮控制起著關鍵的作用[1]。傳統的音響中心采用模擬音頻技術傳輸話音信號[2],由于模擬音頻設備存在易受干擾、頻帶窄、可靠性差、設備體積重量大等缺點,已不再適用于有減重需求、電磁環境復雜的航空電子領域應用,因而數字音頻處理技術[3]應運而生。數字音頻技術是將模擬聲音信號轉換為數字信號,通過現代數字處理方法處理、傳輸話音,數字音頻系統[4]具有抗干擾性強、設備體積小、重量輕、音頻信號質量好等特點,因而本文提出了一種基于FPGA+DSP架構的數字音頻處理系統。前端通過模擬音頻電路完成模擬音頻信號的A/D、D/A轉換,后端通過FPGA和DSP構建數字處理平臺,完成數字音頻的抑制噪聲、話音增強等處理。

1 系統架構

數字音頻處理系統由模擬音頻接口、數字音頻處理兩部分組成,系統框圖如圖1所示。其中模擬音頻接口包括輸入和輸出兩部分,輸入部分完成輸入模擬音頻信號的阻抗匹配、信號采集、濾波和預放大,并將處理后模擬音頻信號送入A/D芯片進行模/數轉換;輸出部分完成D/A芯片輸出信號的濾波、隔直和放大,輸出的模擬音頻信號驅動耳機、話筒等音頻設備。

數字音頻部分由FPGA、DSP及外圍存儲控制電路組成。FPGA作為A/D芯片與DSP間通信的橋梁,對A/D或D/A數據進行緩存、組幀和串并轉換,轉換后的數據通過LocalBus總線接口傳輸給DSP進行數據處理,同時FPGA單元完成A/D芯片初始化配置、DSP時鐘、復位信號輸出控制等功能;DSP單元作為系統的核心處理部分,完成數字音頻信號的混音、加權、編解碼和音頻處理算法等功能。

2 硬件電路設計

2.1 音頻接口電路設計

音頻接口電路主要包括輸入和輸出兩部分,輸入部分如圖 2所示。

圖1 數字音頻處理系統框圖

圖2 模擬音頻輸入接口電路

圖3 模擬音頻輸出接口電路

前端設計RC低通濾波器(由阻容網絡R3/C6、R6/C8組成),用于濾除音頻信號中的雜波干擾。由于音頻信號頻率范圍為300~3 400 Hz,為了有效濾除輸入音頻信號雜波并保證話音信號的平坦度,音頻輸入接口前端設計RC低通濾波器(由阻容網絡R3/C6,R6/C7組成),截止頻率設置為10 kHz左右,對輸入的差分音頻信號進行濾波,濾波后的信號經隔直電容(C2/C5組成)去除直流分量后送入芯片MAX4062進行預放大,放大后的信號送入TPS721芯片進行單端信號到差分信號轉換,轉換后通過雙絞屏蔽電纜將差分信號傳給后端設備進行A/D采樣,這里采用差分信號傳輸有效降低了傳輸路徑電磁輻射對模擬信號的干擾和衰減,減小了信號的失真。

輸出音頻接口電路設計如圖3所示,由于D/A器件采用插值算法將數字信號轉換為模擬信號,D/A轉換后的模擬信號中含有低頻干擾和高頻雜波,音頻輸出接口前端由低通濾波器(阻容網絡C10/R10)和高通濾波器(阻容網絡C9/R8)組成,兩個濾波器疊加構建了帶通濾波器,通帶設置為200~4 000Hz左右,這樣有效地濾除輸出音頻信號的雜波并保留了有用信息,濾波后的信號經放大器(型號為OPA547)進行負反饋放大,放大后信號經隔直電容(C11)除去直流分量后驅動耳機等音響設備。

2.2 A/D及D/A電路設計

A/D和D/A轉換電路完成模/數、數/模信號轉換功能,如圖4所示,采用TLV320AIC23B芯片完成A/D和D/A轉換,TLV320AIC23B是一款高性能的音頻編/解碼器,該芯片內部集成A/D和D/A電路,由于TLV320AIC23B芯片由3.3 V電壓供電,單端輸入采樣,前端設計匹配電路,采用芯片INA2134及其周圍電阻網路完成信號匹配和差分單端轉換;

轉換后的單端信號送入TLV320AIC23B進行A/D轉換;D/A電路為A/D的逆過程,FPGA端將數字信號送入TLV320AIC23B的控制端,經D/A轉換后由TLV320AIC23B模擬輸出引腳(9/10引腳)輸出驅動后端音響設備。

圖4 A/D和D/A電路

2.3 DSP和FPGA功能電路設計

DSP和FPGA功能電路框圖如圖5所示,DSP作為系統的處理核心,采用ADI公司的高性能處理器ADSP-21368BBPZ,該款DSP是SHARC系列浮點處理器的產品,最高主頻為400 MHz,DSP最小系統包括時鐘單元、供電單元、復位邏輯和外擴的SDRAM存儲器和FLASH存儲器,其中DSP外部片選0分配給FLASH存儲器,用于存儲DSP固化程序以及音頻報警等,掉電不丟失數據;DSP外部片選1分配給SDRAM存儲器,用于暫存程序代碼和其他運行數據;DSP外部片選2分配給FPGA,用于對FPGA數據讀寫尋址;FPGA功能單元由時鐘、配置單元和FPGA組成,時鐘為FPGA工作提供時鐘源,配置單元存儲掉電不丟失的FPGA固化代碼,上電時完成FPGA配置加載,FPGA加載完成后輸出時鐘、復位信號完成DSP初始化配置;FPGA與DSP間通過LocalBus總線接口通信,FPGA完成A/D數據的緩存、組幀、串并轉換,并以中斷方式通知DSP取數。

圖5 DSP和FPGA功能電路框圖

3 話音活動檢測算法描述

話音活動檢測算法原理是[5]:語音與噪聲歸一化自相關函數中極大值(即能量)的概率分布不同,因而可利用能量來對濁音及非濁音(包括清音和噪聲)進行判斷。由于話音信號本身具有短時平穩性,一般認為10~30 ms的時間范圍是準穩態過程,在短時間內把話音信號當做一個穩態過程,采用短時能量對話音信號進行激活檢測,假設第w幀話音信號Sw(n)的短時能量為Ew,計算短時能量公式如下所示:

其中N為幀長。預先設定一個閾值Y,當短時能量Ew>Y時,判斷為話音;反之為噪聲。

基于短時能量的方法在信噪比較高時準確性較高,但當信噪比較低時誤差較高,需要結合其它方法綜合判決,本文采用短時能量和過零率結合的話音端點檢測方法。語音信號的短時過零率ZCR[6]是指單位時間內信號波形穿過橫軸(零電平)的次數。抽樣后的語音信號是離散的時間序列,其過零即是相鄰兩個采樣改變符號的次數,定義為:

圖7 音頻處理仿真環境

其中sgn[.] 表示符號函數,即

研究表明信號過零率較噪聲過零率低,當ZCR大于設定閾值Z時,認為是噪聲;反之判定為話音。這樣通過短時能量和過零率相結合的算法,能夠準確檢測話音端點,減少誤判率和漏判率。

4 軟件流程描述

圖6 音頻處理算法 流程圖

為了獲得更好的通話效果,采用數字處理算法對話音信號進行處理。音頻處理算法流程圖如圖6所示。

如圖6所示DSP上電后運行初始化程序,完成A/D芯片、FLASH、SDRAM等硬件資源的初始化配置,同時設置中斷函數實時監測是否有FPGA的緩存中斷,當監測到有中斷到來時調用中斷響應函數,讀取FIFO內音頻數據。每次中斷函數讀取8 ms話音數據,為了滿足音頻準平穩信號特性,需將本次8 ms采集到的信號與前兩次(16 ms)采集的信號進行組幀,構成24 ms音頻數據,對組幀后的數據進行加窗,窗函數選擇Hanmming窗,加窗調制后的信號送入話音活動檢測模塊,若檢測到無話音活動送入舒適噪聲生成模塊重構背景噪聲,噪聲生成模塊采用隨機白噪聲產生算法生成舒適白噪聲,以填補話音信號中無音段。若檢測到有話音活動送入自適應噪聲抑制模塊進行降噪處理,經噪聲抑制模塊去噪后的信號送入自動增益控制模塊[7],經上述算法模塊處理后的音頻信號送入音頻輸出模塊,對數字音頻進行D/A變換、放大和匹配后輸出模擬音頻信號,驅動耳機、話筒等音響設備。

5 試驗驗證

為了驗證數字話音處理系統的功能和性能,搭建如圖7所示驗證環境。實錄了一段在機載環境下信噪比為5 dB的飛行員話音信號作為輸入測試激勵,該信號是飛行員通話無線電設備和飛機發動機噪聲疊加的帶噪話音段,代表著一種常見、典型的機載音頻信號。話音信號處理前與處理后的結果如圖8所示。

圖8 數字話音處理系統效果圖

圖8(a)為信噪比為5 dB的輸入帶噪話音段,經本系統處理后輸出的音頻信號如圖8(b)所示,從圖中可看出輸入信號為帶有強噪音的話音信號,經過系統處理后有音無音段被準確地識別出來,無音段的噪聲信號被有效抑制,有音段的話音被明顯增強。

為了進一步評價話音信號質量,采用主觀和客觀評價相結合的方法,其中主觀評價采用ITU組織在ITU-T P.800和P.830建議書中制定的測試標準:MOS[8](Mean Opinion Score)評分測試;客觀評價采用ITU組織推薦的語音傳輸質量測試標準P.862-PESQ算法[9],選用基于PESQ算法開發的商用話音質量測試儀進行測試,選取了10位受試者對不同信噪比的話音進行MOS評分和測試儀測試,測試結果如表1所列。

表1 話音質量評價表

從表1可看出,對比不同信噪比條件下處理前后的話音信號,處理前話音信號評分較低,話音質量較差;處理后話音信號評分有所提高,話音信號質量較好,特別是在低信噪比條件下,處理前后的評分差值更大,話音質量改善的效果更加明顯。另外通過多人主觀測試反映,輸入信號含有強噪聲的話音,音量強度忽強忽弱,舒適度差,處理后輸出的話音噪聲明顯減弱,話音平穩,可聽性好。試驗結果表明,數字話音處理系統能夠有效抑制噪聲并改善話音質量,特別是對低信噪比條件下話音的增強起到了較好的作用。

結 語

[1] 李成文,楊軍祥.新一代直升機綜合核心處理機技術研究與實現[J].電子技術應用,2014(12):121-124.

[2] 楊坤.模擬音頻技術與數字音頻技術研究[J].科技傳播,2015(7):90-91.

[3] 孫育紅.數字多媒體數據采編系統設計與實現[J].現代電子技術,2017,40(15):122-125.

[4] 趙力.語音信號處理[M].北京:機械工業出版社,2016.

[5] Yonemori H,Maruyama R.A study on the Noise Suppression in High Frequency Acoustic Noise of IH Cooking Heater[J].Journal of the Japan Society of Applied Electromagnetics&Mechanics,2015,23(1):213-218.

[6] 紀振發,楊暉,李然,等.基于短時自相關及過零率的語音端點檢測算法[J].電子科技,2016,29(9):52-55.

[7] Khing P P,Swanson B A,Ambikairajah E.The effect of automatic gain control structure and release time on cochlear implant speech intelligibility[J].Plos One, 2013,8(11):e82263.

[8] ITU-T Recommendation P.800. Methods for Subjective Determination of 17 Transmission Quality,1996.

[9] 陳曉翔,陸保體,林嘉宇.PESQ算法在軍事語音評估中的性能分析[J].微處理機,2014,35(1):35-40.

李聲飛(工程師),主要研究方向為航空機載音頻信號處理、總線技術。

猜你喜歡
話音數字音頻信噪比
兩種64排GE CT冠脈成像信噪比與劑量對比分析研究
基于深度學習的無人機數據鏈信噪比估計算法
話音疊加中實時混音算法的FPGA實現
低信噪比下基于Hough變換的前視陣列SAR稀疏三維成像
基于FPGA的多協議數字音頻信號發生方法
數字音頻及其嵌入技術在廣播電視工程的應用
數字音頻廣播信號接收系統及其軟件架構
數字音頻廣播的特點
保持信噪比的相位分解反褶積方法研究
IP語音報頭壓縮設計與實現
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合