?

基于語音識別技術的機載短波應急通信*

2014-10-09 11:50胡貝貝
電訊技術 2014年1期
關鍵詞:短波魯棒性聲學

陳 晨,胡貝貝

(1.空軍裝備部重點型號部,北京100843;2.空軍駐714廠軍事代表室,南京210002)

1 引言

短波通信是我國戰機的重要通信手段。但是受發射功率、天線增益等因素的影響,遠距離通信能力的不足是對傳統短波通信體制的一個重大挑戰。同時,短波通信頻道較窄、信道擁擠,容易受敵方和非敵方干擾,在戰時復雜電磁環境下,短波通信的可靠性難以得到保障。因而,如何為機載短波通信系統提供應急通信能力成為了行業內的研究熱點。

專家學者針對上面提出的問題開展了廣泛的研究,文獻[1]提出了一種以小衛星為中繼的遠程通信方案;文獻[2]介紹了短波通信的抗干擾方法和應用,以及短波通信抗干擾技術的發展趨勢。本文從分析目前短波通信系統存在的問題入手,通過使用語音識別技術,設計出基于語音識別技術的機載短波應急通信方法,并細分析了實現該方法的關鍵技術。該方法對短波信道的要求低,從而可以極大地提高短波通信的通信距離和抗干擾能力。

2 現有短波通信的不足

2.1 短波通信系統遠程通信能力缺乏

我國在南海最南端的領土曾母暗沙距離我國大陸約兩千公里,菲律賓最南端的島嶼棉蘭老島距離我國大陸約2 000 km。我國目前的三代戰機的作戰半徑可以達到1 500~2 000 km以上,但是作為這些機型遠程通信唯一手段的短波電臺的通信距離已經不能覆蓋載機的作戰半徑,當前正在研發的新一代戰機對短波電臺的通信距離要求成倍提高,但同時其中的一些關鍵指標如發射功率、天線增益等并未提高甚至受飛機氣動外形影響有所降低,在這種條件下要保證飛機的遠距通信能力,傳統的通信體制面臨很大的挑戰。

2.2 短波通信系統抗干擾能力不足

由于短波通信頻段較窄、信道擁擠,受環境影響嚴重,通信存在質量較差、不穩定、干擾嚴重等不利因素,在平時的正常使用中短波電臺的通信難以百分之百聯通,對于戰時電子戰帶來的復雜電磁環境,短波通信的可用性將更加難以保證。對于跳頻抗干擾,由于現役機載短波電臺跳速過低,在每一頻點駐留時間過長,而干擾設備從偵察頻率到引導干擾的反應時間越來越短,同時由于短波信道擁擠的狀況和戰時敵我雙方大量的電子戰裝備對短波信道的干擾,幾乎不可能找到沒有干擾的信道,現有的跳頻抗干擾方式將很難發揮作用。以美國、韓國、我國臺灣地區等普遍裝備的典型車載短波通信干擾設備AN/TLQ-17(20世紀90年代海灣戰爭時產品)為基準進行計算,我現役機載短波電臺的通信能力難以得到有效保證。表1是美軍幾種典型的通信干擾裝備及其指標。

表1 美軍幾種典型的通信干擾裝備Table1 Typical communication jamming equipment of US military forces

綜上所述,作為機載遠距通信主要手段的短波電臺目前無論是在抗干擾能力還是通信距離方面都存在嚴峻挑戰,需要增加一種應急通信手段,當常規短波通信在距離或干擾等極限條件下無法連通時作為常規短波通信的補充,保障飛行員的最低通信需求。

3 基于語音識別技術的機載短波應急通信

3.1 短波通信中話音信號及語義信息分析

短波電臺的通信距離和抗干擾能力與短波電臺的發射功率、天線尺寸以及接收機的信號處理能力有密切關系。由于機載平臺的能耗以及尺寸等因素的限制,發射功率和天線增益提高的空間都不大,唯一具有較大改進潛力的地方就是電臺的接收處理性能。

根據香農定理我們知道,接收機處理的信號信噪比同傳輸速率相關,在信道帶寬固定的情況下,信道速率越低,需要的信噪比越低,同時其接收靈敏度也就越高,傳輸距離越大。也就是說,在其他條件相同時,如果要高保真的語音或高速的數據通信,那么對信道的信噪比要求就越高,通信的距離就越近,抗干擾能力就越差。

當前的通信技術中大量采用聲碼話技術將傳統的模擬語音轉化成數字語音進行壓縮傳輸,一般的正常數字語音速率為64 kb/s(傳統電話)。在無線通信中,通常采用降低采樣率以及壓縮編碼的方式進行傳輸,在保證話音質量的同時降低傳輸速率。

實際上,正常語音包含有豐富的信息,包括頻譜特征、聲紋、語氣以及語義信息等,其中的很多信息并不是我們所必需的。圖1是“任務已經完成”這段2 s話音的時間-頻率-幅度三維采樣波形,其對話音正常采樣時占用接近7 kHz的帶寬。圖2所示的是加了300 Hz的帶通濾波器后的采樣波形,其在占用300 Hz帶寬時仍舊能夠把“任務已完成”這句話的意思表述清楚,前后兩者的數據量和數據率相差幾十倍,圖2所示的就是低速聲碼話的基本工作原理。

圖1 占用7 kHz帶寬的語音信號Fig.1 Speech signal of 7 kHz bandwidth

圖2 占用300 Hz帶寬的語音信號Fig.2 Speech signal of 300 Hz bandwidth

那么,最低可接受的語音通話是什么水平?通話中真正關注的是語音本身還是其語義?兩者對通信帶寬以及信噪比的要求有巨大的差別。例如:飛行員以正常的語速回復“明白”這句話音,以1 200 b/s的聲碼話傳輸需要1 200 b的數據量,而其中的語義用6 b的數據就可以表達清楚。當指揮員和飛行戰斗人員在強干擾導致的所有正常通信手段失效時,需要的可能僅僅是執行或取消、完成或失敗這樣一個6 b的語義信息。

3.2 自動語音識別技術

語音識別是一個模式匹配的過程,將語音信號轉化為文本。通常在貝葉斯統計建??蚣芟录右越鉀Q。如果認為語音可以通過特征提取轉換為具有區分度的特征序列 O={o1,o2,o3,…,oT},那么語音識別的任務就是在所有的詞序列空間中搜索最優的詞序列

其中,W表示特征序列O對應的詞序列,P(O|W)被稱為聲學模型概率,P(W)被稱為語言模型概率。語音識別的任務就是找到一個最優的詞序列,使后驗概率最大化。

一個典型的語音識別系統如圖3所示,由前端特征提取模塊、聲學模型、語言模型和解碼器等部分構成。

圖3 語音識別系統的基本組成Fig.3 Basic structure of speech recognition system

基于統計建??蚣艿恼Z音識別需要將原始的語音時域信號參數化,轉換為具有區分度的、易于計算機存儲和處理的特征矢量。目前主流的語音識別系統都采用短時傅立葉變換、線性預測分析和倒譜分析等信號處理手段。

聲學模型要解決的問題是語音特征和建模單元之間的匹配性和區分性的問題。當前主流的語音識別系統絕大多數采用隱馬爾科夫模型(Hidden Markov Model,HMM)來對聲學模型進行建模[3-4]。一個典型的用于語音識別聲學建模的HMM如圖4所示。

圖4 用于語音識別的典型HMM結構Fig.4 Typical structure of HMM for speech recognition

HMM的每個狀態通常采用高斯混合模型(Gausssian Mixture Model,GMM)進行描述,一個GMM的定義如下:

其中,csm是狀態s中第m個混合高斯分量的權重,D是語音特征向量的維數,μsm和sm分別為第m個高斯分量的均值向量和協方差矩陣。

解碼器的任務是在由聲學模型、發音詞典、命令集等知識源組成的搜索空間中搜索出最佳詞序列(命令)。在語音識別中,解碼器所用到的空間異常巨大,必須借助一系列方法對搜索空間進行壓縮。

近20年來,語音識別技術開始走向市場,并且在一些領域取得了較好的使用效果,典型的例子如蘋果iphone4S手機中的“語音助手(Siri)”、科大訊飛公司的“訊飛口訊”軟件(語音識別效果如圖5所示)。在軍用航空電子領域中,美、法、英、瑞典等先后開展了將語音識別技術應用到機載平臺的嘗試。歐洲的“臺風”戰斗機率先引入了語音識別技術用于語音控制,能夠準確識別200多種控制命令,對飛機航電系統的26種功能進行控制,其識別準確率超過95%。美軍的F35也引入了該項技術,可以識別100條指令,識別準確率達到98%,美軍正在考慮將該技術運用到F-22“猛禽”戰斗機上。據此可見,語音識別技術的成熟度已經達到應用于軍用航空電子設備的水平。

圖5 訊飛軟件語音識別效果圖Fig.5 The impression drawing of iFLY's speech recognition software

3.3 基本技術方案

基于上述分析,本文提出一種綜合的解決方案,主要思路是在短波電臺中引入語音識別及極低速率實時通信兩種先進技術,通過語音識別技術提取話音中的語義信息,再將語義信息以極低速實時通信模式進行傳遞,最大程度減少不必要的通信數據量,以此降低對信道的要求。同時,在接收端將話音含義信息通過語音合成技術生成人工語音,保持短波電臺輸入輸出語音的接口不變,既不改變飛行員的使用習慣,也不改變與短波電臺交聯的其他航電設備,從而在大幅提高短波電臺的通信距離和抗干擾能力的同時,減小項目的規模和成本。

圖6為系統原理框圖,在不影響短波電臺其他功能和性能的條件下,在電臺收發信機單元里增加一路可選的最低限度通信通道。當正常話音因為干擾或距離過遠等原因完全中斷時調用其功能實現話音通信。其硬件包括語音識別模塊、語音合成模塊、控制模塊以及極低速波形調制解調模塊,其中語音識別和語音合成模塊分別與電臺的語音輸入輸出接口相交聯,極低速波形調制解調模塊與電臺內部的信道模塊的中頻接口相交聯。

圖6 基于語音識別技術的機載應急通信系統原理框圖Fig.6 Functional block diagram of the proposed scheme

當該通道用于發話時,語音識別模塊對飛行員的話音進行識別,提取語義信息轉化為對應的數據,傳遞至極低速波形調制解調模塊,調制產生中頻模擬信號經電臺內部的信道單元變頻后發射;當該通道用于收話時,接收來自電臺信道單元的經極低速調制的中頻信號,解調出數據信息,傳遞至語音合成模塊生成人工語音傳遞至飛行員。

該方案在理論上對短波信道的要求最低,從而能極大地提高短波通信的通信距離和抗干擾能力,其優勢是增加該通道后的短波電臺不需要改變與機上外部航電系統的交聯及接口關系,基本不改變飛行員的使用習慣,經驗證成功后,可以在新研短波電臺中將此功能模塊集成到電臺原有的主控模塊中,研發過程相對簡單,研發成本很低。

4 關鍵技術

4.1 嵌入式命令詞語音識別系統

語音識別技術是把高速率的語音信號轉換為極低速率的語義數據的關鍵,采用計算資源要求較低的命令詞語音識別系統較為合適。為了在嵌入式系統的低計算資源條件下完成語音識別功能,需要對系統進行高度優化。第一,聲學模型使用在嵌入式系統之前,需要進行合理地裁剪、壓縮;第二,指令集構成的解碼搜索空間需要進行狀態合并等技術進行優化;第三,解碼器需要使用高斯選擇等技術優化搜索算法,以減少計算量。

4.2 說話人自適應

每一套系統提供給飛機所在部隊的飛行員使用,因此,可以通過對聲學模型進行說話人自適應來提高系統的識別率。通過采集飛行員常用任務對話建立數據庫,作為先驗數據,采用最大似然線性回歸(Maximum Likelihood Linear Regression,MLLR)算法[5]或最大后驗概率(Maximum A Posteriori,MAP)算法[6]對聲學模型進行說話人自適應,提高系統對相關說話人的識別性能。

MLLR算法通過說話人相關、識別環境相關的語音數據對背景聲學模型的高斯均值和方差進行線性變化,使自適應后的模型能夠更好地擬合實際識別的語音。線性變化的參數在最大似然準則下通過EM算法訓練得到。MLLR假設自適應后的模型參數與已有背景模型參數存在如下線性變化關系:

其中,μ、Σ分別是均值矢量和協方差矩陣。

MAP自適應利用貝葉斯理論,將模型先驗信息與帶噪語音數據信息相結合實現自適應。新模型的參數通過最大化帶噪語音數據x的后驗分布來估計:

4.3 噪聲魯棒性語音識別

飛機平臺上的背景噪聲較大,只有解決了噪聲魯棒性問題,該項技術才能真正實用。語音識別的噪聲魯棒性是指在輸入語音受噪聲影響、質量較差、語音的音素特性或聲學特性在訓練和測試不匹配時,語音識別系統仍然保持較高的識別精度的性質。噪聲魯棒性語音識別的研究目的就是要消除或減小這種不匹配帶來的影響??梢酝ㄟ^映射f來描述這種不匹配性:

其中,s是一個識別單元模型;用e來表示一個特定的聲學環境,qe(s)表示在聲學環境e下對s的度量;映射f代表一種最小化環境α和β下的度量轉換??梢钥紤]采用修改解碼過程中所使用的聲學模型,即模型域方法,或采用特征域方法來提高系統在機載噪聲條件下的性能。這兩大類變換方法如圖7所示。

圖7 語音識別噪聲魯棒性方法Fig.7 Methods of noise robustness speech recognition

(1)模型域魯棒性技術分析

模型域魯棒性技術主要通過修改訓練模型的參數,使其適應測試語音。前面提到的聲學模型自適應技術也可以用于提高系統的噪聲魯棒性。通過采集飛行員話筒傳入的機艙內噪聲數據使用MLLR或者MAP對聲學模型進行修正,可以較好地解決噪聲魯棒性問題。

(2)特征域魯棒性技術分析

前端特征域魯棒性技術的目標是對原始語音信號進行處理,提取和訓練數據“近似”的聲學特征,提供給解碼器使用。常見的特征域魯棒性技術有特征規整技術和魯棒性特征技術兩類。

可以考慮使用均值方差規整技術(Mean and Variance Normalization,MVN)對特征進行處理。語音信號o(t)是由原始發音信號s(t)經過傳播函數h(t)表征的傳輸信道得到的,在時域上表示為o(t)=s(t)*h(t),頻域上則表示為O(f)=S(f)H(f)。對O(f)取倒譜則得到

通常,同一個信道的傳輸函數H(f)是較為穩定,減去這一信道倒譜的均值,能在一定程度上排除信道帶來的影響。對語音特征的方差進行規整,能進一步地抑制加性噪聲。設O(t)為第t幀語音信號倒譜,語音信號的長度為T,那么經過MVN后的O'(t)為

魯棒性特征提取方法試圖獲取抗噪能力強的特征參數。梅爾頻率倒譜系數和感知線性預測系數是目前主流語音識別系統使用的特征?;谌硕牳兄獧C理和子帶能量規整特征(Auditory-Based Subband Power Normalized Features,ABSPNF)[7]使用實時在線的子帶能量規整,融入感知線性預測系數中的等響度預加重和強度-響度冪次法則,在噪聲環境下有較好的識別性能。采用ABSPNF作為語音識別的輸入特征,可以進一步地提高系統在機載噪聲下的識別精度。

5 總結及工作展望

本文分析了現有短波通信在抗干擾和通信距離上存在的欠缺,提出了一種基于語音識別技術的機載短波應急通信方法。該方法通過語音識別技術提取語音信號的語義信息進行傳輸。針對這種特定的環境,本文就嵌入式命令詞語音識別系統、說話人自適應技術、噪聲魯棒性語音識別技術進行了分析,采用這些技術提高了語音識別的性能,保證了基于語音識別技術的機載短波應急通信方法的實現。

本文提出的基于語音識別技術的機載短波應急通信方法降低了對短波信道的要求,可極大地提高短波通信的通信距離和抗干擾能力,為機載平臺提供了一種常規短波通信完全失效時的應急通信手段,保障飛行員的最低通信需求。今后的工作方向之一是研究新的聲學模型建模技術和魯棒性語音識別技術,進一步提高系統的穩定性和可靠性。

[1]吳昊,陳樹新,張衡陽.基于小衛星中繼的遠程通信方案[J].電訊技術,2012,52(4):452-455.WU Hao,CHEN Shu-xin,ZHANG Heng-yang.A Remote Communication Scheme Based on Small Satellite Relay[J].Telecommunication Engineering,2012,52(4):452-455.(in Chinese)

[2]王磊,李鶴,周音,等.信息化條件下短波通信抗干擾技術與應用[J].艦船電子工程,2012,32(2):69-72.WANG Lei,LI He,ZHOU Yin,et al.Technology and Application Research of HF Communication Anti-jamming under the Informatization Condition [J].Ship Electronic Engineering,2012,32(2):69-72.(in Chinese)

[3]Levinson S,Rabiner L,Sondhi M.An introduction to the application of the theory of probabilistic functions of a markov process to automatic speech recognition[J].Bell System Technical Journal,1983,62(4):1035-1074.

[4]Rabiner L.A tutorial on hidden markov models and selected applications in speech recognition[J].Proceedings of the IEEE,1989,77(2):257-286.

[5]Leggetter C,Woodland P.Maximum likelihood linear regression for speaker adaptation of continuous density hidden markov models[J].Computer Speech and Language,1995,9(2):171-185.

[6]Gauvain J,Lee C.Maximum a posteriori estimation for multivariate gaussian mixture observations of markov chains[J].IEEE Transactions on Speech and Audio Processing,1994,2(2):291-298.

[7]蔡尚.自動語音識別中的噪聲魯棒性特征提取方法研究[D].北京:中國科學院聲學研究所,2012.CAI Shang.Noise Robust Feature Extraction Methods for Automatic Speech Recognition[D].Beijing:Institute of A-coustics,Chinese Academy of Sciences,2012.(in Chinese)

猜你喜歡
短波魯棒性聲學
愛的就是這股Hi-Fi味 Davis Acoustics(戴維斯聲學)Balthus 70
荒漠綠洲區潛在生態網絡增邊優化魯棒性分析
基于確定性指標的弦支結構魯棒性評價
Acoustical Treatment Primer:Diffusion談談聲學處理中的“擴散”
Acoustical Treatment Primer:Absorption談談聲學處理中的“吸聲”(二)
Acoustical Treatment Primer:Absorption 談談聲學處理中的“吸聲”
樂海短波
工運短波
工運短波
基于非支配解集的多模式裝備項目群調度魯棒性優化
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合