?

基于卷積神經網絡的5G蜂窩網絡無線定位方法

2022-12-13 05:39熊星月何至軍周志成
數據采集與處理 2022年6期
關鍵詞:卷積無線神經網絡

熊星月,何 迪,何至軍,周志成

(1.上海交通大學電子信息與電氣工程學院北斗導航與位置服務上海市重點實驗室,上海 200240;2.北京集智數字科技有限公司,北京 100871;3.深圳達實智能股份有限公司,深圳 518057)

引 言

在無線定位領域,傳統的定位方式包括:使用接收信號強度指示(Received signal strength indica?tion,RSSI)[1]、到達時間(Time of arrival,TOA)[2]、到達時間差(Time difference of arrival,TDOA)[3]、到達角(Angle of arrival,AOA)[4]等數據的三邊定位,這些計算型的定位方式有較高的硬件要求;同時使用這類數據的指紋定位,其算法簡易設備簡單但應變與抗干擾能力差,需要頻繁更新數據庫的概率更高,但在室內等遮擋環境下相對計算型的定位方式,定位精度也相對更高。

深度學習由于其強大的功能性在不同領域得到廣泛應用[5]。深度學習和機器學習的主要目的是讓計算機能夠仿照人類大腦積累的經驗來進行各類判斷,目前在圖像的分割與分類[6]、大數據處理[7]、人體運動分析[8]等領域取得了較好的應用成果。然而在三維空間的測距與定位方面,深度學習被使用的頻率和深入程度都有待提升?,F階段已有的深度學習相關定位方法基本滯留于兩個方面:使用固定時間間隔上傳的圖片或攝像頭實時捕捉的畫面對已知事物的畫面定位與景深測定[9];使用多個不同位置天線數據上的無線通信的RSSI或信道狀態信息(Channel state information,CSI)來進行預先規劃的分區指紋信息登錄與訓練,進而進行深度學習后運用相同數據自動分類定位[10?11]。華為等企業也使用以天線矩陣為基礎,輔以物聯網(Internet of things,IOT)等方案進行精確的室內定位,但并未使用具體的深度學習方案[12]。本文基于深度學習算法,使用無線通信對信道傳輸中的各類特征值進行訓練,使用神經網絡回避指紋定位中龐大的指紋庫與隨指紋庫正比例增長的分類計算復雜度,結合深度學習算法在學習完成后的分類高效性與抗干擾能力,最終實現一套易于在移動終端配置、抗干擾性更強、定位實時性更高的無線定位方案。本文方法與現有深度學習方案的區別在于:本文對卷積層在無線定位功能的深度學習網絡中的功能特殊性做出假設,隨后在分析與實驗中對該假設進行驗證,構成了性價比更高的無線定位方法。

1 研究背景與相關工作

針對無線移動通信系統天線接收信號數據深度學習的無線定位方法,目前已有許多學者對其進行了相應的研究。因此,面向這種智能信號處理與傳統無線定位技術相融合的新興技術,本節首先對已經提出的一些理論和方法作簡要介紹和分析。

由于在室內環境下全球導航衛星系統(Global navigation satellite system,GNSS)信號接收較弱,文獻[13]使用卷積神經網絡對攝像頭內的視頻進行分類來實現對室內停車場的汽車進行定位,該定位分為3個步驟:首先對攝像頭的視頻信息進行逐幀緩存,并對相鄰幀進行差值比較,當該值大于設定閾值時認為攝像頭內的物體產生了運動,對這些幀數進行第2步處理,否則不進行后續處理;然后將第1步中獲取的224像素×224像素圖像輸入精調試的GoogleNet中進行車輛與非車輛的分類判定;最后通過計算得到圖像中車輛相對于攝像頭的位置并確認車輛的定位坐標。該方案最終在多個視頻樣例中達到了至少65.69%的準確率。這種定位方式的不足之處在于需要使用高成本設備,如攝像機,因此很難在較大的室內場景進行高覆蓋率的配置,并且對于視頻信號的處理較為繁雜,需要使用更復雜的神經網絡進行訓練與后續分類,最終的參數數量過于龐大且必須要有服務器支持,不適用于移動端配置。

文獻[14]提出了一個基于對Wi?Fi的RSSI數據進行深度學習的室內無線定位方法。在該方法中使用了一個包含5層隱藏層的深度神經網絡,同時使用了多達520個Wi?Fi接入點(Access point,AP)來制作特征樣本,但該方法的定位對象僅精確到建筑與樓層,而不涉及更具體的位置定位。同時文獻[14]也指出了對于缺省的AP應當使用對模型沖擊更小的數值作為默認值,這個默認值一般可以設為接近合法樣本中同類數據最小的值。該文獻使用的AP數量較多,在實際應用時其硬件條件較難實現,同時由于隱藏層數量很少,即使使用了大量AP進行特征量的補充,其定位精度依然非常低下,僅僅能區分出目標所在的建筑物與樓層。

文獻[15]研究了輸入數據預處理與數據增強對利用深度學習的無線定位方法的影響。文中使用的數據為移動網絡基站的小區信號,對每個小區信號記錄其移動通信網絡中小區的編號(Cell ID,CID)與接收信號強度(Received signal strength,RSS),其中CID為標識小區ID的唯一值。在預處理環節中,該方法將所獲得的RSS進行標準化,使所有的RSS值轉化至[0,1]區間內,以此提升訓練速度。在數據增強環節中,文獻[15]提出了4種增強方案:第1種方法為對每個樣本添加加性噪聲,其噪聲為一個正態分布,該正態分布的標準差為在同一CID中所有樣本RSS值的標準差;第2種方法為通過與現有數據對比得出RSS值更趨向于服從貝塔分布,隨后通過對每個CID在每個分類位置建立貝塔分布并從中取樣得到新的樣本;第3種方法為對應包含多CID數據的樣本,通過隨機舍去來自每個CID的數據建立新樣本;第4種方法為使用變分自編碼(Variational auto?encoder,VAE)生成新樣本。最終結合上述方案,在室內與室外情況下分別達到了57%與50.5%的強化訓練效果。文獻[15]證明了在對無線信號特征進行深度學習的情況下,對數據集進行的預處理與數據增強能夠極大地提升了整體定位性能。

文獻[16]提出了一種對Wi?Fi的信道特征基于深度學習進行室內定位的方案Deep Fi。在該方案中使用的是單個包含3根天線的AP,而定位目標為4 m×7 m與6 m×9 m的兩組室內環境,每組分別包含54個與81個采樣目標點,通過一個包含7層隱藏層的深度學習網絡進行分類。最終證明深度學習方案擁有更高的精度:DeepFi在兩種環境下的平均誤差距離為0.95 m與1.8 m,以20%的性能優勢優于細粒度室內指紋系統(Fine?grained indoor fingerprint system,FIFS),Horus定位系統與最大似然(Maxi?mum likelihood,ML)的平均誤差距離則均大于2.6 m。該方案充分利用了MIMO系統的特性,對于每根天線采集其全部30個副載波上的CSI,從而在每個樣本中有效利用90個CSI作為特征值。文獻[16]提出了利用CSI覆蓋面作為特征的定位方法,對于本文的研究起到一定的啟示作用,同時也初步驗證了深度學習作為定位方案相對于傳統指紋定位方案與傳統機器學習方案的優勢性。

文獻[17]提出了一種通過對Wi?Fi的RSSI特征進行深度學習的室內外定位方法。該方法中使用了163個AP對91個1.8 m×1.8 m室內類進行定位,使用了359個AP對105個2 m×2 m的室外類進行定位,最終在室內環境下達到了0.398 m的平均定位誤差,在室外環境下達到了0.368 m的平均誤差。值得注意的是,文獻[17]研究了對于不同學習算法而言樣本庫大小對最終定位均方根誤差(Root meat square error,RMSE)的影響。文中定義總樣本庫為100N,并從該樣本庫中隨機選取20N、40N、60N、80N以及100N作為樣本庫對不同算法進行基于RMSE的性能比對。結果表明,基于K最近鄰(K?nearest neighbors,KNN)、支持向量機(Support vector machine,SVM)或局部線性嵌入(Locally lin?ear embedding,LLE)的定位算法在樣本庫擴張時相較于基于DNN的算法表現更差;在樣本庫擴張到100N時基于KNN、SVM與LLE的算法產生的RMSE與其在20N樣本庫時產生的RMSE的比值分別為247.3%、233.0%、250.4%。而基于DNN的兩種算法中,當采用受限波爾茲曼機(Restricted Boltzmann machines,RBM)進行預訓練時該比值為83.5%,采用堆棧降噪自編碼(Stacked denoising au?toencoder,SDA)進行預訓練時該比值為120.6%。結果表明,對于無線信號特征值這種不穩定的大方差樣本而言,基于神經網絡的分類器具有優于其他分類器的抗干擾能力。

文獻[18]提出了一種對CSI進行深度學習的無線定位方法ConFi。在該方法中使用了一個具有3個天線以及30個副載波的CSI采集系統,并對該系統得到的CSI值進行時間跨度上的組合。ConFi使用的并非是基于全連接的傳統神經網絡,而是基于卷積層的卷積神經網絡,該方法對于大小為30×30×3的輸入圖像,使用了一個包含3層卷積層,每層卷積層均使用5×5的10個卷積核,最后連接一層有900神經元的全連接層與一層用于分類的全連接層的卷積神經網絡進行學習。該文獻與文獻[16]一樣,討論了文中方法與基于RSS或CSI方法的性能對比,并得到了ConFi擁有更優性能的結論。同時文獻[18]也將ConFi作為CNN基礎的定位方法與其他DNN基礎的定位方法的性能對比,其中包括文獻[16]所提出的DeepFi,對比結果為:在平均誤差方面,ConFi以9.2%與21.64%的性能提升分別優于DeepFi與DANN,由此證明CNN在提取CSI特征方面優于傳統基于全連接層的DNN。

2 基于卷積神經網絡的無線定位方法

2.1 輸入數據構建

在當前的5G基站設備中多采用天線陣列的結構。天線陣列由多天線有規律地排布組成,在同一陣列中,任意兩根天線的距離是已知的,由此每個陣列都可以通過信號強度差和相位差等數據配合天線間距計算得到一個定位結果。每個陣列都具有獨立定位能力的優勢在于不僅多陣列同時定位可以進一步降低誤差,如果某個甚至多個基站到接收端的信號傳播受到阻擋或干擾,只要存在任何一個信號正常傳播的基站,便可以依據該基站的矩陣數據進行正確定位。

本文方法的重點之一在于使用卷積神經網絡進行無線定位的特征數據學習,而輸入數據構建是使用卷積神經網絡學習中非常重要的一個環節。如前所述,卷積層在學習過程中是以卷積核為單位對輸入數據進行多特征同步運算,卷積層所學習的數據特征也傾向于基于卷積核所覆蓋的多個特征值產生的跨特征值綜合性數據特征。因此在輸入數據的格式構建時需要考慮矩陣構成中相鄰的數據應當具有合理性,這種合理性是指在同時觀察這些數據時應當能比單獨觀察其中某個數據獲得更多的具備分類能力的信息。通過對輸入數據的結構進行合理安排,卷積層可以在減少參數量的同時,每個卷積核都具有識別輸入樣本的分類能力,可以極大地提升神經網絡的效率。從無線定位方法的角度來看輸入數據與神經網絡卷積層的關系,期望輸入“圖像”的相鄰像素來自不同的源信號,這樣能最大程度地利用卷積層的特性構成效果更好的神經網絡。由于一般實際定位過程中所使用的硬件設備很少會使用多于4個的無線發射基站,故在分析中對數據來源做出假設時,本文也考慮終端所接收到的基站發射信號不多于4個。

2.2 算法步驟

為論述方便,不失一般性,假設待定位區域為一個矩形區域(在實際應用中可以考慮任意不規則形狀區域)。圖1為本基于卷積神經網絡的無線定位方法原理圖?;诰矸e神經網絡的無線定位方法步驟如下:

圖1 基于卷積神經網絡的無線定位方法原理圖Fig.1 Diagram of wireless localization method based on convolutional neural network

(1)采集多個天線上的RSSI數據和TOA數據,并將TOA數據轉換為信號相位數據;將同一天線、同一時刻的RSSI數據和相位數據均映射到0~255的整數區間,分別作為RGB空間中的R值和G值,形成一個像素點;將多個天線同一時刻對應的像素點組成一張圖片,作為機器學習的輸入。

(2)輸入的圖片依次經過多次卷積單元形式的子網絡結構、多次全連接單元形式的子網絡結構后進行分類。

(3)每一類分別對應一個預先劃分的定位區域,分類結果輸出得到定位結果。例如,根據經典開闊地的無線信號的空間衰落公式為

式中:Loss(dB)表示無線信號衰落的RSSI分貝值;RSSI為終端所接收到的RSSI數值;f為發射信號的頻率。

除此之外,由于5G移動通信使用的頻率包括0.5~6 GHz和毫米波24.25 GHz以上,路徑損耗、陰影衰減、穿透損耗、植被損耗、人體損耗、大氣損耗及雨衰損耗等都會引起相應電波傳播時的衰減損耗。大量的科研組織和科技人員對5G移動通信無線傳播模型展開了研究,其中有4個主要組織各自發布了5G傳播模型,分別是:(1)3GPP,3GPP提供連續的工作進展報告,為5G行業提供國際標準,相應的5G傳播模型文檔為3GPP TR 38.901;(2)5GCM,5GCM是由15家公司和大學合作組成的特設小組,根據廣泛的測量活動對3GPP的開發模型進行補充和修正;(3)METIS 2020,METIS 2020是由歐聯贊助的大型研究項目組;(4)mmMAGIC,mmMAGIC是由歐聯贊助的另外一個大型研究項目組。

需要說明的是,5GCM、METIS 2020、mmMAGIC所發布的傳播模型都是在3GPP發布的模型基礎上進行校正的,適用于特定的場景、環境和條件。在基于卷積神經網絡的無線定位方法步驟(1)中,設D=10RSSI_m+RSSI_1-30,其中RSSI_m表示RSSI的測量值,單位為dB,RSSI_1表示1 m處的標準RSSI值,則有

在步驟(2)中,所述卷積單元包括依次連接的2D卷積層、2D平均池化層、批標準化層和Relu函數激活層;多個卷積單元串聯形成第一子網絡結構;所述全連接單元包括依次連接的全連接層、Dropout層和批標準化層;多個全連接單元串聯形成第二子網絡結構;輸入的圖片經過第一子網絡結構后進入第二子網絡結構,分類采用全連接層到Softmax層,再到輸出層的形式,即第二子網絡結構的輸出進入全連接層,再到Softmax層,最后由輸出層輸出分類結果。

圖2為本文方法中定位區域RGB效果示意圖,而圖3則為在圖2中右下角兩個相鄰區域的RGB效果示意圖。從圖3中可以較為清晰地看出,兩個區域的RGB效果有著非常直觀的差異,這種肉眼可見的差異性對于定位或區域分類來說具有十分重要的辨識度,對于有效提高定位區域的辨識度和提升整體區域的定位都具有非常重要的作用。

圖2 基于卷積神經網絡的無線定位方法定位區域RGB效果示意圖Fig.2 RGB effect diagram of localization area by wireless localization method based on convolutional neural network

圖3 圖2右下角兩個相鄰區域的RGB效果示意圖Fig.3 RGB effect diagram of adjacent localization area in Fig.2

3 性能分析

為了證明卷積層具有優越的無線定位能力,在性能分析中將使用不同尺寸的卷積核與步長,通過調整這些超參數來驗證卷積層在本文無線定位方法中的作用。同時為了驗證本文方法的通用性,本節將在幾種不同的假設環境中進行仿真,分別涵蓋不同大小的總區域與子區域。通過選取相同大小的總區域與不同大小的子區域,可以得到類尺寸的選取與最終平均定位誤差的關系。由于采用了小區域仿真的方案,當隨機選取出的(x0,y0)位置不同時,模型的性能會有少許差異,但經過反復隨機與手動按照固定間隔選擇(x0,y0)的驗證可以保證該差異造成的性能評估參數差異不超過中位數的5%。

3.1 卷積層參數選取

本節使用的總區域為100 m×100 m的正四邊形,子區域為1 m×1 m的正四邊形,假設輸入數據的來源為4組天線陣列,每組天線陣列包含4×4共16根天線,其產生的數據(包含RSSI與TOA)占據輸入矩陣的4×4×2個單元,本節將在此基礎上對卷積層進行調試。另外,為便于對比,對于不同方案使用相同的(x0,y0)。

方案1為在圖1所示卷積神經網絡的第1層直接采用4×4尺寸的卷積核,并采用[4 4]的步長進行實驗。由前文的假設可以認為:卷積核共執行4次操作,并對4組天線陣列的特征值分組進行運算,以每一個陣列為整體通過相似度擬合近似的無線定位算法得到一個該天線陣列對應的定位信息。具體的相似度擬合近似算法有很多種,例如:在無線定位方法中單個天線陣列的RSSI和DOA信息已經具有獨立的定位能力;或者由相鄰天線的相位差(或時間差)信息,并結合所得到的信號到達角信息也可以進一步進行計算,得出定位信息等。在此方案中,同時考慮信號的相位差(或時間差)以及信號到達角來進行相似度擬合近似計算。在此基礎上調試后續的隱藏層,可得出方案1的性能如表1所示。

表1 方案1性能結果Table 1 Performance results of Scheme 1

方案2在方案1的基礎上稍做改變。首先通過減小步長到[1 1]從而允許卷積層進行跨陣列的運作,除了該步長外并不調整第1層卷積層內的其他超參數,即卷積核尺寸與個數保持不變,且與方案1相同。在卷積神經網絡中這種步長的調整較為普遍,尤其是在如本文仿真的相似環境下,由于樣本的特征值較少,理論上應當使用如[1 1]等更小的步長盡可能多地保留其特征量,并盡可能全面地學習信號的局部特征。在此條件下調試后續隱藏層并進行學習,獲得方案2的性能如表2所示。

表2 方案2性能結果Table 2 Performance results of Scheme 2

通過對比表1與表2可以發現,小步長的方案2擁有更高的訓練集準確率,然而有更低的測試集準確率,這意味著方案2產生了更嚴重的過擬合,且相較于方案1反而在一定程度上造成了定位性能的下降,更高的特征利用率反而降低了分類性能。使用本文提出的假設可以有效地解釋這個現象:由于天線的排布規律在卷積核跨越天線陣列時發生了變化,同一個卷積核作為定位算法的特征提取模式,在卷積核內均為同一陣列與卷積核內包含跨陣列數據的兩種情況下無法通用,這導致了跨天線陣列的卷積操作不能有效地產生定位依據,反而產生了不準確的定位依據,從而在一定程度上干擾了后續隱藏層的學習。從卷積層的工作邏輯上則可解釋為,在從天線陣列數據中提取特征以完成定位的過程中,對完成定位更具有意義的是全局性的特征,而非局部性的特征。另外,方案2相較于方案1使用了更小的步長,而步長與該卷積層輸出特征圖的高度與寬度呈反比,這意味著方案2中該卷積層輸出的特征量為方案1的16倍,但沒有提升定位性能,只是單純地增加了神經網絡中流動的冗余特征量,增加了調試難度,以及訓練與訓練后分類的運算時間。通常,在進行卷積操作時選用的卷積核邊長應為奇數,這是由于邊長為奇數的卷積核更適合進行保留特征量的填充,同時奇數邊長的卷積核在抵達邊緣時由于具有對稱中心,在提取特征時更為敏感。

方案3為假設使用4個僅包含9根天線的天線陣列,因此在方案1的基礎上等比例縮小了輸入的特征圖以及卷積核的尺寸與步長,使用3×3的卷積核與[3 3]的步長。方案4則在方案3的基礎上改為使用[1 1]的步長。兩種方案性能對比如表3所示。從表3中可以得出,即使是使用更適用于小步長的特征精細提取的奇數邊長卷積核,最終的性能對比結果與方案1、方案2的對比結果相同,精細的局部特征提取僅能增加過擬合并在一定程度上降低定位精度,而對天線陣列整體進行的全局特征提取則擁有較好的效果。

表3 方案3與方案4性能對比Table 3 Performance comparison between Scheme 3 and Scheme 4

3.2 卷積層在無線定位中的應用

本環境的設定為3.1節中的第1種情況:總區域為100 m×100 m的正四邊形,子區域為1 m×1 m的正四邊形。在此環境下生成10 000個訓練樣本與3 000個測試樣本,訓練樣本采用70 d B信噪比,測試樣本采用30 dB信噪比。設置學習速率為0.003,驗證耐心為15。表4為在本環境下訓練結束后訓練集產生的混淆矩陣,其中R/C表示矩陣的每行為實際分類,每列為預測分類結果。為了便于查看,表中的第1行與第1列用于標注實際混淆矩陣行與列的序號,實際混淆矩陣從第2行第2列開始?;煜仃嚨男袛岛土袛低诸悢?,因此本混淆矩陣應為25×25的矩陣,但由于篇幅限制,在表4中只展示其中的前12行與前12列?;煜仃囉梢阎挠柧毤c模型預測的對應關系生成,其中每一行依次包含實際屬于這一類的樣本,每一列包含被模型預測到此類的樣本。以表4的第7行為例(表中未能展示,但該行在第12列之后均為0),該行表明在測試集的第7類中總共包含397個樣本,其中有372個被訓練后的模型正確分類到了第7類,有7個被錯誤分類到了第2類,有6個被錯誤分類到了第6類,有12個被錯誤分類到了第12類。顯然,混淆矩陣的左上?右下對角線上的數值即為每一類當中被正確分類的樣本個數,根據混淆矩陣可以快速計算分類準確率。同樣地可以獲得對測試集的混淆矩陣如表5所示。

表4 100 m比1 m環境下訓練集混淆矩陣Table 4 Confusion matrix of training set in 100 m to 1 m environment

表5 100 m比1 m環境下測試集混淆矩陣Table 5 Confusion matrix of test set in 100 m to 1 m environment

從表4、5中可以看出,第x類最容易被錯誤分類至的類為第x-1類、第x+1類、第x-4類和第x+4類,對照幾何關系可知,這些易混淆類即為正確分類相鄰的類,這與前面所做的假設相吻合。結合表4、5可以得到訓練集與測試集的兩組性能評測數據。但為了證明本文方法的優勢,進一步使用經典的RSS三邊定位算法進行對比仿真。在RSS算法中使用與本文方法相同的采樣方案,即在總定位區域內隨機選?。▁0,y0)并以此為原點向x軸與y軸正方向拓展出5個子區域邊長,隨后在此定位區域內隨機取點獲取RSSI進行后續分析。

在RSS三邊定位方法的計算過程中,與卷積神經網絡的測試集生成方案相同,取樣本的信噪比為20 d B。每個陣列的16根天線所獲取的數據都被充分利用以加權平均的形式降低噪聲的影響。三邊定位與卷積神經網絡方法同樣取3 000個測試點進行評估,不同的是由于沒有類的劃分因此不存在分類準確率,對該算法只計算平均距離誤差。為了使該平均誤差距離與神經網絡的平均距離誤差在同條件下比較,對三邊定位產生的結果再進行額外的分類處理,通過將三邊定位得到的接收端坐標與子區域的類進行對應從而獲得三邊定位所得的分類結果,同樣計算得到以子區域偏移為基準的基于距離的誤差。在最終得到了平均距離誤差后,結合卷積神經網絡方法的性能評測數據如表6所示。

表6 100 m比1 m環境下性能評測數據Table 6 Per for mance evaluation data in 100 m to 1 m envir onment

從表6中訓練集準確率與測試集準確率可以看出,模型存在一定程度的過擬合,但測試集準確率仍然達到了較優秀的效果。對于測試集的處理速度足夠快,平均每個樣本僅需要1.56×10-5s。通過對比測試集平均誤差與三邊定位平均誤差可以發現,本文方法所提供的定位精度優于傳統三邊定位的定位精度,其平均誤差距離僅為傳統三邊定位的平均誤差距離的17.90%。

3.3 大區域低精度要求下的結果與分析

本環境下總定位區域仍然維持100 m×100 m,但將類的精度降低,子區域大小調整為3 m×3 m。訓練集與測試集的尺寸維持不變,仍然生成10 000個訓練樣本與3 000個測試樣本;其信噪比維持不變,訓練集使用70 d B的信噪比,而測試集使用30 d B的信噪比。取學習速率為0.003,驗證耐心為15,訓練結果如表7所示。

表7 100 m比3 m環境下性能評測數據Table 7 Per for mance evaluation data in 100 m to 3 m envir onment

對照表6、7可以得出,每一類子區域尺寸的提升將增加模型的準確率,但也會增加分類錯誤時產生的誤差距離,因此平均誤差距離有所上升。在本環境下子區域邊長增加了200%,測試集平均誤差增加了約93%,而三邊定位的平均誤差距離增加了近200%,本文方法平均誤差僅相當于三邊定位平均誤差的12.42%,相較3.2節所述環境相對性能并未下降,說明在本節環境下本文方法仍然是一種具有優勢的定位方法。

子區域尺寸是一個需要權衡的重要參數,然而對其進行選擇的參考條件并不能在仿真環節中得到良好體現,這是由于子區域的選擇直接關系到算法所期望的定位精度以及訓練樣本采集的困難程度,這些要素在實際實驗中將會得到更好的展現。

3.4 小區域高精度要求下的結果與分析

本環境取總定位區域尺寸為10 m×10 m,子區域尺寸為0.1 m×0.1 m,總區域與子區域的面積比例與3.3節相同,但兩者都進行了縮小。訓練集與測試集的樣本數量維持不變,仍然生成10 000個訓練樣本與3 000個測試樣本;由于發射基站距離接收端距離更近,對信噪比進行提升,訓練集使用70 dB的信噪比,而測試集使用30 d B的信噪比。取學習速率為0.003,驗證耐心為15,訓練結果的混淆矩陣略過不表,在混淆矩陣中觀察,最易混淆的類是與正確類相鄰的類依然成立,性能結果如表8所示??梢园l現,在維持相同的總區域與子區域邊長比的前提下,總區域與子區域的絕對邊長對本文方法所構建模型產生的影響較小。準確率的下降可能是由于相鄰兩子區域之間的無線信號特征相似程度的大幅增加,因此神經網絡更難對其進行區分。在本節環境下,本文方法與三邊定位的平均距離誤差比為15.65%,仍然占有絕對性的優勢。

表8 10 m比0.1 m環境下性能評測數據Table 8 Performance evaluation data in 10 m to 0.1 m envir onment

3.5 性能對比與分析

本節采取與3.2節中相同的仿真環境,除3.4節中已使用的三邊定位外,本節引入了傳統指紋定位與傳統機器學習的基于特征值指紋分類的定位方法作為對比方案。每一種分類器均使用AutoML對模型進行最優化調試,最終所得模型的性能對比如表9所示。由表9可見,在分類精度上本文方法與非卷積DNN、優化SVM的性能相近,然而本文方法在準確率、空間占用與分類速度上均優于非卷積DNN,而優化SVM的準確率雖然略高于本文方法,但其空間占用與分類速度相對本文方法而言劣勢巨大,因此可以認為本文方法是一種性能優異的定位方法。

表9 不同定位方法性能對比Table 9 Performance comparison of different locati?zation methods

4 外場測試實驗驗證

4.1 室外實驗

4.1.1 實驗場景

本次實驗場景位于某個特定的室外區域,3個無線小區ID分別注冊為物理小區標識PCI=199,PCI=45與PCI=137。每個基站可以對接收端提供3種不同的特征:RSSI,定時提前值(Timing ad?vance,TA)和DoA。其中TA是與距離相關的參數,而DoA在特征數據中又分為hDoA與v DoA,分別代表水平方向的波達方向角與豎直方向的波達方向角。樣本的選取集中在“測試點位”區域,在該區域中間隔10 cm左右取一個采樣目標點,在同一條直線上共取9個點作為9個類別。

4.1.2 數據采集

在實驗中采集所得數據格式如表10所示,其中puschTa表示上行信道的時間提前量。表10展示了在其中一個點位,由PCI=199區域的基站提供的部分數據作為參考,可見基站返回的數據中包含時間戳與4種特征值。

表10 室外實驗采集所得數據Table 10 Data collected fr om outdoor experiments

綜上所述,本實驗過程中采用的訓練數據格式為:抓取每個PCI樣本中同PCI時間戳排序順位相同的樣本,并將其組合為一個用于訓練的樣本。如表11所示,本實驗中使用的輸入格式為3×4×1矩陣,其中同行的數據來自相同PCI,而同列的數據具有相同的特征類型。這種排布滿足前文所述的相鄰數據的組合,具有額外的定位價值,是一種合理的排布形式。由于樣本中的特征值相較仿真實驗更少,卷積神經網絡的應用將得到進一步考驗。最后,在訓練前對數據集進行了預處理,消除了飛點與PCI數量不足3個的樣本。相反,測試集應當反映實際應用的結果,不應當進行篩選,因此測試集一律使用的是未經任何處理而直接組合成輸入數據格式的樣本。

表11 室外實驗輸入數據格式Table 11 Input data format of outdoor experiments

4.1.3 現場實驗結果分析

雖然實驗中使用的數據受到限制無法直接獲得多天線數據,但由于發射基站能夠返回波達角作為額外的特征值,因此每個基站仍然具有獨立的定位能力,從定位的概念而言與仿真中所使用的天線陣列相似。在此神經網絡基礎上進行訓練時,由于數據本身已經是實測數據,不再對其添加噪聲,而是直接使用。使用0.001學習速率進行訓練后得到的結果如表12和表13所示。對比表12與表13可以發現,由于測試集數據為原始數據并未篩去飛點樣本與PCI數量不足3的樣本,導致測試集的分類結果中產生了一些與訓練集的分類結果錯誤模式不同的隨機錯誤。

表12 室外實驗環境下訓練集混淆矩陣Table 12 Confusion matrix of tr aining set in outdoor experimental environment

表13 室外實驗環境下測試集混淆矩陣Table 13 Confusion matr ix of test set in outdoor exper imental envir onment

表14進一步給出了室外實驗環境下性能評測數據。從表14中可以發現,本文方法最終的分類和定位效果極佳,雖然測試集準確率與訓練集準確率的差距表明該情況下的過擬合比仿真更嚴重,但這是由于采集數據中的飛點與訓練集本身較小的雙重原因導致的。實驗環境下的測試集平均誤差大于3.4節仿真中小區域高精度環境下的測試集平均誤差,這應當是由前述的飛點樣本與PCI小于3的樣本導致的不可預期誤差。若要改善這些誤差,降低PCI缺失樣本造成的精度損失的最佳方案是從硬件或邏輯上改善數據采集方案,使得在實際運用時能夠在短時間內(此處強調短時間內是為了保障定位的時效性,實際分類并不需求3個PCI返回的數據時間戳相近)抓取全部3個PCI的數據構成輸入數據;若要降低PCI返回數據本身與平均數值相差過大造成飛點產生的精度損失,則應當從獲取到的數據本身下手,通過在定位方案中加入已知定位區域的各個特征值合理上下限邏輯判定來直接丟棄誤差嚴重的樣本,并重新向相應PCI請求新的樣本。

表14 室外實驗環境下性能評測數據Table 14 Per for mance evaluation data in outdoor experimental environment

為了驗證本文方法的有效性,同樣將本文方法與其他分類方法進行對比,結果如表15所示。在本實驗的性能對比過程中,通過使用AutoML對基于各類分類器的模型使用貝葉斯優化的超參數調整,確保模型性能后,從最優化的參數狀態開始手動調整模型復雜度以權衡分類精度與模型體積,最后與本方法進行對比。由于三邊定位、DOA、TDOA與AOA等計算型的無線定位算法在有建筑物遮蔽信號源的狀態下不可使用,此處不進行對比。從表15中可以得到,在實驗環境中雖然由于可利用的移動網絡基站并不具有多天線分別返回特征值的能力,導致單個樣本內的特征量減少至僅有12個,作為一種基于分類的定位方法,本文方法仍然對絕大多數同樣基于分類的無線定位算法具有優勢。傳統的指紋定位與機器學習方案均在準確率上劣于本文方法,而非卷積的DNN分類方法在準確率上相對本文方法具有微弱優勢。在本實驗環境中由于樣本復雜度低且樣本庫較小,本文方法在空間占用上與分類速度上的優勢無法得以體現,但本文方法仍然是一種高效、高精度的無線定位方法。

表15 室外實驗性能對比Table 15 Compar ison of outdoor experimental per?formance

4.1.4 室外實驗結果

以上主要介紹了室外實驗的實驗過程與實驗結果。由于實際運用時的數據采集受到預定位區域可用的無線發射基站的硬件機能限制,因此仿真時所使用的輸入數據格式與卷積神經網絡構造均不可直接運用,但在經過對這兩者小幅度修改以及對超參數的調整后,本文方法依然實現了與優于仿真環境的大于92%的定位準確率,達到了10 cm級別的定位精度誤差,具有較優的定位性能。通過與其他定位方法的對比也證明了卷積神經網絡即使在樣本復雜度極低的無線定位中仍然具有良好的實踐效果。

4.2 室內實驗

4.2.1 實驗場景

圖4為自制室內數據采集App中的場景圖,該室內場景為某電信營業廳,綠色標記為已采集子區域,藍色標記為當前采集子區域,移動網絡基站位置如圖紅色PRRU中所示,建筑承重柱等電磁波遮擋作用強的物體以黑色正方形與圓形標示,展示柜等電磁波遮擋作用低的物體用淺色線標示。

圖4 室內實驗環境圖Fig.4 Indoor experimental environment map

4.2.2 數據采集

數據采集時的子區域分劃中,每個網格的邊長均為3 m,本次實驗僅針對營業廳的一樓進行。由環境圖可見大多數有效的采集區域集中在第1~7行以及第3~15列,將其命名為R1~R7以及C3~C15。同樣地,由環境圖可見,營業廳中存在部分子定位區域,其大部分面積均被不可踏入的物體所覆蓋,例如R2C12被承重柱覆蓋,R3C14在大門內部等,此類由于用戶無法到達因而被排除在外的子區域共5個。如R5的C6~C10這種有一半面積被扶手電梯的底座所覆蓋的子區域,則在其可供人行的部分進行數據采集。

以某一次采集為例,在每個子區域中采用4部手機同時進行數據采集,采集邏輯為以每秒一次的頻率將手機所能檢測到的所有移動網絡基站的各類網絡特征記錄下來作為一組數據。在每個子區域內共采集1 min,采集過程中手持手機在靠近子區域中心的位置走動以增加樣本的多樣性。對從現場采集可用的數據來源手機中獲取的數據集進行初步處理,將冗余的時間戳等數據刪除后數據如表16所示,其中,AsuLevel為手機信號強度,RSRP為參考信號接收功率,RSRQ為參考信號接收質量。

表16 室內實驗采集所得數據Table 16 Data collected fr om indoor exper iments

在對處理后得到的數據集進行分析發現,整個區域共有13個出現較為頻繁的移動網絡基站,通過識別其具有唯一性的PCI編號抓取每個移動網絡基站對應的RSSI、RSRP與RSRQ值,并依序進行排布,最終構成一個13×3的矩陣,每個矩陣作為一個樣本組成訓練集進行訓練。當一個樣本中沒有出現這13個標記PCI中的某個數據時,將樣本中的RSSI、RSRP與RSRQ值以缺省值-131、-131與-22進行填充,這些缺省值來源于CellSig?nalStrength類中對應返回值的值域下限。通過使用上述缺省值代替默認的0值可以減小PCI缺失時樣本對神經網絡產生的沖擊,提升神經網絡的整體性能。

4.2.3 神經網絡的調整與訓練

相較于之前的室外實驗,本實驗中所使用的輸入樣本包含更多的特征值,尤其是從卷積層的角度更關注的是每一層中所包含的特征值數量,而在本實驗中該數量為195,和仿真過程中使用的每層64特征值更相近,在調整后發現相對室外實驗所使用的神經網絡,僅對第1層卷積層進行卷積核尺寸與數量的修改即可進行訓練。

本實驗中每個移動網絡基站所具有的特征值為3個,由4.1節中的設想可知在第1卷積層使用3×3的卷積核與[3 3]的步長最為理想。在進行調參嘗試后發現該參數確為理想參數,相較其他卷積核尺寸與步長而言有更高的準確率(平均約高3%)與更低的平均誤差(平均約低0.15 m)。

4.2.4 現場實驗結果與分析

將總數據集進行隨機亂序處理,并從中以7∶3的比例分割得到訓練集與測試集。調整訓練超參數后,進行訓練得到訓練集、測試集混淆矩陣(部分截?。┡c訓練集、測試集分類準確率與平均誤差結果,如表17~19所示。由表17、18的混淆矩陣可以看出,對于部分子區域組合如子區域4與子區域5,其樣本之間仍然存在嚴重的重合率。這主要是由于安卓系統所提供的類只允許輸出最高精度為1的無線信號特征值,而對于某些相鄰的子區域而言,其之間的特征值差距并無法達到該閾值,因此安卓系統返回了完全相同的值,因此該問題并沒有有效的解決途徑。由表19可知,本實驗的訓練結果沒有產生過擬合,而在訓練集與測試集中均有約23%的樣本被錯誤分類。在平均誤差的計算時,兩個子區域之間的誤差距離為子區域中心的距離,即產生錯誤分類時,若分類結果為正確結果相鄰的子區域,其誤差距離應為3 m。參考測試集的平均誤差并對比分類結果可知,在所有錯誤分類中有85%的錯誤為分類至相鄰子區域。進一步查看測試集中的錯誤分類樣本與訓練集中錯誤類內的樣本發現,在錯誤分類中有95%以上均為由于測試樣本與訓練集中的其他類樣本完全一致所導致,即上述暫無有效解決途徑的數據采集誤差。

表17 室內實驗環境下訓練集混淆矩陣Table 17 Confusion matrix of training set in indoor experimental environment

表19 室內實驗環境下性能評測數據Table 19 Per for mance evaluation data under indoor exper imental environment

在本實驗的性能對比過程中,通過使用AutoML對基于各類分類器的模型使用貝葉斯優化的超參數調整,確保模型性能后從最優化的參數狀態開始手動調整模型復雜度以權衡分類精度與模型體積,最后與本文方法進行對比,結果如表20所示。與之前的室外實驗相同,由于三邊定位、DOA、TDOA與AOA等計算型的無線定位算法在室內隔斷、水泥墻體等遮蔽物存在的非直射狀態下不可使用,此處不進行對比。由表20可以得知,在本實驗環境下,優化樹方法擁有與本文方法相似的優秀性價比,而指紋定位、優化SVM與DNN等方案則分別由于空間占用與準確率性價比較低,性能不理想。

表20 室內實驗性能對比Table 20 Comparison of indoor experimental per?for mance

結合上述性能分析、室外實驗與室內實驗三者的結果可以得到以下結論:(1)特征值精度越高,樣本的多樣性越強,重復率越低,則神經網絡型的模型越具有優勢;(2)樣本量的增大對神經網絡型與樹型的模型會提升性能,負面影響很小,但會導致指紋定位型與SVM型的運算負荷與模型體積高速增加,降低其在移動端使用的性價比;(3)基于CNN的模型相對于普通基于DNN的模型具有更優秀的可學習參數利用率,能夠以更小的體積與更高的運算速度達到相同或更好的精確度。

表18 室內實驗環境下測試集混淆矩陣Table 18 Confusion matrix of test set in indoor experimental envir onment

4.2.5 實驗小結

在包含不可避免誤差的狀態下,本實驗最終得到的定位準確率為77.60%。對于通過分類器進行定位的方法而言這個結果雖然不夠理想,但由于該誤差來源的無法區分樣本均在距離近的子區域之間產生模糊,最終產生的平均定位誤差較低,從平均定位誤差的角度而言,在較為復雜的室內實驗環境下定位誤差仍然能夠達到0.739 5 m,效果較好。

5 結束語

本文提出了一種基于對5G蜂窩網絡特征數據使用卷積神經網絡進行深度學習的無線定位方法。該方法用一個訓練后的卷積神經網絡來替代指紋定位中的指紋庫與鄰近算法兩部分:由于分類需求出現時不必計算數量正比于指紋庫中樣本量的距離值,本文方法可以擁有更快的分類速度;同時由于訓練后的神經網絡僅儲存網絡結構與每個隱藏層內的權重與偏置,將占用遠小于指紋庫的數據空間,對于移動端應用十分有利。結合仿真與兩種不同實驗環境的對比結果可以得到以下結論:基于神經網絡的模型在使用5G蜂窩網絡的無線定位中相較傳統定位方案而言具有優勢,且這種優勢隨著5G蜂窩網絡特征值精度的提升與樣本重復率的下降而增加。在基于神經網絡的模型中,基于卷積神經網絡的模型相較不使用卷積層的神經網絡模型具有更高的性價比,這是由于卷積層的工作原理與無線定位對5G無線網絡特征值的運用方式相吻合,從而可使用更少的可學習參數完成同等或更強的定位精確度,在模型占用體積與分類速度上產生優勢。

猜你喜歡
卷積無線神經網絡
基于3D-Winograd的快速卷積算法設計及FPGA實現
《無線互聯科技》征稿詞(2021)
卷積神經網絡的分析與設計
神經網絡抑制無線通信干擾探究
從濾波器理解卷積
無線追蹤3
基于神經網絡的中小學生情感分析
基于ARM的無線WiFi插排的設計
一種PP型無線供電系統的分析
基于傅里葉域卷積表示的目標跟蹤算法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合