?

基于集成學習的廣域光骨干網多信道傳輸質量預測方法

2020-10-11 03:07孫曉川李志剛張明輝桂冠
通信學報 2020年9期
關鍵詞:骨干網信道因子

孫曉川,李志剛,張明輝,桂冠

(1.南京郵電大學通信與信息工程學院,江蘇 南京 210003;2.華北理工大學人工智能學院,河北 唐山 063210;3.河北工業大學電子信息工程學院,天津 300401)

1 引言

第5代移動通信系統(5G)的飛速發展[1-3]不斷促進云計算、遠程教育、智能城市、自動駕駛等高端需求的進一步發展,使終端用戶數量、網絡業務量和數據流量快速增長,支撐數字通信基礎設施的廣域光骨干網面臨嚴峻的挑戰[4]。全球范圍內,骨干網干線采用的都是光通信傳輸模式。為滿足未來400 Gbit/s速率的傳輸要求,構建高帶寬、大容量、快速響應的智能全光網勢在必行[5]。根據信道狀態、系統資源和用戶業務需求,未來智能光網絡應能夠自適應地調整信號速率、調制格式、波長等參數,實現骨干網資源的最大化利用。作為未來智能光網絡的核心技術,系統性能參數的監控、識別和預警,尤其是光信道性能分析與預測,是保障高速骨干網通信質量不可或缺的重要組成部分。

眾所周知,骨干網絡的光層特性決定了網絡承載流量的效率。光信道傳輸質量(QoT,quality of transmission)極易受色度色散、偏振模色散、光纖非線性、噪聲等多種損傷參數的影響[6-7]。這些因素的波動會導致光信道傳輸的突發性、空間異質性和復雜的非線性關系,從而給高容量、大帶寬、快響應的骨干網可靠通信帶來巨大的挑戰。通常,質量因子(Q因子)是衡量光信道傳輸質量最具代表性的度量標準之一。

高效的光通信質量預測對管理大規模的光傳輸和交換系統非常重要[8]。這是因為未來光骨干網絡將是一種具備動態重構和鏈路級恢復功能的網狀網絡,技術更復雜,極易受到網絡故障、錯誤配置、信號質量惡化等因素的影響[9]。具體地,一個短暫的服務中斷會影響大量的數據通信,且隨著信道數、數據傳送速率以及通信距離增大,光網絡對非線性效應更敏感。

近年來,機器學習(ML,machine learning)在骨干網通信中的應用已成為研究熱點,特別是在光信道性能預測方面,主要包括支持向量機、隨機森林、決策樹和神經網絡等[10-12]。目前,關于光信道性能預測的絕大多數研究都集中于單信道模式,這顯然無法為光網絡管控的智能化決策提供更準確的信息。而利用多信道性能預測輔助光網絡智能化管控的研究很少。文獻[13]研究了基于人工神經網絡(ANN,artificial neural network)的多信道Q因子預測方法,利用實時網絡運行和配置信息,在563.4 km的模擬實驗平臺上進行了不同信道開關模式下的Q因子預測。但該方法在處理多信道QoT預測問題時受到兩方面制約:1)單一ANN模型實質上是弱學習器,很難得到期望的預測結果,大量研究表明,通過某種策略聯合多個學習器,性能會顯著優于單個學習器[14];2)模擬光通信數據嚴重影響了ANN在實際光信道QoT評估中的有效性,而商用光網絡的真實數據更能反映光信道的不確定性和未知因素,更有助于構建一個有效而精確的ML模型。

集成學習(EL,ensemble learning)是一種應用廣泛的機器學習優化方法,可以將弱預測器集成組合為強預測器,提高算法的非線性逼近性能[15]。具體地,集成學習分別對多個單一學習器(同質/異質)進行訓練,按照某種策略對學習結果進行整合,從而找到每個學習器之間的互補性,獲得更加優秀的性能。一方面,集成學習中的結合策略可以減輕由于特征不相關和冗余而產生的剩余效應;另一方面,多個獨立模型學習能力的變化使它們能夠捕獲不同的數據特征,為整合結果提供了附加價值[16]。利用這些優勢,集成學習模型可以獲得比模型中任何獨立模型更好的預測性能。目前,集成學習算法主要包括Bagging算法、Boosting算法和Stacking算法[17]。其中,Stacking算法常用于提升機器學習模型的預測性能。鑒于此,本文將探索基于Stacking的集成學習模型在光信道QoT預測中的可行性。

本文提出了一種基于集成學習的新型廣域光骨干網絡多信道QoT預測方法。結構上,該模型由5個多層感知機(MLP,multilayer perceptron)組成的基預測器和一個MLP組成的元預測器堆棧而成。訓練模式上,分別訓練基預測器中的MLP,整合其預測結果作為元預測器的輸入進行二次訓練,最終的結果兼顧多個預測模型的學習能力。實驗結果表明,集成多個學習器使光信道QoT預測方法的泛化性能更強和可移植性更優,避免了單一學習器的預測精度不足,分散了預測誤差的風險,提高了光信道性能預測的可靠性。

2 基于集成學習的光信道QoT預測模型

本文構建了基于Stacking算法的廣域光骨干網多信道QoT預測模型,簡稱為EL-MLP。特別地,考慮Q因子作為信道通信質量的度量標準。結構上,基于EL-MLP的Q因子預測模型由數據選取、參數尋優和模型構建3個模塊構成,如圖1所示。受數據采集設備和不可控因素的影響,每個信道中的Q因子數據量存在差異,通過數據選取模塊,在單信道和多信道情況下選出等量的樣本數據集,并根據多信道選擇模式確定信道狀態,確保后續的模型訓練在相同數據量和相同多信道場景下進行。采用參數尋優模塊從所有備選參數中篩選出對預測器預測性能最有利的參數設置(如迭代次數、學習速率),輸入模型構建模塊,確定最優的EL-MLP預測模型。本文采用格式搜索的方法。

圖1 基于EL-MLP的Q因子預測模型

2.1 信道選擇模式

在多信道預測的信道選擇中,設置4種打開或關閉的信道狀態以生成4種不同的場景[13]。此外,設置包含信道狀態和Q因子特征的組合向量V來有效地表達每一條信道中Q因子的狀態。假設第1、第3、第5信道處于打開狀態,[1,0,1,0,1,0,0,0]表示當前所有信道的狀態,其中,“1”表示對應信道已被光網絡信號占用,“0”表示對應信道為開放頻譜信道。8個信道的相關Q因子特征λi(i=1,2,…,8)與信道狀態的組合向量為

根據組合向量,對處于信道關閉狀態的Q因子進行預測。一方面為處于打開狀態的信道減少負荷;另一方面為已接收的網絡流量分配合理的信道空間,避免出現負載過高、負載不平衡的現象。

2.2 訓練方法

MLP模型可以通過學習樣本集建立輸入與輸出之間的非線性映射。MLP模型的參數少且結構簡單,可以快速準確地處理Q因子時間序列數據之間的非線性關系[18],因此本文選用MLP作為基預測器和元預測器的組件。

EL-MLP訓練實際上是利用初始訓練集訓練出最優的基學習器,然后對基學習器中的所有MLP的輸出結果疊加取平均,生成一個新數據集,用于訓練元學習器。通常,MLP通過誤差反向傳播方法進行訓練。首先進行前向傳播計算,任意一層神經元對應的輸出為

MLP訓練的目的是通過最小化損失函數來確定最優的權重矩陣和偏置。假設MLP網絡的最后一層為第k層,則損失函數為

其中,Lk表示第k層的所有神經元,表示第k層第j個節點的預測值,表示第k層第j個節點的真實值。權重矩陣和偏置的迭代方程如下。

其中,η為學習速率。更新權重矩陣和偏置,直到損失函數達到指定范圍或迭代次數大于最大迭代次數,MLP訓練結束。EL-MLP訓練算法偽代碼如算法1所示。

3 仿真實驗與性能分析

本節首先介紹了實驗所采用的數據集、模型性能評估標準和模型參數選擇。然后利用集成學習模型EL-MLP對單信道內Q因子數據進行預測評估。最后建立了同時預測多信道內Q因子的EL-MLP模型,并分別在4種不同場景下進行了對比,檢驗了模型的預測精度及泛化能力。

3.1 數據集及性能評價標準

本文綜合評估了在單一光信道和多種場景下不同光信道中EL-MLP模型對QoT的預測性能。特別地,采用Q因子作為光信道QoT的度量標準。本文所使用的數據集來源于2015年2月到2016年4月微軟北美光骨干網,廣泛應用于研究光信道的時間行為、信號質量、信道之間的相關性、段之間的相關性等[9]。此外,選取了8種光信道Q因子時間序列數據作為樣本集,序列長度為20 000。

為進一步驗證該模型良好的非線性逼近性能,考慮了多層ANN進行性能對比[13],實際上,這是一個深度神經網絡結構。此外,本文采用均方誤差(MSE,mean square error)和平均絕對值誤差(MAE,mean absolute error)評估模型的預測性能。

其中,yi表示Q因子真實值,yp表示其預測值,N表示時間序列長度。實驗中,MSE和MAE的值越小,表明該模型對Q因子的預測精度越高,模型預測性能越好。

本文采用的EL-MLP第一層基預測器由5個結構相同的MLP模型構成,第二層元預測器由一個MLP模型構成。MLP結構包括一個輸入層、一個輸出層和2個隱藏層,每一層神經元規模設置為(6,6,6,6)。此外,本文使用網格搜索方法和五折交叉驗證方法對EL-MLP的迭代次數和學習速率進行優化。首先,確定迭代次數E和學習速率η的取值范圍,即E∈{1,51,101,151,201},η∈{1×10-4,2×10-4,3×10-4,4×10-4,5×10-4}。然后,在取值范圍內構建5×5的網格,從第一個網格(E1,η1)開始,遍歷網格中所有參數對并進行五折交叉驗證,求得所有的MSE如表1所示。其中,最小MSE對應的參數組合是最優的。

表1 模型參數設置

3.2 單信道QoT預測性能分析

圖2給出了EL-MLP和ANN針對單信道模式Q因子時間序列的預測趨勢對比。從圖2可以看出,EL-MLP可以更有效地擬合Q因子序列的變化趨勢,這意味著該模型具有更好的預測性能。圖3給出了不同時間步下評估模型對單信道模式Q因子的預測誤差對比。顯然,在大部分區域,EL-MLP的誤差值明顯低于ANN的誤差值。

表2從MAE和MSE這2個方面對比了EL-MLP和ANN的單信道模式QoT預測性能。從表2可以看出,在該度量標準下,EL-MLP對Q因子時間序列的非線性逼近性能優于ANN一個數量級以上。

圖2 單信道模式Q因子時間序列預測趨勢對比

圖3 單信道模式Q因子預測誤差對比

表2 單信道模式模型QoT預測性能對比

3.3 多信道QoT預測性能分析

本節考慮4種應用場景,構建了多輸入多輸出EL-MLP模型,同時對多個光信道通信質量進行預測。具體地,場景1中,光信道3處于開啟狀態,利用EL-MLP與ANN預測另外7個光信道中的Q因子值。場景2中,光信道1、2處于開啟狀態,預測剩余6個光信道的Q因子值。場景3中,光信道1、3和5處于開啟狀態,預測剩余5個光信道的Q因子值。場景4中,光信道1、3、5和7處于開啟狀態,預測剩余4個光信道的Q因子值。

圖4對比了4種應用場景下評估模型對光信道Q因子的預測性能,即不同光信道Q因子預測值與實際值的對比。與ANN相比,EL-MLP的Q因子預測值更接近實際值。表3給出了不同的多信道QoT預測場景下評估模型的預測性能。特別地,針對MSE性能度量,EL-MLP的預測性能比ANN提高了2個數量級。

圖4 不同應用場景下評估模型對于各信道Q因子預測性能比較

表3 多信道模式下模型預測性能對比

為了驗證EL-MLP的預測性能,本文針對光信道8在4種場景下的Q因子預測值進行了分析,如圖5所示。在不同場景模式中,EL-MLP依然可以更有效地擬合Q因子時間序列的變化趨勢。這些結果說明在多信道QoT預測任務中所提模型具有更好的預測性能與泛化能力。

綜上所述,相比單一的機器學習模型,采用集成學習方法對光骨干網QoT預測更有效。這是因為集成學習組合多個同態學習器進行光信道QoT預測,不僅能夠有效緩解單一學習器的過擬合問題,而且可以顯著減小因參數選擇不準確而引起預測精度降低的風險,極大地提高了算法的泛化性能。

4 結束語

作為未來智能光網絡的核心技術,系統性能參數的監控、識別和預警,尤其是光信道性能分析與預測,是保障高速骨干網通信質量不可或缺的重要組成部分。本文研究了目前光信道QoT預測的機器學習方法,分析了單一預測模型存在的瓶頸問題和集成學習理論的優勢,提出了一種基于集成學習的廣域光骨干網QoT預測方法,實現了針對不同光信道QoT的有效預測,突破了現有解決方案在預測精度上的局限性。通過與深度計算模型的對比實驗發現,所提方法能夠極大地提高衡量光通信質量的Q因子的預測精度(至少一個數量級)。實際上,光信道傳輸質量不同程度地依賴多種損失參數,為進一步提高QoT預測的準確性,在未來的工作中擬研究在集成學習框架下多參數融合的多信道性能預測方法。

圖5 不同應用場景下光信道8中Q因子預測趨勢對比

猜你喜歡
骨干網信道因子
我刊2021年影響因子年報
信號/數據處理數字信道接收機中同時雙信道選擇與處理方法
構建鐵路數據通信網骨干網的網絡安全管理中心
有軌電車信號系統三層骨干網傳輸方案分析
一些關于無窮多個素因子的問題
加快新基建 200G骨干網呼之欲出,400G還有多遠?
影響因子
中國廣電網絡成為互聯網骨干網單位
一種無人機數據鏈信道選擇和功率控制方法
基于導頻的OFDM信道估計技術
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合