劉巖松 趙瑞琳 王金濤
(沈陽航空航天大學 遼寧沈陽 110000)
k-均值聚類算法在實際應用中運行速度快,操作簡便,實用性強,故該文選取k-均值聚類算法對空中交通運行狀態進行分類,同種交通運行狀態間的差異度最小化,不同種類的交通運行狀態間的差異度最大化。但鑒于k-均值聚類算法的局限性,例如:對于k的取值沒有明確的規定、無法判斷各個類別中的各個組成成員間的聚集程度,該文應用改進后的k-均值聚類算法進行計算。
該文采用基于方差分析的k-均值聚類改進算法,其基本運行原理如下。首先,對k值進行初始化,運用聚類分析方法取得聚類結果。其次,對聚類樣本數量>1 的組進行樣本方差分析,得到該組聚類組內樣本之間的聚集程度,如果每一個組都滿足P≥a,可以說明每一組的聚類樣本間不存在顯著性差異,這時的k值為最佳聚類數;若某一組出現p 圖1 以方差分析為基礎的k-均值聚類改進算法操作步驟 通過改進的k-均值聚類算法對空中交通的狀態進行分類,之后運用遺傳算法,對得到的結果進行解碼,得到最佳分類數。路網整體交通運行狀態評價指標樣本數據如表1所示[2]。 表1 路網整體交通運行狀態評價指標數據 從圖2 可知,當分類數取4 時,聚類空間距離和降低及分類數圖形的斜率絕對值最小,即變化趨勢緩和,并在實際的空中運行狀態劃分中,少交通量狀態、暢通狀態、穩定狀態、擁擠狀態的4 種狀態可用來對應4 種分類的狀態,因此,該文將分類數選作4。分別為:少交通量狀態、暢通狀態、穩定狀態、擁擠狀態[3]。 圖2 分類數選擇 運用k-均值聚類改進算法來獲得航路交通狀態劃分的最佳分類數后,采用矩形函數來構建航路網絡的隸屬度矩陣[4],對空中交通運行狀態進行歸類,進而從客觀出發,對空中交通運行狀態做出定量分類[5]。 航路網絡運作狀態模糊綜合評價模型的計算流程圖如圖3所示。 圖3 路網交通運行狀態模糊綜合評價模型的計算流程圖 Step 1:定研究空域,并獲取其范圍內的飛行數據。 Step 2:以15 min 為數據集時間間隔,研究路網整體交通狀況,評估時間序列因素,進行綜合模糊評估。 Step 3:確定航路網絡交通狀況模糊綜合評價模型的評價因子集U和基于評論的V。U、V的所包含的內容如公式(1)、公式(2)所示: Step 4:根據層次分析過程中每個評價因子的重要權重,來創建因子權重向量A。A={a流量,a流量交通密度,a交通接近率,a交通飽和率}。 Step 5:采集前一個月內的航段交通流量、航段交通密度、航段交通接近率、航段交通飽和率的數據,對各類數據進行k-均值聚類,將歷史數據的聚類類別設置為4,每個類別代表每個指標分為不同狀態級別時的流量狀態和閾值分布,同時令i=1。 Step 6:對于第i組數據集評價,通過Step 5中得到結果來創建模糊評價矩陣Ri。 Step 7:使用因子權重向量A和模糊評價矩陣Ri進行模糊運算,即B=A×Ri,得到模糊綜合評價集Bi,得到第i組評價因子集的最終評價結果。 Step 8:若i<96,令i=i+1,轉到S6,繼續,否則,交通狀態評價結束。 基于層次分析法和專家方法[6]計算因子權重向量A。因素權重向量的計算結果為:A=[0.0555,0.5679,0.2653,0.1205]?;趉均值聚類算法計算因素各項指標數據對應于路網交通狀態等級的閾值劃分如表2所示。 表2 因素集指標對應于路網交通狀態等級的閾值劃分 在對空中交通運行狀態進行分析時,多種指標性的分類閾值會導致無法直觀地對空中交通運行的總體態勢進行評價,對空中交通運行狀態的評價具有干擾性,故該文對各項判別指標進行歸一處理。通過對空中交通運行狀態的分類閾值可以看出,隨著空中交通擁堵嚴重,與此同時,交通流量、交通流量公里數、交通擁擠率以及交通負荷度增大,說明各個判別指標的上升意味著交通擁堵狀態的加劇。 由此,構造時空擁堵指數SI。 將時空擁堵參數作為目標函數進行聚類求解,對該文的數據進行時空擁堵情況的定量分析,可得到如下結果。 當0≤SI≤0.34798時,航空網絡處于少交通量狀態; 當0.34798 當0.70305 當1 該文主要從海量的航空流量數據中提取有用信息,從空中交通流量為出發點對空中交通的運行狀態進行預測評估,通過對k-均值聚類改進后得到的算法,來劃分空中交通運行狀態進行合理劃分,充分提取數據中所包含的交通狀態運行規律,以及通過模糊綜合評價模型對處在不同狀態的航路進行識別評價,通過計算得出:處在不同的運行狀態時,各個狀態下時空擁堵指數的閾值,為后續的空中交通擁擠程度研究提供更加便捷的判斷方式。但仍有一些不足之處,想要得到更精確的結果,需要進一步分析突發事件對于航路網絡運行狀態所帶來的影響程度,希望在日后的學習中可以進行下一步研究。2 最佳分類數確定
3 閾值確定
4 構建時空擁堵指數
5 結語