?

基于時空圖卷積神經網絡的離港航班延誤預測

2023-06-10 03:22姜雨陳名揚袁琪戴垚宇
北京航空航天大學學報 2023年5期
關鍵詞:離港準點航班

姜雨,陳名揚,袁琪,戴垚宇

(南京航空航天大學 民航學院,南京 211106)

隨著民航運輸需求量的不斷提升,航班延誤問題已經成為限制民用機場發展的主要瓶頸之一。同時伴隨機場網絡的規模持續擴張,機場之間的航班延誤傳播現象愈發頻繁[1]。因此,如何精準高效地預測航班延誤就變得至關重要,這不僅可以提前感知機場航班延誤發生的可能性[2-3],還能夠反映航班延誤的波動情況[4]。

縱觀國內外學者的相關研究,對航班延誤預測問題大多采用構建預測模型的解決方式,并且研究對象主要集中在航班延誤波及、航線延誤和機場航班延誤。Cai[5]和Hao[6]等構建航班延遲模型以分析延誤波及問題;Guo[7]、Thiagarajan[8]和羅謙[9]等從航線延誤角度出發構建航班延誤預測模型;王春政等[10]致力于研究機場網絡中各子系統間的延誤特征并提出基于Agent 的機場網絡延誤預測模型;Khanmohammadi 等[11]基于自適應網絡構建了模糊推理系統和模糊決策系統,可分別執行航班延誤預測和飛機降落計劃制定兩大任務。

近些年來,隨著人工智能的迅速發展,越來越多的學者運用深度學習的思想去解決交通運輸領域的預測問題[12-13],常見的深度學習算法有卷積神經網絡(convolutional neural networks, CNN)和循環神經網絡(recurrent neural network, RNN)等。吳仁彪等[14]在CNN 的基礎上增設直通通道并引入卷積衰減因子以控制不同深度網絡的特征疊加比例,從而維持航班延誤預測模型的穩定性。部分學者提出 使 用 圖 卷 積 神 經 網 絡[15-18](graph convolutional network, GCN)捕捉交通網絡中的空間特征以提升預測精度。Yin[19]和馮寧[20]等利用譜圖卷積方法將卷積操作應用至圖結構數據以提取路網中的空間特征,從結果來看這種方法使得預測模型具有相對較高的預測精度和穩定性,因此,如何將GCN 引入機場網絡中進行航班延誤預測亟待研究。

本文從航班延誤預測的時間序列特性出發構建機場網絡,在GCN 的基礎上建立基于時空圖卷積神經網絡(spatio-temporal graph convolutional networks,STGCN)的離港航班延誤預測模型,并使用TensorFlow為深度學習框架進行模型訓練和實例分析。

1 機場網絡與譜圖卷積

1.1 機場網絡模型設計

本文對航班延誤預測問題的表達式為

式中:vt∈Rn為第t時間段的n個機場的觀測向量,向量中每個元素都代表了對應機場的觀測值。式(1)表 示 由 前m個 延 誤 觀 測 值vt?m+1,vt?m+2,···,vt,去預測下一個步長為h的時間段內的延誤預測值v?t+1,v?t+2,···,v?t+h。

綜上定義第t時間段的機場網絡圖結構為圖Gt=(Vt,E,W)。其中,Vt為節點集,對應于各機場的延誤值;E為邊的集合,表示各機場之間的連接性,每個機場的觀測值并不是互相獨立而是成對連接的;W為Gt的 加權鄰接矩陣,其元素wij為 節點i和j之間的權重,同時也表征了對應2 座機場之間的連接度,這種連接度能夠反映出機場間的空間關聯性。不同時間段的機場網絡按時間序列進行排列,使得每個機場網絡圖中的延誤狀態信息是一種按照時序動態變化的圖信號,最終形成機場網絡圖結構的網絡數據,具體如圖1 所示。

圖1 機場網絡圖結構的網絡數據Fig.1 Network data of airport network graph structure

機場網絡的加權鄰接矩陣W反映了機場間的空間關聯性。W可根據各機場之間的周航班頻次計算得出,其元素具體公式為

式中:wij為 機場i和 機場j之間邊的權重;fij為機場i和 機場j之間的周航班頻次;fmax和fmin分別為最大航班頻次和最小航班頻次;ε為控制鄰接矩陣分布和稀疏性的閾值,取 ε =0.2。

1.2 基于譜的圖卷積方法

GCN 是一種研究圖的神經網絡,其本質在于提取網絡中的空間特征。目前圖卷積方法大致有2類:一種是基于空間域的圖卷積;另一種是基于譜的圖卷積。1.1 節所提出的機場網絡圖結構屬于拓撲圖,其包含了節點自身的節點特征和各節點之間的結構特征,并且擁有關于圖的鄰接矩陣,這使得機場網絡滿足譜圖的生成條件,因此,采用基于譜的圖卷積方法研究機場網絡的空間特征。

譜圖卷積的主要思想是利用傅里葉變化將圖信號從空間域轉換為譜域,之后再進行卷積運算。譜圖卷積相關公式為

式中:L∈Rn×n為 圖的拉普拉斯矩陣;I∈Rn×n為單位矩陣;D∈Rn×n為對角度矩陣,其對角線上的元素是各 節 點 的 度 數;U∈Rn×n為L的 特 征 向 量 矩 陣;Λ=diag([λ0,λ1,···,λn?1])∈Rn×n為對角陣,λi為L的特征值;X∈Rn×n為輸入的圖信號;“?g”表示圖卷積運算;Θ (Λ)為一個濾波器,是一個對角矩陣。

式(3)表示拉普拉斯矩陣L的譜分解,式(4)表示圖信號X通過核 Θ 與 傅里葉變化UTX相乘,完成由不規則的圖結構數據轉換為規則結構數據的過程,以便之后進行卷積操作,最終完成各節點特征和結構特征的信息聚合。

2 航班延誤預測模型構建

2.1 STGCN 結構構建

從機場網絡的整體性出發捕捉航班延誤的時間特征和空間特征,并且在時間軸上采用完全卷積結構?;诖?,將STGCN 用于預測航班延誤。STGCN的結構如圖2 所示,其中同一模塊使用相同顏色表示。

圖2 STGCN 結構Fig.2 Architecture of STGCN

STGCN 主體由時空卷積塊和輸出層構成,圖2右側部分反映了模型的整體流程,輸入是已知前m個時間段的延誤觀測值vt?m+1,vt?m+2,···,vt,通過時空卷積塊提取輸入值的時間特征和空間特征,并在輸出層進行特征整合,最終輸出延誤預測值v?。

2.2 提取空間特征的空間圖卷積

為考慮到機場網絡的連通性和全局性,將圖卷積直接運用至圖結構數據以提取網絡的空間特征。在式(4)所對應的譜圖卷積中,網絡的復雜度為O(n2),因此,使用切比雪夫多項式作為近似策略進行逼近以降低復雜度。

定義卷積核為對角陣 Λ的多項式,記作

式中:θ ∈RK為多項式系數的向量;K為圖卷積核的大小。

切比雪夫多項式Tk(x)用 來近似濾波器為K?1階的截斷展開式,即

基于此對圖卷積式(4)進行重新定義,具體為

式中:Tk為縮放后的拉普拉斯矩陣L? 的k階切比雪夫多項式。使用切比雪夫多項式進行逼近后計算局部卷積,網絡的學習復雜度降為O(K|E|)。

2.3 提取時間特征的時間門控卷積

由于CNN 具有訓練速度快、結構簡單等特點,因此,采用卷積結構捕捉機場網絡中發生航班延誤時的時間特征。如圖2 左側所示,時間門控卷積層中設有一個一維因果卷積,其卷積核大小為KT,而后連接一個門控線性單元(gated linear units, GLU)激活。對于機場網絡中的各節點,時間門控卷積對輸入元素的KT個近鄰進行挖掘,使得序列長度逐次縮短KT?1?;诖?,對每個節點的輸入視為一個長度為M、通道數為Ci的時間序列,因此將輸入設為Y∈RM×Ci。時間門控卷積的定義為

式中:Γ ∈RKT×Ci×2Co為時間門控卷積核,Co為輸出特征的通道數;“?Υ”表示卷積操作;P和Q為GLU 的輸入;“⊙”表示哈達瑪乘法。式(10)是指將輸入Y通過卷積核 Γ映射到單一輸出元素R(M?KT+1)×(2Co),且P和Q的 通 道 數 相 同。Sigmoid 門σ(Q)的作用是控制哪些輸入信息可以傳入下一層。使用GLU 不僅能通過堆疊卷積層從而充分利用輸入,還能在各卷積層間形成殘差連接以防止梯度消失。

2.4 時空卷積塊

時空卷積塊的主要結構如圖2 中間所示,其中空間圖卷積負責提取圖中的空間特征,時間門控卷積則用于提取時間特征。利用空間圖卷積連接2 個門控卷積,可以完成由網絡卷積向時序卷積的快速空間狀態傳播。此外時空卷積塊中采用層標準化以防止模型過擬合。

設時空卷積塊l的輸入為vl∈RM×n×Cl,輸出為vl+1 ∈R(M?2(KT?1))×n×Cl+1,且它們都是三維張量,具體計算公式為

圖2 右側部分中的輸出層由一個時間門控卷積與全連接層組成,門控卷積將時空卷積塊的輸出映射為單步預測,之后獲得中間輸出結果Z∈Rn×c,并通過式(12)得到延誤預測值v?為

式中:a∈Rc為待訓練的權重;b為偏置項。

最后運用 L2損 失函數衡量預測值v?與真實值v的不一致程度,具體公式為

式 中:A為 可 訓 練 的 所 有 參 數;v?t+1(·)為 預 測 值;vt+1為真實值。

3 實例分析

實例中以2011—2019 年美國的相關民航運輸數據構建機場網絡并對其進行航班延誤預測,驗證STGCN 用于預測機場航班延誤的可行性。

3.1 機場網絡構建

在美國選取51 座主要大型機場,將所選機場作為節點,通航航線作為邊構建機場網絡。美國本土的機場網絡如圖3 所示。

圖3 機場網絡Fig.3 Airport network

圖3 中藍點表示機場,藍點越大,表明旅客吞吐量越大,其中所選機場的年旅客吞吐量多數大于1 000 萬人次;藍線表示相應機場之間的航線連接,圖中顯示的連線均是日航班量大于或等于10 的航線。

圖4 為機場網絡鄰接矩陣W的可視化形式,采用LabelEncoder 對所選機場按照其三字碼首字母順序進行編碼。右側的彩色條說明了W中各節點間的權重區間在 [0,1]。權重越大,顏色越深,相應機場之間的聯系越緊密。當權重為0 時表示相應機場間沒有航線連接。

圖4 機場網絡鄰接矩陣W 可視化Fig.4 Visualization of adjacency matrix W in airport network

3.2 延誤數據采集

所選51 座機場的航班延誤數據來源于美國聯邦航空管理局(FAA),其中包括了2011—2019 年這51 座機場共計167 631 條航班延誤信息,選取機場離港準點率為延誤觀測值和延誤預測值。機場離港準點率是指飛機在預計起飛時間之后的15 min(含)內脫離跑道起飛的準點率。具體延誤信息示例如表1 所示。使用Scikit-Learn 庫中Preprocessing模塊的 StandardScaler函數對各輸入數據進行ZScore 標準化操作。

表1 機場航班延誤數據示例Table 1 Example of airport flight delay data

3.3 實驗設置

3.3.1 實驗環境與參數設置

相關實驗算法均采用Python 3.7.0 進行編寫;深度學習框架為TensorFlow 1.14.0;處理器為Intel(R)Core(TM) i7-10510U,CPU 頻率為1.80 GHz;圖形處理器為NVIDIA GeForce MX250;機帶內存為16 GB。

選取 2 011—2 019年中前7 年的延誤數據作為訓練集,第8 年為驗證集,第9 年為測試集。在測試集中,歷史時間窗口設為7 天,分別預測未來1 天、2 天、3 天的機場離港準點率。在設置模型參數時,最大迭代次數(epoch)設為50;批處理數據量(batch size)設為100;深度學習優化器采用 RMSProp算法;初始學習率設為0.008;學習率衰減設為0.7;時空卷積核的大小均設為2。

3.3.2 評價指標選取

選取平均絕對誤差(mean absolute error, MAE)、平均絕對百分比誤差(mean absolute percentage error,MAPE)、均方根誤差(root mean square error, RMSE)作為評價指標。具體計算公式為

式中:y?i為 預測值;yi為 真實值;n為預測序列長度。

3.4 實驗結果分析

3.4.1 不同模型預測結果對比

實例分析中運用STGCN 預測機場離港準點率,并選擇3 種經典預測模型進行比較。

1)歷史平均(history average, HA)法:一種經典統計模型,將歷史平均交通數據作為預測值。

2)長短期記憶循環神經網絡(long short termmemory, LSTM)[21-22]:RNN 的改進模型,能夠充分利用長距離時序信息,并且可以保持長時記憶。

3)堆棧自編碼器(stacked autoencoders, SAEs)[23]:通過堆疊自動編譯器建立,將下一層編譯器的輸出作為當前層的輸入從而形成一個深度網絡。

實驗結果如表2 所示??芍?,當預測窗口分別是1 天、2 天和3 天時,STGCN 相比其他3 種預測模型都取得了更好的預測結果。HA 和LSTM 等傳統模型并不適用于長期預測。SAEs 由于缺少空間特征的捕獲,因此,預測結果相比于STGCN 仍有一定差距。

表2 不同預測模型預測結果的評價指標對比Table 2 Comparison of evaluation indexes for prediction results by different forecasting models

圖5 為預測窗口為1 天時,SAEs 和STGCN 的預測曲線與真實值的比較,其中預測曲線的數值是當天51 個機場預測值的平均值??梢钥闯?,STGCN的曲線更接近于真實值,說明能夠更快速地響應航班延誤的動態變化從而更精準地預測航班準點率。

圖5 不同預測模型的預測曲線Fig.5 Prediction curves of different forecasting models

3.4.2 不同機場預測結果對比

具體到不同的機場,STGCN 的預測效果也有所區別。選取預測窗口為1 天時,3 座代表性機場的預測結果進行比較,如圖6 所示。其中HNL 是所有機場中MAE 最小的,表明預測效果最好;JFK的MAE 處于所有機場的中等水平;MEM 的預測結果不及上述2 座機場,其MAE 為10.54,是所有機場中最大的。結果表明,對于離港準點率波動不大的機場,STGCN 的預測精度較高;而對于準點率波動較大的機場,預測精度會相對下降,但從圖6 中MEM 的預測曲線可以看出,對于準點率波動較大的機場仍舊能夠較好地擬合出延誤波動趨勢。

圖6 不同機場的預測結果Fig.6 Prediction results of different airports

進一步分析延誤預測誤差相對較大的機場,發現它們均坐落于人口密集的大城市且都是樞紐機場,與其他機場的通航航線較多,這使得它們的延誤不確定性和隨機性相比于其他機場更為復雜。

基于此,下文分別從高延誤度、中延誤度和低延誤度3 種機場航班延誤程度各自所對應的預測精度出發,說明STGCN 的預測效果。其中低延誤度表示當天離港準點率大于或等于 80%;中延誤度表示準點率介于50%~80%之間;高延誤度表示準點率低于 50%。

圖7 為3 種不同延誤程度下的各機場航班延誤預測誤差對比,其中所選的均是一年中發生過高延誤的機場??梢园l現,在發生低延誤時,除了MEM的預測誤差較高,其他機場的MAE 均在2~7 之間,表明低延誤日的預測結果較好;中延誤日的預測誤差雖然整體上高于低延誤日,但仍處于一個較低的范圍,并且中低延誤日的預測誤差波動幅度較小,表明對航班延誤波動趨勢的掌握較好;發生高延誤時各機場預測結果的MAE 相對較高,并且波動幅度較大,但在這些機場中,除了MEM 的高延誤日天數較多,其他機場一年中的高延誤日天數均未超過10 天,并且整個機場網絡中平均每個機場一年中發生高延誤的天數僅為2.59 天。

圖7 三種延誤程度下的各機場預測誤差比較Fig.7 Comparison of forecast errors in airports under three delay levels

因此,在未考慮特殊因素導致高延誤的情況下,STGCN 在一年的絕大多數時間中能夠進行較為精確的航班延誤預測,并且快速地響應機場發生航班延誤的波動情況。

3.4.3 不同時期預測結果對比

通常航空公司在一年中會多次改變航班計劃,這可能會導致航班延誤特征發生變化,而航班計劃的改變往往和航空運輸淡旺季相掛鉤,因此,為了更全面地測試不同時期下STGCN 的航班延誤預測能力,根據美國運輸統計局公示的2019 年旅客吞吐量挑選出全年航空運輸的旺季和淡季,并用STGCN分別對旺季和淡季進行航班延誤預測。其中淡季是2019 年1 月至3 月,旺季是2019 年7 月至9 月,預測窗口設為1 天。

最終淡季航班延誤預測結果的MAE、MAPE、RMSE 分別是5.156、6.984%、7.359;旺季航班延誤預測結果的MAE、MAPE、RMSE 分別是4.748、6.293%、6.542。2 個時期的預測結果評價指標和相應的全年指標相近,表明STGCN 在不同時期均能取得較好的預測表現。

進一步分析淡旺季中不同延誤程度下的預測結果,參照上文設定的3 種延誤程度劃分,在淡旺季中按照延誤程度分別挑選一天作為測試日。由于2019 年全美沒有發生所有機場整體離港準點率小于50%的高延誤日,因此,下文主要分析中延誤度和低延誤度這2 種延誤程度,并最終挑選4 天為測試日,分別為淡季中延誤日(2019 年2 月17 日)、淡季低延誤日(2019 年1 月21 日)、旺季中延誤日(2019 年7 月13 日)、旺季低延誤日(2019 年8 月20日)。4 個測試日的預測值和真實值對比如圖8 所示。

圖8 不同測試日的預測結果Fig.8 Predicted results on different test days

圖8 反映出在4 個測試日中除了個別機場預測值與真實值相差較大,其他多數機場的預測結果都與實際離港準點率相近,并且可以較為精準地反映出航班延誤的動態變化。隨后使用SAEs 進行再次預測,以評價STGCN 的預測能力。表3 為2 個預測模型的預測結果評價指標對比,可知STGCN 在4 個抽選測試日的預測結果都優于SAEs,說明在不同時期STGCN 相較于傳統預測模型均有著更低的預測誤差。

表3 STGCN 與SAEs 預測結果評價指標比較Table 3 Comparison of evaluation indexes between STGCN and SAEs

綜上所述,STGCN 在一般情況下擁有較高的航班延誤預測精度,其預測結果在一年中的不同時期均有著重要的參考價值和指導意義。

4 結 論

1)STGCN 相較于傳統的預測模型擁有更高的航班延誤預測精度,并且能夠快速地反映出航班延誤的波動情況。

2)針對不同的航班延誤程度,除了少數高延誤日的預測誤差相對較大,STGCN 在一年中的絕大多數時間都能保證較小的預測誤差。

3)在一年中的不同時期,STGCN 均能做出精準的航班延誤預測,為機場制定季節性的航班延誤保障措施提供參考價值。

下一步將思考如何引入機場網絡中的其他延誤影響因素至卷積中。在本文實例分析中發現部分高延誤日的預測精度較低,初步分析可能是惡劣天氣所導致的大規模航班延誤。未來會致力于在模型中引入氣象特征,從而進行更為精準的航班延誤預測。

猜你喜歡
離港準點航班
全美航班短暫停飛
離港航班延誤成本研究
山航紅色定制航班
山航紅色定制航班
山航紅色定制航班
長三角機場群運行相關性分析
準點
準點率前十,日本機場占五席
旺角暴亂嫌犯被禁止離港
JAL獲得世界航空公司準點率三冠王
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合