?

基于圖卷積神經網絡的航站樓旅客流時空分布預測

2024-01-17 12:48丁新偉劉騏暢
中國民航大學學報 2023年6期
關鍵詞:登機口航站樓時刻

丁新偉,秦 倩,闞 犇,劉騏暢,賈 馳

(1.首都機場集團有限公司國際科技部,北京 101300;2.中國民航大學電子信息與自動化學院,天津 300300)

隨著中國民航業整體穩健向前發展,機場依然需要解決航站樓旅客流與綜合交通區的合理接駁問題,以達到對航站樓旅客的高效疏散并提高機場運行效率[1-3]。實現航站樓旅客的時空分布預測,可準確獲取旅客的人員密度、關鍵節點人數等信息,為綜合交通區運力的合理調配提供依據。航站樓旅客流的預測本質上屬于時空序列預測問題,即基于歷史時期內的客流時空分布數據,預測當前和未來一段時間內的演化情況。目前,專門針對航站樓旅客流預測的研究較少,主要包括ARIMA 模型[4]、K 近鄰算法[5-7]、支持向量機回歸[8]等,且大多只基于整體或單一區域的旅客流序列,并只利用了整體或單一區域的時間信息,未利用空間信息,這樣的結果很容易由于其他區域的旅客流變化造成預測準確性下降。而在公路、地鐵站等場景的交通流預測研究中,卷積神經網絡被用于提取交通流的空間特征,但將待預測區域劃分為尺寸相同的網格并統計各個網格中的流量,不符合交通流量數據的真實空間特征[9]。

針對目前研究的不足,本文提出一種基于神經網絡即結合圖卷積和門控循環單元[9-12](GCGRN,graph convolutional gated recurrent network)的航站樓旅客流時空分布預測方法,結合航站樓內部空間拓撲結構,挖掘各空間區域內客流變化的內在機理,捕獲樓內各空間區域客流變化的時空相關性;利用登機口變化導致航站樓內客流分布改變的條件,提高預測方法的精度與可解釋性。

1 旅客流預測原理及模型

1.1 旅客流預測問題定義

根據航站樓GIS(geographic information system)地圖并結合樓內各個空間區域與設施分布特點,將空間區域簡化為節點如圖1 所示,相鄰空間區域使用無向邊相連,生成由節點和無向邊組成的鄰接拓撲圖G=(V,E,A),其中V=為節點集合,N 為節點數量,E 為一組無向邊集合,A∈RN×N為根據每對節點之間的距離構造的鄰接矩陣。特征矩陣Xt∈RN×N為拓撲圖G 在時間t 的旅客流量。綜上,航站樓旅客流預測問題可以定義為拓撲圖G和特征矩陣X 的映射函數f(),其映射關系如下

圖1 簡化后的航站樓空間結構示意圖Fig.1 Schematic diagram of the simplified spatial structure of the terminal building

式中:n 表示輸入時間序列的長度,即歷史時刻;T 表示輸出預測序列的長度。

1.2 圖卷積

圖卷積神經網絡本質在于提取網絡中的空間特征,目前圖卷積方法主要分為兩類:基于譜的圖卷積和基于空間域的圖卷積。上述結構屬于拓撲圖,由節點和無向邊組成,包含了節點本身的節點特征以及節點間的結構特征,并且可以構成拓撲圖的鄰接矩陣,綜上,采用基于譜的圖卷積方法研究航站樓網絡的空間特征。

基于譜的圖卷積主要是對圖進行傅里葉變換,將圖信號從空間域轉為譜域,再對其進行卷積運算?;谧V的圖卷積表示如下

式中:L∈RN×N為圖的拉普拉斯矩陣;I∈RN×N為單位矩陣;D∈RN×N為A 的度矩陣,其對角線上的元素是各節點的度數;U∈RN×N為L 的特征向量矩陣,T 為轉置;Θ 為圖卷積核;*φ 表示圖卷積算子;x∈RN表示輸入的旅客流量空間特征向量;Λ=diag(λ0,λ1,…,λN-)1∈RN×N為對角矩陣,其中λi為L 的特征值;Θ(Λ)是一個濾波器,其實質是一個對角矩陣。

1.3 模型結構

圖卷積神經網絡模型分為兩個部分:卷積神經網絡(GCN,graph convolutional network)和門控循環單元(GRU,gated recurrent unit),如圖2 所示。由式(1)可知,將歷史n 個時刻旅客流分布的時間序列數據輸入圖卷積網絡,提取網絡拓撲結構,得到空間特征;接著再將帶有空間特征的時間序列輸入GRU 中,提取出航站樓內待預測時刻未來T′個時刻的旅客流特征矩陣Y;最后輸入全連接層,輸出預測結果。

圖2 旅客流預測過程拓撲圖Fig.2 Topology of passenger flow forecasting process

1.3.1 空間特征模型

卷積神經網絡在傅里葉變換中加入濾波,作用于頂點及其一階鄰域上,達到提取頂點間空間特征的目的。如圖3 中,假設網絡中的節點1 是頂點。GCN 模型可以通過中心節點和其周圍節點的隱藏關系來獲取空間特征。采用GCN 模型學習空間特征,即

圖3 1 號節點的鄰接特征Fig.3 Adjacency features of node 1

式中:X 為旅客流量x 的傅里葉變換,即特征矩陣;m表示切比雪夫網絡(譜卷積網絡結構)第m 層;ReLU為激活函數=A+I;D 為A 的度矩陣;W 為神經網絡中的可訓練權重矩陣。

1.3.2 時間特征模型

GRU 在循環神經網絡(RNN,recurrent neural network)的基礎上設計了門控結構,使得信息在隱藏層可以有選擇性地傳遞,并記憶重要信息,以及解決長時間序列訓練過程中出現的梯度消失和梯度爆炸問題。GRU 由重置門和更新門兩個部分構成,所含參數少且收斂速度快。狀態在GRU 中從前向后單向傳輸,且只可以使用當前的輸入與之前的上下文信息,GRU結構如圖4 所示,其數學表達式如下

圖4 GRU 結構Fig.4 GRU structure

式中:通過t 的上一時刻隱藏狀態ht-1和當前時刻的旅客流信息xt獲取兩個門控狀態;zt表示更新門,來控制上一時刻信息影響當前時刻的程度;rt表示重置門,來控制忽略上一時刻信息的程度;σ 為Sigmoid函數,可將數據變換為0~1 范圍內的數值,充當門控信號;W(z)和W(r)分別為更新門和重置門中xt的權重系數。GRU 將上一時刻的隱藏狀態和當前時刻的旅客流信息作為輸入,以此來獲得下一時刻的旅客流狀態。獲取當前時刻旅客流信息的同時,可保留上一時刻的旅客流信息,且仍有能力提取時間特征。

2 基于GCGRN 模型的旅客流預測方法

2.1 樣本生成方法

為了更便捷地實現GCGRN 模型的輸入,將各個時間切片內的旅客流作為樣本,對航站樓內監控攝像頭采集的視頻圖像整合并得到航站樓內各個空間區域旅客流的時間序列,構造各個時間切片內的旅客流時間分布向量H,方法如下。

選取航站樓內能夠覆蓋關鍵換乘、排隊區域的監控攝像頭,按固定間隔對這些監控攝像頭采集的視頻圖像進行截圖,每個截圖作為一個時間切片,然后從每個時間切片中得到該時刻、該監控攝像頭覆蓋空間區域內的旅客流,并對監控攝像頭進行編號、排序,構造每個時間切片內的旅客流時間分布向量H,其分量分別為各個空間區域在每個時間切片內的旅客流,具體步驟如圖5 所示。

圖5 樣本生成步驟流程圖Fig.5 Flow chart of sample generation steps

2.2 旅客流時空分布預測方法

以航站樓內旅客歷史時空分布為基礎,選取歷史運營日各時間切片內的旅客流分布序列作為訓練序列對預測日的目標時刻旅客流預測,設計了基于圖卷積神經網絡的時空分布預測方法。

定義1對鄰接拓撲圖中的節點編號,創建兩個維度都是節點編號的一個二維矩陣,若編號為i,j 的兩個空間區域相連,則在上述二維矩陣中,(i,j)元素對應的數值為1;若編號為i,j 的兩個空間區域不相連,則在上述二維矩陣中,(i,j)元素對應的數值為0,將標注了各個元素對應數值后的二維矩陣作為區域鄰接矩陣A。

定義2設度矩陣可表示為則圖卷積的計算公式為

定義3設第t 個時刻的空間特征向量與上一個時刻門控循環單元的狀態分別經過線性變換后相加,經Sigmoid 激活函數處理,得到值域為(0,1)的更新門zt的值如下

式中:xt為第t 個時刻的空間特征向量;W(z)為第t 個時刻的空間特征向量xt的權重矩陣;ht-1為第t-1 個時刻門控循環單元的狀態;V(z)為第t-1 個時刻門控循環單元的狀態ht-1的權重矩陣。

同樣地,使用另一組t 個時刻的空間特征向量xt的權重矩陣W(r)和第t-1 個時刻門控循環單元的狀態ht-1的權重矩陣V(r),得到值域為(0,1)的重置門rt的值如下

對重置門rt的值進行線性變換,得到當前記憶ht′的值如下

式中,⊙為Hadamard 乘積。再結合更新門zt的值和當前記憶ht′的值,獲得輸出信息ht如下

共進行T 組門控循環單元的操作,對T 組門控循環單元的輸出信息經全連接層進行整合,得到航站樓內待預測時刻未來T′時刻的特征矩陣,Y1=(Yt+1,Yt+2,…,Yt+T)′,其中Yt+1,Yt+2,…,Yt+T′分別為待預測時刻未來T′個時刻的旅客流特征向量。

定義4設從待預測時刻開始,未來2 h 內有M 架航班起飛,使用每架航班的計劃登機口與前一天使用的登機口數據,構建一個二維矩陣,若某航班當天使用的登機口為p,前一天該時間內使用的登機口為q,則在上述二維矩陣中,(p,q)元素對應的數值為1;否則,在上述二維矩陣中,(p,q)元素對應的數值為0,將標注了各個元素對應的數值后的二維矩陣作為表示登機口變化的鄰接矩陣k。

由航站樓內客流分布的歷史數據,得到前一天中對應于待預測未來T′個時刻的旅客流特征矩陣,Y′=(Y′t+1,Y′t+2,…,Y′t+T)′,其中Y′t+1,Y′t+2,…,Y′t+T′分別為前一天中對應于待預測未來T′個時刻的旅客流特征向量,然后結合上述表示登機口變化的鄰接矩陣k,分別進行K 次圖卷積操作,獲得輸出信息

式中:Si(l)為第l 次迭代產生的旅客流特征向量,S(0)=Y′;

將K 次圖卷積操作的輸出信息經全連接層進行融合,得到由登機口變化引起的旅客流特征矩陣Y2=其中分別為由登機口變化引起的旅客流特征向量。

建立針對航站樓旅客流預測的GCGRN 模型,該模型具體步驟如下:

步驟1結合航站樓內各個空間區域與設施分布特點,將空間區域信息簡化為圖結構數據,并構造區域鄰接矩陣A;

步驟2基于樣本生成中的旅客流時間分布向量H 和步驟1 獲得的區域鄰接矩陣A,通過圖卷積網絡在圖結構數據上進行圖卷積操作,獲得空間特征向量;

步驟3將上述步驟2 由圖卷積網絡提取的空間特征向量輸入門控循環單元中,提取出航站樓內待預測時刻未來T′個時刻的旅客流特征矩陣Y1,如圖6 所示;

圖6 待預測時刻的旅客流特征矩陣示意圖Fig.6 Schematic diagram of the passenger flow characteristic matrix at the moment to be predicted

步驟4由航班計劃及航班歷史數據,得到待預測時刻未來2 h 內起飛航班使用的登機口p 及該航班前一天使用的登機口q,構造表示登機口變化的鄰接矩陣k,將前一天對應于待預測時刻的未來T′個時刻的旅客流特征矩陣輸入圖卷積網絡進行圖卷積操作,獲得由登機口變化引起的旅客流特征矩陣Y2,如圖7所示;

圖7 由登機口變化引起的旅客流特征矩陣示意圖Fig.7 Schematic diagram of the passenger flow characteristic matrix caused by the change of the boarding gate

步驟5將步驟3 獲得的航站樓內待預測時刻未來T′個時刻的旅客流特征矩陣Y1和步驟4 獲得的由登機口變化引起的旅客流特征矩陣Y2進行融合,通過不同的權重加權求和得到最終預測的旅客流特征矩陣如下

式中:F1、F2為權重系數且F1+F2=1。F1表示旅客攜帶行李量;F2表示航班信息,不同時間段內航班信息,不同旅客攜帶行李量不同,以此為限制條件進行自動迭代,尋找最優F1、F2權重值。

3 實驗與分析

3.1 實驗環境

本實驗使用Python 3.7 基于PyTorch 1.7.1 實現,使用Windows10 操作系統,CPU 為Intel Xeon E5-2680 v4@2.40GHz*14,GPU 為NVIDIAGeForceRTX3080Ti,內存64 GB。

3.2 評價指標

為了驗證GCGRN 模型預測效果,將最終預測的旅客流與真實旅客流進行比較,并利用均方根誤差[10](RMSE,root mean squard error)、平均絕對誤差[10](MAE,mean absolute error)以及擬合優度R2[13]作為評價指標,對比較結果進行衡量,3 種評價指標數值越小表示模型預測效果越好。

3.3 結果分析

為了探究2.2 節建立的GCGRN 模型在旅客流預測的適用性,本文從方法維度進行驗證分析。選擇某大型機場5 天運行日作為預測日,將每日劃分為48個時段,并與傳統K 近鄰(KNN,K-nearest neighbor)模型[5-7]、自回歸求和滑動平均(ARIMA,autoregressive integrated moving average)模型[4]、支持向量機(SVM,support vector machine)模型[8]以及待預測時刻的旅客流特征矩陣Y1與由登機口變化引起的旅客流特征矩陣Y2分別單獨作用時作對比。

某天各預測方法仿真對比圖,如圖8 所示。5 日平均評價指標均方根誤差RMSE、平均絕對誤差MAE 及擬合優度R2如表1 所示。

表1 5 日平均評價指標Tab.1 Five-day average evaluation index

圖8 不同預測方法預測值與真實值對比Fig.8 Comparison of the predicted value of different models with the actual value

由圖8 和表1 可以看出,待預測時刻的旅客流特征矩陣Y1與由登機口變化引起的旅客流特征矩陣Y2分別單獨作用時,預測精度均不如GCGRN 模型,且KNN 模型的評價指標RMSE 與MAE 均小于ARIMA模型并均相差2.0,擬合優度R2比ARIMA 模型高2.66個百分點,說明KNN 模型對航站樓旅客流預測效果好于ARIMA 模型,這是由于ARIMA 模型只適用于平穩的時間序列,對于像航站樓旅客流這種非線性且復雜的實際問題,預測效果就會大打折扣。SVM 模型雖然能較好地解決非線性時間序列問題,各項評價指標都優于ARIMA 模型且與KNN 模型十分接近,但不易確定模型參數,預測精度取決于核函數,參數調整費時費力,難以幫助航站樓對資源進行實時配置。

相較于上述傳統模型,GCGRN 融合圖卷積神經網絡與門控循環單元,將歷史運營日的各時間切片內的旅客流時間分布序列作為訓練序列來對預測日各時間段旅客流進行預測。該模型極大程度地規避了天氣、節假日等一系列外界因素對航站樓旅客流造成的影響,較其他模型具有更高的預測準確率。

從以上3 種評價指標來看,GCGRN 的評價指標RMSE 與MAE 均低于其他3 種模型,以MAE 為例,其值低于其他3 種模型的均差為4.507,且擬合優度R2為4 種模型最高,平均提高7.58 個百分點,證明了GCGRN 對航站樓旅客流預測具有更好的效果。

4 結語

本文從時間和空間兩個維度對航站樓旅客流進行建模,構建了基于圖卷積神經網絡的航站樓旅客時空分布預測模型,并提出利用門控循環單元提取時間特征。最后結合某機場航站樓實際旅客流數據開展航站樓旅客流的預測探究,研究表明:

(1)GCGRN 模型充分利用航站樓內部的空間拓撲結構,深度挖掘航站樓內各空間區域內客流變化的內在機理,更好地捕獲了航站樓內各空間區域客流變化的時空相關性;

(2)GCGRN 模型利用了登機口變化導致航站樓內客流分布改變的條件,使得預測方法的精度更高,可解釋性更強,機場運營方可依據本方法調整登機口以調控客流分布,提高服務質量。

GCGRN 模型雖然對航站樓旅客流提供良好的預測效果,但不同時間、地點以及航班計劃均會影響聚集效果。未來隨著機場路側綜合交通帶來的數據完善與補充并建立更加完善的航站樓旅客特征體系,可以進一步提升基于GCGRN 模型航站樓旅客流預測模型的精確度與普適度。

猜你喜歡
登機口航站樓時刻
冬“傲”時刻
基于WF-IoT融合物聯網的控制技術在航站樓內的應用
機場航站樓年雷擊次數計算
光環境模擬在航站樓高大空間照明設計中的應用
捕獵時刻
機場登機口分配問題的頂點著色模型與算法
數理:尋找登機口
考慮中轉旅客的登機口分配問題
植物在航站樓室內環境中的應用
成龍的一次簽名
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合