?

基于可變形卷積時空網絡的乘車需求預測模型*

2021-02-25 12:16于瑞云林福郁高寧蔚
軟件學報 2021年12期
關鍵詞:交通流量乘車時空

于瑞云,林福郁,高寧蔚,李 婕

1(東北大學 軟件學院,遼寧 沈陽 110169)

2(東北大學 計算機科學與工程學院,遼寧 沈陽 110169)

在城市交通日漸發達的今天,建立一個高效的交通系統已成為打造智慧城市的核心問題.準確的需求預測模型,成為解決此類問題的關鍵.如果我們能夠準確地預測出乘客的出行需求,就可以預先分配資源,即可避免空載現象發生,從而達到節約資源、緩解交通壓力的目的.目前,隨著滴滴、Uber 等出租車服務的日益普及,我們能夠以前所未有的規模收集大量需求數據.如何利用大數據來更好地預測交通需求的問題,已經引起了人工智能研究界越來越多的關注.

本文主要研究區域乘車需求預測問題,即通過歷史乘車請求數據來預測未來時間的區域乘車請求數量.隨著道路上車流量逐年遞增以及乘客對出租車、快車等服務需求量的不斷增大,乘車服務供需不匹配的問題逐漸暴露出來.例如:有時候,一些司機因為所在區域乘客需求量較少而導致無單可接;同時,由于周邊地區的乘客需求遠超過出租車數量,導致大量乘客在惡劣天氣或高峰時段很難乘車.所以,對出租車、快車等營利性車輛的需求預測,在近些年就越發引起研究人員重視.

以往的文獻顯示研究人員已經對交通數據預測進行了長期研究.其中,預測對象包括人流量、車流量、出租車需求量等.在研究初期,研究人員把城市進行區塊化處理,并把其中一塊區域不同時間段的車輛需求數量看作時間序列,進而對時間序列進行預測.比較有代表性的方法為:整合移動平均自回歸模型(ARIMA)[1]及其相關變種,上述方法已被廣泛應用于交通預測[2,3].在之前的研究基礎上,Abadi 等人[4]、Wu 等人[5]以及Tong 等人[6]意識到天氣、節假日、場地以及特殊事件等外在因素對城市的交通流量仍具有很大影響,所以就把此類影響因素加入到預測模型中.雖然研究表明,通過結合各類外部因素可以改善預測精度,但它們仍然無法捕捉到復雜且非線性的時空相關性.

近幾年,機器學習與深度學習在國內外科研人員的不懈努力下都取得了突破性的進展,同時也給交通流量預測場景帶來了新的解決方案.Yi 等人[7]與Wang 等人[8]使用深度神經網絡(DNN)對交通流量進行預測并取得了較高的準確度,但Zhao 等人[9]分別使用馬爾可夫模型與神經網絡(ANNs)模型對出租車需求進行預測,并將結果進行對比,實驗結果表明,馬爾可夫模型在可預測性高的場景下效果要好于神經網絡模型.由此可見:在此場景下,簡單的神經網絡并不能捕捉到復雜的時空相關性.

然而,深度學習在計算機視覺領域取得的成就卻給了研究人員新的啟發.例如:可以將整個城市的出租車需求按一定時間段切片,然后把城市每塊區域內的需求數量看作一個像素點,這樣就可以得到一張單位時間內的城市出租車需求圖像.給定一組歷史需求圖像,用模型預測下一個時間戳的出租車需求圖像.其中最典型的模型就包括卷積神經網絡(CNN)[10]以及循環神經網絡(RNN)[11]:一些學者使用CNN 及其變種模型來模擬城市復雜的空間相關性[12-14];另一些學者則使用RNN 以及長短期記憶網絡(LSTM)[15]模擬城市交通流量的時序性[16-18].與之前的回歸模型、神經網絡等模型相比,這些開創性的嘗試在性能上表現出明顯的優越性.然而,這些嘗試都沒有同時考慮到時間和空間的相關性.近些年,Ke 等人[19]與Zhou 等人[20]則將CNN 與LSTM 相結合,使用卷積LSTM[21]對出租車需求進行預測并取得了很好的效果.在此基礎上,Yao 等人[22]在AAAI2018 會議中提出在一個聯合模型中捕捉空間和時間的復雜非線性關系,從而對城市交通流量進行預測,其預測效果較之前模型有很大提升.

但是該類模型也存在不足之處,模型中使用CNN 對城市流量進行空間特征提取.眾所周知,傳統CNN 中感受野的形狀是固定的,所以在提取特征信息時,只能提取到關鍵像素點與其相鄰區域內的特征信息.然而就實際情況而言,某一塊區域內的交通情況可能與另一塊相距較遠的區域有很大關聯[23].如圖1 所示,這是將地圖網格化處理后,兩塊在11×11 范圍內且曼哈頓距離大于4 的區域乘車需求對比圖.由圖可得,兩塊區域在高峰時期需求趨勢相似.然而這僅為可以被可視化的顯性關聯,還有很多隱性關聯隱含在數據中.如果使用CNN 進行空間特征提取,很可能使這些關聯在池化層進行下采樣時被模糊掉,最終導致空間特征提取結果存在誤差.

Fig.1 Comparison of demand in different regions圖1 不同區域需求對比

文獻[23-25]將算計視覺領域的圖卷積網絡(GCN)[26]應用到交通流量預測領域,以嘗試解決上述問題.實驗表明,其在空間特征提取上有了很大的改善.但GCN 在交通流量預測領域的應用還不完善,例如無法很好地獲取各個時間片圖之間的時間特征,并且部分該類模型也沒有考慮到城市中興趣點(POI)對乘車需求的影響.大量的調研[27]結果也證實了POI 對交通流量存在不可忽視的影響.

為解決以上問題,本文提出了可變形卷積時空網絡(deformable convolution spatial-temporal network,簡稱DCSN)模型.其使用可變形卷積網絡(DCN)[28]與LSTM 共同捕捉空間和時間的復雜非線性關系,并使用圖結構來模擬各區域間POI 和出租車需求的相似關系.如圖2 所示:之所以使用DCN 來對城市交通空間特征進行提取,因為DCN 可以改變卷積核映射在目標圖像上感受野的形狀,使得不相鄰且相對較遠的兩塊區域的空間特征也能保留下來,進而解決傳統CNN 模型提取城市交通流量空間特征信息時誤差較大的問題.但如果將整個城市的出租車需求視為圖像并在此圖像上應用DCN 模型,是無法取得最佳效果的.因為通過研究發現,在預測目標區域中包含相關性較弱的區域實際上會損害模型性能、降低預測準確度.所以,本文借鑒了Yao 等人[22]論文中僅對局部區域做特征提取的方法,僅對要預測目標附近區域使用DCN 模型.然而所選區域的大小對模型至關重要,本文對其大小進行對比實驗,既保證DCN 在CNN 的基礎上提取到更多不相鄰的空間特征,也保證DCN 模型不被相關性較弱的區域影響.只對目標附近區域做特征提取顯然是不夠全面的,通過研究[6,22]發現:POI 整體差異較小且乘車需求波動相似的兩塊區域,在需求預測問題上可以為彼此提供助力.所以,本文對距預測目標較遠區域基于POI 差異進行需求建模,通過圖結構來捕捉兩個區域需求的潛在關系,并使用嵌入算法將區域信息以向量形式嵌入到模型中.本文使用滴滴出行的真實訂單數據進行大量實驗,實驗結果表明,本文提出的方法優于其他現有車輛需求預測方法.

Fig.2 Comparison of convolution patterns between CNN and DCN圖2 CNN 與DCN 的卷積模式對比

本文的主要貢獻概括如下:

? 本文提出,使用由可變形卷積時空模型以及POI 需求關聯模型組成的聯合模型來對區域車輛需求進行預測,它同時考慮了時間、空間以及不同區域的需求關聯性等因素;

? 在可變形卷積時空模型中,使用DCN 與LSTM 提取時空特征;在POI 需求關聯模型中,使用區域間的POI 差異化指數以及需求差異化指數來捕捉區域間的需求相似關系.

1 相關工作

交通流量預測問題在眾多研究學者多年來的探索實踐下,取得了許多突破性的進展.從傳統統計學方法到機器學習與深度學習,都在使預測精度逐漸提高.本節將主要討論與交通流量預測的相關工作.

Li 等人[2]提出了一種基于ARIMA 的預測方法來預測熱點地區乘客的時空變化,以幫助司機找到他們的下一位乘客.Moreira-Matias 等人[3]使用滑動窗口集合框架,將時變泊松模型、加權時變泊松模型和ARIMA 模型相結合,對乘客需求進行預測,并取得了不錯的效果.

Abadi 等人[4]進一步考慮了外部環境數據(例如場地以及特殊事件等)對交通流量預測的影響,并基于自回歸模型對交通流量進行預測.Wu 等人[5]通過實驗揭示了天氣與城市交通數據間隱藏的相關性.Tong 等人[6]結合POI 信息提出具有高維度特征的統一線性回歸模型LinUOTD,并設計了一系列的優化技術來對模型進行有效的訓練和更新.模型突出的靈活性,使其在交通流量預測場景取得不錯的效果.雖然此類方法結合外部因素使預測精度有所提升,但它們仍然無法捕捉到復雜且非線性的時空相關性.

隨著機器學習與深度學習的飛速發展,研究人員們嘗試使用神經網絡解決交通流量預測問題.Yi 等人[7]使用實時交通數據利用DNN 對交通流量進行預測,其實驗結果表明,該模型具有較高的準確性.Wang 等人[8]受到殘差神經網絡(ResNet)[23]的啟發,提出一個名為“深度供需(DeepSD)”的端到端框架,其框架具有高度的靈活性和可擴展性,可利用多個數據源(例如打車指令、天氣數據和交通數據)來實現對交通流量的高精度預測.Zhao等人[9]使用ANN 模型對出租車需求進行預測,實驗結果表明:在可預測性高的場景下,馬爾可夫模型預測精度為89%,比神經網絡模型高11%.可見,傳統神經網絡在此場景下表現并不理想.

進而,研究人員又把目光投向了近些年在計算機視覺領域聲名鵲起的CNN.Wang 等人[12]和Zhang 等人[13]將城市交通流量視為圖片,進而使用CNN 及其變種ResNet[29]對交通流量進行預測.Liu 等人[14]提出一個面向時空數據的大規模車輛需求預測集成框架,其使用注意力機制將多個基礎模型和3 個注意力模塊(通道注意力模塊、空間注意力模塊和位置注意力模塊)組合在一起,進而提高原有基礎模型的性能.其中,空間注意力模塊使用卷積網絡進行空間特征提取.以上方法都取得了很好的成績,但因為傳統CNN 固定的卷積模式,導致提取空間特征時產生了一定的誤差;此外,雖然這些方法確實使用歷史時間戳的交通圖像進行預測,但它們沒有明確地模擬時序依賴性.進而,Zhao 等人[18]使用LSTM 網絡通過由許多存儲器單元組成的二維網絡來模擬交通系統中的時空相關性,進而對交通流量進行預測.遺憾的是:他們在考慮交通流量的時序變化時僅模擬了單塊區域的時序依賴性,卻忽略了各個區域間的空間關聯性.

通過多年的不懈研究和不斷改進,終于有學者將時序依賴性和空間關聯性結合到一起.Ke 等人[19]與Zhou等人[20]使用卷積LSTM 來處理出租車需求預測的時空依賴性.在此基礎上,Yao 等人[22]提出了一個深度多視圖時空網絡(DMVST-Net)框架來模擬空間和時間關系,從而對出租車需求進行預測.其模型包括3 個視圖:時間視圖、空間視圖和語義視圖.通過使用大量真實出租車數據集進行實驗,證明該模型預測效果優于上述方法.然而該模型也存在不足之處,如未解決傳統CNN 在交通流量預測場景下的誤差問題以及并未考慮城市中POI 對出租車需求的影響等.

總體來說,與上述研究方法相比,本文提出的DCSN 模型創新點在于設計并結合了可變形卷積時空模型與POI 需求關聯模型.即:使用DCN 與LSTM 共同捕捉空間和時間的復雜非線性關系,并基于POI 差異指數以及歷史需求差異指數對不同區域需求相似性進行建模.最后將兩個模型輸出,通過全連接神經網絡得出最終的預測結果.

2 算法設計

圖3 展示了本文所提出的DCSN 模型總體框架圖,其主要由兩部分組成,分別為可變形卷積時空模型與POI需求關聯模型.其中,可變形卷積時空模型包括DCN 與LSTM,使用DCN 卷積對不同時間片同一塊區域做空間特征提取.輸出的特征向量與當前時間片的天氣、溫度等上下文特征相連接作為LSTM 中一個時間單元的輸入,可變形卷積時空模型最終的輸出為時空特征向量.POI 需求關聯模型首先構建區域的加權圖(POI 差異指數和歷史需求差異指數為權重影響因子);將所要預測的區域節點編碼為向量,將兩個模型輸出的向量相連接,再使用全連接網絡進行聯合訓練;最后,得出區域需求預測結果.

Fig.3 DCSN model overall architecture diagram圖3 DCSN 模型整體架構圖

2.1 問題定義

本小節將對出租車需求預測問題進行定義.將地圖進行網格化處理.L={l1,l2,…,ln}為城市地圖中的所劃分的區域集合,其中,n為將地圖劃分的網格數量;T={t1,t2,…,tm}為按相等時間間隔劃分的時間片集合,其中,m為時間片數量總和.解決區域出租車需求預測問題的實質,即為使用前h個時間片的乘車需求來預測第h+1 個時間節點該區域的需求數量.結合本文提出的模型,其主要問題具體可表達為

其中,

?PL為區域的POI 信息.

公式中,h為時間步長.公式整體意為:將前h個時間片的乘車需求信息、天氣信息以及區域POI 信息輸入到本模型中,最終得出當前區域下一時間片的出租車需求數量.

2.2 可變形卷積時空模型

可變形卷積時空模型由時間和空間兩部分組成,如圖3 所示.本文使用DCN 對地圖區域中的需求進行空間特征提取,進而將其結果應用于LSTM 模型中模擬出租車需求的時間依賴性.接下來,本小節將著重對這兩個部分進行分析講解.

2.2.1 空間特征:局部DCN 模型

DCN 在CNN 的基礎上引入了兩個全新的模塊(即可變形卷積模塊與可變形RoI 池化模塊),其主要思想為:從目標任務中學習偏移量,然后使用額外的偏移量來改變模型中的空間采樣位置,從而有效提升CNN 的泛化能力.本文研究發現,DCN 通過學習偏移量改變感受野范圍的特性.在此場景下,能更好地模擬空間相關性,從而提取出更為準確的特征信息.

本文使用DCN 對地圖區域間的需求進行空間特征提取時,借鑒Yao 等人[22]論文中所使用的局部分解方法,僅將要預測的區域以及其周圍信息輸入到模型中.在不同的時間片中,本文將每個區域及其周圍鄰域的乘車需 求數量視為具有一個通道的s×s圖像集合(圖像中,城市邊界缺失部分用0 補齊),其中,尺寸s控制空間粒度.對于區域i的不同時間片t,都可以得到二維張量圖像,進而將輸入到DCN 模型中進行卷積.對于中一個像素x0的卷積操作可表示為

其中,R={(-1,-1),(-1,0),…,(0,0),…,(1,0),(1,1)}表示卷積核為3×3 的感受野網格,網格中心點坐標(0,0)映射到要做卷積操作的像素點x0.W(·)表示獲取卷積核中對應位置的卷積權重,d(·)表示獲取張量圖像中對應像素點的值.DCN 與CNN 的主要差別就在于Δrn,即為上文所提到的偏移量,通過對像素點周圍部分圖像卷積所得.具體形式為二通道矩陣,分別對應橫縱坐標偏移量.

對單一像素點的卷積過程如圖4 所示.

Fig.4 Deformable convolution process schematic圖4 可變形卷積過程示意圖

本文將區域i不同時間片t的乘車需求特征圖饋送到K個卷積層,第k層卷積表達式如下:

2.2.2 時間特征:LSTM 模型

本文使用LSTM 來捕獲乘車需求時序相關性,該模塊的基本表達式為

2.3 POI需求關聯模型

本文通過研究發現,空間上不相近的兩塊區域在乘車需求上也可能存在相似關系.例如:大型商場所在的區域在周末可能具有較高的乘車需求,而居民區所在的區域在工作日的清晨將迎來乘車需求高峰等.因為前面所提到的局部DCN 模型僅提取目標像素點鄰近區域的空間相似性,所以本文從POI 以及歷史需求兩個方面來提取較遠區域間的相似關系.這樣即可與局部DCN 模型相互補充,使模型預測結果更加準確.

因為在地圖中每塊區域皆可互通,所以本文將目標地圖按區域劃分后轉換成一張無向完全圖,具體定義為G=(V,E,W).V為節點集合,對應城市地圖中的所劃分的區域集合L;E為圖中點與點之間邊的集合;W為每條邊上的權重,即表示兩個區域之間的相似程度.W的表達式為

其中,Dm與Pij分別為區域間的POI 差異化指數與需求差異化指數,將在接下來的部分著重講解求解方法.δ(·)為min-max 標準化方法,為了避免因兩個差異化指數數值上差距過大從而對結果造成影響;α則是為了權衡兩種差異化指數對權重大小的影響,本文通過多次實驗得出,當α取值在0.4 與0.6 之間時,模型準確性最高,所以本文將其最優區間平均數0.5 作為α的最終取值.

2.3.1 區域POI 差異化指數

現實生活中,POI 對其所在的區域乘車需求影響非常大,所以本文提取不同區域間的POI 相似性,并將其嵌入到模型中.本模塊著重考慮地鐵站、公交車站、旅游景點、大型商場、醫院、學校以及居民區這七類不易變更的POI,使用線性神經網絡模型[30]提取不同種類POI 對乘車需求的影響權重.其中,線性神經網絡的輸入為各個區域不同種類POI 的數量以及當前區域各個時間片乘車需求數量的總和,訓練得出的不同種類POI 對乘車需求的影響權重即為所求.表達式如下:

2.3.2 區域需求差異化指數

經本文研究發現:在捕捉兩個區域的相似關系時,不僅要從POI 功能的角度出發,還應該考慮兩個區域需求序列的相似性.本模塊以周為單位對各個模塊每個時間片的乘車需求數量取平均值,得出各區域一天的需求序列.進而對不同區域間的需求序列使用動態時間規整算法(DTW)[31]求出區域需求差異化指數,其計算公式如下:

其中,Si,Sj代表兩個不同區域的平均需求序列,DTW(·)為動態時間規整算法,Dm即為所求區域需求差異化指數.

得到區域POI 差異化指數Pij及區域需求差異化指數Dm后,即可使用公式(5)完成無向完全圖中,邊權重W的計算.在獲取完整的圖信息后,本文使用Node2vec 圖嵌入方法[32]將區域節點i轉化為多維向量gi.為使嵌入的多維向量gi能與整個網絡架構進行協同訓練,本模塊將區域節點i的特征向量饋送到全連接層,其公式定義為

其中,Wpd與bpd都為可學習的參數,即為整個POI 需求關聯模型的輸出.

2.4 模型整合

為了使前面兩小節的模型相關聯,本小節將可變形卷積時空模型輸出的特征向量與POI 需求關聯模型輸出的特征向量相連接,進而得到向量.此時,已經包含區域i的時空以及POI 等特征,最后將其饋送到全連接網絡以獲取區域i的最終需求預測值.最終預測函數如下:

其中,Wf與bf都為可學習的參數.因為真實的需求值經過標準化處理,所以σ(·)為Sigmoid函數使最終輸出的 區間為[0,1],目的為使整個模型更快收斂.模型使用的損失函數定義為

其中,γ為超參數.上述損失函數實際由均方誤差和平均絕對百分誤差兩部分組成.因為均方誤差易受極端值影響,為了避免訓練被大值樣本支配,所以引入平均絕對百分誤差.

3 實驗與結果分析

3.1 數據集處理

本文使用快車平臺真實的訂單軌跡數據CD2Data 與XA2Data 來驗證模型的有效性,數據集來自滴滴出行“蓋亞”數據開放計劃.

? CD2Date:數據為2016 年10 月和11 月成都市二環部分區域快車平臺訂單數據;

? XA2Date:數據為2016 年10 月和11 月西安市二環部分區域快車平臺訂單數據.

本文將兩個數據集中2016 年10 月8 日至2016 年11 月23 日(共47 天)的數據作為訓練集,2016 年11 月24 日至2016 年11 月30 日(共7 天)的數據作為測試集.數據集中,2016 年國慶假期期間的數據因為較平時相比波動過大所以舍棄.處理數據時,本文將兩個數據集所對應的區域進行網格化處理,劃分成20×20 個小區域.并且僅將早6 點到晚21 點之間的數據作為觀測數據,每個時間片的時間跨度設為半小時.進而提取出每塊區域每個時間片的需求數量.值得注意的是:因為本文主要分析的問題為乘車需求預測,所以訂單的位置以乘客的初始位 置為準.最后將單位需求數據進行標準化處理,進而得到所有區域單個時間片的需求數據集合.DCSN 模型 除了應用到了乘車的軌跡數據,還應用了外部數據以及城市的POI 數據.本文將天氣等外部離散數據轉化為One-Hot 向量嵌入到模型中;POI 數據則使用百度地圖信息檢索功能獲取,同樣將其進行網格劃分,進而統計每塊區域的POI 種類及數量.

當測試預測結果時,本文使用待預測時間片的前8 個時間片(即前4 小時)來對該區域接下來的乘車需求進行預測.并且在實驗過程中,本文過濾掉了區域需求小于5 的樣本,這是工業中常用的做法.因為在現實生活的應用程序中,人們并不關心這種低需求場景.

3.2 實驗參數設置

本文基于Tensorflow 和Keras 框架實現DCSN 模型.在空間特征提取時,控制輸入特征圖大小的s取11,即對目標及其周圍11×11 的區域進行空間特征提取.在DCN 模型中,本文將卷積層數K設為3,濾波器大小設為3×3,濾波器數量設為64.經過多次對比實驗后,本文將LSTM 模型中時間步長h設為8.在DCSN 模型中,除了作為最終預測組件的全連接層,其中的激活函數為Sigmoid函數,其余全連接層中的激活函數皆為ReLU函數.模型的損失函數已在第2.4 節中具體說明,模型使用的優化算法為Adam.

本文使用平均絕對百分比誤差(MAPE)和均方誤差(RMSE)作為評價指標,其具體計算公式下:

3.3 對比實驗結果分析

本小節將DCSN 模型與以下5 種主流及最新的交通流量預測方法進行比較.

? 歷史均值法(HA):使用歷史流量的平均值來作為下一時間片的預測值.此處,本文同樣使用前8 個時間片的歷史數據來預測下一時間片的乘車需求數量;

? ARIMA 是一種眾所周知的時間序列預測模型,它結合了移動平均和自回歸分量來建模時間序列;

? LSTM 在傳統RNN 的基礎上改進,新增遺忘門等機制,有效解決傳統RNN 所存在的梯度爆炸和梯度消失等問題.作為目前解決時間序列預測問題的主流算法之一;

? ST-ResNet[13]:ST-ResNet 是一種基于深度學習的流量預測方法,該方法將不同時間片的城市交通流量繪制成圖像,然后使用殘差神經網絡提取圖像特征,進而完成流量預測;

? DMVST-Net[22]:DMVST-Net 是一種基于多視圖的深度學習框架,用于出租車需求預測.它由3 個不同的視圖組成,分別為時間視圖、空間視圖和語義視圖.

為了對比公平,在實驗時,除HA 與ARIMA 外的其他算法都使用公式(11)所定義的損失函數.DCSN 模型與其他5 個主流交通流量預測方法性能對比見表1.

Table 1 Performance comparison of different approaches表1 不同方法性能對比

表1 顯示了本文所提出的模型與其他基準算法在數據集CD2Data 與XA2Data 上的性能對比.DCSN 模型在所有方法中實現了最低的MAPE 和最低的RMSE.更具體地說,HA 和ARIMA 等傳統方法因為完全依賴于歷史需求值并且建模能力有限,所以預測表現不佳.LSTM 與ST-ResNet 在預測時考慮空間特征和時間特征對交通流量的影響,使預測誤差較傳統方法大大降低,但并未將二者相結合.DMVST-Net 模型使用三層視圖將時空特征以及外部特征相融合,取得了非常不錯的預測效果.本文所提出的DCSN 模型在DMVST-Net 模型的基礎上進行改進,使用DCN 進行空間特征提取,并將POI 對乘車需求的影響因素加入到模型中,使模型的預測性能進一步提升.

DCSN 模型的平均訓練時長為47.2s/輪,基準算法中效果最好的DMCVST-Net 模型的平均訓練時長為45.4s/輪.因為使用DCN 代替了CNN 并加入了POI 需求關聯模型,所以使前者的模型復雜性略高于后者.但整體訓練時長差距不大,且DCSN 模型準確性得到顯著提升.

3.4 消融實驗結果分析

本文為了研究DCSN 模型內部各改進之處對性能的影響,在CD2Data 數據集下分別對其進行消融實驗.

? CLN:僅包含時空模型,但將本文的可變形卷積時空模型中的DCN 用傳統CNN 替代.即,僅使用CNN和LSTM 的組合對乘車需求進行預測;

? DLN:僅使用本文所提出的可變形卷積時空模型對乘車需求進行預測,不包含POI 需求關聯模型;

? CLMN:在CLN 的基礎上添加需求關聯模塊,但公式(5)中α取1,即,僅考慮區域需求差異化指數對模型的影響;

? DLMN:在DLN 的基礎上添加需求關聯模塊,同樣,α取1;

? CLPDN:在CLN 模型的基礎上加入本文所提出的POI 需求關聯模型;

? DCSN:為本文所提出的完整模型.

此外,本文還對DCSN 模型中所使用的損失函數進行消融實驗,以找出最優的損失函數.所作對比如下.

? LMSE:僅使用最常用的均方誤差(MSE)作為模型的損失函數;

? LMAPE:僅使用MAPE 作為模型的損失函數;

?L:模型最終使用的損失函數,結合了均方誤差和平均絕對百分誤差,其中,γ取0.01.具體形式已在第2.4節中詳細說明.

各方案性能對比如圖5 所示.

Fig.5 Improved program performance comparison chart圖5 改進方案性能對比圖

DLN 模型在CLN 模型的基礎上將卷積神經網絡改進為可變形卷積神經網絡,從結果來看,模型整體效果有所提升.所以可以證明:可變形卷積神經網絡在此場景下提取空間特征信息,可以取得很好的效果.CLMN 模型與DLMN 模型在DLN 模型與CLN 模型的基礎上加入了僅考慮區域需求差異化指數的需求關聯模型,使得模型的準確性得到顯著提升.最后兩個模型則在前兩個模型的基礎上加入了完整的POI 需求關聯模型,從圖中可以看出,預測誤差大大減小,證明了在POI 需求關聯模型中POI 差異化指數的必要性.POI 需求關聯模型既將POI對乘車需求的影響因素加入到模型中,又彌補了局部DCN 模型在空間上的距離局限性.同時可以看出,本文所使用的損失函數L效果最好.所以綜上所述,當前DCSN 模型效果最佳.

本文還在實驗過程中對DCN 模型中輸入特征圖尺寸s的大小以及濾波器的大小做了調優實驗.特征圖的尺寸對局部DCN 模型很重要,這決定模型將提取目標區域周圍多大范圍內的空間特征信息.同樣,濾波器的大小本身也是DCN 模型的重要屬性,所以在CD2Data 數據集下對其進行調優實驗.卷積層數都設為3,具體實驗結果如圖6 所示.

Fig.6 Tuning experiment results comparison chart圖6 調優實驗結果對比圖

由實驗結果可以得出,DCN 模型中輸入特征圖尺寸s取11 并且濾波器尺寸為3×3 時模型性能最佳,故模型實驗最終采用此參數.

本文研究發現,時間步長h是進行時間特征提取的重要參數.為了確定其對模型性能的影響,所以本文在CD2Data 數據集下對h的不同取值進行對比實驗.具體實驗結果見表2.

Table 2 Performance comparison of different sequence length表2 不同時間步長性能對比

由表2 可以得出,模型誤差整體上隨時間步長h的增長而下降.由此可以說明時間步長對時間特征提取的重要性.當時間步長為8 時,模型性能最佳.此外,h增加到8 以上時模型性能略有下降.一個潛在的原因是:在考慮更長的時間依賴性時,需要學習更多的參數,進而使訓練變得更加困難.

4 總 結

本文在乘車需求預測場景下對傳統時空模型進行改進,提出多組件的可變形卷積時空網絡DCSN.本模型將傳統時空模型中的卷積神經網絡改進為可變形卷積神經網絡,使對目標區域的空間特征提取效果得到提升.本文還將POI 對乘車需求的影響因素加入到模型中,彌補了局部DCN 模型在空間上的距離局限性,使DCSN 模型效果優于其他已有的乘車需求預測方法.

未來,本文將在兩個主要方面對模型進行改進.將更多對乘車需求有顯著影響的外部因素進行更合適的建模,并將其嵌入到模型中;本文在進行預測時僅考慮了近4 個小時的歷史需求對未來需求的影響,在接下來的研究中,本文將進一步考慮長周期(如日或周)歷史數據對未來需求的影響并將其加入到模型中,使預測結果更加準確.

致謝實驗數據來自滴滴出行“蓋亞”數據開放計劃.

猜你喜歡
交通流量乘車時空
跨越時空的相遇
鏡中的時空穿梭
這一次優步乘車,讓我感動了
基于XGBOOST算法的擁堵路段短時交通流量預測
玩一次時空大“穿越”
基于GA-BP神經網絡的衡大高速公路日交通流量預測
乘車
時空之門
基于復合卡和ETC的交通流量采集研究
MLFF系統在交通流量控制中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合