?

融合多因素的“時間齒輪”交通流預測模型

2022-11-28 08:26蘭添賀曲大義劉浩敏
河北科技大學學報 2022年5期
關鍵詞:交通流量交通流路段

蘭添賀,曲大義,陳 昆,劉浩敏

(青島理工大學機械與汽車工程學院,山東青島 266520)

隨著智能交通及大數據技術的快速發展,運用智能化手段解決城市交通問題成為一種主流趨勢[1]。車載傳感器和路口監控能夠實時收集大量的交通流量數據,通過提取并挖掘數據中的隱藏規律,可以為減緩交通壓力、優化出行結構和提升道路通行能力等提供幫助。因此,對交通流影響因素的深度分析,以及對交通流進行實時準確的預測,是目前城市交通領域研究的熱點。

為了提升交通流預測的準確度,國內外研究人員提出了多種預測方法[2-10],相比于傳統的數學模型預測方法[11],這些方法雖在預測精度和效率上取得了很大進步,但僅考慮了單一因素,也缺少對影響交通流的各因素進行深度特征挖掘。隨著人工神經網絡的快速發展,依托深度學習算法進行交通流的特征挖掘和預測,成為全新的研究方向[12-16]。一些模型雖通過人工神經網絡深度挖掘了交通流信息的時間特征,但卻忽略了外部天氣因素和空間因素的重要性。融合多源數據并結合多種算法雖能夠明顯提升交通流預測的準確度,但并沒有考慮城市道路交通自身擁有的特點[17-21]。城市道路的布局結構與高速公路不同,市區城市道路具有密集路網和大量交叉口。一個路段的交通流量與其附近交叉口各個方向的交通流量密切相關。此外,城市道路的交通流量與人們的出行選擇有關。戶外天氣如溫度、風速和晴雨等對于人們的出行選擇均具有明顯影響。

本文在數據層面將根據市區城市道路的特點,收集目標路段附近交叉口各個方向的車流量,將目標路段的天氣數據作為影響因素,通過深度分析各類因素與目標路段交通流量的相關性,對天氣因素和附近交叉口各個方向的交通流量分模塊進行特征挖掘;在算法層面,考慮到數據本身具有周期性的規律,通過嵌入Time2vec提高模型對周期性數據的特征捕捉能力;仿照轉軸與齒輪的關系,將輸入數據與算法進一步結合,以Bi-GRU模型為基礎,從正反2個方向對時間序列信息進行特征挖掘;最后,將Attention機制與Bi-GRU相結合,提高模型的特征學習能力,建立一種融合多因素的“時間齒輪”交通流預測模型。將市區城市道路作為研究對象,與MLP模型、AIRMA模型、SVM模型、RNN模型、LSTM模型、GRU模型和Bi-GRU模型等多種現有模型進行對比,研究預測準確度和預測速度。

1 研究數據及多元因素分析

1.1 交通流數據預處理

目標路段的研究數據源自山東省青島市即墨區城間公路。使用電子警察采集目標路段(north)及其最近一個交叉路口各方向的交通流量信息,采集時間跨度為8 d,采集周期為5 min。

對原始數據進行檢查和清洗。為了彌補缺失的值,采用附近2個數的平均值作為填補。設置有效數據區間,將超出的異常數據使用整體數據的平均值替代,每個方向包含2 304條交通流量數據。目標路段(north)及其最近一個交叉路口各方向的交通流量走勢如圖1所示。

圖1 交通流量走勢

1.2 城市道路交通流量分析

城市道路中路段的交通流量與附近交叉口有緊密關系,通過路段中某一橫截面的車流量受到鄰近交叉口各個方向交通流量的影響。因此,采集目標路段最近的一個交叉口各方向的數據進行研究,可分析各個方向車流量之間的相互影響作用。如圖2所示,目標路段的方向為南向北,采用檢測器收集其余各個方向路段的交通流量信息,根據皮爾遜相關系數法,可分析各個方向交通流量之間的相關性。二維變量的皮爾遜相關系數如式(1)所示。

圖2 目標路段及最近交叉路口

(1)

圖3所示為各個方向交通流量之間的相關性熱力圖,通常情況下,該系數超過0.8被視為2個因素的相關性較強,處于0.5~0.8之間則被視為2個因素的相關性中等。目標路段為南向北(north)方向,可以看到其余方向的交通流量與north方向的相關性均在中等以上,平均相關系數為0.82,屬于強相關。上述結果表明,交叉口各個方向的交通流量對目標路段的交通流量具有顯著影響,因此考慮將各個方向的交通流量作為預測模型的輸入因素之一。交叉口相關因素部分的輸入變量為[f1+f2,f3+f4,f5+f6,f7+f8],預測模型的最終輸出為[f5+f6]。

圖3 4個方向交通流量之間的相關性熱力圖

1.3 出行天氣分析

人們的出行常會受到天氣因素的影響。青島氣候較為潮濕,且大風天氣居多,戶外出行通常會考慮溫度、風速和陰晴雨等。根據這一特點,本文采用從WunderGround平臺獲取的天氣數據,數據類別包括風速、溫度、濕度、氣壓和陰晴雨,天氣數據樣本如表1所示。

表1 天氣因素數據樣本

為了體現天氣因素對交通出行的影響,本文提出一種更為深度的分析方法,采用K-means聚類算法[22]分析風速和溫度對交通出行的影響。K-means聚類方法可以把樣本點的特征矩陣區分為n個無交集的簇。首先,設定n個隨機的最初質心,通過計算將樣本點聚合到位置最為接近的質心,生成簇;其次,計算每個簇中樣本點的平均值,將結果作為修正質心;最后,比較修正質心和最初的質心是否一致,如果不一致則再循環上述計算過程,如果一致則停止迭代完成聚類。聚類過程中需要計算的質心距離使用歐式距離,本文使用的三維空間歐式距離公式如式(2)所示:

(2)

式中:xi,yi,zi為樣本點的三維特征值;xμ,yμ,zμ為最近質心的三維特征值。

圖4所示為溫度、風速和交通流量的聚類結果,將聚類的類別設置為3。由圖4可知,圖中的樣本點大致分為3種情況。第1種情況,交通流量較少的綠色點集,多分布在風速高且氣溫低的區域;第2種情況,交通流量中等的紫色點集,相比第1種情況,分布在風速更為緩和且氣溫相對舒適的區域;第3種情況,交通流量較高的黃色點集,分布在溫度舒適且風速較低的區域。根據這3種情況可以明顯看出,人們會相應減少低溫和大風天氣的出行,而更多傾向于在溫度適宜且風速溫和的天氣下出行。因此,天氣變化會明顯影響城市道路的車流量。

圖4 溫度、風速和交通流量的聚類結果

此外,分別計算晴天、陰天和雨天的交通流量平均值,如圖5所示,可以看出,晴天的交通流量平均值明顯要高于陰天和雨天??梢?,人們較多選擇晴天出行,減少雨天出行的幾率。

圖5 晴天、陰天和雨天的交通流量

綜合上述分析可知,為了提高交通流量預測的準確度,需引入更多相關因素作為影響因子。本文選擇將風速、溫度、濕度、氣壓和陰晴雨作為天氣因素的輸入值。

2 TGM預測模型的構建

為了有效協調多種因素對預測模型結果的影響,延長交通流預測的時長,本文建立一種新型的“時間齒輪”預測模型(TGM)。模型內部分為2個模塊,模塊1對天氣因素進行特征提取,模塊2對目標路段附近交叉口各方向的交通流量信息進行特征挖掘。最后,將2組模塊的輸出經過張量拼接輸入到多層感知機(multiple perception,MLP)中再次挖掘數據的深層特征。

2.1 提取天氣因素

如圖6所示,TGM模型的模塊1對天氣數據進行特征提取。首先,對晴天、陰天和雨天進行熱編碼,對應值為晴天—2,陰天—1,雨天—0;其次,為了減少不同數據數值范圍對預測結果影響的差異,對5種因素進行歸一化處理,將數據壓縮到0~1之間;最后,使用MLP對天氣因素進行特征挖掘,設置2組全連接層(Dense),單元數設置為128,激活函數設置為relu。

圖6 TGM模型的整體結構

2.2 構建時間齒輪模型

交叉路口4個方向的交通流量數據會隨著時間變化,而時間信息和各個方向的交通流信息明顯在不同的維度。為了更好地體現這種時空特征,本文仿照轉軸與齒輪的關系,將時間線抽象為齒輪的轉軸,4個方向的交通量數據則在齒輪的輪齒上。如圖6所示,每一個時間點xn均包含4個方向的交通流量數據,并將4個方向的數據排布在輪齒上沿著時間轉軸傳遞信息。本文設置2組時間齒輪,根據正向和反向的時間線綜合提取交通流的時空特征。

如同齒輪的周期性運動,交通流數據也具有明顯的周期性。為了增強模型對時間序列數據的特征捕捉能力,使用一種基于Time2vec的時序數據表征學習方法[23]。在方法中添加一個正弦函數,使模型能夠更容易地捕獲到交通流數據的隱藏周期變化規律。如圖6所示,將Time2vec嵌入到預測模型中。Time2vec的公式如式(3)所示:

(3)

式中:x為原始時間序列的特征;α和β分別為三角函數中可學習的頻率和相位;ε為第ε個特征;w為特征維度。

為了充分學習交通流數據的時間特征,對TGM模型的算法框架在Bi-GRU網絡的基礎上進行改進。與LSTM相比,GRU在確保一定精度的同時,還進一步簡化了內部組成。GRU內部組成如圖7所示。

圖7 GRU結構

如圖8所示,Bi-GRU網絡將時序數據按照2個相反的方向分別送入到2組GRU中,再將2組輸出的結果進行融合,因此模型的輸出考慮到了未來數據信息對歷史數據信息的影響,這種結構在大量學術研究中被證明具有更優的模型性能[24]。本文使用多維時空數據,Bi-GRU盡管具有優越性能,但是在數據復雜的情況下,模型為了充分挖掘數據的特征會增加迭代次數,變得難以擬合。因為傳統神經網絡的學習過程通常會兼顧全局信息,模型需要對信息進行逐個分析,因而大大增加了模型的學習成本??梢?,面對多維度且大量的數據,如果重點分析其中的關鍵信息,并減少非關鍵信息的關注度,則可以降低模型的學習成本,使模型的計算過程變得簡單靈活。

圖8 Bi-GRU結構

圖9 引入Attention機制的Encoder-Decoder結構

綜上所述,為了提升Bi-GRU對多維數據的特征提取能力,將注意力機制分別加入到正向GRU和反向GRU中,同時對Attention機制進行改進,可提高特征權重對GRU最終信息提取結果的依賴性。加入改進Attention機制的Bi-GRU結構如圖10所示。

圖10 結合改進Attention機制的Bi-GRU

如圖10所示,對Bi-GRU的正向和反向加入改進的Attention機制。在正向和反向的GRU中,輸入值xt經過GRU信息深層挖掘,獲得相應的信息提取結果,分別將正向GRU和反向GRU信息的最后一個結果ht和ht′單獨提取出來。然后,將每一個GRU單元的信息提取結果送入Dense層,按照輸入參數的維度標準化,將正向計算結果和反向計算結果分別設為[d1,d2,d3,…,dt]和[d1′,d2′,d3′,…,dt′]。為提升Attention機制計算權重值對GRU最終信息提取結果的依賴,將Dense層的計算結果和ht,ht′進行點乘,并使用激活函數softmax將計算結果轉換為衡量信息重要性的權重分數,將正向和反向Attention機制計算的權重設為A和A′。計算過程如式(4)和式(5)所示:

A=softmax([d1,d2,d3,…,dt]·ht)=[α1,α2,α3,…,αt],

(4)

A′=softmax([d1′,d2′,d3′,…,dt′]·ht′)=[α1′,α2′,α3′,…,αt′]。

(5)

通過權重分配機制,提高模型對重點信息的關注度。將計算出的權重值和GRU每個單元信息提取值的對應元素相乘并求和,正向和反向的計算過程如式(6)和式(7)所示:

(6)

(7)

考慮到GRU最終信息提取結果較為重要,將權重求和的結果和GRU最終信息提取結果合并,結合Attention機制的正向GRU輸出特征矩陣為Y1=[C,ht],結合Attention機制的反向GRU輸出特征矩陣為Y2=[C′,ht′]。通過上述計算過程,將改進的Attention機制加入到正向GRU和反向GRU中,最終的輸出結果為Y=[Y1,Y2],再添加MLP層進一步挖掘信息的深層次特征。

3 結果驗證與分析

3.1 相關設置

本文設置多個對比模型,預測未來5,15,25 min的交通流量。訓練集和驗證集的比例設置為7∶1,輸入步長為24(120 min),學習率為0.000 1,一次性的投放抓取次數設置為128。將MSE作為模型的損失函數,使用Adam作為模型優化器,輪數epoch設置為300,Time2vec的特征數設置為64,TGM模型中Bi-GRU2個方向的神經元數均設置為64,激活函數使用tanh。

3.2 多因素對比結果

為了證明多因素預測模型及算法改進的優越性,進行以TGM模型為基礎的消融實驗,具體的參照對象設置如下:

上述研究中,研究組潰瘍消失時間(37.20±11.52)d、癥狀緩解時間(14.13±5.26)d與幽門螺桿菌轉陰時間(23.08±2.49)d均低于對照組,研究組治療后經胃鏡檢查結果痊愈率為88.33%,與對照組(68.33%)比較,組間比較,差異具有統計學意義(P<0.05),由此可見,在抗幽門螺桿菌的含鉍四聯療法上加用雙歧桿菌四聯活菌片治療消化性潰瘍的效果顯著。

TGM-Weather:在TGM模型的基礎上,去除天氣因素提取模塊;

TGM-Space:在TGM模型的基礎上,輸入值去除其余方向路段的交通流數據;

TGM-Attention:在TGM模型的基礎上,去除Attention機制,算法框架使用Bi-GRU;

TGM-RNN:在TGM模型的基礎上,保留Attention機制,將Bi-GRU換成RNN。

上述參照模型以及TGM模型的預測結果如圖11所示。

圖11 預測結果對比

由圖11可以看到TGM模型的預測性能相比其他對照模型具有明顯提高。消融實驗表明,當模型分別加入了天氣因素、附近交叉口交通流量因素、Attention機制和Bi-GRU后,5,15,25 min的交通流預測準確度均有相應提升。與不考慮交叉口和天氣因素的模型相比,TGM模型結合城市交通的特點,能夠更好地捕捉城市路段交通流量的特征。此外,在TGM-Attention模型和TGM-RNN模型中可以看到,Attention機制和Bi-GRU對預測結果具有明顯的影響。以上實驗證明了融合天氣因素和最近交叉口各方向路段交通流量信息,以及仿照轉軸與齒輪關系建立TGM模型進行交通流預測的合理性。

3.3 預測模型對比分析

為了證明TGM模型具有更為準確的交通流預測能力,將MLP模型、AIRMA模型、SVM模型、RNN模型、LSTM模型、GRU模型和Bi-GRU模型設置為對比實驗模型,所有對比模型的相關參數與TGM模型保持一致,并將模型的性能調至最佳狀態。對比實驗的預測結果見表2和表3。

表2 實驗結果:MAE對比

表3 實驗結果:RMSE對比

從表2和表3中可以看出,與其他模型相比,TGM模型具有更佳的預測效果。TGM模型預測5,15,25 min交通流的MAE值分別為5.21,5.73和6.24,RMSE值分別為7.22,8.29和8.79。當預測時間延長時,TGM模型在15 min和25 min實驗組的預測誤差MAE相比5 min實驗組分別增加了9.08%和16.51%,RMSE相比5 min實驗組分別增加了12.91%和17.86%??梢?,TGM模型能夠在預測時間延長的同時保證誤差在合理范圍內,具有穩定的中長時預測能力。

在15 min和25 min實驗組中,傳統機器學習算法的預測誤差增加幅度較大。相比5 min實驗組,MLP,AIRMA和SVM的15 min預測誤差MAE值分別增加了18.19%,18.23%和13.24%,25 min預測誤差MAE值分別增加了26.28%,25.30%和24.41%??梢?,傳統機器學習算法的中長時預測不穩定。在15 min實驗組中,與RNN,LSTM,GRU和Bi-GRU相比,5 min實驗組的預測誤差MAE值分別增加了16.88%,14.35%,10.83%和10.62%。在25 min實驗組中,與RNN,LSTM,GRU和Bi-GRU相比,5 min實驗組的預測誤差MAE值分別增加了29.72%,27.28%,25.26%和18.24%。典型循環神經網絡模型和Bi-GRU模型在中長時預測實驗中,其誤差增加幅度均比TGM模型大,說明TGM模型相比其他模型在中長時預測方面更加穩定。此外,TGM模型預測15 min和25 min的誤差MAE值相比性能較優的Bi-GRU模型分別降低了6.37%和6.73%,RMSE值分別降低了7.09%和7.99%。結果表明,TGM模型相比其他模型在預測準確度方面提升也明顯。

圖12所示為TGM模型預測值與實際交通流量的對比曲線圖。

圖12 TGM模型預測結果與實際值對比

由圖12可知,TGM模型很好地預測了實際交通流的變化趨勢,并且在多處曲線峰值處與實際值高度重合。此外,TGM模型在中長時交通流預測方面仍具有可觀的擬合效果,進一步驗證了TGM模型的優越性。

4 結 語

1)提出了一種融合多因素的“時間齒輪”交通流預測模型,深度分析了天氣因素和鄰近交叉路口各方向交通流量對目標路段交通流量的影響,融合多因素對交通流進行預測。

2)提出的TGM模型分為2個模塊,模塊1使用MLP對天氣因素進行信息提取,模塊2仿照轉軸和齒輪結構,將時間線和交叉路口各方向交通流量抽象為轉軸與齒輪,參照齒輪的旋轉周期,嵌入Time2vec提升模型對數據周期性規律的學習能力,再將模塊1和模塊2的結果合并,添加MLP得到最終輸出的預測結果。消融實驗驗證了所提出的TGM模型在方法上具有合理性。

3)與MLP模型、AIRMA模型、SVM模型、RNN模型、LSTM模型、GRU模型和Bi-GRU模型對比可知,TGM模型具有更強的非線性擬合能力和更高的預測準確度。相比性能較優的Bi-GRU模型,TGM模型在預測15,25 min交通流量的結果中,MAE值分別降低了6.37%和6.73%,RMSE值分別降低了7.09%和7.99%,可以滿足中長時預測精度的要求,為交通協調管理控制提供數據支撐。

4)本文提出的TGM預測模型僅針對城市公路,面對復雜多變的道路交通情況,其預測性能仍有提升空間。未來將考慮增加出行興趣地點和行車軌跡等因素,并區分私有車輛和公有車輛,進行更為深入的交通流預測研究。

猜你喜歡
交通流量交通流路段
冬奧車道都有哪些相關路段如何正確通行
基于XGBOOST算法的擁堵路段短時交通流量預測
高速公路重要路段事件檢測技術探討
基于加權組合模型的短時交通流預測研究
一種平穩化短時交通流預測方法
基于GA-BP神經網絡的衡大高速公路日交通流量預測
交通流隨機行為的研究進展
提升管護水平 創建靚美路段——鹿泉區集中供熱管理二處全力打造槐安路靚美路段側記
路內停車對交通流延誤影響的定量分析
基于復合卡和ETC的交通流量采集研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合