?

基于LSTCN模型的城市交通速度預測

2021-12-24 01:43殷仕山孫克雷
關鍵詞:卷積天氣交通

殷仕山 孫克雷

(安徽理工大學計算機科學與工程學院 淮南 232001)

0 引 言

由于挖掘時空模式的強大能力,在交通預測領域中越來越多地采用基于深度學習的方法[1].Lyu等[2]提出了一種基于深度學習的堆疊式自動編碼器(SAE)模型,以捕獲交通流量預測中的時空相關性.Koesdwiady等[3]結合了DBN和決策級數據融合方案來同時預測交通流量和天氣狀況.Kuremoto等[4]研究了如何將基于受限Boltzmann機的深度置信度網絡應用于短時交通速度預測.Ma等[5]運用長期短期記憶(LSTM)來捕獲交通速度預測的長期時間特征.然而,LSTM每次只讀取和分析輸入序列中的一個速度值.循環神經網絡必須等待前一個速度值處理完畢后才能處理下一個值,這意味著循環神經網絡無法像CNN那樣進行大規模并行處理,而傳統的神經網絡無法精確提取數據的時間特征,所以對時間序列的研究又轉向了卷積神經網絡.

卷積神經網絡CNN在處理二維數據(如圖像)時表現良好,通常由卷積層和下采樣層疊加而成,即池化層.Wang等[6]提出了一種基于單隱層卷積神經網絡結合誤差反饋的交通流速度預測模型.Yu等[7]提出了一種基于卷積神經網絡的數據分組模型,該模型由兩部分組成.連續詞模型(CBOW)用于尋找相似的時空關系,而CNN網絡用于短期速度預測.Ma等[8]將時空交通速度矩陣轉換為圖像,然后將其作為CNN的輸入,用于交通速度預測.羅文慧等[9]考慮到天氣,事故等異常情況,利用CNN提取交通流的時空特征,輸入到頂層SVM模型中進行預測.Wu等[10]通過使用一維CNN來利用空間特征和兩個LSTM來表征交通流的時間相關性來預測交通流.Ke等[11]運用融合卷積LSTM(Conv-LSTM)來開發時空深度學習模型,以預測按需乘車服務下的乘客需求.從以上的CNN文獻中發現,傳統的CNN只能在滑動窗口有限的情況下提取局部信息.結果,當提取過程數據的深層特征時,CNN可能仍然會遇到梯度消失的問題.為了解決此問題,專門開發了時間卷積網絡(temporal convolutional network,TCN)以處理序列建模問題.

利用CNN和RNN的優勢,TCN具有以下三個特征來改進時間序列建模的性能:因果卷積,擴展卷積和殘差連接.因果卷積在輸入和輸出之間建立了牢固的因果關系;擴張的卷積增加了TCN的接收場,而無需使用太多的隱藏層;殘差連接功能避免了梯度消失的可能性.文中首先將交通速度數據建模為時間序列問題,然后提出了一種預測城市交通速度的長短期時間卷積網(long and short-term temporal convolutional network,LSTCN)模型.LSTCN預測模型對時間卷積網絡進行了改進,使其能捕捉交通速度序列特征,并充分考慮天氣因素對交通速度的影響,從而更準確地預測城市交通速度.

1 交通速度與天氣因素的研究

1.1 交通速度的時間特征

道路交通速度數據在短期內具有明顯的趨勢性,在長期內具有周期性特征[12],見圖1.對深圳市羅湖區2015年1月20日、周二10:00—10:15的交通速度進行預測,那么當天09:00—10:00內的交通數據以及對應的周一10:00—10:15和上周周二10:00—10:15的交通速度數據將為預測提供最有用的信息,而當天06:00點的交通情況通常與預測目標無關.

圖1 交通速度數據周期性

由圖1可知:13日、19日和20日的速度趨勢變化非常相似,說明了交通速度數據存在明顯的日周期性和周周期性.

1.2 天氣因素的處理

天氣的變化會直接影響交通速度的變化[13].通過世界氣象在線網站的接口,獲取所需城市的氣象數據,并選取10個可量化的氣象參數作為外部數據特征.由于天氣因素與道路交通速度之間的作為具有復雜的非線性關系,采用皮爾遜(Pearson)相關系數來度量10個天氣因素與交通速度之間的相關性.分析結果見圖2.

圖2 天氣因素相關性

氣象特征數據與交通速度數據的相關系數為

r(xw,yt)=

(1)

式中:n為采樣點數據的個數;xw為歸一化后的氣象特征數據;yt為降采樣以及歸一化后的交通速度數據;r(xw,yt)為氣象特征數據與交通速度數據之間的相關系數[14].相關系數r的值在[0,1]之間,r越接近1,關聯度越強,r越接近0,關聯度越弱.r(xw,yt)的絕對值反映了天氣數據與交通數據的關聯度.本文選取相關系數超過0.2的影響因子,即溫度,降雨量,濕度和能見度,以縮小選取的時空范圍,削弱低于此標準的影響效應.

2 長短期時間卷積網絡模型

2.1 時間卷積網絡

TCN是一種特殊的1D-CNN,用于時間序列預測和分類任務,TCN在多種任務和數據集上的性能優于LSTM、GRU等典型的遞歸神經網絡,相比于遞歸神經網絡,TCN可以記住更長的歷史信息,捕獲更全局的時間序列特征.

為了實現對長期歷史尺度輸入的有效預測,不論是使用深層次的網絡還是大量的卷積核,都需占用大量的計算資源,并且時空復雜度很高.因此引入了擴展卷積機制,使得模型能夠用更小的濾波器和更淺的網絡層覆蓋更大的時間序列范圍.

對于一維輸入序列I∈Rs和卷積核F:{0,2,…,k-1}→R,對序列元素x的擴展卷積運算F定義為

(2)

式中:d為擴展間隔;k為卷積核的大小,因果擴展卷積的示意圖見圖3.

圖3 三層因果擴展卷積網絡

時間卷積網絡中還加入了殘差連接、權值歸一化和dropout來提高性能,一個完整的TCN殘差塊見圖4.

圖4 時間卷積網絡

2.2 融合天氣因素的LSTCN交通速度預測模型

考慮到交通速度數據同時具有短期趨勢性和長期周期性,本文類比長短期記憶網絡模型的思想,提出了一種長短期卷積網絡.交通流數據預測遵循因果關系原則,但不需要連續不間斷的歷史數據輸入.例如,10:00的交通流量與06:00的交通流量并不相關,因此擴展間隔的設計不需要覆蓋所有的序列范圍.

以Q次/h為研究對象的統計頻率,設當前時間為T0,待預測的數據點為Tp,在此時間序列上分別截取近期趨勢Tn,日周期Td和周周期Tw,充分提取交通速度數據的時間特征,見圖5.

圖5 交通速度時間特征示例

1) 近期趨勢性Xn=(XT0-Tn+1,XT0-Tn+2,…,XT0),即與預測目標數據緊鄰的歷史時間序列,見圖5中Tn段.城市道路上車輛的匯集和分散是漸變式的,同一地點前一時刻的車流量勢必會影響下一時刻的車流量,進而影響交通速度的變化.

所有時間序列預測模型都要求網絡的輸入輸出長度相等并且序列中任意時刻T對應的節點只接受T時間之前的信息.LSTCN在網絡輸出端用了全連接層來保證輸出序列與輸入長度相等,繼承了時間卷積網絡中采用的具有因果關系的卷積來保證網絡中的任一時間節點在模型的各階段只獲得歷史時刻的信息,見圖6.

圖6 基于長短期時間卷積網絡的預測模型

模型首先對交通速度和氣象特征的近期趨勢性進行特征提取,經實驗得出使用3層TCN效果最佳.其次提取交通速度的周期性特征,將TCN擴展間隔設置為D、W,分別代表每日和每周的時間序列長度.最后將二者提取的特征統一維度后相加,經過全連接層輸出預測結果Pi,簡單表示為

Pi=TCN5level(Xtra)+TCN3level(Xwea)

(3)

具體預測流程如下.

步驟1將交通速度序列數據以滑動窗口的方式進行處理,窗口大小為12,每次向前滑動一個數據,即時間特征數目為12,預測下一個時刻的交通速度.

步驟2篩選出相關性最強的四個氣象特征,將氣象特征序列直接作為輔助特征.

步驟3對滑窗處理后的交通速度數據和氣象特征數據進行預處理并劃分訓練集與測試集.

步驟4將訓練集輸入LSTCN模型進行訓練.

步驟5用訓練好的模型預測測試集交通速度大小,使用常用的評價指標計算誤差.

3 實驗與評估

3.1 數據來源與預處理

廣州道路交通速度數據(GZ):由214個匿名路段(主要是城市快速路和主干道)組成,數據采集間隔為10 min.實驗選取2016年8—9月的數據,其中,前50 d的數據用于訓練,后11 d的數據用于測試.深圳道路通行速度數據(SZ):由羅湖區156條主干道組成,數據采集間隔為15 min.實驗選取2015年1月1—31日的數據,其中,前24 d的數據用于訓練,后7 d的數據用于測試.

對交通速度和篩選后的氣象特征數據進行歸一化處理,對數據使用了離差標準化,是對原始數據的線性變換,使結果值映射到[0~1],公式為

(4)

式中:x為交通速度和氣象特征的原始數據;y為處理后的數據;xmax為原始數據集中的最大值;xmin為其最小值.

3.2 模型評價指標

選取回歸問題最常用的四個評價指標,即平均絕對誤差(MAE),均方誤差(MSE),均方根誤差(RMSE)和平均絕對百分比誤差(MAPE)對交通速度預測模型進行評價.四個指標的定義為

(5)

(6)

(7)

(8)

式中:N為預測值的個數;Pi為觀測點的預測交通速度值;Fi為對應的真實交通速度值;MAE,MSE,RMSE,MAPE的值越小,表明模型的預測精度越高.

3.3 實驗環境和參數設置

3.3.1TCN隱層節點數的確定

隱層節點數是決定模型提取數據特征能力的重要參數,太少的節點數意味著網絡性能較差;過多的節點數雖然能夠減小網絡的系統誤差,但是會延長不必要的訓練時間,甚至出現過擬合.考察了不同隱層節點下模型的預測誤差,結果見表1.由表1可知:模型的預測誤差隨節點數的增加而變化,根據實驗結果,將TCN隱層節點數設置為64.

表1 不同TCN隱層節點數實驗結果對比

3.3.2周期性中TCN卷積核大小的確定

為了探究不同周期性數據的輸入長度,即TCN卷積核的大小對預測結果的影響,在廣州數據集進行了參數實驗,考慮到模型的運算效率問題,將卷積核大小分別設置為Td={2,3,4},Tw={2,3,4},部分結果見表2.根據結果,最終確定卷積核大小為{3,3}.

表2 不同TCN卷積核大小實驗結果對比

3.3.3近期趨勢性中TCN層數的確定

對TCN的層數進行實驗驗證,驗證結果見表3.由表3可知,模型的預測誤差隨著TCN層數的增加呈現先下降后上升的趨勢,因為層數越多參數量越大,反而難以訓練,為了使模型能夠達到最佳性能,最終確定使用三層的TCN.

表3 不同TCN層數實驗結果對比

3.3.4其他參數

提取周期性特征的后兩層的擴展間隔為每日和每周包含的時間節點數量,深圳數據集的擴展間隔為{1,2,4,96,672},廣州數據集的為{1,2,4,144,1 008}.綜合考慮精度和效率要求,將訓練Epoch設置為500次,批量規模為128,使用了學習率衰減和Adam優化.

3.4 實驗結果與分析

首先比較了LSTM、GRU、TCN和未考慮天氣因素的LSTCN四種深度學習模型的預測結果.LSTM和GRU采用了常規的三層結構,TCN則使用了和本文模型近期趨勢性相同的三層結構,便于對比.為保證實驗公平性,上述模型使用相同的交通數據特征輸入,以及統一的Adam優化器.

為了清楚地比較四種深度學習模型的預測性能,展示了廣州和深圳的預測數據,見圖7.四種模型都能較好地擬合真實數據,與LSTM,GRU和TCN模型相比,LSTCN對速度變化趨勢的擬合程度要明顯優于其他模型.具體來說,在深圳數據集上,它的整體預測值偏低,對變化的大趨勢預測精準;在廣州數據集上,擬合效果更加優秀,特別是在數據突變處.

圖7 模型預測結果對比

為了保證預測結果的穩定性,進行了多次實驗,得到的各項測試誤差平均值見表4.在本次實驗中,TCN的性能優于LSTM和GRU,LSTCN取得了最好的效果.與LSTM模型相比,在廣州數據集上的MAE降低了5.4%,RMSE降低了3.5%,MAPE降低了0.21%.

表4 模型預測性能比較

圖8為測試集在訓練過程中的均方誤差MSE的變化曲線,可以看出訓練開始時TCN和LSTCN的收斂速度明顯快于LSTM和GRU,后續訓練過程相差不大,都是在抖動中緩慢下降.LSTM和GRU都屬于循環神經網絡RNN模型的變種,所以每個單元的訓練都需要等待前一個單元的輸出,導致每次訓練所消耗的時間是卷積神經網絡的數倍,因此在相同epoch次數下LSTCN的實際收斂時間比LSTM和GRU要低,但要高于模型更簡單的TCN模型.

圖8 測試集MSE在訓練過程中的變化

為了進一步說明天氣因素對交通速度預測的影響,驗證預測模型的有效性,分別用未融合天氣因素的LSTCN預測模型和融合天氣因素的LSTCN預測模型對兩個城市的交通速度做了預測,并通過常用誤差評價指標對預測結果做了對比,結果見表5.

表5 融合天氣因素前后預測性能比較

由表5可知,融合了天氣因素對城市交通速度預測時的各項誤差都要小于單靠交通速度數據進行預測時的誤差,提高了預測精度.由此可以得出,融合天氣因素之后,有效地改善了交通速度預測效果,說明了天氣因素確實會影響城市交通速度的預測,從而驗證了預測模型的可行性.

4 結 束 語

針對天氣因素對交通速度的影響以及現有方法在超長時間序列預測精度上的不足,提出一種基于綜合天氣因素的長短期時間卷積網絡的交通速度預測模型LSTCN,用于綜合捕捉交通流的時間特征和外部天氣特征.長短期時間卷積網絡可以并行處理時間序列,相比常用的循環神經網絡,訓練速度快,占用內存少.通過反復試驗確定預測模型的參數,并與常用的時間序列預測方法進行比較,結果證明我們的預測精度和運算效率較高.但本文沒有考慮空間特征對預測結果的影響,今后將利用圖卷積結構對模型進行改進.

猜你喜歡
卷積天氣交通
基于3D-Winograd的快速卷積算法設計及FPGA實現
天氣冷了,就容易抑郁嗎?
繁忙的交通
誰是天氣之子
盛暑天氣,覓得書中一味涼
卷積神經網絡的分析與設計
從濾波器理解卷積
Weather(天氣)
小小交通勸導員
基于傅里葉域卷積表示的目標跟蹤算法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合