?

基于生成對抗和圖卷積網絡的含缺失值交通流預測模型

2023-11-15 06:59陳建忠呂澤凱藺皓萌
公路交通科技 2023年9期
關鍵詞:交通流分量精度

陳建忠,呂澤凱,藺皓萌

(西北工業大學 自動化學院,陜西 西安 710129)

0 引言

在科學技術日新月異的今天,人工智能的快速崛起和廣泛應用為緩解交通擁堵提供了有效的方法[1]。交通流預測需要大量的歷史交通數據,在實際數據收集過程中,由于交通基礎設施、氣象狀況和數據采集技術的限制與人為失誤等原因造成的數據缺失問題對交通流預測的準確性產生嚴重的負面影響[2]。因此,本研究基于深度學習方法建立交通流缺失數據補全方法和交通流預測模型,提高交通流缺失數據補全的準確性和交通流預測的精度。

常見的處理缺失數據的方法分為不做任何處理、刪除缺失數據和填補缺失數據。填補缺失數據是應用最為廣泛且效果最好的處理方法。隨著人工智能的快速發展,神經網絡、深度學習等方法逐步應用于交通流缺失數據的補全中,目前已經取得了一定的研究成果。Tian等[3]提出了一種基于長短時記憶網絡的方法用于時間序列數據補全;Duan等[4]提出了一種基于去噪堆疊自動編碼器的交通數據補全模型,討論了時空因素對交通數據插補的影響,給出了分層訓練的方法并建立模型,該方法可以有效獲取大規模路網數據中包含的時空相關性信息;Tan等[5]將張量插補方法應用于高速公路多檢測器缺失數據的插補中。

隨著交通流數據采集技術的快速發展,依據交通流數據的特點,從數據驅動角度進行交通流預測,從20世紀70年代末開始就一直是該領域的基本研究方向?;跀祿寗拥慕煌黝A測方法大致分為以下4類,分別是統計模型、機器學習模型、深度學習模型和組合模型。

統計模型考慮了交通流的周期性,提取歷史數據對未來交通流進行預測。經典的時間序列方法有歷史平均模型和自回歸積分滑動平均模型等。機器學習模型如支持向量機、貝葉斯網絡和隨機森林等在交通流預測中展現出了強大的能力。Dell’Acqua等[6]給出了最近鄰回歸方法,這是一種對于交通流預測有效且易于實現的數據驅動方法;祁偉等[7]引入季節性ARiMA模型并利用時序周期特征計算交通觀測值的缺失,對稀疏交通流進行預測;吳晉武等[8]提出了一種改進的非參數回歸交通流預測算法,融合主成分分析、模糊C均值聚類與支持向量機方法,對短時交通流進行預測。

深度學習是機器學習的細分領域。相對于機器學習模型,深度學習模型除了可以學習簡單特征以外,還能從簡單特征中提取更加復雜的特征,可以更有效地進行特征提取進而處理更為復雜的問題,提高模型準確性。Lü等[9]應用深層架構模型,使用自動編碼器捕獲交通流特征進行預測;為了預測交通流,Huang等[10]提出了一個由2部分組成的深層結構,即底層的深層信念網絡(Deep Belief Network,DBN)和頂層的多任務學習回歸層,DBN能以無監督的方式學習交通流的有效特征;Ma等[11]提出一種長短時記憶網絡,有效地獲取交通流非線性特征。為提高模型提取特征的能力,部分研究者提出了將多種模型組合用于交通流預測;Zhao等[12]和Yu等[13]提出了時空圖卷積網絡,設計了一種包含圖卷積網絡與門控循環單元的時空卷積模塊,對流量、速度進行預測;唐智慧等[14]將神經網絡模型與無跡卡爾曼組合構成預測模型,對短時交通流進行預測;楊春霞等[15]基于雙向長短時記憶網絡方法,構建了學習交通流上下關聯性的模型;陳孟等[16]綜合時空圖卷積網絡以及卡爾曼濾波對未來的交通流流量進行預測。

交通流預測的關鍵在于依據大量歷史交通數據,針對交通流非線性、非平穩的特點,設計合適的模型,以達到盡可能低的預測誤差。目前基于深度學習的交通流缺失數據補全方法研究較少,運用深度學習方法學習大規模路網交通流數據分布,可以更加有效地提取特征,與現有補全方法相比,提高了數據補全的準確性。本研究針對含缺失值的城市道路網絡交通流,設計了基于生成對抗網絡的交通生成對抗插補網絡?,F有交通流預測方法多數依賴完整交通流數據集實現預測,當數據集中有較多缺失值時使用這些方法的交通流預測精度會顯著降低。為提高含缺失值的路網交通流預測的準確性,在文獻[12]的基礎上,設計了基于交通生成對抗插補網絡、經驗模態分解、圖卷積網絡和門控循環單元的交通流預測模型,顯著降低了數據缺失和數據噪聲對交通流預測的負面影響,捕獲路網交通流的時空相關性進而提升城市道路網絡交通流預測的精度。

1 數據集選用與缺失設計

城市道路交通系統是由人、車、路整合而成的巨大復雜系統,交通流參數的變化受到諸多因素的影響,體現在城市道路網絡交通流的隨機性、周期性、時間相關性和空間相關性等。為研究城市道路網絡的交通流預測,本研究選用深圳市羅湖區出租車平均車速數據集[12],該數據集包括2015年1月1日至31日深圳市羅湖區156條主要道路的實測車速數據。試驗數據主要包括2部分:一是156×156鄰接矩陣,描述了道路之間的空間拓撲,每行表示一條道路,矩陣中的值表示道路之間的連通性,道路間有連通為1,不連通為0;二是特征矩陣,描述了每一條道路上的速度隨時間的變化,每一行代表一個時間點不同路段的交通速度,每一列是同一道路不同時間段上的交通速度,速度選取的是每15 min該路段所有統計車輛的平均速度。

在本研究試驗中模擬真實交通流數據缺失情形,設計2種缺失模式,分別為:(1)隨機缺失:每個傳感器完全隨機丟失觀測值;(2)非隨機缺失:每個傳感器在數天內失去觀測值。這2種缺失情形在數據集上作數據處理,將被視為缺失值的數據點的值變為0,用于模擬實際缺失情形??紤]實際情形中數據缺失的比率不盡相同,設計含有不同缺失率的缺失數據用于補全方法驗證,缺失率設置為10%,20%,30%,40%,50%,60%這6種情形。

2 補全方法與預測模型

2.1 交通流數據補全方法設計

生成對抗網絡可以在不依賴完整數據集的情況下很好地進行數據的填補,其在圖像增強領域大放異彩[17]。在研究補全問題時通常將圖像作為矩陣進行操作,因交通流數據同樣可以矩陣化,對于交通流數據的補全問題,生成對抗網絡同樣適用[18]。本研究將生成對抗網絡引入交通流數據補全中,利用生成對抗網絡的思想結合矩陣化的交通流數據結構,設計了用于交通流數據補全的交通生成對抗插補網絡(Traffic Generative Adversarial Imputation Network,TGAIN)。為方便推導,做如下規定:

X為原始交通流數據構成的數據矩陣;M為X的掩模矩陣,維度與X相同;mi為M中第i個元素的值,當X中第i個元素為觀測數據時,mi為1,當X中第i個元素為缺失數據時,mi為0。TGAIN的目標是填充數據矩陣X中的缺失值。引入矩陣乘積運算法則Hadamard積[19],其符號為○。如果矩陣C∈m×n,矩陣Β∈m×n,則2個矩陣的Hadamard積定義為:

(1)

(2)

式中1為維度與M相同、元素均為1的矩陣。補全結果為:

(3)

(4)

(5)

因為生成器G的實際輸出包含所有數據的矩陣,所以在G的訓練過程中,不僅要使數據缺失點插補的值成功“騙過”判別器,還要保證觀測數據盡可能不變,為此定義下列2個損失函數:

(6)

(7)

(8)

式中α為超參數。圖1描述了交通生成對抗插補網絡的結構和補全數據的產生過程。

圖1 交通生成對抗插補網絡結構Fig.1 Traffic generative adversarial imputation network structure

2.2 時空預測模型

2.2.1 經驗模態分解

交通流數據屬于非線性非平穩時間序列,具有一定的非平穩性、周期性和隨機性。由于車、路和人等多種外部因素的耦合影響,原始交通數據往往還包含一些噪聲,有時表現出較大的波動,進而導致了預測性能的下降。為降低噪聲對預測模型性能的影響,將經驗模態分解(Empirical Mode Decomposition,EMD)用于交通流數據處理,將復雜的交通流時間序列轉化為多個具有較強規律性的分量,再將各分量分別進行重構作為后續預測模型的輸入,最后合并各分量預測結果。

EMD方法是由Huang等[20]提出的一種針對非線性、非平穩數據的分解方法。與小波分解和傅里葉分解等基于先驗的分解方法不同,EMD是一種完全由數據驅動的分解方法,突破了傅里葉變換的局限性,克服了小波分解需要主觀選擇小波基的缺陷。作為一種自適應的分析方法,EMD具有良好的時頻分辨率,能夠將有噪聲、非平穩的交通流時間序列分解為單一、平穩的分量。在噪聲抑制方面,EMD可以將噪聲和有效信號分離為不同的本征模式函數(Intrinsic Mode Function,IMF)和殘差,IMF分量反映了原始交通流時間序列的不同時間尺度的震蕩特性,殘差反映了原始數據的長期趨勢。每個IMF的特征應符合2個條件:

(1)完整的時間序列中,序列的所有極大值點的個數和極小值點的個數之和與序列過零點的數目必須相等或最多相差一個。

(2)在時間序列的任何時刻,局部最大值的上包絡線和局部最小值的下包絡線均值為零。分解后的IMF與原始交通數據序列相比具有更強的規律性,去除了一定噪聲影響。EMD可以處理分析非線性、非平穩數據,這對于探索交通流預測模型的隱藏時間序列關系起了至關重要的作用,該方法有助于揭示復雜非線性時間序列的特征。

定義交通流時間序列x(t)≈(x1,x2,…,xT),T為時間序列的長度,xt為當前路段t時刻觀測到的交通流參數。IMF分量和殘差由以下步驟確定:

(1)判定交通流時間序列x(t)的所有局部極大值和極小值點;

(2)應用三次樣條插值分別擬合所有局部極大、極小點形成x(t)的上包絡線u(t)和下包絡線v(t);

(3)計算上下包絡線的均值m(t);

(4)計算原始交通流時間序列x(t)與包絡線平均值m(t)的差h(t):

(5)判斷h(t)是否滿足IMF的條件,若h(t)滿足條件,則h(t)為原交通流時間序列的本征模函數分量,定義C(t)=h(t),令r(t)=x(t)-h(t),x(t)=r(t);若不滿足,則令x(t)=h(t);

(6)重復步驟(1)-(5)直到r(t)變為單調函數或IMF分量數目達到最大數量條件,EMD分解終止。

通過步驟(1)~(6),x(t)被分解為n個IMF分量和1個殘差項,EMD對交通流時間序列的分解結果可以表示為:

(9)

式中Ci(t)為第i個IMF分量。

本研究中設置IMF分量的最大數目為6,交通流時間序列經過EMD多次篩選處理后,可以得到一系列從高頻到低頻排列的IMF分量和殘余項。其中高頻IMF分量的隨機性較強,通常會代表交通流中的噪聲干擾和交通流自身的一些隨機特性。低頻IMF規律性較強,代表交通流自身具有的時間規律特性。殘余項則是一個趨勢項,各IMF分量和該趨勢疊加可以得到原始的交通流時間序列。對各分量及殘余項分別進行預測,將預測結果疊加得到交通流預測結果。

2.2.2 圖卷積網絡

在深度學習獲取數據空間特征方面,一直由卷積神經網絡(Convolutional Neural Network,CNN)統治,其在計算機視覺領域也取得了十分優異的效果。但是,CNN處理的數據都是歐式結構的數據,對于交通路網拓撲這種非歐式結構的數據,拓撲圖中每個頂點的相鄰頂點數目都可能不同,因傳統的離散卷積在非歐式結構數據上無法保持平移不變性,故而無法用同樣尺寸的卷積核來進行卷積運算。為了在非歐式結構(拓撲圖)上有效提取空間特征來進行深度學習,近年來,圖卷積網絡(Graph Convolutional Network,GCN)[21]成為了人工智能領域研究的熱點。本研究使用GCN對交通路網拓撲結構進行學習捕獲交通流空間相關性。GCN的作用和CNN一樣,是一個特征提取器,只是GCN的對象是圖數據。假設在交通路網拓撲圖中,有n個節點,每個節點都有T維的交通流時間序列,設這些節點的特征組成矩陣X∈n×T,各個節點之間的拓撲關系形成鄰接矩陣A∈n×n,將X和A作為圖卷積模型的輸入。GCN為多層神經網絡,層與層之間的傳播方式為:

(10)

(11)

2.2.3 門控循環單元

循環神經網絡(Recurrent Neural Network,RNN)是用于處理序列數據的一種神經網絡。RNN在許多深度學習任務中表現出卓越的性能,如機器翻譯、語音識別和推薦系統等。交通流數據作為時間序列數據,RNN在交通流數據預測上同樣表現亮眼。RNN因為可以將先前的信息用于當前的任務,所以非常適合處理交通流時間序列,捕獲交通流數據的時間相關性。但是,RNN訓練時極易產生梯度消失或梯度爆炸的問題,因此產生了門控循環單元(Gated Recurrent Unit,GRU)[22]等循環神經網絡的變種。本研究采用GRU捕獲交通流數據的時間相關性,其結構如圖2所示。

圖2 門控循環單元結構Fig.2 Gated recurrent unit structure

在兩層GCN基礎上疊加一層GRU以捕獲時間特性[12]。圖2中,ht-1為t-1時刻的隱藏狀態;Xt為t時刻的交通信息;rt為重置門,用于控制先前時刻狀態信息的度量;ut為上傳門,用于控制上傳到下一狀態的信息度量;ct為t時刻儲存的信息;ht為t時刻的輸出隱藏狀態。GRU通過獲取t-1時刻的隱藏狀態與當時的交通狀態信息得到t時刻的交通信息。各變量定義如下:

ut=σ{Wuf[(A,Xt),ht-1]+bu},

(12)

rt=σ{Wrf[(A,Xt),ht-1]+br},

(13)

ct=tanh{Wcf[(A,Xt),rt×ht-1]+bc},

(14)

ht=ut×ht-1+(1-ut)×ct。

(15)

綜上所述,本研究建立的EMD-GCN-GRU模型可以處理復雜的帶有噪聲和時空特性的路網交通流數據,將交通流數據經EMD處理后得到6個IMF分量和一個殘差分量,將同級分量重構為后續模型輸入,再使用GCN學習路網的空間拓撲,捕獲道路之間的空間相關性,使用GRU捕獲交通流的時間相關性,最后將各個分量的預測結果疊加,得到最終預測結果,實現交通流預測任務。模型的損失函數設計為:

(16)

圖3 EMD-GCN-GRU模型結構Fig.3 EMD-GCN-GRU model structure

2.3 模型精度評價指標

本研究主要從預測精度、準確性等方面衡量模型的性能,從數值上對比不同預測模型的優劣,選取了5個性能指標進行衡量,分別為:

(1)平均絕對誤差(Mean Absolute Error,MAE)。

(2)均方根誤差(Root-mean Square Error,RMSE)。

(3)準確度(Accuracy):衡量預測數據準確性,即

(17)

(4)數據的擬合程度,即:

(18)

(5)解釋方差得分,即:

(19)

3 試驗結果與分析

3.1 補全模型

選取深圳市羅湖區464 256條平均車速數據為研究對象,設置2種缺失模式和6種缺失比率,使用TGAIN與矩陣分解(Matrix Factorization,MF)模型[23-25]進行補全驗證。隨機缺失補全精度對比如表1所示,可以觀察到TGAIN的MAE和RMSE均明顯低于MF模型,其中在缺失率為30%時,TGAIN補全精度優勢最為顯著,相對于MF模型,TGAIN的MAE降低了約40.64%,RMSE降低了約30.04%,補全準確性更高。

表1 隨機缺失補全精度Tab.1 Random missing completion accuracy

非隨機缺失補全精度對比如表2所示,可以觀察到,在缺失率為10%,20%和30%時TGAIN的MAE和RMSE均明顯低于MF模型,補全準確率更高。在缺失率為40%時TGAIN的MAE和RMSE均低于MF模型,但相差不大。在缺失率為50%和60%時TGAIN的MAE和RMSE均高于MF模型,補全性能變差。TGAIN模型受非隨機缺失率影響較大,在非隨機缺失數據增多至總數據量一半以上的情形下,無法準確地學習真實數據的分布,導致補全誤差增加。

表2 非隨機缺失補全精度Tab.2 Nonrandom missing completion accuracy

3.2 時空預測模型

通常在訓練次數足夠的情況下,隱藏單元數目Num對模型預測精度影響最大,故首先對EMD-GCN-GRU方法選用不同隱藏單元數目進行預測精度對比,選出最優隱藏單元數目。各含有不同隱藏單元數目的模型預測精度如表3所示,第1行表示隱藏單元的數量,第1列表示不同精度評價指標??梢钥闯鲈陔[藏單元數目為100時模型的擬合程度最高,所以選用隱藏單元數目為100進行后續研究。隨著隱藏單元數目增加,模型預測精度先提高后降低,這是因為當隱藏單元數目過度增加時模型過擬合。

表3 不同隱藏單元數目模型預測精度比較Tab.3 Comparison of prediction accuracy of models with different number of hidden units

選用數據集前80%作為訓練集,其余20%作為測試集。選用過去1 d的速度數據(96個時間步)預測下一時間段即15 min的平均速度,使用Adam優化器優化預測模型(見表4)。

表4 預測模型參數Tab.4 Prediction model parameters

為便于作圖表示,預測算法的驗證均以第一條道路為例給出結果。經EMD處理后,原始道路車速數據作為EMD的輸入信號被分解為6個IMF分量和一個殘差分量,其分別描述了不同時間尺度的車速變化特征,如圖4所示。

圖4 經驗模態分解結果Fig.4 Empirical mode decomposition result

IMF1分量預測結果如圖5所示,可以看出模型對IMF1分量的預測效果較好。交通流時間序列經EMD處理后,得到了一系列規律性較強的分量,將同級分量重構為模型輸入分別進行后續預測模型的訓練,由于時間演化趨勢不再互相耦合,各分量均具有更好的可預測性。

模型的預測結果如圖6所示,在預測全程,模型的預測值變化趨勢貼合真實交通速度分布,基本接近車速真值,說明模型的有效性。由圖7前96步的預測結果可知,模型在第20步左右未能準確預測到速度變化極值,對其他時刻的速度變化趨勢、極值均能較為準確地進行預測,總體預測效果良好。在少量極值點預測性能較差,主要原因是在使用GCN時定義了傅里葉域中的平滑濾波器,通過不斷移動過濾器捕捉空間特征。這個過程導致總體預測結果的波動較小,使峰值更為平滑[12]。

圖7 前96步預測結果Fig.7 Prediction result of the first 96 steps

選取如下模型與本研究EMD-GCN-GRU模型進行預測精度對比:

(1)歷史平均模型(HA):使用歷史交通流數據的平均值作為預測值;

(2)支持向量回歸(SVR):利用歷史數據對模型進行訓練,得到輸入和輸出之間的關系,然后通過訓練后的模型預測未來的交通流。在該模型中使用的核函數是線性核;

(3)自回歸積分滑動平均模型(ARIMA):將預測對象隨時間推移而形成的數據序列視為一個隨機序列,用一定的數學模型來近似描述這個序列并進行預測;

(4)循環神經網絡(RNN):用于處理序列數據的神經網絡;

(5)長短時記憶網絡(LSTM):一種時間遞歸神經網絡[22];

(6)門控循環單元(GRU);

(7)GCN-GRU組合預測模型:將圖卷積網絡與門控循環單元結合組成的預測模型[12]。

統計每個模型預測結果的MAE和RMSE(見表5),可以看出與其他7種預測算法相比,EMD-GCN-GRU的MAE和RMSE均為最小,優于其他模型,相較于MAE較低的SVR,LSTM和GRU,MAE分別下降7.34%,1.02%和1.47%,相較于RMSE較低的LSTM,GRU和GCN-GRU,RMSE分別下降10.43%,10.72%和8.94%,說明EMD-GCN-GRU模型具有更好的交通流預測準確性。

表5 各模型預測精度Tab.5 Prediction accuracy of each model

為研究使用不同歷史時長數據進行預測對預測模型性能的影響,設置預測所用歷史數據時長分別為1,2,3,24 h,統計各模型的預測精度指標如表6所示??梢钥闯鲱A測模型的MAE和RMSE在24 h時最低,說明預測模型在此數據集上使用歷史1 d的數據進行交通流預測更加科學準確。

表6 使用不同歷史時長數據的預測精度Tab.6 Prediction accuracy with different historical duration data

3.3 組合預測模型

組合預測模型是對含缺失交通流數據集中的缺失值使用TGAIN進行填充后,再使用EMG-GCN-GRU模型進行城市道路網絡交通流預測。在試驗中,選擇20,40,60,80,100這5種隱藏單元數目構建預測模型進行精度對比,各評價指標如表7所示??梢钥闯鲈陔[藏單元數目為60時的預測模型精度最好,所以選用隱藏單元數目為60進行后續研究。

表7 不同隱藏單元數目的組合模型預測精度Tab.7 Prediction accuracy of combination model with different number of hidden units

選用數據集前80%作為訓練集,余20%作為測試集。選用過去1 d的速度數據(96個時間段)預測下一時間段的平均速度,使用Adam優化器優化預測模型。模型的主要參數:隱藏單元數目為60,批大小為128,其余參數同表4。表8給出在缺失率為20%時,針對2種缺失模式,分別使用缺失數據和經TGAIN補全后的數據進行預測的預測結果,可以看出在2種缺失模式下,使用補全數據進行預測的模型精度顯著優于使用原始缺失數據的預測精度,使用補全數據進行預測能夠更好地捕獲車速的變化規律,說明了組合預測模型的優越性,同時也再次證明了TGAIN補全方法的有效性。

表8 使用缺失數據和補全數據的預測精度Tab.8 Prediction accuracy with missing data and complete data

為研究使用不同歷史時長數據對組合預測模型性能的影響,設置預測所用歷史數據時長分別為1,2,3,和24 h,各模型的預測精度統計見表9,可以看出組合模型的MAE和RMSE在24 h時最低,說明組合模型在此數據集上使用歷史1 d的數據進行交通流預測更加科學準確。

表9 使用不同歷史時長數據的預測精度Tab.9 Prediction accuracy with different historical duration data

4 結論

本研究基于生成對抗網絡,提出用于城市道路網絡交通流數據補全的交通生成對抗插補網絡TGAIN。采用深圳市羅湖區出租車平均車速數據集對TGAIN與具有較高補全準確性的矩陣分解模型進行了對比。結果表明TGAIN模型在數據集隨機缺失模式下補全準確性較高,補全性能受隨機缺失率影響較小,在數據集非隨機缺失模式下補全準確性受缺失率影響較大,在非隨機缺失率低于50%時補全性能較好。

針對具有已知空間聯系的路網交通流數據,在可獲取路網空間鄰接拓撲的基礎上,建立對交通流數據進行分解重構并捕獲時空相關性的EMD-GCN-GRU預測模型。結果表明,相比其他7種預測算法,EMD-GCN-GRU預測模型具有較高的預測準確性。對含缺失值的城市道路網絡交通流預測問題設計組合預測模型,將TGAIN與EMD-GCN-GRU模型相結合進行預測,仿真結果表明使用組合模型預測精度顯著提高。

猜你喜歡
交通流分量精度
帽子的分量
論《哈姆雷特》中良心的分量
基于DSPIC33F微處理器的采集精度的提高
分量
交通流隨機行為的研究進展
GPS/GLONASS/BDS組合PPP精度分析
路內停車對交通流延誤影響的定量分析
改進的Goldschmidt雙精度浮點除法器
具有負壓力的Aw-Rascle交通流的Riemann問題
基于瞬時對稱分量法的三相四線制D-STATCOM控制研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合