?

基于深度學習的城市快速路交通運行狀態判別與預測

2023-06-21 02:15趙彪劉曉鋒付甜
現代信息科技 2023年1期
關鍵詞:深度學習

趙彪 劉曉鋒 付甜

摘? 要:為了實時判斷城市交通及快速路交通狀況,并充分考慮到快速路及交通系統的模糊性、差異性、波動性,文章首先給出了一套基于模糊C均值聚類法(Fuzzy C-Means)的快速路交通狀況判斷算法,將道路的交通狀況區分為通暢、基本順暢、緩行、堵塞4類。其次,利用了長短期記憶網絡(LSTM)的長短時預測技術,給出了一個基于深度學習的模式,對交通運行三參數進行預測,并利用路側檢測設備不斷獲取新的真實數據,對預測模型進行迭代訓練。然后利用已形成的模糊聚類模型,得到快速路交通運行狀態的預測結果。最后以天津市黑牛城道的真實交通數據進行實驗驗證,結果表明,文章提出的交通流狀態預測模型準確性達到93.22%,能為快速路交通控制提供有效的狀態預測。

關鍵詞:城市快速路;模糊C均值聚類;深度學習;LSTM短時預測方法;交通運行三參數

中圖分類號:TP391.9? ? 文獻標識碼:A? ? 文章編號:2096-4706(2023)01-0001-08

Traffic Operation State Discrimination and Prediction of Urban Expressway

Based on Deep Learning

ZHAO Biao, LIU Xiaofeng, FU Tian

(Tianjin University of Technology and Education, Tianjin? 300222, China)

Abstract: In order to judge the urban traffic and traffic condition of expressway in real time, and to fully consider the fuzziness, variability, and fluctuation of expressway and traffic system, a set of judgment algorithms of expressway traffic condition based on Fuzzy C-Means is given in this paper firstly, which distinguishes the traffic conditions of roads into four categories: smooth, basically smooth, slow and blocked. Secondly, a model based on deep learning is given to predict the three parameters of traffic operation by using the Long Short-Term Memory (LSTM) long short-term prediction technique, and the prediction model is trained iteratively by continuously acquiring new real data using roadside detection equipments. Then using the developed fuzzy clustering model, the prediction results of the traffic operation state of the expressway are obtained. Finally, the real traffic data of Heiniu Road in Tianjin is used for experimental validation, and the results show that the accuracy of the traffic flow state prediction model proposed in this paper reach 93.22%, which can provide effective state prediction for expressway traffic control.

Keywords: urban expressway; Fuzzy C-Means; deep learning; LSTM short-time prediction method; three parameters of traffic operation

0? 引? 言

作為都市道路交通的主動脈,城市快速路以其大容量、高效、強聯通的特性承載著城市內各個主要功能區域的交通,極大地減輕了城市壓力,提升了城市的整體服務質量。對于道路交通的模糊性、隨機性、復雜性,實時準確的短期交通流量預測,對快速路的智能控制和管理具有基礎性和決定性的作用。

以往的短期交通預測工具,主要可以分成以下三種:參數方法、非參數方法和混合方法。參數化方法包括時間排序方式和卡爾曼濾波[1,2]。焦朋朋等[3]充分利用其對高維特征數據預測精度高以及計算速度快的優勢,提出了基于集成學習XGBoost模型的交通流預測。褚瑞娟[4]給出了基于CEEMDAN-IWEP和GWO-LSSVM的運輸流組合分析模型,通過CEEMDAN模型可以把原始運輸流時間序列劃分成若干個比較均勻、簡單的本征模態分量的殘余誤差序列,采用最小二乘支持向量機對重組后的序列和殘差分量進行預測,將各LSSVM模型的預測結果相加得到最終的預測結果。張亮亮[5]等人給出了基于階段特征分析的城市快速路交通運營狀況預報方案,運用滑動變異系數的方法將道路運營狀況序列細分為幾個有不同特征的子序列,并分析了各個特征子序列的自關系,從而建立了門限自回歸的道路運營狀況多步預報模式。Guo[1]等采用動態的過程方差,生成可行的預測和估計水平間隔,運用改進的自適應卡爾曼濾波方法預測交通流。Lin[6]基于交通流理論,將ARIMA模型與GARCH模型相結合,得到相應的波動特征,實現高速公路交通流預測。Shahriari[7]將bootstrapping抽樣方法和ARIMA結合,建立E-ARIMA交通流預測模型。

傳統的基于機器學習的方法利用人為的特征來捕捉交通流的特征,這不足以獲得準確的預測性能。此外,早期基于神經網絡的工作通常使用淺層網絡或只有一個隱藏層,這也無法捕捉交通流的不確定性和復雜的非線性。與傳統的ANN模型相比,深度學習模型使用多層架構,從大量的原始數據中自動提取固有的特征。最近,深度學習激發了交通研究的興趣。不同的深入了解模式,也被引入于交通流分析。然而,現有的基于深度學習模型的交通流預測工作存在以下缺點:

(1)很多作品的著眼點在于單參數的預測,比如交通量預測、交通速度預測,但往往缺乏對整體交通運行情況的控制要素的關注,使得預測結果不能完全反映出交通運行的具體情況,很難在具體的交通管理與控制中作為控制性指標使用。

(2)目前大多數的快速路匝道控制策略研究的主要方法是人工定周期控制和自適應控制。前者無法隨交通運行狀態的變化而進行實時調整,后者則因為快速路交通系統的復雜性和模糊性而缺乏預見性,因此在國內的推廣相對較慢。同時目前的研究缺乏對預測參數的歸類處理,也就很難開展對不同交通運行狀態,如擁堵狀態、暢通狀態等的針對性交通管理與控制。本文提出的快速路交通運行狀態預測方法,可以有效解決這些問題,為快速路交通控制提供支持。

1? 基于FCM的快速路交通狀態判別

1.1? FCM算法簡介

C均值模糊聚類算法[8]由Bezdek和Castelaz于1972年提出,以同類對象相似度最大,不同類別對象相似度最小為原則,將多維數據樣本劃分為特定類數。具體方法如下:

設X={x1, x2,…, xn}為n元數據集合,xi∈Rs。FCM把X劃分為c個子集S1, S2,…,Sc,若用V={α1,…,αc}表示這c個子集的聚類中心,uij表示元素xj對Si的隸屬度,則FCM算法的優化目標函數為:

(1)

滿足如下約束條件:

(2)

其中,

(3)

(4)

(5)

式中U={uij}為c×n矩陣,V={α1,α2,…,αn}為c×s矩陣,xj與αi的距離為dij,本文中距離計算采用歐式距離。m為模糊指數,用來控制分類矩陣U的模糊程度,其取值大于1,m越大,分類的模糊程度越高,在實際的交通運行預測應用中m的最佳范圍為(1.5,2.5)。該算法的主過程通過不斷迭代收斂,獲取目標函數的最小值,隸屬度值uij采用拉格朗日乘數法進行計算。

結合式(1)~式(5),即可夠得到隸屬度矩陣U和聚類中心A以及使目標函數最小化的迭代優選過程。

1.2? 基于FCM交通狀態判別方法

1.2.1? 數據預處理

為增強數據處理的可信度,必須檢驗原始數據的完善與合理程度,并消除和舍棄不合理的原始數據記載。本文用三參數基本圖作為參照,依次繪就占有率—速度、占有率—交通量、速度—占有率的關系圖,對部分數據進行校正和剔除[9]。

1.2.2? 迭代聚類

通過式(3)、式(4)計算U(k),V(k+1),比較V(k+1)與V(k),如果滿足V(k+1)-V(k)≤?的條件,則停止迭代,得到各交通狀態的聚類中心,否則,以k=k+1繼續迭代分析。

1.2.3? 狀態判斷結果分析

在模擬數據分析中,隨機選擇了這些信息并和新的城市交通狀態聚類中心比較,以確定最有代表性的信息所對應的新交通狀況。

狀態判別流程如圖1所示。

2? 基于深度學習的快速路交通運行狀態預測

2.1? LSTM算法簡介

長短期記憶網絡(Long Short-Term Memory, LSTM)是循環神經網絡RNN的一個變體[10],是專為處理學習長期依賴性現象而設計并產生的,對傳統RNN的缺陷具有針對性,是當前使用較為廣泛的神經網絡模型,在時間序列預測、視頻信息處理、圖像處理及自然語言處理等諸多領域中能達到較好的應用效果。

如圖2所示,RNN是一個循環的神經網絡,允許了信息的持久性。其中A被視為神經網絡的一個縮影,接受某時刻的輸入Xt然后輸出對應的結果ht,一個回路可以允許信息從一步傳遞到另一步。一個循環神經網絡可以被認為把若干個功能相同的基本單元連接起來,每一個基本單元都可以將信息傳遞到下一個基本單元。由于其獨特的時間記憶機制,參數共享并且圖靈完備,RNN可以記住輸入的有關重要信息,這使得RNN可以非常精準的進行預測。因此,人們在處理非線性的序列數據(比如時間序列數據、交通流數據、文本、金融數據、天氣等)時,常常將RNN作為首選的預測算法。

LSTM是RNN的一個分支,與RNN不同,RNN的隱藏層節點在LSTM中變成了記憶模塊。由于記憶模塊加入,LSTM具有了記憶能力,可在一定程度解決梯度消失問題及長期依賴問題。

LSTM的核心思想是其細胞狀態[11]。傳統的RNN會以不被控制的方法在每個時間步長里重復之前的記憶,因此信息和殘差在RNN神經元中傳遞時會隨時間逐步損耗。因此RNN需要一定的結構來支撐長期記憶能力,LSTM使用“細胞狀態”來刻畫神經元記憶中不太容易衰減的部分,并圍繞細胞狀態構造長期記憶。差異對比如圖3所示。

在圖4中,左圖為RNN的神經元結構,右圖為LSTM的神經元結構,LSTM中增加的部位即為細胞狀態(Cell State),我們以細胞狀態向量的形式,來儲存神經元對之前序列的學習和記憶,細胞狀態在整個神經網絡中一直延直線運行,將上個時間步的細胞狀態、當前步的數據輸入、上一時步的隱藏狀態綜合起來,構造出每個神經元結構的歷史長期記憶。

LSTM單元結構中的輸入門、遺忘門、輸出門的計算公式為:

it=g(Wxixt+Whiht-1+hi)? ? ? ? ? ? ? ? ? ? ? ? ?(6)

ft=g(Wx? fxt+Wh? fht-1+bf)? ? ? ? ? ? ? ? ? ? ? ? (7)

Ot=g(Wxoxt+Whoht-1+bo)? ? ? ? ? ? ? ? ? ? ? ? (8)

輸入變化及狀態更新公式:

i_int=tanh(Wxcxt+Whcht-1+bc_in)? ? ? ? ? ? ? ? ? (9)

ct=ft·ct-1+it·c_int? ? ? ? ? ? ? ? ? ? ? ? (10)

ht=ot·tanh(ct)? ? ? ? ? ? ? ? ? ? ? ? ? ? (11)

2.2? 基于LSTM的快速路交通三要素短時預測流程

基于LSTM循環神經網絡的交通運行三要素預測模型的基本步驟如下[12]:

(1)實驗數據預處理(校正、剔除)。

(2)選取訓練集與測試集(對數據集進行劃分)。

(3)根據預測因子和所需預測的變量確定輸入、輸出變量。

(4)確定網絡層數與各層神經元數量。

(5)確定網絡的初始權值、隱層閥值、輸出層閥值、激勵函數、學習速率等。

(6)訓練神經網絡模型中,當實驗誤差超過規定范圍以后或訓練步數超過事先規定的值時終止訓練系統,若不滿足,進行各網絡參數值的修正和調整。

(7)預測,輸入測試集數據得到網絡的實際輸出值。

(8)分析預測結果,得出最終最佳的預測結果。

本文快速路交通運行三要素短時預測流程如圖4所示。

3? 案例分析

3.1? 目標道路概況

本文選擇天津市黑牛城道的通達尚城路段作為研究對象,該段道路為天津市快速環路的一部分,主路四車道,輔路兩車道。該道路作為天津市重要的東西向主干道,承擔著通道性功能,由于交通組織復雜,交通量大,同時缺乏必要的管控措施,在高峰時段常處于過飽和狀態,擁堵問題嚴重。研究路段區位信息如圖5所示。道路車道渠化情況如圖6所示。

3.2? 交通調查與主要參數

本文主要通過多目標跟蹤視覺雷達對汽車目標路線的信息收集,該技術能夠實現檢測道路的真實汽車跟蹤路徑信息,包含了汽車的時速、方位、車道號、三維位置,以及超車、變道、停車和逆行等的監測信號,同時具有汽車流量數據、平均速度、市場占有率,以及汽車排隊時間等信息。雷達設備安置在該段快速路途中一座人行天橋上,正面面對被測道路,距離道路豎直距離大概7米。系統采用RS485通信模式設置,在多目標跟蹤、觸發(單目標)和觸發(多目標)工作模式下同時發送RS485數據。該系統安裝后屏幕架構如圖7所示。該多目標雷達采集系統操作界面及檢測結果如圖8所示。

本文選擇的主要研究參數包括交通量、平均運行速度、占有率。同時以一些組合參數對調查時段進行選取,包括堵塞指數(CI)、停止時間比例(PST)等。以120秒為檢測間隔,選擇早上7:00到8:30作為早高峰時段,中午11:30到13:00作為午高峰,下午5:30到7:00作為晚高峰時段,下午2:50到3:50和上午10:00到11:00作為平峰時段,進行了斷面交通調查。各時段總體情況如表1所示。

經過對調查數據的分析,并以后驗概率為主要衡量指標在對原始聚類分析法中加以優化,便可得出關于快速路交通運行狀況的原始聚類分析法中的4×3階矩陣。不同交通運行狀態的初始聚類中心如表2所示。

3.3? 交通運行狀態聚類分析

3.3.1? m值的確定

根據m值的選定的取值范圍為(1,2.5][13],采用啟發式的方法,以步長0.3在區間(1,2.5]中對進行試取值,即m∈{1.3,1.6,1.9,2.2,2.5}。經過不同m值的效果對比,最終選擇m=2.2。

3.3.2? 聚類類數c值的確定

在應用算法進行聚類分析時,需要預先給定聚類類數,本文通過聚類有效性函數來確定聚類數目的取值,從而在最大程度上使聚類問題更有效。因而,對聚類分析而言,有效性問題可以轉化為最佳聚類類數的確定問題。本文采用類有效性函數,確定不同聚類類數的有效性,類有效性函數如式(14)所示:

(14)

式中,n表示樣本數量,c表示類別數,m表示模糊加權指數,xj表示第j個樣本的值,uij表示第i個樣本對第j類的隸屬度,vi、vj表示第i類和第j類的聚類中心。

就模糊聚類的效果而言,同一類別的樣本間的相似度越大,分布越緊密,而不同類別的樣本間相似度越小,分離程度越大說明聚類效果越好。因此,式(14)中數值越大表示分類的緊密程度越高,分類分離程度越大,p的值越大就表示聚類效果越好。經過計算,c=2,3,4,5,6,7,8,9,10時,有效性函數的函數值如表3所示。

猜你喜歡
深度學習
從合坐走向合學:淺議新學習模式的構建
面向大數據遠程開放實驗平臺構建研究
基于自動智能分類器的圖書館亂架圖書檢測
搭建深度學習的三級階梯
有體驗的學習才是有意義的學習
電子商務中基于深度學習的虛假交易識別研究
利用網絡技術促進學生深度學習的幾大策略
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
深度學習算法應用于巖石圖像處理的可行性研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合