?

基于多源速度數據的動態權值融合方法研究*

2022-10-13 09:51王路曼王理民蔡銘
關鍵詞:高德路網浮動

王路曼,王理民,蔡銘

1. 中山大學智能工程學院,廣東 深圳 518106

2. 廣東省智能交通系統重點實驗室,廣東 廣州 510006

隨著智慧交通建設的展開,交通數據采集能力有所提升,數據種類與數量增長迅速,交通大數據的應用成為了交通信息化水平提升的關鍵。導航平臺路段速度數據和浮動車GPS 速度數據具有數據量大、數據更新穩定、容易獲取等優點,被廣泛應用于交通領域,是常用的道路運行車速數據源。導航平臺路段速度數據是指高德或百度等互聯網公司發布的實時路段速度數據,此類數據以不同長度的路段為單元進行反饋,包含路段位置、長度、道路等級、運行車速等信息;而浮動車GPS 數據是指實時采集的出租車、公交車、網約車等車輛的位置及速度等數據,將其位置坐標與地圖進行匹配,可以得到的路段速度數據。

大多數學者都是基于其中一種數據進行相關研究。劉瑤杰[1]、孟曉彤[2]、魯武當[3]基于導航平臺數據對城市交通擁堵時空特征及未來路況預測進行研究。鄒蕊燭[4]、賈洪飛等[5]利用浮動車GPS數據進行城市路網狀況分析。Li C[6]基于出租車GPS 實時速度、位置等信息,分析了道路實時擁堵等交通運行狀態指標,為出租車及其他車輛出行提供參考。他們在研究中都提到浮動車GPS數據存在因實時車輛覆蓋強度不同所導致的部分路段數據缺失、不完整等問題。目前,將兩種數據融合使用的研究相對較少。趙順晶等[7]將導航平臺路段速度和浮動車GPS 速度基于固定權值進行融合,但未考慮兩種數據的實時更新數據質量問題。在多源數據融合方面,Alwan[8]、丁玥等[9]提出的多源數據融合的基本框架包含三個模塊,即模式匹配、實體對齊和實體融合。陳磊等[10]提出了一種基于思維進化的優化BP 神經網絡數據融合算法。崔青華等[11]通過構建最優加權融合模型,將浮動車GPS 數據與微波車輛檢測數據進行數據融合,并將融合數據應用于行程時間的短時預測。戰昕[12]將視頻傳感器與磁敏傳感器獲得的車輛檢測信息融合,用于提高車輛檢測信息的準確度,采用的融合方法是基于數據可靠性的Dempster-Shafer 證據融合理論。上述數據融合方法大多需要掌握終端檢測設備和數據傳輸情況,在實際應用中存在一定局限性。同時,由于數據源格式等不同,并不能完全適用于導航平臺路段速度和浮動車GPS速度的融合。

本文將導航平臺路段數據和浮動車GPS 數據進行對比分析,提出了數據可靠性概念。針對導航平臺路段速度和浮動車GPS 速度設計不同的數據可靠性評估算法,基于數據可靠性指數賦予兩類數據實時動態權值并進行融合。該研究方法不僅可以避免單一數據源出現異常造成較大誤差的情況,同時可以提高實時更新數據的路網覆蓋率,有助于進行區域交通研究。

1 數據源與問題描述

1.1 實驗數據

本研究所用到的數據包括導航平臺路段數據和浮動車GPS 數據,導航平臺路段數據采用的是高德地圖的路段速度數據,浮動車GPS 數據采用的是營運車輛車載GPS 產生的速度數據,數據所在區域為佛山市,數據時間范圍為2019 年10 月15日至11 月14 日。高德路段速度數據以不同長度的路段為單元進行反饋,共計52 752 條路段產生731 732 350 條數據記錄,數據時間粒度為2 min,路段數據的主要字段及釋義如表1所示。

表1 路段速度數據字段及釋義Table 1 Field and interpretation of road section speed data

浮動車GPS 數據主要包括出租客運、公交客運、網約車、普通貨運等10 類營運車輛車載GPS所產生的數據,共計92 827 輛浮動車產生約50 億條數據記錄,數據更新時間不定,浮動車GPS 數據的主要字段及釋義如表2所示。

表2 GPS數據字段及釋義Table 2 Field and interpretation of GPS data

1.2 數據預處理

由于導航平臺路段速度數據是以不同長度的路段為單元進行反饋,而浮動車GPS 數據是以車輛GPS 點為單元生成數據記錄,且兩種數據的更新頻率不同,數據融合前需先將兩種數據進行空間和時間同步化處理,主要是對浮動車GPS 數據進行處理。處理過程包括GPS 數據清洗、統一空間坐標系、路網匹配以及路段速度計算4 個部分,處理成為時間粒度為2 min的GPS路段速度數據。

浮動車GPS 數據清洗是為了剔除經緯度異常、速度異常、時間異常、長期停駛等異常數據。浮動車GPS 數據以經緯度為坐標,采用WGS84 空間坐標系,而高德路段數據采用GCJ02坐標系,因此需要將兩者統一到同一坐標系下。本研究采用的方法是將GPS 數據坐標和路網地圖的坐標轉化到同一投影坐標下進行計算,所采用的投影坐標是:Xian_1980_3_Degree_GK_Zo-ne_38, WKID 為2362。使用投影坐標的優點是可以將經緯度轉化成以m為單位,以便于浮動車GPS點與道路的距離和后續的路網匹配算法的計算。

路網匹配算法主要是利用方向匹配法和最短距離法進行路網匹配。根據浮動車GPS 數據的行車方向與高德路段數據行車方向的一致性以及最短距離原則,將浮動車GPS 數據匹配到距離最近且與行車方向一致的路段。隨機選擇一輛公交車在一定時段內產生的GPS 數據進行驗證,預處理后的GPS數據有4 162條,正確匹配的數據有3 965條,匹配準確率達到95.3%,則認為該匹配方法能夠滿足研究需求。路段速度計算是利用浮動車GPS 數據的速度字段作為瞬時速度,計算2 min 內在同一路段上的所有浮動車速度的平均值,作為這條路段在2 min內的速度。

1.3 數據問題分析

導航平臺路段速度數據和浮動車GPS 數據由于數據終端采集、傳輸等均不相同,數據的更新頻率和更新范圍也有差異。經統計分析發現路段速度數據實時更新較為穩定,更新數據空間范圍也相對固定,但更新的部分路段數據質量較差,存在路段更新速度一直為0 km/h、連續多次更新速度為同一值以及個別速度值異常等問題。以2019年11 月14 日為例,有數據更新的路段有32 614條,占佛山市總路段條數的61.83%,路段數據更新情況如圖1(a)所示,平均每2 min 有更新的路段為32 604 條,但全天路段更新速度一直為0 km/h的路段有897條,出現連續30 min以上更新速度為同一值的路段有11 843 條,這兩類異常數據占佛山市總路段條數的24.15%。

將浮動車GPS 數據清洗后匹配到路段,通過統計分析發現GPS 路段數據的更新空間范圍較廣,但由于實時車輛路段覆蓋強度不同,存在部分路段數據缺失、不完整等問題。以2019年11月14日為例,有數據更新的路段有51 708 條,占佛山市總路段條數的98.02%,路段數據更新情況如圖1(b)所示,但平均每2 min 有GPS 數據更新的路段為11 773 條,僅占佛山市總路段條數的22.32%。

圖1 兩種數據更新空間范圍Fig.1 The spatial range of two kinds of data updating

通過上述分析可知兩種數據各有優缺點,導航平臺路段速度數據更新穩定但范圍不夠廣,浮動車GPS 數據更新范圍廣但實時更新穩定性較差,而且由于兩種數據源不同,兩種數據實時更新的路段覆蓋范圍也不相同。結合兩種數據的特征將其融合,不僅可以有效提高路段速度數據的準確率,同時可以提高實時更新數據的路網覆蓋率,即提高了查準率和查全率。

2 基于數據可靠性的數據融合算法

2.1 算法概述及框架

本文所提出的基于數據可靠性的導航平臺路段速度和浮動車GPS 速度融合算法,如圖2 所示??蚣馨? 部分內容:1)高德路段速度數據可靠性評估,從歷史數據中提取歷史時刻數據集合,通過對比實時數據與歷史數據分析得到實時數據的可靠性指數。2)GPS 數據可靠性評估,首先將GPS數據清洗匹配到路段上形成GPS路段數據,再依據GPS 歷史時段數據更新情況進行可靠性評估。3)將兩類數據基于數據可靠性指數進行加權平均得到路段融合后實時更新的數據。數據的可靠性評估是整個算法中最重要的部分,評估指標是可靠性指數r,r∈(0,1),r越大表示數據越可靠。

圖2 數據融合算法框架Fig.2 Framework of data fusion algorithm

2.2 高德路段數據可靠性評估算法

路段速度數據本質上是由交通出行者決定的,而出行者的出行特征總體上具有一定的時間空間分布規律,因此導致了路段速度數據也具有一定的時間周期性和時空相關性。本文以路段歷史速度數據以及與之相鄰的上下游路段歷史速度數據進行路段速度數據可靠性評估。城市路網中存在交叉口會將不同道路打斷成多條封閉路段,但為排除交叉口對路段速度的影響,封閉路段不包括交叉口臨近路段,封閉路段示意圖如圖3所示。路段的上下游路段是指封閉路段內與其相接壤的上下游路段,即路段的上下游路段唯一或沒有(交叉口臨近路段無上下游路段),路段速度數據的可靠性評估算法如圖4所示,與之相對應的字段釋義如表3所示。

表3 數據可靠性評估算法字段釋義表Table 3 Field and interpretation of road section data reliability evaluation algorithm

圖3 封閉路段示意圖Fig.3 Schematic diagram of closed road section

圖4 高德路段數據可靠性評估算法Fig.4 Reliability evaluation algorithm for Gaode road section data

在高德路段數據中加入表征星期的列,取值1~7。輸入某路段當前更新時刻的高德路段速度vl和該路段及其上下游路段歷史數據中同星期幾、同時、同分的速度值組成歷史數據集Hl,求出該數據集的閾值集合[Hlmin,Hlmax]和均值Hlmean。當實時路段速度vl∈[Hlmin,Hlmax],說明該速度數據較為可靠,則當前更新時刻路段數據的可靠性指數rl為1;當實時路段速度vl?[Hlmin,Hlmax],則該路段速度數據的可靠性指數與實時速度和歷史數據集均值的差值成反比。若該路段的歷史數據集均值等于0且當前實時速度等于0,則該路段速度數據的可靠性指數為0;若該路段的歷史數據集均值等于0 且當前實時速度不為0,則該速度數據的可靠性指數為1。

2.3 GPS數據可靠性評估算法

浮動車GPS 數據的應用是通過將其匹配到具體的路段上來計算路段速度,因此浮動車GPS 數據的可靠性評估包括兩部分:1)2 min時間間隔內成功匹配到某一路段上的GPS 數據條數直接決定了GPS數據的可靠性。GPS數據條數越多數據可靠性就越高,反之則存在數據偶然性的概率越大;2)基于該路段歷史同更新時刻且匹配GPS 數據條數較多的路段速度組成的歷史數據集,該路段當前更新時刻的路段速度與歷史數據集的偏差決定了GPS數據的可靠性,偏差越大,可靠性越低。

利用數理統計方法確定基于路段平均速度估計的最小GPS 數據樣本量,即對于某條路段,若給定允許速度誤差δ、樣本標準差為s,置信度水平為(1 -α),則GPS數據樣本數量n應滿足

由上式可計算出,當某條路段時間粒度GPS數據樣本數量n≥5 時,置信度水平(1 -α) ≥0.9。即認為若當前時刻成功匹配到某路段上的GPS 點數≥5 個,則該路段的可靠性指數較高。路段浮動車GPS 數據可靠性評估算法如圖5所示,與之相對應的字段釋義如表4所示。

表4 GPS數據可靠性評估算法字段釋義表Table 4 Field and interpretation of GPS data reliability evaluation algorithm

圖5 GPS數據可靠性評估算法流程Fig.5 Procedure of data reliability evaluation algorithm for GPS data

在浮動車GPS 數據中加入表征星期的列,取值1~7。整個可靠性評估算法包含兩部分:1)由成功匹配到路段的GPS點數決定路段GPS樣本量可靠性指數rg1。2)將該路段歷史數據中同星期幾、同時、同分且匹配到該路段的GPS 個數≥5 的路段速度值組成歷史數據集,評估方法與高德路段數據相同,得出GPS 路段速度的可靠性指數rg2,最后將兩部分的可靠性指數進行平均得到該路段當前更新時刻浮動車GPS數據可靠性指數rg。

2.4 數據融合

在進行高德路段速度數據和浮動車GPS 數據的數據可靠性評估后,可得出當前時刻的高德路段速度數據的可靠性指數rl和GPS路段數據的數據可靠性指數rg。將實時更新的高德路段速度vl和浮動車GPS平均速度vg,基于數據可靠性指數進行加權平均得到路段融合后的最終速度v,路段當前更新時刻的最終速度可表示為

3 實驗與分析

3.1 數據可靠性評估

實驗中高德路段速度數據和浮動車GPS 數據的歷史數據集均為2019年10月15日至11月13日,共30 d。以2019 年11 月14 日的數據為測試集,實驗數據樣例如表5 和表6 所示。數據表均以路段為單元進行展示,共計52 752 條路段,更新時間粒度為2 min,但由于表中只展示有更新的路段數據,且某些路段某些時刻高德路段速度無更新或者無成功匹配到路段的GPS 數據,表中存在路段編號不連續現象。

表5 2019年11月14日的高德路段數據可靠性評估Table 5 Reliability evaluation of Gaode road section data at Nov.14,2019

表6 2019年11月14日的GPS數據可靠性評估Table 6 Reliability evaluation of GPS data at Nov.14,2019

3.2 結果與分析

將基于數據可靠性的實時動態權值融合數據與單獨使用某一種數據或固定權值的融合數據的數據質量進行對比,以驗證本文所提出算法的有效性和實用性。本文以平均時間粒度數據更新的路網覆蓋率(RNC,road network coverage)和路段速度平均絕對誤差(MAE)為評價指標。定義

式中N表示每個時間粒度更新的路段數,li表示更新路段的長度,L表示路網總長度,v表示更新數據中的速度值,vs表示實際測量的速度值,T表示時間粒度的個數。

3.2.1 平均時間粒度路段更新的比例 本文的融合數據、高德路段速度數據、浮動車GPS 數據的平均時間粒度更新的路網覆蓋率如圖6 所示。圖6中,由于白天路網中行駛的車輛較多,產生的GPS數據路網覆蓋率較高,本文融合數據路網覆蓋率也較高;但GPS數據更新情況不穩定,存在某個時刻路網覆蓋率突降的情況。高德路段數據更新情況較為穩定,更新數據路網覆蓋率維持在60%左右。據統計GPS 數據平均時間粒度數據更新路網覆蓋率為33.43%,高德路段數據為60.32%,而本文的融合數據達到74.29%,顯著高于其他兩種數據。

圖6 不同數據實時更新數據路網覆蓋率Fig.6 Real time update of road network coverage with different data

3.2.2 路段速度平均絕對誤差 采用了實地調查的方式,對融合的速度數據的準確度進行校驗。在佛山市主城區隨機選取了6條兩類數據更新狀況均良好的路段,調查人員站在調查路段中間位置,所選路段及測量點如圖7所示。

圖7 測量路段示意圖Fig.7 Schematic diagram of survey road

調查時間為2019年11月14日,調查時段分為早高峰7:00~9:00,晚高峰17:00~19:00,平峰時段10:00~12:00 和14:00~16:00,每個時間段為2 h,選取其中1 h進行不間斷測量,保證每條路段被測時段包含一個高峰時段和一個平峰時段。測量路段的編號、名稱、道路等級、長度等基本屬性,以及測量時段如表7所示。

表7 測量路段信息Table 7 Survey road section information

調查人員是由專業技術人員擔任,使用雷達測速儀測速時隨機選擇被測車輛,避免總是選擇車隊的第一輛車、某一車道車輛比例過大、某一種車型比例過大或者高速行駛車輛比例過大等情況,同時調查人員在測速時隱蔽在駕駛員不易發現的位置,盡量保證調查結果能夠真實地反映車輛行駛狀況。

調查人員調查時首先使用皮尺測量路段長度并確定路段中點位置,并選定固定測速點位置。正式測量開始時,調查人員使用雷達測速儀不間斷測速記錄,測量頻率平均約為5 s/次,并以2 min為時間粒度進行分隔,取2 min 內所測得的所有速度樣本的平均值為當前時間粒度的實測速度值。

將高德路段速度、GPS路段速度和兩種數據按1∶1 固定權值融合、按照本文提出的實時動態權值融合,并與實測速度值進行對比,結果如圖8所示??梢钥闯?,各測量路段的不同數據速度曲線不連續。一是由于測量時段不連續,在平峰時段與高峰時段斷開;二是由于某些時刻某種數據無更新。且,當高德路段速度和GPS 路段速度數據質量都較好時,固定權值融合速度和動態權值融合速度曲線幾乎重合,并都與實測速度值擬合較好,如路段37732 和39830 所示。當高德路段速度和GPS路段速度數據質量不穩定,尤其是GPS數據波動較大時,動態權值融合速度曲線與實測速度值的擬合性明顯優于其他三種數據源,如路段37999 和40315 所示。計算得出各路段測量時段的速度平均絕對誤差,如表8所示。實驗表明,在隨機選取的6條路段上,基于動態權值融合的速度數據準確度較高,所有測量時段的速度平均絕對誤差為3.82 km/h,高峰測量時段的速度平均絕對誤差為3.69 km/h,平峰測量時段的速度平均絕對誤差為3.95 km/h,表現最優。

表8 不同數據源路段速度的平均絕對誤差Table 8 Average absolute error of road section speed in different data

圖8 各測量路段的不同數據速度波動曲線Fig.8 Different data speed fluctuation curve of each measurement road section

4 結 論

本文提出了一種基于數據可靠性的動態權值融合方法,將導航平臺路段速度數據和浮動車GPS速度數據進行了融合。以佛山市的高德路段速度數據和浮動車GPS 數據為例,對兩類數據進行空間和時間同步化處理,并針對高德路段速度數據和浮動車GPS 數據設計不同的可靠性評估算法。將實時更新的高德路段速度和GPS 路段速度基于數據可靠性指數進行加權平均得到了融合后最終的路段速度。驗證實驗表明:基于數據可靠性的動態權值融合方法有效地提高了實時更新數據的路網覆蓋率和數據準確度,不僅降低了單一數據源出現異常造成的誤差,同時避免了固定權值融合不考慮數據源質量簡單加權融合的弊端。

本文提出的方法雖然在導航平臺路段速度數據和浮動車GPS 速度數據融合中具有較好的應用效果,但由于不同類型數據源的特征不同,在后續的研究工作中,嘗試將該方法應用到其他類型數據源融合場景中。此外,還可以挖掘更多的速度數據特征,進一步優化數據融合算法,提高融合數據精度。

猜你喜歡
高德路網浮動
云南智慧高速路網綜合運營管控平臺建設實踐
電連接器柔性浮動工裝在機械壽命中的運用
論資本賬戶有限開放與人民幣匯率浮動管理
等車望眼欲穿高德新出的實時公交APP
秋日掠影
打著“飛的”去上班 城市空中交通路網還有多遠
CSS層疊樣式表浮動與清除浮動技術研究
活地圖
高德地圖車機版正式發布
圣人的告誡
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合