?

基于移動大數據的城市深夜公交線路改進方案

2018-04-19 07:37李貞鎬
計算機工程 2018年4期
關鍵詞:公交線公交站公交線路

李貞鎬,

(清華大學 電子工程系,北京 100084)

0 概述

隨著大城市全球化進程的加快和地域時差的影響,需要深夜工作的人數持續增加。特別是對于世界經濟同步增長的大城市來講,為保障夜間出行人群使用大眾交通工具的需求,開設深夜公交線路顯得尤為重要。當前,中國的大城市大都設有深夜公交路線,但普遍存在運營效率低、運輸成本高、涵蓋范圍不夠等諸多問題[1]。隨著大城市人口不斷增加,利用建設衛星城疏導人群是一種趨勢。以上海為例,設有松江、嘉定、安亭、金山衛和吳淞等衛星城,但連接這些衛星城的深夜公交線路卻非常缺乏。

近年來,計算機技術迅猛發展,特別是以智能終端和社交媒體為代表的各種信息渠道的出現和信息的生產、流通、保有量的持續增長,大數據的概念越來越受到人們的重視[2]。

因為大數據中存在大量的無效信息,所以從中篩選出有用的信息非常重要??梢暬鳛榇髷祿治鲋凶钪匾h節之一,其目的就是大數據分析結果可以通過視覺上容易理解的方式表達和傳遞[3]??梢暬鳛榇髷祿刑崛∮袃r值信息的核心技術,是大數據處理過程中必不可少的環節。而且,隨著大數據處理和分析技術的發展,對既有大眾交通線網進行有效的評價及優化,促進城市交通智能化管理健康發展。

大多數公交線路評價方法選取重復度為評價指標,但該方法在計算過程中對評價區間距離的定義不明確,而且,根據被選為評價基準的線路不同,其評價結果之間具有巨大的差異[4]??紤]區域均衡性的公交線路評價模型,目的是為了達到整個公交系統的均衡分布,確保公交線網較高的覆蓋程度,適合以城市整體公交線網的評估[5]。

本文在上海市深夜公交線網優化的基礎上,利用可視化分析軟件,結合區域間均衡性模型方法和Dijkstra模型,研究基于移動數據及出租車移動數據的城市深夜公交線網評價及優化系統,分析上海既有深夜公交線網的問題并提出改進方案,為設計更高效的深夜公共交通線路提供有效的依據。

1 研究現狀

公交線路的重復度是指在大眾交通工具的運營中更有效的管理公交線路,即乘客使用起來更為便利的角度指定的評價指標,表示公交線路在特定區域或區間內的集中程度的指標。公交線路的過度重復會影響公交運營的效率,還會影響乘客選擇乘坐路線[6]。

大多數公交線路的重復度評價方法是依據特定線路的區間長度,選取該區間內運營多少公交線路為判斷指標,但這種方法在計算過程中具有一定的問題[7]。

首先,對評價區間距離的定義不明確。有的是計算整個線路的重復度,有的則是分成n個小區間進行計算。這2種方法的結果存在一定的差異,區間距離越小,重復線路越多,重復度指標也隨即偏高。其次,根據被選為公交路線評價對比基準的線路不同,重復度評價結果也不同??偟貋碚f,考慮到該方法不能徹底解決公交線路重復度評價中的問題,因此,本文研究選取考慮區域均衡性的公交線路評價模型。

2 上海深夜交通現況分析及優化設計

2.1 深夜移動需求數據的獲取

在本文研究中,使用的數據集為上海移動網絡供應商提供的2014年8月1日—31日的數據統計。數據集是針對全市設置的各個基站每10 min的數據量與對應的基站接收數據次數組成的三維矩陣?;镜臄祿偣舶?0億條,總容量為8 GB,數據集容量雖然很龐大,但其信息的來源具有很高的可靠性。

深夜公交移動需求量分析中使用的數據信息主要包括3種:

1)上海市主要移動網絡供應商用戶的追蹤數據集,每一個數據項記錄用戶名,每一次手機業務的開始和結束的時間、連接的基站編號以及消耗的流量等,數據集有超過19.6億條記錄,覆蓋38萬個基站。

2)上海出租車運營公司提供的數據集,記錄了上海市1.3萬輛出租車的移動軌跡數據,采用經緯度標示,時間跨度為1個月(2014年8月1日—31日),時間精度為1 min。

3)上海市地圖,由百度地圖下載,處理數據中選用精度為200 m。

2.2 考慮區域均衡性的公交線路評價模型

本文對既有深夜公交線路進行評價時,主要考慮了線路的重復性和覆蓋程度,選用深夜公交線路的區域分布均勻程度為評價指標。在評價時,通過每個區域人口對比該區域深夜公交線路數量比值的差異,分析了深夜公交線路的區域均衡程度。

為了更好地觀察移動需求量的變化,本文以移動數據的變化量代替移動數據量。并且根據實際測量,經過某一地區的公交線路周圍移動數據變化量除以該地區移動人口數量的結果,作為公交線路均衡性的判定指標[8]。

A=∑Dt+1-Dt/S

U=A/B

(1)

其中,A為按時間測定的區域內平均移動數據變化量,D為按時間測定的移動數據量,t為時間(每隔10 min),S為區域面積,U為某一地區的公交線路分布均勻程度,B為人口。

單個公交線路的重復度Ri=1.0表示該公交線路從起點到終點的整個路段只有這一條線路,線路重復次數越多,重復度Ri的數值也相應提升,該值還可以作為公交線路之間相互影響的指標[9]。

(2)

其中,ni,b為從區域i到區域b的公交線路數量,nb,i為從區域b到區域i的公交線路數量,Ntotal為城市所有公交數量。

2.3 基于移動需求量的公交線路評價模型

假設乘客深夜利用公交出行時,一般離最近公交站的移動距離不會超過1 km。對應每個公交站的移動需求量是通過以該公交站的坐標為中心、半徑為1 km的范圍內,所有基站接收的數據量之和除于以該范圍內的所有公交站數量(包括圓心處的公交站),具體指標為[10]:

(3)

其中,St=n為每個公交站的移動需求量,Dr=1為1 km范圍內所有基站接收的數據量之和,Sn為1 km范圍內所有公交站數量。

每個公交線路的移動需求量是通過上述方法獲取的公交站移動需求量選取該路線經過的公交站進行整合后,除以該路線的公交站數量[11]。

(4)

其中,Lt=n為深夜公交線路的移動需求量,St=m為每個公交站的移動需求量,Sn為深夜公交線路上的公交站數量。

通過以上2個指標就可以綜合地判斷公交線路的合理性。St-n和Lt-n數據越大,說明該公交站和公交線的利用率很高,反過來,如果St-n和Lt-n數據很低,甚至達到0,則說明該公交站選址和公交路線的選線都存在問題,需要進行優化。

2.4 基于Dijkstra算法的公交線網優化模型

公交線路一般要求運輸能力高,要注重提高效率。優化算法中通??紤]路徑、通行量、換乘、道路、車輛、效益、政策等諸多因素[12]。由于本文研究的優化對象為深夜運營的公交線網,因此只考慮了線路通行量和路徑長度2個因素,算法采用了Dijkstra模型。

G=(V,E,R,WT,WL)

(5)

其中,G為有向賦權圖,V為網絡上所有節點即公交站點的集合,E為有向圖中所有邊的集合,R為有向圖中所有頂點的集合,WT為節點的非負權值集合,WL為節點的非負權值集合,表示在相應線路的線路長度權值。

在Dijkstra算法中,頂點集本文選取了地圖中所有的道路交叉點和線路方向變化的轉折點,以及根據前面分析模塊中得到的移動需求量大的296個新增公交站點。邊集則是根據百度地圖中顯示的實際路況而建立的拓撲關系。

3 實驗結果與分析

3.1 深夜公交需求量現況分析

目前,上海深夜可利用的交通工具是公交和出租車2種。上海有39條深夜公交線路。平均運營時間及配車時間范圍為11∶40—04∶10,經過的車站數量為800多個。線路平均行駛距離為20 km左右,最長線路的長度約為25 km,其中,21%的線路把火車站或者機場設為起始站和終點站。還有大部分的線路的出發點也都在這2個地點的附近。所以,可以看出深夜公交主要是充當著運送來往上海和其他城市之間人群的功能。為了更好地體現分析結果,本文把深夜移動需求量和既有深夜公交線路進行了疊加,并通過將信息放在地圖上展現結果。

如圖1所示,離市中心較遠的A、B、D 3個區有非常大的深夜移動需求,但是卻沒有公交線路覆蓋。既有的公交線路僅覆蓋城市的核心地區。另外,C區雖然距離市中心只有10多公里,移動需求量也很大,但公交線路基本沒有覆蓋該地區。

圖1 上海深夜移動需求量和既有深夜公交線路

此外,本文研究還對深夜出租車的統計數據進行了分析,從圖2可以看出,出租車的分布與移動需求之間也存在很大差異,有大量出租車移動數據量的區域公交線路分布不夠。這從另一個方面也說明了優化設計公交線路的重要性和緊迫性。

圖2 上海深夜出租車移動數據和既有深夜公交線路

3.2 深夜公交區域分布現況分析

為了能夠最大限度地進行均勻分配可用資源,本文研究將評價上海各區域內線路的重復度。

目前,深夜運營的公交線路所經過的行政區域數量共計12個(上海是分成17個行政區域),根據數據變化量,把該12個行政區域合并為7個研究區域,如圖3所示,并對每個研究區域內的公交線路密度進行評價。

圖3 上海深夜公交線路區域分布

根據表1所示結果顯示,利用每個研究區域內的有移動需求的總量對該區域面積做平均,可以看到,該平均值在3、4、5這3個區域明顯高于其他區域,這與現在的公交線路分布的密度是相互對應的。但是,從移動需求總量來看,區域6和區域1的移動需求量分別為43和50,很顯然具有更大的移動需求。這表明線路的密度與移動需求存在不匹配的地方,而且相關公交線路能夠連接的地區也不夠。

表1 研究區域公交線路密度評價結果

3.3 根據公交站移動需求量的公交線路評價

對各線路的車站周圍的數據量進行分析,求出各車站及路線周邊的數據變化量。對所有公交線路的公交站移動需求量進行了細致的分析。

以一個月的時間跨度,對全部39條公交的往返線路的每個公交站的移動需求量進行了統計,圖4為該數據的分布。結果顯示,799個公交站中大量的公交站的一個月的移動需求量并不大,其中,有42個站一個月內的總移動需求是0。只有少數線路有較大的需求量,很顯然,說明公交站的設計總體上存在較大的問題。

圖4 各路線的公交站移動需求量

另外,還對39條公交的往返線路移動需求量進行了分析,如圖5所示,很容易發現整個39條線路的移動需求量分布不均勻,顯現出較大的非均衡性,甚至有些公交線路的移動需求量非常低。39條線路的移動需求量的均值為33 502,而方差達到了31 305,說明在公交線路的規劃上存有較大的優化空間。

圖5 各路線周邊的公交站數據變化量

3.4 深夜公交線網及線路的設計

在優化公交線網時,為了能夠最大限度地覆蓋所有上海市深夜移動需求量高的站點,從所有站點中選取移動需求量最高的2 000個公交站點,其中包括既有站點和新增站點。另外,還考慮了出租車數據量高的地區,相應地調整了其中一部分公交站點。

考慮到公交線路需要覆蓋城市大部分區域,即使有些區域相互之間移動需求量很低,也要把這些區域連接起來[13]。優化結果顯示,新的深夜公交線網(見圖6)基本覆蓋了所有的深夜移動需求量和出租車移動數據量高的地方,而且新的公交線路(見圖7)比起既有的深夜公交線路更能滿足上海市深夜出行的需求。

圖6 新的深夜公交線網

圖7 新的深夜公交線路

在Dijkstra模型中計算線路權重時,主要考慮了通行量和路徑長度。為了讓公交線路更多地覆蓋移動需求量高的節點,在計算過程中,2個節點之間的權重不僅和它們之間的距離有關,而且和路徑上的公交站移動需求量信息有關[14]。在利用Dijkstra模型時,不能直接處理節點帶有權值的有向圖的路徑搜索,而需要將2個節點的移動需求量的總和按一定的比值融合到兩點間的距離中,這樣就能將該模型簡化成最短路徑算法[15]。

4 結束語

本文建立的評價模型為考慮區域均衡性的深夜公交線路評價模型,目的是為了達到整個深夜公交系統的均衡分布,確保深夜公交線網的覆蓋程度。在評價過程中,選擇整個城市的深夜公交線網為研究對象,根據上海主要移動網絡供應商提供的移動數據,將上海12個行政區域分成7個研究區域,分析深夜公交線路的重復率與覆蓋程度。該評價的重點主要放在深夜公交線路的分布上,具體路線選擇及換乘等因素沒有考慮。另外,在本次研究中引入了大數據,利用上海市移動供應商和出租車公司提供的乘客移動信息,經過篩選與整合之后,選用可視化工具對上海市深夜移動需求量分析結果進行了可視化顯示,結果發現,與考慮區域均衡性的深夜公交線路評價結果有一些出入,說明了既有深夜公交線路的不合理性。

公交路線的分布狀況與該區域的乘客及道路環境也有密切的關系。本文利用Dijkstra模型對既有深夜公交線路優化時,只考慮了2個公交站之間的移動需求量。因為公交屬于大眾交通工具,即使是人口稀少的區域也要實現與其他區域之間的交通連接。所以,要根據評價分析結果進行增加公交站點或延長公交路線時,需要進行相應的調整。本文研究評價及優化方法與去除既有不合理公交線路方法相比,更適合于增加公交線路的方案。

[1] HAN J H.BTRNDP investigation of the bus route network[J].Journal of the Korean Traffic Society,2005,23(8):19-29.

[2] OH J H.Big data visualization and visualization process[D].[S.1]:Korean Journal of Multimedia Institute,2014.

[3] YOO J U.The visualization of big data[D].[S.1.]:South Korea Consulting Association,2011.

[4] CH I M.Study on the location of a bus station considering bus routes[D].Philadelphia,USA:University of Pennsylvania,2007.

[5] HONG Z X.Research on route design[D].Gwangju,Korean:University of Kwangju,2006.

[6] 袁長偉,吳群琪,袁華智,等.考慮軌道交通作用效應的城市公交線網優化方法[J].公路交通科技,2014,31(8):119-125.

[7] 費 騰,張立毅,陳 雷.混合Levy變異與混沌變異的改進人工魚群算法[J].計算機工程,2016,42(7):146-152,158.

[8] 馮正勇.衰落信道數據包傳輸跨層優化模型改進[J].計算機工程,2016,42(11):125-130.

[9] 蔡 彪,庹先國,桑 強,等.復雜網絡中基于三角環吸引子的社區檢測[J].計算機工程,2016,42(9):197-201.

[10] 沈記全,孔祥君.基于改進蟻群優化算法的QoS區間數服務組合方法[J].計算機工程,2016,42(7):181-188,193.

[11] 程憲寶.基于改進簡化粒子群優化的多目標跟蹤算法[J].計算機工程,2016,42(8):282-288.

[12] 楊興地.中小城市常規公交線網優化方法研究[J].交通信息與安全,2013,31(5):55-61.

[13] 李淑慶.重慶市主城區公交線網優化標準研究[J].交通信息與安全,2010(5):43-45.

[14] 史葦杭,林 楠.一種聯合的時序數據特征序列分類學習算法[J].計算機工程,2016,42(6):196-200,207.

[15] 郭羽含,楊曉翠.綠色供應鏈網絡構建的雙階段綜合優化方法[J].計算機工程,2016,42(10):192-200.

猜你喜歡
公交線公交站公交線路
優化公交線網布局,帶動城市經濟發展
改進遺傳算法的公交線網優化研究
長沙“智能公交站牌”上線
公交線網及發車頻率同步優化研究
交通與港航(2018年2期)2018-04-25
大笨狗酷比多
——沒有車的公交站
基于GIS的公交路線優化設計
基于GIS的公交路線優化設計
夜歸
最美公交線路上的“最美司機”
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合