?

基于聚類客流特征分析
——以京滬高鐵為例

2024-04-15 09:49李輝玉
建材與裝飾 2024年11期
關鍵詞:發送量站臺客流

李輝玉

(西南交通大學,四川成都 610031)

0 引言

到2022 年底,京滬高鐵累計開行列車近12 萬列,日均發送旅客3.07 萬人次。然而,其他運輸方式也在積極調整營銷策略,以應對市場競爭。當運輸距離少于500km 時,公路運輸是一個主要的競爭者;而當運輸距離超過1000km 時,民航則成為主要的競爭對手[1]。這給京滬高鐵的運營管理部門帶來了新的挑戰。為了在激烈的市場競爭中獲得更大的市場份額,京滬高鐵需要深入研究市場需求,優化運輸資源配置,提高運輸效率并降低成本。因此,對沿線客流特征的分析和研究變得尤為重要,能為客運決策的制定提供數據支撐和理論參考。

1 概述

1.1 京滬高速線路

京滬高鐵沿線地區不僅是我國中西部地區經濟發展的龍頭,也是國際經濟競爭的前沿。京滬高鐵全長1318km,經過23 個城市,設有24 個車站,途經部分城市經濟規模和人口規模都非常龐大。北京的人口規模超過了2100 萬人,經濟規模超過了30000 億元;天津的人口規模超過了1500 萬人,經濟規模超過了16000 億元;上海的人口規模和經濟規模也都超過了2400 萬人和32000 億元。同時,這些城市也是我國旅游業的重要目的地之一,吸引著大量的游客和商務人士,為京滬高鐵提供了豐富的客流資源。

1.2 客流特征

自從2020 年開始,受新冠病毒感染影響,鐵路客流量受到較大沖擊。目前高鐵客運仍不穩定,因此本文以2019 年京滬線各站點發客數據為研究對象,更具通識性。

其中北京南2019 年發送量超3000 萬人次。而小站如定遠、丹陽北等的發送量不足50 萬人次??梢娋€車站發送量差異大。為研究客流規律,選取大站進行深入分析,不同大站的客流發送有顯著差異。北京南站在2 月和11 月有明顯下降,7—9 月較高。南京南站波動小,趨勢與北京南站相似。常州北站和定遠站波動幅度小,但定遠站在2 月發送量確有所增加。

綜上所述,不同車站間客流差異大,需深入考慮車站類型和實際情況。對京滬高鐵車站的分類研究有助于分析客流空間分布差異,并為其他線路的車站類型劃分和客流規律分析提供基礎。

2 模型構建

2.1 符號定義

符號定義如表1 所示。

表1 符號定義

2.2 車站客流特征

在車站客流特征的研究中,時間序列數據的處理至關重要。為了更深入地了解數據的內在機制,通常需要提取關鍵特征,如均值、方差等,以降低數據維度[2-3]。這些特征能夠準確描述時間序列的整體趨勢和發展方向。

(1)均值。衡量數據集中趨勢的重要指標,提供了數據的核心信息。

從均值推導可得出:上海虹橋、北京南等車站均值較大,這些車站的旅客發送量總量較大;均值較小的車站有定遠、丹陽北,這些車站的旅客發送量總量較小。

(2)標準差。標準差越小,說明數據點之間的差異越小,時間序列的波動幅度也越小,反之則越大。

從標準差推導可得出:上海虹橋、北京南、南京南、濟南西等車站標準差較大,這些車站的旅客發送量時間序列波動幅度較大;丹陽北和定遠等車站標準差較小,波動幅度也就較小。

(3)偏度。通過計算時間序列的偏度,可以了解該時間序列分布的對稱性,進一步分析其特性。

從偏度推導可得出:2019 年京滬線旅客發送量時間序列的偏度變化。從偏度的角度來看,偏度較大的車站有廊坊、滄州西等車站;偏度較小的車站有北京南。

(4)峰度。衡量數據分布尖銳程度的參數,用于描述時間序列中頻率曲線的形態。

從峰度推導可得出:定遠、丹陽北,這些車站的總體數據分布與正態分布相比更加陡峭,呈現出尖頂峰的形態;滄州西等車站更加平坦,呈現出平頂峰的形態。

(5)Hurst 指數。衡量時間序列數據的長期依賴性,決定趨勢的延續性。

從Hurst 指數推導可得出:曲阜東、北京南、丹陽北Hurst 指數較大,這些車站的時間序列持續性較強;Hurst指數較小的車站有宿州東,該車站的時間序列持續性較弱,未來數據點更可能出現大幅度波動或趨勢反轉。

2.3 車站所在的區位屬性

高鐵車站重在長途運輸,區位因素次要。但城市規模、經濟和人文影響客流。城市等級、站臺規模體現城市特點[4-5]。

北京南、濟南西、天津西、南京南、徐州東和上海虹橋等車站的站臺規模較大,旅客發送量也相應較高。在京滬線中,北京南、天津南、濟南西、天津西、徐州東、南京南、常州北、無錫東、蘇州北和上海虹橋等車站位于較高城市等級的城市。這些車站的旅客發送量較高。

綜上所述,為了更好分析京滬客流特征。文章在構建車站分類模型時,選擇均值、峰度、偏度、標準差、Hurst 指數、站臺規模和城市等級7 個關鍵指標。這些指標全面、可量化,并易于操作。它們直觀反映車站特性和差異性,提高分類準確性。根據決策需求可調整和優化這些指標,為車站運營提供參考。

2.4 聚類變量標準化

當聚類變量量級差異大時,標準化處理尤為重要。本文使用Z-score 標準化將所有變量轉為同一量級,確保所有變量在聚類中發揮同等作用。其標準化處理公式如下:

3 聚類處理

3.1 聚類數值標準化

3.1.1 客流特征標準化

客流特征經過Z-score 標準化處理以后,可得到客流特征數值,如表2 所示。

表2 標準化后車站客流特征數據

3.1.2 站臺規模和城市等級標準化

將站臺規模按到發線取值進行處理,車站所在城市等級則按照城市所屬等級對應數值(7~1)從大到小取值進行處理。通過Z-score 標準化后的車站所在地區位屬性數值如表3 所示。

表3 車站所在地區位屬性數據

3.2 聚類結果分析

結合前小節Z-score 標準化后的數值經過Python處理分析,可將京滬沿線車站聚為如下4 類。

第1 類:北京南、上海虹橋;這兩座車站都是特大型鐵路樞紐,連接了多個方向的高鐵線路。它們在地理位置上靠近大都市,因此吸引了大量旅客。

第2 類:天津西、濟南西、徐州東、南京南;這些車站都是連接京滬高鐵的重要節點,其中天津西和濟南西是華北地區的重要樞紐,徐州東和南京南則是連接華東和中南地區的重要站點。

第3 類:常州北、蘇州北、無錫東、天津南、曲阜東、蚌埠南、德州東、昆山南、廊坊、滄州西、滁州、鎮江南、宿州東、棗莊、泰安和滕州東;這一類車站覆蓋了多個城市和地區,其中部分車站如常州北、蘇州北等是當地的重要樞紐,而其他車站則起到了連接周邊城市的作用。

第4 類:定遠、丹陽北;這兩座車站較小,客流量會受到一定限制。

通過進一步優化可得到客流特征時間序列指標,如表4 所示。通過對比各類車站的指標值,可以發現不同類型車站之間的差異和特點,具體如下。

表4 時間序列指標

第1 類車站具有高均值旅客發送量,顯示出較大的運輸能力。其時間序列波動大,可能受季節性因素影響。站臺規模大,適合大客流。所在城市等級高,交通需求和運輸需求大。

第2 類車站發送量均值較高,具有一定運輸能力。波動幅度大,但數據相對對稱。站臺規模大,城市等級高,有一定交通需求。

第3 類車站發送量均值適中,波動幅度適中,數據分布正常。所在城市經濟發展和交通需求中等。

第4 類車站發送量均值最低,運輸能力弱。數據偏斜,有尖銳數據點。站臺規模小,可能無法滿足大客流需求。

4 結語

本文對京滬線各站點的客流特征進行了深入研究,發現各車站旅客發送量存在顯著差異。采用聚類分析對車站進行分類,并基于關鍵屬性指標進行定量分析。結果顯示,車站可分為四類,每類車站客流特征不同。本文還分析了站臺規模和城市等級等車站特點。研究結果對乘客和運輸企業具有參考價值,有助于優化資源配置和提高運輸效率。

猜你喜歡
發送量站臺客流
客流增多
尋找93/4站臺
為黑惡勢力站臺撐腰的縣委常委
云南:鐵路客流持續回暖 單日旅客發送量連續超20萬
人生的站臺
八號站臺的那只狗
春運來了
春運40天發送量將達29.1億人次
基于自學習補償的室內定位及在客流分析中的應用
人工免疫算法在電梯客流時段劃分的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合