?

基于潛在類別模型的城際高速鐵路客運市場細分

2021-08-02 08:02蘇煥銀陶文聰彭舒婷曾瓊芳
鐵道科學與工程學報 2021年6期
關鍵詞:城際細分高速鐵路

蘇煥銀,陶文聰,彭舒婷,曾瓊芳

(1.五邑大學 軌道交通學院,廣東 江門529020;2.湖南工商大學 旅游管理學院,湖南 長沙410075)

鐵路運輸企業為了提高經濟收益,通常依據旅客需求特征將客運市場劃分為若干類別。目前鐵路客運市場細分研究主要集中在中長距離的普通鐵路或者高速鐵路,缺少針對城際高速鐵路客運市場細分的研究。城際高速鐵路是指位于人口稠密的都市圈或城市群的高速鐵路客運專線,例如,京津城際高鐵、滬寧城際鐵路和廣珠城際等,主要特點是線路距離較短、列車班次公交化運行以及設計速度不低于250 km/h。這些線路上的旅客出行距離較短,往返出行頻繁且周期較短,一天內不同出發時段的客流具有明顯的高峰低谷現象,這導致了城際高速鐵路服務的旅客群體和中長距離的鐵路旅客群體相比具有明顯的特征差異性。早期的鐵路客運市場細分研究多采用聚類分析方法,該方法存在一些不足,如任意給定初始的聚類中心、分類結果不穩定、難以分析某個屬性的貢獻率等。因此,一些學者[1?3]設計了改進的聚類分析方法,但分類計算過程較為復雜。隨著市場細分方法研究的深入,一種基于統計學原理的潛在類別模型被學者們應用于交通領域的研究,它在處理分類變量時可取得相對穩定的分類效果[4]。HETRAKUL等[5?6]通過互聯網購票數據獲取鐵路旅客相關數據,發現潛在類別模型能夠很好剖析旅客出行異質性特征。ELDEEB等[7]采用潛在類別模型對受訪旅客進行高鐵運輸服務質量的市場細分研究。DUAN等[8]基于受訪者的成本、時間、頻率、可靠性和安全性這5個鐵路服務屬性數據進行市場細分,發現采用潛在類別模型進行市場細分比傳統的市場細分方法更可信可靠。喬珂等[9]基于京滬高速鐵路的歷史售票數據,采用潛在類別模型將旅客市場細分為3類,分類正確率達到93%。段力偉等[10]將潛在類別模型應用于鐵路貨運市場細分的研究。劉建榮等[11-12]考慮公路出行者的行為異質性,采用潛在類別模型對問卷調查獲取的數據進行公路旅客類別的劃分,最終劃分的類別具有明顯的差異性。另外,顧兆軍等[13]基于航空訂票歷史數據,采用潛在類別模型對航空旅客進行市場細分,驗證了該分類方法可行性,且在該領域還具有較多的應用[14-15]。因此,潛在類別模型在客運市場細分的研究中能夠取得相對穩定的分類效果,較好地分析旅客特征。綜上所述,本文基于潛在類別模型研究城際高速鐵路的客運市場細分問題。首先以廣珠城際高速鐵路為例,進行旅客問卷調查,獲取城際高速鐵路旅客的個人屬性和出行屬性相關數據。在此基礎上,確定潛在類別模型的外顯變量及模型結構,采用Latent Gold 5.0軟件對模型進行適配性檢驗,估計模型參數。根據模型估計結果,對廣珠城際高速鐵路客運市場進行細分,分析各類旅客群體的特征。

1 城際高速鐵路旅客數據獲取

廣珠城際鐵路位于中國粵港澳大灣區,全長143 km,20個車站,設計速度250 km/h。本文以廣珠城際高速鐵路旅客為調研對象,采取網絡調查方法,有針對性地在廣州、珠海、中山等城市發放問卷,在2020年3月期間展開調研,包含了工作日和休息日。問卷調查包含旅客的個人屬性和出行屬性,對于樣本數量過少的組合進行了合并和剔除處理,并采用效度分析方法對樣本進行了篩選,獲得有效問卷數1 715份,具體見表1(由于篇幅限制,只展示分類所用到的變量相關信息)。

根據表1可知,在旅客的年齡段主要分布在18~40歲之間,學歷主要以大專和本科為主,稅前月收入主要以中低等收入為主。一年的出行次數多在2次以上,出行目的以商務工作和旅游休閑為主,出行費用主要是自費。

表1 調查數據統計Table 1 Survey data statistics

2 潛在類別模型設計

2.1 外顯變量的選取

構建潛在類別模型的第1步是進行外顯變量的選取,外顯變量即為影響類別劃分的相關影響因素。本文通過問卷調查獲取外顯變量的相關數據,經過多次分類對比試驗,剔除使得分類效果較差的外顯變量,最終選定性別、年齡段、學歷、稅前月收入、出行平均次數、出行目的、出行費用這7個因素作為廣珠城際鐵路客運市場細分的外顯變量。

上述7個外顯變量分別記為W1,W2,…,W7,對應的取值見表1。每位旅客的外顯變量取值就代表了每位旅客的特征。那么,潛在類別模型的數據輸入形式如表2所示。

表2 輸入數據的形式Table 2 Form of input data

2.2 模型建立

潛在類別模型的基本原理是將類別變量對應的概率轉化成模型對應的參數,其中類別變量包括潛在變量和外顯變量,潛在變量記為X。因此模型中也包含2種概率的估計,即潛在類別概率和條件概率。依據潛在類別概率和條件概率,計算給定外顯變量取值情況下旅客歸屬每個潛在類別的概率,進而判斷旅客所在的潛在類別。

潛在類別概率表示旅客屬于第X個潛在類別的概率,也可以理解為第X個潛在類別中的旅客占全體旅客的比例,記為P(X),其中X=1,2,…,T,T為潛在類別總數。顯然,各個潛在類別概率的總和為1,即

條件概率表示旅客屬于某個潛在類別的條件下,外顯變量取值對應的概率。那么,外顯變量Wi的條件概率表示為P(Wi/X),i=1,2,…,7。由于外顯變量的不同取值相互獨立,因此外顯變量對應的條件概率總和均為1,即

其中Fi表示外顯變量Wi的最大水平取值,具體見表1,如F1=2,F2=5。

不同外顯變量之間滿足相互獨立的條件,因此滿足式(3)。

在完成上述的概率參數化估計后,可以采用潛在變量X解釋外顯變量Wi,i=1,2,…,7之間的關系。那么,潛在類別模型表示如下:

其中,P(W1,W2,W3,W4,W5,W6,W7)表示外顯變量的聯合概率。

應用上述潛在類別模型對旅客進行分類,將所有旅客分配到適當的潛在類別當中去。對于給定的旅客外顯變量取值,利用貝葉斯公式,可以計算該旅客歸屬潛在類別X的概率,表示如下:

其中,P(X/W1,W2,W3,W4,W5,W6,W7)表示旅客屬于某個潛在類別的后驗概率。

那么,判定該旅客屬于概率最大的潛在類別,記為X?,表示如下:

3 模型適配性檢驗及參數估計

3.1 模型適配性檢驗

本文借助Latent Gold 5.0軟件進行模型適配性檢驗以及參數估計。模型適配性檢驗采用常用的5個評價指標[4],分別是AIC值,BIC值,Pearsonχ2,G2和P值(檢驗卡方統計量是否顯著)。檢驗原理:如果AIC值,BIC值,Pearsonχ2和G2越小,P值小于或等于0.05,說明觀測數據與模型的適配程度越高。模型適配性檢驗結果如表3所示,分析如下:

表3 模型適配性檢驗Table 3 Suitability test of model

AIC值不斷變小,從第4個潛在類別開始,相鄰2個潛在類別差值已經很小了。

BIC值不斷變小,而且在潛在類別個數為4時達到最小。

Pearsonχ2不斷變小,而且在潛在類別個數為4時達到最小。

G2不斷變小,而且相鄰2個潛在類別差值越來越小。

卡方統計量在6個潛在類別中均顯著,P值均小于0.05。

樣本數超過1 000,因此以BIC值作為重點參考評價指標。綜上分析,選擇潛在類別個數為4的模型進行參數估計。

3.2 模型參數估計

潛在類別模型的參數估計主要采用極大似然法,在迭代過程中的算法常用期望最大化法,它具有不受初始值選擇影響的穩健性[4]。本文采用極大似然法估計參數,結果見表4。

表4 模型參數估計結果Table 4 Parameter estimation results of model

由表4可知,第1類旅客的潛在類別概率最高,概率值為0.454 4;其次是第2類和第3類旅客,分別為0.242 2和0.211 4;第4類旅客潛在類別概率最小,為0.092 0。

3.3 分類計算

根據表4的模型參數,利用式(5)和式(6),對樣本中的所有旅客進行分類計算,得到實際分配后各類別的比例,如表5所示。根據表5,各類相對誤差(絕對值)均小于5%,且前3類占整體樣本比例的90%以上,這部分的相對誤差在2.1%以下,說明潛在類別模型可以較好的對城際高速鐵路旅客進行分類。

表5 分類結果及相對誤差計算Table 5 Classification results and relative error calculation

4 城際高速鐵路旅客市場細分結果

4.1 旅客市場細分結果分析

根據第3部分的模型參數,對城際高速鐵路旅客市場細分情況進行分析,主要分析每個潛在類別的旅客群體的特征和出行選擇偏好。圖1直觀地展示了7個外顯變量對應每個潛在類別的條件概率,即給定潛在類別的條件下,每個外顯變量在相應水平取值的比例。

根據表4和圖1,每個潛在類別的旅客群體具有明顯的差異特征,具體如下:

圖1 各類型旅客特征分析Fig.1 Analysis of the characteristics of each type of passengers

第1類旅客,男性比例較高,年齡主要分布在26~40歲之間,學歷較高,稅前月收入較高,出行頻率最高,公費出行,以商務出行為主要出行目的。

第2類旅客,女性比例偏高,年齡主要在18~25之間、26~30之間和31~40之間,學歷較高,稅前月收入稍高,出行頻率僅次于第1類旅客,自費出行,以旅游休閑和探親訪友為主要出行目的。

第3類旅客,女性比例偏高,年齡主要在18~25歲之間,學歷較高,稅前月收入最低,出行頻率較低,自費出行,以旅游休閑和求學為主要出行目的。

第4類旅客,女性比例偏高,年齡主要在31~60之間,學歷較低,稅前月收入較低,出行頻率最低,自費出行,以旅游休閑和探親訪友為主要出行目的。

根據上述分析可知,第1類和第2類旅客屬于追求出行品質的高端型旅客,第1類旅客一般對出行時間的可靠性和出行過程的便捷性具有較高要求,第2類旅客通常對出行過程的服務質量和配套設置具有較高要求。第3類和第4類旅客屬于追求經濟效益的低端型旅客,相比于服務質量,更關注票價的合理性。

4.2 旅客市場細分橫向對比分析

根據分類計算的結果,進一步進行旅客市場細分橫向對比分析,各類型旅客特征橫向對比分析見圖2。

根據圖2可知,第1類和第2類旅客有著相似的特征,平均年齡段處在較高的水平,平均稅前月收入較高,平均出行次數較多,不同的是第1類旅客以公費出行和商務型出行為主,而第2類旅客以自費出行和休閑型出行為主。第3類和第4類旅客的平均稅前月收入較低,以自費出行為主,以休閑型出行為主,不同的是它們對應的平均年齡段分別處在最低和最高的水平。

圖2 各類型旅客特征橫向對比分析Fig.2 Transverse comparative analysis of the characteristics of all types of passengers

依據各類型旅客的特征,鐵路部門可以有針對性地設計滿足不同旅客需求特征的客運服務產品。例如,對于第1類旅客,可以提供一些直達或者少停站的快速列車,提供VIP上車通道等;對于第2類旅客,可以提供行李搬運、優先選座、車上飲食等服務;對于第3類旅客和第4類旅客,在旅客出行淡季提供折扣票,吸引這類旅客的出行。

5 結論

1)分類計算的相對誤差小于5%,且90%以上的旅客分類相對誤差小于2.1%,說明模型設計的合理性。

2)基于潛在類別模型可將廣珠城際高速鐵路旅客分為4類,概率分別為45.44%,24.22%,21.14%和9.20%。第1類和第2類旅客屬于追求出行品質的高端型旅客,第3類和第4類旅客屬于追求經濟效益的低端型旅客。

3)根據每類旅客群體特征的差異性,鐵路運輸企業可設計相關的運輸產品以及市場營銷策略,提高運輸企業的經濟收入以及旅客滿意度。

猜你喜歡
城際細分高速鐵路
城際列車
市政道路下穿高速鐵路技術簡述及應用
預制膠拼架橋法在高速鐵路工程中的實踐
濟南市氫能城際公交車示范運行切入點分析
深耕環保細分領域,維爾利為環保注入新動力
城際新造動車組應答器信息丟失問題分析
萬科城際之光售樓部
高速鐵路機車車輛關鍵技術解析
1~7月,我國貨車各細分市場均有增長
高速鐵路明確僅運行動車
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合