?

基于WiFi定位的智慧景區游客行為研究
——以黃山風景名勝區為例

2018-07-14 06:26黃蔚欣吳明柏黨安榮
中國園林 2018年3期
關鍵詞:索道游覽客流

黃蔚欣 張 宇 吳明柏 黨安榮

隨著互聯網技術的快速發展,手機等智能終端設備得到普及,促使我們進入了大數據時代。2017年上半年中國手機上網用戶突破11億,人們使用手機的過程中形成了豐富多維數據,特別是其中的包含時空位置信息的定位數據為研究人的活動軌跡提供了可能性。環境行為學致力于研究人在空間里的行為規律,傳統調研方法是基于觀察、問卷、訪談、拍照等方式實地記錄客流行為規律[1-2],效率低下且無法記錄大規模和復雜的人員活動。手機定位數據包含客流的軌跡信息,為研究人的空間行為規律提供了全新的途徑。在城鄉規劃設計領域,目前已廣泛應用海量定位數據分析城市尺度[3-4]及建筑尺度[5]的空間行為規律。

“十二五”來,我國旅游產業和假日經濟發展迅速[6],同時,公眾假期帶來的景區客流擁堵與出行體驗下降,是困擾公眾和景區管理者的重要問題。智慧景區的規劃與建設旨在促進景區的精明規劃、精細管理與精準服務[7],智慧黃山景區是我國智慧景區規劃與建設的樣板。本文將以智慧黃山景區為例,基于WiFi的時空行為研究方法進行景區客流研究,旨在為智慧景區規劃和管理探索新的途徑;并對智慧黃山風景在春節與平時的客流進行對比,對客流特征受長假的影響進行挖掘。

景區由景點和游覽路徑組成,人員從一個景點到達下一個景點一般只能按照已有的路徑行進,因而人員活動的區域可以簡化為由景點、景點之間的連線組成的拓撲網絡。目前有關景區客流軌跡的研究并不多見,而通過對景區軌跡數據的分析可以幫助景觀規劃師更全面地認知人在景區的行為規律,為景區規劃提供客觀依據;同時也為管理者提供決策依據,對于提升景區的游覽體驗、空間品質有重要意義。

1 游客行為軌跡研究方法

人員定位數據的收集有多種定位方式,常用的如GPS定位、RFID定位、藍牙定位以及本文使用的WiFi定位。GPS定位技術覆蓋范圍廣但精度略低[8],通常適用于城市尺度上的客流軌跡分析;RFID定位技術需要人們佩戴特定的設備才能收集到軌跡數據[9-10],適用于小規模人群精確的軌跡行為分析;藍牙定位技術雖然定位精度高,但覆蓋范圍有限,且同時能夠抓取到的手機數據量有限[11]。黃山景區面積約1 200km2,高峰期客流量逾4萬,不適合用藍牙、RFID獲取人員定位數據;GPS定位技術精度雖然滿足要求,但是需要游覽者主動上傳數據供分析,因此無法通過調研的方式獲得大量具有統計意義的數據,特別是對于景區這樣有著復雜交通流線的情況來說更是如此。WiFi定位技術有著合適的定位精確度和覆蓋范圍[12],前期的試驗表明WiFi定位具有出色的設備抓取能力,相較而言更適用于景區的客流軌跡數據采集與研究。

軌跡數據指的是人員在一定時期內的各個時刻的空間位置組合而成的數據,主要具有時空序列性、異頻采樣性及噪聲混雜性3個特征[13]。時空序列性是軌跡數據的基本特征,軌跡數據里蘊含了對象的時空動態信息。異頻采樣性指的是數據的不連續性,設備并不能實時抓取移動設備信息并記錄下來,而是間隔一定的時間周期記錄采樣。噪聲混雜性指的是軌跡數據包含連續軌跡離散化、定位精度、其他設備干擾等產生的大量數據噪聲。

對軌跡數據聚類是普遍采用的客流軌跡研究方法之一,軌跡數據聚類的一大關鍵是如何衡量不同軌跡之間的相似度,主要有以下幾種方法[13]:嚴格按照時間維度將軌跡點一一對應計算其歐式距離[14];不要求時間維度一一對應,只考慮軌跡點的時間先后順序和時間間隔[15];只按照時間順序記錄軌跡并將某一段時空的軌跡用一個時空點代表?;谝陨戏椒ǖ玫杰壽E和軌跡之間距離的度量標準,再用機器學習里常用的KNN、DBSCAN等聚類方法挖掘軌跡數據里的信息。

在本文的研究中,首先在黃山景區主要景點布設WiFi定位設備,采集客流在黃山景區主要景點的定位數據,然后對數據進行脫敏、清洗、缺失值處理;進而按照游覽天數和游覽時間劃分軌跡數據并對比行為差異,最后用頻繁項集挖掘、軌跡聚類的方法研究智慧黃山景區客流軌跡規律,揭示游客行為特征。

2 數據采集與清洗

2.1 WiFi定位設備布點

根據智慧黃山景區的景點資源空間分布及信息基礎設施布局特征,在黃山景區內的主要景點、3條索道上下站以及新國線換乘中心等14個地點布置了共20個用于定位的WiFi接入點。2017年1月19日—2月16日29天里一共收集了約7 800萬條定位數據,記錄了數據采集的時間、設備的位置和MAC地址以及信號強度等信息。然后對采集到的數據進行脫敏處理,對移動設備的MAC地址進行加密,從而避免數據涉及個人隱私的問題。

2.2 定位數據質量分析

布設在智慧黃山景區的20個定位WiFi接入點所采集的數據既具有很高的相關性,又表現出一定的差異性。當然,也需要說明:本次采集到的定位數據存在一定系統性的缺失(圖1)。

圖1 各設備逐日接收數據量變化曲線(吳明柏繪)

圖2 游客在黃山智慧景區游覽的天數分布(吳明柏繪)

圖3 游客/員工/WiFi定位設備逐日流量變化(吳明柏繪)

圖4 WiFi定位設備一天內數據量隨時間變化(吳明柏繪)

數據缺失體現在部分設備收集到的數據在一段時間里不完整,如圖1所示,迎客松餐廳和光明頂處設備在1月30日后大部分時間沒有接收到數據,而2月1日天海3號樓、2月5日玉屏上站和2月11日北海廣場處設備的數據量也明顯與前后幾天的數據量有偏差。調查表明,數據缺失主要是由定位設備斷電或被遮擋導致的,一定程度上影響了后期分析。為了降低數據缺失的影響,采用統計方法對大部分軌跡的缺失值進行空間維度上的填充,經檢驗,填充方法填充準確率約為67%。受篇幅所限,具體的缺失值填充方法在這里不展開贅述。

3 客流行為分析與聚類

3.1 客流量的逐日變化規律分析

據統計,游覽智慧黃山景區不同天數的人數服從冪律分布,表明游覽黃山一天的人數占比最大,之后快速下降(圖2)。為了更直觀地展現人數的差異,圖2中表示人數的縱坐標采用了對數坐標。由圖2可知,游覽7d以內的人數隨時間增長衰減迅速,7d以后趨于平緩,并且數量級降到103。收集到的數據里不僅有游客的手機數據,還有工作人員的設備以及山上帶有WiFi功能的設備。

一般可以認為,游客和工作人員的出現天數分布服從不同的規律,而圖2中的人數分布是二者的疊加。在這里我們假設出現7d以內的為游客,7d以上的為員工,因為一般游客不可能在約一個月的時間內超過7d在黃山游覽。

黃山游客日流量受春節假期的影響出現了明顯的規律性波動(圖3)。除夕之前游客數量較少,除夕前一天為客流最低谷;除夕到正月初七的春節假期間為游客最為集中的時段,客流在初二、初三達到頂峰后開始快速回落,一直到正月初七才開始反彈;從正月初八到正月初十是客流的第二個高峰;從正月十二(星期六)到元宵節之前是最后一個客流高峰,之后客流回歸到節前水平。 相比于游客數量受春節假期的明顯影響,員工與其他設備的數量基本保持不變,僅在除夕之后有少量增加,與游客行為的定性判斷基本相符,也佐證了前述游客數據分類的合理性。不同地點游客逐時數據變化的趨勢不甚相同(圖4)。

圖5 WiFi定位設備布設點間聯系拓撲網絡(張宇繪)

表1 客流軌跡的頻繁路徑列表(長度大于等于5,支持度大于0.2)

1)3條索道的上下站跟新國線都在9:00和15:00左右出現2個高峰,除太平上站之外,早高峰均強于晚高峰,另外售票處的設備晚高峰相比入口處設備要小很多,因為一般在下站買票的游客上山的時間集中在上午,也說明了定位設備的覆蓋范圍有限。

2)北海、光明頂、迎客松等景點基本為每天只有一個客流高峰,但高峰出現的時間并不一致,北海早于光明頂早于迎客松。

3)西海、獅子林、排云樓的變化趨勢也為雙峰,早高峰出現在9:00,與索道早高峰相近,晚高峰出現在8:00,為游客返回酒店住宿的集中時間。而天海則為酒店的雙峰與景點的單峰疊加。

4)此外,在天海、西海、排云樓和獅子林,6:00左右有一個較小的客流高峰,應該是準備觀看日出的游客。

5)各設備處員工的數據量變化同整個景區的變化類似,呈現上下班的特點,酒店和餐廳的員工數量要更多。

3.2 客流行為的時間跨度分布及擬合分析

從收集數據的方式和數據分析結果來看,可以得到“游客從一個景點位移到下一個景點”及“在其中一個景點”停留2種行為模式。黃山景區面積約1 200km2,要做到全覆蓋代價太大,因而我們的策略是在景點、索道等關鍵節點布設,點和點連接串聯成一張拓撲網(圖5)。連線對應了客流位移行為,點對應了客流在景點處的停留行為,本文研究了不同位移、不同景點這2種行為模式在時間跨度上的分布,用統計的方法分別對分布進行了擬合。

點和點之間位移的時間跨度近似服從對數正態分布。從數據里提取出軌跡里從一個點到下一個點的時間跨度,剔除其中的異常值,得到圖6的頻率分布圖(圖6中藍色部分),用對數正態分布對其進行擬合,擬合得到的曲線如圖6中紅色曲線,大部分的擬合結果都十分接近,基本可以認定擬合得到的對數正態曲線能準確描述黃山景區景點之間位移的時間跨度。

不同分布曲線間離散程度差異顯著,這和距離以及路線景點有關。一般點和點之間距離越長,時間跨度的分布更離散;圖中拓撲點之間的連線并不意味著實際情況的唯一路徑。比如從天海到迎客松這段路,中途可繞道去到蓮花峰,也可直接走近路到達迎客松,多種游覽路徑的存在使得天海到迎客松的位移時間跨度相對更分散(對應圖6中編號area_id:4 to B)。

客流在黃山風景點上停留的時長近似服從冪律分布。如圖7所示,客流的停留時長頻率分布圖(圖7中紅點)隨著時間增長初期衰減十分迅速,進而考慮用冪律分布對其擬合,得到圖7中藍色曲線,大致準確地描述了停留這一行為時間跨度的分布。注意到部分游客夜晚會在黃山上的酒店住宿,在過夜點上的停留時間偏長,而這種停留行為并不是這里想要研究的,因此在研究分布之前先進行了篩選,去掉了游客在其中一個點停留超過6h的數據。

3.3 游覽一天與超過一天客流軌跡差異分析

圖6 游客在黃山各段路徑點與點之間位移時間跨度分布(張宇繪)

圖7 游客在黃山各景點停留時間-跨度分布(張宇繪)

圖8 游覽一天和超過一天客流上下山索道選擇頻率分布(張宇繪)

游覽一天和超過一天的客流上下山索道選擇有相似的偏好,但是在太平索道的使用上存在顯著差異。2類客流都最偏好選擇從云谷索道上山、玉屏索道下山(YG-YP),其次偏好選擇從玉屏索道上山、云谷索道下山(YPYG)。 游覽一天的客流里仍有部分人選擇從太平索道上山,而超過一天的客流里極少選擇太平索道上山(圖8)。

游覽一天與超過一天到達離開黃山的時間分布有顯著差異(圖9)。游覽一天的人群到達黃山的時間十分集中,在8:00—9:00;而超過一天的人群里則相對分散,除上午到達外,在14:00—15:00還有一波客流小高峰。游覽一天的人群相對集中的在15:00點左右離開,超過一天的人群離開時間相對更早,集中在11:00—14:00。圖10清晰表明只來一天的人群到達離開時間集中在圖上一片區域,而超過一天的人群偏分散,有2個相對集中的區域,這2個區域的分布在到達時間上有顯著不同。

以到達每個點的軌跡占軌跡總數的比例得到圖示柱狀圖(圖11),對比游覽一天和超過一天的軌跡游覽地點的差異。除了太平索道的上站(圖11編號6)和下站(圖11編號5)的位置游覽一天的軌跡比例高于超過一天的軌跡,其他位置都是超過一天的軌跡到達比例更高。而排云樓(圖11編號2)和西海(圖11編號8)2個位置超過一天的軌跡到達比例顯著高于游覽一天的軌跡比例,超過一天的客流接近80%的軌跡途徑排云樓和西海,而游覽一天的客流里這一比例僅為40%。

3.4 春節與非春節時期客流軌跡差異

長假對景區客流的影響是本文研究的重點之一。為此,將數據采集的時間設定為春節前一周至元宵節之后。如前所述,春節假期對每日客流量有非常顯著的影響,在本節中,將對春節和平時客流軌跡的規律進行更深入的對比。

相對平時,春節時期在黃山游覽一天的客流的到達離開時間分布相對更為分散。超過一天的客流到達離開時間分布基本一致,而游覽一天的客流到達離開時間的分布在春節期間明顯更為分散(圖12)。這一現象的原因尚不清楚,有待進一步探討。

圖9 游覽一天和超過一天客流到達離開時間分布(張宇繪)

圖10 游覽一天和超過一天客流到達離開時間分布(張宇繪)

圖11 游覽一天和超過一天客流游覽地點占比(張宇繪)

圖12 春節和非春節時期到達離開時間分布(張宇繪)

春節時期部分點和點之間位移行為的時間跨度更長。對春節和非春節時期分別做了4.2節中的2種行為模式時間跨度分布擬合,點上停留時間跨度分布并無明顯差異,而部分點和點之間位移行為時間跨度存在顯著差異。如圖13所示,可以看到諸如天海至玉屏索道上站(圖13編號4 to D)和天海至迎客松(圖13編號4 to B)兩段位移上,春節時期時間跨度明顯增長,結合前邊的日流量圖,可以大致推斷為春節時期這些路段上客流量過大出現了擁擠從而導致了時間跨度的增加。

3.5 客流軌跡的主要游覽模式分析

在保留了客流軌跡的時間順序以及軌跡開始和結束時間信息的狀況下,根據PrefixSpan算法尋找到客流軌跡數據里有序集合中的頻繁項集,也就是游客游覽的頻繁路徑(表1)。從中可以看出主要有2類頻繁路徑,一類是云谷下站-云谷上站-北海-光明頂-天海-玉屏上站-玉屏下站(9A014DC),另一類是玉屏下站-玉屏上站-天海-北海-光明頂(CD401)。這些路徑是被大量客流所選擇的, 是景區中主要的游覽模式。

3.6 客流軌跡的聚類分析

同樣在保留了客流軌跡的時間順序以及軌跡開始和結束時間信息的狀況下,基于編輯距離算法計算不同游客軌跡之間的兩兩距離,再運用DB-Scan進行聚類,得到游覽路徑的聚類(圖14、15)??梢钥闯鲇慰偷挠斡[具有一定的傾向性,從云谷索道上山、玉屏索道下山的游客比例高于從玉屏索道上山、云谷索道下山的游客,此外也有一部分從太平索道上山、玉屏索道下山的游客。

圖13 春節和非春節時期點和點之間位移時間跨度分布對比(張宇繪)

圖14 基于DB-Scan的客流軌跡聚類頻率分布(吳明柏繪)

圖15 DB-Scan聚類得到各類別軌跡示意(吳明柏繪)

可以發現,從云谷索道上山、玉屏索道下山的主流游覽線路在春節期間所占比例有所下降,而與之反方向的游覽線路比例有所上升。未能聚類的軌跡比例從春節之后就開始下降,可能是春節前游客的游覽路徑更加多樣化產生的結果(圖16)。

4 結論與討論

本文以黃山景區為例,通過在重要節點布置能夠記錄手機WiFi數據的接入點采集數據并進行分析,得到了人們在各個景點停留以及景點之間位移2種主要行為的時間跨度分布規律,按照游覽天數和是否春節區分人群,深入比較分析了游覽軌跡的差異;通過對軌跡進行頻繁項挖掘以及聚類,提取出人們在黃山景區游覽的主要路徑,并對比其在春節前后的變化。與傳統調研方法相比,傳感器和大數據相結合的方法呈現出更為全面、客觀和深入的特點。

在使用WiFi數據帶來全新的景區客流行為模式研究方式的同時,也需要指出,現階段包括WiFi定位技術在內的各項定位技術還存在需要進一步完善的方面,采集到的定位數據可能存在數據缺失抑或是包含大量無用的噪聲,在分析之前需要做相應清洗和填充等處理,以免造成分析結論上的偏差。

WiFi定位是一種常用于中小尺度空間范圍的定位技術,在本文的研究中,我們嘗試將其推廣到空間尺度更大,但交通流線相對簡單集中的景區,希望能夠找到一種對景區客流進行研究的可行方法。我們相信,使用這一方法得到的軌跡數據除了能夠得到本文所呈現的分析成果外,還有更多有價值的信息有待進一步挖掘。并且,結合其他來源的數據之后,數據之間相互印證支持還能形成更深入的洞見。

當然,在實際應用中,如果能在景區增加設備的密度和覆蓋范圍,長時間記錄數據并進行挖掘,實時對數據進行處理,將可以得到更全面、準確和深入的分析結果。依靠大數據分析輔助智慧景區規劃,驅動決策管理,對于提升景區游覽體驗、改善景區管理模式以及應對客流突發狀況都將帶來全新的可能性。

圖16 各類別軌跡頻率分布隨時間的變化(吳明柏繪)

猜你喜歡
索道游覽客流
客流增多
城市軌道交通節假日期間大客流行車組織思考與實踐
來,一次游覽七個世界
游覽乘法大觀園
淺析索道橋性能的改善方法
固定抱索器索道吊椅拆裝工具車
美術館游覽指南
長江索道迎來30歲生日
基于自學習補償的室內定位及在客流分析中的應用
人工免疫算法在電梯客流時段劃分的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合