?

城市居民活動軌跡日間穩定性分析
——以西寧市為例

2024-01-29 14:43趙志遠楊紅楊喜平
地理信息世界 2023年4期
關鍵詞:時間段軌跡人群

趙志遠,楊紅,楊喜平

1. 福州大學 數字中國研究院(福建),福州 350003;

2. 空間數據挖掘與信息共享教育部重點實驗室,福州 350003;

3. 陜西師范大學 地理科學與旅游學院,西安 710119

1 引 言

信息和通信技術的快速發展為人類活動位置觀測提供了新途徑,以手機位置數據、帶地理位置標記的社交媒體數據等為代表的大規模人群位置感知數據,有力支撐了人類移動特征和活動模式挖掘的理論與方法的研究(González 等,2008;Song等,2010;羅茜和焦利民,2023)。有關成果被進一步用于支撐城市規劃(傅英姿和王德,2021)、智能交通(張月朋和王德,2021;Yan 等,2022)、人類健康(Li 等,2019)等領域的創新應用,如評估自行車出行的潛在需求(Xu 等,2016;周亞娟等,2020)、優化商業選址(彭大芹等,2019)、改善出行導航方案(Hu 和Chen,2021)、研究人口遷入成因(詹慶明等,2020)等。

科學精準評估人群活動需求,需要從人群活動的物理空間本體特征和數據空間孿生特征兩個角度進行考慮。一方面,從物理空間來看,個體活動呈現重現性和變化性并存的復雜特性,個體活動軌跡的日間穩定性能夠有效刻畫個體活動復雜特性。已有研究發現人類移動模式在人群匯總層面具有時間穩定性(Wang 等,2021)。其中內在機制需要通過繼續分析個體出行活動的穩定性來挖掘,如活動空間的范圍大?。⊿harmeen 和Houston,2020)、出行距離(Susilo 和Kitamura,2005)等活動特征和出行模式(Neutens 等,2012;Zhang 等,2021)等?;顒犹卣骱统鲂心J绞擒壽E在特定維度的呈現,從微觀個體活動軌跡出發分析居民活動的日間穩定性,能夠幫助揭示在人群匯總層面穩定性的內在機制與特征,共同揭示人類活動在個體微觀層面和人群匯總層面的日間穩定性特征,減少特征挖掘過程中因信息抽象概括對分析結果的影響。目前,直接基于軌跡分析日間穩定性的研究較少;涉及活動軌跡日間穩定性的研究常見于個體位置重訪規律(González 等,2008;王德等,2021)或軌跡相似性度量(潘曉等,2019;梁明等,2023),這為活動軌跡日間穩定性度量提供了技術參考。另一方面,從數據空間來看,大數據時代雖然涌現了豐富的數據資源,但數據生產方和數據使用方往往出現錯位的現象。此種情況下,由于缺乏數據支撐應用的有效性檢驗,數據是否能夠充分滿足應用需求以及對分析結果產生哪些影響是需要關注的問題。受隱私關切和數據獲取條件限制等因素的影響,現有研究中的大規模人群位置觀測數據在覆蓋時間長度存在差異,有關分析結果既可能是人群行為本身特征映射的結果,也可能是數據覆蓋時長變化作用的結果,如何科學理解有關分析結果對后續決策十分關鍵。以手機位置數據的研究為例,少數研究的數據覆蓋時間超過1 個月(Guan 等,2021),許多研究所用的數據涵蓋居民一天的出行活動軌跡數據(彭大芹等,2019;周亞娟等,2020;Hu 和Chen,2021)??紤]到個體日常生活需求、可支配資源限制及物理環境條件等因素,個體日間活動呈現出復雜性特點(Susilo 和Axhausen,2014;Duan 等,2017)。因此,迫切需要了解人類出行活動的日間穩定性特征,科學認識短時間軌跡數據集對人類移動復雜性的刻畫能力。

本文以青海省西寧市為例,利用匿名化脫敏手機位置數據,基于軌跡相似性方法,分析并對比不同類型的日期之間居民個體活動軌跡的穩定性;同時,對不同屬性和區域的人群日間穩定性進行了對比。研究結果可以為城市規劃管理決策提供科學支撐。

2 研究區與數據源

2.1 研究區域

西寧市為青海省省會,位于青藏高原東北部,截至2016 年末,市區人口為128.91 萬人。本文選取城東、城中、城西、城北四個城區作為研究區域(圖1),分析其居民活動軌跡日間穩定性及人群和時空分布特征。

2.2 數據源

研究所用的匿名化脫敏數據來自西寧市某移動運營商,包括因通話、短信及移動互聯網使用產生的記錄。在空間范圍上,數據主要涵蓋的是西寧市主城區;在時間范圍上,數據集包含兩個工作日(2018 年8 月2~3 日)和兩個休息日(2018 年8 月4~5 日)。數據集中有38 萬個用戶,一天約4500 萬條數據。手機位置數據通過基站定位,約有2600個基站,基站間平均距離191.26 m,基站分布呈東西“十字”放射條帶狀(圖1)。數據集屬性情況見表1,為保護用戶隱私,研究使用的數據均已經過匿名化脫敏處理。

表1 手機位置數據屬性示例Tab.1 Example of mobile phone location data attributes

2.3 數據預處理

首先,刪除手機位置數據中的空值、異常值等;其次,為盡可能準確地記錄居民的活動軌跡,本研究篩選出任意一天的記錄時長不低于16 h(Lu 等,2017)的手機用戶4.79 萬;最后,識別出居住地的用戶有4.57 萬作為研究所用數據集。數據集中青年(19~35 歲)人群占比最高,達57%;老年(60 歲以上)人群占比較少,約為2%。這與我國年齡人口分布和手機用戶的群體分布相似。

以西寧市街道為空間單元,計算所用數據集中的各街道的人口與第六次全國人口普查數據的斯皮爾曼相關系數為0.85(p<0.01),說明研究區的居住地分布與人口普查結果在整體上有較好的一致性。其中,人口分布較多的街鎮主要是占地面積較大且位于中心城區外圍的彭家寨鎮、韻家口鎮和馬坊街道。清洗后數據采樣的平均時間間隔為8 min,有92.4%的數據采樣時間間隔在30 min 之內,表明研究所用數據質量良好。各時間段的數據量在4 d內分布較為均勻(圖2),工作日白天數據量明顯高于休息日,星期天最低(8 月5 日)。4 d 數據記錄時間分布的斯皮爾曼相關性最小值為0.84,綜合說明本研究的數據記錄量在日間有較好的一致性,可用于活動軌跡的日間穩定性分析。

圖2 數據記錄的時間分布Fig.2 Time distribution of data records

3 研究方法

基于手機位置數據,本文利用時間最鄰近的位置記錄對數據缺失的時間段進行位置插補,生成個體出行網格軌跡;通過個體在天與天之間相同時間段出現在相同網格的時間段次數,構建個體活動軌跡日間穩定性度量方法;對不同群體活動軌跡日間穩定性進行分析。技術流程如圖3 所示。

圖3 活動軌跡日間穩定性分析流程Fig.3 Flowchat of inter-day stability analysis of activity trajectories

3.1 居住地識別

居住地是居民日?;顒拥闹匾^點。本文借助用戶在凌晨的停留信息識別居住地,具體步驟如下:①使用SMoT(stop and moves of a trajectory)模型識別停留軌跡段(Spaccapietra 等,2008;徐金壘等,2015),統計用戶每天在凌晨停留超過3 h 的位置,稱為凌晨駐留點。②統計用戶4 d 內凌晨駐留點的質心。③計算每個凌晨駐留點離質心的距離,將離質心距離最近的凌晨駐留點識別為用戶的居住地。

3.2 缺失記錄插補

手機位置數據的記錄在時間上并非呈均勻分布。為了保證任意時間段下都有用戶位置信息,本文對數據缺失的時間段插補空間位置信息。插補的具體規則為,將時間劃分為間隔(Δt)相等的M個時間段:從0:00 開始,如果某時間段內無記錄,則在該時間段前后的兩條記錄中選擇時間間隔最近的位置信息插補到數據缺失的時間段;如果最短的前后記錄時間間隔都相等,則將這兩個位置信息都插補到該時間段內。經過缺失記錄插補后的軌跡在任意時間段都至少有一條位置記錄,如圖4 所示。

圖4 缺失記錄插補示意圖Fig.4 Schematic diagram of the interpolation for the missing record time windows

3.3 軌跡網格化

手機位置數據記錄的位置是為用戶提供通信網絡服務的基站的位置。為了便于比較活動軌跡日間穩定性高低和消除基站分布密集地區手機信號跳轉的影響,把以基站位置定位的軌跡轉為以網格定位的網格軌跡??紤]到研究數據集基站間平均距離有95.3%在500 m 以內,本文使用500 m 大小的規則網格,將以經緯度定位的軌跡數據轉為網格軌跡表示。把一天的時間劃分為間隔相等(Δt)的M個時間段,任意一個時間段的定位點有n個(n≥1),則用戶q一天活動的網格軌跡表示為式(1)。表示用戶q在時間段m所在網格信息,可以表示為式(2)。有

3.4 日間穩定性度量方法構建

為了分析居民活動軌跡日間穩定性,本研究參考現有軌跡相似性方法(潘曉等,2019),基于用戶在不同天之間對應時間段出現在相同網格的時間段次數與一天總時間段數M之比來量化用戶活動軌跡日間穩定性的高低。如用戶q在某兩天的活動網格軌跡分別為和則用戶q在這兩天的活動軌跡日間穩定性分數表示如式(3)。穩定分數的取值為[0,1],其中,表示用戶q在兩天對應的時間段m中是否有相同網格編號的記錄:

每個用戶在任意的兩天間都有一個活動軌跡日間穩定性分數,通過度量居民的活動軌跡日間穩定性可以了解其活動位置在日間的差異大小。為進一步挖掘居民在一天中不同時間區間的活動軌跡日間穩定性差異,本文以手機位置數據識別居住地常用的時間節點6:00 和晚高峰結束時間19:00 作為分割點,將一天劃分為三個時間段(表2),再根據式(3)分別計算不同時間區間下的穩定性。

表2 時間段劃分Tab.2 Division of Time Intervals

4 實驗結果分析

分別選取時間段10 min、30 min 和60 min 計算居民活動軌跡的日間穩定性,發現隨著時間段取值的增加,活動軌跡日間穩定性和各時間段的穩定人群占比都表現出升高的趨勢??紤]到數據集采樣時間間隔在30 min 以內的數據占92.4%,本研究選取30 min 的時間段進行后續分析。

4.1 活動軌跡日間穩定性總體概況

總體而言,居民活動軌跡日間穩定性不高,工作日活動軌跡較穩定,休息日活動位置多樣。由表3、圖5 可知西寧市居民活動軌跡日間穩定性均值為0.545,這意味著,居民的活動位置在日間平均約有54.5%的時間是相同的。其中,工作日之間(WW-day)的日間穩定性最高,比休息日之間(OO-day)的穩定性高出近6.4%。WW-day 穩定性較高主要是源于其白天工作時間有更多的穩定人群,這與時間地理學中,工作日居民出行受到工作活動的制約相符合。OO-day 的穩定性低于WW-day 反映居民休息日的活動軌跡不僅與工作日存在差異,在休息日之間差異也相對較大。因此,在提取人類活動信息時,需要更多的休息日出行軌跡才能獲得與工作日準確性相當的特征信息。

表3 不同日期類型日間穩定性均值對比Tab.3 Inter-day stability distribution for different date types

圖5 穩定人群占比時間分布Fig.5 Time distribution of stable population persentage

在T1~T3 的三個時段中,凌晨時段活動軌跡穩定性最高,晚上次之,白天最低。三個時間區間中的穩定性大小關系與個體位置預測準確率的時間分布特征(李明曉等,2018)相符合,其中,凌晨和晚上分別高出白天近38%、10%(表3)。這表明利用居民在凌晨的停留行為識別居住地的可靠性較高(Cao 等,2019)。此外,工作日不僅白天穩定人群占比高出休息日,在晚上也較高(圖5),反映在工作日不僅白天的休閑出行活動受到限制,晚上的出行活動也會受到一定的限制。

4.2 各年齡段人群日間穩定性分析

按照年齡將居民分為青少年人群(13~18 歲)、青年人群(19~35 歲)、中年人群(36~60 歲)和老年人群(60 歲以上)?;顒榆壽E日間穩定性表現為青少人群最高,老年人群次之,青年和中年人群較低;其中,青少年人群日間穩定性比青年人群高出14%(表4)。青少年活動軌跡日間穩定性高可能與數據采集的時間有關,暑假學生以社區活動為主,表現出較高的活動軌跡日間穩定性。圖6 中,青年和中年人群在工作日工作時間的曲線有明顯的上下班現象,青年人群在上班時間較其他年齡段受到了更大的位置限制,但其在晚上有較其他年齡段更為多樣化的活動位置。老年人群在休息日的中午12:00~13:00 有個小高峰,反映其在這期間有穩定的活動位置。從曲線處于最小值的時間來看,多數年齡段居民活動位置最不穩定的時間段在15:00 左右,但青年和中年人群工作日活動位置最不穩定的時間段在下班后的18:00~20:00。從晚上19 歲以上居民穩定人群占比的變化趨勢來看,老年人群較早回到家中,青年人群在外逗留時間較長,回家最晚。

表4 各年齡段人群日間穩定性分布Tab.4 Inter-day stability distribution for different age groups

圖6 各年齡段穩定人群占比時間分布Fig.6 Time distribution of stable population distribution for different age groups

4.3 男性與女性日間穩定性分析

男性和女性活動軌跡日間穩定性在總體上表現為女性略高于男性,僅高出1%左右,差異較小,體現出隨時代發展,女性生活的限制性得到持續緩解。相比較而言,女性在工作日的穩定性高于男性(圖7),這可能與女性較少承擔工作中的外出活動有關。在休息日,女性日間穩定性與男性總體持平(表5),但在11:00~20:00 表現為更低的穩定人群占比,反映女性在休息日擁有更為多樣化的活動位置,活動復雜性高。在21:00 之后和凌晨,女性穩定人群占比均高于男性,這與女性出于安全考慮會減少夜間的獨自出門頻次相符合。

表5 男性與女性日間穩定性分布Tab.5 Inter-day stability distribution for men and women

圖7 男性與女性穩定人群占比時間分布Fig.7 Time distribution of stable population distribution for men and women

4.4 日間穩定性空間分布情況

結合識別的居民居住地,本研究發現西寧市街道尺度下城市居民活動軌跡日間穩定性在空間上表現為從城市中心向外,穩定性先降低后增高的趨勢(圖8)。不同城市功能分區下居民出行行為存在差異,進而在空間上表現為各地區居民活動軌跡的日間穩定性差異(王長碩等,2022)。位于老城區中心的倉門街歷史悠久,區域功能結構復雜,居民出行軌跡多樣;生物科技產業園作為經濟高發展的工業區,人群出行需求和活動位置多樣。遠郊區居民活動軌跡日間穩定性高,可能與遠郊地區從事農業的居民占比高,人群活動位置較為單一有關。

圖8 人群穩定性空間分布Fig.8 Spatial distribution of population stability

4.5 典型地區穩定性對比

為了對比位于城市不同地區人群活動軌跡日間穩定性特征,本文從研究區域中選擇幾個典型區域來對比分析區域人群活動軌跡日間穩定性特征。從城市中心到遠郊區依次選擇東關大街街道、倉門街街道、虎臺街道、大堡子鎮(圖9),分析不同區域人群活動軌跡日間穩定性特征。

圖9 典型區域地理位置Fig.9 Geographical locations of the typical areas

從圖10 來看,大堡子鎮位于城市遠郊地區,居民活動軌跡日間穩定性高且受日期類型影響較小,意味著在相同數據資源條件下,活動特征挖掘的準確率在遠郊區居民上能有更高的準確率;虎臺街道位于西寧市近郊區,穩定性較低且受日期類型影響較大,因為隨著城市的發展與擴張,近郊區逐漸成為人口分布的次中心,且出行距離較遠、出行路徑不確定性較高;位于老城區中心的倉門街街道和相鄰的東關大街街道居民活動軌跡日間穩定性均較高且受日期類型影響較小,不同居住主體的兩個街道居民有相似的活動軌跡日間穩定性特征,反映西寧市居民均形成了較為穩定的生活節奏。

圖10 典型區域人群穩定性對比Fig.10 Distribution of population stability in typical regions

5 結 論

本文圍繞城市居民活動穩定性分析問題,研究了西寧市居民活動軌跡日間穩定性的時空分布特征,得出以下主要結論:①居民活動軌跡的日間穩定性總體偏低,其活動位置在日間平均約有54.5%的時間是相同的。居民在工作日的活動軌跡穩定性較高,休息日的活動位置多樣性較高,其中,居民在白天的活動軌跡穩定性最低。因此,使用短時間軌跡數據挖掘居民工作地時,需要考慮居民出行活動的不穩定性因素,以提高數據挖掘的準確性。②青少年和老年人群活動軌跡的日間穩定性總體較高,青年人群在工作時間受到較大的位置限制,但在晚上有多樣化的活動位置。在位置預測研究中,青年人群的活動軌跡日間穩定性在工作日和休息日、工作日的工作時間和18:00~20:00 的差異較大,同時青年人群是人類活動大數據研究數據集中的主體人群,針對不同時間下的居民出行穩定性特征分析位置預測算法能有效提升位置預測準確率。③男性與女性在活動軌跡日間穩定性上差異較小,雖然女性在工作日的活動位置較穩定,但其在休息日白天表現為有更為多樣的活動位置,反映女性的活動模式限制得到基本的解除。④街道尺度下的活動軌跡日間穩定性在空間上表現為從城市中心向外,穩定性先降低,后增高的趨勢。

本研究仍存在以下問題有待進一步研究:①居民活動軌跡日間穩定性結論的魯棒性還需要更長時間的數據,做更深入的分析;②可變面積單元問題對結果的影響。

猜你喜歡
時間段軌跡人群
在逃犯
糖尿病早預防、早控制
軌跡
夏天曬太陽防病要注意時間段
軌跡
軌跡
我走進人群
財富焦慮人群
進化的軌跡(一)——進化,無盡的適應
發朋友圈沒人看是一種怎樣的體驗
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合