?

大數據視角下的京津冀地區城市體系現狀
——以POI數據和手機數據為例

2021-01-27 03:34王崑陽譙博文
關鍵詞:京津冀天津基礎設施

王崑陽 譙博文 張 晶?

(1.廣島大學綜合科學研究科,廣島7398521;2.首都師范大學三維重點實驗室,北京100048)

0 引 言

城市體系是由一系列不同等級規模、不同職能分工和相互密切聯系的城市組成的系統[1],其結構反映了城市群內部的空間特征[2].城市體系將一定范圍內的城市視為一個具有層次等級,且不斷改變的整體[3].區域一體化是城市體系的一種發展形式,是指區域內的2個或多個城市突破行政區劃制約,使發展要素和資源在彼此之間自由流動和優化配置,促進社會經濟緊密融合,形成優勢互補、共同繁榮的整體效應[4],如京津冀一體化.

城市基礎設施是城市發展的支柱[5],基礎設施的數量反映了一個地區的發展規模.城市基礎設施的建設程度在一定程度上代表了某一區域的城市發展等級.分析京津冀地區城市基礎設施的分布,對全面了解京津冀地區現狀與未來發展趨勢具有重要的意義.各類基礎設施在區域內的分布特征反映了其空間分布上的公平性與異質性[6-8],可以體現城市之間的功能差異[9-11].同時,城市基礎設施的數量必須考慮該地區的人口數量,城市基礎設施的建設要以人口為基礎,人口的數量反映了該城市對于基礎設施的需求量.單獨對人口或城市基礎設施進行討論是片面的,并不能反映城市的實際情況,將城市基礎設施數量與人口數量結合討論是必要的.通過對比城市基礎設施與人口的關系,可以確定該區域是否存在基礎設施供不應求的情況,而基礎設施的供需不平均是造成人口遷徙的原因之一[12].

另一方面,交通網絡是制約區域內各城市之間各類供需關系的重要因素[13].隨著技術的發展,手機的位置移動數據逐漸被應用到人口與城市的研究中[14].通過手機內置的基于位置服務(location based services,LBS)功能,定位設備的所在位置,再對比不同時刻設備所在位置的變化,從而獲取該設備在空間上的位置移動信息[15].相比于路網,手機數據所反映的交通信息更客觀地描述了實際的交通量;相比于基于公路流、鐵路流的研究方法,手機數據可以更加全面地獲取到一定范圍內的人口移動信息,并且擁有更高的時空精度[16-17].手機數據可以同時涵蓋多種交通方式所產生的位置移動信息,更加全面和直觀地反映不同城市之間的關聯強度.但目前利用手機移動數據對京津冀地區的研究尚少.

土地利用-交通相互作用模型(land use-transport interaction model,LUTI)是模擬城市發展過程的常用模型,主要用來研究土地利用決策對社會活動和交通發展的影響,或交通決策對社會活動和城市空間分布的影響.LUTI模型側重城市內部結構的變化,對于空間公平性和社會群體的空間聚集分析較為薄弱[18].信息點(point of information,POI),即描述信息的點,其包含該點的坐標位置及其他所需要的信息,可以充分反映城市內部的功能區差異,且城市基礎設施POI的分布模式、分布密度在城市空間分析中具有重要意義[19].而手機數據則可以提供必要的交通信息.基于這些考慮,本文提出設想,使用POI數據作為城市土地利用信息,使用手機數據作為交通信息.在這個層面上,通過研究城市間的土地利用與交通,研究城市之間的城市體系.

京津冀包括北京、天津、石家莊、唐山、秦皇島、邯鄲、邢臺、保定、張家口、承德、滄州、廊坊和衡水,共計13個城市.2014年以前,京津冀地區的發展缺乏統一規劃,區域一體化進程緩慢、結構趨同現象嚴重[20-22].隨著雄安新區進入國家規劃,京津冀一體化發展的需求空前盛大.對京津冀地區的城市體系現狀進行研究,有利于把握當前京津冀都市圈內各城市的發展特征,對未來規劃具有重要的參考價值.本研究以土地利用-交通相互作用模型為基本思路,利用京津冀地區6類城市基礎設施POI數據作為城市土地利用屬性,手機 LBS數據作為交通屬性.本研究旨在通過POI和人口數據研究當前京津冀地區以醫療、學校、銀行、超市商場、餐飲和賓館酒店為代表的城市基礎設施的空間分布特征及其空間公平性;通過手機數據研究各城市在網絡結構下的空間交互強度以及依附關系;通過對比POI和手機數據,挖掘京津冀地區資源較為豐富、空間交互較弱,具有發展潛力的地區,為京津冀一體化發展提供參考與建議.

1 數據來源與研究方法

1.1 數據來源

本文的POI數據來自百度地圖開放平臺(https://lbsyun.baidu.com/),獲取了截至2015年6月的 POI數據,醫療、學校、銀行、超市商場、餐飲和賓館酒店分別為 14 651、23 150、25 129、51 896、39 312和10 187條.每個城市基礎設施 POI包含4方面的信息:設施名稱、設施類別、經度和緯度.利用這些數據點的空間分布特征,可以反映出區域內不同城市之間基礎設施的空間分布關系.

手機數據是來自百度遷徙所屬的人口移動大數據項目.本文采集了2015年4月11—26日期間的16個自然日(10個工作日和6個休息日)京津冀地區13個城市之間逐小時人口流動數據.16個自然日采集的樣本總量超過200萬條,日均超過12萬條,從而保證了本文推斷的有效性,其中工作日累計樣本量約123萬條,休息日累計樣本量約82萬條.

1.2 研究思路與方法

1.2.1 均衡性評價

本文所采取的評價方法為變異系數(coefficient of variation,CV)[23]和赫芬達爾指數[24](herfindahlhirschman index,HHI).CV也稱離散系數,反映了地區均衡度,其值越小,說明該區域越均衡,離散程度越小,公式為

式中σ表示標準差,μ表示平均數.HHI經常用來衡量產業集中度,公式為

式中Xi表示某地區某類POI數量,X表示一定空間范圍內的同類POI總數,Si=Xi/X表示某地區的某類POI占有率,N表示地區總數.HHI反映區域規模指標的聚集程度,數值越大說明越集中,當區域屬于完全壟斷狀態時,則HHI=1.

另外,為了直觀地反映城市內資源與人口的關系,本文設計了城市基礎設施資源總數與常住人口總數的比值,對城市的POI分布及供需情況進行評價,簡稱資源-人口比例,具體方法為

式中R表示某區域內某類資源的資源-人口比例,M′表示該區域某類 POI數量,M表示京津冀同類POI總數,P′表示該區域常住人口數量,P表示京津冀常住人口總數.

1.2.2 聚類算法

聚類是將具有相似屬性的樣本聚到一個類中的數據挖掘方法,旨在識別多變量數據中的離散模式[25].該方法通過樣本之間的相似性進行分組,通過樹狀圖反映各要素之間的結構與關系.

1.2.3 優勢流方法

優勢流方法是一種網絡簡化方法,該方法參照城市規模,依據某一個城市主要要素流的流向,將這個城市歸屬到對其最具控制力的中心[26].一般在一定空間范圍內某城市所處層級水平越高,表明其中心性、主導性越強,對周邊城市或地區的控制力和影響力越大,服務范圍越廣.

1.2.4 社區發現算法

社區發現算法用于發現網絡中的社區結構[27].在社交網絡中,每位用戶都相當于一個點,用戶之間通過互相的關注關系構成了整個網絡的結構,在這樣的網絡中,有的用戶之間連接較為緊密,有的用戶之間連接關系較為稀疏,連接較為緊密的部分可以被看成是一個社區,其內部的節點之間有較為緊密的連接,而隸屬不同社區的節點間的連接則較為稀疏.

社區發現是一個復雜而有意義的過程,用于探測并揭示不同類型復雜網絡中固有的社區結構[27].其中,Fast Unfolding算法是基于模塊度對社區進行劃分的算法,通過不斷劃分社區,使劃分后整個網絡的模塊度不斷增大.劃分后的網絡模塊度越大,說明社區劃分的效果越好.Fast Unfolding算法通過反復運算使模塊度增大,并根據運算結果對網絡進行重構,直到網絡結構不再改變[28],最終聚合成圍繞少數中心點形成的網絡,這與城市體系中的單中心、雙中心、多中心城市結構很相似.因此該算法非常適用于挖掘城市之間的潛在關系.Fast Unfolding算法公式為

式中:Q表示整個社區的模塊度;m表示該網絡中的權重總和,Aij表示節點i和節點j之間的權重;k表示與頂點連接的邊的權重;Ci和Cj分別代表節點i和節點j被分配到的社區;δ用于判斷頂節點i和節點j是否被分配的同一社區.

1.2.5 反距離權重法

反距離權重法假定每個測量點都有一種局部影響,而這種影響會隨著距離增大而減弱[29],這很符合人們在對城市基礎設施進行出行選擇時的就近原則.因此本文使用反距離權重法對POI和手機數據所反映的城市連通度進行插值.

2 基于公共服務的京津冀地區城市體系分析

2.1 各地區6類城市基礎設施分布情況及均衡性分析

為了能夠直觀地查看各地區城市基礎設施的分布情況,本文將各地區6類POI的數量進行了類型內對比,以獲得各地區6類POI在京津冀都市圈內所占該類POI總量百分比,如表1所示.同時,計算了6類城市基礎設施POI在不同地區的資源-人口比,如表2所示.

表1 6類城市基礎設施POI在不同地區的比例和不同地區常住人口量比例 單位:%

表2 6類城市基礎設施POI在不同地區的資源-人口比及總量排名

從表1可知,在6類城市基礎設施中,北京均處于優勢地位,其中醫療 POI占京津冀地區總量的32.4%,餐飲POI占50.4%,賓館酒店POI占44.9%,其6類 POI總量占京津冀地區 POI總量37.1%.天津市6類POI均在京津冀地區排第2位,北京和天津兩地6類 POI相加可以發現,銀行、超市商場、餐飲和賓館酒店4類POI之和均已超過京津冀地區6類POI總量的50%,而常住人口之和為33.9%.從表2可知,6類POI在北京、天津的資源-人口比遠高于其他地區,其POI總量的資源-人口比例分別位于第1位和第3位,以城市基礎設施提供者的身份向周邊城市提供6類城市基礎設施服務.秦皇島的資源-人口比例雖然位居第2位,但這主要是因為其旅游城市的特性,流動人口高、常住人口少,并不能認為其具有向周邊城市提供城市基礎設施服務的能力.位居第4位的廊坊同樣存在大量流動人口.由此可見,大多數城市基礎設施均分布在北京和天津,其城市基礎設施公平性遠高于其他城市,并向周邊城市提供城市基礎設施服務.根據表1的數據,可以計算出6類 POI在京津冀地區的CV和HHI.如表3所示.

表3 6類POI在京津冀地區的變異系數和赫芬達爾指數

通過CV與HHI之間的變化規律可以看出6類城市基礎設施均處于過度集中或過度離散的狀態.餐飲與賓館酒店這類生活服務類型POI在京津冀地區集中度較高,而醫療、學校、銀行這類基礎保障類型POI則相對較為平均.

本文還將各地區6類POI的數量進行了區域內對比,以獲得各地區6類POI在京津冀都市圈內所占本地區6類POI總量百分比,如表4所示.從POI總量中可以發現,邯鄲、邢臺、滄州、衡水所包含的POI總量均低于4.0%,總比為12.1%,但4市所包含的常住人口總量達到26.1%,4市資源-人口比例為京津冀都市圈內的倒數4名,屬于重度城市基礎設施需求地,具有較低的城市基礎設施公平性,因此應加強城市基礎設施建設,或加強與周邊基礎設施豐富的城市之間的互動.而張家口與承德2地雖然POI總量<4.0%,但由于其常住人口量較少,城市基礎設施需求量低.在河北省的各城市中,醫療和學校POI在石家莊以及保定比較集中,且石家莊略高于保定.

表4 不同地區6類城市基礎設施POI在本地區的比例 單位:%

從表4可知,超市商場POI在京津冀地區均占較高比例.北京、秦皇島、廊坊、天津和唐山的餐飲占據較高比例.由于秦皇島是一個旅游城市,賓館酒店的占比為京津冀地區最高,而承德、衡水、邯鄲和張家口則以學校所占比例較高.

2.2 6類城市基礎設施POI的空間分布密度

為了能夠更直觀地反映出6類城市基礎設施的分布情況,本文計算了6類POI在各城市的點密度.點密度體現了每個輸出柵格像元周圍的點要素的密度.從概念上講,每個柵格像元中心的周圍都定義了一個鄰域,將鄰域內點的數量相加,然后除以鄰域面積,即得到點要素的密度(見圖1).

圖1 京津冀地區6類POI密度分布(a)醫療;(b)學校;(c)銀行;(d)超市商場;(e)餐飲;(f)賓館酒店

從圖1可知,6類POI在北京均呈現較為集中的形態,以醫療和餐飲最為密集.學校、銀行和超市商場這3類POI則在北京、天津和石家莊均有集中態勢,且在各地均有較為密集的分布,其中學校POI相對最為平均,說明教育資源在各地區分布較為平衡.賓館酒店類則是除北京和天津外,在秦皇島市呈現密集形態.

2.3 各城市POI總量聚類

根據各城市的POI數量,對京津冀都市圈內的城市進行了聚類(圖2).根據POI的性質,聚類距離越近的地區其POI分布特征越相似,距離越遠則表示其POI分布特征差異較大。圖2反映了北京、天津兩地在整個京津冀都市圈中具有較高的城市基礎設施占有率.值得注意的是,對于河北省內的城市,石家莊、保定與其他城市的差異,體現了石家莊和保定在河北省內,相對于其他城市有較高的POI占有率,即具有更大的發展潛力以及帶動周邊城市發展的能力.

圖2 京津冀地區城市POI聚類

整體對比可知,北京、天津在6類 POI的空間公平性上全面處于明顯優勢地位,對周邊城市具有一定的領導作用.位于第2梯度的則是石家莊和保定,這兩地在河北省內的基礎設施空間公平性最高.而南部的邢臺和邯鄲不僅 POI分布稀少,從距離上也難以利用到北京、天津的資源.

3 基于人口流量的京津冀地區城市體系分析

3.1 基于人口流量的京津冀社區劃分

對京津冀都市圈各城市之間的LBS數據進行統計,得到共計156條不對稱網絡聯系(圖3),通過優勢流方法獲得其中占主導地位的23條主要人口流動線路.對占主導地位的23條線進行二次分類,使用自然斷裂法分為5級,斷點類別基于數據中固有的自然分組.將分類間隔加以識別,可對相似值進行最恰當地分組,并可使各個類之間的差異最大化.從圖3可知,北京-廊坊兩地之間的人口交互強度最高,日均人口流量達到36 839人次.北京-保定和北京-天津之間的人口交互強度次之,分別為17 646與13 660人次.天津-廊坊、天津-唐山也以 10 188與7 207人次保持在第3梯度.由此可見,廊坊與北京和天津兩地的人口流量都處于較高的水平,說明三地之間的空間交互程度較高.整體上,除上述地區外,承德、張家口、石家莊、滄州與北京和天津兩地的人口流量較大.相對而言,河北省11個城市之間人口流量較小,均在日均434人次以下.

圖3 京津冀地區日均人口流量圖(雙向)

使用Fast Unfolding算法進行社區發現京津冀地區呈現雙中心的結構(圖4).其中,石家莊、保定、邢臺、承德、邯鄲、廊坊和張家口以北京為中心;而唐山、秦皇島、衡水和滄州則以天津為中心.

圖4 基于Fast Unfolding算法的網絡結構下京津冀地區社區發現結果

3.2 網絡結構下的中心城市差異

為了更直觀地觀察北京、天津2個中心城市的人口流量,制作了雙向人口流量圖,并使用對數函數對數據進行拉伸,使其更加顯著地反映進出關系(圖5),從圖5可知,以北京和天津為中心的人口移動整體趨勢為進京津方向人口流量大于出京津方向,且北京更為顯著.以北京為中心的城市體系中,除了廊坊,均明顯呈現進大于出的趨勢,僅秦皇島差距微弱.而天津為中心的城市體系中,滄州、唐山和保定進津方向明顯多于出津方向,其他城市并無明顯差異.值得注意的是,廊坊市在以北京為中心的城市關系中,不同于整體進京大于出京的趨勢,雖然差距微弱,出京卻大于進京.總體來說,北京市對周邊城市的影響力大于天津市.

圖5 北京、天津進出雙向日均人口流量示意圖(a)北京;(b)天津

4 POI與人口流量所反映的城市熱度差異

使用反距離權重法,計算各地區POI以及人口流量熱度(圖6).從圖6可知,京津冀都市圈各城市POI熱度與人口流量熱度整體上很相似,但石家莊的POI熱度與人口流量熱度差異卻很大.石家莊雖然擁有豐富的基礎設施資源,但其作為省會城市對周邊城市的影響能力不足,在網絡結構中的核心地位與層次性不明顯.實際交通交互量遠低于其基礎設施的承載能力,基礎設施無法得到充分利用,其周邊城市也難以利用到石家莊的城市基礎設施資源.再加上邢臺、邯鄲和北京、天津的距離較遠,聯系較弱,使京津冀南部地區在整個網絡中處于薄弱狀態.石家莊豐富的城市基礎設施資源和薄弱的交通交互量,使其具有成為京津冀都市圈內另一個中心城市的可能性.

圖6 京津冀地區各城市POI熱度與人口流量熱度(a)POI熱度;(b)人口流量熱度

5 結論和討論

本文證明了使用POI數據與手機數據替代LUTI模型中原本的土地利用和交通信息進行城市體系研究具有可行性,且二者結論具有一致性.北京、天津和石家莊的城市基礎設施資源遠遠比京津冀都市圈內的其他城市豐富,具有向周邊城市提供城市基礎設施服務的能力;圍繞北京和天津形成的雙中心網絡結構可以有效帶動北部區域發展,但是南部地區當前并沒有中心城市,并且與現有中心城市的交互較弱;位于南部的石家莊雖然現在與周邊城市的交互較弱,但具有豐富的城市基礎設施資源,有較高的發展潛力.伴隨雄安新區的設立,京津冀地區將從雙中心變為多中心的形態,配合保定的城市基礎設施資源,可以很好地帶動包括滄州和衡水在內的京津冀中部地區發展,而南部城市群依然處于薄弱的地位.基于本研究的結果,在京津冀后續發展計劃中,加強發展石家莊作為省會城市的優勢,可以更好地帶動南部城市群發展,為京津冀一體化發展提供助力.當然,城市體系的研究還有很多方面,本文只是從公共服務和交通聯系2個角度對京津冀都市圈的城市體系進行了探究,未來還可從更多角度進行研究,更好地為京津冀一體化發展提供參考和依據.

猜你喜歡
京津冀天津基礎設施
如果天津有“畫”說
農業基礎設施建設有望加速
公募基礎設施REITs與股票的比較
天津卷
《天津之眼》
振動攪拌,基礎設施耐久性的保障
充分挖掘基礎設施建設發展潛力
天津
京津冀大聯合向縱深突破
京津冀一化
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合