?

基于POI和夜光數據的滇中地區人口空間化模擬研究

2022-11-18 02:36趙政權
貴州大學學報(自然科學版) 2022年5期
關鍵詞:夜光格網人口

趙政權,羅 虹

(云南國土資源職業學院 國土空間信息學院,云南 昆明 652501)

人口問題一直是社會經濟發展的熱點,人口數據空間化是采用合適的方法,篩選適合的解釋因子對人口統計數據搭建模型,進行離散化處理后探討區域人口的空間分布規律,模擬人口的地理分布[1-3]。主要的方法目前都基于土地利用數據[4-8]、興趣點數據[9]、多源遙感數據融合[10]、位置大數據[11-12]進行研究。獲取高精度的人口分布信息對于人口、資源和環境的合理規劃、管理及區域的可持續發展研究都具有重要的意義[13]。

夜間燈光數據作為重要的人類活動強度發展指標,因其成本低、周期短、獲取方便,對于人口的研究具有無可比擬的優勢。早前使用較為廣泛的是美國軍事氣象衛星計劃搭載的業務線掃描系統傳感器夜光數據(defense meteorological satellite program/operation linescan system,DMSP/OLS),其拍攝的夜光產品空間分辨率為1 km,適用于大尺度范疇的州、國家及地區研究。因DMSP/OLS夜光數據分辨率較低,2012年美國開始啟用新一代的國家極地軌道運行環境衛星系統預備工程搭載的可見光紅外成像輻射儀夜光數據(national polar-orbiting operational environmental satellite system preparatory project/visible infrared imaging radiometer,NPP/VIIRS),共有22個波段,星下點空間分辨率為375 m,比DMSP/OLS夜光數據分辨率更高,適用于中小尺度范疇的區域研究。2018年我國也發射了全球首顆專業夜光遙感衛星——珞珈一號(LJ1-01),該衛星是武漢大學與相關科研機構研發的全球第一顆專業遙感衛星,LJ1-01衛星獲得的系統幾何糾正產品,空間分辨率可達130 m,可以識別更細節的燈光。興趣點(point of interest, POI)與人類活動密切相關,如何基于興趣點數據更好地進行人口分析也是現在的研究熱點[14-15]。很多學者對于人口空間化進行了研究,胡云鋒等[16]以DMSP/OLS、NPP/VIIRS夜間燈光數據及其他輔助數據為基礎,對川渝地區的人口分布進行了研究,同時隨機抽取500個鄉鎮樣本對人口空間化的精度進行對比檢驗。高義等[17]基于DMSP/OLS夜光數據、NPP/VIIRS夜光數據及人口普查等數據,采用建筑物與裸地增強指數法對海岸帶人口進行了空間化處理分析。陳晴等[18]基于LUC數據和夜光數據,以黃河三角洲高效生態經濟區為研究區域,生成1 km的人口空間化網格,最后以縣及鄉鎮人口數據進行了精度驗證。趙鑫等[19]利用NPP/VIIRS燈光數據、土地利用數據及POI數據,采用主成分賦權法構建廣州市人口空間化指標體系,最后對人口進行了空間化處理。目前,人口分布的研究大多在國家、省級的尺度上,且主要集中在經濟發達區域[20],鮮有對西部區域的研究。本研究選用NPP/VIIRS、LJ1-01夜間燈光及POI數據,以滇中經濟區為研究區域,分別生成500 m×500 m、150 m×150 m的格網,采用空間滯后模型(spatial lag model, SLM)和空間誤差模型(spatial error model, SEM)對人口數據建立回歸模型,并以縣級人口統計數據修正預測人口數,對比模型的預測精度,最后以鄉鎮人口統計數據來進行精度評價。

1 研究區域概況及數據預處理

1.1 研究區域概況

滇中地區指云南中部以昆明市為核心,半徑約150~200 km左右,包括曲靖市、玉溪市和楚雄彝族自治州4個州市組成的行政轄區,該區域位于全國“兩橫三縱”城市化戰略格局中包昆通道縱軸的南端,面積約10萬km2,占全省土地面積的24%,集中了云南省約4成的人口和6成的經濟總量,位于長江、珠江和紅河上游,屬亞熱帶氣候,日照充足,四季如春,氣候宜人,干濕季分明,土壤類型以紅壤為主,植被類型多樣,屬于滇東高原盆地,以山地和山間盆地地形為主,地勢起伏和緩,集中了云南全省近一半的山間平地(壩子),滇中地區的行政區劃圖如圖1所示。滇中地區是我國連接東南亞、南亞國家的陸路交通樞紐,是面向東南亞、南亞對外開放的重要門戶,是云南融入國家“一帶一路”和“長江經濟帶”戰略的關鍵支撐,是云南經濟跨越發展的“引擎”和重要增長極,也是全省經濟轉型升級的主戰場,因此研究滇中人口分布具有重要的參考價值。

圖1 研究區域示意圖(審圖號:云S(2017)046號)Fig.1 Sketch map of the study area

1.2 數據來源

本研究中的主要數據類型包括了人口統計數據、行政區劃數據、POI數據及兩種夜光數據。

1)2018年滇中地區縣級人口統計數據來自中國縣域統計年鑒2019(縣市卷)及云南省統計年鑒(2019);2018年滇中地區鄉鎮人口統計數據來自中國縣域統計年鑒2019(鄉鎮卷)及云南省統計年鑒(2019)。其中,全國的統計數據中缺少的部分由云南省統計年鑒補充。

2)行政區劃數據來自云南省地理信息公共服務平臺2017版的云南省行政區劃圖,下載地址:https://yunnan.tianditu.gov.cn/MapResource,通過地理配準,以底圖為基礎進行矢量化。

3)POI數據通過高德地圖進行爬取,POI數據類型主要有餐飲服務、住宿服務、汽車服務、體育休閑服務、生活服務、購物服務、金融保險、醫療保健服務、科教文化、購物服務、公共服務設施、旅游景點等,共獲取了387 145條數據。

4)NPP/VIIRS數據來自美國國家地球物理數據中心(NGDC)2018年發布的夜間燈光月度數據,下載地址:https://ngdc.noaa.gov/eog/download.html。

5)LJ1-01數據來自高分辨率對地觀測系統湖北數據與應用網發布的2018年10月夜光數據,下載地址:http://www.hbeos.org.cn/。

1.3 數據預處理

NPP/VIIRS可以識別微弱燈光,該下載數據還包含了火山、極光、月光、火災以及冰川積雪的噪聲影響,需要進一步處理。研究采用2018年12個月的月度數據,分別針對12個月的數據去除負值和噪聲點,取12個月燈光數據的平均值,之后進行裁剪并重投影為Albers投影,重采樣至500 m,夜間燈光數據分布圖如圖2(a)所示。

LJ1-01在社會經濟統計方面具有非常大的潛力,研究數據采集時間為2018年10月,需對夜光數據進行幾何糾正,鑲嵌、裁剪并重投影為Albers投影,重采樣至150 m,夜間燈光數據分布圖如圖2(b)所示。LJ1-01數據的輻射亮度值與NPP/VIIRS數據不一致,因此需把LJ1-01的燈光值歸化至0~236的范圍,以便于之后的回歸分析比較。

圖2 NPP/VIIRS 和 LJ-01夜間燈光數據分布圖Fig.2 Distribution map of NPP/VIIRS and LJ1-01 nighttime light data

2 研究方法

2.1 人口空間化流程

人口空間化流程圖如圖3所示,首先以行政區劃圖為基礎分別生成500 m×500 m、150 m×150 m的格網,NPP/VIIRS和LJ1-01夜光數據分別經過預處理和歸一化處理后,提取兩種格網內的夜光值,同時將收集的人口數據加入空間滯后模型和空間誤差模型進行回歸預測,比較兩種夜光數據的回歸模型的精度,并加入興趣點以提高模型的預測精度,再以區縣人口統計數據對格網預測值進行修正,然后基于鄉鎮人口統計數據進行最后的精度評價。

圖3 人口空間化流程圖Fig.3 Flow-process of spatial distribution of population

2.2 空間滯后模型

人口的分布常常會受到周圍環境的影響,經典的最小二乘法不能滿足人口空間化的需求,考慮到因變量的空間相關性,故采用空間滯后模型和空間誤差模型搭建人口回歸模型。

空間滯后模型的計算公式為

y=αWy+βx+γ

(1)

式中:y是因變量,指的是格網內的人口數;x是自變量,指的是格網內兩種不同夜光數據的輻射亮度值,是n×k的矩陣;W是n階空間權重矩陣;α和β都表示的是空間回歸系數,γ是獨立誤差項。

2.3 空間誤差模型

空間誤差模型的計算公式為

y=βx+ρWμ+μ

(2)

式中:y是因變量,指的是格網內的人口數;x是自變量,指的是格網內兩種不同夜光數據的輻射亮度值;W是n階空間權重矩陣;ρ和β都表示空間回歸系數,μ是不相關、同方差的獨立誤差項。

2.4 POI融合

POI數據與人類的活動密切相關,且屬性豐富,因此可以把POI數據融入夜光數據,提高夜光與人口的相關性。首先對POI進行核密度分析,大于核密度平均值的格網直接進行灰度值的對數處理,目的是縮小像元間差別,降低模型整體差異[14];小于核密度平均值的像元,需先進行歸一化處理,再進行對數變換。

對于空間上任意一個點S,其核密度值計算公式為

(3)

式中:f(S)是核密度計算值;K是核函數;n表示樣本點數量;R也稱帶寬,是距離衰減閾值。

LJ1-01經過POI處理后的輻射亮度值優化公式為

f(i,j)=K×log [G(i,j)]

(4)

(5)

式中:f(i,j)是經POI核密度計算處理后的第i行第j列珞珈一號夜光數據的亮度值;G(i,j)是珞珈一號夜光數據的原始灰度值;k是由POI計算出來的核密度值;kmean是計算出來的核密度平均值;kmin是計算出來的核密度最小值;K是經過歸一化處理后的核密度值。

2.5 模擬結果精度評定

對NPP/VIIRS和LJ1-01格網化后的500 m×500 m和150 m×150 m的人口單元按區縣數據進行糾正,后以鄉鎮行政區域為單位,分區計算人口模擬值,與統計數據比較后,計算人口預測值的相對誤差。

模擬結果誤差糾正的公式如下:

(6)

(7)

人口回歸預測結果與鄉鎮數據的相對誤差檢驗公式如下:

(8)

3 結果與分析

3.1 人口空間化模型比較

基于NPP/VIIRS夜光數據和人口統計數據建立的模型,其中空間滯后模型的R2是0.882 661,空間誤差模型的R2是0.882 353;基于LJ1-01夜光數據和人口統計數據建立的模型,其中空間滯后模型的R2是0.959 567,空間誤差模型的R2是0.949 470;基于LJ1-01夜光數據、興趣點和人口統計數據優化后的模型,其中空間滯后模型的R2是0.993 504,空間誤差模型的R2是0.989 537。通過比較發現,兩種模型進行回歸分析的精度相差不大,但無論對于哪一種類型的燈光數據,空間滯后模型的精度要略高于空間誤差模型的精度,因此,后續的回歸模型全部采用空間滯后模型進行計算,且整體上LJ1-01模型預測精度要優于NPP/VIIRS,而LJ1-01與POI融合后的模型精度要優于LJ1-01。

3.2 人口格網空間化結果

3種模型的人口空間化結果如圖4所示。由圖4可知:1)3種模型的人口空間化結果大致相同,但以LJ1-01為基礎的人口空間化結果明顯比NPP/VIIRS更能反應人口細節特征;LJ1-01與POI融合結果為基礎的人口空間化結果比LJ1-01具有更豐富層次的人口信息。2)滇中地區人口稠密區分布仍舊集中在昆明主城區,并沿著呈貢方向有向玉溪市集中連片的趨勢,其次是曲靖、楚雄行政中心所在地人口較為集中,呈現城市多核心圈層分布結構,其余地區人口都較為稀疏。3)因POI數據的加入,人口格網打破了行政界線處的突變式變化,城市中心區域與周邊變化自然,更能對比人口的空間差異和人口的真實分布狀態。

圖4 滇中地區人口空間化結果Fig.4 Spatial distribution of population in Central Yunnan Province

3.3 模擬結果精度評定

從整體上看,基于NPP/VIIRS、LJ1-01及LJ1-01與POI融合后夜光數據修正后的人口數分別是1 540.72 萬人、1 571.27 萬人、1 608.53 萬人,與2018年滇中地區人口統計數1 813.94 萬人相比,幾種數據統計結果均與實際值接近,效果較好,各類數據誤差分別為15.1%、13.4%、11.3%,LJ1-01對比NPP/VIIRS結果總體精度提升了1.7%,說明珞珈一號夜光數據在人口細節刻畫上比NPP/VIIRS精度更高;LJ1-01與POI融合后夜光數據對比LJ1-01總體精度也提升了2.1%,說明與POI數據融合后可以提升模型的精度。

為了驗證人口空間化模型的精度,全區域共445個鄉鎮(街道)的行政單元人口統計數據參與計算,同時以鄉鎮(街道)為單元進行格網人口修正值的區域統計,以相對誤差f的大小來衡量人口空間化的精度。若人口預測結果相對誤差小于20%的鄉鎮個數占比較高,則說明精度較高;相反人口預測結果相對誤差大于60%的鄉鎮個數占比較高,則說明精度較低。3種模型的鄉鎮(街道)單元驗證表如表1所示。

由表1可知,從整體上看,NPP/VIIRS夜光數據人口預測結果相對誤差占比最大的區間為20%~40%,LJ1-01結果在小于10%以下的區間占比較大,且比NPP/VIIRS在10%以下的區間占比有所提升,說明LJ1-01比NPP/VIIRS夜光數據更能識別一些細節,精度較高;LJ1-01與POI融合后數據相對誤差占比最大的區間為0~10%,比前兩種數據在同等區間占比有所提升,說明LJ1-01與POI融合后數據在人口識別方面更具優勢。

基于NPP/VIIRS夜光數據人口預測結果相對誤差小于20%的鄉鎮有175個,占比39.3%;基于LJ1-01夜光數據人口預測結果相對誤差小于20%的鄉鎮比前者增加了40個,占比也增加了9%;基于LJ1-01與POI融合后夜光數據人口預測結果相對誤差小于20%的鄉鎮有261個,比之前的兩種數據分別增加了86個、46個,占比分別增加了19.3%、10.3%,說明LJ1-01與POI融合后數據比LJ1-01數據精度有所提升,在人口模擬方面具有更大優勢。

在相對誤差大于60%的區間段,LJ1-01預測結果的鄉鎮個數有49個,占比11%,LJ1-01與POI融合后數據預測結果的鄉鎮個數有20個,比LJ1-01減少了29個,占比減少了6.5%,進一步說明了POI與人口的密切相關,融入后可以明顯改善模型質量。

表1 鄉鎮(街道)單元驗證表Tab.1 Township sample validation

人口預測結果相對誤差小于20%的鄉鎮個數占比越高,則越能準確估計人口[14]。與已有的研究對比發現,胡云鋒等[16]基于DMSP/OLS夜光數據和NPP/VIIRS夜光數據能準確估計人口的鄉鎮占比為33%、38%;高義等[17]基于兩種燈光數據得到的能準確估計人口結果為24%、26%;李爽等[6]利用DMSP/OLS燈光數據得到的鄉鎮占比為55%,均低于本研究的59%,再一次說明珞珈一號夜光數據的高分辨率可以識別出燈光細節特征,同時融入興趣點數據可以提高人口模擬的精度。

4 結論

夜間燈光數據可以間接反映人類活動的范圍和強度,實時可靠、高精度的人口空間分布信息對于研究和表征人類對環境、社會和經濟影響有著重要的意義[16]。本研究基于NPP/VIIRS、LJ1-01兩種夜光數據,采用回歸模型進行人口預測,并融入POI進行人口的預測修正,最后以鄉鎮為單元進行模型的精度評價。

1)通過比較發現,空間滯后模型和空間誤差模型兩種模型進行回歸分析的精度相差不大,但無論對于哪一種燈光數據,空間滯后模型的精度要稍高于空間誤差模型的精度;LJ1-01模型人口預測精度要優于NPP/VIIRS,而LJ1-01與POI融合后的模型精度要優于LJ1-01。

2)以NPP/VIIRS、LJ1-01及LJ1-01與POI融合后夜光數據為基礎的3種模型人口預測結果分布大致相同,人口稠密區仍舊集中分布在昆明主城區及地(州)、區縣級行政中心,并呈現城市典型圈層結構,同時LJ1-01為基礎的人口空間化結果明顯比NPP/VIIRS更能反應人口細節特征。

3)LJ1-01與POI融合后夜光數據對比LJ1-01、NPP/VIIRS總體精度提升了2.1%、3.8%,反映出夜光數據與POI融合后可以提升模型預測的精度。

4)基于LJ1-01與POI融合后夜光數據人口預測結果相對誤差小于20%,較為準確估值的區間段鄉鎮個數有261個,比之前的NPP/VIIRS、LJ1-01兩種數據占比分別增加了19.3%、10.3%,說明LJ1-01與POI融合后數據比LJ1-01數據更具優勢。在相對誤差大于60%的嚴重高估區間段,LJ1-01與POI融合后數據比LJ1-01的結果占比減少了6.5%,進一步說明了POI數據融入后可以提升人口預測模型的精度。

文中融入POI數據后,雖然在一定程度上提高了模型預測的精度,但考慮到多源遙感數據的快速發展,目前研究仍有一些不足,下一步還將融入土地利用數據、手機定位數據等與人口指示因子密切相關的數據,豐富建模的變量,進一步提高精度。

猜你喜歡
夜光格網人口
《世界人口日》
有朝一日,夜光材料會照亮我們的城市嗎?
人口轉型為何在加速 精讀
遙感數據即得即用(Ready To Use,RTU)地理格網產品規范
云南地區GPS面膨脹格網異常動態變化與M≥5.0地震關系分析
樹脂質夜光人造石的研制
實時電離層格網數據精度評估
矢量點狀數據抽稀方法的研究與實現
人口最少的國家
1723 萬人,我國人口數據下滑引關注
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合