?

基于多元分區建模指標優化的“一帶一路”人口空間化研究

2021-07-08 10:42徐甜雨趙學勝陳芳馨楊藝
自然資源遙感 2021年2期
關鍵詞:平原區弱光高光

徐甜雨,趙學勝,陳芳馨,楊藝

(中國礦業大學(北京)地球科學與測繪工程學院,北京 100083)

0 引言

人口與自然環境、社會發展息息相關,是推動自然地理特征形成和社會發展的重要因素[1-2]。目前,各國獲取人口數據的主要途徑是人口普查,但人口普查數據在統計和應用過程中存在以下局限性:①數據更新慢,大部分國家通常十年或更長時間進行一次人口普查;②數據較為粗糙,無法在更小尺度(行政單元內)反映人口空間分布特征[3];③人口普查數據與其他環境數據(例如空氣污染物,溫度等)結合比較困難,阻礙了人類與環境系統之間的跨學科研究[4]。人口空間化是解決上述問題的有效方法之一,它通過相關的模型或者算法,結合影響人口分布的影響因子對人口普查數據進行空間離散化處理[5],其結果能夠極大程度地解決人口統計數據在計算分析時的界線限制問題,目前在疾病風險評估、人類健康適應性政策和防災減災等領域得到了廣泛應用[6-8]。

隨著遙感和地理信息技術的快速發展,人口空間化研究進入快速發展階段,陸續出現面積權重法、多因素融合法和遙感估算法等[5]。但由于區域差異,不同的方法模型有不同的適用范圍。為了提高人口空間化的精度,研究者們嘗試以分類分區的方式對研究區進行建模,例如田永中等[9]劃分了農業生態區;Wang等[10]、王明明等[11]按城鄉分區建模。這些研究通過分區建模有效提高了人口空間化的精度,但在各分區采用了相同的人口分布指標,未考慮人口分布指標在不同地區的空間差異性,僅通過構建不同的數學模型體現各分區的差異。因此,一些研究者嘗試在不同的分區采用不同的人口分布指標,例如在城鄉分別采取夜間燈光和土地利用數據作為建模指標[12]。但隨著人口急劇增長,人口分布區域逐漸呈現多元化,僅針對城鄉分區的建模指標優化已無法滿足人口空間化研究的需要。其次,由于數據和尺度的限制,這些指標優化往往忽略了功能區之間人口分布的空間差異性。因此本文從分區指標選擇、細化功能區人口差異方面展開對大區域多元分區指標優化的相關研究。

近幾十年夜間燈光數據被廣泛應用于各項人口產品及研究模型中[13-15],但由于數據限制,基于夜間燈光統一建模容易造成高光地區人口被低估、弱光地區被高估的現象[16]。其次,隨著人口的急劇增長,人地關系愈發緊張,地形地勢逐漸成為影響人口分布的重要因素[17]。本文通過分析“一帶一路”沿線國家的地理特征,提出了以夜間燈光和坡度控制的4類地理分區模式,即高光平原區、高光丘陵區、弱光平原區和弱光丘陵區,采用差異化構建人口分布指標、融合功能區人口指數等措施探討多元分區中人口分布指標優化的可行性。并以塔吉克斯坦為研究區生成空間分辨率為30 m的人口密度圖,進而與多分區單一指標建模結果進行對比,以期驗證本文多元分區建模指標優化的可行性。

1 研究方法

人口空間化主要包括多元分區、人口分布指標優化、構建動態回歸模型以及空間化結果誤差分析4個步驟??傮w框架如圖1所示,其中RE為相對誤差(relative error,RE),NTL_POP和HSI_POP分別為基于夜間燈光和宜居指數的模擬結果,TJK_POP為基于本文模型獲得的塔吉克斯坦30 m人口分布圖。

圖1 建模流程Fig.1 Modeling process

1.1 多元分區

本文參考卓莉等[18]的研究通過計算各市燈光面積占居住面積的百分比確定燈光分區的閾值,當超過60%時,將該區域設為高光區,反之則為弱光區。坡度閾值則通過房屋密度隨坡度變化的曲線確定,將房屋密度隨坡度增大逐漸減小時的節點作為坡度分區的閾值。將上述閾值確定的高光平原區、高光丘陵區、弱光平原區以及弱光丘陵區作為本文研究多元分區指標優化的基礎區域。

1.2 人口分布指標優化

1.2.1 功能區人口指數

功能區決定了人口分布的種類及密度,例如機場、火車站主要以流動人口為主,而居住區主要為常住人口。但目前功能區的獲取主要依賴于興趣點(point of interest,POI)數據,受數據限制,研究多局限于國內北京、上海等一線城市[19-20]。其次,僅依靠數學模型體現各功能區人口空間差異,可能出現多重共線性問題,造成某些功能區人口出現負值的現象[16]。為細化人口在不同功能區的差異,削弱流動人口帶來的影響。本文基于10 m空間分辨率的地表覆蓋數據,結合功能區的社會屬性,提出了功能區人口指數。

10 m分辨率地表覆蓋數據包含耕地、森林、草地、人造地表等10個一級類和坑塘、河渠等21個二級類,其中與人口分布密切相關的人造地表又被細分為房屋建筑區、交通、機場等7個二級類。本文基于人造地表的二級類將各分區劃分為居住區、工業區、交通以及其他4類,其中居住區主要以居民建設用地為主,工業區包括各類工廠、采礦、倉儲業用地,交通涵蓋機場、車站、港口等,其他則包含一些無法確定其社會屬性的區域,如獨立施工區等。統計各市總人口與上述各類功能區面積,在SPSS軟件中構建人口與各功能區的偏相關性分析,將偏相關系數作為各功能區人口指數(λ)。

1.2.2 構建多元分區人口分布指標

1)高光平原區。該區地勢平坦,人口分布受地形地勢影響較弱,且夜間燈光表現良好,無光區域較少,因此,直接以夜間燈光作為該區域的人口分布指標。

2)高光丘陵區。在高光平原區的基礎上融合了坡度因子,提出了改進的坡度夜間燈光指數(slope adjusted nighttime light index,SNTLI)。將該區域的坡度每隔2°進行重分類,統計各等級坡度中居住區的面積占比作為該等級坡度的權重,融合夜間燈光與坡度權重建立SNTLI,即

SNTLI=NTL·Wslope,

(1)

式中:NTL為夜間燈光;Wslope為坡度權重。

3)弱光平原區。該區夜間燈光值較小,人口分布受能源供應、植被覆蓋等因素的影響較大,僅使用夜間燈光估計人口分布是不準確的[13],因此本文選擇宜居指數(human settlement index,HSI)作為人口分布指標,HSI利用16 d MODIS影像增強植被指數(enhanced vegetation index,EVI)產品和NPP/VIIRS圖像計算得出,公式為:

(2)

式中:EVImax為2015年的12張16 d MODIS EVI復合圖像的最大圖像;NTLnor為NPP/VIIRS圖像的規范化DN值。

4)弱光丘陵區??紤]到地形地勢的影響,在弱光平原區的基礎上融合了坡度因子,參考Sun等[13]提出的坡度修正的人類宜居指數(slope adjusted human settlement index,SAHSI)作為該區域指示人口分布的指標,公式為:

SAHSI=HSI(1-Slopenor),

(3)

式中Slopenor為坡度除以90°進行歸一化處理后的值,單位為(°)。

1.3 構建動態回歸模型

每個分區內部由于社會背景、生活方式的不同,人口分布仍存在差異,為保證模型應用的精確度,在各分區內根據人口與分布指標的實際分布關系進行動態分區,適當調整各分區的建模系數。具體過程如下:

1)結合上文提出的各分區人口分布指標、功能區人口指數與人口普查數據構建各分區人口回歸模型,得到人口初步模擬結果,公式為:

(4)

式中:popi為第i分區的人口;ai為第i分區模型權重;indexij為第i分區內第j類功能區的人口分布指標數值;λj為第j類功能區的人口指數。

2)統計各分區內各市人口普查數據與初步人口模擬結果的RE,公式為:

RE=(POPm-POPs)/POPs×100%,

(5)

式中:POPm為模擬人口;POPs為人口普查數據。

3)對于RE=0或分區內城市數量低于樣本總數10%(本研究設定市域數量小于6個)的區域,保留原來的回歸模型,其余區域則根據RE<0和RE>0劃分為兩個子區域,進行二次建模,并將二次建模結果作為最終各分區的人口回歸模型。

1.4 空間化結果誤差分析

分別采用相對誤差絕對值|RE|和平均相對誤差(mean relative error,MRE)評估人口密度估計的準確性。MRE計算公式為:

(6)

式中n為參與建模的城市個數。

此外,為了體現本文人口分布指標優化的可行性,分別從整體和局部兩個方面對比分析了本文模擬結果與基于夜間燈光和HSI指數單一指標模擬結果的差異。

2 研究區及數據源

2.1 研究區概況

塔吉克斯坦是位于中亞東南部的內陸國家,全國共包括3個州、1個區、一個直轄市,共59個地級市,總人口約900萬,國土面積為14.31萬km2,西部和北部分別與烏茲別克斯坦、吉爾吉斯斯坦接壤,東鄰中國新疆,南接阿富汗(圖2)。塔吉克斯坦境內山地和高原占90%,有“高山國”之稱。近些年隨人口的急劇增長,山地丘陵逐漸成為居住地的選擇。另外,塔吉克斯坦作為中國“陸上絲綢之路”的重要通道,是中國與歐洲和撒哈拉地區經濟聯系的橋頭堡,具有重要戰略地位。

圖2 塔吉克斯坦共和國行政區劃示意圖Fig.2 Administrative divisions of the Republic of Tajikistan

2.2 數據源及數據預處理

研究所涉數據源如表1所示。為保證面積變形最小,將所有數據源統一為Albers等面積圓錐投影(中央經線設置為E71°,兩條緯線分別設置為N37.41°和N40.35°),柵格數據重采樣至30 m空間分辨率,并使用塔吉克斯坦行政邊界矢量數據將所有柵格數據裁剪至研究區范圍。

表1 數據源列表Tab.1 List of data sources

3 人口數據空間化結果分析

3.1 人口數據空間化

根據閾值法將塔吉克斯坦劃分4類地理分區,計算各功能區人口指數(表2),建立各分區人口與人口分布指標之間的回歸模型,得到初步人口模擬結果。根據公式(5)計算4類分區的RE,對滿足動態分區條件的分區進行二次建模,經統計高光平原區和高光丘陵區由于建模數量較少,因此保留初步回歸模型,分別為A1,A2區域,弱光平原區和弱光丘陵區中RE>0和RE<0的區域分別組成A3—A6子區域,進行二次建模。將具有最高方程擬合度(R2)的擬合曲線作為最終的人口密度模型(表3)。

表2 功能區人口指數Tab.2 Functional zone population index

表3 建模結果Tab.3 Modeling results

由于模型誤差的影響,每個行政單元的初始人口模擬值和實際人口統計值不一致,因此建立各分區的修正公式,對網格的初始模擬結果進行調整,最后將調整后的網格人口數轉換成30 m柵格數據。修正公式為:

(7)

式中:popij為第i個行政單元內第j個網格的模擬人口數量;popij0為第i個行政單元內第j個網格的初始人口數量;Pi0為第i個行政單元初始模擬人口統計值;Pista為第i個行政單元人口統計值。

3.2 人口數據空間化結果分析

塔吉克斯坦人口分布具有明顯的空間差異性,TJK_POP(圖3)顯示,塔吉克斯坦人口分布整體呈現西多東少的分布格局,西部有錫爾河、阿姆河、瓦赫什河等河流穿境而過,水資源豐富,并且地勢相對平坦,分布有瓦赫什谷地、費爾干納盆地等,人口密度較大,其中高人口密度主要分布于杜尚別、苦盞、庫爾干秋別、庫洛布等資源豐富、經濟發達的城市。而中部和東部則主要以山地丘陵為主,海拔較高,河流較少,人口分布相對稀疏,例如塔吉克斯坦東部的戈爾諾—巴達赫尚州面積占全國的44.6%,而人口僅占2.4%;其次,4類分區人口模擬結果(圖4)顯示,高光區人口(圖4(a)和(b))與弱光區(圖4(c)和(d))人口分布具有明顯的密度差異。高光區人口分布以高密度人口為主,并且人口呈塊狀分布,人口密度高低與距市中心的距離在分布趨勢上呈現近似正比關系,市中心人口聚集度最高,向外圍逐漸減少。而弱光區人口密度較低,大部分區域人口密度低于5人/柵格,人口沿河流呈零星分布,總體為較為雜亂的分布格局。

圖3 塔吉克斯坦30 m人口分布圖(TJK_POP)Fig.3 Tajikistan 30 m population distribution map(TJK_POP)

(a)高光平原區 (b)高光丘陵區

3.3 對比分析

為體現本文多元分區指標優化的可行性,本文以|RE|和MRE為依據,分別從整體和局部對比了TJK_POP與NTL_POP、HSI_POP的精度,并以高光平原區為例分析了功能區人口指數的可行性。

整體上TJK_POP相較于NTL_POP和HSI_POP精度有明顯改進。經統計TJK_POP的MRE為22.57%,相較于NTL_POP和HSI_POP,精度分別提高了16.98%和10.39%。其次,根據TJK_POP |RE|分布圖(圖5)可知,TJK_POP中|RE|<10%的城市數量占25.4%,主要分布于中西部,72.89%的城市|RE|在[-30%,30%]以內,|RE|>50%的城市數量僅占11.9%,主要分布于戈爾諾—巴達赫尚州,造成該州誤差較大的原因主要是該區域人口分布零散,居民區面積較小,造成很多區域人口被忽略。由此可見本文針對多元分區的指標優化在塔吉克斯坦具有可行性。

圖5 TJK_POP |RE|分布圖Fig.5 Absolute value of relative error distribution

TJK_POP在4類分區的精度相較NTL_POP和HSI_POP均有不同程度的提升。4類分區|RE|對比圖(圖6)顯示:①在高光平原區和弱光平原區,TJK_POP分別與NTL_POP和HSI_POP呈相似的誤差分布趨勢,但經統計在上述區域分別有88.9%和73.9%的城市,TJK_POP的精度高于另外兩類模擬結果,而誤差偏高的區域主要是由于缺少詳細的行政區劃數據造成基于市級樣本統一構建的功能區人口指數忽略了各市之間的差異,因此造成某些城市人口被誤估;②高光丘陵區TJK_POP的MRE經統計為19.33%,其中各城市的|RE|均低于NTL_POP和HSI_POP,精度有明顯提升,由此可見,隨著地形地勢對人口分布影響力的增加,融合夜間燈光與坡度的人口分布指標更適合高光丘陵區域的人口空間化研究。③在弱光丘陵區,TJK_POP與NTL_POP和HSI_POP三者的MRE經統計分別為24.97%,54.13%和35.51%,TJK_POP與HSI_POP的精度要遠優于NTL_POP,由此可見HSI指數更適合該類型區域的人口空間化,并且TJK_POP相較于HSI_POP大部分區域誤差集中分布于[10%,30%]之間,精度更高。

(a)NTL_POP&TJK_POP

功能區人口指數反映了人口的實際分布情況,減少了流動人口導致的人口誤估問題。選擇高光平原區北部區域作為驗證區,根據驗證區的功能區人口指數優化對比圖(圖7)可以發現,TJK_POP和NTL_POP整體呈相似的人口分布趨勢,人口均主要分布于居住區,但TJK_POP展現了更符合實際情況的人口分布信息,例如TJK_POP的居住區人口密度更高,車站、工業區人口較為稀疏。造成這種分布的主要原因是通過融合功能區人口指數,TJK_POP減少了機場、車站、工業區等功能區的經濟活動、人口流動對人口分布的影響,降低了這些區域的人口權重,從而使人口更多地集中分布于人口統計的居住區。

(a)NTL_POP (b)TJK_POP (c)高光平原區功能區分布

4 結論和討論

分區建模已成為人口空間化研究的必要過程,本文以高光平原區、高光丘陵區、弱光平原區以及弱光丘陵區4類分區為基礎,通過構建功能區人口指數、選擇適宜指標、結合樣本動態建模等措施對多元分區指標優化進行了系統的研究,并以“一帶一路”沿線國家—塔吉克斯坦為研究區模擬了2015年30 m人口分布圖。通過與人口普查數據、NTL_POP和HSI_POP進行對比,發現本文針對這4類分區的指標優化具有顯著的效果,基本可以滿足大區域人口空間化研究的需要。同時針對一帶一路沿線部分國家特征提出的多元分區以及指標優化方法也對一帶一路人口空間化研究具有重要的現實意義。

1)基于夜間燈光和坡度提出的4類地理分區涵蓋了影響人口分布的經濟和自然因素,對“一帶一路”沿線大部分國家都具有參考意義,相應的針對不同分區提出的人口分布指標也為類似國家人口空間化研究提供了一類普適性指標,加強了中國對“一帶一路”沿線國家人口的了解,對促進共同發展、實現共同繁榮的合作共贏之路具有重要的現實意義[21]。

2)“一帶一路”連接國家眾多,各國人口空間分布不但在宏觀區域差異巨大,城市內部差異也比較明顯,功能區人口指數的應用體現了城市內部的人口分布差異,減少了通勤、出行的流動人口對實際居住人口分布的影響。

但由于數據限制,本研究尚有如下不足,需要在后續研究中完善:

1)由于缺少塔吉克斯坦精細的行政矢量數據,本文是基于市級行政區劃展開研究,因此造成部分區域誤差超過50%。在今后的研究中,可以考慮以更加精細的行政數據為基礎,提高人口空間化的精度。

2)由于城市數量的限制,本文基于樣本動態分區僅是基于RE的正負進行了二次分區,因此造成研究區中部分區域擬合效果較差,誤差較大的現象,在后續研究中,可以嘗試更為細致的動態分區。

3)本文主要集中于研究人口數量與自然經濟要素的關系,沒有反映年齡、性別及人口流動等人口結構空間特性,因此,在后續研究中可以基于本文將人口空間化研究擴展為性別、年齡空間化專題。

猜你喜歡
平原區弱光高光
想做聯名爆款?超級飛俠、熊出沒、奧特曼等“高光”IP等你來聊
季后賽高光時刻喬爾·恩比德沒有遺憾
太陽能聯棟溫室耐弱光蔬菜養心菜栽培初探
釋放出來自HDR的高光力量 Optoma奧圖碼UHZ880
河北省平原區新近系熱儲回灌的可行性與前景分析
河北省平原區館陶組熱儲地下熱水動態特征
保定市平原區淺層地下水水質變化趨勢
拔節期弱光脅迫對揚麥15麥秸營養成分和體外發酵的影響
四苯基卟啉鈀(Ⅱ)/9,10-二苯基蒽弱光上轉換體系的介質效應
基于Moldflow 的高光無痕電視前殼注射模具設計
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合