?

基于探索性空間數據分析的中國人口生育率空間差異研究

2015-10-09 13:40夏磊
西部學刊 2015年9期
關鍵詞:空間自相關區域差異

摘要:21世紀初我國總和生育率已降到1.5,遠低于更替水平,因此研究中國的生育水平對于我國人口健康穩定發展十分重要。本文以港澳臺之外的大陸31省為研究區,以2000、2005和2010年的總和生育率為衡量指標,采用探索性空間數據分析(ESDA)方法,通過ARCGIS、Geoda等軟件對我國總和生育率的空間演變趨勢及分布模式進行探索性空間分析。結果表明:2000、2005和2010年我國的生育水平在空間分布上呈現正的空間自相關,但是這三年的全局空間自相關趨勢有所減弱;我國生育水平高值聚集區主要分布于西部省份,并且以西南為高值聚集中心;我國生育水平低值聚集區域主要分布在東北、東部沿海省份,其低值中心是以吉林為代表的東北地區。

關鍵詞:總和生育率;空間自相關;空間模式;區域差異

中圖分類號:P208 文獻標識碼:A 文章編號:

一、引言

Wolfgang lutz等人(2005)提出了“低生育率陷阱”的假設,即生育率一旦下降到一定水平(1.5人)以下,如果生育率一直低于世代更替的平衡水平,會對人口的規模、結構和安全造成嚴重的不利后果,而且對于后期的人口均衡發展而言,也會帶來難以消除的障礙。[1-2]確保不低于世代更替的生育率,是社會可持續發展的保證。2010年全國生育率為1.18110,其中“城市”為0.88210,“鎮”為1.15340,“鄉村”為1.43755,中國的總和生育率不到世界平均生育水平的一半,并且遠低于發達國家的平均水平。[3]82對于我國的人口發展而言,現如今出現的低生育率現象是一種極其危險的警示,因此認真研究中國低生育率現象極為重要,且有利于中國人口的健康發展。

國內學者對中國生育率研究主要集中在三個方面:一是對生育政策的厘清,二是對低生育率的確認,三是對政策調整的探討。[4]然而傳統的中國人口生育率研究注重的是生育水平的差異和生育轉變模式,但卻無法反映人口生育率在空間關系和數值關系共同作用下的空間模式特征,而探索性空間數據分析(ESDA)可以解決這一問題。探索性空間數據分析已廣泛用于區域經濟、疾病控制等領域,但是很少應用到人口生育研究方面,因此本研究可以將探索性空間數據分析應用于低生育水平下的全國生育率區域差異研究,分析2000—2010年省級總和生育率的時空差異。同時可以通過對全國省級區域的生育差異特征研究,揭示生育率數據的空間效應。

二、數據來源和分析方法

(一)數據來源

此次研究區域是除香港、澳門和臺灣以外的中國31個省市區的數據,以國際學術界認可的總和生育率作為衡量指標,本文數據源自中國國家統計局公布的中國人口統計年鑒(見表1)。[5]

由我國人口統計年鑒得到的2000、2005和2010年中國31省區人口總和生育率數據,需利用Office excel進行處理,導出excel格式的數據表。借助ARCgis平臺,在中國地圖中提取出除港澳臺以外的大陸31個省區作為基礎底圖,將這三年人口總和生育率數據表同底圖關聯,導出各省區總和生育率的shapefiles文件,再將其導入GeoDa軟件,進行空間數據探測與空間自相關分析。

利用GeoDa的explore工具,對總和生育率數據的宏觀情況進行探查。箱形圖(Box Plot)是描述變量非空間分析的基本EDA方法之一,它顯示分布的中值、第一和第三分位數,同時也顯示離群值。通過建立的總和生育率數據箱形圖,可得出:

(1)總和生育率最大值分為2.19(貴州)、1.935(貴州)和1.79(廣西),最小值分別為0.67(北京)、0.668(北京)和0.707(北京)。

(2)總和生育率的中值分別為1.26(重慶)和1.39(青海)。

(3)總和生育率平均數分別為1.265、1.348和1.186。

(4)總和生育率標準差分別為0.3561、0.335和0.2871。

(二)研究方法

1.空間權重矩陣

空間權重矩陣是建立地理對象之間空間關系不可或缺的一部分,是觀測對象之間空間依賴的正式表達。[6]通常用一個二元對稱空間權重矩陣W來表示n個區域的鄰近關系,其中 為區域i和j的鄰近關系,公式如下:

利用Geoda創建空間權重矩陣。對空間權重矩陣有兩種定義方式,分別為Rook鄰接和Queen鄰接。Queen鄰接是在Rook上下左右鄰接關系的基礎上加上了對角線,此次空間權重的定義選用一階Queen鄰接關系。

由于海南省的空間位置特殊性,與其他省區在空間位置上是孤島,為了更好地表達海南省與周圍省份的空間鄰接性,本文為使海南省與廣東、廣西兩省為鄰接關系,在創建空間權重矩陣過程中人為地調整了空間權重,得到調整后的 空間權重矩陣。

2.全局空間自相關

式中N為空間區域數量, 為i區域觀測變量總和生育率的值, 為i和j區域之間的空間權重;[8]I系數取值從-1到1;當I=0時代表空間不相關,取正值時為正相關,取負值為負相關。[9]

3.局部空間自相關

全局空間自相關指標可以探查觀測值空間上的整體分布情況,但卻難以探查屬性值聚集的具體位置及區域相關的程度。因此在1994年,Anselin 提出了局部空間關聯指數 LISA(Local Indices of Spatial Association)彌補了Morans I的局限,該指數能揭示空間參考單元與鄰近空間單元屬性特征值間的相似性,探測空間異質性。[10]

式中, 和 為觀測值 與均值的偏差。當 值大于0,表明該區域與周圍區域的屬性值相似,即為高值或低值聚集;如果I值小于0時,表明該區域與周圍區域的屬性值不相似,即為高值被低值包圍或低值為高值包圍。同時本文保持區域i的值固定不變,對于區域i鄰近的空間單元的觀測值進行隨機排列,以此檢驗局部MoranI的顯著性。為得到反映顯著性水平的P值,需要在每次排列后重新計算I,并在零假設條件下,比較I值與原始的I值的大小。

4. Moran散點圖

Moran散點圖軸的中心為平均值,將圖分為四個象限,依次對應不同的空間自相關類型,第一、二、三、四象限分別代表該散點對應的地理區域具有高-高聚集模式、低-高異常模式、低-低聚集模式以及高-低異常模式。散點圖的回歸擬合線的斜率顯示了空間數據的空間自相關程度,通過圖形的交互,我們能夠進一步探查空間數據存在哪些空間自相關影響比較大的局部重要區域。Moran散點圖描繪了考察變量與其空間滯后項的關系,表示考察變量局部區域范圍內的空間分布特征。[11]

三、研究結果

(一)全局空間自相關指數趨勢分析

通過地理信息系統軟件對中國地圖進行處理,提取出除港澳臺以外的中國大陸地區,作為創建空間權重的重要基礎性文件。之后運用GEODA軟件,對這三年數據進行空間分析,得出中國31個省、直轄市、自治區總和生育率的全局自相關指數(見表2)。在創建空間權重矩陣過程中,必須確保表格中的歷年總和生育率數據與權重文件中相應的鄰接實體能夠實現完全匹配。如表2所示,三年的中國總和生育率所對應的全局Morans I值均為正值,且維持在顯著水平,說明31個省區總和生育率在地理空間的總體分布并不是隨機的,而是存在正向空間自相關,總和生育率值相似的省份趨于空間聚集,即高值省份相互聚集,低值省份相互聚集。

就變化趨勢而言, Morans I指數值呈現下降趨勢, 2005年下降的尤為明顯。這說明這三年,我國生育水平的全局空間自相關趨勢減弱,但在2005年生育水平的基礎上,2010年某些空間聚集區域有所擴展或在2005年基礎上發展了新的空間聚集區域。雖然2000、2005和2010年我國省級總和生育率(TFR)的空間聚集程度呈現波動性,但總的來說,總和生育率在空間分布上仍為正的空間自相關。

(二)Moran散點圖

如圖1橫軸表示總和生育率標準化值,縱軸為相鄰區域總和生育率標準化均值。每個象限對應不同的空間自相關類型:高-高和低-低為正相關,低-高和高-低為負相關。

從圖1、表3可以看出,大部分省份位于第一、三象限內,表現出正的空間自相關。甘肅、廣西、貴州等7個省份三年都屬于“高-高”型,在空間分布上為典型的空間聚集分布。2005年“高-高”型陣列中加入安徽、湖北??傮w上來說,“高-高”型的省份主要集中于西部省份?!暗?低”型變化不大,主要集中于北京、福建等10個東部省份,其中東北三省全部為“低-低”型,這說明這些區域總和生育率較為顯著地表現為空間的聚集分布。而“低-低”型省份中明顯的變化為2005年山東省落入了“高-高”型行列中??偤蜕实椭稻奂瘏^域主要集中于東部沿海和東北三省。

同時Moran散點圖也有助于發現負局部空間自相關區域,即空間上為離散分布。位于第二象限的“低-高”型區域和第四象限的“高-低”型區域都屬于負局部空間自相關。由圖1、表3可知,這兩類省份數量相比較而言較少?!暗?高”型省份以廣東、陜西、重慶三省最為顯著,“高-低”型區域典型的為海南、河北、寧夏三省。同時2000年屬“低-高”型的湖北、四川2005年落入了“高-高”型區域,2000年屬“高-低”型的安徽、河南、江西和山西四省2005年進入其他三類區域中。2005年屬“低-高”型的河南2010年落入了“高-高”型陣列,2005年屬“高—低”型省份的江西、山西分別落入“高-高”型和“低-高”型區域。

2000年以后中國人口生育水平在空間分布上日趨穩定,總體變化幅度不是很大。高生育水平主要集中于西部省份,低生育水平地區分布區域穩定,主要在東北、沿海形成集聚帶人口總和生育率呈現這種分布格局,而中部省份的生育水平這三年波動相對大一些。

(三)基于LISA聚集模式圖的局部空間自相關分析

使用Geoda中的LISA聚集模式圖功能對中國31個省的總和生育率進行分析,分析結果如圖2。顯示在LISA聚集圖中的所謂空間聚集為聚集中心,從圖2分析可知:

(1)2000年高—高聚集模式熱點中心分別為云南和青海;2005年則只剩云南;2010年高—高聚集模式熱點中心在2005年云南的基礎上增加了廣西與湖南。這表明,2000年我國總和生育率高值聚集區域集中于西南、西北的西部地區,隨后兩年出現轉移:2005年高生育水平省份集中于云南、西藏、貴州等西南省份;2010年高生育水平省份除了西南,還增加了以湖南為熱點中心的中部省份,我國高生育水平聚集區域以西南地區為中心,由西北轉移到了以湖南為代表的中南地區。

2000年低—低聚集模式冷點中心為吉林;2005年低—低聚集模式冷點中心仍為吉林,2010年冷點中心在吉林的基礎上加上了內蒙古。由此可以看出,2000、2005年我國總和生育率低值聚集區域是以吉林為中心的東北地區。2010年總和生育率低值聚集區域擴展到了以內蒙古為中心的北部地區,我國低生育水平區域有所擴展。

總的來說,2000、2005和2010年顯著的高—高聚集模式熱點中心、低—低聚集模式冷點中心仍為少數地區。

(2)2000年,四川的生育水平相對較低,其鄰接的西北、西南地區的生育水平相對較高,四川表現為顯著的低—高異常模式。2010年,廣東的生育水平相較于鄰近的廣西、湖南、海南等省份總和生育率值較高,表現為典型的低—高異常模式。

(3)2005和2010年,與河北鄰近的華北地區的總和生育率較低,其本身的生育水平較高,因此河北表現為顯著的“高—低”型異常模式。

四、討論

由上述分析,可以得出以下結論:(1)2000、2005和2010年我國的生育水平在空間分布上呈現正的空間自相關,但是這三年其全局空間自相關趨勢有所減弱。(2)我國生育水平高值聚集區域主要分布在西部省份,并且以西南為高值聚集中心;我國生育水平低值聚集區域主要分布在我國東北、東部沿海省份,其中心是以吉林代表的東北地區。

2000、2005和2010年我國生育率水平的空間差異仍保持一定的東西差異,與我國社會經濟發展水平的空間格局相適應。但局部細節特征仍值得分析,我們在研究空間差異原因時,需對我國總和生育率分布區域做進一步的劃分。比如四川省與西北西南顯著不同的低生育水平原因,河北省生育水平明顯高于鄰接的華北地區省份的原因,2010年以湖南為代表的中南地區呈現高值聚集的原因,值得我們進一步研究。

參考文獻:

[1]趙維祥.超低生育率現象及其影響研究[D].安徽大學碩士學位論文,2012.

[2]劉忠良.中國崛起與新人口危機[J].決策與信息,2014(4).

[3]郭志剛.中國的低生育水平與被忽略的人口風險[M].北京:社會科學文獻出版社,2012.

[4]許靜.中國低生育水平與意愿生育水平的差距[J].人口與發展,2010(1).

[5]國家統計局.中國統計年鑒[M].北京:中國統計出版社,2005-2010.

[6]梁洪運,周其龍等.空間權重矩陣對空間自相關影響分析[J].科技資訊,2013(9).

[7]張松林,張昆. 空間自相關局部指標Moran指數和G系數研究[J].大地測量與地球動力學,2007(3).

[8]張旭,朱欣焰等.中國人口生育率的時空演變與空間差異研究[J].武漢大學學報,2012(5).

[9]許莉.基于空間統計與GIS的廣西GDP空間自相關分析[J].學術論壇,2012(8).

[10]Luc Anselin.Local indicators aossociation-LISA[J].Geographcial Analysis,1995.

[11]馬妍,劉爽.中國省級人口轉變的時空演變進程—基于聚類分析的實證研究[J].人口學刊,2011(1).

作者簡介:夏磊,男,云南宣威人,主要從事自然地理方面研究。

(責任編輯:李直)

猜你喜歡
空間自相關區域差異
區域差異的就業質量評價指標體系的構建與應用
我國城鄉居民財產分配現狀及區域差異研究
商貿流通業對經濟發展貢獻的區域差異分析
我國工業資本配置效率的空間異質性分析研究綜述
基于空間自相關分析的中國國民體質綜合指數研究
城鎮化、商業化與農村金融
我國省域經濟空間收斂性研究
基于因子分析與層次分析的中國區域差異綜合指數的構建與研究
中國生態文明發展水平的空間差異與趨同性
廣東省人口老齡化的時空演化及成因分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合