?

基于空間插值算法的2014—2018年河南省PM2.5時空分布及演變特征研究

2019-09-10 04:25張馨文
河南科技 2019年8期
關鍵詞:插值克里河南省

張馨文

摘 要:本文選取河南省2014—2018年監測網絡中269個監測站點的空氣質量資料,在地理統計學和GIS的支持下,分別用四種不同的空間插值方法對各年PM2.5年均濃度進行插值,通過模擬精度的對比以及制圖分析發現:泛克里金和普通克里金插值精度較高;而可視化方面普通克里金具有最佳效果。將普通克里金插值結果與前期探索性數據進行整合,得出結論:PM2.5濃度大致從由中北部向四周遞減變為由北部向南部遞減,在東西方向上呈現中部高兩側低的特點,2014年以來河南省大氣質量整體在改善。

關鍵詞:PM2.5;空間插值;時空分布

Abstract: In this paper, selected the air quality data of 269 monitoring stations in the monitoring network of Henan Province from 2014 to 2018, and the annual average concentration of PM2.5 was interpolated by four different spatial interpolation methods with the support of geostatistics and GIS. Through the comparison of simulation precision and cartographic analysis, it was found that Ordinary Kriging and Universal Kriging have the highest accuracy, while the Ordinary Kriging has the best effect in the visual. Combining the Ordinary Kriging interpolation with the ESDA, the result showed that the concentration of PM2.5 is changing from the pattern of decline from north-central to the sidesinto the north to the south, whilein the east-west direction the middle is higher than the sides, and the overall air quality has improved in Henan Province since 2014.

Keywords: PM2.5;spatial interpolation;spatial and temporal distribution

空氣質量與每個人的生活息息相關。但是,隨著我國城市化和工業化進程不斷加快,大范圍霧霾天氣頻頻發生,嚴重影響了居民的健康水平、經濟與環境的可持續發展[1]。作為重點大氣污染源[2],PM2.5一方面粒徑細小,能較長時間懸浮于空氣中,顯著減弱大氣能見度;另一方面,其化學組成復雜,富含大量有害物質,極易損害人體健康。黨的十九大報告中指出“污染防治”是我國全面建成小康社會實現第一個一百年奮斗目標必須打好的“三大攻堅戰”之一,以防治PM2.5為重點的大氣污染防治工作在我國必然被著力推進。然而,近年來,河南省空氣質量形勢不容樂觀,尤其到18年末,多地持續出現霧霾紅色預警,17個地級市中就有12個頻頻登上全國城市空氣質量排行的末位。由此,結合區域特征,利用更適宜的方法探討河南省PM2.5的時空分布規律,成為優化大氣防治措施的關鍵。

國內有關PM2.5時空分布的研究區域主體往往以全國為重點[3-4],而區域尺度上,多數研究基本關注京津冀、長三角等污染核心地帶[5-6],尚未發現以河南省為區域主體的研究。同時,研究數據主要來自遙感反演和地面監測[7]。由于反演所用的光學氣溶膠厚度值(AOD)時間序列上不穩定,只能通過分辨率較粗的氣象數據修正[8],反演模型精度難以提升。針對時間尺度不斷增長的需求,越來越多的學者選擇將研究數據主體轉向具有穩定時序的監測數據。

本文選擇河南省具有完整監測數據的2014—2018年為研究時段,基于392個監測站實時監測的空氣質量數據,利用4種不同空間插值方法探索出PM2.5模擬分布的最佳結果,進而獲得2014—2018年來河南省PM2.5質量濃度時空分布格局和演變規律,為相關研究和河南省大氣污染防治政策優化提供科學的參考依據。

1 研究數據與方法

1.1 研究區概況

河南省位于中國中部,界于北緯31°23'—36°22',東經10°21'—116°39',東接安徽、山東,北接河北、山西,西連陜西,南臨湖北,總面積16.7萬km2,大部分地區屬北亞熱帶向暖溫帶過渡的大陸性季風氣候,南北過渡性明顯。經濟方面,河南省地處沿海開放地區與中西部地區的結合部,是中國經濟活動承東啟西、通南達北的中間地帶。截至2018年,河南省區域總人口和年GDP總量分別位于全國省份排行的第三和第四名。

1.2 數據來源與處理

本實驗的數據主要包括:①從真氣網(https://www.zq12369.com/)上爬取的河南省17個地級市共包括國控點和省控點在內的392個監測站2014年1月1日至2018年12月31日監測的空氣質量數據;②來自2014—2018年《河南統計年鑒》的各縣(市)年末常住人口、GDP數據;③由Esri公司提供的ChinaData矢量數據集(包括省級行政區、地級市、縣城等)。

針對各站點監測的PM2.5逐時濃度數據,剔除了數據不完整的123個站點,余下269個監測站作為后續插值的采樣點(如圖1所示),逐步求得各采樣點24h日平均質量濃度和年平均質量濃度。

1.3 探索性空間數據分析

探索性空間數據分析(Exploratory Spatial Data Analysis,ESDA)不僅能顯示空間數據的內在規律,而且是后續插值方法相關參數和模型選擇的依據。

1.3.1 空間自相關分析??臻g插值建立在空間相關性分析的基礎上,若分析檢測的是同一屬性變量,稱為空間自相關,反映的是一個區域單元上的某種地理現象或某一屬性值與鄰近區域單元上同一現象或屬性值的相關程度[9]。常用Moran’s I系數來描述空間鄰近區域單元的相似程度,計算結果在-1~1,大于0呈正相關關系,屬性值高或低的地區都有聚集現象;若結果小于0,呈負相關關系,數據空間分布呈現高低間隔分布的狀態;絕對值越接近1說明相關性越強,若結果趨近0,則相鄰區域單元相關性低,在研究區呈隨機分布狀態。

1.3.2 同步統計檢驗。同步統計檢驗可以完成檢驗數據分布、尋找離群值以及進行全局趨勢分析等一系列任務。直方圖可以對大量采樣點進行整理加工,找出其數據分布的規律和形態,以便對其總體分布特征進行推斷。QQ圖是一種用于用于檢驗數據分布的相似性的統計圖,被檢驗的采樣點數據越符合所指定的分布,越聚集在一條直線上。趨勢分析圖用X、Y平面表示采樣點位置,用Z軸表示數據屬性值,通過觀察Z軸數據值投影到X、Y平面散點曲線的趨勢,判斷數據是否存在全局趨勢以及其趨勢形態,若存在,可使用某種確定性內插方法生成表面,或通過范克里金或協同克里金模型移除全局趨勢。

1.4 插值方法

采樣點的數量有限,空間分布也不夠均衡,要獲得區域內整體數據的分布認知,必然要進行空間插值??臻g插值的方法多樣,每種方法都有其特點和適用性。用多種方法對PM2.5濃度插值,在保證預測結果適用性的同時還可對比出其誤差規律[10],并探索與PM2.5有較強相關性的因素,為河南省PM2.5濃度預測和調控工作提供參考。

空間插值的公式為:

1.4.1 確定性空間數據插值。反距離加權法(Inverse Distanceweight,IDW)認為,預測點的數據值是其鄰近采樣點綜合貢獻的結果,貢獻程度與距離成反比。確定權重的公式為:

1.4.2 克里金(Kriging)插值??死锝鸩逯捣ú粌H考慮了預測點與鄰近采樣點的空間距離關系,還考慮了其位置關系。該方法建立在區域化變量理論分析的基礎上,以半變異函數作為工具,對有限區域內的區域化變量取值進行線性無偏最優估計。

半變異函數是一個關于數據點的半變異值與數據點間距離的函數,計

1.4.2.2 泛克里金(Universal Kriging,UK)。對不滿足平穩性假設的數據,UK可以對空間坐標表示的變量按照自相關進行回歸分析,即線性無偏最優估計時考慮其趨勢,其模型可表示為:

1.4.2.3 協同克里金法(Collaborative Kriging,CK)。CK是OK區域化變量單個向多個的拓展,通過計算屬性間的半方差函數和交叉半方差函數利用變量間的空間連續性、相關關系[11],較為復雜。

1.5 插值檢驗

1.5.1 交叉驗證。本實驗選擇ArcMap10.4軟件Geostatistical Analyst模塊中的交叉驗證工具調整插值方法的參數,根據平均誤差最接近于零,均方根預測誤差最小,平均標準誤差最接近于均方根預測誤差,標準均方根預測誤差最接近1的標準判斷出克里金插值最合適的半變異函數模型。

1.5.2 子集驗證。實驗通過子集驗證的方式比較四種不同插值方法的精度。先從研究區的269個采樣點中隨機選擇20個作為檢驗站點,剩余249個采樣點作為分析插值數據重新進行插值,各點分布如圖1所示。對不同插值結果的精度選擇絕對平均絕對誤差(Mean Absolute Error,MAE)和均方根誤差(Root-Mean-Square Error,RMSE)進行比較。二者越小插值精度越高;MAE相等時,RMSE越小越好。

2 插值應用過程

首先觀察ESDA結果(見圖2),直方圖顯示年均PM2.5濃度的中位數基本都與平均值較為接近,說明數據接近正態分布;而正態QQ圖則可以顯示出數據總體是傾向于正態分布的,插值前無需進行相應的數據轉換。通過趨勢分析可以發現,河南省各市的年均PM2.5濃度具有一定的空間相關性,其基本趨勢為北高南低,東西向為中部高兩側低。

OK不考慮移除趨勢,其精度主要受半變異函數的影響。本文在保證變異函數的“步長個數[×]步長大小=研究區域長度的一半”的情況下,分別選擇球面、高斯、指數、三角函數四種半變異函數模型進行插值,對比交叉驗證結果后,除2015年選擇三角函數外,其余各年都選擇高斯函數做OK的半變異函數模型。UK綜合了探索性數據分析結果去除數據的趨勢特征,選擇趨勢的移除階數為1,確定高斯函數作為適合表面的核函數,其半變異函數建模過程與普通克里金保持一致。CK考慮霧霾與經濟發展的緊密關聯,分析二者的正交協方差函數云圖后,選擇各市縣的年末GDP作為增加的區域化變量,半變異函數建模過程依舊與OK保持一致。IDW需要確定的參數極少,這里經調試后統一設置指數為2,權重取自15個相鄰要素。

3 實驗結果分析

3.1 2014—2018年河南PM2.5濃度的空間集聚趨勢

實驗利用GeoDa軟件中的Arc Distance距離算法生成空間權重矩陣計算各年的Moran’s I,結果如圖3所示。

從圖3可以看出,PM2.5的分布在2014和2017年具有一定的空間自相關性,存在集聚現象;在2016和2018年存在空間相關性,但相關性不高;而2015年幾乎沒有自相關性。觀測Moran散點圖可以看出濃度值的聚集類型。相關性最強的是2014年,其散點圖中顯示,大部分測點在一、三象限,說明在2014年河南省內PM2.5多呈冷、熱點分明的分布模式。

3.2 插值預測結果分析

3.2.1 不同方法預測結果比較。對插值結果制圖得到不同方法模擬的PM2.5濃度空間分布圖像(圖略)。IDW預測結果非常平滑,但能明顯看出PM2.5濃度的極值只出現在采樣點處,受采樣點分布的影響較大,尤其是在河南省中北部地區產生很多孤立異常的圖斑,與實際分布情況有差距。OK所得濃度結果過渡性好,比較符合實際,可以體現出空間變化趨勢,制圖的視覺效果也很理想,但其存在預測的最高值偏低,而最低值偏高的問題。UK也可以反映出PM2.5的空間變化趨勢,但成圖存在塊狀效果。CK明顯受到GDP變量的影響,使得模擬的PM2.5濃度在部分地區空間變異過大。GDP極值處常有孤立異常的圖斑存在,與實際情況有區別,這也說明實際的PM2.5濃度分布受眾多因素影響,僅考慮GDP作為協同變量還不夠??梢暬螼K最優,可以準確地表現PM2.5的空間分布特征與變化規律。

3.2.2 2014—2018年河南PM2.5的空間分布及動態變化。4種插值方法均大致顯示出河南省的PM2.5濃度分布格局與變化規律,綜合趨勢面分析結果:近年來,PM2.5濃度大致從由中北部向四周遞減變為由北部向南部遞減,在東西方向上依然呈現中部高兩側低的特點。此外,插值預測到的PM2.5濃度的年均值的域值逐年降低,說明2014年以來河南省大氣質量整體上是逐年改善的。

3.3 插值精度分析

由于IDW沒有對預測誤差產生估計,并不適用于交叉驗證,實驗轉而利用子集驗證的方式進行誤差比對,對比結果如表1所示。首先確定實測值與各種插值方法的估算值無顯著差異。

綜合兩指標的計算值及其排序情況得出結論:河南省2014和2016年的年均PM2.5濃度用UK插值所得結果精度最高,2015、2017年和2018年用OK插值所得結果精度最高。雖然不同插值方法插值精度沒有特別顯著的差別,但克里金法要普遍優于確定性空間插值方法。

4 討論與總結

本文選取了2014—2018年河南省17個地級市269個監測站點的空氣質量資料,以此為采樣點檢驗數據分布特征,利用IDW、OK、UK、CK共4種方法分別進行PM2.5年均濃度的插值,制作了各方法模擬各年PM2.5空間分布的圖像,通過交叉驗證確定高斯函數為OK擬合區域化變量的最優函數,接著進行子集驗證,結合ESDA與OK的結果,最后得出結論:①2014和2016年UK的精度最高,2015、2017年和2018年OK精度最高,視覺上OK最能反映空間變化規律;②PM2.5年均濃度大致從由中北部向四周遞減變為由北部向南部遞減,在東西方向上依然呈現出中部高兩側低的特點;③插值預測到的PM2.5濃度的年均值的域值在逐年降低,說明2014年以來河南省大氣質量整體上是逐年改善的。

此外,CK的應用過程表明,近年來,經濟的發展與空氣質量的沖突在逐漸減弱,體現了河南省經濟結構正逐步向與環境協調化發展轉型的特征。深入研究PM2.5的影響因素,如風力風向、濕度、汽車尾氣排放,從而確定最適宜研究區的多協同變量的克里金模型也是今后研究的主要方向。

參考文獻:

[1]Lelieveld J, Evans J S, Fnais M, et al. The contribution of outdoor air pollution sources to premature mortality on a global scale[J]. Nature,2015(7569):367-371.

[2]盛黎,繆育聰,徐權周,等.對話黃順祥:走近中國大氣污染防治[J].科學通報,2018(16):1515-1518.

[3]王振波,方創琳,許光,等.2014年中國城市PM2.5濃度的時空變化規律[J].地理學報,2015(11):1720-1734.

[4]李名升,任曉霞,于洋,等.中國大陸城市PM污染時空分布規律[J].中國環境科學,2016(3):641-650.

[5]楊興川,趙文吉,熊秋林,等.2016年京津冀地區PM2.5時空分布特征及其與氣象因素的關系[J].生態環境學報,2017(10):1747-1754.

[6]戴昭鑫,張云芝,胡云鋒,等.基于地面監測數據的2013—2015年長三角地區PM2.5時空特征[J].長江流域資源與環境,2016(5):1004-8227.

[7]熊歡歡,梁龍武,曾贈,等.中國城市PM2.5時空分布的動態比較分析[J].資源科學,2017(1):136-146.

[8]張云芝.基于地面監測和遙感反演的京津冀地區PM2.5時空分布研究[D].呼和浩特:內蒙古師范大學,2016.

[9]劉湘南,王平,關麗,盧浩,張春曉.GIS空間分析[M].3版.北京:科學出版社,2008.

[10]朱求安,張萬昌,余鈞輝.基于GIS的空間插值方法研究[J].江西師范大學學報(自然科學版),2004(2):183-188.

[11]章清,張海濤,郭龍,等.基于主成分分析的協同克里格插值模型對土壤銅含量的空間分布預測[J].華中農業大學學報,2016(1):60-68.

猜你喜歡
插值克里河南省
大銀幕上的克里弗
無定河流域降水量空間插值方法比較研究
河南省體育館近年承辦的主要賽事
你今天真好看
河南省體育館近年承辦的主要賽事
你今天真好看
福州市PM2.5濃度分布的空間插值方法比較
不同空間特征下插值精度及變化規律研究
要借你個肩膀嗎?
基于混合并行的Kriging插值算法研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合