?

ERA-Interim和ERA5再分析數據在江蘇區域的適用性對比研究

2021-09-09 03:59呂潤清李響
海洋預報 2021年4期
關鍵詞:氣象要素適用性站點

呂潤清,李響

(1.江蘇省氣象臺,江蘇南京 210008;2.國家海洋環境預報中心,北京 100081)

1 引言

人類社會的生產生活與各種天氣/氣候情況密不可分,因此天氣/氣候學分析是保障社會發展的重要因素,也面臨巨大的挑戰。高質量的氣象數據是分析當前及過去天氣現象和氣候特征的重要基礎?,F有的氣象觀測資料受地域、時間和觀測儀器的限制,僅覆蓋了部分海洋和極地等地區[1],其時間和空間的不連續性無法滿足需求[2]。

20世紀80年代后期,隨著計算機技術的發展,基于求解動力方程的天氣數值預報模式得到充分應用[3]。研究人員利用數據同化技術將各種來源的地面、高空觀測資料與數值模式的結果相結合,得到格點化、連續長時間序列、高時空分辨率的歷史資料數據集,處理后的數據集稱為再分析數據[4]。再分析數據集綜合了傳統觀測數據和數值模式數據的優點,彌補了單一觀測資料時空分布不均的缺點,增加了數值結果的準確性,改進了對大氣物理過程的描述,能夠充分反映氣象要素的多種時空尺度變化特征[5-6],在各種天氣/氣候/海洋研究領域都發揮著重要作用,如短時間內的強對流突發事件[7]、短期天氣預報、區域氣候特征模擬[8]、全球長時間氣候變率、變化的監測和研究[9]以及為海洋特征模擬提供驅動[10]等。

美國、歐洲和日本等國家主要的業務/科研部門均開展了全球大氣再分析資料的研究,各類再分析數據集的時間跨度和分辨率逐步提高,覆蓋時間尺度從十幾年到一百多年[11]。例如:美國國家環境預報中心(National Centers for Environmental Prediction,NCEP)、美國國家大氣研究中心(National Center for Atmospheric Research,NCAR)和美國能 源 部(Department Of Energy,DOE)聯合發布的NCEP/NCAR(NCEP1)、NCEP/DOE(NCEP2)、NCEP/CFSR(Climate Forecast System Reanalysis,氣候預報系統再分析)等數據集[12-14];美國國家航空航天局(National Aeronautics and Space Administration,NASA)提供的回顧性分析應用數據集(Modern-Era Retrospective analysis for Research and Applications,MERRA)[15];歐 洲 中 期 天 氣 預 報 中 心(European Centre for Medium-range Weather Forecasts,ECMWF)推出的系列再分析數據:第一個全球大氣研究計劃(Global Atmospheric Research Program,GARP)全球實驗(First GARPGlobal Experiment,FGGE)、15 a歐洲再分析數據(European Re-Analyses 15 years,ERA-15)、40 a歐洲再分析數據(European Re-Analyses 40 years,Era-40)和過渡期歐洲再分析數據(European Re-Analyses-Interim,ERA-Interim)[16,17];日本氣象廳(Japan Meteorological Agency,JMA)發布的25 a日本再分析數據(Japanese Re-Analysis 25 years,JRA-25)和55 a日本再分析數據(Japanese Re-Analysis 55 years,JRA-55)[18-19]等。2014年,中國國家氣象局(China Meteorological Administration,CMA)國家氣象信息中心也開始研發中國全球再分析資料集(CMA’s global atmospheric Re-Analysis,CRA)[20]。

由于選用不同數值模式、觀測資料以及同化和均一化過程帶來的差異[21],不同再分析數據集的可信度存在差異[22-23]。2016年,ECMWF發布了使用新一代四維變分同化技術制作的第五代ECMWF再分析資料集(The fifth generation ECMWF Re-Analyses,ERA5),該數據集采用實時更新的方式提供1950年至今的高分辨率全球大氣再分析數據[24-25]。ERA-Interim與ERA5的適用性比較研究已在中國多個省份開展,孟憲貴等[26]對比了山東省及周邊的觀測數據,結果表明ERA5在地面和對流層低層的相對濕度和風場上的表現明顯優于ERAInterim;朱景等[27]利用浙江省71個氣象自動觀測臺站的溫度資料,證明ERA5對地表溫度的模擬較ERA-Interim有明顯改善。此外,同一數據集在不同區域的適用性也有較大差別,葉夢姝[21]比較了全國降水資料與3套再分析資料,結果顯示平原地區的再分析資料結果較山區更加可信,復雜地形區域對降水的空報和漏報情況都顯著多于平原地區。

江蘇位于116°~122°E,30°~36°N之間,受東亞季風控制,兼具南北方氣候特征,以淮河和蘇北灌溉總渠一線為界,北部屬于溫帶季風氣候,南部屬于亞熱帶季風氣候。地理環境上,江蘇為沿海省份,海岸線綿長,大陸地區整體地勢平坦,地跨長江和淮河,域內湖泊眾多。受季風和地理環境影響,江蘇天氣情況復雜多變,氣象災害相對頻發,預報具有很大的挑戰性[28]。鑒于再分析數據集對天氣/氣候預測的重要性及其數據本身的不確定性,研判再分析數據在江蘇區域的適用性及對相關的后續研究提供的理論依據,具有非常重要的意義。本文利用江蘇省73個國家級自動氣象觀測站和3個高空探測站,對ERA-Interim和ERA5的地面和高空氣象要素在江蘇區域內的適用性進行分析對比,利用機器學習方法對再分析數據的誤差進行分類,探究其主要的誤差分布和偏離特征,最終給出這兩種再分析數據在江蘇區域的適用性情況,為使用該區域ERA5和ERA-Interim再分析數據集進行相關天氣/氣候研究及預報的氣象科研人員提供借鑒和參考。

2 數據與方法

2.1 數據

觀測數據為江蘇省73個國家級自動氣象觀測站及3個高空探測站(南京、徐州和射陽)的觀測數據,具體站點分布如圖1所示。文中所用地面觀測要素包括:海平面氣壓(單位:hPa)、10 m風向(單位:°)、10 m風速(單位:m/s)、2 m氣溫(單位:℃)、2 m相對濕度(單位:%)和每1 h內降水累積量(單位:mm);高空觀測要素包括:標準氣壓層(1 000 hPa、925 hPa、850 hPa、700 hPa、500 hPa、400 hPa、300 hPa、250 hPa、200 hPa、150 hPa和100 hPa)的位勢高度(單位:位勢米)、風向(單位:°)、風速(單位:m/s)、氣溫(單位:℃)和相對濕度(單位:%)。

圖1 江蘇區域觀測數據站點分布(紅點所示為地面自動觀測站,紅五角星所示為探空站點)

由于江蘇省在2016年進行了氣象觀測改革,對觀測數據實施質量控制,剔除異常值,所以2016年后的數據質量結果更為可信。為了保證不同月份間對比的數據量保持一致,需要選取整年的觀測數據。因此,選取觀測數據時段為2016—2018年,其中地面要素為逐10 min質控后觀測數據,高空要素為一日2次(世界時00時和12時,下同)的觀測數據,總數據量達11 449 758個,具有一定的代表性。

再分析數據為ERA-Interim和ERA5再分析數據集。ERA-Interim是ECMWF第3代再分析數據集,使用ECMWF集成預報系統(Integrated Forecast System,IFS)31r2循環(Cycle 31r2,Cy31r2)中的四維變分(Four-Dimensional Variational,4D-Var)數據同化技術[29]。該數據提供0.125°~2.5°多種空間分辨率,垂向上從地面起分為60層,分辨率最高可達0.1 hPa,時間范圍為1979—2019年,提供每日4次同化數據(世界時00時、06時、12時和18時)[30]。ERA5數據是ECMWF最新再分析數據集。作為ERA-Interim的替代品,ERA5的時間和空間分辨率都得到提高,水平分辨率由0.75°提高至0.281 25°,垂直分層由60層增至137層,垂向分辨率由0.1 hPa提高至0.01 hPa(約為80 km),數據的時間范圍延展到從1979年開始到最近5 d內的實時數據(2020年已發布將時間范圍提前至1950年的初步版本),時間分辨率由每6 h提高至每1 h[24,25]。此外,相比于ERA-Interim數據,ERA5數據對觀測資料的使用方法和物理過程描述都有顯著的改進,數據同化技術使用的是ECMWF新一代IFS 41r2循環(Cycle 41r2,Cy41r2)的4D-Var技術[31]。本文選取了2016—2018年同時間段的ERA5和ERA-Interim再分析數據。

2.2 方法

本文首先通過Pearson相關系數(Correlation Coefficient,CC)衡量再分析數據和觀測數據之間的一致性,并利用標準差(Standard Deviation,δ)和均方根誤差(Root Mean Square Error,RMSE)量化偏離程度,具體計算公式如下:

式中,A表示觀測數據;E為再分析數據;N為樣本數;-表示平均值。這3個統計量將通過泰勒圖綜合表示。標準化的泰勒圖基于余弦定理,綜合展示CC、δ和RMSE的關系。以原點為圓心,方位角表示相關系數,距原點的距離為再分析數據和觀測數據的δ比率;以觀測數據點(Obs,沿水平方向距離原點一個單位)為圓心的圓表示標準化RMSE。因此距離觀測數據點越近,說明再分析數據模擬效果越好[32]。泰勒圖中標準差比率為:

標準化均方根誤差為:

同時,文中利用相對偏差(Relative bias)衡量誤差偏離正負和分析誤差來源,計算公式為:

為了充分利用有限的數據,減少統計量計算誤差,本文利用自助采樣法(拔靴法,Bootstrap)[33]計算上述統計量95%置信度的范圍。在常規計算方法下,對于一組再分析數據和觀測數據,統計量式(1)—(6)只能計算出對應的一個值,難以估計這個值的質量或者置信度。Bootstrap方法作為一種增廣樣本統計方法,以原始數據為基礎,通過重復抽樣(抽樣次數由用戶指定),可以得到一組數據某統計量的分布特征(通過重復抽樣得到某個統計量的多個值)[34],適用于本文統計量難以用常規方法進行假設檢驗的問題。在本文實際計算某統計量過程中,對于一組再分析數據和觀測數據,規定通過Bootstrap方法得到某統計量1 000個樣本,再以1 000個樣本為基礎,取具有95%置信度的范圍進行檢驗,下文討論的有關統計量都在95%置信區間內。

此外,本文利用無監督學習K均值(K-means,K為指定分類數目)聚類分析方法對各氣象要素的誤差進行分類。K-means算法是一種基于空間歐式距離(空間中兩個樣本對象之間的真實距離)進行相似度劃分的聚類算法,歐式距離越小的兩個樣本對象之間的相似程度越高[35]。因其算法簡捷高效,且可以指定分類數目,歸類結果解釋性強,此方法已被用于挖掘大量氣象數據中深層次的關系。韓微等[36]基于全國50 a的逐日氣溫觀測資料,利用聚類分析方法將全國劃分為若干區域,劃分結果與按氣候和地形劃分結果相近。本文嘗試利用再分析數據誤差將觀測站點劃分為若干區域,各區域之內的誤差最小化,同時區域之間的誤差最大化,分類區域能具有一定地域特征。分類結果有助于描述系統誤差的空間分布,在使用再分析數據的過程中,注意系統誤差對天氣分析的影響,能夠提高再分析數據利用率。

3 結果

3.1 地面要素的適用性及誤差時空分布特征

3.1.1 地面要素的適用性

圖2給出了2016—2018年ERA5和ERAInterim數據中各地面氣象要素的泰勒圖。兩套再分析數據對江蘇區域的各地面觀測要素均具有較好的表征能力,除小時降水量這一要素外,ERA5的其他地面要素數據比ERA-Interim數據的適用性顯著提升,尤其是2 m氣溫及2 m相對濕度。

圖2 地面要素泰勒圖(紅色和藍色散點表示1—12月ERA5和ERA-Interim再分析數據的相關系數、標準差和均方根誤差的分布,散點旁數字表征月份,散點越靠近Obs表示再分析數據和觀測數據間各項誤差越?。?/p>

相比ERA-Interim數據,ERA5中海平面氣壓與觀測數據的相關系數均高于0.95(ERA-Interim在0.9附近),且均方根誤差小于0.25 hPa(ERA-Interim在0.25~0.5 hPa之間)。ERA5的2 m氣溫及2 m相對濕度相比于ERA-Interim表現出系統性改進,與觀測數據的相關系數分別集中在0.95和0.9附近,兩個要素的相關系數相較于ERA-Interim與觀測數據的相關系數0.5和0.4均提升了超過0.4,標準化均方根誤差均減少了60%。ERA5數據的10 m風速風向相較于ERA-Interim數據也有所改進,與觀測的一致性提高(相關系數提高約0.3),均值也更接近于觀測。但是,上述地面要素在ERA5和ERA-Interim兩套數據中的標準差比率沒有顯著差異,標準差比率均集中在1附近,ERA5和ERA-Interim均較準確地表征海平面氣壓、2 m氣溫和2 m相對濕度的振幅,ERA-Interim高估了10 m風速約15%,10 m風向的振幅也有約15%的偏離。兩套數據的小時降水量相較于觀測均有較大誤差,相關系數分布較為離散,體現了該要素時間上適用性的差異,在實際研究/預報中需謹慎使用該要素。ERA5數據的地面要素適用性相較于ERA-Interim數據顯著提升(除小時降水量),可能主要得益于制作該數據的模式、同化系統和觀測數據的改進。

需要注意的是,在統計學上,本文計算得到的相關系數只需高于0.104(根據數據量查表可得),即可認為在顯著性水平0.001上顯著相關[37]。方差F檢驗[37]表明,在顯著性水平0.05上,兩套再分析數據的海平面氣壓與觀測數據相比離散程度沒有顯著差異,其他各要素離散程度都有顯著差異。

3.1.2 相關系數和相對偏差的時空分布特征

兩套再分析數據與觀測數據的一致性及誤差的時空分布特征,對于再分析數據的合理使用非常重要。本文選擇針對不同站點逐月的相關系數和相對偏差進行時空分布特征的分析。圖3給出了兩套再分析數據與站點觀測數據之間相關系數的逐月變化。對于各地面氣象要素,ERA5數據與觀測數據的一致性要優于ERA-Interim數據,尤其是2 m氣溫及2 m相對濕度。ERA5再分析數據的各地面氣象要素的相關系數季節差異顯著,相關系數的低值區主要存在于夏季(6—8月)。小時降水量的相關系數差異較大,最好月份和最差月份相差達0.6,其他要素季節相差在0.2之內。此外,2 m相對濕度在1月和12月的相關系數與年均值相比偏低0.05,10 m風向在整個下半年(6—12月)相關系數明顯偏低,比上半年偏低0.2。相較ERA5,ERA-Interim再分析數據與觀測的相關系數的季節差異沒有明顯分布規律。海平面氣壓與觀測數據的相關系數在9月比年均相關系數略偏高0.01。10 m風向、10 m風速、2 m氣溫和2 m相對濕度與觀測數據的相關系數季節差異在0.2之內,10 m風向在3月、10月、11月和12月的一致性較差,10 m風速在1—6月一致性偏低,2 m氣溫和2 m相對濕度在1—6月的相關系數較其他月偏高0.15,小時降水量的主要誤差季節分布和ERA5相似。

圖3 地面要素站點相關系數逐月分布(各物理量單位見2.1部分)

圖4給出了兩套再分析數據與站點觀測數據之間相對偏差的逐月變化。兩套數據的相對偏差量級相近,且存在季節差異特征,不同要素的偏差的季節特征不同。但均值t檢驗[37]顯示,在0.05顯著性水平上,ERA5再分析數據的海平面氣壓在冬季與觀測相比沒有顯著差異,2 m氣溫部分站點在冬季與觀測沒有顯著差異,其他氣象要素均值與觀測相比有顯著差異;ERA-Interim的10 m風速和小時降水量與觀測均值有顯著差異,其他氣象要素與觀測相比只在部分站點有顯著差異。兩套數據相對偏差的95%置信區間也顯示,ERA5各氣象要素的置信區間不包含0值,而ERA-Interim各氣象要素相對偏差的置信區間在一半以上的站點跨0值分布。因此,ERA5再分析數據的相對偏差時空分布特征是可信的,在后續研究中有使用意義,而ERA-Interim相對偏差的時空分布特征在統計學上并不完全可信,需要注意。ERA5再分析數據與觀測數據的相對偏差大致可以分為3個量級:海平面氣壓相對偏差在0.1%之內,低估了觀測海平面氣壓值,且6—10月偏離程度略大;10 m風向、2 m氣溫和2 m相對濕度的相對偏差絕對值在10%之內,分別在1—7月、10—12月和1—7月表現為正偏差,其余月份相對偏差為負值;ERA5顯著高估了10 m風速和小時降水量,10 m風速和小時降水量分別在1—7月和10—12月相對偏差較低。ERA-Interim再分析數據的相對偏差的季節分布特征與ERA5再分析數據類似,不同氣象要素的偏離程度也相近,但2 m氣溫在1—4月為正偏差,2 m相對濕度在1—7月為負偏差。

圖4 地面要素站點相對偏差逐月分布(單位:%)

導致這兩套再分析數據適用性的季節差異的主要原因可能是江蘇地區為顯著的季風區域。受季風影響,冬季在強勁的西北氣流控制下天氣形勢穩定,而夏季受東南氣流影響,天氣多變,強對流天氣過程頻發,且易受到臺風等極端天氣影響,多出現短時強降水[7,28],導致再分析數據在夏季的適用性偏低。以季節差異明顯的小時降水量為例,ERA5和觀測的小時降水量降水分布直方圖(圖略)表明,ERA5數據的降水頻次和一般降水量(小時降水量<20 mm)均高于觀測,對一般降水存在空報現象,導致小時降水量被高估;同時,ERA5數據明顯低估了短時強降水(小時降水量>20 mm)發生的概率,常漏報短時強降水,而短時強降水常出現在對流性天氣多發的夏季,導致夏季的數據適用性較差。

圖3和圖4表明,兩套再分析數據的適用性存在季節差異,同時也存在空間差異,不同觀測站點間差異在夏半年(4—9月)尤為明顯。為了更加直觀地考察兩套數據適用性的空間差異,采用無監督學習K-means聚類分析方法[36]對73個觀測站4—9月的誤差進行分類,分類依據為各個站點地面要素的相關系數和相對偏差。

圖5給出了ERA5再分析數據中各地面要素適用性的空間差異。圖中可以看出,ERA5再分析數據適用性的空間分布具有顯著的地域特征,總體以長江為界將江蘇省分為南北兩個區域,兩個區域間站點的相關系數差別不大,但是相對偏差有明顯區別。其主要表現為10 m風向在南部地區(紅點)為負偏差而在北部地區(藍點)為正偏差,2 m相對濕度在南部地區為正偏差而在北部地區為負偏差。具體分類結果顯示,南部區域海平面氣壓的相關系數相對較高,海平面氣壓、10 m風向和2 m氣溫的相對偏差為負,分別集中在-0.025 5%、-5.26%和-3.34%左右,10 m風速、2 m相對濕度和小時降水量的相對偏差為正,分別集中在59.14%、2.49%和56.63%附近。而在北部區域,2 m氣溫和2 m相對濕度的相關系數較高,海平面氣壓、2 m氣溫和2 m相對濕度的相對偏差為負,分別為-0.036%、-0.058 2%和-3.30%左右,10 m風向、10 m風速和小時降水量的相對偏差為正,分別集中在為2.22%、22.15%和90.83%附近。同樣,對ERA-Interim再分析數據進行了聚類分析,結果顯示為沒有顯著的空間分布特征(圖略)。

圖5 ERA5地面要素適用性誤差分類

3.2 高空要素的適用性

圖6給出了兩套再分析數據與江蘇境內3個高空探測站2016—2018年氣象探空數據的相關系數和相對偏差的對比。兩套數據中的高空氣象要素與觀測較為一致,其中位勢高度與氣溫比較準確,各層的風速、風向與觀測相對一致,但是各層的相對濕度隨高度的變化體現了較大的差異性。兩套數據的適用性表現出相同的空間差異,其中,氣溫和風向的適用性在對流層低層和高層表現出明顯空間差異,相對濕度在對流層中高層的適用性有明顯空間差異。

圖6 高空要素相關系數和相對偏差對比圖

ERA5數據各層位勢高度與探空數據的相關系數都在0.95以上,相關系數從1 000 hPa開始隨高度逐漸減小,在850~925 hPa之間達到局部極小值,然后逐漸回升,從150 hPa高度再度開始急劇減小,相關系數在對流層高層降至最??;相對偏差在1 000~700 hPa之間為負值,其隨高度增加緩慢減小,在對流層中高層趨近于0。ERA5數據的風向和風速與探空數據的相關系數在0.7之上,基本隨高度的增加而增大;相對偏差在1 000~700 hPa之間隨高度增加而逐漸趨近于0,在對流層中高層基本保持不變。ERA5的氣溫和相對濕度與探空數據的相關系數隨高度增加而減小,其中相對濕度的相關系數變化顯著,從0.9減小到0.2;氣溫的相對偏差在對流層中低層700 hPa達到極小值-17%,中高層接近于0,相對濕度則在對流層中高層有明顯偏差,最大相對偏差可達100%。不同站點高空氣象要素的適用性隨高度變化的趨勢基本一致,相比于站點58238,站點58150和站點58027的風向、風速、氣溫和位勢高度在對流層低層和高層的適用性較差,相對濕度在對流層中高層與觀測數據有更大差異。高空要素相比于地面要素沒有明顯季節變化特征(圖略)。

兩套再分析數據高空氣象要素的相關系數和相對偏差隨高度變化的趨勢基本一致。相較于ERA-Interim數據,ERA5數據與探空數據的相關系數在風場和氣溫上的表現有所提升。風向在不同高度上均有改善,相關系數平均提高了0.3左右;風速的相關系數在對流層低層提高了約0.4;氣溫的相關系數在對流層高層提升約0.1;ERA5的位勢高度和相對濕度與ERA-Interim相比沒有明顯優勢。兩套數據在不同氣壓層的相對偏差沒有顯著差異。

4 總結

本文利用江蘇73個國家級自動氣象觀測站和3個高空探測站的觀測數據對ERA-Interim和ERA5再分析數據的地面及高空氣象要素在江蘇省的適用性進行對比研究,主要結論如下:

(1)ERA5再分析數據的各地面要素的適用性均優于ERA-Interim再分析數據,其中2 m氣溫及2 m相對濕度體現了系統性的改進,相關系數提升超過0.4,但兩套再分析數據的小時降水量均存在較大的誤差。ERA5再分析數據與觀測數據之間的一致性及誤差均存在一定的時空分布特征??傮w而言,ERA5中海平面氣壓的適用性在全年都有很好的表現,數據質量可靠,其他氣象要素在夏季的適用性低于其他季節,空間上表征為在夏半年存在顯著南北差異,10 m風向在江蘇南部為負偏差而在北部為正偏差,2 m相對濕度在南部為正偏差而在北部為負偏差。與之相對的,ERA-Interim數據沒有顯著的時空分布特征。

(2)兩套再分析數據的高空氣象要素與觀測數據均較為一致,其中位勢高度與氣溫比較準確,各層的風速、風向與觀測數據相對一致,但是各層的相對濕度隨高度的變化體現出較大的差異性,各個要素不同站點間適用性差異在對流層低層和高層比較明顯??傮w而言,ERA5再分析數據在各氣壓層與觀測的一致性優于ERA-Interim再分析數據。

本文雖然取得了一定的研究成果,但是還存在一些不足。本文的分析工作,尤其是季節分析和聚類分析,是基于3 a(2016—2018年)的觀測數據,其結果代表性有一定局限,我們將在以后的研究中進行更長時間序列的驗證分析。同時,本文采用聚類分析方法對誤差的空間分布特征進行了分析,但是對這種誤差空間分布特征的成因未明確,在后續的研究中也將開展更多的機制分析工作,給出誤差時空分布特征的成因。

猜你喜歡
氣象要素適用性站點
成都電網夏季最大電力負荷變化特征及其與氣象要素的關系
童裝常用領型及其適用性分析
強調簡潔和適用性 MICHI by Rotel X5/X3合并功放
無人潛航器作戰保障適用性評估方法
環保技術在土木工程領域的適用性探討
基于Web站點的SQL注入分析與防范
積極開展遠程教育示范站點評比活動
河蟹養殖水溫預報模型研究
探測環境變化對臨沭站氣象要素的影響
怕被人認出
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合