?

青海湟水流域基于改進的MLP 大氣加權平均溫度模型研究

2024-01-29 14:43趙利江楊海鵬許超鈐趙健赟
地理信息世界 2023年4期
關鍵詞:湟水探空平均溫度

趙利江,楊海鵬,許超鈐,趙健赟

1. 長安大學 地質工程與測繪學院,西安 710054;

2. 青海省基礎測繪院,西寧 810016;

3. 青海省地理空間信息技術和應用重點實驗室,西寧 810016;

4. 武漢大學 測繪學院,武漢 430079;

5. 青海大學 地質工程系,西寧 810016

1 引 言

湟水流域是青海省政治、經濟、文化和交通中心,流域內人口數為312 萬,占全省人口數的60.2%;工農業總產值為143 億元,占全省的54.2%。20 世紀90 年代以來隨著氣候增暖、降水減少、地表蒸發量的不斷增加,湟水流域氣候干旱化程度進一步加快,異常天氣(雪災、干旱、洪澇、冰雹等)發生次數明顯增加(戴升等,2006)。尤其是2022年8 月發生的持續降雨,引發了大通縣的山洪和泥石流,造成4 人死亡,27 人失聯。而水汽是降水發生的最直接因素,因此,研究湟水流域的水汽變化及其與強降水的相互關系,對指導防災減災工作具有十分重要的現實意義。

可降水量(precipitable water vapor,PWV)是從地面直到大氣頂界的單位面積大氣柱中所含水汽總量全部凝結并降落到地面可以產生的降水量,是反映大氣水汽含量主要技術指標。近年來,隨著國家衛星導航定位基準站網和各省衛星導航定位基準站網的逐步建立,基于全球導航衛星系統(global navigation satellite system,GNSS)反演PWV逐步成為研究熱點(馬進全等,2019;張鵬等,2018;王洪棟,2018)。PWV精度受大氣加權平均溫度(Tm)影響。Tm可以使用探空站的大氣垂直氣象要素計算,但受限于站點數量較少且時間分辨率較低,難以滿足實際應用需求,因此,傳統研究通常用Tm數據建立模型,此類模型主要分為回歸模型和經驗模型兩種?;貧w模型通過分析Tm與地表氣象要素的相關關系采用回歸分析等方法建立,最早的是利用北美 13 個探空站兩年的探空記錄建立的Bevis 式模型(Bevis 等,1992)。但因其系數具有季節和地理的限制,在其他地區使用誤差較大。為提高本地模型精度,有研究基于我國探空數據建立了東部地區的Bevis 式模型(李建國等,1999;劉焱雄等,2000);有研究利用Tm與地表氣溫、氣壓、露點溫度、水汽壓相關關系,建立了本地的多因子模型,結果表明增加因子數能夠提高Tm的估計精度(劉旭春等,2006;周國君和潘雄,2006;李國翠等,2008)。上述回歸模型計算Tm均需要地表氣象要素,難以滿足實時水汽的計算需要。因此,不需要氣象參數的經驗模型陸續出現,如GWMT-D(He 等,2017)、全球氣壓溫度3(global pressure and temperature 3,GPT3)(Landskron 和Bohm,2018)、GGTm(Huang 等,2019)等,其中,GPT3 模型具有開源、易操作、格網分辨率和精度高的特點,是目前使用最為廣泛的經驗模型。GPT3 模型出現之后,將積日(day of year,DOY)引入區域加權平均溫度模型,所得精度優于 GPT3(莫智翔等,2021)。楊飛等(2022)優化后的GPT3 模型中誤差達到3.52 K。但經驗模型精度往往低于回歸模型(Ding,2020)。隨著大數據的發展,有研究利用神經網絡基于氣溫、氣壓、水汽壓、高程、緯度、積日等建立了大氣加權平均溫度模型(謝劭峰等,2022)。相比傳統模型精度有一定的提升,卻未考慮大氣加權平均溫度的長期變化趨勢。

為進一步研究提高大氣加權平均溫度模型的精度,本文利用歐洲中期天氣預報中心(European Centre for Medium-range Weather Forecasts ,ECMWF)的全球氣候第五代再分析(the fifth generation ECMWF atmospheric reanalysis,ERA5)數據集和大氣逐層數據,考慮大氣加權平均溫度的年際變化,基于多層感知器(multilayer perceptron,MLP)方法建立了湟水流域大氣加權平均溫度模型,并與已有的Bevis 式、雙因子、多因子、GPT3、改進的GPT3 模型、謝劭峰等(2022)方法六種模型進行了比較驗證。結果表明,本文所建立的改進的MLP 模型具有更高的精度。

2 數據來源

湟水流域只有西寧1 座探空站,因此僅使用探空數據建立的Tm模型雖然在局部有很高的精度,但無法滿足整個流域的計算需求。本文從ECMWF 收集了湟水流域2010~2020 年的大氣逐層數據、ERA5 數據集中1950 年以來的陸地地表氣溫數據,主要包括大氣逐層氣壓、溫度、位勢高度、比濕和地表溫度、氣壓、露點溫度等參數。在國家氣象科學數據中心(http://data.cma.cn/)收集了11 座氣象站的地表氣溫、氣壓、露點溫度等數據。從美國懷俄明大學官網(http://www.weather.uwyo.edu/)下載了2010~2022 年西寧站探空數據,其中包括氣壓、高度、地面溫度、露點溫度、比濕、相對濕度等參數,用于檢驗模型精度。另外,收集了流域內30 m 分辨率的數字高程模型,用于獲取格網平均高程。為了彌補氣象站數量的不足,使用陸地地表氣溫數據補充了6 個格網點。氣象站及格網點分布,如圖1 所示。

圖1 站點分布Fig.1 Distribution map of stations

3 研究方法

3.1 Tm 計算原理

在利用GNSS 觀測數據進行水汽反演過程中,首先要對GNSS 原始數據進行處理以獲取天頂總延遲(zenith total delay,ZTD),并用獲取的估值減去由于大氣引起的天頂靜力學延遲(zenith hydrostatic delay,ZHD),從而得到與水汽相關的天頂濕延遲(zenith wet delay,ZWD)??山邓颗c天頂濕延遲之間的關系如下:

式中,PWV 為可降水量,mm;Π為轉換因子,其與大氣加權平均溫度Tm函數關系為

式中,Rv為水汽氣體常數;k2、k3為常數。Rv=461.522 J/(kg·K),k2′=22.1±2.2,k3=3.739(±0.012)×105K2/hPa。

大氣加權平均溫度Tm與大氣水汽壓ei、大氣溫度Ti、層高dh的關系可使用ECMWF 提供的逐層大氣參數離散積分:

式中,ei、Ti分別為第i層大氣的平均水汽壓(hPa)和平均氣溫(K);hi為第i層大氣厚度,m。hi由勢高作差得到,由于層間勢高差與高程差相差較小,因此,本文在數據處理時,直接使用勢高差代替高程差。由于ECMWF 提供的大氣逐層數據、陸地地表氣溫數據中沒有水汽壓,需要使用比濕由式(4)或露點溫度由式(5)求得

3.2 多層感知器

MLP 是一種前向結構的人工神經網絡,由多個節點層所組成,其中,第一層為輸入層,最后一層為輸出層,中間部分為一個或多個隱含層。除輸入節點外,每個節點都是一個帶有非線性激活函數的多輸入單輸出神經元。結構如圖2 所示。

圖2 MLP 結構示意Fig.2 Architecture of multi-layer perceptron network

3.3 精度評價指標

使用平均偏差Sbia和均方根誤差Srm表示新模型與參考值間的離散程度:

式中,N為匹配樣本總量;yi為模型估計Tm值,K;zi為探空數據實測Tm值,K。

相關系數Corr 表示兩個樣本的相關關系:

式中,X為被檢驗數據,包括地表溫度(K)、水汽壓(hPa);Y為Tm樣本數據,K。

4 實驗與分析

4.1 Tm 變化特征

由大氣逐層數據、陸地地表氣溫數據中提取了湟水流域11 座氣象站、6 個格網點的136562 個樣本數據,計算了全部樣本數據的Tm值。圖3(a)描述的是2010~2020 年湟水流域的日均Tm隨時間的變化情況,湟水流域年均Tm約270 K,最高點約280 K(DOY 為210),最低點約250 K(DOY 為365),具有明顯的季節性變化。圖3(b)描述的是2010~2020 年湟水流域的年均Tm隨時間變化情況,除了季節性變化之外,該流域Tm年均值具有一定的年際變化:2010~2012 年下降;2012~2016 年回升;2016~2020 年下降。因此,本文將積日和累計日(cumulative day,CD)作為建模參數。

圖3 湟水流域2010~2020 年大氣加權平均溫度變化情況Fig.3 Changes of atmospheric weighted average temperature in Huangshui basin from 2010 to 2020

4.2 相關性分析

為明確Tm模型參數,本文計算了2010~2020 年湟水流域136562 個樣本數據的大氣加權平均溫度Tm,分析了Tm與地表氣溫Ts、水汽壓es、高程hs、緯度bs的相關性,其中,Ts與Tm相關系數0.934,es與Tm相關系數0.85,均呈正向強相關,因此,建模時應考慮Ts、es。hs、bs對Tm有系統性的影響,如不考慮緯度和高程的變化則模型中會存在一定的系統誤差,Tm與Ts、es、hs、bs的相關關系,如圖4 所示。

圖4 大氣加權平均溫度與地表氣溫(a)、水汽壓(b)、高程(c)和緯度(d)的相關關系Fig.4 Correlation between atmospheric weighted average temperature with surface temperature (a), water vapor pressure (b),elevation (c), and latitude (d)

4.3 模型結果對比

4.3.1 典型模型對比

為了解不同Tm模型的精度水平,本文利用2010~2020 年湟水流域的ERA5 數據建立了三種有氣象要素的線性回歸分析模型(Bevis 式、雙因子、多因子)、一種經驗模型(GPT3)、一種混合模型(改進的GPT3)。并利用均方根誤差、平均誤差比較和評價了五種傳統模型估計Tm的精度,如表1 所示。

表1 傳統模型的參數及其內符合精度Tab.1 Traditional model parameters and its internal coincidence accuracy K

(1)在Bevis 式模型的基礎上,增加水汽壓可使回歸模型均方根誤差減小17%,進一步增加高程和緯度因子可降低回歸模型的平均誤差,但均方根誤差沒有明顯降低。

(2)經驗模型GPT3 在湟水流域具有較好的適用性,在不需要地表氣象參數的條件下平均誤差可達0.078 K,標準差2.17 K。

(3)混合模型的均方根誤差優于GPT3 和多因子模型,但平均誤差有明顯增大,需要使用探空數據進一步驗證。

4.3.2 改進的MLP 模型

為了進一步提高模型精度,借鑒謝劭峰等(2022)方法的多層感知器原理,本文引入參數——年際變化因子(CD),并結合地表氣溫Ts、水汽壓es、高程hs、緯度bs和DOY 建立了改進的MLP 模型。

(1)選取與Tm具有相關關系的Ts、es、hs、bs、DOY、CD 作為協變量輸入到輸入層,Tm作為因變量。

(2)將70%數據作為訓練集,30%作為驗證集,反向優化模型參數,利用2018 年西寧探空站實測Tm評估所建模型的性能。

(3)定義神經網絡模型結構,利用試湊法得到模型隱藏層的層數為1、節點數為4。隱藏層激活函數為雙曲正切函數,輸出層激活函數為恒等函數y=x,損失函數選用誤差平方和。

(4)在模型訓練中,選取批次訓練,優化算法選擇標度共軛梯度法。

研究中起點時間為2010 年1 月1 日。相比于謝劭峰等(2022)方法,本模型平均偏差減小50%,均方根誤差減小4%,如表2 所示。

表2 MLP 相關的模型參數及內符合精度Tab.2 Model parameters and internal coincidence accuracy based on MLP K

5 精度評價

5.1 基于探空數據的模型精度分析

為客觀檢驗模型精度,使用2010~2022 年西寧探空站實測Tm對Bevis 式、雙因子、多因子、GPT3、改進的GPT3 模型、謝劭峰等(2022)方法與改進的MLP 模型進行了評價,結果如表3 所示??紤]了CD因子的本模型均方根誤差相比Bevis 式、雙因子、多因子、GPT3、改進的GPT3、謝劭峰等(2022)方法分別減小了32%、23%、15%、14%、7%、5%。此外,本模型顧及了地表溫度、水汽壓、高程、緯度、積日、累計日多種影響因素,模型表現得更穩定,如圖5 所示。因此,本模型可以為青海湟水流域GNSS反演PWV 提供更高精度的大氣加權平均溫度值。

表3 研究所用模型外符合精度Tab.3 Out-of-model coincidence accuracy K

圖5 模型殘差散點分布Fig.5 Scatter plot of model residuals

5.2 Tm 對PWV 的影響估計

為量化Tm對PWV 的影響,利用式(1)、式(2)分別對П和Tm微分得式(9)、式(10)。Tm取湟水流域年均大氣加權平均溫度270 K,進一步簡化得式(11)。如

式中,σП為轉換因子的均方根誤差;σPWV為PWV均方根誤差,mm。

式中,mTσ為Tm均方根誤差,K。

取湟水流域平均濕延遲150 mm。得到各模型計算PWV 精度情況,如表4 所示??芍狟evis 式、雙因子、多因子、GPT3、改進的GPT3、謝劭峰等(2022)方法、本模型的Tm誤差帶給PWV 的影響分別為0.336 mm、0.293 mm、0.267 mm、0.263 mm、0.245 mm、0.240 mm、0.227 mm。

表4 不同方法產生的PWV 誤差Tab.4 PWV error of different models

6 結 論

考慮了年際變化因素,本文利用青海湟水流域2010~2020 年大氣逐層數據和陸地地表氣溫數據,建立了適用于青海湟水流域的改進的MLP大氣加權平均溫度模型,并以2010~2022 年西寧探空站獲取的Tm為參考,與已有研究方法進行了精度比較評價,結果表明,平均偏差和均方根誤差分別為–0.01 K、2.71 K,均方根誤差相比于Bevis 式、雙因子、多因子、GPT3、改進的GPT3模型、謝劭峰等(2022)方法分別減小了32%、23%、15%、14%、7%、5%。這證明本文改進的MLP 模型在青海湟水流域的精度要優于已有研究方法,一定程度上能夠為湟水流域大氣評估研究提供方法參考。

猜你喜歡
湟水探空平均溫度
探空氣球為高空氣象“把脈”
3月熱浪來襲悉尼或迎165年以來新紀錄
南方地區圓拱形和鋸齒形大棚內溫度四季差別探究*
湟水流域洪水演變特征分析
云南保山氣溫變化特征及其均生函數預測實驗
湟水谷地世界屋脊上的隱秘詩意
湟水谷地名不見經傳的繁榮之地
TK-2GPS人影火箭探空數據與L波段探空數據對比分析
徐州地區加權平均溫度模型研究
淺談凈舉力對探空氣球升速及施放高度的影響
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合