?

基于Cressman優化算法的海洋矢量數據插值方法研究

2023-08-16 06:28陳珂陳括吳萍梅杰袁逸葦
海洋信息技術與應用 2023年3期
關鍵詞:空間數據插值矢量

陳珂,陳括,吳萍,梅杰,袁逸葦

(1.自然資源部東海預報減災中心, 上海 200136;2.自然資源部東海信息中心, 上海 200136)

隨著“海洋強國戰略”以及“建設智慧海洋”等一系列政策及理念的提出,海洋信息化正逐漸成為全面了解、研究和建設海洋的重要一環。海洋矢量數據的可視化作為直觀有效的數據展示形式,為海洋環境監測、海洋災害預警預報等方面研究提供了重要的信息資源。然而海洋矢量數據不同于傳統工業數據,在時間、空間上具有實時動態性、空間相關性、多維多屬性和不連續不確定性,并且存在數據量大、冗余度高等問題,如何在保證整體精度的同時,高效、直觀、動態地將海洋矢量數據進行可視化成為海洋技術研究中的熱點問題之一[1]。

由于空間相關性分析兼顧了空間對象之間的相關性和變異性,已在地理研究、資源評估和農作物監測等領域被廣泛應用[2-5]。如李連發等通過對空間數據的相關性進行量化,提出了空間抽樣框架;劉鐵軍等[6]以分層抽樣為基礎,兼顧空間關聯性提出了“三明治”空間抽樣模型。這些理論將空間相關性理論應用到空間數據處理中,一定程度上降低了空間數據的信息冗余。在插值研究中,常用的插值方法包括幾何方法、統計方法、空間統計方法、函數方法、隨機模擬方法、物理模型模擬方法和綜合方法等[7-9]。但海洋矢量數據其自身具有多源、異構、多維等空間特性,插值過程中結合數據的空間相關性是非常必要的。

本文嘗試將空間相關性和插值算法相結合,應用在海洋矢量數據可視化的研究中,通過對矢量數據進行空間相關性分析計算出海洋數據多種屬性的依賴度以及其權重系數,對數據進行約簡、選擇和插值,進而為海洋矢量數據的插值可視化提供一種可行的新方法和新思路。

1 海洋矢量數據插值基本思路

首先利用Moran's I 進行空間相關性分析,對海洋空間數據進行整理和過濾,形成插值計算初始場;然后根據空間相關性分析確定插值計算的影響半徑d'、插值權重Wijk,并進行Cressman 插值計算獲得新場;最后將新場與實際值進行對比分析,若超過誤差范圍,則根據插值對新場進行訂正,若在誤差范圍內,則針對海洋數據插值計算結果進行可視化分析,并與傳統插值算法作對比,檢驗海洋數據插值模型的合理性(圖1)。

圖1 海洋矢量數據插值流程圖

2 基于Moran's I的空間相關性分析方法

空間自相關是空間地理數據的重要性質,空間中鄰近的地理數據信息通常比相距較遠的具有更高的相似性[10]。由于空間對象之間存在空間相關性,空間事物在分布上呈現結構性。

Moran's I 是一種度量空間對象之間相關程度的重要參數,在空間自相關分析中已得到廣泛應用[11-12]。通過對Moran's I 值的標準化計算得到矢量數據間的空間聚類程度,即z-score 值,z-score值越大表示空間聚類程度越高,通過z-score 值,檢索研究區域矢量數據的最佳距離,即矢量數據在該距離內空間聚類程度最高,由該距離推導研究區域內的樣本量及樣本點的空間分布。通過對樣本點精度檢驗推導整個研究區域的精度水平。相關公式如下:

式(1)-(5)中,I 表示Moran's I 指數值,n 表示某區域數據的總數,Wij表示數據i 和j 之間的空間權重,Zi表示數據i 的屬性值,zˉ表示所有數據的屬性平均值,S0表示所有空間權重的聚合,Z表示空間聚類程度z-score 標準化值,E( )I 表示Moran's I 的期望,V( )I 表示Moran's I 的方差,d表示歐氏距離,xi表示空間數據i 的經度,yj表示空間數據j 的緯度,xmax表示所有空間數據中最大經度,xmin表示所有空間數據中最小經度,ymax表示所有空間數據中最大緯度,ymin表示所有空間數據中最小緯度,n'表示選擇的數據量,d'表示依據I選擇的最佳距離。

基于Moran's I 的空間樣本選擇算法是對空間結構數據選擇進行優化的算法,其本質是通過數據的總數n、數據i 和j 之間的空間權重Wij、數據i的屬性值Zi、數據的屬性平均值zˉ四個參數獲得樣本間的最佳距離,算法描述如下:

算法. 基于Moran's I 的空間數據選擇算法(n,Wij,Zi,).

輸入:數據總數n,數據i 和j之間的空間權重Wij,數據i的屬性值Zi,數據的平均屬性值zˉ;

輸出:樣本點間的最佳距離d'.

①FOR(i=1;i<=n;i++){

② FOR(j=1;j<=n;j++){

③利用公式(2)計算空間數據權重的聚合S0;}}

④FOR(i=1;i<=n;i++){

⑤ FOR(j=1;j<=n;j++){

⑥利用公式(1)計算數據間的Moran's I指數值I}}

⑦利用公式(3)計算各數據的空間聚類程度Z值;

⑧利用公式(4)計算各Z值對應的像元距離d;

⑨輸出聚類程度較高的最佳距離d'.

該算法中,在數據總數為n 的情況下,數據空間權重聚合S0的時間復雜度為O(n2);數據間的Moran's I指數值I的時間復雜度為O(n2);各Z值對應的數據點距離d 的時間復雜度為O(n2);因此,該算法的時間復雜度為O(n2)。

3 基于Cressman的空間數據插值方法

Cressman 插值是在氣象領域中應用最多的一種插值算法,是將離散點內插到規則格點引起誤差較小的一種逐步訂正的內插方法,被廣泛應用于氣象領域空間矢量數據的各種診斷分析和數值預報方案的客觀分析中,因而Cressman 插值方法使客觀分析成了一門獨立的科學[13]。

Cressman插值算法[14-16]采用逐步訂正方法進行最優化插值,用實際資料與預備場或初值場去改變和訂正,得到新場,再求出新場與實際值之差,去訂正上一次的場,直到訂正場逼近實際資料為止。公式如下:

其中:

式中,α 為任一氣象要素,α0是變量α 在格點(i,j)上的第一猜測值,α'是變量α 在格點(i,j)上的訂正值;?αk是參與插值計算點k 的值與第一猜測值之差;Wijk是權重因子,在0~1 之間變化;K是影響半徑d'內的空間數據量。Cressman 客觀分析方法最重要的是權重函數Wijk的確定,它的一般形式為:

式中:影響半徑d'的選取具有一定的人為因素,一般取一常數。d'選取的原則是通過空間相關性分析選取的最佳距離。dijk是格點(i,j)到點k的距離。

Cressman 插值算法的思路如下:第一步,確定一個預備場,并設定一個逼近值范圍,用于比較計算后的新值與實際資料的差值;第二步,計算權重Wijk;第三步,將權重放入插值計算中,得到一個新場;第四步,將這個新場與實際資料相比,計算它們的差是否在預定的逼近范圍內,如果不在逼近范圍內,就用這個新場與實際值的差,去訂正上一次的場;第五步,對訂正后的場和實際值進行比較,如果還是超過逼近值的范圍,則繼續訂正,直到新場與實際值的差在預定的逼近值范圍內。

4 某海域流場模式數據插值結果及分析

基于Moran's I 的空間相關性分析和Cressman插值算法通常運用于空間矢量數據分析。流場數據作為空間矢量數據,具有空間性、時效性、多維性等特點。因此,本文采用東海某區域的流場矢量數據進行仿真實驗,在插值計算前,首先對不同距離的矢量數據進行空間相關性分析,數據點間的距離與對應z-score值如表1所示。

表1 不同距離的Moran's I及z-score值

由表1 可知,當數據間距離為118.71 m 時,對應的z-score 值最大為48.266 820,表示該距離為118.71 m 的范圍內,空間聚類程度最高,表現出強相關性,選此時對應的距離d'為最佳距離。

流場數據原始數據點分布如圖2 所示,根據Moran's I 的空間相關性分析選取插值半徑d'為118.71 m,對流場數據進行Cressman 插值計算,并與傳統插值[15-18]計算結果進行對比(圖3、圖4)。反距離權重插值法(Inverse Distance Weight,IDW)是一種常用而簡便的空間插值方法,它以插值點與樣本點間的距離為權重進行加權平均,離插值點越近的樣本點賦予的權重越大,IDW 通過對鄰近區域的每個采樣點值平均運算獲得內插單元。本文采用的傳統插值計算方法為Cressman 插值和反距離權重插值,插值半徑d默認為50 m,如圖5、圖6所示。

圖2 某海域流場數據分布

圖3 基于Cressman優化算法平面結果

圖4 基于Cressman優化算法3D結果

圖5 基于Cressman插值算法計算結果

圖6 基于IDW插值算法計算結果

為更好地分析三種不同插值方法,本次研究在同一環境下,分別對三種不同插值方法運行10次,并對10 次運行時間進行統計分析,如表2、圖7所示。

表2 三種不同插值方法完成時間對比

圖7 基于Cressman插值算法計算結果

通過圖3與圖5對比可以看出,傳統Cressman插值方法和優化Cressman插值方法結果基本一致,圖5和圖6對比可以看出,傳統Cressman插值方法和IDW 插值方法在插值半徑為50 m 的情況下,獲得的結果也基本一致,說明和傳統的插值方法相比,優化后的Cressman 插值方法同樣可以保證插值結果的精確度。同時,通過表2和圖7看出,優化Cressman插值方法比兩個傳統插值方法耗時短,傳統Cressman插值方法平均運行時間為5.72 s,反距離權重插值方法(IDW)完成時間為5.85 s,所耗時間基本相同,優化Cressman 插值方法運行時間為3.46 s,與傳統插值方法相比,時間減少了近40%。這是由于優化Cressman 插值方法通過對流場數據的空間相關性分析后選擇的插值半徑比傳統插值方法的插值半徑大,從而減少了插值計算過程中的數據冗余,縮短了運行時間。

海洋流場矢量數據具有空間性、時效性、數據量大等特點,傳統插值方法缺少對插值半徑的精準分析,插值半徑需盡量選擇較小值來保證插值精度,因此會導致時間長、效率低和信息冗余等問題。本文提出的基于Cressman插值優化算法,通過數據間空間相關性的度量,量化了矢量數據的插值半徑,在保證精度的同時,能夠較準確地表達流場數據,保持了數據的可靠性,減少了數據的冗余度,保障了其插值結果的可信度,有利于海洋流場數據精準、高效地展示,大大減少了后臺程序的計算時間,使數據表達更加流暢。

5 結論

文中針對海洋矢量模式數據的插值問題,提出了一種結合空間相關性分析對Cressman 算法進行優化的插值方法。該方法考慮了海洋矢量數據的空間特性,采用Moran's I對數據進行空間相關性分析,并基于Cressman插值算法對空間數據進行處理及柵格化表達[17-20]?;贑ressman 插值優化算法能夠保證結果的有效性、準確性,并在一定程度上解決了傳統插值算法中數據冗余、時間成本高等問題,提高了運算效率,降低了時間成本。

猜你喜歡
空間數據插值矢量
矢量三角形法的應用
基于Sinc插值與相關譜的縱橫波速度比掃描方法
基于矢量最優估計的穩健測向方法
元數據驅動的多中心空間數據同步方法研究
一種改進FFT多譜線插值諧波分析方法
基于四項最低旁瓣Nuttall窗的插值FFT諧波分析
三角形法則在動態平衡問題中的應用
Blackman-Harris窗的插值FFT諧波分析與應用
基于文件系統的分布式海量空間數據高效存儲與組織研究
客戶端空間數據緩存策略
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合