?

混凝土壩變形缺失信息處理方法研究

2022-05-09 05:37
三峽大學學報(自然科學版) 2022年2期
關鍵詞:插值測點變形

王 成 何 啟

(1.中交第四航務工程局 第七工程有限公司,廣州 510230;2.河海大學 水利水電學院,南京 210098)

混凝土壩可視為一個不斷變化的復雜系統,特殊的結構形式和復雜的工作環境,導致大壩的服役性態呈現出復雜、多樣、不確定等特點.在諸多反映混凝土壩性態變化的效應量中,壩工界普遍認為,大壩的變形能最直觀地反映出大壩的運行性態[1].在混凝土壩長期服役的過程中,積累了大量的變形監測數據,這些數據包含了大量的混凝土壩變形性態信息,為分析混凝土壩變形性態提供了有效的資料,也為變形性態的預測提供了基礎信息.

在對混凝土壩的變形情況進行監測時,自動化系統中儀器的數據采集一般都是基于一定時間間隔的,如每六小時一測或每天一測等,且通常保持不變;而人工監測系統由于人為原因、儀器損壞和數據丟失等因素的影響,監測信息之間的時間間隔往往并不能保持完全一致,表現為不等間隔的時間序列,這將給建模工作帶來困難.需要特別說明的是,在自動化系統和人工系統中,有時由于儀器長時間損壞,導致監測信息會出現長時間的缺失問題,比如某測點兩年的數據序列中某一個月或某兩個月的連續缺失,這種類型的數據缺失問題將直接導致無法獲得該時間段內該測點的變形情況,當該測點位于大壩關鍵監測位置時,很可能錯過大壩異常變形情況的監測而給大壩的安全分析工作帶來困難.另外,數據的長時間缺失導致信息的中斷不利于變形情況的整體分析,變形預測工作也不方便展開.因此,需要研究相關方法實現缺失數據的彌補.呂開云[2]指出觀測數據插補的方法主要包括內在物理聯系插補法和數學插補法兩種,并介紹了線性插補法的原理和過程;李雙平等[3]對比了常用的數學插值方法,選擇了充分利用已有數據信息、插值曲線光滑的三次Hermite分段插值,實現了數據序列的均勻化處理;屠立峰等[4]針對傳統插值函數在兩端插值區間易出現“龍格現象”的弊端,充分發揮了分形插值法能通過物體的部分信息推求整體性態的優勢,將其運用到缺失時間序列的插值計算中;胡添翼[5]運用空間鄰近點的變形信息來回歸目標測點的變形值,提出了空間鄰近點回歸插值法和空間反距離加權插值法.

本文將混凝土壩變形監測信息視為時間序列,將信息的不完整問題分為兩類來處理,一類是時間序列的單值缺失問題(不均勻問題),即存在小部分時間間隔與整體不一致的數據序列時,對其進行均勻化處理;另一類是連續多個數據缺失問題,對其進行估計補充.

1 單值缺失處理方法

傳統的混凝土壩單值缺失處理方法常用插值法進行估計,主要包括分段線性插值、多項式Lagrange插值、Newton 插值、三次樣條插值和三次Hermite插值等,這些插值方法對單值缺失數據進行估計時,并不會影響到變形時間序列的整體變化趨勢和規律,因此當缺失信息較少時,可采用此類插值方法進行補齊,構成等間隔的變形時間序列.但這些傳統插值方法只是基于已知的數據本身,并沒有過多考慮實際問題的物理意義,而變形時間序列單值缺失問題的處理是混凝土壩未知時間點變形信息的補充,需要考慮到混凝土壩的實際變形規律.

為此,本文引入非局部平均(Non-local Means,NLM)思想[6-7],提出了混凝土壩單值缺失處理改進的非局部平均插值法,方法思路為:利用變形信息的非局部知識信息,以及變形序列中不同時刻信息規律的自相似性來對缺失時刻的變形值進行估計,在此基礎上,引入完整的與目標測點變形趨勢相關性最強的變形序列作為計算依據.該方法旨在通過綜合考慮變形序列不同時刻變形值之間的自相關性,以及與目標測點位置相當的測點之間的相關性來刻畫出缺失信息的特征.

假設壩體某變形測點A 的測值存在不均勻現象,為了估計出單個缺失數據,進行以下步驟.

首先,從測點的整個變形時間序列來看,找出與測點A 的變形趨勢相關性最強且序列完整的測點B,可從同一個監測垂線上的諸多測點來尋找.本文采用Pearson相關性檢驗方法來計算測點變形數據之間的相關性,Pearson相關系數是一種用來定量衡量變量之間相關關系的統計學參數,其計算公式為:

式中:δAi、δBi分別表示A、B測點同一時刻的變形值;N表示序列的總個數.

從式(1)可以看出,Pearson相關系數的值在-1到1之間變化,且相關系數的絕對值越大,代表兩變量之間的相關性越強.當相關系數越接近于1或-1時,相關性越強;當相關系數越接近于0時,相關性越弱.另外,當相關系數大于0時,兩變量為正相關;反之為負相關.

其次,將測點B 的變形時間序列中與測點A 序列中待求插值點同一時間的變形值稱作假設插值點,計算測點B的序列中其它點對此假設插值點變形值的權重.本文采用歐幾里德距離(又稱歐式距離)的平方(Square of Euclidean Distance,SED)來度量不同時間點對應變形值的相似性.歐式距離的平方計算公式為:

式中:δBi、δBj分別表示B 測點i、j時刻對應的變形值大小.

通常情況下,不同時刻的變形值和之間的差值越小,說明兩個時刻的變形越相似,計算時賦予的權重值也越大,權重采用如下公式計算:

式中:h為控制指數函數增減速度的參數,決定著權重的大小.

最后,將基于測點B完整變形序列求出的各個參考點相對于假設插值點的權值賦予測點A 對應時刻的變形值,再對其進行加權平均即可求出插值點的數值,公式如下:

式中:I表示選取的整個時間序列的時刻集.

假設測點A 和測點B的變形時間序列如圖1所示,其中測點B的序列完整,測點A 的序列中有缺失情況.圖中圓點表示不同時刻對應的變形值大小,方點表示測點A 序列中的缺失值,也即待求的插值點.

圖1 單值缺失情況示意圖

2 多值缺失處理方法

當變形時間序列中缺失的信息較多時,傳統的插值方法難以進行有效的插值計算,而NLM 插值算法雖然可以求出每個缺失點的數值,但需要逐個計算參考序列中其它點對假設插值點的權重值,再計算目標序列中各點對插值點的權重.該方法雖然可行,但計算工作量大.針對上述情況,本文研究混凝土壩變形信息的多值缺失處理方法.

目前常用的多值缺失處理方法主要有非線性回歸分析插值法和空間鄰近點回歸插值法,但兩種方法都有其局限性.當回歸模型對變形序列的擬合精度較低或缺失段的環境量未知時,非線性回歸分析插值法精度較低;空間鄰近點回歸插值法借鑒了統計模型的建模思想,僅對變量的有限個整數項冪級數展開進行回歸,難以全面刻畫測點變形之間未知的作用關系.

考慮到空間測點變形之間復雜未知的作用關系難以用具體的數學表達式進行表征,而BP神經網絡具有強大的非線性映射能力,經過對樣本的學習訓練可以勾畫出數據背后復雜的信息關系;與此同時,BP神經網絡還具備強大的泛化能力,訓練好的網絡可以實現對新輸入樣本的有效處理,給出合適的輸出結果.因此,為了提高缺失值估計的精度,盡可能找出最接近缺失時刻變形真實值,本文引入BP神經網絡來處理空間測點變形之間的未知關系,由此提出相應缺失值的估計方法.

假設某混凝土壩壩體有n個在空間上鄰近且結構上相關的監測點,如混凝土重力壩同一條垂線上的測點或混凝土拱壩同一變形分區內的測點(分區方法本文不展開說明),當第i個測點的變形信息由于某些原因出現缺失,即可利用其它m=(n-1)個測點的已知信息來估計i點的信息.基于BP神經網絡映射的多值缺失估計方法建立步驟如下:

設樣本集中含有輸入向量和輸出向量之間的Z個模式對,隨機取一個模式對k,輸入模式向量為A k,期望輸出向量為;中間層單元輸入向量為S=(s1,s2,…,s p)(p為隱含層節點的數目,下同),輸出向量為B k=(b1,b2,…,b p);輸出層單元輸入向量為L k=(l1,l2,…,l p),輸出向量為C=(c);輸入層與隱含層之間的連接權為w(w=w ij,i=1,2,…,m;j=1,2,…,p);隱含層與輸出層之間的連接權為v(v=v j,j=1,2,…,p);隱含層各單元輸出閾值為θ(θ=θj,j=1,2,…,p);輸出層單元的輸出閾值為γ=(γ).

1)網絡參數初始化,通過隨機賦值函數給w、v、θ和γ隨機賦一個(-1,1)之間的較小值;

2)用輸入向量A k、連接權w和閾值θ計算隱含層的輸入S;用S通過Sigmoid函數計算隱含層的輸出B k,即:

3)用隱含層的輸出B k、連接權v和閾值γ計算輸出層單元的輸入L k,再用L k計算輸出層單元的輸出向量C,即:

4)用期望輸出向量Y k、網絡實際輸出C計算輸出層單元的一般化誤差d k,即:

5)用連接權v、輸出層的一般化誤差d k和隱含層的輸出Bk計算隱含層各單元的一般化誤差e k,即:

6)用輸出層單元的一般化誤差d k、中間層各單元的輸出B k修正連接權v和閾值γ,即:

式中:η代表學習效率,取η=0.01~0.8;α為動量因子,取α=0.9.

近二三十年來,國內學者通過引進和學習西方的數學教育理論和方法,增強國際間的交流與合作,這是現在與世界進行對話的基礎.但是,與數學不同的是,數學教育有很強的民族性、地域性,如何基于中國的民族性和地域性建立中國數學教育理論體系與研究規范,并以此為基礎建立自己的話語權,進而與世界對話,融入世界學術圈?

8)隨機選取訓練樣本集中另一個學習模式對,重復步驟3)~6),直至所有的模式對訓練完畢;

9)計算網絡全局誤差函數E,其計算式為:

若E小于預先設定的一個誤差值,則網絡停止學習;否則重復步驟3)~8),進行樣本集的下一輪學習訓練;

10)將訓練好的網絡保存,輸入新樣本,得出缺失信息估計輸出結果.

以n=5為例,輸入層即為4個相關測點的變形序列,輸出層即為目標測點的變形序列,網絡結構如圖2所示.

圖2 BP神經網絡結構示意圖

3 工程應用

我國某混凝土重力壩壩頂高程384 m,最大壩高162 m;為監測大壩的水平變形,在各重要壩段均布置了垂線.本文以泄1壩段正垂線上的各測點監測數據為例進行分析,驗證本文所提出的不完整信息處理方法的有效性,6 個測點的水平變形過程線如圖3 所示.可以發現,這些測點的水平變形過程線具有較強的相關性.

3.1 單值缺失估計

以圖3中的測點PL5-3為例,首先尋找與該測點變形序列相關性最強的參考序列,目標測點序列與其它各測點序列的相關性計算結果見表1.

圖3 泄1壩段正垂線測點水平變形過程線

表1 目標測點與各鄰近測點變形序列的相關性結果

從上表的計算結果可以看出,測點PL5-4的變形序列與目標序列的相關性最強,變形規律最相似,因此,參考測點即為測點PL5-4.

對于2014年8月31日到2014年9月18日的變形序列,共有19個變形數據,見表2.

表2 目標測點與參考測點的變形數據匯總表

假設2014年9月10日的變形數據是缺失的,用本文提出的基于非局部平均的插值方法和傳統方法分別對缺失值進行估計,結果見表3.

表3 各插值方法的估計結果對比 (單位:mm)

從各插值方法的計算結果可以看出,本文提出的基于非局部平均的單值缺失估計方法的估計結果接近原監測值.同時可以發現,當缺失值不在前后兩個數值區間范圍內時,傳統的插值方法難以有效估計出此類變形值;而NLM 插值方法克服了此局限性,該方法利用變形序列自相似性的同時引入參考序列,提高了缺失值估計的精度.

3.2 多值缺失估計

同樣以PL5-3測點的變形序列為例,構造長達一個月的缺失段(2014 年9 月1 日 至2014 年10 月2日).利用BP 神經網絡建立同一垂線上的其它測點與目標測點變形序列之間的映射關系.首先將各測點均已知的變形數據組成訓練樣本導入BP 神經網絡中進行學習,其次將其它測點缺失時間的變形值組成新樣本導入訓練好的網絡中計算出目標測點的缺失數據.各方法的計算結果如圖4所示,其估計精度見表4,其中可決系數

圖4 缺失值估計結果對比圖

表4 缺失值估計精度對比

由圖4和表4的結果可以看出,本文提出的基于空間鄰近點BP 映射的多值缺失估計方法的估計精度均高于其它3種方法,可決系數和均方根誤差均達到比較理想的效果;空間鄰近點插值方法的估計效果也較好,但該方法僅利用了上下兩個測點的變形信息進行回歸分析,沒有充分挖掘出目標測點變形的相關信息;非線性回歸利用了統計模型的思想,在環境量變化不大的情況下可以采用該方法進行估計;線性插值的效果較差,難以適用于多值缺失的估計.

4 結論

為解決混凝土壩變形信息的缺失問題,本文提出了基于非局部平均思想的單值缺失估計方法和基于空間鄰近點BP映射的多值缺失估計方法;工程應用驗證表明,本文提出的兩種方法計算簡單,易于操作,且均具有較高的精確度,可以較好地估計出變形時間序列中的缺失信息.但是,這兩種方法仍有待改進的地方:1)基于非局部平均思想的單值缺失估計方法,需要確定時間序列中所有已知時刻變形對缺失時刻變形的權重,整個時間序列長度的選擇標準值需進一步的研究;2)基于空間鄰近點BP映射的多值缺失估計方法,通過BP神經網絡來刻畫目標測點變形和鄰近點變形的映射關系,但難以用數學顯式刻畫測點變形之間的關系,需要進一步研究能充分反映混凝土壩各部分變形間相互關系的直觀表達式.

猜你喜歡
插值測點變形
徐州市云龍公園小氣候實測與分析
滑動式Lagrange與Chebyshev插值方法對BDS精密星歷內插及其精度分析
基于CATIA的汽車測點批量開發的研究與應用
水下單層圓柱殼振動聲輻射預報的測點布置改進方法
二元Barycentric-Newton混合有理插值
變形記
談詩的變形
室外風環境實測及PHOENICS 模擬對比分析研究*
——以徐州高層小區為例
基于pade逼近的重心有理混合插值新方法
“我”的變形計
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合