?

SSA-SARIMA 組合模型的橋梁健康狀態預測

2023-12-15 04:28諶楨文
關鍵詞:加速度精度橋梁

諶楨文,常 軍

(蘇州科技大學 土木工程學院,江蘇 蘇州 215011)

橋梁健康監測系統用于實時掌握橋梁的健康狀況。通過安裝不同類型的傳感器可以掌握橋梁的整體信息,并通過適當的處理,可用于傳統的損傷識別和結構狀況評估[1-2]。其中,如何建立一個具有高精度的預測模型,準確地對監測數據進行預測是結構狀態評估的關鍵,對于橋梁安全預警及后續管養工作具有重要意義。這些數據往往是含有等時間間隔的數據。因此,時間序列分析理論為橋梁健康狀況評估提供了可行的思路[3-5]。奇異譜分析(SSA)是一種時間序列分析工具,被認為是一種非常成功的數據預處理算法。SSA 可將給定的時間序列分解為有限個更簡單和可識別的分量,再將信號按需要進行重組[6-8],同時它對數據有良好的外推預測能力[9-10]。SARIMA 模型在ARMA 模型的基礎上能夠有效地對數據中的季節項和趨勢項進行處理,避免了現在大多數只使用趨勢或者季節性的組合模型的帶來的繁瑣,在精度方面有著提高[11-12]。因此,基于SSA 分解、重構及外推預測能力和SARIMA 模型,通過工程實例的檢驗證明組合模型的預測能力比單一模型的預測能力有顯著的提升。

1 基本原理

1.1 奇異譜分析

奇異譜分析最早由Colebrook[13]在海洋學研究中提出并使用。SSA 是一種非參數、無模型的時間序列工具,對于時間序列,既不需要假設參數模型,也不需要假設平穩性條件,它可以通過奇異值分解(SVD)將時間序列分解為可分離的分量[14]。在橋梁領域的實際運用中,李小奇等[15]和戴建彪等[16]利用奇異譜分析,分別提取應力監測數據及橋梁索塔GPS 監測數據中的趨勢成分和周期成分。SSA 包括時間序列的分解、重構及預測。

(1)分解。原始的時間序列(x1,x2,…,xN)通過映射可以成為K 個長度為L 的向量,定義由這些向量組成的矩陣為軌跡矩陣X

式中,L 是選定的窗口長度,N(N>2)是時間序列長度,K=N-L+1。對軌跡矩陣X 進行奇異值分解(SVD)可提供L 個特征值、特征向量和主成分的集合。令S=XXT,用λ1,…,λL表示S 的特征值,并假定它們按遞減順序排列,因此λ1≥…≥λL≥0。軌跡矩陣X 的奇異值分解可以寫為

其中,Ei=(時間重組序列RCi),Ui為S 對應特征值的標準正交向量,Vi=XTUi/(i=1,2,…,d)。

(2)重構。將初等矩陣Ei的下標i={1,2,…,d}劃分成子集I1,I2,…,Im,計I={i1,i2,…,ip}為對應的下標,則有

將式(4)中的每個分組轉化成對應長度為N 的時間序列,設Y 為L×K 維矩陣,其元素為Yij(1≤i≤L,1≤j≤K)。令L*=min(L,K),K*=max(L,K),K=N-L+1,則當L<K 時,Y*ij=Yij,否則,Y*ij=Yji。對角平均按下面公式將矩陣Y 轉換成序列g1,g2,…,gN。

式(5)相當于在矩陣對角線i+j=k+1 求平均:當k=1 時,g1=y11;當k=2 時,g2=(y12+y21)/2,以此類推。如果矩陣Y是時間序列(h1,h2,…,hN)的軌跡矩陣,那么對所有i 都有gi=hi。將式(5)應用于式(4)中的EIk(k=1,2,…,m),將形成一個重建序列Z(k)=(z1(k),…,zN(k)),因此,原始時間序列(x1,x2,…,xN)將被分解為m 個時間序列

(3)預測。為了實現SSA 預測,時間序列應該滿足線性遞歸公式(LRF)[10]。時間序列QN=(x1,x2,…,xN)線性遞歸公式如下

其中gk表示為式(5)重構出來的序列。

1.2 SARIMA 模型

SARIMA 模型,即季節性差分自回歸滑動平均,是ARIMA 的發展,并提高了ARIMA 模型在季節性序列建模中的性能。具體內容可參考文獻[18]。

2 SSA-SARIMA 組合模型

組合模型預測方法是現在較為熱門的方法,一般時間序列數據有三個特性,分別為趨勢、周期和噪聲。單一預測模型很難同時對三種特性數據有較好的預測能力。因此,采用組合模型成為了提高預測精度的有效手段[4,11,17],組合模型建立如下:

(1)利用SSA 將原始信號分解為L 個重組序列RC;

(2)引入貢獻率和相關矩陣來確定重組的RC 信號組,從而獲得趨勢、周期和高頻三個特征數據;

(3)利用SSA 和SARIMA 模型分別對三種特性數據進行預測;

(4)將預測結果通過評價指標,比較兩種模型對三種特征數據的預測效果,并對特征數據擬合度較好的模型進行重組,確定SSA-SARIMA 組合模型;

(5)分別采用該組合模型、SSA 和SARIMA 模型對原始數據進行預測;

(6)采用均方誤差(MSE)、均方根誤差(RMSE)、平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)等評價指標對預測結果進行比較,驗證組合模型的有效性。

上述評價指標的目的是反映模型的預測值與實際值的相似度。預測值越接近實際值,預測誤差越小,預測精度越高。在上述四個評價指標中,MES 和RMSE 可以代表結果的總體誤差。該值越小,預測結果整體誤差越小。MAE 和MAPE 值可以表示為擬合精度。該值越小,說明預測結果精度越高,信號損失越小。

3 實例分析

3.1 數據選取

采用文獻[18]中案例驗證組合模型的有效性。提取2021 年7 月28 日至8 月28 日的實橋跨中位置加速度傳感器數據,由于樣本量過大,將每一小時的數據平均值,進行樣本量縮減??s減之后樣本量為745 個,大大減少了運算量,加速度數據如圖1 所示。

圖1 加速度信號

由圖1 可知,加速度數據存在明顯的趨勢和季節性,整體的加速度數據為非平穩數據。由于數據集樣本量為745 個,選取前595 個數據為訓練集,用作訓練模型,后150 個數據為測試集,用作樣本外預測,其數據集劃分如圖2 所示。

圖2 訓練集與測試集

3.2 SSA 分解與重構

SSA 窗口的長度應盡量為周期的倍數,所以窗口長度為48,SSA 分解結果如圖3 所示。由圖3 可知,RC1 有著明顯的趨勢性,RC2-RC3 有明顯的周期性,為了更準確地選取趨勢項、周期項和高頻項,引用貢獻率和相關性進行輔助選取。

圖3 SSA 前6 項分解結果

由圖4 特征值對應特征向量的貢獻率可以得到,一共有48 個特征值,第1 個奇異值對應RC 的貢獻率最大,其占主要成分,第4 個奇異值對應RC 往后的貢獻率接近0。再由圖5 中RC 相關性矩陣可知,第4 個和第5 個RC 相關性較強,所以最終確定三個分量的劃分為:第1 個對應RC 作為趨勢項,第2 至第5 個RC 確定為季節項,第6 至第48 個RC 為高頻項,組合結果如圖6 所示。

圖4 特征值的貢獻率

圖5 RC 相關性矩陣

圖6 趨勢項、季節項、高頻項重組結果

3.3 選取最優模型

奇異譜分析提取了原始數據的3 個特性分量(趨勢、季節、高頻)分別利用單一模型對三種特性數據進行預測。圖7 為各項預測結果,下面引用MSE 和MAPE 評價指標對模型的誤差和精度進行評估,結果如表1 所示。由預測結果可以知道,對于趨勢項而言,SARIMA 模型的MSE 和MAPE 值均較小,說明其誤差較小,精度較高;對于季節項而言,SSA 模型的MSE 和MAPE 值均較小,說明其誤差較小,精度較高;對于高頻項而言SSA 和SARIMA 模型的MSE 值均較小,說明兩種模型預測誤差均小,但是SARIMA 模型的MAPE 值較小,說明其精度較高。所以,最優組合模型選用SSA 模型預測季節項,由SARIMA 模型預測趨勢項和高頻項。

表1 各分項SSA 和SARIMA 預測結果

圖7 趨勢項、季節項、高頻項預測結果

3.4 單一及組合模型的預測結果

將數據整合,利用原始加速度數據來驗證組合模型的預測結果比單一模型的預測結果好。如圖8 為原始加速度數據的模型預測結果對比圖;表2 為SSA 模型、SARIMA 模型和SSA-SARIMA 組合模型預測效果評價表。從表2 可以看出,對于組合模型,四個指標均小于單一模型,說明組合模型的預測精度要優于其他兩種單一預測模型。

表2 各模型預測效果評價

圖8 原始加速度數據各模型預測結果對比

4 結語

以某大橋健康監測系統采集的加速度數據為樣本,結合SSA 和SARIMA 模型,研究了組合模型在橋梁健康預測分析中的應用。得出以下結論:

(1)基于SSA 的組合模型預測結果能夠更為精確的擬合實際結果,為橋梁傳感器空缺數據的插補及預測橋梁未來健康狀態提供了一個可靠的預測模型。

(2)SSA 分析不僅可以將數據拆分成若干簡單含有可識別信息的分量,還可以進行重組提取數據中的趨勢分量、季節分量及周期分量,這對于提取橋梁監測數據中的重要信息有著十分重要的幫助。

(3)SSA 模型和SARIMA 模型兩種單一模型對于趨勢、季節、高頻數據的預測能力總體來說較好。但對于橋梁數據而言,高頻項數據中往往存在很重要的信息,兩種模型對于高頻項的誤差精度較差,會導致高頻能量的丟失。

猜你喜歡
加速度精度橋梁
“鱉”不住了!從26元/斤飆至38元/斤,2022年甲魚能否再跑出“加速度”?
手拉手 共搭愛的橋梁
句子也需要橋梁
天際加速度
創新,動能轉換的“加速度”
死亡加速度
基于DSPIC33F微處理器的采集精度的提高
高性能砼在橋梁中的應用
GPS/GLONASS/BDS組合PPP精度分析
改進的Goldschmidt雙精度浮點除法器
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合