?

基于深度學習的橋梁健康監測數據有效性分析

2021-03-15 12:33梁宗保納守勇馬天立
關鍵詞:監測數據神經元標簽

梁宗保,柴 潔, 納守勇,馬天立,唐 玉

(1. 重慶交通大學 信息科學與工程學院,重慶 400074; 2. 重慶忠萬高速公路有限公司,重慶 401147)

0 引 言

建立四通八達的現代化交通網,大力發展交通運輸事業,對發展國民經濟,促進文化交流和鞏固國防等方面都具有非常重要的作用。橋梁是交通的重要組成部分,橋梁安全問題是在役橋梁的核心問題。通過橋梁結構健康監測系統可以實時了解橋梁結構狀態,對橋梁進行有效維護,延長橋梁的使用壽命。

橋梁結構健康監測系統包含信息獲取與安全評價兩個環節[1],信息獲取環節以多種類型的傳感器及相關儀器組成的硬件系統為主。橋梁結構健康監測系統中數據有效性問題大多是由信息獲取環節的硬件設備造成的。監測設備出現故障,無法為后續的安全評價提供正確的原始信息,從而對評價結果產生嚴重影響,導致橋梁結構事故預兆的漏報或誤報。因此,傳感器采集的原始信息有效性問題是橋梁結構健康監測系統面臨的重大科學技術問題。

國內外相關研究都集中在異常數據分析、橋梁安全評估等方面,對橋梁結構健康監測數據有效性分析的研究較少。胡順仁等[2]采用主成分分析法,結合關聯穩態模型分析,通過統計過程控制限和T2控制限的計算發現失效數據點;黃曉微等[3]提出了一種基于K最近鄰的傳感器有效度算法,并將該算法應用于攀枝花倮果大橋健康監測系統的撓度數據分析;袁慎芳等[4]利用超球面一類支持向量機,結合核主成分分析,成功識別常規監測數據和特殊事件數據。但這些方法都是根據數據的統計特性識別單點失真數據,需要大量的領域知識,不能直接用于判斷數據的有效性。

近年來,深度學習(deep learning, DL)在人工智能領域取得了重大成果。DL由G. E. HINTON等[5]在2006年提出,DL模型由多層非線性運算單元組合而成,將較低層的輸出作為更高一層的輸入,通過這種方式自動地從大量訓練數據中學習抽象的特征表示,發現數據的分布特征。 DL因在特征提取與處理方面的優勢在計算機視覺[6]、語音識別[7-8]與自然語言處理[9]等領域應用廣泛。DL在橋梁健康監測系統中也發揮著重要作用。梁宗保等[10]提出了一種基于DL的橋梁結構健康診斷方法,將自編碼器、支持向量機(support vector machine, SVM)相結合,采用5層網絡對橋梁結構健康進行診斷;馮微等[11]針對車撞橋墩過程中橋墩受損等級不易被實時監測和預警的問題,構建了基于DL的橋墩損傷等級判別模型;S. CHEN等[12]提出了一種多分辨率自適應圖濾波分類方法,通過半監督學習標記信號并將該方法間接應用于橋梁結構健康監測。但在監測數據有效性分析中,DL尚未得到廣泛應用,鑒于DL具備從復雜數據中提取數據特征、學習數據分布的能力,可以將DL應用于橋梁健康監測數據有效性分析。

橋梁由不同的結構體組成,斜拉橋同一結構體各測量點間呈現位置上的關聯[2],同一時刻受到同一外部作用時,同截面和相鄰測量點的數據保持高度關聯。針對上述特性,提出了一種灰色關聯度與DL相結合的方法,通過灰色關聯分析(grey relation analysis, GRA)對數據進行預處理,自動給定數據標簽并進行標簽正確性驗證,結合DL模型深度神經網絡(deep neural network, DNN)、深度信念網絡(deep belief network, DBN)對數據有效性進行分析,提高模型預測效率,實現了監測數據有效性的智能分析。

1 DNN與DBN

1.1 DNN

DNN是輸入層和輸出層之間有多個隱藏層的人工神經網絡(artificial neural network, ANN),DNN通過學習來存儲輸入與輸出間的復雜映射關系。DNN中單個神經元為感知機模型,模型結構如圖1。感知機模型是生物神經細胞的簡單抽樣,模型輸出是輸入經過線性變換與函數激活的結果。神經元上的計算為:

(1)

式中:x為模型輸入;w為權重;b為偏置;Z為線性運算結果;f()為激活函數,通常為tanh()或sigmoid()函數;y為神經元輸出。DNN的學習是基于損失函數最小化的,通過反向傳播算法最小化假設函數與實際值間的距離,迭代優化w與b。

圖1 感知機模型

DNN通過疊加多層感知機,解決了淺層神經網絡非線性擬合不佳的問題。對于非線性的復雜數據,DNN能自動提取數據特征,具有較高的預測精度。

1.2 DBN

受限玻爾茲曼機(restricted boltzmann machines, RBM)是包含一層可見單元和一層隱藏單元的無向概率圖模型,層間全連接,層內無連接,其結構如圖2。DBN是由多個RBM累疊所得,且具有若干隱藏變量層的生成模型。作為自編碼器,DBN可以在盡量保留數據特征的情況下降低數據維度;作為分類器,DBN可以有效減少分類錯誤率。DBN的一種高效訓練方式是將復雜模型看作是一組簡單模型的組合序列,采用逐層無監督的方法學習參數[13]。

圖2 RBM模型

DBN允許序列中的RBM接收不同的數據表示,且保持前一個RBM的輸出為后一個RBM的輸入,因此能夠更好的學習數據分布,具有較高的分類性能。

2 數據有效性預測模型設計

DNN、DBN模型可以學習到刻畫數據本質屬性的特征,對數據分類任務有很大幫助[14]。以下利用DNN與DBN,建立用于分析橋梁結構健康監測系統傳感器數據有效性的模型。

2.1 DNN模型結構

建立用于橋梁結構健康監測數據有效性分析的DNN模型主要需要確定以下超參數:模型層數、輸入層神經元個數、輸出層神經元個數、隱藏層神經元個數。模型輸入層神經元個數一般等于輸入的數據序列長度,輸出層神經元個數為分類任務的類別數。參考Kolmogorov定理,結合對比實驗,確定模型層數及神經元個數。模型結構如圖3,圖中數據為該層內神經元個數。

圖3 DNN模型結構

模型損失函數采用交叉熵函數:

h0(xi)]

(2)

式中:h0(xi)為輸入xi時DNN的輸出;yi為樣本標簽;N為樣本個數。

反向傳播過程中計算公式為:

(3)

式中:α為學習率。

模型輸出與數據段類型對應關系如表1。模型訓練過程:利用權重系數矩陣w與偏置向量b和輸入向量x進行前向傳播得到模型輸出;計算模型輸出與標簽間的損失函數;通過反向傳播算法最小化損失函數,優化模型參數,提高模型性能。

表1 模型輸出結果對應關系

2.2 DBN模型結構

建立用于橋梁結構健康監測數據有效性分析的DBN模型,模型由兩個RBM堆疊而成。模型輸入層神經元個數與輸入序列長度一致,模型結構如圖4,圖中括號內為單層神經元個數。模型訓練過程采用對比散度算法[15],詳細流程如1)至4):

圖4 DBN模型結構

1)將輸入賦值給可見層v,計算隱藏層中每個神經元被激活的概率p(h1|v1)。隱藏層中神經元hj被激活的概率為:

(4)

式中:hj=1為神經元處于激活狀態;f()為激活函數;bj為j的偏置;vi為可見層神經元i的輸入;wij為i與j間的權重。

2)利用Gibbs采樣,從已得到的概率分布中抽取一個樣本:h1~p(h1|v1)。

3)通過h1實現可見層的重構,利用隱藏層反推可見層中神經元被激活的概率p(v2|h1)??梢妼又猩窠浽獀i被激活的概率為:

(5)

式中:ci為i的偏置。

4)同2),抽取一個樣本v2~p(v2|h1),用v2計算隱藏層神經元激活概率p(h2|v2)并更新參數為:

(6)

式中:w為權重;b、c分別是可見層和隱藏層的偏置;λ為學習率。

模型訓練過程如下:將輸入層和隱藏層H1作為第1個RBM,訓練RBM的參數,然后固定參數,將H1作為可見層,H2作為隱藏層,訓練第2個RBM,逐層訓練每一個RBM,最后通過有監督的反向傳播算法微調網絡中每層之間的權重,進一步優化網絡。

3 無效數據段特征分析與數據集構建

對橋梁結構健康監測數據進行特征分析的主要目的是研究數據的分布特征,進一步對數據進行分析與處理。目前橋梁結構健康監測數據的特征分析大多針對單點數據,但在實際應用中,單點與數據段之間存在一定的關聯,一個無效數據段必然包含無效數據點,單個數據點的失效也會導致數據段的失效,因此在數據特征分析的基礎上針對數據段進行處理,主要方法如下:首先根據無效數據段常見特征標記數據段,然后結合橋梁撓度傳感器節點布置情況根據GRA[16]對數據有效性進行分類,構建數據集。

3.1 無效數據段特征分析

數據段失效可能是連續的數據點失效,也可能是單個數據點異常。無效數據一般存在兩種情況:超過閾值且無法恢復的數據;因傳感器故障而產生震蕩的數據。

無效數據段常見的特征如下:①漂移失效:在斜拉橋監測中,正常情況下,測點數據在一段時間內的幅值變化具有一定規律,如果某段時間內,數據幅值呈現連續小幅恒定增加或小幅恒定減小的漂移變化,則此段數據為漂移失效;②數據頻率異常:正常情況下橋梁結構健康監測數據按照一定的頻率波動,無效數據可能出現波動異常;③恒值失效:傳感器因故停止工作或輸出不變,可能導致某一時間段內數據為恒定值;④數據段跳變:相比原有數據,某段數據的波動特征變化不明顯,但幅值出現較為明顯的增加或減少。

3.2 數據集構建

根據3.1節中無效數據段常見特征能夠對數據段進行可視化標記,但很大一部分無效數據段的變化處于合理的范圍內,沒有表現出可視化的常見無效特征,因此不能直接標記。鑒于斜拉橋同截面與相鄰節點的數據存在高度關聯的特性,可利用關聯性分析來標記無效數據段。

關聯性分析是一種能夠可視化地定量地說明事物或參數之間相互關系的方法,主要思路是通過比較一個樣本數據序列和其他若干序列在不同維度上的相似程度來衡量序列間的緊密性。GRA是一種經典的多因素關聯分析方法,主要研究對象是離散的數據狀態變量,比如橋梁結構健康監測數據。在系統發展過程中,如果兩個因素的變化趨勢具有一致性,即同步程度較高,則認為兩者關聯較大;反之,則兩者關聯較小。斜拉橋結構特性表明,其相鄰節點在荷載作用下的效應數據之間的關聯性較強,而節點數據失效則會影響這種關聯性。因此灰色關聯度可以運用在斜拉橋撓度數據分析中,根據參考序列和比較序列間的動態關聯關系判斷監測數據是否有效。GRA標記數據的步驟如下:

1)確定數據列:將撓度傳感器數據以天為單位切分為數據段,需要判斷有效性的數據段為參考數據列,相鄰和同截面節點的數據列為比較數據列。

2)數據標準化:對數據序列進行無量綱處理,轉化為方差為0,標準差為1的數據序列。

3)計算關聯系數:假設參考數據列X0和m個比較數據列X{Xi|i=1,2,……m}均有n維分量,關聯系數的計算公式為:

ξoi(k)=

(7)

式中:ρ為分辨系數,取值一般在區間(0, 1);k為第k維分量。

4)計算關聯度:計算參考數據列在各個分量上的關聯系數均值為:

(8)

式中:roi為關聯度,反映了序列間的變化相似度。

5)判定參考數據列有效性:參照關聯度常用強度判定[17],結合斜拉橋結構力學理論分析及橋梁行業一般認定[2],對數據序列進行有效性判定的標準如下:關聯度0.8~1.0屬于強關聯,判定為有效數據段;0.8~0.6屬于較強關聯,判定為一般有效數據段;0.6以下屬于弱關聯,判定為無效數據段。判定結果標簽設定如表2。

表2 數據處理結果對應關系

其中,有效數據段即能夠真實反映橋梁節點結構狀況的數據段,可直接用于后續的橋梁健康診斷。無效數據段即無法真實反映橋梁節點結構狀況的數據段,不可用于橋梁健康診斷。而一般有效數據段即能夠大致反映橋梁節點結構情況的數據段,需要進一步處理以確認其是否可用。例如通過修復其中的異常數據點,重新計算關聯度來確定其是否為有效數據段。

采用上述判定標準對參考數據列與比較數據列的關聯度均值進行判定,完成數據集的構建。

6)驗證數據標簽可信度:使用統計算法3σ、孤立森林和LOF算法對傳感器數據進行單點異常分析,通過異常點在數據段所占比例驗證標簽可信度。

根據上述方法結合傳感器布置位置對馬桑溪大橋主梁撓度傳感器數據進行特征分析與處理,構建數據集。馬桑溪大橋撓度傳感器節點布置如圖5,圖中節點標號與關聯度計算中數據列標號對應。圖6為數據段關聯度計算結果示例。表3為數據集標簽可信度驗證結果。

圖5 橋梁主梁傳感器節點布置

4 實驗與結果分析

4.1 數據集、度量方式與實現細節

在橋梁結構健康監測數據有效性分析中,使用第3部分的數據列構建數據集,判定結果為數據標簽,表1為模型輸出與數據標簽間對應關系。將數據集以6∶2∶2的比例切分為訓練集、驗證集與測試集。采用交叉熵函數和準確度作為衡量指標。模型構建主要基于Keras與TensorFlow框架,選定規模為32的小批量RMSprop作為模型優化器,即反向傳播算法。

表3 數據標簽可信度

圖6 關聯度計算結果示例

4.2 實驗與實驗結果

基于Keras框架構建DNN模型,模型架構如圖3,隱藏層選擇修正線性單元(rectified linear unit, RLU)作為激活函數;輸出層激活函數為Softmax函數;損失函數使用交叉熵函數;學習率0.05;迭代次數100。根據圖4構建DBN模型,激活函數、損失函數、評價指標、迭代次數、學習率與DNN相同。

使用決策樹(decision tree)、隨機森林(random forest)、 SVM等機器學習分類方法進行對比實驗,實驗效果如表4。

表4 模型預測結果對比

4.3 實驗分析

將決策樹、隨機森林、SVM等多種經典機器學習算法與DNN、DBN模型進行對比實驗,實驗結果如表4。在相同數據集上,相比于決策樹模型,DBN提高約14.12%的預測精度。實驗證明,深度模型具備較強的數據分析與處理能力,更適用于橋梁健康監測數據有效性分析。

但DNN、DBN模型中存在大量參數,且參數初始值隨機設定,因此在訓練過程中容易陷入局部最優,影響網絡模型訓練及測試精度。結合人工螢火蟲群優化算法(glowworm swarm optimization, GSO[18],進一步優化DBN。GSO具有較好的解決優化問題的能力,將損失函數作為目標函數,采用GSO對RBM的初始參數進行優化,提高模型泛化性及測試精度。實驗結果如表5,表中DBN-R表示參數隨機初始化,DBN-GSO表示使用螢火蟲算法優化初始參數。實驗證明使用GSO算法進行模型參數初始化可以提高模型預測精度。

表5 模型優化結果

5 結 論

數據有效性分析對橋梁健康監測系統具有重要意義?;谛崩瓨蚪Y構特性,使用GRA對橋梁撓度傳感器數據段有效性進行判斷,結合多種異常檢測算法對判斷結果進行驗證。以判定結果為數據標簽,利用DNN、DBN模型進行訓練,結合GSO與DBN,得出以下結論:

1)采用GRA衡量數據段間的相關性,能夠自動給定數據標簽并進行驗證,為預測模型提供數據集。

2) 基于DL的數據有效性分析模型效果優于經典機器學習方法。相比于決策樹,DBN模型預測準確度提高了14.12%,具有更高的預測精度與應用價值。

3)基于DBN-GSO的橋梁結構健康監測數據有效性分析模型預測精度達到了94.47%,驗證了所提方法的有效性。

猜你喜歡
監測數據神經元標簽
AI講座:神經網絡的空間對應
仿生芯片可再現生物神經元行為
不害怕撕掉標簽的人,都活出了真正的漂亮
這個神經元負責改變我們的習慣
研究人員精確定位控制飲酒的神經元
淺談環境監測垂直管理的優勢
讓衣柜擺脫“雜亂無章”的標簽
科學家的標簽
科學家的標簽
環保驗收監測異常數據的分析與處理探討
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合