?

基于改進遺傳算法優化BP神經網絡的單體建筑物震害評估方法

2023-03-06 07:05孟雅湉熊永良郭紅梅張瑩趙真江雪梨
中國地震 2023年4期
關鍵詞:適應度單體遺傳算法

孟雅湉 熊永良 郭紅梅 張瑩 趙真 江雪梨

1)西南交通大學,地球科學與環境工程學院,成都 611756

2)四川省地震局,成都 610041

0 引言

我國位于環太平洋地震帶和歐亞地震帶之間,地震活動范圍廣,頻率高,烈度大,震源淺(李邯廣,2018)。地震釋放的能量會導致建筑物和各類設施的破壞、倒塌及各種次生災害發生,造成巨大的經濟損失,甚至造成人員傷亡(陳華靜等,2020)。其中, 建筑物的破壞和倒塌又是造成人員傷亡和經濟損失的最主要原因。因此,在目前地震預測能力不足的條件下,若能快速、準確地評估某區域內單體建筑物在各震害影響因素綜合作用下的破壞情況,對于震前發現抗震設防的具體薄弱環節,開展建筑物抗震加固等地震災害風險精準治理,以及震后快速了解災區建筑物詳細震害情況,準確定位受災位置,進行救援力量科學部署等應急處置均具有重要意義(別冬梅,2011; 孫柏濤等,2021)。

對于單體建筑物的震害評估,目前國內外主要有6種方法,分別為歷史震害統計法、專家評估法、模糊類比法、半經驗半理論法、結構理論計算方法和動態分析法(崔玉紅等,2001)。然而,這些評估方法或存在評估結果粗放,或存在評估過程繁雜、自適應能力較差等不足。因此,找到一種評估過程快速、智能,評估結果又能準確反映各類不同單體建筑物破壞情況的評估方法,具有研究意義和防震減災應用價值。

近年來,由于機器學習方法自適應性高、容錯性強的特點,并且在處理復雜的非線性問題時具有高效性和準確性(范傳鑫,2014),很多研究者已經開始將機器學習算法及其衍生方法應用于地震等自然災害損失評估領域(Kircher et al,1997)。劉本玉等(2002)應用模糊人工神經網絡方法對結構震害進行分析預測,運用灰色數學方法篩選出震害主要影響因素,并進行模糊人工神經網絡的構筑與訓練。湯皓等(2006)構建了一種結合灰色關聯分析與BP神經網絡技術的綜合評價模型來對多層磚房震害進行分析、預測。Noura等(2019)利用人工神經網絡(ANN)方法進行震害評估,模型輸出結果達到了87%的準確性。戴靜涵(2019)將神經網絡交叉應用,實現了在使用少量震害影響因子的情況下,對建筑物進行快速且準確的震害評估。Yariyan等(2020)應用FAHP-ANN模型準確識別了建筑基礎設施的地震易損性。除了BP神經網絡方法外,也有學者利用Elman神經網絡的方法對地震直接經濟損失進行評估分析(鄭韻等,2021),以及基于深度學習的神經網絡方法對地震傷亡人口進行預測(朱鵬宇等,2022)。

上述研究表明,基于機器學習進行震害評估的方法是快速、準確的,但傳統的人工神經網絡和BP神經網絡模型容易陷入局部極小值,收斂速度較慢(夏瑜潞,2019)。因此,本文利用改進的遺傳算法對BP神經網絡進行優化,建立單體建筑物震害評估模型,輸出評估區域內單體建筑物在各震害影響因素綜合作用下的破壞等級。在實現對建筑物震害快速、準確、科學智能化評估的同時,模型輸出的定量且精細化的評估結果有助于全面感知建筑物的震害風險水平,可為政府、行業部門和社會共同開展地震災害風險精準治理等風險管理工作提供信息支撐。

1 震害影響因素分析與量化

1.1 震害影響因子的確定

建筑物在地震中的破壞情況是由多種因素共同決定的,科學選取震害因素是準確評估建筑物震害情況的前提。本文在考慮地震強度、建筑物所處環境及自身結構特征等各種因素對建筑物震害影響的情況下,基于數據易于獲取的原則,選取地震烈度、場地類型、發震斷層類型、距震中距離、距發震斷層距離、建筑物結構類型、建筑用途、設防烈度作為建筑物震害的影響因素。將這8個影響因素作為本文模型的輸入指標,模型的輸出為建筑物的震害情況,按照5種破壞等級進行分類,即基本完好、輕微破壞、中等破壞、嚴重破壞和毀壞。

1.2 震害影響因子的量化

神經網絡算法僅能處理數值型的數字信息,而發震斷層類型、場地類型、建筑物結構類型和建筑用途為定性信息,無法直接進行比較和計算,因此需要將其轉化為數值型信息。在確定影響因子的量化取值標準時,通過分析同一影響因素的不同屬性對結果的影響大小,反映出不同屬性之間的差異。將定性的影響因子參數取值設置為0~1之間的數值,數值大小反映的是在同一影響因素內屬性之間的對比關系。數值型的定量影響因子按實際數值取值,影響因子的選擇和量化取值標準如下:

(1)地震烈度: 按照實際數值取值,地震烈度Ⅷ度、 Ⅶ度、 Ⅵ度、 Ⅴ度依次取值為8、 7、 6、 5。

(2)場地類型: 由于土層等效剪切波速和覆蓋層厚度數據難以獲取,本文根據亢川川(2017)的研究方法,利用SRTM30的DEM數據,結合ArcGIS軟件計算建筑物對應場地的坡度值,基于地形坡度法并根據NEHRP規范將場地類型劃分為B、C、D、E四類。在四類場地類型中,B類場地對地震動的放大作用最不明顯,抗震性能最好,其他次之,故將取值依次設置為B類0.5,C類0.3,D類0.1,E類0。

(3)發震斷層類型:評估區域內的發震斷層主要分為逆沖斷層和走滑斷層。根據楊海芳(2018)的研究結果,在同等震級下,逆沖斷層對建筑物震害的影響大于走滑斷層。因此,將其取值分別設置為1和0.6。

(4)距震中距離:根據建筑物和震中的位置信息計算距離,距離越近,地震對建筑物的破壞力越大。

(5)距發震斷層距離:地震烈度區的分布與發震斷層的位置有關,根據建筑物和發震斷層的位置信息計算距離,建筑物離發震斷層越近,受到的地震動的影響越大。

(6)建筑物結構類型:根據尹之潛等(2004)的統計和歷史震例資料,典型的建筑物結構類型主要分為土木結構、磚木結構、磚混結構、框架結構和木結構,木結構為穿斗木屋架房屋。不同結構類型的建筑物抗震性能不同,根據歷史震例數據,對5種結構類型的建筑物震害指數進行統計分析,得到不同建筑結構的取值依次為0.33、0.31、0.25、0.11和0。

(7)建筑用途:建筑物按用途主要分為民用住宅類、教育類、衛生類、黨政類和其他類,其他類包括工業廠房和商場等建筑。不同用途的建筑物在建造時所采取的抗震措施不同,重要建筑物的抗震性能更優。因此,將其取值按震害影響依次設置為1、0.4、0.4、0.4和0。

(8)設防烈度:建筑物經過抗震設防后具備一定的抗震能力,設防烈度值越大,建筑物在地震中受到的損失越小。建筑物設防烈度的取值主要取決于地區規劃的抗震設防烈度標準,重要建筑物由于設計和施工要求更高,需要增加1度設防烈度。

以上建筑物震害的影響因素與建筑物震害結果既存在正相關,也存在負相關。BP神經網絡算法作為一種可以自適應學習的算法,可以從大量的輸入、輸出數據中學習到輸入與輸出中的既有正相關又有負相關的映射關系。

2 單體建筑物震害評估模型構建

2.1 數據準備

從四川省地震局調查和統計的災情數據中,收集整理了2019年6月17日長寧縣6.0級和2021年9月16日瀘縣6.0級地震中的205棟建筑物數據,從中選取對應的8個影響因子參數和破壞等級數據,作為本文的樣本數據集,用于構建單體建筑物震害評估模型,部分樣本數據見表1。在數據集中,破壞等級數據由專業評估人員根據我國普遍采用的建筑物破壞等級劃分方法,依據地震現場的實地評估結果進行劃分。同時,為了方便BP神經網絡的計算,按照上述量化取值標準對影響因子進行量化。

表1 單體建筑物震害部分樣本數據

2.2 數據預處理

2.2.1 樣本均衡化

在上述數據集中,破壞等級為基本完好、輕微破壞、中等破壞、嚴重破壞和毀壞的建筑物分別為44棟、84棟、40棟、28棟和9棟。不同破壞等級的樣本數目差距較大,且破壞等級為毀壞的建筑物數量過少,不利于神經網絡模型的訓練。樣本的特征和數據作為模型的輸入對于評估指標與模型的優劣具有重要作用(彭一凡,2022)。若使用類別不均衡的樣本訓練神經網絡模型,模型會學習到訓練集中樣本比例的先驗信息,導致輸出結果可能出現多數類精度高,而少數類精度較低的情況。

為提升模型的準確度,需要對原始類別不均衡的數據集進行采樣,通過改變原始不同類別樣本的數目,得到均衡的數據樣本。本文采用代價向量作為采樣比例的過采樣方法,利用MATLAB的BP神經網絡工具箱建立模型,根據模型輸出結果獲取混淆矩陣,以混淆矩陣中錯分類的樣本數作為代價矩陣,通過對代價矩陣每一列求和得到代價向量,復制少數類樣本直到不同類的樣本與代價向量成正比,以平衡樣本之間的數目差異。

通過上述過采樣方法,在保持樣本的重要信息完整性、避免人為構造不存在的樣本和不改變原有數據的分布情況的前提下,成功地平衡了樣本數量,樣本數量變化如表2所示。

表2 樣本數量變化

2.2.2 樣本歸一化

由于不同影響因素的屬性量綱不同,存在的數量級差異會影響模型輸出結果的準確性。因此,本文基于數據極值法對影響因子的屬性進行歸一化處理,將其轉化為無量綱的純數值。

2.2.3 數據集劃分

為了防止模型過擬合,將樣本數據集按3︰1︰1的比例劃分為訓練集、驗證集和測試集,三組數據集分別用于模型的訓練、調優和泛化能力評估。

2.3 BP神經網絡方法和結構設計

反向誤差傳播算法(Back Propagation,簡稱BP)是一種應用廣泛且效果卓越的神經網絡算法。在解決震害評估等類似的復雜非線性問題上,與其他傳統模型相比,BP神經網絡通過反向傳播調整網絡的權值和閾值,具有更強的預測、訓練及自適應能力,能取得較好的機器學習效果(婁棕棋,2019)。

BP神經網絡包含輸入層、隱含層和輸出層三部分。本文將地震烈度、場地類型、發震斷層類型、距震中距離、距發震斷層距離、建筑物結構類型、建筑用途、設防烈度8個建筑物震害影響因素作為BP神經網絡的輸入神經元,即X=(x1,x2,x3,…,x8),共8個輸入層節點。通過反復實驗,確定隱藏層節點數為21個。輸出層節點數與建筑物的破壞等級相對應,設置為5個狀態神經元,即輸出向量Y=(y1,y2,…,y5),其中y1=(10000)、y2=(01000)、y3=(00100)、y4=(00010)、y5=(00001)。BP神經網絡的拓撲結構為8×21×5,如圖1所示。

圖1 BP神經網絡拓撲結構

2.4 改進的遺傳算法優化BP神經網絡

除神經網絡的拓撲結構外,神經網絡還要通過控制初始權值和閾值等來實現處理信息的功能,科學合理的參數選擇能夠使神經網絡逼近任意的非線性函數,有助于刻畫建筑物震害影響因素與破壞狀態間復雜的非線性關系,從而準確評估建筑物的震害情況。BP神經網絡的初始權值和閾值通常是隨機生成的,這導致在訓練過程中評估結果極易陷入局部最優解。遺傳算法(Genetic Algorithm,簡稱GA)是一種并行全局搜索算法,該方法在求解全局最優問題時具有較強的魯棒性,能夠在一定程度上彌補BP神經網絡的不足(吳欣欣,2020; 竇玉丹等,2010)。然而,傳統遺傳算法的交叉和變異操作中,固定值的交叉率和變異率容易導致早熟收斂,使得全局搜索能力降低。此外,當前種群的最優個體繼續參與選擇、交叉和變異等遺傳操作,可能在下一代丟失其基因信息,進一步限制了遺傳算法的優化能力。為此,本文提出了改進的傳統遺傳算法,用于優化BP神經網絡的初始權值和閾值。

針對傳統遺傳算法的不足,本文引入精英保留策略并對交叉、變異操作進行改進。在進行遺傳操作前,對種群個體的適應度進行降序排列,并選擇適應度最高的一定比例的個體作為精英直接遺傳到下一代。通過保留當前種群的最優個體,可以更好地保持種群的多樣性,同時提高算法的收斂速度。然后,采用輪盤賭的選擇方法,根據個體的適應度值占總適應度值的比例,確定每個個體被選擇的概率。

(1)

(2)

式中,Pcmax和Pcmin分別為最大交叉概率和最小交叉概率,Pmmax和Pmmin分別為最大變異概率和最小變異概率,其取值范圍為[0,1],fmax為種群中的最大適應度值,favg為種群的平均適應度值,f′為兩交叉個體中適應度較大的適應度值,f為變異個體的適應度值。

在改進傳統遺傳算法后,對BP神經網絡進行優化,基本流程如圖2所示。

圖2 改進的遺傳算法優化BP神經網絡流程

通過設置遺傳算法種群規模m、最大迭代數G、精英個體比例GAPP、最大交叉概率Pcmax、最小交叉概率Pcmin,最大變異概率Pmmax、最小變異概率Pmmin等運行參數(表3),在初始權值和閾值空間中隨機產生一組種群,完成種群的初始化操作。

表3 遺傳算法參數設置

將BP神經網絡的初始權值和閾值作為種群中的個體,采用實數編碼個體進行編碼。然后,利用訓練集BP神經網絡模型進行訓練,并在驗證集上測試BP神經網絡的精度,以均方誤差的倒數作為適應度函數,計算每個個體的適應度值,根據計算結果,對個體適應度值進行由高到低的降序排列,將精英個體直接遺傳到下一代。經過選擇操作后選取的個體按公式(1)和(2)計算的概率進行交叉和變異,交叉和變異算子采用田旭光等(2004)提出的方法,產生新一代個體。重復以上步驟,直至滿足最大迭代次數。最后,將最優個體解作為BP神經網絡的初始權值和閾值,輸入訓練集和驗證集對BP神經網絡進行訓練和調優,在達到預先設定的要求時停止訓練,輸出測試集在BP神經網絡模型上的評估結果。

2.5 模型性能分析

為驗證改進的遺傳算法對BP神經網絡的優化效果,本文對比了BP神經網絡(BP)模型、遺傳算法優化的BP神經網絡(GA-BP)模型和改進的遺傳算法優化BP神經網絡(IGA-BP)模型在測試集上的評估結果,并利用準確率和Kappa系數評估不同模型的性能,結果如圖3所示。其中, 不同模型在測試集上的準確率分別為83.93%、89.79%和91.96%,Kappa系數值分別為0.79、0.87和0.89。結果表明,IGA-BP模型的評估精度最高且模型泛化能力最優,由此驗證了本文提出的改進遺傳算法提高了傳統遺傳算法的尋優性能,并且對BP神經網絡有明顯的優化效果,該方法構建的單體建筑物震害評估模型具有較優的評估性能,可以應用于實際的震害評估工作中。

圖3 模型性能對比

3 實際算例分析

2022年9月5日四川甘孜州瀘定縣發生6.8級地震,發震斷層類型為走滑斷層(李贊等,2023)。根據四川省地震局的現場抽樣調查和專家評估數據,選取了30棟建筑物數據,從中提取了8個影響因子數據作為評估模型的輸入指標,按照上述量化標準將數據全部轉化為定量數據,并進行歸一化處理。將數據輸入單體建筑物評估模型中,對建筑物的破壞情況進行評估,模型輸入參數和評估結果見表4。

表4 實際算例數據和評估結果

為驗證單體建筑物震害評估模型的評估精度,將評估結果與現場調查結果進行對比,結果如圖4所示。結果表明,在30棟建筑物中,有26棟建筑物的評估結果與現場調查結果一致,準確率為86.67%,略低于樣本測試集結果91.96%的準確率。這可能是因為瀘定縣的30棟建筑物中還包括石木結構的藏式民居,而本文構建模型的數據集并未包含這一特征,實驗時將這類結構近似歸類為磚混結構,從而影響了模型的評估精度。進一步分析評估結果發現,嚴重破壞和毀壞2個可能產生嚴重損失的破壞等級評估精度最高,這有助于震前、震后進行應急處置,減少震害損失; 盡管破壞等級為中等破壞的評估精度較低,存在一些偏差,但評估結果與現場調查結果基本吻合??傮w而言,本文提出的方法能夠較為精確地評估單體建筑物的震害等級。

圖4 評估結果與現場調查結果對比

4 結論

本文通過分析單體建筑物震害的影響因素,并結合機器學習算法最新研究進展,建立了單體建筑物震害的評估模型。通過精英保留策略和自適應方法調整交叉、變異概率,對遺傳算法進行改進,提高了遺傳算法優化BP神經網絡的性能?;?019年6月17日長寧縣6.0級和2021年9月16日瀘縣6.0級地震調查數據,采用改進的遺傳算法優化BP神經網絡算法建立了單體建筑物震害評估模型,結果表明改進的遺傳算法具有顯著的優化效果。利用構建的單體建筑物震害評估模型,對2022年瀘定縣6.8級地震中的30棟建筑物的破壞情況進行評估,準確率可達86.67%,驗證了該模型具有較高的評估性能。

本文的方法可以實現對各類建筑物震害的快速、準確、智能化評估,相較于其他單體建筑物震害評估方法存在的參數過多和由于結構類型日趨復雜不利于大面積推廣的情況,本文定量且精細化的評估方法具有廣泛適用性,對于全面感知建筑物的震害風險水平具有一定意義。今后,隨著信息技術的發展,多樣化的建筑物數據和專家經驗知識的方便獲取還可以將數據驅動和知識驅動相融合,建立一套具有可解釋性的單體建筑物震害評估系統。

猜你喜歡
適應度單體遺傳算法
改進的自適應復制、交叉和突變遺傳算法
單體光電產品檢驗驗收方案問題探討
基于自適應遺傳算法的CSAMT一維反演
一種基于遺傳算法的聚類分析方法在DNA序列比較中的應用
基于遺傳算法和LS-SVM的財務危機預測
基于空調導風板成型工藝的Kriging模型適應度研究
基于改進的遺傳算法的模糊聚類算法
相變大單體MPEGMA的制備與性能
巨無霸式醫療單體的選擇
類姜黃素及其單體對β-內分泌酶活性的抑制作用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合