?

基于機器學習的高強鋼焊接等截面箱型柱整體穩定性預測方法

2024-04-11 13:02張營營徐浩陳培見馬俊周祎
土木與環境工程學報 2024年1期
關鍵詞:高強機器承載力

張營營 ,徐浩 ,陳培見 ,馬俊 ,周祎

(1.中國礦業大學 a.力學與土木工程學院;b.江蘇省土木工程環境災變與結構可靠性重點實驗室,江蘇 徐州 221116;2.中國建筑第八工程局有限公司南方分公司,廣東 深圳 518035;3.西南交通大學 土木工程學院,成都 610031)

近年來,隨著建筑產業的高速發展,人們開始建造更多大跨度、超高層、大重量的建筑物。高強鋼材料具有更高的屈服強度和抗拉強度,能代替普通強度鋼作為大跨高層建筑的建筑材料來達到節約鋼材、減少造價、提高建筑效率等目的。隨著高強鋼產量需求的增加,高強鋼構件的受力性能需要進一步研究[1]。高強鋼軸心受壓構件受力性能中的穩定性一直是高強鋼應用和研究的重點。近年來,很多學者進行了高強鋼構件的整體穩定性研究。薛加燁[2]、邱林波等[3]對460、550、690 MPa 的箱型和H 型截面構件進行軸壓試驗,并驗證了高強鋼構件整體穩定承載力相對普通強度鋼的優越性;趙金友等[4]對跨中無側向支撐的3 個雙軸對稱和6 個單軸對稱焊接工字形截面簡支梁進行了整體彎扭屈曲試驗以研究Q460 高強鋼焊接工字形截面簡支梁的整體穩定性能并對《高強鋼結構設計標準》[5]中的簡支梁整體穩定系數計算公式進行修正。Meng 等[6]對結構鋼圓形空心截面(CHS)梁柱的整體屈曲性能展開試驗與數值模擬研究,并對歐洲規范中擬議的設計方法進行了可靠性評估。學者們在對高強鋼構件的整體穩定性進行研究時,大多采用有限元分析或現場試驗的研究方法,無論從時間成本還是從人力成本上考慮,這兩種方法都在實際研究中都有不便之處。因此,有必要探尋一種高效且準確的高強鋼構件整體穩定性能預測方法。

作為人工智能領域分支之一的機器學習方法憑借其優秀的預測精度、便捷的建模流程及可靠的理論支持,在土木領域迅速興起,并在建筑構件的性能預測問題上表現優異。Limbachiya 等[7]利用人工神經網絡(ANN)預測蜂窩梁的腹板屈曲后剪切強度,驗證了人工神經網絡模型準確性的同時說明了機器學習預測模型與現有的設計規范模型相比性能更優;Wakjira 等[8]對比不同的機器學習預測模型性能以提出織物增強水泥基加固梁的最佳預測模型,并對現有相關規范準則模型進行評價;Sarothi 等[9]首次編制了包含443 個實驗數據集組成數據庫,結合機器學習預測結構鋼雙剪螺栓連接的承載強度,并對其特征重要性進行分析,驗證了鋼材極限屈服強度比和螺栓排數對連接強度的影響顯著。機器學習能從海量數據中提取其中特征并尋求特征間的規律來達到數據預測的目的。當遇到的任務非常復雜或者需要通過計算機自動調整時,就需要借助強大的機器學習技術來完成[10]。但用于預測高強鋼構件整體穩定性的機器學習預測模型還尚待研究,且針對帶有初始缺陷的高強鋼構件的整體穩定性問題尚缺乏可靠規范進行指導。

筆者研究開發高強鋼焊接等截面箱型柱整體穩定性的機器學習預測模型,對不同強度的高強鋼焊接等截面箱型柱,使用纖維模型算法創建數據庫,參考現有鋼結構設計規范中對鋼結構整體穩定性的描述;將構件總寬度、翼緣厚度、計算長度、初始缺陷值、屈服強度、正則化長細比、寬厚比、彈性模量這8 個參數作為輸入參數;以構件極限承載力作為輸出參數,并對比分析3 種優化后的常用的機器學習模型的預測結果。通過評價指標評選出最優預測模型并驗證機器學習模型相較于現有規范中經驗模型的優越性。最后,通過解釋性算法對機器學習預測模型做出解釋,在驗證模型準確性的基礎上,根據解釋內容結合規范及已有研究驗證模型的合理性。

1 訓練數據庫的建立

1.1 纖維模型簡介

通常來說,對機器學習預測模型進行訓練時需要一個數據可靠且數據容量足夠大的數據庫,以便機器學習模型進行訓練、驗證和測試。常見的構建數據庫的手段包括有限元模擬、現場試驗以及搜集已發表論文中的成果數據。有限元的數值模擬方法雖然得到的數據足夠精確,但存在建模困難,耗時較長等問題?,F場試驗數據獲取不僅需要耗費大量人力和時間進行試驗,且得到的數據可能會因為試驗環境等問題產生噪聲數據。由于數據庫的數據需求量較大,搜集大量論文中的已有試驗成果數據同樣費時費力。

纖維模型的基本思想是將構件長度方向的截面劃分為網格狀的矩形纖維再通過數值積分的方法進行計算。該方法需要分別建立截面內力、外力和變形之間的關系。綜合考慮力的平衡與變形的協調來逐步得到荷載-位移曲線及其數值計算結果。該方法存在4 個基本假定:不考慮局部屈曲和橫向扭轉屈曲、不考慮剪力影響、平截面假定、構件屈曲后變形曲線為正弦曲線的半波[11]。高強鋼焊接箱型柱纖維模型的本構模型在相關文獻中有所體現[12]。由于殘余應力對軸向受壓結構的屈曲行為有較大影響,所以纖維模型計算時將考慮班慧勇等[13]提出的焊接箱形截面統一殘余應力模型。

根據班慧勇等對于高強鋼焊接截面殘余應力統一分布模型的研究可知,高強鋼焊接箱形截面的殘余應力分布存在如下特點:1)板件中心一定區域存在均勻分布的殘余壓應力,而焊縫附件區域存在殘余拉應力。2)焊縫附近區域的最大殘余拉應力遠小于鋼材屈服強度,靠近角部的殘余拉應力數值相對偏小。3)板件中部區域的殘余壓應力隨板件寬厚比增大而明顯減小。根據班慧勇等[13]的研究結果,鋼材焊接箱形截面的殘余應力分布可以簡化為如圖1 所示的階梯狀分布形式在纖維模型中使用。

圖1 統一殘余應力模型Fig.1 Unified residual stress model

考慮到纖維模型在運算速度、建模難度方面的顯著優勢,很多學者都將纖維模型方法應用于高強鋼構件的研究中[14-15]。此外,纖維模型在分析高強鋼整體穩定性能方面的適用性與優越性均已經得到了驗證,有學者通過對比實驗確定了纖維模型對高強鋼構件整體穩定性預測結果與實際試驗值的平均誤差僅為9.49%[16]。纖維模型方法不僅能夠快速構建容量足夠的數據庫,其中的數據質量也能得到保證。因此,采用纖維模型方法作為數據庫的主要構建方法,構建了548 組樣本數據供模型進行訓練。

1.2 參數選取說明

考慮到鋼構件的軸心受壓承載能力能直觀反映構件的整體穩定性,因此,選取構件在荷載作用下的極限承載力作為輸出參數。

根據現行《高強鋼結構設計標準》(JGJ/T 483—2020)[5]可知,鋼構件的極限承載力與構件總寬、總高、翼緣厚度、腹板厚度、計算長度、面積、慣性矩、回轉半徑、屈服強度、長細比、正則化長細比、寬厚比、彈性模量、初始缺陷等均有關聯,因此,將上述參數作為輸入參數構建纖維模型數據庫。在通過數據庫訓練數據之前,采用Pearson 相關系數法對輸入參數的相關性進行分析,從而篩選掉相關性過大的參數(Pearson 系數大于0.8)。上述涉及參數的相關性分析結果如圖2 所示。

圖2 數據變量相關性統計Fig.2 Correlation statistics of data variables

方格顏色越深,數字越接近1,代表數據間的相關性越大。由于是對高強鋼焊接等截面箱型柱進行研究,其對稱的特征也極大程度體現在部分幾何參數和材性參數中,所以相關性分析剔除掉了對稱數據中的某一方,例如,構件總高和總寬相等,兩者只選構件總寬數據作為輸入參數即可。依據相關性分析結果,最終選定構件總寬、腹板厚度、計算長度、初始缺陷值、屈服強度、正則化長細比、寬厚比、彈性模量這8 個參數作為輸入參數。

此外,在構建數據庫時,還要注意保證訓練樣本參數數據在一定范圍內的離散性,只有訓練參數足夠離散,才能使得機器學習模型的預測結果是考慮到所有的輸入參數得到的。數據集中特征參數的基本信息如表1 所示。

2 基于機器學習和規范準則的模型

2.1 機器學習模型

機器學習(ML)模型是從一些不基于物理定律的數學方程發展而來的。機器學習模型訓練、驗證所依賴的數據庫均為上文提到的纖維模型數據庫。借助MATLAB 軟件,使用隨機森林回歸(RF)、高斯過程回歸(GPR)和人工神經網絡(ANN)這3 種ML 模型進行訓練,其中包括兩個單一模型和一個集成模型。在之前的研究中,大部分研究者只考慮了一種機器學習算法對于構件性能預測的優越性,主要是人工神經網絡[16-18]。然而,所有的ML 模型都有其優點和缺點,面對不同輸入參數及不同數據特征的構件性能預測問題,最適用的ML 模型并不唯一。因此,有必要對眾多的ML 模型進行擇優選取。選擇最合適的ML 模型的方法就是基于評價指標的試錯過程。選取的3 種機器學習方法在常規機器學習算法中屬較新研究成果,且在其他類型構件性能的預測中也有良好表現。其他諸如SVM、線性回歸等簡單機器學習方法,作者也進行過預訓練,但效果遠不如所述3 種方法,因此,僅對上述3 種機器學習方法進行分析研究。

模型優化方面,采用k-折疊交叉驗證方法以避免訓練過程中出現過度擬合的情況。k-折疊交叉驗證就是將數據集隨機平均分為k份。輪流取其中1份作為測試集,其余數據作為訓練集進行試驗。k值的選擇通常是5 或10[19-20],當數據庫內樣本足夠多時,k取5 即可。超參數調整是模型優化的一項重要工作,其目的是全面搜尋使得模型預測誤差最低的超參數或超參數組合。在一些優秀的超參數算法提出之前,超參數只能通過人工調整、不斷試錯的方法進行調優,但此種方法不僅效率低下,得到的超參數組合也不一定能使得模型性能得到顯著提升。目前常見的實現自動化超參數調優的算法有網格搜索、隨機搜索和貝葉斯優化。相較其他兩種算法,貝葉斯優化算法的迭代次數較少,算法效率也相對較高,因此,使用貝葉斯優化方法進行超參數調優。貝葉斯超參數調優算法流程如圖3 所示。圖4 展示了模型的均方誤差隨著貝葉斯優化迭代次數的增加逐步降低,同時模型訓練性能逐步提高的趨勢。在第10 次迭代之后,模型性能趨于穩定。

圖3 貝葉斯優化超參數原理Fig.3 Bayesian principle of optimizing hyperparameters

圖4 高斯過程回歸模型超參數調整過程Fig.4 Super parameter adjustment process of gaussian regression model

2.1.1 高斯過程回歸

高斯過程回歸(GPR)模型預測步驟如圖5 所示。高斯過程屬于一種特殊的二階矩隨機過程。通常認為,自變量和因變量在有限維度下的概率分布都滿足一維或多維聯合高斯正態分布。多維高斯聯合分布由它的均值向量E(x)和協方差矩陣cov(x)所決定[21]。GP 模型是服從聯合高斯分布的有限個隨機變量的集合,確定均值函數和協方差矩陣就能完整地確定一個高斯過程的性質。協方差函數作為衡量數據點相互影響的標準,是統計分析中的重要指標之一,該函數表示兩個變量之間的協調變化率。常用協方差函數包括平方指數、Matern、各項同性指數等。該尺度的存在決定了具有一定差異的輸入特征是否被視為近似特征。此類超參數同樣被貝葉斯優化器所考慮,并進行優化組合。

圖5 高斯過程回歸流程圖Fig.5 Gaussian process regression flow chart

2.1.2 人工神經網絡

人工神經網絡(ANN)是一種模擬生物神經系統的深度學習算法。算法的每個處理節點被稱為神經元或節點。單個節點可以接收多個信息的輸入,但只返回一個輸出信息。從輸入到輸出的過程需要引入激活函數來提高神經網絡的非線性表達能力。在神經網絡中,每個神經元都被賦予一個權重值,權重值的變化同樣影響著神經網絡的性能,通過迭代訓練樣本可以不斷調整神經元的權重值,當預測值與實際值之間的誤差達到最小值,則迭代停止。

輸入層和輸出層之間的層稱為隱藏層,圖6 即為單層隱藏層神經網絡示意圖。除此之外,針對不同的數據特征,神經網絡中隱藏層與神經元的最優設計數并不一樣。這些難以確定的超參數除了采用排列組合的方法試錯外,還可以通過超參數調優方法快速找到相對最優解。

圖6 單層隱藏層神經網絡示意圖Fig.6 Schematic diagram of single hidden layer neural network

2.1.3 隨機森林

隨機森林是基于決策樹模型的一種集成算法,決策樹是一種非參數規則的算法,將一組數據點的特征空間進行劃分,使得每一小塊空間區域都具有相似的響應值。決策樹中的內部節點可以針對輸入數據的某一特征進行判斷,當局部節點無法再根據特征進行分類時,則生成葉節點代表測試后的輸出。位于決策樹最高處的根節點則代表了數據中最重要的特征。簡單決策樹模型示意圖如圖7所示。

圖7 簡單決策樹模型示意圖Fig.7 Schematic diagram of simple decision tree model

單一的決策樹模型通常會存在過度擬合的情況,且具有較高的方差。為了緩解這個問題,以決策樹的分類回歸思想為基礎,衍生出很多集成算法。集成學習方法將多個訓練好的基本學習器通過一定的策略進行結合,最終形成性能可靠的強學習器來進行預測,集成模型框架如圖8 所示。

隨機森林模型就是以決策樹為基本學習器的一個集成學習模型。如圖9 所示,它包含多個由Bagging 集成學習技術訓練得到的決策樹。最終的預測結果由眾多具有較大差異的決策樹的輸出結果共同決定。隨機森林中的學習器個數與模型的學習效率和學習效果直接相關,而學習器數量變化對兩者的影響呈現相反的表現趨勢,此外,葉子節點上應有的最少樣例數會決定模型是否更容易遭受噪聲數據的影響。諸如此類難以確定又對模型質量有著重要影響的超參數將由貝葉斯優化自動確定,以使得模型性能達到其能力范圍內的較高水準。

圖9 隨機森林模型示意圖Fig.9 Schematic diagram of random forest model

2.2 中國規范

在中國《高強鋼結構設計標準》(JGJ/T 483—2020)[5]中,軸心受壓構件的極限承載力可由式(1)計算。

式中:φ為穩定系數。

穩定系數φ可根據截面類型、長細比和鋼材屈服強度查詢規范中附錄表獲得。在最新的高強鋼設計規范中,箱型截面的高強鋼構件在板厚小于40 mm時,統一按b 類截面設計;當板厚不小于40 mm 時,若板件寬厚比大于20,按b 類截面設計,否則按c 類截面設計。截面分類方式的變化也是高強鋼設計規范與普通鋼設計規范中的主要區別。

3 模型性能評價指標

為了研究開發的ML 模型的預測能力,將使用常見的不同性能指標評估模型的性能,包括決定系數R2、均方誤差MSE、均方根誤差RMSE 和平均絕對誤差MAE。

1)決定系數

決定系數又被稱為R2分數。記Sres=∑(Yi-)2,表示真實值與預測值之差的平方和即殘差平方和。Stot=∑(Yi-)2表示真實值與其平均值之差的平方和即總離差平方和。

決定系數所展示的是模型的擬合程度。模型擬合程度越高,輸入參數對輸出參數的解釋程度越高,觀察點在回歸直線附近就越密集。決定系數的取值范圍在0~1,越接近于1,說明模型的預測效果越好;越接近0,說明模型的預測效果越差;若決定系數出現負值,說明該模型的效果非常差。

2)均方誤差與均方根誤差

均方誤差(MSE)又被稱為L2 范數損失。是用來計算每一個樣本的預測值與真實值之差的平方,然后求和再取平均值。其值越小說明擬合效果越好。均方根誤差就是在均方誤差的基礎上再開方。

3)平均絕對誤差

平均絕對誤差(MAE)又被稱為L1 范數損失,用于計算每一個樣本的預測值和真實值的差的絕對值,然后求和再取平均值。用于評估預測結果和真實數據集的接近程度,其值越小,則說明預測模型預測性能越好。

4 模型驗證與分析

4.1 模型預測結果的對比

選取4 個評價指標,評估中國現有規范中的經驗模型和3 種常見機器學習模型對高強鋼焊接等截面箱型柱整體穩定性的預測性能,并將相關數據進行匯總。然而,模型在訓練時的表現并不能代表其在模型測試時的表現,需要加入模型在測試集上的表現來對模型進行全面的評判。因此,采集了約70組中國學者對高強鋼焊接截面柱整體穩定性進行研究的真實試驗數據[2,22-24],整理了其中25 組相關數據,見表2,并增加了模型對新的測試集數據的預測情況來進一步驗證模型性能與數據集質量的優劣,這些用于測試的數據需要保證未在模型的訓練過程中出現。

表2 高強鋼焊接箱形截面柱軸心受壓承載力試驗數據Table 2 Test data of axial compression bearing capacity of high strength steel welded box section columns

表3 同時記錄了模型訓練時的評價指標情況以及機器學習模型或現有規范準則模型在測試集數據上的表現?!陡邚婁摻Y構設計規范》(JGJ/T 483—2020)[5]所用模型的決定系數為0.83,RMSE 值達到了1 176.6 kN,MAE 也高達861.57 kN。模型預測精度在±861.6 kN,超出了測試集數據中平均極限承載力(3 149.4 kN)的27.3%。隨著鋼材免屈服強度的增大,設計規范模型逐漸表現出不適用性,且預測結果偏大。通過查閱相關文獻,可以對此現象做出解釋,部分學者在對高強鋼焊接截面柱整體穩定性能的研究中得出以下結論:采用中國規范設計時,對于寬厚比小于20 的Q690 箱形柱,可選取a 類柱子曲線[23];Q890 和Q960 鋼材焊接箱形軸壓構件板厚小于40 mm 時應按a 類曲線進行設計,區別于規范中建議使用b 類曲線計算[24]。以上結論說明中國現有規范對于高強鋼軸心軸壓構件的截面分類并不完全準確。且規范公式的提出考慮了設計師們進行設計時的便捷性,通常是有過簡化處理的。上述原因導致現行規范在預測時的缺陷。

表3 預測模型性能比對Table 5 Performance comparison of prediction models

反觀機器學習預測模型的表現,機器學習預測模型中的高斯過程回歸模型整體表現明顯要優于現有規范準則模型。其在訓練過程中的RMSE 值為41.21 kN,MAE 值為23.59 kN,決定系數為1.0。而在對測試集數據預測過程中,其RMSE 值為265.13 kN,MAE 值為163.17 kN,決定系數高達0.99,平均誤差率僅有5.6%。

由表3 可見,機器學習模型對高強鋼焊接等截面箱型柱的整體穩定性的預測效果相較現有規范有明顯的提升。但隨機森林模型在此類問題的預測上表現很差,在訓練過程中的決定系數為0.93,在測試集數據預測中決定系數僅有0.75。以決策樹為基本學習器的集成算法預測效果較差的原因可能是決策樹模型的決策邊界可能并不準確且決策樹算法對個別數據比較敏感,進而導致其集成模型的效果在回歸預測上的表現很差。

對于機器學習預測模型在測試集上的表現相對模型訓練時普遍變差的問題,機器學習領域專家認為這是由于機器學習模型泛化能力不佳導致的,可通過調整超參數、使用K 折交叉驗證、歸一化數據等手段降低其影響,筆者研究中也有所涉及。其他的數據集本身的原因包括:1)纖維模型構建的數據庫樣本與實際工程情況本就有著10%左右的誤差;2)在數據庫的構建過程中,初始缺陷考慮得并不全面;3)實際試驗數據的部分參數超出了數據庫樣本參數大小范圍約10%。能否對超出訓練數據范圍的數據進行準確預測也是模型泛化能力強弱的體現。以上原因導致了機器學習模型在預測測試集數據時的性能下降。在后續研究中,將進一步關注數據集和模型的質量來提高機器模型在測試集上進行預測時的表現。盡管如此,以高斯過程回歸模型為代表的眾多機器學習模型仍然展現出了優于現有規范準則模型及其他種類預測模型的性能。

圖10 為數據集在3 個機器學習模型的中的真實值與預測值響應圖,其中,藍色的點表示訓練集中已知的輸出參數,即軸心受壓極限承載力真實值。而黃色的點表示模型經過訓練后根據輸入參數得出的預測響應值,即軸心受壓極限承載力預測值,當兩點完全重合時,表示機器學習模型在該點處的預測精度很高,重合的點越多,機器學習模型性能越好。另一種能直觀展現出機器學習模型預測效果的圖是圖11 所展示的殘差圖,當模型的性能足夠優秀時其預測響應與真實值相差無幾,在殘差圖中表現為所有預測點都接近于零線,從任意點到零線的垂直距離即為該點的殘差。

圖10 訓練過程機器學習模型預測響應圖Fig.10 Prediction response diagram of machine learning model in the training process

圖11 訓練過程機器學習模型殘差圖Fig.11 Residual diagram of machine learning model during training

綜合所有ML 模型在模型性能可視化圖中的表現可以看出,高斯過程回歸模型和神經網絡模型表現是這3 種模型中的較優模型。在預測響應圖中,兩種模型的預測點與真實點重合度很高;在殘差圖中,兩種模型中各樣本點的殘差絕大多數都在100 kN以內,不超過訓練樣本平均極限承載力(1 780.75 kN)的6%。說明高斯過程回歸模型和神經網絡模型在訓練過程中的優異性能。但結合表3 可以看出,在預測測試集中新的實際工程數據時,高斯過程回歸模型的穩定性要略高于神經網絡模型。因此,在高強鋼焊接箱形截面柱整體穩定性的研究中,高斯過程回歸會是常見機器學習模型中的最優模型,也是優于現有規范經驗模型的選擇。值得一提的是,高斯過程回歸模型預測25 組真實實驗數據時,僅耗費0.006 s,這樣的計算效率顯然要優于更加精細的有限元模擬方法,盡管有限元建模能夠使模型的計算結果達到很高的精度,但其繁瑣的建模過程和較長的計算時間使得效率更高的機器學習模型成為一種新的選擇。

4.2 高斯過程回歸模型的可解釋性研究

模型可解釋性是指對模型工作機制以及對模型預測結果的理解,機器學習模型的可解釋性越高,模型的可信任度就越高。諸如支持向量回歸等機器學習模型被稱為“黑盒”模型,從這些ML 模型中探求輸入參數和輸出參數之的力學關系是很困難的。近年來,陸續有學者研究并提出了幾種方法來提高ML 模型的可解釋性。部分依賴圖(PDP)和個體條件期望圖(ICE)就是用于對ML 模型進行解釋的常用可視化工具。

部分依賴圖反映了在一個訓練好的ML 模型中輸入特征參數與輸出響應參數之間的關系[25],通常包括線性關系、單調關系或者其他更復雜的關系。某個選定輸入特征參數的部分依賴性定義為忽略其他輸入變量的影響而獲得的平均預測值,或者說部分相關性作為所選輸入特征參數的函數,顯示了所選輸入特征參數對數據集的平均影響。各輸入特征的PDP 圖如圖12 所示。

圖12 8 種指 標的PDP 圖Fig.12 PDP plots for eight indicators.

個體條件期望圖作為部分依賴圖的一種變體,代表了每個樣本的輸入特征參數和輸出響應值之間的關系。部分相關性顯示了輸入和輸出之間的平均關系,但ICE 圖將平均關系信息進行了分解,并顯示了每次觀測時個體特征的依賴性[26]。

選擇在上述研究中表現最好的高斯過程回歸模型,計算并繪制該模型的PDP 圖,以確定8 個輸入特征參數與高強鋼焊接等截面箱型柱極限承載力之間的關系。從圖12 中的PDP 圖可以看出,構件的總高(總寬)、翼緣(腹板)厚度、材料屈服強度、材料彈性模量與高強鋼焊接等截面箱型柱的軸壓極限承載力在一定范圍內呈正相關。構件計算長度、初始缺陷值、正則化長細比、寬厚比與構件軸壓極限承載力在一定范圍內呈負相關。在對《高強鋼結構設計規范》(JGJ/T 483—2020)[5]中關于鋼結構軸壓構件整體穩定性的相關規范公式進行分析后發現,機器學習模型做出的有關輸入參數對輸出參數影響趨勢的解釋均是合理的,這從側面體現了機器學習模型內部運作的合理性。但大部分趨勢都展現出線性或近線性,這與實際情況有所差距,這主要是由于訓練樣本數據中的輸入參數范圍有限,如果將數據集參數范圍擴大,將會得到更加豐富且貼合實際的部分依賴圖。在正則化長細比部分依賴圖中可以看到更為明顯的趨勢特征,當λn小于1時,構件的極限承載力以較大的梯度下降,當λn到達1 時,構件承載力下降速度大大減緩而進入平臺期,當λn大于1.5 后,構件承載力又恢復到λn數值較小時的下降梯度。

4.3 神經網絡模型的特征重要性研究

使用Shapley Value 方法制作特征參數重要性可視化圖像,一個特征的Shapley Value 是該特征在所有的特征序列中的平均邊際貢獻。使用效果較好的神經網絡模型計算8 個輸入特征參數的特征重要性,其可視化的表現見圖13。然而,神經網絡模型的預測結果會受其超參數的影響,因此,獲得的特征重要性排序并非絕對,只作為建議來指導進行工程實際。

圖13 特征參數重要性Fig.13 Importance of characteristic parameters

特征重要性分析表明,相對于其他輸入參數,構件的正則化長細比、總高(總寬)、腹板厚度(翼緣厚度)、屈服強度是影響高強鋼焊接等截面箱型柱軸心受壓承載力的主要參數。由中國現有規范中對高強鋼構件軸心受壓的整體穩定性描述公式可知,高強鋼構件整體穩定性與構件截面面積和材料屈服強度線性相關,而特征重要性分析中得到的重要參數恰好就包含了屈服強度和面積(面積可由構件總高與腹板厚度求得),這從雙向驗證了規范與機器學習模型都具備較高的合理性。相比之下,構件的初始缺陷和彈性模量對其極限承載力影響較小,這可能是由于數據庫中初始缺陷取值均僅為構件計算長度的千分之一以下,取值偏小導致初始缺陷對構件極限承載力的影響不大。

5 結論

開發了兩個單一模型和一個集成模型,用于預測高強鋼焊接等截面箱型柱的軸心受壓極限承載力以驗證其整體穩定性。將3 種機器學習模型的預測性能和現有規范中的經驗模型進行比較,并對最優機器學習模型進行可解釋性研究。研究結果表明,機器學習技術在預測高強鋼構件整體穩定性方面的可行性和高精度,并為將數據驅動模型納入設計規范的修訂和完善提供了重要參考。得到以下主要結論:

1)與其他ML 模型和基于物理的方程相比,高斯過程回歸模型預測得到的結果最為準確,該模型對測試集數據預測的RMSE 值為265.13 kN,MAE值為163.17 kN,決定系數高達0.99。與25 組已有試驗結果相比,平均絕對誤差僅有5.6%。此外,隨著未來數據庫數據愈加豐富,參數數值包含范圍愈加廣泛,高斯過程回歸模型的性能可以進一步提高。這項工作的結果證明了機器學習技術在預測高強鋼構件整體穩定性方面的可行性和高精度,并為將數據驅動模型納入下一代國際設計規范做出了引導。

2)根據模型的可解釋性研究發現,作為最優機器學習預測模型的高斯過程回歸模型,其中,輸入參數對預測結果的影響趨勢與現有規范準則中的經驗公式一致,在證明了機器學習模型準確性的基礎上又驗證了模型的合理性。

3)根據輸入特征參數重要性排序可知,正則化長細比、材料屈服強度以及和構件截面面積相關的幾何特征是對高強鋼軸心受壓承載力影響較大的參數。這與中國現有規范準則中所述接近,而在機器學習模型的解釋中正則化長細比作為對輸出結果影響最大的重要參數參與預測運算。

4)機器學習模型應用于高強鋼構件力學性能預測的工作中具有能夠快速甄別關鍵參數與力學性能之間的關系優勢,但現階段其計算精度相較于精細的有限元分析尚有差距,且計算結果的合理性依賴于模型的選取和大量數據的收集,因此,現階段成果僅作為高強鋼構件力學性能分析的參考與借鑒。

猜你喜歡
高強機器承載力
高強
機器狗
機器狗
未來機器城
看誰法力更高強
CFRP-PCP板加固混凝土梁的抗彎承載力研究
耐火鋼圓鋼管混凝土柱耐火極限和承載力
無敵機器蛛
鋼纖維高強混凝土墻基于CONWEP的爆炸響應
潛艇極限承載力計算與分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合