基于神經網絡算法的瀝青路面使用性能組合預測模型研究

2023-05-09 05:02曹雪娟盧治琳吳博文

重慶交通大學學報(自然科學版) 2023年3期

曹雪娟,盧治琳,吳博文,黃瑩,王民

(1. 重慶交通大學材料科學與工程學院,重慶 400074; 2. 重慶交通大學土木工程學院,重慶 400074; 3. 重慶市智翔鋪道技術工程有限公司,重慶 400067)

0 引言

目前,我國高速公路已經從最初的大規模建設階段逐步過渡到瀝青路面的養護和管理階段?？茖W合理地評價瀝青路面使用性能是制定養護計劃的基礎[1-3],因此,對瀝青路面使用性能進行準確預測至關重要。

國內外常用的瀝青路面使用性能預測模型主要分為概率型和確定型兩類。隨著計算機技術的發展,灰色預測模型、神經網絡預測模型和組合預測模型逐漸成為研究焦點[4-6]?；疑A測模型可以通過較少的建模數據得到較高的預測精度,但對隨機因素變化較大的瀝青路面預測效果較差[7-9]。神經網絡預測模型具有較強的信息處理和自學習能力,已成功應用于道路工程領域[10-11],徑向基(radial basis function,RBF)因其可以逼近任意的非線性函數被廣泛應用,但存在容易陷入局部最優值的問題[12-13]。目前研究多采用組合方法對目標進行預測,如主成分分析法(principal component analysis,PCA)和遺傳算法(genetic algorithm,GA)等,組合預測模型優于單一數學模型分析的定性研究,預測結果與實際狀況更加吻合[14-17]。

筆者提出了一種基于RBF的瀝青路面使用性能組合預測模型——PCA-GA-RBF。將模型訓練階段的計算誤差作為目標函數,引入PCA對路面使用性能影響因素進行降維處理;利用GA優化RBF結構,為瀝青路面使用性能預測提供了可靠的依據。研究表明:組合預測模型PCA-GA-RBF結構簡單、收斂速度快、預測精度高。

1 模型建立

首先定義一個非線性映射,將瀝青路面使用性能影響數據集(路齡、年均氣溫、年均降雨量等)映射到高維特征空間中,然后在此特征空間中對路面使用性能進行線性回歸,最終達到預測路面使用性能的目的。步驟如下:

1)收集原始數據并進行預處理;

2)運用主成分分析法對建模數據進行降維處理,將計算結果作為模型的輸入變量;

3)運用遺傳算法進行全局尋優計算,確定最優模型參數λ、α;

4)以路面行駛質量指數(IRQ)為模型輸出變量,建立神經網絡訓練模型;

5)對組合預測模型PCA-GA-RBF進行評估。

基于組合預測模型PCA-GA-RBF的瀝青路面使用性能算法流程如圖1。

圖1 組合預測模型PCA-GA-RBF算法流程

1.1 數據預處理

為了提高組合預測模型PCA-GA-RBF樣本數據的質量,減少異常數據和缺失數據對回歸性能的干擾,同時加快RBF模型的訓練速度,筆者對原始數據集做了如下預處理。

1.1.1 數據組成分析與優化

筆者收集整理了四川省2014—2019年23條高速公路的路面施工建造、環境氣候、交通量和路面養護等4大模塊數據,基于瀝青路面使用性能指標體系,挖掘出15個對瀝青路面破損狀況有較大影響的因素,詳見表1。將整理的瀝青路面使用性能數據信息導入SQL Server平臺,建立數據庫,“上面層材料類型”“中面層材料類型”等材料類型數據在軟件中量化為0、1、……形式。

表1 瀝青路面使用性能影響因素

1.1.2 剔除異常數據

根據JTG 5210—2018《公路技術狀況評定標準》,路面性能指標檢測得分在0～100之間,數值越大表明路面性能越好,超過上限100或低于下限0的數據可以明確劃分為異常值剔除。

1.1.3 缺失數據分析

缺失數據主要包括記錄的缺失和記錄中某個字段的缺失,筆者采用多重插補法(MI)對缺失數據進行處理,從包含缺失值的數據集中生成多組完整的數據集。

1.2 瀝青路面使用性能影響因素主成分分析

1.2.1 主成分分析法

在不減少原始數據所包含信息的前提下,為了能夠對原始數據進行降維處理,以使計算方差最優,筆者采用主成分分析法來選取影響瀝青路面使用性能的主成分因素。路齡、年均氣溫、年均降雨量等15個路面使用性能影響因素即為主成分分析中的主成分因素,基于Karhunen-Loeve變換原理求解特征方程,采用MATLAB提供的主成分分析函數princomp進行主成分分析,最終得到15個因素的主成分分析碎石圖(圖2),圖中僅展示了前10個主成分因素。

圖2 主成分分析

由圖2可見,F8主成分因素之后曲線斜率變化趨于平穩,并且F9與F10主成分因素之間的線段斜率近乎為0,說明F9、F10主成分因素所包含的原始數據信息非常少,分析時可不考慮。因此,筆者選取前8個主成分因素進行分析。

1.2.2 主成分分析法可靠性驗證

表2為主成分特征值的貢獻率比較結果。

表2 主成分特征值的貢獻率

由表2可知,8個主成分因素的綜合獻率超過85%,因此,選取這8個主成分因素進行分析較為合理,既保留了足夠多的原始信息,又實現了降維處理。

1.3 模型參數優化

RBF的計算效率與性能由參數λ、α決定,筆者將遺傳算法的計算結果作為初始權值進行模型優化。

1.3.1 染色體編碼

為了提高參數尋優精確性,采用二進制編碼方式,避免后續選擇、交叉和變異過程中的編碼與解碼,最終構建的RBF的拓撲解構為8-48-1,從而,確定RBF中間隱藏層的神經元個數為48。

1.3.2 適應度函數的選擇

適應度函數決定了模型的尋優方向。針對RBF參數優化問題,筆者選取均方差誤差函數M作為適應度函數,如式(1):

(1)

1.3.3 選擇、交叉和變異

采用輪盤賭的方式選擇新的種群,染色體被選擇的概率隨函數值的增大而增高,交叉和變異均依照系統設置概率進行操作。經過RBF的反復迭代,最終尋找出基于全體樣本的最優參數λ=0.58、α=0.997。遺傳算法優化過程的相關參數設置如表3。

表3 遺傳算法優化參數

1.4 PCA-GA-RBF組合預測模型建立

1.4.1 確定輸入變量和輸出變量

將主成分分析所得的8個主成分因素作為組合預測模型的輸入變量,瀝青路面行駛質量指數(IRQ)作為預測模型的輸出變量,共同構成數據總量為5 000組的建模數據集。

1.4.2 選定訓練樣本集與測試樣本集

為保證PCA-GA-RBF有較好的預測效果,避免計算過程出現過擬合的現象,將整體建模數據集劃分為訓練集與測試集2類,訓練集數據∶測試集數據為70∶30,即訓練集3 500組數據,測試集1 500組數據。

1.4.3 確定徑向基函數

采用高斯函數作為徑向基函數φ(x),以減少多變量輸入的復雜程度。

1.4.4 遺傳優化算法對回歸參數尋優

為了提高PCA-GA-RBF的預測精度,采用遺傳算法對高斯函數的中心向量Ci和寬度σi進行最優參數選擇。

由于RBF的輸出層根據需求為單個預測值,權值向量為w=[w1,w2,…]T,故預測值表達式為

yi=wφ(x)

(2)

利用R語言編程平臺,建立組合預測模型PCA-GA-RBF。

1.5 組合預測模型PCA-GA-RBF評估

1.5.1 PCA-GA-RBF與RBF對比

PCA-GA-RBF、RBF訓練模型的訓練過程如圖3。

圖3 PCA-GA-RBF、RBF訓練過程

由圖3可見,與RBF相比,PCA-GA-RBF訓練過程曲線斜率較大,迭代次數較少,計算速率更快。表明主成分分析可減少迭代次數,實現對數據的降維處理,簡化了模型結構。

1.5.2 PCA-GA-RBF預測精度檢驗

圖4為PCA-GA-RBF與RBF模型的預測結果。

圖4 PCA-GA-RBF、RBF預測結果

從圖4可以看出,圖4(b)中各個離散點的分布較密集,即離散程度較小,說明PCA-GA-RBF的預測精度較高,真實值與預測值之間的偏差波動較小,結果較可靠。

1.5.3 PCA-GA-RBF有效性與準確性檢驗

采用與構建組合預測模型PCA-GA-RBF相似的方法,構建PCA-GA-BP模型,其中數據預處理和瀝青路面使用性能影響因素也采用主成分分析法。經過試算驗證后,確定了PCA-GA-BP模型的最優網絡結構,即第一層神經元個數為6個、第二層神經元個數為5個的網絡結構。調用R語言平臺neuralnet函數構建BP、PCA-GA-BP訓練模型,兩者完成計算分別共進行了9 876、7 962次迭代。

表4為BP、PCA-GA-BP和RBF、PCA-GA-RBF預測模型擬合優度R2與均方根誤差S的計算結果?？梢?4個模型中,組合預測模型PCA-GA-RBF的R2最接近1,S最小,表明其預測結果有效且精度較高。

表4 4種神經網絡預測模型評估結果

2 實例驗證

2.1 數據

隨機選取了四川省2014—2019年10條高速公路共計2 280個IRQ記錄數據,將建模數據集按照訓練集數據∶測試集數據為70∶30進行劃分,即訓練集1 596組數據,測試集648組數據。

2.2 評價指標

根據JTG H 20—2007《公路技術狀況評定標準》,路面平整度評價標準見表5,路面行駛質量指數IRQ按式(3)計算:

(3)

式中:IIR為國際平整度;a0、a1為標定系數,a0=0.026,a1=0.650。

表5 路面平整度評價標準

2.3 瀝青路面使用性能預測

瀝青路面使用性能真實值與PCA-GA-RB預測值如圖5?？梢?預測曲線擬合優度R2=0.850,各離散點分布相對密集,表明組合預測模型的泛化能力較強,誤差波動性較小。

圖5 PCA-GA-RBF預測結果

2.4 評價結果對比

統計的2 280個IRQ記錄數據中,路面平整度實際等級為優、良、中的IRQ數據個數見表6。同時,采用組合預測模型PCA-GA-RBF預測瀝青路面的IRQ,再根據表5得出路面平整度預測等級,預測等級分別為為優、良、中的IRQ數據統計見表6。

表6 路面平整度實際等級和預測等級的IRQ數據統計

表6中,當路面平整度預測等級和實際等級均分別為優、良、中時,預測所用IRQ數據個數A*分別為525、27、17,路面平整度實際等級分別為優、良、中時,IRQ實際數據個數B*分別為632、32、20,則PCA-GA-RBF對路面平整度實際等級為優、良、中的預測準確率Q=A*/B*,從而可以得到,PCA-GA-RBF對路面平整度實際等級為優、良、中的預測準確率分別為83.1%、84.3%、85.0%,可見預測的準確率較高。

3 結論

引入PCA和GA以優化RBF模型,得到了瀝青路面使用性能組合預測模型PCA-GA-RBF;將PCA-GA-RBF應用于路面行駛質量的預測,并與實際路面行駛質量指標進行對比,驗證了PCA-GA-RBF的準確性。研究得到以下主要結論:

1)在BP、PCA-GA-BP及RBF、PCA-GA-RBF等4個模型中,PCA-GA-RBF的擬合優度R2最接近1,均方根誤差S最小,表明PCA-GA-RBF預測精度最高。

2)PCA-GA-RBF組合預測模型具有泛化力,可以選取單個評價指標進行評價。

基于神經網絡算法的瀝青路面使用性能 組合預測模型研究

0 引 言