?

基于LSTM-SAFCN 模型的生物質鍋爐NOx 排放濃度預測①

2024-02-13 12:26何德峰劉明裕孫芷菲王秀麗李廉明
高技術通訊 2024年1期
關鍵詞:生物質卷積噪聲

何德峰 劉明裕 孫芷菲 王秀麗③ 李廉明

(?浙江工業大學信息工程學院 杭州310023)

(??嘉興新嘉愛斯熱電有限公司 嘉興314016)

構建清潔低碳、安全高效的能源體系是我國實現碳中和目標的關鍵舉措。與化石能源相比,使用生物質燃燒發電是一種更經濟環保的選擇[1-2]。生物質能的燃燒過程是一個碳閉環過程,生物質通過光合作用吸收的CO2能夠中和生物質燃燒產生的CO2,從而很好地實現碳中和。然而,生物質燃燒過程產生的煙氣仍包含大量其他污染物,其中氮氧化物(NOx)是占比最大的一種污染物[3-4],過量的NOx排放會導致酸雨、光化學煙霧、臭氧層破壞和溫室效應等嚴重的環境問題[5-8]。因此,準確預測NOx 排放濃度是實現生物質鍋爐燃燒過程有效監測的關鍵步驟,同時也為燃燒過程優化、節能減排提供重要的科學參考依據。

由于生物質鍋爐運行機理復雜,生物質燃燒過程具有高度非線性、強耦合的特點,導致NOx 排放濃度受多種復雜因素影響。生物質燃燒機理分析方法因為具有強大的可解釋性,常用來預測NOx 排放濃度,但該方法建模難度大、計算復雜度高,用于預測NOx 排放濃度成本較高[9-12]。近年來,數據驅動的方法在預測領域逐漸流行,特別是,人工神經網絡(artificial neural network,ANN)作為一種通用函數逼近器已率先用來預測NOx 排放濃度[13-14]。例如,周昊等人[15]利用ANN 預測大容量煤粉鍋爐中的NOx 排放濃度;谷景麗等人[16]應用ANN 模型實現了NOx 濃度等參數的軟測量。然而,ANN 只能建立從輸入到輸出的靜態映射,不能很好地提取時間序列數據的動態特征。

受不同工況影響,生物質鍋爐燃燒過程具有較強的動態特性,循環神經網絡(recurrent neural network,RNN)在ANN 的基礎上為處理時間序列數據而提出。RNN 以時間序列進行順序輸入,通過隱藏層實現遞歸輸出。然而,受梯度消失和梯度爆炸問題的影響,RNN 并不能解決長距離依賴問題。于是長短期記憶(long short-term memory,LSTM)網絡應運而生,并廣泛應用于預測領域[17]。例如,Yang 等人[18]利用LSTM 網絡建立燃煤鍋爐的預測模型,用來預測NOx 排放濃度,實驗結果充分表明LSTM 網絡優于ANN。Xie 等人[19]基于LSTM 網絡動態模擬并預測出選擇性催化還原系統出口的NOx 排放濃度。

卷積神經網絡(convolutional neural networks,CNN)具有強大的局部特征提取能力,能夠廣泛用于序列數據處理。Facebook AI 團隊充分利用CNN 的并行優勢實現了序列到序列的任務[20],然而,CNN網絡結構的全連接層參數數量龐大容易導致計算效率低下。為了解決上述問題,Long 等人[21]將全連接層替換成卷積層,提出全卷積神經網絡(fully convolutional networks,FCN)模型,該網絡與其他類型的神經網絡廣泛結合可實現精良的實際應用效果。Karim 等人[22]將LSTM 網絡與FCN 結合實現了多元時間序列分類。胡丹等人[23]進一步利用LSTMFCN 模型實現了船舶軌跡預測,得到了良好的預測結果。

然而,基于LSTM-FCN 構建的預測模型往往存在著因計算效率和信息利用率不高引起的預測精度有限的問題。為了進一步解決這一問題,本文在LSTM-FCN 框架中引入自注意力機制(self-attention,SA),提出基于長短期記憶-自注意力機制全卷積神經網絡(long short-term memory-self attention fully convolutional network,LSTM-SAFCN) 的預測模型。自注意力機制可以有效減少對外部信息的依賴,更好地捕捉數據或特征之間的內部相關性,使得數據中的重要特征得以突出顯現,從根本上起到提高預測精度的作用[24]。

基于上述問題,本研究首先根據完全自適應噪聲集合經驗模態分解[25](complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)方法對時間序列數據進行預處理,以消除數據中的噪聲對預測精度的影響;然后,融合SA 與LSTM-FCN 方法,解決計算效率和信息利用率不高導致的預測精度低下問題;接著,將預處理后的數據用于訓練LSTM-SAFCN 模型;最后,將訓練好的模型應用于生物質流化床鍋爐中來提高NOx 排放濃度的預測準確度。SA 引入FCN 而非LSTM 中是因為SA 是并行結構,LSTM 是串行結構,二者難以結合。將SA 與同是并行結構的FCN 結合,可彌補FCN 無法反映時間序列的時變特點、缺乏全局視野的缺陷。

1 生物質鍋爐燃燒過程

本文研究對象為生物質循環流化床鍋爐,其燃燒產生能量用于熱電聯產流程供電與供暖。如圖1所示,生物質熱電聯產過程包括生物質儲運、生物質燃燒、汽水循環、蒸汽發電、供汽供熱、煙氣處理和煙氣排放等工藝環節。生物質燃料通常由專門的運輸車運輸至爐前倉進行儲存,需使用時通過傳送帶運送至鍋爐內進行燃燒,燃燒所需的一次風和二次風分別從爐膛的底部和側墻送入,爐膛四周布置有水冷壁,用于吸收燃燒所產生的部分熱量。由氣流帶出爐膛的大部分固體物料在分離器內被分離和收集,再次通過返料裝置送回爐膛,進行多次循環燃燒。燃燒過程中產生的大量高溫煙氣流經由過熱器、再熱器、省煤器等處理后,大部分用于推動汽輪發電機供電,以及起到加熱冷凝塔中冷水的作用,少部分用于供汽供暖。燃燒產生的高溫煙氣則進入除塵器進行除塵,最后由引風機排至煙囪進入大氣。

圖1 生物質循環流化床熱電聯產流程圖

圖2 LSTM-SAFCN 模型流程圖

2 NOx 排放濃度預測

基于LSTM-SAFCN 方法實現NOx 濃度預測,其過程包括以下步驟。

(1)數據集獲取:在循環流化床鍋爐中進行燃燒實驗,通過傳感器獲取數據集,并將數據集劃分為訓練集和測試集。

(2)數據預處理:對傳感器獲得的數據集進行預處理,利用CEEMDAN 消除原始數據中的噪聲干擾,并對數據進行歸一化。

(3)LSTM-SAFCN 模型訓練:融合SA 與LSTMSAFCN 建立NOx 排放濃度預測模型,利用訓練集對其進行訓練。

(4)NOx 排放濃度預測:利用訓練好的LSTMSAFCN 模型,基于測試集預測NOx 排放濃度。

2.1 數據預處理

鍋爐實際運行過程復雜,傳感器采集的數據蘊含噪聲數據,傳統的數據預處理方法本質上從數據擬合的角度抑制噪聲,實際上沒有去除噪聲,這也直接影響了預測結果的精度。本文利用改進的經驗模態分解方法——CEEMDAN 去除數據中的噪聲,同時解決傳統經驗模態分解方法的模態混疊現象,保證了數據的平穩性和有效性,為精準預測NOx 排放濃度提供有力的數據保障。

CEEMDAN 在經驗模態分解法的基礎上從以下2 個方面進行改進:(1)摒棄將高斯白噪聲信號直接添加在原始信號中的方案;(2)CEEMDAN 在得到的第一階IMF 分量后進行總體平均計算,得到第一階IMF 分量。CEEMDAN 算法的主要步驟如下。

(1)在初始時間序列信號x(t) 中添加k次均值為0 的高斯白噪聲,共構造k個添加了高斯白噪聲的時間序列,具體如式(1)所示。

其中,xi(t) 表示第i次加入高斯白噪聲的時間序列;ε表示高斯白噪聲權值系數;δi(t) 為第i次所添加的高斯白噪聲。

(2)對初始時間序列x(t) 進行經驗模態分解(empirical mode decomposition,EMD)分解,得到k個模態分量(intrinsic mode functions,IMF),取其均值作為CEEMDAN 的第1 個IMF,具體如式(2)所示

其中,表示第i個時間序列進行EMD 分解得到的第1 個IMF;IMF1表示CEEMDAN 分解得到的第1 個IMF。

(3)初始時間序列x(t) 減去CEEMDAN 分解得到的第1 個IMF,定義為時間序列余量,計算公式如式(3)所示:

其中,r1(t) 表示原始信號相對第1 個IMF 的余量。

(4)重復上述步驟,得到其他IMF 分量,具體公式如式(4)、(5)所示:

式中,Ej(·) 表示利用EMD 分解得到的第j個IMF分量;rj-1表示第(j-1)個余量,由式(5)計算得到;εj-1表示第(j -1) 次的高斯白噪聲對應的權值系數。

(5)當滿足EMD 停止條件,即第n次分解的余量信號rn(t) 為單調信號,則迭代停止,CEEMDAN算法結束。

鍋爐燃燒過程的各種運行參數擁有不同屬性的數據取值范圍,為了消除量綱對NOx 排放濃度的影響,對數據進行歸一化處理。本文使用Z-score 標準化對數據進行歸一化,計算公式如下:

其中,xi表示變量的原始測量值,n表示數據采集次數,ˉx表示n次采樣均值,s是對應的標準差,yi表示歸一化后的變量值。歸一化后的數據yi一般服從均值為0、標準差為1 的正態分布。

2.2 LSTM-SAFCN 預測模型

LSTM-FCN 方法在處理時間序列預測問題時,由于不能兼顧時間序列數據的局部細節與長期趨勢特征,預測精度有限。因此,本文將LSTM-FCN 與SA 結合提出改進的LSTM-SAFCN 方法,以提高NOx排放濃度預測精度。改進的LSTM-SAFCN 模型預測結構如圖3 所示,主要包括LSTM 模塊、Self-Attention 模塊和FCN 模塊。LSTM 模塊解決了傳統循環網絡無法處理較長序列數據信息的弊病;FCN 模塊可以進一步減少參數數量,且更好地實現對局部信息的提取;Self-Attention 模塊對數據進行全局關聯和時間關聯,使得數據中的重要特征得以突出顯現,從根本上起到提高預測精度的作用。

圖3 LSTM-SAFCN 模型結構圖

利用LSTM-SAFCN 預測NOx 排放濃度時,首先將預處理后的數據同時輸入LSTM 模塊和SAFCN模塊分別提取特征,然后,融合2 個特征輸入線性層進行NOx 排放濃度預測。

LSTM 是一種門控神經網絡,利用門控機制控制數據流以提取特征,如圖4 所示。同時,LSTM 引入了一條貫通首尾的通路保存長期信息,即單元狀態,它將梯度直接注入底層以實現長距離依賴。

圖4 LSTM 網絡結構

FCN 模塊由3 個時序卷積模塊構成,每個模塊由1 個一維卷積層、1 個批量歸一化(batch normalization,BN)層、1 個ReLU 激活函數以及1 個Dropout層組成。

一維卷積層的卷積核只沿著一個維度進行。一維卷積主要起著調整通道數的作用,在保證特征圖不變的同時能夠表征系統非線性。并且,一維卷積可實現跨通道通信,在升、降維時實現通道間信息交互。

BN 層主要用在批處理方法中,每批數據在卷積操作之后進行標準化處理。BN 操作將每層數據的分布進行統一,加快網絡訓練和收斂速度。同時,BN 層歸一化后,保證激活層輸出不會過大,使得梯度不會過小,避免梯度消失。最后,由于BN 層將各小批量的樣本進行關聯,減小了單一樣本對訓練的影響,避免了過擬合。

因為Dropout 層中所有神經元的激活值都有一定概率輸出為0,網絡由確定的狀態變為不確定的狀態,可以有效避免過擬合情況。

上述的模塊只是一種局部的編碼方式,構建了輸入數據的局部依賴關系,因此本文加入Self-Attention 模塊,充分關注數據中的重要特征。SA 模塊以時間維度進行數據關聯,可以提取時間序列的時間相關性,利于后續CNN 的局部特征提取。

3 實驗驗證

實驗數據來源于2021 年8 月9 日生物質流化床鍋爐燃燒實驗數據,采樣周期為5 s。根據熱效率的不同,采集2 組不同工況的數據,其中工況1 熱效率平均值為97.77%,工況2 熱效率平均值為95.52%。本實驗利用改進的LSTM-SAFCN 方法對NOx 排放濃度進行預測,并與傳統的預測模型在不同工況下進行對比實驗。

本文模型中FCN 模塊由3 個時序卷積模塊構成。根據輸入數據的特征數量,設置第1 個卷積層的輸入通道數為23,輸出通道數為32,卷積核的大小為3,填充為2;第2 個卷積層的輸入通道數為32,輸出通道數為64,卷積核的大小為3,填充為2;第3個卷積層的輸入通道數為64,輸出通道數為32,卷積核的大小為1,無填充。上述操作最終實現了對數據特征數量的擴充,能夠提取出時序數據中存在的深度特征。

LSTM 模塊由1 個LSTM 層構成。其中,LSTM的循環層設置為10,隱藏層為32,可將以時序形式輸入的數據映射為32 維的特征向量。

上述模塊的輸出最終通過Concat 層合并為64維向量,最后通過2 個全連接層映射為一維向量,即實現NOx 排放濃度的預測。

3.1 數據預處理

數據預處理作為實驗中的重要一環,其處理結果將直接影響預測的精度。本文采用改進后的CEEMDAN 算法對數據進行預處理,并將其與傳統的EMD 方法進行比較,實驗結果如圖5 所示。

圖5 EDM 與CEEMDAN 處理數據結果圖

從圖5 明顯可以看出,CEEMDAN 方法無論是整體的趨勢還是局部的細節,其擬合度均優于EMD方法。這是因為EMD 方法本身存在模態混疊問題,CEEMDAN 方法通過加入白噪聲消除了這類問題,使得模態的分解十分清晰,產生了良好的擬合效果。此外,從圖中還可以觀察到經過CEEMDAN 處理后的數據擬合出的曲線是光滑的,而真實數據的曲線是階梯狀的。這是由于真實數據中存在噪聲,導致數據不光滑,CEEMDAN 方法可以消除數據中存在的噪聲,使處理后的數據變得光滑。

3.2 NOx 排放濃度預測對比實驗

為了進一步驗證模型的有效性,將LSTM-SAFCN 模型與LSTM、LSTM-FCN 模型進行預測結果的對比。圖6 是不同模型的真實值與預測值之間的結果對比圖,結果表明LSTM-SAFCN 能夠更好地跟隨真實值的變化。為了更加直觀地反映各個模型的預測精度,從圖6 中截取了1000~1300 時間步長曲線用于更好地觀察擬合程度,見圖7。從圖7 可以看出LSTM-SAFCN 模型的預測值較其他幾種模型對真實值的擬合程度更好,這說明LSTM-SAFCN 模型能夠更加準確地預測NOx 的濃度。

圖7 3 種預測模型預測結果對比圖

LSTM-SAFCN 的預測效果優于LSTM-FCN,是因為引入SA 后,可以減少對外部信息的依賴,更好地捕捉到數據之間的內部相關性,使得數據中的重要特征得以突出顯現。與這2 種方法相比較,基于單LSTM 的預測模型預測效果更差,這主要是模型對于數據中特征提取的效果不好,沒有提取到有效的重要信息用于預測,直接導致實驗結果精度較差。

為了評估預測模型的性能,使用均方根誤差(root mean square error,RMSE)、平均絕對誤差(mean absolute error,MAE)和確定系數(coefficient of determination,R2)來作為預測結果的評價標準。其計算公式分別為

其中,N為測試集樣本數,Yi為實際測量值,為模型的預測值,為樣本均值。RMSE 反映測量值和預測值之間的總體偏差,MAE 揭示測量值和預測值之間的相似性,R2考慮觀測值和預測值之間的相關程度。RMSE 和MAE 值越低,預測性能越好;R2值越高,預測精度越高。

表1 是不同預測模型在不同評價指標下的預測結果。對比發現,LSTM-SAFCN 模型預測效果明顯優于其他2 種模型,與LSTM、LSTM-FCN 相比指標RMSE分別下降了66.06%、36.65%;指標MAE 分別下降了81.61%、53.68%;指標R2上升了65.59%、40.86%。

表1 不同預測模型實驗結果對比

3.3 不同工況下NOx 排放濃度預測

為了進一步驗證模型的有效性,在不同工況下使用相同的預測模型進行實驗。上述3 種模型在工況2 的預測結果對比圖如圖8 所示??梢钥闯?在工況2 中LSTM-SAFCN 模型仍舊是最貼合預測曲線的。這說明在不同工況下,LSTM-SAFCN 模型依然能夠準確地預測NOx 排放濃度。

圖8 工況2 下3 種預測模型預測結果對比圖

表2 是在工況2 下不同預測模型的預測結果對比。對比發現,LSTM-SAFCN 模型依然明顯優于其他2 種模型,其中,與LSTM、LSTM-FCN 相比指標RMSE 分別下降了25.45%、9.42%;指標MAE 分別下降了23.58%、12.22%;指標R2上升了13.75%、5.00%。

表2 工況2 下不同預測模型實驗結果對比

不同模型、不同工況的預測結果充分說明,LSTM-SAFCN 模型由于加入SA 對輸入數據實現了全局關聯,與其他2 種預測模型相比具有更高的預測精度。

4 結論

針對生物質燃燒機理復雜且NOX排放受多方面因素影響的問題,本文在采用CEEMDAN 方法進行數據預處理的基礎上,提出了一種改進的長短期記憶-自注意力機制全卷積神經網絡(LSTM-SAFCN)模型用于預測NOX排放濃度,該模型可以同時兼顧時間序列數據的局部細節與長期趨勢特征。實驗結果表明,LSTM-SAFCN 模型與其他2 種傳統模型相比預測精度更高。

考慮到LSTM 模塊計算速度慢,后續工作將致力于改變并行結構,加深網絡深度,進一步提高網絡預測精度。

猜你喜歡
生物質卷積噪聲
生物質揮發分燃燒NO生成規律研究
基于3D-Winograd的快速卷積算法設計及FPGA實現
《生物質化學工程》第九屆編委會名單
噪聲可退化且依賴于狀態和分布的平均場博弈
《造紙與生物質材料》(英文)2020年第3期摘要
從濾波器理解卷積
基于傅里葉域卷積表示的目標跟蹤算法
控制噪聲有妙法
生物質碳基固體酸的制備及其催化性能研究
一種基于白噪聲響應的隨機載荷譜識別方法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合