?

基于數據分解的AQI的CEEMD-Elman神經網絡預測研究

2019-11-28 10:50吳曼曼徐建新
中國環境科學 2019年11期
關鍵詞:預測值個數空氣質量

吳曼曼,徐建新,王 欽

基于數據分解的AQI的CEEMD-Elman神經網絡預測研究

吳曼曼1,2,徐建新2,3*,王 欽1

(1.昆明理工大學質量發展研究院,云南 昆明 650093;2.省部共建復雜有色金屬清潔能源利用國家重點實驗室,云南 昆明 650093;3.昆明理工大學冶金與能源工程學院,云南 昆明 650093)

針對Elman神經網絡在預測空氣質量指數(AQI)時易受到數據非平穩性的影響導致預測趨勢良好但準確度較低的問題,提出以互補集合經驗模態分解(Complementary Ensemble Empirical Mode Decomposition, CEEMD)為基礎的CEEMD-Elman模型.應用CEEMD對AQI序列分解成不同時間尺度上的本征模態函數分量和剩余分量,進而首次將對非平穩的AQI序列的預測研究轉化為對多個平穩的本征模態函數分量的研究.分別與Elman單一模型、EMD-Elman模型、BP單一模型及CEEMD-BP模型進行實驗對比.結果表明:應用該方法建立的模型的均方誤差、平均絕對誤差和平均絕對百分比誤差分別為4.80、0.71、1.84%,均小于其他模型結果;對應空氣質量等級預報正確天數的頻率為94.12%.該模型能有效的降低非平穩性對實驗預測結果的影響,實現對空氣質量等級的準確預報;該研究為進一步預測AQI的走向提供了有效依據,也為政府決策和管理部門制定空氣污染控制提供了更充分的參考.

空氣質量指數;互補集合經驗模態分解;偏自相關函數;Elman神經網絡;空氣質量等級

隨著城市化和工業化的快速發展,大氣污染已成為人類社會面臨的嚴峻挑戰.空氣質量指數(Air Quality Index,AQI)作為衡量空氣質量的重要指標,與人類健康息息相關[1-2].AQI旨在綜合各種污染物(PM2.5、PM10、CO、O3、SO2、NO2)的綜合指數,以數字的形式描繪空氣質量狀況,使公眾能簡明的了解空氣質量的優劣,根據空氣質量標準(GB3095- 2012)[3]和對人體健康的各種影響,空氣質量指數分為6類.因此,如何準確預測AQI對控制大氣污染、促進人類社會可持續發展具有重要意義.但空氣質量指數的分析與預測是極其復雜的,主要是因為大氣環境本質上是一個動態、非線性、非平穩、有噪聲的系統[4-5],其走勢容易受各種因素的影響:經濟變量、環境污染物濃度、氣象要素等[6-7].因此如何更準確地預測空氣質量受到廣泛關注.

目前大氣污染預測方法主要分為三種:統計模型、數值模型和智能預測.統計模型常用的有自回歸綜合移動平均(ARIMA)模型[8]、多元線性回歸(MLR)模型[9]、和灰色模型[10],但其顯著的缺點是預測精度依賴于非線性過程中的線性映射能力[11],對非線性問題預測結果通常不太穩定;數值模型預測常用的有CMAQ[12]、CAMx[13]和WRF-Chem[14],然而,這類模型初始參數的要求較高,且大氣化學演變過程非常復雜,從而使得模型在預測過程中存在不確定性,導致預測結果的精度較低;智能預測常用的有人工神經網絡[15-16],人工神經網絡因具備很強的非線性逼近能力和自適應、自學習等特點,在用來研究空氣污染預測時具有特定的優勢.

針對使用神經網絡進行預測時,目前大多數采用的是基于BP(back propagation,BP)算法的靜態前饋神經網絡[17-18].但隨系統階次的增加或階次未知,迅速擴大的網絡結構使網絡學習的收斂速度減慢且易陷入局部極小值收斂[19].相比之下,動態回歸神經網絡提供了一種極具潛力的選擇,它能夠更生動、更直接地反映系統的動態特點.Elman回歸神經網絡是一種典型的動態神經元網絡,具有適應時變特性的能力.考慮到AQI序列具有動態性的特點,可采用Elman網絡進行預測.但現有的研究大多從污染物指標和氣象要素出發,先獲取影響空氣質量的關鍵指標進而實現對AQI序列的預測,而該研究工作量較為復雜且易受其他因素影響;且國內直接對AQI序列進行預測的研究較少,AQI預測的理論體系還不成熟;盡管神經網絡模型具有更好的性能,然而在大多數實際情況下,AQI序列是非平穩或混沌的,因此,直接利用Elman神經網絡對其進行建模時預測精度較低[20-21].

互補集合經驗模態分解是經驗模態分解家族中的一員,由EMD(Empirical Mode Decomposition)和EEMD(Ensemble Empirical Mode Decomposition)演變而來.EMD方法是Huang[22]提出一種基于“篩選”思想將不平穩信號分解成相對平穩的有限個本征模態函數(Intrinsic Mode Function,IMF)分量和剩余分量的方法,EMD方法適用于非線性信號分解,在非線性信號處理上具有很大的優勢.該算法被認為是對傳統方法的重大突破,但分解結果往往受到模態混合的影響.為了解決這個問題,Wu和Huang提出了EEMD[23],顯著提高了EMD算法的穩定性,但在實現足夠大的集成手段時,需要花費大量的時間,而且不能完全抵消增加的白噪聲.Yeh等[24]引入CEEMD來解決EMD和EEMD問題,CEEMD方法不僅有效地解決了EMD分解的模態混合問題,而且幾乎完全消除了殘余白噪聲的影響且提高了計算效率.為了提高模型的預測精度和穩定性,利用CEEMD消除原始數據中的噪聲,將AQI序列分解為若干個IMF分量和剩余分量,并將其作為Elman神經網絡的輸入.

研究證實,將經驗模態分解技術與神經網絡的結合可以為時間序列預測提供良好的預測結果.例如,Wang等[25]將EMD與Elman相結合,建立了一種新的風速趨勢預測分解模型,結果表明,該模型具有較小的誤差,適用于風速預測;Yang等[26]將EEMD和Elman神經網絡結合,構建一種新的空氣質量監測預警系統,預測結果表明,該混合模型具有較高的預測精度和穩定性,Yu等[27]直接將CEEMD分解后的序列與集成極限學習機結合預測原油價格,實驗結果表明,模型具有更好的預測性能模型的統計指標和預測精度.

本文從AQI序列本身出發,將用于處理時頻信號的CEEMD分解技術與Elman神經網絡相結合,以期改進Elman神經網絡在預測大氣污染準確度不高的問題.首先,用CEEMD對AQI序列進行分解成多個IMF分量和剩余分量;其次,用偏自相關函數求出AQI滯后期數,以確定Elman網絡的輸入和輸出變量;再次,分別對各分量構建AQI的CEEMD- Elman預測模型;最后,將各分量的預測值相加得到最終預測值.并將該方法分別與Elman單一神經網絡模型、BP單一網絡、EMD-Elman模型、EEMD- Elman模型和CEEMD-BP模型的均方誤差、平均絕對誤差以及平均百分比誤差進行對比分析.

1 原理與方法

本實驗采用Windows7系統平臺,處理工具為MATLAB和Eviews.

1.1 Elman神經網絡基本原理

Elman神經網絡是Elman提出的一種典型局部回歸網絡,主要結構是前饋鏈接,包括輸入層、隱含層、輸出層和承接層[28],網絡示意如圖1所示.一般情況下,輸入層傳輸信號,輸出層單元線性加權,隱含層的傳遞函數可采用線性或非線性函數,承接層是用來記憶隱含層前一時刻的輸出值.Elman神經網絡的非線性空間表達式為[28]:

圖1 Elman神經網絡示意

1.2 CEEMD基本原理

CEEMD(Complementary Ensemble Empirical Mode Decomposition,CEEMD)[24]是由EMD和EEMD演變而來,可解決EMD存在模態混疊的問題和EEMD中分解時間較長的問題.其分解過程如下:

②根據上下包絡線求得平均曲線:

⑥用剩余序列重復上述①-⑤個步驟,可得到多個IMF,直到滿足終止條件:

(3)兩組IMF1和IMF2和的集成平均值即為最終的分解結果IMF.

1.3 偏自相關函數

偏自相關函數(Partial Autocorrelation Function, PACF)是辨識自回歸滑動平均模型ARMA(,)中滯后階數的常用方法,它可以反映時間序列中任意兩個變量在排除了中間變量的影響后的相關性[29].本文利用 PACF 來確定各分量的滯后階數,進而確定 Elman神經網絡的輸入層神經元個數、輸出變量.

1.4 CEEMD-Elman模型的搭建

1.4.1 流程圖 CEEMD-Elman網絡預測模型的思路(具體流程見圖2):首先利用CEEMD對AQI序列進行分解處理,該方法可將AQI序列分解成頻率不同的多個IMF分量和剩余分量,分別將其作為CEEMD-Elman模型的輸入變量;其次,利用偏自相關函數求AQI的滯后期,以確定各子模型的輸入層神經元個數;再次,對各分量建模組成CEEMD- Elman預測模型,獲得每個分量的預測值;最后,將各個子模型的預測結果相加得到最終預測結果.步驟如下:

①對上海市AQI序列進行CEEMD分解,得到多個IMF分量和剩余分量;

②利用PACF求得AQI序列的滯后階數,進而確定子模型的輸入變量;再通過多次訓練并對比訓練網絡誤差大小來確定隱含層的神經元個數,最終確定模型的輸出變量;

④重復步驟二到步驟三,分別獲得其他分量和剩余分量的預測結果;

⑤將各分量和剩余分量的預測值相加.

圖2 CEEMD-Elman預測模型的流程

1.4.2 關鍵參數的設定 在進行網絡訓練和預測中,由于權數和閾值是由隨機數隨機產生,因此每次運行軟件時,網絡的收斂速度會有所不同.經過反復對比,權的初始值域選擇為(-0.1, 0.1)較好.在模型學習過程中隱含層傳遞函數采用tansig函數,輸出層傳遞函數采用purelin函數,訓練函數為traingdx,其中,最大迭代次數為5000次,最多驗證失敗次數為5次,誤差容限為0.00001.

隱含層的節點數及神經元個數也同樣是神經網絡模型中關鍵參數之一.理論上,如果神經網絡只要有足夠多的隱含層節點就可以逼近任意的連續函數.但目前仍沒有具體的計算標準,大多數是根據經驗來設定隱含層神經元個數.有研究說明一個三層神經元的隱含層神經元個數應該是該神經網絡輸入神經元個數的75%[21];而有研究建議最優隱藏層的神經元個數應該為其輸入神經元個數的1.5至3倍[22].筆者結合這兩種經驗,確定了各模型隱含層神經元個數的實驗范圍為對應其輸入神經元數目的75%~ 300%.對CEEMD-Elman模型進行反復訓練對比,通過比較網絡誤差的大小來判斷隱含層最佳神經元數目.最終確定AQI序列的各子模型的隱含層神經元個數,如表2所示

1.5 方法的驗證

為更準確地觀察數據的處理情況,選取平均絕對誤差、均方誤差和平均絕對百分比誤差3個指標.平均絕對誤差表征預測誤差的離散程度,數值越小表明預測結果越好;均方誤差是反映預測值誤差的實際情況的一種方法,可評價數據的變化程度,數值越小越好;平均絕對百分比誤差說明預測值與原始值差別程度,數值越小,表明預測效果越好.

2 CEEMD-Elman預測模型的結果與分析

2.1 樣本數據來源及預處理

選取上海市2017年3月10日至2019年3月10日每日空氣質量指數(http://www.semc.com.cn/aqi/ Home/Index)共712個有效樣本數據為研究對象.樣本數據的基本統計特征如表1所示.表1可知,該樣本數據的標準差為34.84,即該組數據的波動性較大;對應的偏度和峰度為1.19、4.68,J-B(Jarque-Bera)構造統計量結果為251.64,為0.00,說明要拒絕該序列與正態分布無顯著差異的原假設,即AQI序列不服從正態分布.進一步對AQI序列做平穩性檢驗,得到ADF (augmented Dickey-Fuller)值為-0.98,大于臨界值-1.94,也即有充分的理由說明AQI序列是非平穩的.綜上檢驗,嚴格適合平穩序列的方法并不可行,而Elman神經網絡可對非平穩非線性的AQI序列進行預測.

表1 樣本數據的基本統計特征

表2 各分量模型的隱含層神經元個數

圖3 上海市的AQI序列

選取上海市AQI序列進行CEEMD-Elman建模時,利用偏自相關函數求得上海市AQI序列滯后期為6,即用前6d的AQI來預測第7d的AQI,并將其作為Elman模型的輸入層神經元個數;通過對比模型網絡誤差大小,最終確定隱含層神經元個數如表2所示.

上海市AQI(2017年3月10日~2019年3月10日)數據如圖3所示.由圖3可知,該序列呈現出較大的波動性和一定的趨勢性,但并沒有顯示出清晰可循的規律性,若想對其進行準確預測則存在較大的難度.CEEMD是一種有效處理非平穩信號的方法,可應用到廣泛的領域.對上海市AQI序列的CEEMD分解結果如圖4所示,分解后共得到9個IMF分量,即對非平穩AQI的研究可轉化為對9個平穩的IMF分量的研究.由圖4所知,每一個IMF分量的頻率成分都不相同,且每一時刻的幅值也不同,但非平穩和非線性性質都有所降低.

圖4 上海市AQI數據的CEEMD分解

2.2 上海市AQI的預測結果

選取上海市AQI共712個有效樣本數據為研究對象.以AQI的2017年3月10日至2018年10月19日共570個數據建立了CEEMD-Elman網絡預測模型,并以AQI的2018年10月20日至2019年3月10日共136個有效數據作為檢驗數據用于模型的預測.分別對各分量IMF和剩余分量進行CEEMD-Elman建模訓練,各分量預測結果如圖5所示.

為更直觀的觀察CEEMD-Elman模型的預測情況,將各子模型預測值進行自適應疊加,并分別與Elman單一模型、BP單一模型、EMD-Elman模型和CEEMD-BP模型進行對比分析.各模型AQI的預測值與實測值的對比結果如圖6所示;各模型的誤差對比如圖7所示.

根據《環境空氣質量指數(AQI)技術規定(試行)》(HJ 633—2012)規定:空氣質量指數劃分為0~50、51~100、101~150、151~200、201~300和大于300六檔,對應于空氣質量的六個級別.為計算本模型對空氣質量預報的準確率,按照空氣質量劃分標準,將各模型預測的上海市空氣質量指數AQI變換成對應的空氣質量等級;并與真實的AQI對比,用空氣質量等級預報正確天數的頻率表示預測準確率,統計可得各模型的預測準確率如表3所示.

圖6 各模型的預測值與實測值對比曲線

圖7 不同模型的誤差對比曲線

表3 各模型空氣質量等級預報正確天數的頻率對比

注: -為真實值,無準確率和誤報率.

2.3 討論分析

由圖5可知:CEEMD-Elman預測結果除IMF1外,其余分量預測結果基本與實際值保持一致,也即隨著AQI序列非線性和非平穩性的程度降低,預測值與實際值的誤差也越來越小.

圖6可知:(1)對比單一神經網絡,3種組合模型都能更好的預測出上海市AQI的趨勢,預測具備較好的波動性和跟隨性;(2)Elman網絡相對BP網絡表現出更好的預測趨勢,即對具有動態性且非線性非平穩的上海市AQI進行預測時,Elman神經網絡更合適;(3)CEEMD-Elman模型的預測趨勢幾乎與上海市AQI趨勢一致,預測效果最好.

由圖7可知:CEEMD-Elman模型的誤差曲線在=0處上下波動,且波動性最小,說明該模型的跟隨性最強,預測效果與真實值最為接近,模型精度最高.

由表3可知:原AQI序列按照空氣質量等級分別為優、良、輕度污染和中度污染的比例分別是25%、55.88%、17.65%和1.47%;對比各模型的預測結果,CEEMD-Elman與真實值最為接近,預測比例分別是22.79%、56.62%、19.85%和0.74%,預報正確天數的頻率為94.12%.

為進一步對比各模型的準確性,分別對比計算各模型的預測誤差,如表4所示.

表4 各模型誤差指標的比較

由表4可知:

(1)對比單一網絡模型.BP模型預測值的均方誤差MSE、平均絕對誤差MAE和平均絕對百分比誤差MAPE分別比Elman模型的高出61.31%、39.40%、34.04%,說明Elman模型的預測值變化較小,即對于時間序列預測時Elman模型的跟隨能力要強于BP模型.

(2)對比組合模型.CEEMD-Elman模型的預測值的均方誤差MSE、平均絕對誤差MAE和平均絕對百分比誤差MAPE分別比EMD-Elman模型低了93.80%、52.24%和83.33%;比CEEMD-BP模型96.89%、92.46%和86.83%.

綜合上述誤差指標來看,CEEMD-Elman模型預測精度最高,說明將AQI序列的預測研究轉化為對多個IMF分量和剩余分量的研究是可行的.這是因為將數據分解技術與Elman神經網絡結合應用到對大氣污染的預測時,CEEMD很大程度上降低了AQI序列因非平穩和噪聲導致的誤差;且建模前利用PACF求得AQI序列的滯后期,考慮了AQI數值受前一天或者前幾天的影響,因此,相比其他模型,CEEMD-Elman模型更適用于AQI序列的預測和空氣質量等級的預報.

3 結論

3.1 通過CEEMD將非線性非平穩的空氣質量指數AQI序列分解成一系列較為平穩的IMF分量和剩余分量,將對AQI序列的預測研究轉化成對多個IMF分量的研究,進而進行建模,說明該模型可以處理非平穩的AQI序列.

3.2 將該方法分別與Elman網絡模型、BP網絡模型、EMD-Elman模型以及CEEMD-BP模型進行對比,選取上海市AQI序列為例,通過比較誤差指標可知CEEMD-Elman模型預測值與實際值的平均絕對誤差、均方誤差以及平均絕對百分比誤差分別為:4.80、0.71、1.84%,均比其他4種模型預測效果更好,反映CEEMD-Elman模型的預測精度得到了較好的改善;對應空氣質量等級預報正確天數的頻率為94.12%,說明了該方法的有效性.

3.3 通過模型的預測值與實際值對比,發現該方法下,可以得到較為準確的預測趨勢和預測值,說明該模型適用于上海市空氣質量的預測,從而驗證了該方法在實際應用中具有一定的適用性.

[1] Gao Q X, Liu J R, Li W T, et al. Comparative analysis and inspiration of air quality index between China and America [J]. Environmental Science, 2015,36(4):1141-1147.

[2] Zhang Q J, Benoi L, Fanny V L, et al. An air quality forecasting system in Beijing-application to the study of dust storm events in China in May 2008 [J]. Journal of Environmental Sciences, 2012,24(1): 102-111.

[3] GB3095-2012 《環境空氣質量標準》[S]. GB3095-2012 Ambient air quality standard [S].

[4] 趙 猛.基于數據挖掘技術的大氣環境預測研究[D]. 北京:北京交通大學, 2017.Chen J. Research on atmospheric environment prediction based on data mining technology [D]. Beijing, Beijing Jiaotong University, 2017.

[5] Kurt A, Oktay, A. B. Forecasting air pollutant indicator levels with geographic models 3days in advance using neural networks [J]. Expert Systems with Applications, 2010,37(12):7986-7992.

[6] 張潔瓊,王雅倩,高 爽,等.不同時間尺度氣象要素與空氣污染關系的KZ濾波研究[J]. 中國環境科學, 2018,38(10):3662-3672. Zhang J Q, Wang Y Q, Gao S, et al. study on the relationship between meteorological elements and air pollution at different time scales based on KZ filtering [J]. China Environmental Science, 2018,38(10): 3662-3672.

[7] 江 琪,王 飛,張恒德,等.北京市PM2. 5和反應性氣體濃度的變化特征及其與氣象條件的關系[J]. 中國環境科學, 2017,37(3):829-837. Jiang Q, Wang F, Zhang H D, et al. Analysis of temporal variation characteristics and meteorological conditions of reactive gas and PM2.5in Beijing [J]. China Environmental Science, 2017,37(3):829-837.

[8] Konovalov I B, Beekman M, Meleux et al. Combining deterministic and statistical approaches for PM10forecasting in Europe [J] Atmospheric Environment, 2009,43:6425–6434.

[9] Zhang H, Zhang W, Palazoglu et al. Prediction of ozone levels using a hidden markov model (HMM) with gamma distribution [J]. Atmospheric Environment, 2012,62:64-73.

[10] 肖 鳴,李衛明,劉德富等.基于多重優化灰色模型的三峽庫區香溪河支流回水區水華變化趨勢預測研究[J]. 環境科學學報, 2017, 37(3):1153-1161.Xiao M, Li W M, Liu D F, et al. Prediction of algal bloom variation in backwater areas of tributaries in Three-Gorges based on multiple optimized grey model [J]. Acta Scientiae Circumstantiae, 37(3):1153-1161.

[11] Song Y, Qin S, Qu J, et al. The forecasting research of early warning systems for atmospheric pollutants: A case in Yangtze River Delta region [J]. Atmospheric Environment, 2015,118:58–69.

[12] Wang L T, Jang C, Zhang Y, et al. Assessment of air quality benefits from national air pollution control policies in China [J]. Atmospheric Environment, 2010,44(28):3449-3457.

[13] Huang Q, Cheng S Y, Perozzi R E, et al. Use of a MM5-CAMx-PSAT modeling system to study SO2source apportionment in the Beijing metropolitan region [J]. Environmental Modeling & Assessment, 2012,17(5):527-538.

[14] Egan S D, Stuefer M, Webley P W, et al. WRF-Chem modeling of sulfur dioxide emissions from the 2008 Kasatochi Volcano [J]. Annals of Geophysics, 2015,57:1593-5213.DOI:10.4401/ag-6626.

[15] Zhu. S L, Lian X Y, Liu H X, et. al. Daily air quality index forecasting with hybrid models: A case in China [J]. Environment Pollution, 2017,231(2):1232-1244.

[16] Li X, Peng L, Yao X J, et al. Long short-term memory neural network for air pollutant concentration predictions: Method development and evaluation [J]. Environment Pollution, 2017,231(1):997-1004.

[17] Bai Y, Li Y, Wan, X X, et al. Air pollutants concentrations forecasting using back propagation neural network based on wavelet decomposition with meteorological conditions [J].Atmospheric Pollution Research, 2016,7(3):557–566.

[18] 張恒德,張庭玉,李 濤等.基于BP神經網絡的污染物濃度多模式集成預報[J]. 中國環境科學, 2018,38(4):1243-1256. Zhang H D, Zhang T Y, Li T, et al. Forecast of air quality pollutants concentrations based on BP neural network multi-model ensemble method [J]. China Environmental Science, 2018,38(4):1243-1256.

[19] White. White. Economic prediction using neural networks: The case of IBM daily stock returns [C]//International Conference on Neural Networks, 1988,2(2):451-458.

[20] Wang P, Liu Y, Qin Z, et al. A novel hybrid forecasting model for PM10and SO2daily concentrations [J]. Science of the Total Environment, 2015,505(505C):1202-1212.

[21] Azman A, Hafizan J,Mohd E T, et al. Prediction of the level of air pollution using principal component analysis and artificial neural network techniques: A case study in Malaysia [J]. Water, Air & Soil Pollution, 2014,225(8):0049-6979.DOI:https://doi.org/10.1007/s11270-014-2063-1.

[22] Huang N E, Shen Z, Long S R, et al. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non- stationary time series analysis [J]. Proceedings A, 1998,454(1971):903-995.

[23] Wu Z, Huang N E. Ensemble empirical mode decomposition: A noise-assisted data analysis method [J]. Advances in Adaptive Data Analysis, 2009,1(1):1?41.

[24] Yeh J R, SHIEH J S, HUANG N E. Complementary ensemble empirical mode decomposition:a Novel Noise Enhanced Data Analysis Method [J]. Advances in Adaptive Data Analysis, 2010,2(2): 135-156.

[25] Wang J J, Zhang W Y, Li Y N, et al. Forecasting wind speed using empirical mode decomposition and Elman neural network [J]. Applied Soft Computing, 2014,23(Complete):452-459.

[26] Yang Z, Wang J. A new air quality monitoring and early warning system: air quality assessment and air pollutant concentration prediction [J]. Environment Research, 2017,158:105-117.

[27] Yu L, Dai W, Tang L. A novel decomposition ensemble model with extended extreme learning machine for crude oil price forecasting [J]. Engineering Applications of Artificial Intelligence, 2016,47:110-121.

[28] ELMAN J L. Finding structure in time [J]. Cognitive Science, 1990, 2(14):179-211.

[29] 宋菁華,楊春節,周 哲等.改進型EMD-Elman神經網絡在鐵水硅含量預測中的應用[J]. 化工學報, 2016,67(3):729-735. Song J H, Yang C J, Zhou Z, et al. Application of improved EMD-Elman neural network to predict silicon content in hot metal [J]. CIESC Journal, 2016.67(3):720-735.

AQI prediction of CEEMD-Elman neural network based on data decomposition.

WU Man-man1,2, XU Jian-xin2,3*, WANG Qin1

(Quality Development Institute, Kunming University of Science and Technology, Kunming 650093, China;2.State Key Laboratory of Complex Nonferrous Metal Resources Clean Utilization, Kunming 650093, China;3.Faculty of Metallurgical and Energy Engineering, Kunming University of Science and Technology, Kunming 650093, China)., 2019, 39(11):4580~4588

Elman neural network (ENN) is susceptible to the non-stationary of data when it is used to predict the Air Quality Index (AQI), resulting in a good forecasting trend but low accuracy. Based on complementary ensemble empirical modal decomposition (CEEMD), a new hybrid model related to ENNwas proposed in this paper. Firstly, CEEMD was employed to decompose the AQI sequence into a finite number of intrinsic mode functions (IMFs) at different time scales and one residue. Secondly, partial autocorrelation function was used to calculate the lag periods of the input variables of each IMF in ENN. Finally, the predicted values of each IMF were summed up to obtain the final predicted result. The study of the AQI without stationarity sequence was then transformed into the study of steady IMFs. The experimental results show that the mean square error, the mean absolute error, and the mean absolute percent error were respectively 4.80, 0.71, and 1.84% which were all less than those of the single Elman network, EMD-Elman model, BP network and CEEMD-BP model. Furthermore, the frequency of the correct forecast for the corresponding air quality grade was 94.12%. It has been concluded that the new model could reduce the volatility impact of real AQI data and effectively predict the air quality grade. This study not only provides an effective evidence to further predict the trend of AQI, but provides a better reference for government decision-making and pollution control formulation of management departments.

air quality index (AQI);complementary ensemble empirical mode decomposition;partial autocorrelation function;Elman neutral network;air quality grade

X823

A

1000-6923(2019)11-4580-09

吳曼曼(1994-),女,安徽阜陽人,昆明理工大學碩士研究生,主要從事機器學習和時間序列預測研究.發表論文2篇.

2019-04-02

云南省高層次人才引進項目(50578020)

* 責任作者, 教授, xujianxina@163.com

猜你喜歡
預測值個數空氣質量
加拿大農業部下調2021/22年度油菜籽和小麥產量預測值
±800kV直流輸電工程合成電場夏季實測值與預測值比對分析
怎樣數出小正方體的個數
AI講座:ML的分類方法
等腰三角形個數探索
怎樣數出小木塊的個數
怎樣數出小正方體的個數
車內空氣質量標準進展
重視車內空氣質量工作 制造更環保、更清潔、更健康的汽車
多功能空氣質量遠程檢測儀
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合