?

沈陽市PM2.5濃度ARIMA-SVM組合預測研究

2018-11-28 03:46宋國君國瀟丹
中國環境科學 2018年11期
關鍵詞:采暖期沈陽市監測點

宋國君,國瀟丹*,楊 嘯,劉 帥

?

沈陽市PM2.5濃度ARIMA-SVM組合預測研究

宋國君1,國瀟丹1*,楊 嘯1,劉 帥2

(1.中國人民大學環境學院,北京 100872;2.農業農村部管理干部學院,北京 102208)

首先利用回歸樹分類方法,對采暖期與非采暖期各日進行氣象類型劃分,識別出易造成重污染天氣的氣象類型.其次分別在各氣象類型內,以污染源排放量為自變量,利用差分自回歸滑動平均與支持向量機(ARIMA+SVM)組合方法建立起PM2.5濃度日均值預測模型,并選取2013年01月~2017年06月間,沈陽市區內9個環境監測點PM2.5濃度日均值進行實證分析.結果表明,使用氣象分類下的ARIMA+SVM組合模型對PM2.5濃度日均值進行預測,相比于不劃分氣象類型時的普通機器學習模型,其模型預測值與實測值趨勢的吻合度更高,且對峰-谷值的識別能力更強.在采暖期與非采暖期,組合模型均具有平均絕對誤差更低、預測正確率更高的優點.

PM2.5濃度;氣象類型;ARIMA-SVM組合模型;預測方法

隨著我國經濟發展進入新常態,空氣質量已成為最受關注的民生問題之一.作為影響我國空氣質量的首要污染物,PM2.濃度的準確預報對預判重污染天氣,制定應急預案啟動機制,優化企業限產方案具有重要意義.

美國、澳大利亞等國家早在20世紀就開展了大規模的城市空氣質量預報研究[1].我國自2001年起開始發布空氣質量預報,預報模型包括機理模型和非機理模型[2].機理模型以實時探空氣象內插和污染監測資料構建初始場,并加入地面氣象和污染源排放資料,經過復雜的網絡嵌套和推演過程,得出未來24~48h的污染物濃度預報值[3],主要包括中國科學院大氣物理所開發的“城市空氣污染預報(EMH)”、中國氣象局氣象科學研究院開發的“城市空氣污染預報(CAPPS)”和“霧-霾數值預報(CUACE/Haze-fog)”三個模型[4].模型涵蓋了污染物由產生到擴散的復雜物理化學過程,但其初始場構建十分困難,預報過程復雜,對于未使用過相應系統和大氣物理知識缺乏的普通研究者來說,幾乎無法操作和復制.

非機理模型則通過歷史數據來判斷污染物濃度變化規律,主要包括統計模型和機器學習模型[5].目前已有很多學者選取污染物濃度、溫度、濕度、氣壓、風速、水汽壓等影響因子,使用多元線性回歸、小波神經網絡、支持向量機模型對PM2.5等濃度進行預測[6-10].非機理模型未將污染物的形成過程同氣象條件影響下的污染物擴散過程分離開,不符合科學機理,且未將可控的生產行為與不可控的天氣現象區別開.另外,以污染物濃度作為預測自變量的方式,認為PM2.5濃度與SO2、NO等污染物具有直接關聯,忽略了由工業生產、燃料燃燒、交通運輸、揚塵等形成的PM2.5一次來源,未關注造成大氣污染的人類行為本質,對污染源管理并無借鑒意義.在進行預報時,除需要輸入常規氣象要素預測值外,還需要輸入其他污染物濃度預測值,對預測精度產生了很大影響[3].

強逆溫、高濕度、偏南風、低氣壓天氣對沈陽市空氣污染擴散明顯不利[11].為避免客觀條件制約對主觀管理效果的弱化,應將氣象因素與污染物來源分開.本文綜合機理與非機理模型提出一種全新的城市PM2.5濃度預測方式.首先,使用回歸樹方法,對沈陽市每個自然日進行氣象類型劃分,使得類型內部各天的擴散模式近似相同.隨后,在每個類型中以污染源日排放量為自變量,使用“差分自回歸滑動平均-支持向量機(ARIMA-SVM)”組合模型進行PM2.5濃度預測.ARIMA-SVM組合預測方法既擬合了歷史數據的線性關系,又對殘差部分進行了非線性建模,避免了普通SVM預測模型對具有明顯下降趨勢的時間序列進行預測時,結果偏高的問題;模型相比于常規SVM及已有文獻中使用距離相關系數等優化后的SVM模型,均方根誤差可降低2.42%~33.93%[12-13].本文所提出的優先進行氣象分類的思想,不僅可以識別出易引起PM2.5濃度超標的類型,也便于對惡劣擴散天氣設計有針對性的應急響應措施.未來可通過修改污染源排放量的方式,判斷各點源減排貢獻率和成本有效性,為空氣質量達標規劃的設計提供可靠依據.

1 研究方法

1.1 研究思路

圖1 研究思路邏輯框

本文提出了一種全新的城市PM2.5日均濃度預測方法,這種方法首先基于回歸樹分類法對各日進行氣象要素組合分類,使得各類型中氣象條件基本相同,將不受控的客觀因素與可控的污染源排放分離開,突出空氣質量管理績效;隨后在各氣象類型內分別進行ARIMA+SVM組合預測,使用歷史數據進行機器學習,識別PM2.5濃度與污染源排放量間的關系;在實際預測中,使用氣象預報數據判斷目標日氣象類型,并將該日污染源排放量預測值帶入所屬類型ARIMA+SVM模型,得出PM2.5濃度預測值.整體研究思路如圖1所示.

1.2 回歸樹氣象分類方法

污染物的擴散、稀釋、積聚和滯留都受到氣象條件的影響[14-15].PM2.5濃度與濕度、風速、風向、氣壓、氣溫等具有密切關聯[16-17].對于北方采暖城市,冬季采暖期PM2.5濃度明顯高于其他季節[19].不同季節PM2.5濃度的氣象影響因素也有所不同,夏秋季主要為氣壓與風速[19],春冬季主要為相對濕度和日照時數[20].降雨對顆粒物具有清洗作用,通過稀釋和沉降引起PM2.5濃度降低[10].相對濕度對PM2.5濃度影響顯著,當濕度較大時形成霧,引起顆粒物變重下沉,同時阻礙煙氣擴散,加重污染[10].風向也是重要的影響因素,城市上風向無大量污染源、風速超過一定數值時有利于污染物擴散[21].出現逆溫現象時PM2.5濃度升高,逆溫層隨著氣溫升高而消失[22].氣壓高時污染物隨著氣流向城市周邊地區擴散[23].但溫度高時,空氣受熱膨脹又形成低氣壓,使氣壓與PM2.5濃度的關系變得復雜.

使用已知的影響PM2.5濃度的氣象要素,對各個自然日進行氣象類型劃分,可判斷空氣污染超標發生的氣象規律,識別造成沈陽市重污染天氣的氣象成因,同時使得各類型內部的氣象影響基本被剔除,突出了管理手段對PM2.5濃度的影響.已有學者使用聚類分析等方法進行氣象分類,而這種非監督分類方式需要人為確定最優分類數量,且不適合將PM2.5濃度作為分類目標[24].本文所使用的回歸樹分類方法可通過對自然日的不斷分類,使得每一類氣象內部的PM2.5濃度相似性最大化,同時與其他類型之間的差異性最大化[25].回歸樹分類法的優點在于:首先,以PM2.5濃度作為氣象特征值分割對象,考慮了污染物與氣象條件之間的影響關系;其次,可以給出唯一最優的分類數量和結果;另外,其相比于各種深度學習方法,具有更強的可解釋性.

回歸樹分類的步驟包括:(1)樹根節點聚合全部樣本;(2)遍歷每一個氣象特征的特征值,每個特征值得到一個劃分,通過比較找出使得各葉節點內部純度最高的最優劃分結果;(3)持續尋找氣象特征進行劃分,直到各節點內樣本不純度降低至預先設定的閾值[26].對于目標變量是連續變量的回歸樹來說,使用最小平方殘差SS來度量樹的不純度,計算公式為:

式中:為節點內樣本,()為節點內樣本總量,X為樣本點,y為樣本值.

1.3 ARIMA+SVM組合預測方法

據中國空氣質量檢測平臺中數據顯示:沈陽市2013~2017年PM2.5濃度時間序列出現明顯下降.差分自回歸滑動平均(ARIMA)模型基于線性方法進行定階,可以很好地擬合出時間序列的線性趨勢.但另一方面,PM2.5濃度經常出現復雜噪聲,導致ARIMA模型無法捕捉這部分非線性規律,導致預測精度不高[27].而支持向量機(SVM)在處理小樣本、非線性時具有明顯優勢,可規避其他機器學習算法中易于出現的局部極小以及過擬合現象,已被廣泛應用于空氣質量預測領域[6,28].由于沈陽市PM2.5濃度時間序列同時具有明顯的線性和非線性特點,本文將使用已在股票價格、發病率、用戶數量預測領域具有廣泛應用的ARIMA-SVM組合模型對其進行預測[29-31].首先使用ARIMA模型描述歷史的線性關系,隨后使用SVM模型對ARIMA模型無法捕捉的殘差部分進行非線性建模.

圖2 ARIMA-SVM組合預測流程圖

ARIMA-SVM組合預測流程如圖2所示,具體步驟包括:

(1)ARIMA模型預測.ARIMA(p,d,q)模型是針對非平穩時間序列所建立的模型,非平穩經d階差分后得到平穩序列,建立ARIMA(p,q)模型,模型的一般形式為:

式中:y為平穩時間序列;為白噪聲序列.通過繪制自相關圖與偏相關圖,可確定模型自回歸階數p和移動平均階數q.定階后可得到模型擬合參數、.

綜上,最終的最優判別函數滿足等式(5).

2 預測結果

2.1 數據來源與處理

沈陽地區PM2.5濃度數據來源于中國空氣質量監測平臺,污染源排放數據來源于沈陽市污染源在線監控系統,氣象數據來自于中國氣象局中國地面國際交換站氣候資料日值數據集(V3.0).本文中全部采用日均數據,時間為2013年01月~2017年06月.

氣象數據中:氣壓、氣溫、相對濕度、風速、地表氣溫指標采用數據集中沈陽市地面區站(編號54342)日均值,降水量采用日累計降水量,蒸發量采用小型蒸發量,風向采用16方位制日極大風向,由正北方起順時針編號.

沈陽市作為典型的北方采暖城市,一年中有5個月的采暖期(11月~次年3月)和7個月的非采暖期(4~10月),大量的供暖鍋爐和熱電廠僅在采暖期運行.采暖期與非采暖期在氣象條件和污染來源方面均有明顯不同,為提高模型預測精度,需要在預測之初就將二者分開,分別進行氣象分類及后續預測.

2.2 氣象分類結果

由Pearson相關分析結果可知:沈陽市采暖期整體PM2.5濃度與相對濕度呈高度正相關,與日照量、風向、蒸發量呈高度負相關;而蒸發量與高低氣溫、蒸發量呈高度正相關,與氣壓、相對濕度呈高度負相關;日照量又與降水量、最低溫度、相對濕度呈高度負相關.在非采暖期,沈陽市PM2.5濃度與氣壓呈高度正相關,與高低氣溫、蒸發量呈高度負相關,各氣象因子之間也存在與采暖期類似的相關關系.將所獲取的全部氣象要素作為自變量,以沈陽市PM2.5濃度為因變量,使用回歸樹的方法,對2013年01月~2017年06月全部自然日進行氣象類型劃分.R軟件輸出的氣象分類結果如圖3所示.R軟件同時給出回歸樹模型的標準化均方誤差,采暖期為6.130′10-33,非采暖期為4.499′10-34,說明回歸樹分類結果合理可靠.

在上述氣象要素中,地溫、平均溫度、日照量、蒸發量屬于氣象預報無法進行或不給出的指標.為了進行后續污染物濃度預測,需要對氣象分類結果進行調整.對于采暖期,回歸樹中后四枝由蒸發量進行區分,由于該指標無法預測,且四枝中所包含樣本量占比僅為11%,均為高濃度天氣,因此將其合并為一類.類似地,將非采暖期后三枝合并.氣象預報中可以給出是否降水的判斷,但無法預測降水量,因此將采暖期中第三步降水量30.45mm以及非采暖期中第四步降水量30.15mm的判定條件均改為>0mm.原始的降水量判別條件數值不大,調整后僅有8個采暖日(1.15%)和4個非采暖日(0.42%)的氣象類別有所調整,調整前后的差異可以忽略.最終得到如表1所示的沈陽市氣象分類結果.

圖3 沈陽市氣象分類回歸樹

PRESSURE-氣壓(0.1hPa)、RAINFALL-降水量(0.1mm)、MAX_ TEMP-最高氣溫(0.1℃)、MIN_TEMP-最低氣溫(0.1℃)、WIND_ SPEED-風速(0.1m/s)、WIND_DIRECTION-風向(16風向)、 HUMIDITY-相對濕度(%)、EARTH_TEMP-地溫(0.1℃)、 AVERAGE_TEMP-平均溫度(0.1℃)、SUNLIGHT- 日照量(0.1h)、EVAPORATION-蒸發量(0.1mm)

表1 沈陽市自然日氣象分類結果

為突出易造成重污染的氣象,本文依據國家24h平均濃度二級標準將氣象類別分為3類,其中Ⅰ類為PM2.5濃度均值為不超標類型(濃度<75μg/m3),Ⅱ類為超標類型(75μg/m3£濃度<150μg/m3),Ⅲ類為嚴重超標類型(濃度3150μg/m3).在各類別內部按平均濃度由小到大進一步排序.

2.3 模型預測結果

2013年01月~2017年06月沈陽市共有9個具有連續監測數據的國控大氣監測點.如表2所示的描述統計結果可知:各站點PM2.5濃度的極值跨度很大,均值均未超標,變異系數接近1,說明濃度值變異程度高,預測難度大.

使用SPSS19.0軟件進行ARIMA時間序列預測,對PM2.5濃度序列中的線性部分進行識別.首先,通過時間序列ADF單位根檢驗可知,各監測點均拒絕原假設,不存在單位根,屬于平穩時間序列.ARIMA (p,d,q)模型轉化為不存在季節趨勢的ARMA(p,q)模型.隨后,通過自相關與偏自相關系數圖識別模型參數p和q.以采暖期小河沿為例,如圖4所示的ACF圖出現明顯拖尾性,而PACF圖自=1后截尾,無明顯模式,說明采暖期小河沿監測點滿足平穩的AR(1)模型.類似地可知:采暖期全部監測點滿足AR(1)模型,非采暖期全部監測點滿足AR(3)模型.

表2 2013年01月~2017年06月沈陽市各監測點PM2.5濃度描述統計結果

注:2015年04月沈陽市對市內國控監測點名稱進行更改,括號內為更名前名稱.

圖4 采暖期小河沿監測點自相關系數與偏自相關系數

分別在采暖期和非采暖期,以9個監測點PM2.5濃度的ARIMA預測殘差為因變量,以沈陽市全部污染源排放量為自變量,使用MATLAB軟件,選取2016年12月(采暖期)及2017年06月(非采暖期)為測試集,其余月份為訓練集,進行SVM預測.受數據可得性的限制,本文目前僅以安裝在線檢測系統的固定源排放量為模型自變量,未來可通過獲取無在線監測固定源的環統數據、道路車流量數據、面源排放量數據,進一步提高模型的全面性及預測精度.沈陽市現有161個安裝煙氣在線監測系統的國控固定源,其中采暖期有132個固定源的數據質量滿足需求,非采暖期有101個.以上述固定源排放量帶入SVM預測,識別出PM2.5濃度的非線性變化部分,確定濃度與污染源管理水平之間的關系,未來可通過改變自變量輸入判斷各污染源減排量對PM2.5濃度變化的貢獻.

表3 ARIMA回歸方程參數

Table 3 ARIMA regression equation parameters

將殘差部分的SVM模型預測值與ARIMA模型預測值加總,獲得最終的PM2.5濃度預測值.因受篇幅限制,本文僅給出如圖5~圖6所示的小河沿監測點測試集預測值對比圖.

圖5 2016年12月小河沿監測點PM2.5濃度預測值對比

Fig.5 Comparison of predicted PM2.5concentration in Xiaoheyan monitoring site in December 2016

由多種方法預測結果對比圖可知:(1)不劃分氣象類型時的預測值平緩,與實際值變化趨勢整體吻合,但無法識別由惡劣氣象條件導致的短期峰-谷值;(2)聚類氣象分類下的預測結果不符合實際值變動趨勢,多出現異動;(3)回歸樹氣象分類SVM模型由于未使用時間序列模型擬合下降趨勢,導致預測值平均偏高幅度超10μg/m3,部分采暖期單日被高估49μg/m3,非采暖期中58%的優等級測試日被錯判為良等級;(4)回歸樹氣象分類ARIMA+ SVM組合預測結果更接近實際值,對峰-谷值的識別能力明顯提高,尤其在受關注的重污染天氣預測效果更好.

圖6 2017年6月小河沿監測點PM2.5濃度預測值對比

3 預測效果評價

為進一步證明使用回歸樹氣象分類下的ARIMA+SVM組合模型預測沈陽市PM2.5濃度的合理性,評價模型預測效果,本文使用均方根誤差(RMSE)、平均絕對誤差(MAPE)、與實際值相關系數(r)3項指標,對不分氣象類型的SVM預測、聚類分析氣象分類SVM預測、回歸樹氣象分類SVM預測、回歸樹氣象分類ARIMA+SVM預測4個模型進行精度評價及對比.上述評價指標分別滿足等式(8~10).除上述統計學指標外,本文也使用廣泛應用于空氣質量預報實際工作中的指數分級法判斷預報正確率()[3].

由如表4所示的預測精度對比情況可知:采暖期中,回歸樹氣象分類下的ARIMA+SVM組合預測模型的均方根誤差均值最低,相關系數達到0.731,說明預測值與實際值顯著相關,正確率均值明顯高于其他模型;而且組合模型對太原街、文化路等城中心區域監測點的預測效果更好.非采暖期中,組合模型的均方根誤差最低,平均絕對誤差僅為0.412,預測正確率更高,相關系數略低于不分氣象類型預測方法.

沈陽市現有的空氣質量數值預報模型,在非采暖期的未修正預報正確率不足5%,使用污染物濃度觀測值進行人工修正后正確率可達到約60%[32].本文所構建的ARIMA+SVM組合預測模型,無人工修正過程,采暖期綜合正確率為51.20%,預報等級偏差超過一級的日數僅占3.20%;非采暖期綜合正確率達到61.20%,不存在預報等級偏差超過一級的情況.綜上所述,回歸樹氣象分類下的ARIMA+SVM模型預測效果明顯優于其他方法.

目前,本文所構建的組合模型已實現為在線空氣質量預測預警系統,并實際應用于本溪、咸陽等城市,均取得了良好的預測效果.但由于受到數據可得性的限制,未能使用小時尺度數據對模型精度做進一步提升,導致在氣候及濃度波動顯著的自然日中,使用日均值數據得到的預測結果可能偏離實際值,且無法反映1h濃度波動趨勢.另外,使用沈陽市地面站氣象數據進行全市9個監測點的濃度預測,忽略了監測點間氣象要素的差異,可能使預測結果存在一定偏差.未來在獲取相應數據后,可對結果進行優化.

表4 模型預測精度對比

4 結論

4.1 構建回歸樹氣象分類下的ARIMA+SVM組合模型,對PM2.5濃度日均值進行預測,預判重污染日期.在預測之前依據影響污染物擴散的氣象條件,對各日進行氣象分類,將主-客觀因素分開,以核定空氣質量管理工作的績效水平,計算污染源減排貢獻率.

4.2 對采暖期與非采暖期各自使用回歸樹方法,利用相對濕度、氣壓、風速等要素進行組合氣象分類,根據PM2.5濃度均值劃分等級.

4.3 以沈陽市為例進行實證分析.在采暖期,氣象分類下的ARIMA+SVM組合模型的平均絕對誤差小于0.6,與實際值相關系數大于0.7,正確率均值大于0.5;在非采暖期,組合模型的平均絕對誤差約為0.4,與實際值相關系數約為0.5,正確率均值大于0.6.

[1] Tao J, Zhang L M, Zhang Z S, et al. Control of PM2.5in Guangzhou during the 16th Asian Games period: Implication for hazy weather prevention [J]. Science of the Total Environment, 2015,508:57-66.

[2] 孫寶磊,孫 暠,張朝能,等.基于BP神經網絡的大氣污染物濃度預測 [J]. 環境科學學報, 2017,37(5):1864-1871.

[3] 薛文博,付 飛,王金南,等.中國PM2.5跨區域傳輸特征數值模擬研究 [J]. 中國環境科學, 2014,34(6):1361-1368.

[4] 雷孝恩,韓志偉,張美根,等.城市空氣污染數值預報模式系統 [M]. 北京:氣象出版社, 1998:15-18.

[5] 張藝耀,苗冠鴻,閆劍詩,等.影響PM2.5因素的多元統計分析與預測 [J]. 資源節約與環保, 2013,(11):135-136.

[6] 尹建光,彭 飛,謝連科,等.基于小波分解與自適應多級殘差修正的最小二乘支持向量回歸預測模型的PM2.5濃度預測研究 [J/OL]. 環境科學學報:1-15[2018-03-13].https://doi.org/10.13671/j.hjkxxb. 2018.0093.

[7] 謝 超,馬民濤,于肖肖.多種神經網絡在華北西部區域城市空氣質量預測中的應用 [J]. 環境工程學報, 2015,9(12):6005-6009.

[8] 黃 思,唐 曉,徐文帥,等.利用多模式集合和多元線性回歸改進北京PM10預報 [J]. 環境科學學報, 2015,35(1):56-64.

[9] 陳亞玲,趙智杰.基于小波變換與傳統時間序列模型的臭氧濃度多步預測 [J]. 環境科學學報, 2013,33(2):339-345.

[10] 陳 軍,高 巖,張燁培,等.PM2.5擴散模型及預測研究 [J]. 數學的實踐與認識, 2014,44(15):16-27.

[11] 周 麗,徐祥德,丁國安,等.北京地區氣溶膠PM2.5粒子濃度的相關因子及其估算模型 [J]. 氣象學報, 2003,61(6):761-768.

[12] 王黎明,吳香華,趙天良,等.基于距離相關系數和支持向量機回歸的PM2.5濃度滾動統計預報方案 [J]. 環境科學學報, 2017,37(4):1268- 1276.

[13] 李 龍,馬 磊,賀建峰,等.基于特征向量的最小二乘支持向量機PM2.5濃度預測模型 [J]. 計算機應用, 2014,34(8):2212-2216.

[14] 胡玉筱,段顯明.基于高斯煙羽和多元線性回歸模型的PM2.5擴散和預測研究 [J]. 干旱區資源與環境, 2015,29(6):86-92.

[15] Tai A P K, Mickley L J, Jacob D J. Correlations between fine particulate matter PM2.5and meteorological variables in the United States: Implications for the sensitivity of PM2.5to climate change [J]. Atmospheric Environment, 2010,44:3976-3984.

[16] Pateraki S, Asimakopoulos D N, Flocas H A, et al. The role of meteorology on different sized aerosol fractions PM10, PM2.5PM2.5-10[J]. Science of the Total Environment, 2012,419:124-135.

[17] 羅新蘭,劉 源.沈陽地區相對濕度與PM2.5濃度對能見度的影響分析 [J]. 科學技術與工程, 2017,17(13):115-119.

[18] 楊 欣,陳義珍,劉厚鳳,等.北京2013年1月連續強霾過程的污染特征及成因分析 [J]. 中國環境科學, 2014,34(2):282-288.

[19] 曾 靜,王美娥,張紅星.北京市夏秋季大氣PM2.5濃度與氣象要素的相關性 [J]. 應用生態學報, 2014,25(9):2695-2699.

[20] 王嫣然,張學霞,趙靜瑤,等.北京地區不同季節PM2.5和PM10濃度對地面氣象因素的響應 [J]. 中國環境監測, 2017,33(2):34-41.

[21] 朱倩茹,劉永紅,徐偉嘉,等.廣州PM2.5污染特征及影響因素分析,中國環境監測, 2013,29(2):15-21.

[22] 嚴文蓮,周德平,王揚峰,等.沈陽冬夏季可吸入顆粒物濃度及尺度譜分布特征 [J]. 應用氣象學報, 2008,19(4):435-443.

[23] 付桂琴,張杏敏,尤鳳春,等.氣象條件對石家莊PM2.5濃度的影響分析 [J]. 干旱氣象, 2016,34(2):349-455.

[24] 曾乃暉,袁艷平,孫亮亮,等.基于聚類分析法的空氣源熱泵輔助太陽能熱水系統氣象分類研究 [J]. 太陽能學報, 2017,38(11):3067- 3076.

[25] 姜明輝,王 歡,王雅林.分類樹在個人信用評估中的應用 [J]. 商業研究, 2003,(21):86-88.

[26] 傅傳喜,馬文軍,梁建華,等.高血壓危險因素logistic回歸與分類樹分析 [J]. 疾病控制雜志, 2006,10(3):256-259.

[27] 楊 敏,丁 劍,王 煒.基于ARIMA-SVM模型的快速公交停站時間組合預測方法 [J]. 東南大學學報(自然科學版), 2016,46(3):651- 656.

[28] 劉 杰,楊 鵬,呂文生,等.模糊時序與支持向量機建模相結合的PM2.5質量濃度預測 [J]. 北京科技大學學報, 2014,36(12):1694- 1702.

[29] 謝驍旭,袁兆康.基于R的江西省肺結核發病率ARIMA-SVM組合預測模型 [J]. 中國衛生統計, 2015,32(1):160-162.

[30] 王佳敏,張紅燕.基于ARIMA-SVM組合模型的移動通信用戶數預測 [J]. 計算機時代, 2014,(9):12-15+17.

[31] 程昌品,陳 強,姜永生.基于ARIMA-SVM組合模型的股票價格預測 [J]. 計算機仿真, 2012,29(6):343-346.

[32] 李曉嵐,馬雁軍,王揚鋒,等.基于CUACE系統沈陽地區春季空氣質量預報的校驗及修正 [J]. 氣象與環境學報, 2016,32(6):10-18.

ARIMA-SVM combination prediction of PM2.5concentration in Shenyang.

SONG Guo-jun1, GUO Xiao-dan1*, YANG Xiao1, LIU Shuai2

(1.School of Environment, Renmin University of China, Beijing 100872, China;2.Agricultural Management Institute of the Ministry of Agriculture and Rural Affairs, Beijing 102208, China)., 2018,38(11):4031~4039

Firstly, meteorological types of heating period and non-heating period were classified using the method of regression tree classification, and meteorological types which are likely to cause severe pollution were identified. Secondly, the daily mean value prediction model of PM2.5concentration of different meteorological types was established using the combination of Autoregressive Integrated Moving Average Model and Support Vector Machine (ARIMA+SVM), which takes the emission of pollution sources as independent variables. In this paper daily mean PM2.5concentration of 9environmental monitoring points with continuous data in Shenyang during Jan 2013 to June 2017 was analysed. The results show that, compared with ordinary machine learning model without weather classification, the prediction of daily mean PM2.5concentration using ARIMA+SVM combined model based on meteorological classification has a better agreement with actual value, and its ability to identify the peak and valley values is much stronger. In heating and non-heating period, this combined model has the advantages of lower average error and higher prediction accuracy.

PM2.5concentration;meteorological classification;ARIMA+SVM combination model;prediction method

X513

A

1000-6923(2018)11-4031-09

宋國君(1962-),男,黑龍江東寧人,教授,博士,主要從事環境政策管理研究.發表論文200余篇.

2018-04-04

國家重點研發計劃項目(2017YFC0212500)

* 責任作者, 博士研究生, 15811440711@163.com

猜你喜歡
采暖期沈陽市監測點
保定市滿城區人大常委會為優化營商環境固定監測點授牌
沈陽市汽車工程學校
天津南港LNG接收站沉降監測點位布設
撫河流域綜合治理監測布局優化
采暖期與非采暖期青島市區PM2.5組分特征及來源分析
烏海市采暖期變化特征及氣象節能潛力分析
河北省冬季氣溫變化對采暖期的影響
全站儀極坐標法監測點穩定性分析方法研究
愛是逐夢的翅膀
集中供暖與非集中供暖城市的冬季大氣污染狀況
——以天津和上海為例
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合