?

基于CiteSpace知識圖譜分析的露天礦粉塵濃度預測研究進展與展望

2023-08-01 05:49肖雙雙馬亞潔李衛炎
西安科技大學學報 2023年4期
關鍵詞:露天礦粉塵預測

肖雙雙,馬亞潔,李衛炎,劉 錦

(1.西安科技大學 能源學院,陜西 西安 710054;2.浙江交通資源投資集團有限公司,浙江 杭州 310020)

0 引 言

露天礦產塵點多、粉塵量大、擴散范圍廣,影響職工健康,加速設備磨損,影響生產效率和生產安全,污染周邊生態環境。露天礦粉塵職業危害已成為礦山領域最重要的職業健康問題,并產生較大的社會影響。在國家加快推進生態文明建設、大力推進綠色礦山建設的背景下,露天礦粉塵防控已成為亟待解決的重大行業問題[1]。為更精準高效的開展粉塵防治工作,需要對各產塵點的粉塵濃度進行精準預測,粉塵濃度預測是實施粉塵污染防治的前提,是指導各類防治措施的實施準則。如何從產塵環節中挖掘關鍵的特征因素,建立有效的粉塵濃度預測模型,近年來已經成為國內外的研究共識和熱點。

國內外學者通過理論分析、現場監測等研究了溫度、濕度、風速、風力、風向、剝離量、采煤量等因素對粉塵濃度的影響,選取風速、風向、溫度、濕度、產煤量、剝離量等指標建立粉塵濃度預測指標體系,采用時間序列、線性回歸、灰色理論、人工神經網絡、支持向量機、求和自回歸移動平均-廣義神經網絡回歸(ARIMA-GRNN)組合算法、灰色-廣義回歸神經網絡(GM-GRNN)組合算法等構建了多種粉塵濃度預測模型,能夠對粉塵濃度的發展趨勢做出大致預測。為提高粉塵濃度預測的準確率,一些學者在模型預測方法的研究中不局限于單一傳統的數學算法預測,而是逐漸引入機器學習,采用生物智能優化算法結合機器學習建立粉塵濃度預測模型,如粒子群-BP神經網絡(PSO-BP)組合預測模型[2]。但是隨著各種方法模型的不斷涌現,在粉塵濃度預測模型的研究現狀與發展趨勢方面的評述較少,預測方法的現狀和演進趨勢仍然不清楚。近年來文獻計量分析已在多個學科中應用,發文量呈逐年遞增的趨勢,基于文獻計量學分析露天礦粉塵濃度預測研究現狀與展望,檢索并梳理國內外相關研究進展,有利于充分了解露天礦粉塵濃度預測的研究現狀,分析粉塵濃度與各類影響因素之間的關系,正確、有效的開展粉塵預測研究工作,幫助露天礦更好的制定粉塵防治策略。

因此,基于CNKI和Web of Science收錄的526篇粉塵濃度預測相關文獻,采用CiteSpace與VOSviewer知識圖譜可視化軟件進行統計分析及數據挖掘,揭示粉塵濃度預測的研究熱點、研究方法和發展過程,系統歸納了露天礦粉塵濃度影響因素、指標體系的研究現狀,梳理了粉塵濃度預測方法隨時間的演進趨勢,提煉出預測方法的4大類型,并分類展開詳述,提出露天礦粉塵濃度預測研究展望,以期為露天礦粉塵濃度預測的深入研究提供參考。

1 基于文獻檢索的研究脈絡分析

1.1 研究方法與數據來源

為對粉塵濃度預測的研究現狀和發展趨勢進行詳細分析,通過對近40 a國內外粉塵濃度預測相關的文獻進行檢索,檢索方法如下。

數據來源:中國知網(CNKI)、Web of Science(WOS)。

檢索區間:1981年1月1日—2022年12月31日。

檢索主題:SU=“粉塵濃度預測”+“PM2.5濃度預測”+“濃度預測模型”。

研究方法:計量學、可視化分析。

運行環境:VOSviewer、CiteSpace。

共檢索到文獻526篇(CNKI 389篇、WOS 137篇),研究“礦山粉塵預測”的相關文獻共220篇(CNKI 40篇、WOS 180篇),研究“露天礦粉塵預測”的相關文獻共48篇(CNKI 9篇、WOS 39篇),由于不同領域的粉塵濃度預測方法類似、指標體系不同,為全面歸納粉塵濃度預測方法發展動態,基于526篇文獻,運用CiteSpace、VOSviewer軟件從文獻計量學的角度生成研究內容的高頻關鍵詞的聚類圖譜和演化趨勢圖譜,對1981年—2022年的粉塵濃度預測相關研究熱點進行可視化分析。

1.2 文獻數量動態變化

國內外關于粉塵濃度預測的研究領域發表成果及發展趨勢,如圖1所示,2013年以前該領域研究論文數量較少,PM 2.5、粉塵濃度預測論文發表數量每年基本保持在1~2篇,2014—2018年該領域發文量開始增加,中英文文獻數量分別維持在每年25篇左右,總體上論文數量呈上升趨勢,隨著計算機科學技術的迅速發展,人工智能、機器學習、大數據技術等的興起,與計算機技術進行學科交叉的方法技術不斷應用于各行業領域,自2019年起發文量顯著增加,文獻數量增長主要體現在基于機器學習的智能預測方法。

1.3 檢索文獻的計量分析

1.3.1 高頻熱點關鍵詞

關鍵詞代表著文獻研究主題,利用VOSviewer對關鍵詞進行統計分析,如圖2、圖3所示。圖中不同顏色代表不同的研究主題,節點的大小代表該研究內容共現頻率的高低,線條的粗細代表研究內容的關聯強度。從圖2、圖3可以看出,在粉塵濃度預測方面,PM 2.5、預測模型、神經網絡、機器學習、粒子群優化、組合預測等關鍵詞出現頻率較高,這些關鍵詞體現了研究的熱點主題。

圖2 中文文獻高頻關鍵詞共現網絡Fig.2 Network of high-frequency keyword co-occurrence in Chinese literature

1.3.2 聚類主體分析

基于CiteSpace軟件的K值聚類分析,設定參數K=10,提取10個聚類團,生成粉塵濃度預測研究關鍵詞聚類圖譜,如圖4所示。

圖4 粉塵濃度預測研究關鍵詞聚類Fig.4 Keyword cluster in dust concentration prediction study

粉塵濃度預測研究大致可分為:環境影響因素、預測模型(時間序列、神經網絡、灰色模型),模型優化(機器學習)、預測控制、結果影響(塵肺病)10大聚類團,基于機器學習的模型優化預測是該領域研究的主流。

1.3.3 關鍵詞聚類的時區演化

運用CiteSpace可視化分析軟件提取1~7個高頻關鍵詞,該時間軸主要針對該領域研究熱點與發展趨勢進行分析,從時間軸可看出,早期的研究方法主要為壽命表法、灰色理論、線性預測等傳統方法。隨著大數據、人工智能的發展,自1995年后,運用神經網絡、支持向量機等機器學習算法預測粉塵濃度逐漸成為新的研究熱點,從2005年起,基于粒子群算法、遺傳算法、蟻群算法等優化算法的組合預測模型逐漸取代BP神經網絡、支持向量機等單一的預測模型,如圖5所示。

圖5 粉塵濃度預測研究熱點時間軸Fig.5 Spot timeline for dust concentration prediction

2 露天礦粉塵濃度預測研究現狀

粉塵濃度預測過程主要是通過對現場監測到的數據進行收集和預處理,根據數據特征采用合適的預測算法建立粉塵濃度預測模型,確定其模型參數,分析影響粉塵濃度的關鍵因素,通過優化算法調整優化其參數,對結果進行修正,提高預測結果的準確率,如圖6所示。粉塵濃度預測的核心包括選取粉塵濃度影響因素,構建粉塵濃度預測指標體系,建立粉塵濃度預測模型[2]。

圖6 粉塵濃度預測過程描述Fig.6 Description of the dust concentration prediction process

2.1 粉塵濃度影響因素和預測指標體系

露天礦作業的每個環節都伴隨著粉塵的產生,露天礦作業環境敞露于地表,鉆孔、爆破、采裝、運輸、排卸各環節都會產生大量粉塵,由此帶來的粉塵污染更為嚴重。產塵量與所用機械設備類型、生產強度、巖石性質、開采方法以及自然條件等眾多因素有關。目前,國內外學者通過理論分析、現場監測等研究了溫度、濕度、風速、風力、風向、剝離量、采煤量等因素對粉塵濃度的影響。如WANG等對西北哈爾烏素露天煤礦的粉塵污染進行了分析,得出影響粉塵濃度的因素順序為:產煤量>邊界層高度>風速>溫差>溫度>濕度[3]。QI等在對影響PM濃度的重要性分析時,除當前PM濃度受前5 min PM濃度的影響外,其他影響因素順序為:濕度>溫度>噪聲級>風速>風向[1]。LI等對TSP濃度預測時根據影響因素的重要程度分配權重,結果顯示TSP在08∶00~09∶00期間最高,在15∶00~16∶00期間最低。分析其原因主要影響因素為:氣象參數、正常作業以及逆溫層[4]?;粑牡确治鎏卣髯兞恐匾?認為環境影響因素中,濕度對粉塵濃度影響最大,其次是溫度、噪聲,風速、風力及風向影響較小,如圖7所示[4]。CHINTHALA等通過結合風穿透效應,研究了風侵角和擴散系數對PM10濃度的影響,研究表明風侵角隨露天礦深度的變化對PM 10截留有顯著影響[5]。

圖7 粉塵濃度影響因素重要性[6]Fig.7 Importance of factors affecting dust concentration

露天礦的生產塵源主要來自鉆孔、爆破、采裝、運輸、排卸等作業環節。在鉆孔作業下,粉塵顆粒由孔底高速噴出孔口而產生高濃度粉塵;爆破環節礦巖爆破瞬間會在爆區周圍產生濃度極高的粉塵顆粒,污染周邊環境。采裝、運輸、排卸等環節因礦巖間摩擦碰撞和道路運輸產生大量的揚塵。一般認為剝離量和采煤量越大,即生產強度越大,產塵量就越大。

溫度對粉塵濃度的影響主要由逆溫現象導致空氣流動性受阻,溫度較低時,粉塵無法擴散,造成嚴重的空氣污染。一般濕度越大空氣中水分子含量越多,空氣相對濕度對粉塵濃度預測結果有顯著影響。風速、風力是粉塵擴散速度的直接影響因素,在露天礦采場內部,較小的風速也可能產生揚塵,增加空氣中粉塵濃度。風向影響粉塵擴散方向,具有隨機性和不確定性。

因此,生產強度大小決定了產塵量的多少,氣象因素決定粉塵的聚集與擴散。根據影響因素選擇預測指標,建立粉塵濃度預測指標體系是粉塵濃度精準預測的關鍵。目前,該指標體系主要分為氣象類指標和生產類指標2大類。氣象類指標包括風速、風向、溫度、濕度等;生產類指標包括產煤量、剝離量、生產噪聲等[7],如圖8所示。

2.2 粉塵濃度預測方法

計量學可視化分析得出粉塵濃度預測方法主要是沿著早期的壽命表、宏觀測算、經驗類比法等傳統方法發展為時間序列、線性回歸、灰色理論等方法,再延伸至近年的人工神經網絡、隨機森林、支持向量機以及生物智能算法優化機器學習等組合方法的研究脈絡發展的?;诳梢暬治鼋Y果,將粉塵濃度預測相關方法進行歸類,系統的分析對比各方法的特點和適用范圍,將應用次數較高的預測方法和模型進行匯總,見表1。目前的粉塵濃度預測方法分為定性和半定量預測、線性回歸預測、機器學習預測以及組合預測4大類。

2.2.1 定性和半定量預測

壽命表、宏觀測算、經驗類比法為傳統預測方法。傳統預測方法大致可分為定性預測和半定量預測2種,在定性預測方法的應用中,王美霞等采用職業衛生調查、類比法、經驗法預測了擬建項目的噪聲與粉塵職業病危害因素預期接觸水平,根據預測結果采取相應防護控制措施[8]。韓磊等通過分析煤礦污染變化趨勢、煤工塵肺患者發病特征、暴露水平與發病的關系,掌握煤工塵肺病發病規律,對煤工塵肺未來發病情況做出預警預測[9]。

在半定量預測方法的研究中,陳春生等在壽命表法的基礎上增加了肺內石英粉塵負荷量估算法對鐵路隧道工現場粉塵容許濃度進行了估算,并對該方法的數據處理部分稍加改進,將累積發病率取了逆正態分布函數后再建立的方程,使得結果更加符合實際應用[10]。沈陽等運用貝葉斯決策分析技術評估某高速公路隧道掘進工粉塵累計暴露情況,并估計決策分析最小樣本數。得出該高速隧道掘進工暴露矽塵濃度超標嚴重,基于粉塵測定的貝葉斯決策分析技術可實現累計暴露預測及最少檢測樣本估算[11]。GHOSE等針對粉塵排放源展開研究,使用排放因子或預測方程對不同采礦活動粉塵排放進行量化,重點介紹了本研究在環境保護領域的重要性以及該研究可能產生的影響,得出結論:得以估計的產塵量可以適當評估對空氣質量的影響,并制定適當的空氣污染控制策略[12]。BALAGA等提出并開發一種基于冪函數的粉塵濃度預測算法功能模型,可針對不具經驗數據的粉塵分布狀態進行預測,建立PM10、PM4和PM2.5粉塵顆粒的分布特征,該模型適用范圍廣,不受粉塵粒徑大小以及粉塵源距離限制,為礦山工作者提供更安全高效的粉塵防治策略[13]。TRIPATHY等重點介紹礦井不同作業區域的粉塵水平監測、不同來源收集的粉塵表征、粉塵的個人暴露情況,采用AERMOD軟件對礦井不同位置和附近區域的粉塵濃度進行了預測[14]。傳統方法如粉塵健康風險評估大多基于定性或者半定量的方法,缺少粉塵暴露的連續性監測,不能在風險概率的基礎上進行定量評估,使得粉塵長期累積暴露評估客觀性下降。以上宏觀預測模型僅僅能夠反映出預測對象的主要變動趨勢,因此傳統的預測方法在需求數據波動較大的復雜環境下逐漸被其他更好的方法取代。

2.2.2 線性回歸預測模型

粉塵預報早期常用理論方法,包括函數解算法和圖像查找法。隨后有學者開始采用統計模型來預測預報,如張志偉等采用灰色理論的預測方法,建立了降塵含量的GM生成函數預測模型,對邯鄲市工業居民混合區降塵含量歷年的變化規律進行預測研究[15]。陳日輝等用粉塵濃度統計值建立GM模型,對原始數據進行了滑動平均處理,該模型預測結果相對誤差較小[16]。曹玉珍等結合灰色預測模型以及模型的預測結果檢驗評估,以MATLAB語言編寫為開源程序,對廣州市降塵量進行預測分析,結果與實際情況相符,該程序可應用于不同指標或同一指標不同時段的建模和模型檢驗過程,為灰色模型在各個領域的廣泛應用提供了幫助[27]。

GM灰色理論、直線回歸等方法一般適用于線性趨勢預測,因此,不適合對波動較大的數據進行預測;對于非線性和不穩定的數據,還需要預測模型具有較強的非線性映射能力。如王月紅等以某礦粉塵濃度時間序列為基礎,提出了差分自回歸移動平均預測模型,建立ARIMA粉塵濃度預測模型,該模型適用于非平穩數據的處理。得到初步模型后,根據貝葉斯信息準則對比模型的優劣,選擇最優模型提高預測精度[18]。毛煒嶧等通過對常規的回歸分析方法加以改進,綜合滑動相關理論以及集合回歸方法建立超級集合模型,利用反推法逐級尋找與沙塵日數序列有顯著統計關系的前期環流因子,得出它們之間的關系,為塔里木盆地多發季節沙塵日數的預測提供依據[19]。礦井產量與粉塵排放量之間的線性關系較弱,采用非線性方法建立模型可以提高結果的準確率。

2.2.3 機器學習預測模型

在機器學習算法的應用中,任屹罡等建立了BP神經網絡模型對鄭州環境空氣中粉塵濃度PM10進行預測,以平均氣壓、平均氣溫、平均相對濕度和平均風速這4類氣象因子來預測,得到預測結果的準確率可達86.85%[20]。王布川采用LMBP神經網絡對煤巷綜掘工作面的粉塵濃度進行了預測,結果顯示預測值誤差在±10%以內,預測結果可靠[21]。李德根等通過分析各產塵因素對截割粉塵濃度的影響,建立基于熵權法的RBF神經網絡模型,分析掘進工作面截割粉塵濃度的變化規律。結果表明:熵權法RBF神經網絡可以準確預測掘進工作面粉塵濃度[22]。李明等在對粉塵影響因素分析的基礎上,建立了粉塵SiO2含量、粉塵濃度、接塵時間與塵肺發病率之間的關系,運用人工神經網絡技術來實現粉塵危害三因素與塵肺病發病率之間的劑量-反應關系,對數據進行訓練學習,參數進行選擇調整,建立了粉塵模擬和預測模型[23]。單純用線性模型或非線性模型會導致信息源不廣泛問題,合適的組合模型可更好地發掘數據的潛在關系,提高模型的預測精度和穩定性,如圖9所示。

2.2.4 組合預測模型

人工神經網絡算法雖然能夠處理非線性、非平穩數據,但易陷入局部最優,且易導致過擬合現象。隨著數據增加,冗余性問題也將制約預測精度和計算效率(圖10)。在多種方法綜合預測模型的研究中,王永斌等分別建立GM(灰色系統)模型、BPNN(反向傳播網絡)模型、GM-GRNN(灰色-廣義回歸神經網絡)組合模型對我國塵肺病發病人數進行預測,并根據誤差分析對比3種模型的預測效果,結果表明,GM(1,1)-GRNN組合模型的擬合及預測效果優于GM(1,1)模型和BPNN模型[25],也是首次將多種智能算法相結合使用。

卞子龍等基于求和自回歸移動平均模型(ARIMA)與灰色模型GM(1,1)、廣義神經回歸網絡模型(GRNN)的分別組合,構建適合江蘇省塵肺病預測的組合模型。通過對比擬合分析ARIMA預測模型、ARIMA-GM組合模型、ARIMA-GRNN組合模型的誤差值得出,在江蘇省塵肺病新病例預測中ARIMA-GRNN模型誤差最小,擬合效果最好[26]。周旭等采用時間序列和神經網絡相結合的外因輸入非線性自回歸模型(NARX模型)來預測粉塵濃度和時間的關系,該模型適用于時序型數據,可以給不同時段的輸入之間建立聯系[27]。劉杰等提出了一種結合弱化緩沖算子優化的分數階累加灰色(FGM)預測模型,對廢氣中煙(粉)塵排放濃度的變化進行預測和擬合,并對比分析GAWBO和AWBO以及WAWBO 3種弱化緩沖算子處理后得到的預測結果,發現運用WAWBO算法優化過的FGM模型預測的數據精度高、誤差低,結果與實際煙(粉)塵排放情況更符[28],如圖11所示。張易容通過建立傳統回歸、隨機森林、LSTM循環神經網絡預測模型,選取時間因子、氣象因子及采裝強度作為輸入變量,預測哈爾烏素露天煤礦PM2.5濃度值,結果表明LSTM循環神經網絡預測模型效果較好[29]。王雅寧采用決策樹、馬爾科夫等算法知識,構建了屬于露天礦的隨機森林-馬爾科夫粉塵濃度預測模型,通過馬爾科夫修正后的預測結果精度較高[30]。

圖11 弱化后擬合值對比Fig.11 Comparison of the weakened fitting values

3 露天礦粉塵濃度預測研究展望

國內外學者對露天礦粉塵預測進行了大量的研究,取得了豐富的成果,為后續研究提供重要的參考。綜合考慮露天礦粉塵產塵機理、物化特征、影響因素等,構建完善露天礦粉塵濃度預測研究體系,如圖12所示,尚有以下問題需深入研究。

圖12 露天礦粉塵濃度預測研究體系Fig.12 Research system of open-pit mine dust concentration prediction

1)礦山尤其是露天礦礦山產塵點多、產塵量大、粉塵濃度大、擴散范圍廣,影響粉塵濃度的因素眾多,了解掌握影響粉塵濃度的主要因素是粉塵濃度精準預測的關鍵。根據氣象理論、粉塵擴散機理,運用人工智能、大數據分析、機器學習的方法對粉塵濃度影響因素進行深入挖掘分析,揭示影響粉塵濃度的關鍵因素,構建科學的粉塵濃度預測指標體系。

2)影響粉塵濃度的因素眾多,且數據波動較大,粉塵環境具有不確定性、時變性、非線性,僅使用現行的、單一的模型對粉塵濃度進行預測,難以獲得最優解。將多種智能預測算法與優化算法相結合,構建粉塵濃度預測智能模型,并根據預測場景、數據特征進行參數優化,提高預測精度。

3)采用各種非線性的預測方法結合智能優化算法對模型的參數進行優化調整,檢驗模型預測效果,提高結果的可靠性,并增強模型的魯棒性,以期獲得更好的預測效果。

4)推廣應用各類粉塵預測模型并評估其預測精度、優勢及不足,為預測模型優化提供參考。

4 結 論

1)PM2.5、預測模型、神經網絡、機器學習、粒子群優化、組合預測為粉塵濃度預測方面的研究熱點,基于機器學習的模型優化預測是該領域研究的主流,基于優化算法的組合預測模型逐漸取代單一預測模型。

2)在粉塵濃度影響因素及預測指標體系方面,生產強度大小決定了產塵量的多少,氣象因素決定粉塵的聚集與擴散。粉塵濃度預測指標主要包括氣象類指標和生產類指標2大類。氣象類指標包括溫度、濕度、風速、風向等,生產類指標包括剝離量、采煤量等。

3)在粉塵濃度預測方法方面,基于可視化分析結果,將目前的粉塵濃度預測方法分為定性和半定量預測、線性回歸預測、機器學習預測以及組合預測4大類,系統分析對比了各類方法的特點和適用范圍。當下主流的預測方法為基于機器學習、生物智能算法優化的組合預測模型。

4)國內外在露天礦粉塵預測研究方面取得了豐碩的成果,相關理論方法不斷革新,但仍存在粉塵濃度影響因素缺乏深度挖掘、粉塵濃度預測指標主觀選取、預測方法單一不變等問題。應積極引入大數據、人工智能等新方法新技術,不斷提升粉塵濃度預測的科學性和準確性。

猜你喜歡
露天礦粉塵預測
無可預測
選修2-2期中考試預測卷(A卷)
選修2-2期中考試預測卷(B卷)
高壓粉塵防爆電機過厚粉塵層的形成與分析
備戰鐵礦露天礦與掛幫礦同時開采穩定性研究
露天礦山土石方量的測量及計算
粉塵大戰
光散射法粉塵儀在超低排放的應用
不必預測未來,只需把握現在
基于Delphi-TOPSIS法的露天礦采區接續方案優選
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合