?

基于大數據的煤礦安全監控預警平臺研究

2018-11-12 03:13韓建萍
數字通信世界 2018年10期
關鍵詞:煤礦安全標簽預警

韓建萍

(山西能源學院,太原 030600)

隨著信息通信技術的快速發展和信息化系統的建設,煤礦企業已經采集和積累了大量的數據。這些數據的有效處理和分析在煤礦安全生產中發揮著重要作用[1-3]。已有研究中,通過統一規劃和建設,文獻[4-5]已經實現了多個專業信息平臺的數據共享,文獻[6-8]已經實現了大量多源異構數據的分析,并應用到煤礦安全管理[8]。但是,已有研究中,不同時間尺度采樣所獲取的數據未得到充分挖掘和有效利用,尤其是歷史數據的規律性研究、歸檔等大數據分析工作的成果與實時監控數據的聯合分析能力需要進一步提高。為解決這個問題,本文提出了一種基于大數據的煤礦安全監控預警平臺,有效地將大數據技術應用到了煤礦安全管理中。在數據處理層,本文提出了一種基于標簽的單因素與多因素分級共享的大數據開放引擎架構,將實時數據與歷史數據進行聯合分析和挖掘,實現了分析模型的共享使用。根據真實應用場景下平臺的性能要求,設計了煤礦安全監控預警平臺的技術選型和技術架構。

1 功能需求分析

通過對已有研究分析可知,當前產生煤礦安全事件主要原因包括設備故障、管理失誤、環境因素超標、從業人員操作失誤等[2,6,7]。其中,管理失誤、從業人員操作失誤屬于規范化管理范疇。本文主要研究如何對設備故障、環境因素超標進行實時預警,從而減少煤礦安全事故的發生。為了實現不同時間尺度采樣所獲取數據的充分挖掘和有效利用,本文提出了基于大數據的煤礦安全監控預警平臺建設的原則為:事前實時預警,防患于未然;事后分析總結教訓,杜絕再次發生;采用人工智能和大數據技術,實現快速智能化預警。

基于此,通過分析煤礦事故發生的因素,根據我國煤礦信息化水平和安全管理特點,確定了基于大數據的煤礦安全監控預警平臺的功能需求包括:一是需要實現煤礦安全監控的數據采集和管理;二是需要實現煤礦安全事故的快速智能化預警。

2 平臺架構

為滿足平臺的功能需求,通過分析煤礦事故發生的因素,本文設計了基于大數據的煤礦安全監控預警平臺,平臺架構如圖1所示,包括數據采集層、數據優化層、數據處理層、數據應用層。

在數據采集層,通過與環境監控平臺、設備監控平臺、安全風險監控平臺、井下傳送平臺等系統對接,實現毫秒級的數據采集,以便實時監控設備運行狀態。需要采集的煤礦安全生產相關實時數據主要包括環境類數據、機器設備類數據。環境類數據主要包括瓦斯數據、空氣含量數據、煤礦壓力數據、煤礦水資源數據、電磁輻射數據、工作面開采速度等實時數據。機器設備類數據主要包括各種設備的功率數據、溫度數據、使用時長等實時數據。為了更好地進行數據分析,需要獲得采煤技術和操作規范等基礎數據、區域地理和地質等基礎數據、人員和設備基礎信息等煤礦安全生產相關的基礎數據作為輔助參考因素。

圖1 基于大數據的煤礦安全監控預警平臺

在數據優化層,主要實現數據的存儲、清洗、轉換??紤]到數據的類型多樣、數據采集時間較短等特點,在數據存儲時,采用分布式文件平臺、NoSql數據庫,確保數據存儲平臺的實時性和可靠性。在數據清洗時,采用填補空缺數據、平滑噪聲數據、識別異常值等措施,確保數據的可用性。在數據轉換時,通過制定數據轉換的標準,明確煤礦數據交換內容和交換協議,將多個數據源的數據合并成一致的、無冗余的數據存儲。

在數據處理層,采用統計分析、機器學習、數據挖掘等技術和算法,基于設備、環境的實時數據、歷史數據,通過建立事故分析模型、可靠性評價模型、預警模型等,實現數據的統計分析和挖掘。為了提高數據處理結果的共用性并實現實時預警,根據煤礦安全事件的歷史數據和相關因素,對設備、環境等建立標簽,便于快速響應和發現安全隱患。數據處理層將在下一節進行詳細描述。

在數據應用層,通過分析煤礦安全事件的關聯關系,基于數據處理層的數據分析模型,實現煤礦安全可靠性評價、煤礦安全事故綜合分析、煤礦安全實時預警,從而實現實時和非實時數據的有效利用,更好的確保煤礦安全。一是煤礦安全事故綜合分析;二是煤礦安全可靠性評價;三是煤礦安全實時預警。為了便于管理,本文提出基于危險源的煤礦安全實時預警機制,可以將煤礦安全的預警分為自燃預警、設備故障預警、瓦斯濃度預警、水害預警等。

3 數據處理層關鍵技術實現

為了將歷史數據的規律性研究成果與實時監控數據的進行聯合分析,實現煤礦安全事故的快速預警,在實現數據處理層時,本文設計了一種基于標簽的單因素與多因素分級共享的大數據開放引擎架構。該架構如圖2所示,包括單因素標簽層、關聯分析和深度挖掘層、多因素分析模型層。一是單因素標簽層:為了提高實時數據分析和響應速度,將設備和環境的相關因素中涉及安全的關鍵數據源抽取出來構成單因素?;趩我蛩氐臄祿卣?,構造出風險評級、事故發生率等標簽,通過標簽可以非??焖俚姆从趁旱V安全關鍵因素的狀態,實現煤礦安全的快速響應。二是關聯分析與深度挖掘層:該層包含Apriori、FP-Growth、DMFIA等關聯算法[9],以及邏輯回歸、支持向量機、聚類、決策樹等機器學習算法。

圖2 大數據開放引擎體系結構

這些算法可以將大數據技術與瓦斯突出、煤礦水害、煤礦火災等事故現象相結合,建立基于大數據煤礦災害預警模型。三是多因素分析模型層:為了實現應用層的各項功能,充分利用單因素標簽的已有知識,通過關聯分析和深度挖掘的相關算法,綜合多個因素標簽的關系,生成可靠性評價模型、實時預警模型、綜合分析模型等三大類模型。下面對單因素標簽、多因素分析模型進行詳細介紹。

3.1 單因素標簽

通常來說,標簽是對事物屬性狀態的一種結論性描述,是對屬性狀態的一種高度精煉,是一種把抽象數據進行形象化描述的方法,不但有助于相關人員對抽象數據進行理解,而且容易實現事物屬性狀態的快速共享[10-12]。為實現毫秒級的數據控制和對事故的快速預警,需要建立足夠多的標簽數據庫?;诖?,對于采集的數據源,抽取安全相關的危險源,梳理安全因素并建立標簽,實現快速響應、資源共享。例如,在環境方面,建立水壓、水位、涌水量、瓦斯含量、瓦斯涌出量、瓦斯壓力、氧氣濃度等危險源的單因素標簽。在設備方面,建立水泵、變壓器、通風機、采煤機、掘進機等危險源的單因素標簽。這些標簽作為煤礦環境和設備運行狀態的虛擬代表,各種煤礦環境和設備的標簽能夠準確反映其運行狀態。這樣對于煤礦安全的實時預警起到非常關鍵的作用。本文提出的單因素標簽包括事故發生概率標簽、風險評級標簽。

(1)事故發生概率標簽。分析當前因素和事故發生數據,發掘事故發生概率與當前因素的內在關聯關系,從而利用當前因素計算煤礦發生安全生產事故的概率。通過學習歷史安全事故發生規律,建立當前因素的安全事故預測模型,并據此設定警戒區間,當超出預警區間時,則進行預警,以防范安全事故發生。例如:變壓器故障事故發生率需要使用變壓器額定負荷LR、實時運行負荷LT、環境溫度、起始負荷以及不同邊界下的主變過負荷剩余時間t等數據源。變壓器故障事故發生率標簽分類為正常、1級預警、2級預警、3級預警。當LTLR≤1時,事故發生率標簽為正常;當LTLR>1且剩余運行時間t>30min 時,事故發生率標簽為1級;當LTLR>1且剩余運行時間10min<t LTLR<30min時,事故發生率標簽為2級;當>1且剩余運行時間1min<t<10min時,事故發生率標簽為3級。

(2)風險評級標簽。通過數據分析技術對煤礦安全生產歷史數據進行分析,評估煤礦安全生產的風險等級?;诖藢Ξ斍耙蛩剡M行異常檢測時,如發生風險評級預警,可及時進行防范,避免安全事故的發生。例如:以變壓器為例,通過分析事故發生率標簽、變壓器組網、事故知識庫等數據源,可以將風險評級標簽分為正常、1級預警、2級預警。當事故發生率標簽為正常時,風險評級標簽為正常;當事故發生率標簽為非正常、并且變壓器組網包含后備電力時,風險評級標簽為1級預警;當事故發生率標簽為非正常,變壓器組網不包含后備電力、且事故知識庫中包含由此導致事故時,風險評級標簽為2級預警。

3.2 多因素分析模型

預警模型已有較多研究成果,但是已有研究模型都比較獨立,缺少共用[5-6,13]。為了實現應用層的各項功能,充分利用單因素標簽的已有知識,通過關聯分析和深度挖掘的相關算法,綜合多個因素標簽的關系,生成可靠性評價模型、實時預警模型、綜合分析模型等三大類模型。例如:以通風系統可靠性評價為例,其需考慮通風系統、瓦斯監測系統、設備監測系統等多種因素和基礎數據。通過共用單因素標簽,可以快速生成所需的各種高層次模型。以煤礦水害的相關研究為例,可以通過分析水壓、水位、涌水量等多種相關的單因素數據,采用關聯分析算法和深度挖掘算法,建立突水水源判別模型、突水量等級預測模型、水害安全評價模型等基礎模型?;谶@些基礎模型,可以快速生成應用層的水害實時預警模型,用于煤礦水害事故的實時預警[14-15]。

4 技術實現

在技術實現部分,基于對已有大數據平臺的分析[3,5,16],結合煤礦的現場實際情況和大數據中流計算框架,提出了基于大數據的煤礦安全監控預警平臺技術實現框架如圖3所示。該技術實現框架包括前端采集層、前端工作站層、后端集群層。前端采集層主要實現與現有采集系統的對接。前端工作站層通過獲取采集的數據,并根據本地規則、本地緩存,實時確定是否發出預警,實現煤礦安全實時預警的功能。后端集群層通過快速的數據存儲、近實時狀態調整、模型發現及狀態調整,實現煤礦安全可靠性評價、煤礦安全綜合分析的功能。在技術選型方面,本文采用Flume、kaf ka、HDFS構建采集架構,采用spark、spark streaming、storm構建計算架構,從而實現煤礦安全數據的高效采集,提高平臺預警的實時性和準確性。下面對前端工作站層和后端集群層進行詳細介紹。

圖3 平臺技術實現

在前端工作站層,需要實現平臺在毫秒級對事件作出可靠的響應。因為本地緩存可以實現亞微妙級別的數據獲取延遲。為確保實時性,采用HBase 及其它內存數據庫,實現快速地獲取和更新數據。為了克服本地緩存的內存大小限制,通過配置HBase以保證能夠在塊緩存中找到所需要的數據,以分布式內存緩存方式在集群節點中分發數據。如圖3所示,前端設備根據采集的數據生成單因素標簽,并與HBase中的標簽數據進行對比,可以快速判斷是否進行預警。

在后端集群層,平臺需要每秒處理數百萬條數據。本文采取快速的數據存儲、近實時的狀態調整、非實時的模型發現及狀態調整3個措施解決此問題:一是快速的數據存儲:前端設備與后端集群之間,建立消息隊列平臺Kaf ka,由Kaf ka將數據發送給Flume,由Flume實現數據的HDFS存儲。二是近實時的狀態調整:為實現預警的實時性,通常需要在事件發生之后的若干秒到幾分鐘內完成進行響應。為實現近實時的狀態分析,由Kaf ka將數據發送給Storm/Spark Streaming,通過快速計算的能力,實現近實時的事件分析。三是非實時的模型發現及狀態調整:為充分利用歷史事件數據,需要在事件發送后的若干小時或幾天內完成歷史事件的分析并挖掘其中隱含的原因和規律。本文采用Spark/Impala組件針對標簽數據進行監督學習、無監督學習;例如,采用支持向量機和貝葉斯網絡,針對標簽數據的監督學習,可以區分風險數據;采用K-Means聚類算法能夠對相似事件進行聚類,從而對特定的類別進行判定。

5 結束語

為解決煤礦安全的實時數據與歷史數據未得到充分聯合分析和挖掘的問題,本文分析了煤礦事故發生的因素,設計了基于大數據的煤礦安全監控預警平臺。為了將實時數據與歷史數據進行充分聯合分析和挖掘,在數據處理層,本文提出了一種基于標簽的單因素與多因素分級共享的大數據開放引擎體系架構。該架構不但可以結合實時監控數據進行實時響應,而且可以生成多種模型,便于應用層進行共享使用。通過分析可知,該平臺能夠提前發現、分析和判斷影響煤礦安全生產的狀態和可能導致事故發生的數據,及時發布安全生產預警信息,最大限度地降低事故發生概率。

猜你喜歡
煤礦安全標簽預警
煤礦安全管理存在的問題及解決辦法
法國發布高溫預警 嚴陣以待備戰“史上最熱周”
強化憂患意識,推動全國煤礦安全生產形勢持續穩定向好
煤礦安全生產實現高質量發展
抓煤礦安全基礎建設四大支柱
無懼標簽 Alfa Romeo Giulia 200HP
不害怕撕掉標簽的人,都活出了真正的漂亮
園林有害生物預警與可持續控制
標簽化傷害了誰
機載預警雷達對IFF 的干擾分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合