?

LIF技術與PLS-DA算法聯合辨識礦井涌水水源類型的研究

2016-07-12 12:57閆鵬程周孟然劉啟蒙
光譜學與光譜分析 2016年9期
關鍵詞:水樣正確率礦井

閆鵬程,周孟然*,劉啟蒙,王 瑞,劉 駿

1.安徽理工大學電氣與信息工程學院,安徽 淮南 232001 2.礦山地質災害防治與環境保護安徽省重點實驗室,安徽 淮南 232001 3.安徽理工大學地球與環境學院,安徽 淮南 232001

LIF技術與PLS-DA算法聯合辨識礦井涌水水源類型的研究

閆鵬程1,周孟然1*,劉啟蒙2, 3,王 瑞1,劉 駿1

1.安徽理工大學電氣與信息工程學院,安徽 淮南 232001 2.礦山地質災害防治與環境保護安徽省重點實驗室,安徽 淮南 232001 3.安徽理工大學地球與環境學院,安徽 淮南 232001

快速的礦井涌水水源辨識對于礦井的水災預警及災后救援意義重大。常規方法使用離子濃度做為判別因子,耗時過長,因此提出一種激光誘導熒光光譜(LIF)技術與偏最小二乘判別分析(PLS-DA)算法聯合快速辨識礦井涌水水源類型的方法。實驗使用405 nm激光對被測水體進行激發,獲取礦井5個不同含水層100組水樣的熒光光譜,根據光譜曲線特征,對數據進行壓縮處理,獲取合適的光譜數據。每種水樣使用15組共75組光譜數據作為建模集,剩余的25組水樣的光譜數據作為測試集。為驗證實驗結果,設計了簇類的獨立軟模式(SIMCA)算法與PLS-DA算法構建的實驗模型進行對比。實驗發現礦井不同含水層水樣的熒光光譜差異較大,在不進行任何預處理的情況下,以PLS模型為基礎的PLS-DA算法較SIMCA算法的建模正確率高,達到了100%,其校正及驗證結果與實際分類變量的相關系數均大于0.951,校正集均方根誤差(RMSECV)和驗證集均方根誤差(RMSEP)均小于0.123,利用模型對測試集中五種水樣樣本的識別正確率均為100%。

礦井涌水;水源辨識;激光誘導熒光光譜;偏最小二乘判別分析

引 言

煤礦突水與瓦斯、煤塵、火和頂板并稱煤礦五大災害,近年來,煤礦水害無論是從發生事故數量上還是死亡人數上皆僅次于瓦斯事故位居第二,因此建立煤礦水災預警系統極其重要[1-3]。水源識別的正確性和及時性是涌水量預測的基礎,無論對于水災預警還是災后救援意義都十分重大[4-6]?,F有的水源識別全部以水化學為基礎,在各水層的長觀孔、突水監測點采集水樣,測定水中代表離子的離子濃度、pH值、電導率等參數[7-10],以此建模進行水源識別進而進行突水預警。但是傳統的水化學檢測這些參數需要1~2小時,對于煤礦的突水預警以及災后急救來說耗時太長。

本工作提出利用LIF技術獲取涌水水源熒光光譜,根據PLS-DA原理對熒光光譜進行模式識別,辨識涌水水源類型。LIF技術使用穩功率穩光譜的半導體激光器作為激光光源,由微型熒光探頭采集熒光信號,最后由熒光光譜儀實時檢測接收。依靠激光的定向、集束、穩光譜、窄線寬等特性大幅提高了熒光光譜的檢出線靈敏度。目前激光誘導熒光已經開始作為一種新型的技術在熒光標記DNA分析[11],生物制藥[12],太陽能電池板品控[13]和毛細管電泳[14]檢測等領域發揮重要作用,PLS-DA算法也開始應用于木材,煙葉,潤滑油[16]的辨識。將LIF技術結合PLS-DA算法應用于煤礦突水水源類型識別尚未見諸任何相關文獻。

1 實驗部分

1.1 儀器

圖1為實驗系統示意圖。半導體激光器(北京華源拓達激光技術有限公司405 nm-LASER)提供波長為405 nm激光,激光功率輸出為100 mW,經5股UV/Vis照明光纖組成的光纖束傳至浸入式微型探頭( 廣東科思凱公司FPB-405-V3),由浸入式微型探頭將激光打入被測水體,被測水體受激輻射,發出熒光,由浸入式微型探頭檢測接收,并經1股UV/Vis讀出光纖傳至熒光光譜儀(美國海洋光學公司USB2000+)。熒光光譜儀接收范圍設置為400~799 nm波段,積分時間為500 ms/1 000 nm,光譜采樣間隔設置為0.5 nm。所有光纖接口皆為SMA905。

圖1 實驗系統框圖

1.2 材料

根據煤礦的含水層分布特點及常見的突水事故情況,選取了煤礦4種含水層的水樣(煤系砂巖裂隙水、奧陶系灰巖巖溶水、煤系灰巖水和第四系沖積層水)以及1種常見的突水事故水樣(老窯水)做為實驗材料。在2015年3月5日現場采集淮南礦業集團某煤礦的5組水樣,各組分別采集樣本20個,在得到采集的水樣后立即放入褐色玻璃容器,并密封避光帶回實驗室。

1.3 光譜模式識別

模式識別中的經典算法以LDA和PCA為代表,但是這兩種算法又各有缺點。光譜數據的特殊性表現在其樣本數相對于維數來說過小(小樣本問題),這使得LDA算法使用在光譜數據處理時有巨大障礙;PCA算法雖可以克服小樣本問題,但是其本質是基于無監督學習,未考慮樣本類間鑒別信息(多重相關性),因此存在產生非優化鑒別模型的危險。

PLS-DA算法的本質是基于監督學習特征提取方法的一種,可以將其看作是主成分分析、多元統計回歸和典型相關分析的有機結合。與LDA算法相比,PLS-DA算法不存在小樣本問題,與PCA相比,PLS-DA不僅做到了樣本主成分的特征提取,而且通過建模最大限度的保留了樣本信息,解決了多重相關性問題,因此其提取的主成分說服力更強,模式識別效果更好。

為對比實驗結果,在不對光譜進行任何預處理的情況下,分別采用以PCA建模為基礎的SIMCA算法和以PLS建模為基礎的PLS-DA算法進行水樣的光譜模式識別。

2 結果與討論

2.1 數據壓縮

對淮南礦業集團某煤礦的5組共100個水樣樣本進行激光激發,獲取熒光光譜。為盡可能降低外界光影響,實驗中,探頭與水樣樣本都置于暗室中進行激光激發。對每個樣本進行3次測量取平均值,以降低實驗中的隨機誤差,共得到熒光數據100組。實驗獲取的熒光光譜數據為400~799 nm,間隔0.5 nm,共800個數據,如圖2所示。實驗使用其中的75個樣本(每組15個樣本)光譜進行建模,剩余25個樣本用于對測試。

通過觀察圖2中5組水樣的熒光光譜可以發現,水樣的熒光光譜總體差異明顯,但是在400~420 nm波段以及670~799 nm波段差異較小,為了減少不必要的運算量,選擇420~669波段共500個數據做為處理對象,為了進一步提高運算效率,對此波段內的數據每2個點取平均值,此時各樣本的光譜數據就由原始的800個數據壓縮至250個數據,壓縮后熒光光譜見圖3。

圖2 水樣原始熒光光譜

圖3 壓縮后熒光光譜

2.2 SIMCA建模與分類

對75組數據進行PCA建模,由表1主成分的累積貢獻率可發現第1主成分的貢獻率很大,因此在對數據建模時使用前2個主成分。圖4為主成分數為2情況下的水樣得分分布圖。由圖4可以看出五種水樣的分類效果顯著。

圖4 PC-1與PC-2得分聚類圖

根據PCA建模情況,在顯著性程度,主成分數為2的情況下,使用SIMCA法對各水樣進行識別。所建立的預測集及測試集的結果如表2所示。由表2可以看出經PCA建模和SIMCA分類識別的建模集正確率為97.33%,錯誤的原因主要是由于砂巖水出現了2個誤判;使用未參與建模的水樣對建模集的驗證得出測試集正確率為100%。

表1 不同主成分數的累積貢獻度

2.3 PLS-DA建模與分類

PLS-DA算法是以PLS模型為基礎,建立樣本分類變量與熒光光譜特征間的回歸模型。實驗分組情況與SIMCA算法實驗的分組一致。第一步根據水樣的類別特征,建立五種水樣的分類變量,見表3,第二步根據PLS模型對建模集的熒光光譜數據和五種水樣的分類變量進行回歸分析,最終建立熒光光譜和樣本分類變量的PLS模型。

表2 不同水樣的SIMCA識別結果

Table 2 SIMCA classification of different water samples

水樣類別數量建模集正確率數量測試集正確率奧灰水15/155/5老窯水15/155/5沖積層水15/15(73/75)97.33%5/5(25/25)100%砂巖水13/155/5灰巖水15/155/5

表3 五種水樣的分類變量表

表4 PLD-DA模型的校正集與驗證集結果

圖5 PLS模型真實值與預測值回歸曲線圖

表4和圖5為五種水樣PLS-DA 算法的校正和驗證結果,由表4可知,利用PLS模型建立的水樣樣本與分類變量之間的相關性良好,模型對校正集和驗證集所有的水樣樣本皆能準確的判識水樣類別,識別率為100%,校正集和驗證集樣本的相關系數r最小分別為0.971和0.951,其校正集均方根誤差(RMSECV)和驗證集均方根誤差(RMSEP)最大分別為0.087和0.123,說明模型具有良好的擬合度。

圖5依次為奧灰水、老窯水、沖積層水、砂巖水和灰巖水五種水樣的分類變量的PLS真實值與預測值的回歸曲線圖。由圖5a可以看出,奧灰水樣本的預測值分布在1附近,而其他四種水樣樣本的預測值皆分布在0附近,其他4幅圖也可以清晰的看出對應的水樣樣本與其他樣本皆可明顯區分。這說明了以PLS模型為基礎的PLS-DA算法具有良好的預測精度,可以使用其進行水樣類別的辨識。

為了測試模型的正確性,利用建立的PLS-DA模型對測試集的25個水樣樣本進行類別辨識,結果如圖6所示。由圖6(a)可見所有奧灰水的樣本預測值皆在1左右,偏差最大為0.92,其他四種水樣樣本的預測值皆在0附近,偏差小于0.1。根據PLS-DA算法的識別標準,由圖6(a)可見測試集中所有的奧灰水樣本均正確識別,剩余四種水樣樣本不具備奧灰水樣本的特征,PLS-DA模型對奧灰水樣本的識別正確率為100%。圖6中的其他4幅辨識圖以此為已建立的老窯水、沖積層水、砂巖水和灰巖水的PLS-DA模型對測試樣本的辨識結果,對剩余的這4幅圖使用與圖6(a)同樣的識別標準可知,模型對測試集中老窯水、沖積層水、砂巖水和灰巖水樣本的識別正確率同樣為100%。

圖6 測試集PLS-DA模型水樣辨識圖

3 結 論

利用LIF技術獲取礦井5個含水層的水樣熒光光譜圖,利用光譜特征進行數據壓縮,依據相關原理建立了PLS-DA的水樣識別模型,并建立了SIMCA識別模型進行識別結果對比,結果表明。

(1)在不進行任何光譜預處理的情況下,PLS-DA的建模正確率為100%,而SIMCA識別模型對建模水樣樣本出現了誤判,正確率為97.33%,PLS-DA識別模型教SIMCA識別模型更適宜應用在水樣類別的辨識上。

(2)5個模型校正集的相關系數均大于0.97,模型具有良好的擬合度,對于測試集樣本的識別正確率均為100%,說明LIF技術結合PLS-DA 算法,可對奧灰水、老窯水、沖積層水、砂巖水和灰巖水的類別進行有效的識別。

(3)本法可實現水樣類別的快速識別,為礦井涌水類型的模式識別提供了一種新的方法,對于礦井涌水類型辨識儀器的開發具有一定的理論指導意義。

[1] LU Jin-tao, LI Xi-bing, GONG Feng-qiang(魯金濤, 李夕兵, 宮鳳強).China Safety Science Journal(中國安全科學學報), 2012, 22(7): 109.

[2] GONG Feng-qiang, LU Jin-tao(宮鳳強, 魯金濤).Journal of Mining & Safety Engineering(采礦與安全工程學報), 2014, 31(2): 236.

[3] WANG Xin-yi, XU Tao, HUANG Dan(王心義, 徐 濤, 黃 丹).Journal of China Coal Society(煤炭學報), 2011, 36, (8): 1334.

[4] HU Wei-yue, YIN Shang-xian(虎維岳, 尹尚先).Chinese Journal of Rock Mechanics and Engineering(巖石力學與工程學報), 2010, 29, (1): 3344.

[5] ZHAO Su-qi, WU Qiang, YIN Shang-xian(趙蘇啟, 武 強, 尹尚先).Journal of China Coal Society(煤炭學報), 2006, 31(1): 618.

[6] WANG Chang-shen, SUN Ya-jun, HANG Yuan(王長申, 孫亞軍, 杭 遠).Chinese Journal of Rock Mechanics and Engineering(巖石力學與工程學報), 2009, 28(2): 298.

[7] YANG Yong-guo, HUANG Fu-chen(楊永國, 黃福臣).Journal of China University of Mining and Technology(中國礦業大學學報), 2007, 36(3): 283.

[8] YAO Jie, TONG Min-ming, LIU Tao(姚 潔, 童敏明, 劉 濤).Coal Mine Safety(煤炭安全), 2013, 44(2): 29.

[9] ZHANG Rui-gang, QIAN Jia-zhong, MA Lei(張瑞鋼, 錢家忠, 馬 雷).Journal of China Coal Society(煤炭學報), 2009, 34(1): 33.

[10] WEI Wen-xue, LU Xin-ming, SHI Long-qing(衛文學, 盧新明, 施龍青).Journal of China Coal Society(煤炭學報), 2010, 35(5): 811.

[11] SANG Fu-ming, REN Xiu-lian, PAN Jian-xin(桑付明, 任秀蓮, 潘建新).Journal of Instrumental Analysis(分析測試學報), 2009, 28(9): 1100.

[12] DING Juan-juan, JIN Bao-kang, KANG Jing-wu(丁娟娟, 金葆康, 康經武).Acta Chimica Sinica(化學學報), 2009, 67(9): 945.

[13] XIAO Guan-hui, QIN Hai, LAN He(肖光輝, 覃 海, 藍 劾).Journal of Applied Optics(應用光學), 2011, 32(5): 1016.

[14] XU Xu, GAO Hong-jun, LIN Bing-cheng(許 旭, 高紅軍, 林炳承).Journal of Instrumental Analysis(分析測試學報), 2005, 24(5): 122.

[15] SHI Feng-cheng, LI Dong-liang, FENG Guang-lin(施豐成, 李東亮, 馮廣林).Tobacco Chemistry(煙草化學), 2013, 4: 56.

[16] OUYANG Ai-guo, ZHAO Zhan-you(歐陽愛國, 趙戰友).Journal of Chinese Agricultural Mechanization(中國農機化學報), 2013, 34(1): 181.

*Corresponding author

(Received May 8, 2015; accepted Sep.16, 2015)

Research on the Source Identification of Mine Water Inrush Based on LIF Technology and PLS-DA Algorithm

YAN Peng-cheng1, ZHOU Meng-ran1*, LIU Qi-meng2, 3, WANG Rui1, LIU Jun1

1.College of Electrical and Information Engineering, Anhui University of Science and Technology, Huainan 232001, China 2.Anhui Provincial Key Lab of Geohazards Prevention and Environment Protection, Huainan 232001, China 3.College of Earth and Environment, Anhui University of Science and Technology, Huainan 232001, China

Rapid source identification of mine water inrush has great significance for early warning and rescuing after the mine water inrush.Conventional method taking the concentration of ions as the discriminant factor takes such a long time that a method of rapid source identification of mine water inrush is in urgent need.This method is combined with Laser induced fluorescence (LIF) technology and Partial Least Squares-Discriminant Analysis (PLS-DA) algorithm.In the experiment, 405 nm laser was used to excite the water and 100 groups of fluorescence spectrum from 5 different aquifer of the mine were obtained.According to the spectra curve features, the data was compressed to obtain proper spectral data.15 groups of spectrum of each water inrush samples were applied, with a total of 75 groups of spectrum as the prediction set while the rest of 25 groups of spectrum as the test set.To verify the experimental result, an experimental model was built with soft independent modeling of class analogy (SIMCA) to compare with PLS-DA.The result shows that the fluorescence spectra of different aquifer water samples is of great difference, without any pre-treatment, the PLS-DA algorithm based on the PLS model has higher modeling accuracy compared with SIMCA algorithm, which reaches to 100%, the validation results and the correlation of separation of variables are both more than 0.951, the RMSECV and RMSEP are both less than 0.123, using the model to identify the 5 water samples of test set, the accuracy are up to 100%.

Mine water inrush; Source identification; LIF; PLS-DA

2015-05-08,

2015-09-16

“十二五”國家科技支撐計劃項目(2013BAK06B01)和國家安全生產重大事故防治關鍵技術科技項目(an-hui-0001-2016AQ)資助

閆鵬程,1988年生,安徽理工大學電氣與信息工程學院博士研究生 e-mail: pcyan1988@126.com *通訊聯系人 e-mail: mrzhou8521@163.com

O657.3

A

10.3964/j.issn.1000-0593(2016)09-2858-05

猜你喜歡
水樣正確率礦井
門診分診服務態度與正確率對護患關系的影響
HC油田N138區注入水配伍性研究
以機器人研發應用引領礦井“四化”建設
建立三大長效機制 保障礦井長治久安
我國相關標準水樣總α、總β放射性分析方法應用中存在的問題及應對
平行水樣分配器在環境監測中的應用
水樣童年
生意
品管圈活動在提高介入手術安全核查正確率中的應用
高瓦斯礦井防治瓦斯異常涌出措施的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合