?

基于PSO-PLS混合算法的水體COD紫外吸收光譜檢測研究

2021-01-06 03:02鄭培超趙偉能王金梅賴春紅王小發毛雪峰
光譜學與光譜分析 2021年1期
關鍵詞:適應度標準溶液波長

鄭培超,趙偉能,王金梅,賴春紅,王小發,毛雪峰

重慶郵電大學光電工程學院,光電信息感測與傳輸技術重慶重點實驗室,重慶 400065

引 言

隨著經濟的迅速發展和城市化進程的加快,水污染問題日益嚴重,已經成為制約經濟發展的瓶頸。為實現水環境的治理和管控,需要大力發展水質檢測設備。在水質檢測中,化學需氧量(chemical oxygen demand, COD)是評價水體受有機物污染程度的重要指標。針對COD的檢測常采用傳統的化學法,如高錳酸鉀法和重鉻酸鉀法,由于這些方法存在分析時間長,有大量二次污染的化學試劑等問題[1],近年來,紫外吸收光譜法逐漸應用到COD的檢測,它通過建立紫外吸光度和有機物濃度的預測模型來反演COD值,該方法不需要任何化學預處理,具有檢測快速,操作簡單,不會對環境構成二次污染等優點[2-3]。

由于紫外吸收光譜法采集的光譜信號的光譜范圍為200~800 nm,光譜信息量龐大,光譜數據中存在大量共線信息,如何選取有效的波長吸光度建立回歸模型是提高預測模型精度的主要問題。目前,紫外吸收光譜法檢測COD在模型算法選擇上主要有偏最小二乘回歸(partial least squares regression, PLSR)、支持向量機回歸(support vector regression, SVR)、人工神經網絡(artificial neural network,ANN)和機器學習(machine learning,ML)等[4-8]。在算法模型選擇方面,畢衛紅等運用偏最小二乘法建立不同譜區的校正模型,得到最好預測模型的r=0.995 8,RMSEC=16.186 5。楊鵬程[9]等利用間隔偏最小二乘法(iPLS)建立了海水硝酸鹽濃度模型,校正集均方根誤差RMSECV降到了9.83。Li[10]等采用組合區間偏最小二乘(siPLS)對南京錢湖水樣進行建模分析,得到最優相關系數r=0.833 4,RMSE=2.63。Pan[11]等利用傅里葉變換紅外光譜(FTIR)快速測量廢水中的COD。結果表明,采用變參數移動窗偏最小二乘(mwPLS)選擇譜區有效的提高了預測精度。湯斌[12]等采用粒子群算法聯合最小二乘支持向量機(PSO_LSSVM),最大相對誤差僅為5.83%。

基于以上研究存在的預測精度不高,算法模型復雜等問題。本研究以PLS算法來建立預測模型,結合粒子群算法收斂速度快,全局搜索最優解的特點對特征波長進行篩選,建立一種快速選擇特征波長,建立預測模型的方法。與PLS,iPLS和SVR三種預測模型對比,PSO-PLS模型預測效果最佳。

1 實驗部分

1.1 裝置

本實驗所采用的實驗裝置如圖1所示,氙-鹵鎢燈光源(Avantes, AvaLight-DH-S-BAL)發出的紫外-可見-近紅外光通過可變光程(為獲取合適的吸光度,本實驗設置的光程差10 mm)的反射式浸入式探頭的入射光纖(Avantes, FDP-7xx200-VAR),將探頭浸入到溶液中,光源發出的光被溶液吸收后反射到探頭的出射光纖上,出射光纖與便攜式光譜儀(Ocean Optics, Maya Pro 2000)連接,采集的光譜數據通過數據線傳輸到計算機進行處理。

圖1 實驗裝置示意圖Fig.1 Schematic diagram of the experimental setup

1.2 樣品制備

準確稱量0.425 1 g鄰苯二甲酸氫鉀(分析純,川東化工)溶于去離子水,配置成1 000 mg·L-1的COD標準溶液,通過逐步稀釋配制成不同濃度的COD標準溶液,采用預先搭建的實驗裝置,設置光譜儀積分時間為100 ms,平均次數5次,平滑度為3,首先以空白溶液為參比,采集其吸收光譜,然后對29份不同濃度的待測樣品,進行光譜的采集。

如圖2所示,標準溶液在近紫外區域有明顯的吸收峰,尤其波長在220~310 nm區間內,紫外吸光度與溶液濃度之間具有很好的相關性,而大于310 nm的波長點幾乎無吸收。且可以看出標準溶液在濃度低時線性關系良好,濃度高時,光譜重疊比較嚴重。

圖2 標準溶液紫外吸收光譜圖Fig.2 Ultraviolet absorption spectrum of standard solution

1.3 方法

1.3.1 偏最小二乘原理

偏最小二乘(partial least squares regression, PLSR)由化學界的Wold和Albano等在1983年提出,這種方法集主成分分析、典型相關分析和多元線性回歸分析三種方法的優點于一身,很好地解決了自變量間多重共線性的問題[14]。本研究以標準溶液的濃度為因變量,不同波長下的吸光度的值為自變量,建立PLS回歸預測模型。建立自變量和因變量的特征向量間的一元線性回歸關系。提取變量的終止條件為交叉有效性驗證。

1.3.2 PSO原理

粒子群算法(particle swarm optimization, PSO)最早是由Eberhart和Kennedy于1995年提出,它的基本思想源于模擬鳥群覓食過程中的行為而提出來的一種基于群體智能的全局隨機搜索算法[14]。首先在所有解空間中初始化一群粒子,用位置、速度、適應度三項指標來表示該粒子特征。粒子在解空間中以一定速度運動,通過個體極值Pbest和種群極值Gbest更新速度和位置,粒子每更新一次位置,就計算一次適應度值,并且通過比較新粒子的適應度值和個體極值、群體極值的適應度值更新個體極值和群體極值位置。不斷迭代,更新速度和位置,直到得到滿足最終條件的最優解。速度更新公式

(1)

ω為非負數,稱為慣性因子,體現的是粒子繼承先前速度的能力,較大的慣性權重有利于全局搜索,較小的慣性權重有利于局部搜索。C1叫自我認知,是粒子跟蹤自己歷史最優值的權重系數,表示粒子自身的認知。C2叫社會認知,是粒子跟蹤群體最優值的權重系數,表示粒子對整個群體知識的認識,r1和r2是[0, 1]區間內均勻分布的隨機數,賦予算法一定的空間搜索能力。

1.3.3 PSO-PLS特征波長選擇方法

偏最小二乘和區間偏最小二乘的主要思想是采用全光譜或者是將全光譜的劃分成一定數量的子區間來建立預測模型,其主要目的都是為了剔除冗余變量,提高預測模型精度。但是不可避免的是各個子區間仍然存在一些共線性的冗余變量,提出的PSO-PLS優選特征波長的方法可以解決上述問題,將采集的光譜數據每個波長點下的吸光度數據作為一個粒子,按照位置順序編號為1—246,首先采用PLS建立k個變量的回歸模型,以模型輸出的RMSE為粒子群算法的適應度函數,粒子在整個譜區根據最小的RMSE更新速度和位置,最后找出滿足條件的最優變量取值。

2 結果與討論

2.1 PSO-PLS建模

定義粒子群算法適應度函數為F(x)=min(RMSE),其中均方根誤差(RMSE)為特征波長處COD真實值與測量值之間的均方根誤差。設置初始種群個數為20,慣性權重w=0.6,自我學習因子c1=1.6,群體學習因子c2=1.6,位置參數限制為[1—246],速度限制為[0—1],最大迭代次數為200。粒子群算法的具體流程如圖3。

圖3 粒子群算法流程圖Fig.3 Particle swarm algorithm flowchart

采用粒子群算法篩選的最優波長數為8個,位置分別168,94,181,183,175,209,106和142。對應波長分別為256.7,230.6,271.9,272.8,269.0,285.1,236.3和253.4 nm。圖4是PLS利用粒子群算法篩選出的特征波長建立的預測模型,相關系數達到了0.999 98,RMSE=0.155 1。

圖4 預測值和真實值相關關系Fig.4 Correlation between predicted value and true value

圖5為粒子群算法運行過程中,適應度隨迭代次數的變化函數,從圖中可以看出,隨著迭代次數的增加,RMSE由最開始的0.954 7逐漸減小至0.155 1,直到達到最大迭代次數。

圖5 適應度變化曲線圖Fig.5 Trend graph of fitness function

2.2 建模效果對比

采用PLS,iPLS,SVR以及PSO-PLS對采集的29份不同濃度的標準溶液光譜數據進行分析。為驗證PSO-PLS建立的預測模型優劣,另外建立PLS,iPLS和SVR三種預測模型與本文提出的PSO-PLS進行對比,圖6為4種預測模型預測濃度值與真實值的相對誤差,由圖6可知,低濃度時,4種算法建立的預測模型相對誤差上下波動較大。隨著濃度的升高,相對誤差趨于平穩。整體來看,PSO-PLS方法的相對誤差在0~300 mg·L-1濃度范圍內波動最小,標準溶液濃度為30 mg·L-1時,PSO-PLS,PLS,iPLS,SVR的相對誤差絕對值分別為0.009 6,0.021 8,0.021 9和0.016 8。PSO-PLS模型的預測效果優于其他3種模型。

圖6 四種預測模型相對誤差對比Fig.6 Comparison of relative error between four prediction models

表1為4種建模方法的相關系數和均方根誤差。從表1可以看出,4種算法中,SVR建立的預測模型相關系數最小,均方根誤差最大。PSO-PLS建立的預測模型的相關系數最大,均方根誤差RMSE僅為0.155 1,遠低于其他3種預測模型。比較可知PSO-PLS預測模型效果優于其他3種預測模型。

表1 4種建模方法效果對比Table 1 Comparison of four modeling methods

3 結 論

采用粒子群算法與偏最小二乘回歸相結合選擇特征波長的方法,建立了COD濃度預測回歸模型,模型適用于COD濃度低于500 mg·L-1的水體。并且將該模型與PLS,iPLS和SVR所建立的預測模型進行對比,實驗數據表明,使用粒子群算法與偏最小二乘回歸相結合的方法建立的模型能夠有效減少建模波長數量,提高預測模型的精度。在實際水質監測中,使用粒子群算法選擇特征波長,不僅能大大節約成本,還能在模型滿足精度足夠高的情況下快速進行建模,為快速無污染的紫外光譜水質監測提供便捷有效的算法依據。

猜你喜歡
適應度標準溶液波長
HPLC-PDA雙波長法同時測定四季草片中沒食子酸和槲皮苷的含量
改進的自適應復制、交叉和突變遺傳算法
碘標準溶液的均勻性、穩定性及不確定度研究
一種基于改進適應度的多機器人協作策略
雙波長激光治療慢性牙周炎的療效觀察
Portal vein embolization for induction of selective hepatic hypertrophy prior to major hepatectomy: rationale, techniques, outcomes and future directions
標準溶液配制及使用中容易忽略的問題
日本研發出可完全覆蓋可見光波長的LED光源
基于空調導風板成型工藝的Kriging模型適應度研究
便攜式多用途光波波長測量儀
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合