?

基于自適應變異粒子群算法的混合核ε-SVM在混合氣體定量分析中的應用*

2016-10-21 11:32劉文貞陳紅巖李孝祿袁月峰郭晶晶
傳感技術學報 2016年9期
關鍵詞:混合氣體適應度粒子

劉文貞,陳紅巖,李孝祿,袁月峰,郭晶晶

(中國計量大學機電工程學院,杭州310018)

基于自適應變異粒子群算法的混合核ε-SVM在混合氣體定量分析中的應用*

劉文貞,陳紅巖*,李孝祿,袁月峰,郭晶晶

(中國計量大學機電工程學院,杭州310018)

針對利用不分光紅外吸收法(NDIR)的多組分氣體傳感器對汽車尾氣進行同時測量時,紅外光譜特征吸收譜線重疊較為嚴重,所測氣體濃度是交叉吸收干擾后的結果,造成測量誤差大,分析精度低的問題,提出了一種自適應變異粒子群算法的混合核ε-SVM方法,建立三組分混合氣體定量分析模型,已消除混合氣體之間相互干擾產生的誤差問題。實驗中,采集CO2、CO、C3H8的濃度信號,作為模型輸入,通過模型回歸分析,得到對應的混合氣體組分濃度,通過實驗數據對模型性能進行分析,結果表明,該模型的平均誤差相比于傳統模型明顯減低,取得較好的精度。

檢測技術與自動化裝置;氣體定量分析;自適應變異粒子群算法;混合核函數;支持向量機;氣體傳感器

EEACC:7230doi:10.3969/j.issn.1004-1699.2016.09.028

機動車尾氣中主要有CO、NO、CO2、HC化合物等,成為環境污染的重要因素。在混合氣體定量分析方法中,氣體傳感器因其便利的安裝及攜帶條件,近年來越來越受到廣泛的應用,其中基于不分光紅外吸收法(NDIR)的多組分氣體傳感器是根據單原子和同核分子組成的氣體不吸收紅外線能量,而異原子組成的氣體(如尾氣中的CO2、CO、C3H8等)能吸收特定波長的紅外光能量原理建立的,其吸收強度用吸收系數反映。當一束平行的紅外光穿過待測氣體時,氣體對紅外波段中特征波長的紅外光能量進行吸收,在其相應譜線處會發生紅外光能量的衰減,衰減量與該待測氣體濃度c、氣體的厚度L以及該氣體吸收系數k有關[1],關系服從朗伯—比爾(Lambert-Beer)定律[2]。但NDIR傳感器對車輛尾氣排放進行動態實時檢測時,由于組分氣體間吸收譜線相互重疊嚴重,造成交叉吸收干擾,以及溫度的變化等因素,導致測量時誤差較大,無法對汽車尾氣排放進行有效的檢測和監督,因此,需要后續的數據處理。

在涉及到非線性干擾問題時,國內外學者提出了很多用于重疊信號解析的方法,如偏最小二乘(PLS)回歸分析、小波神經網絡、支持向量機(SVM)等[3-7]。Manouchehrian Amin[5]等運用基于遺傳算法尋優方法的支持向量機,建立回歸模型,預測巖石的強度和可變性屬性;劉建國[6]等人將RBF神經網絡應用到可燃混合氣體的分析中,克服了傳感器陣列在混合氣體檢測中的交叉敏感現象;曲?。?]等利用自適應變異粒子群優化的SVM建立混合氣體校正模型,對多組分氣體傳感器檢測到的混合氣體進行檢測,有效的提高了混合氣體的預測精度,降低了預測誤差。目前,SVM算法在混合氣體定量分析領域取得了一定的成果。但目前所采用的單核SVM仍存在泛化性能弱、學習能力差等弱點,因此,在此基礎上,采取一種將徑向基核函數和多項式核函數進行線性組合構建的混合核SVM[8],并采取自適應變異粒子群算法對混合核SVM校正模型進行優化,解決普通粒子群算法存在的后期震蕩嚴重、趨同性強和極易陷入局部極小值等問題,以此來提高模型預測精度。

1 混合核ε-SVM校正模型理論

1.1ε-SVM

SVM算法是根據結構風險最小化原則設計的一種統計學習理論,具有小樣本學習能力強、模型推廣性能好以及高維數據處理能力強等優點。在SVM分類算法中引入式(1)所示的不敏感損失函數,選取合適的參數ε,可以構造成ε型支持向量回歸算法(ε-SVM)來實現SVM的回歸預測功能。

其中,ω為回歸系數,φ(xi)為輸入空間到特征空間的映射函數,b為閥值。

根據優化理論,選取適當的精度ε>0和懲罰參數C>0,將式(2)轉換線性規劃問題,在此引入松弛變量ξ,ξ*≥0來求解ω與b。

引入Lagrange函數求解式(3)和式(4),通過核函數k(xi,xj)將高維空間的內積運算轉換在原二維空間計算,有:

經過求解,得到:

求得ω與b后,構造決策函數,即ε-SVM回歸校正模型的回歸函數:

式(6)中,若αi不為零或者不為零,表示此樣本即為支持向量。

1.2混合核ε-SVM

ε-SVM進行預測之前首先要確定核函數的類型。SVM有4種常用的核函數,即徑向基核函數(RBF)、Sigmoid核函數、高斯核函數和多項式核函數。選用不同的核函數可構造不同的支持向量機。鑒于局部性核函數在測試點附近小領域內對數據點的影響較大,具有學習能力強、泛化性能弱的特點,而全局性核函數泛化性能力強、學習能力弱,為了得到學習能力與泛化能力都較強的核函數,將這兩類核函數混合起來。由于RBF核函數能較好的模擬光譜信號,是一個典型的局部性核函數,使用比較普遍,而多項式核函數是一個典型的全局性核函數,因此選擇將兩者線性組合,構造混合核函數[8]如式(10)所示:

1.3ε-SVM模型參數的影響分析

ε-SVM中影響預測精度的參數有回歸函數中的懲罰參數C、損失函數中的ε,以及核函數中的權重因子σ和λ。①懲罰因子C控制著經驗風險和VC維的平衡。為了減少誤差以實現對訓練樣本的較好擬合,在相似預測效果的情況下,一般選擇相對較小的C值以避免引起經驗誤差和VC維失去平衡而導致泛化能力弱。②ε控制著SVM對輸入變量的敏感程度,ε值過大會使SVM反應遲鈍,不能隨著輸入的變化迅速調整;而過小的ε則會使SVM對輸入太過敏感,使得干擾對SVM影響過大,甚至導致學習失敗。因此,選擇合理的參數是保證ε-SVM實現準確預測的基礎。③σ控制著誤差的邊界,理想的訓練結果是使得盡量多的訓練樣本包含所有的預測樣本,以實現預測誤差的最小化。④權重因子λ可以改變混合核函數中原核函數的權重,λ∈(0.5,0.99).由上可知,如何尋找一個精確、快速、穩定的算法來實現對參數的優化對提高模型預測精度具有重要的意義。粒子群優化算法[7-8]PSO(Particle Swarm Optimization)是一種具有魯棒性的群體智能的優化算法,其基本思想是通過群里中個體之間的信息傳遞及信息共享來尋找最優解,該算法克服了遺傳算法具有收斂速度慢、早熟的缺陷。因此,為了能夠對ε-SVM算法中的參數進行優化選取,改良傳統的遍歷優化方法,采用自適應變異粒子群AMPSO(Adaptive Mutation Particle Swarm Optimization)算法優化ε-SVM模型。

2 AMPSO-ε-SVM模型理論

2.1PSO算法

PSO算法是一種基于速度-位置搜索的智能隨機優化方法,模擬群鳥覓食種群,每個個體都被看作一個粒子,則鳥群可以被看成一個粒子群[9]。假設在一個D維的空間中,有n個粒子組成的種群X=(X1,X2,…,Xn),其中Xi=[xi1,xi2…,xiD]T為第i個粒子在D維搜索空間的位置,亦代表問題的一個潛在解。根據目標函數可以計算出每個粒子位置Xi對應的適應度值根據適應值的大小衡量其優劣。粒子個體經歷過得最好位置,即個體極值為Pi=[Pi1,Pi2…,PiD]T,整個群體所有粒子經過的最好位置,即種群的全局極值為Pg=[Pg1,Pg2…,PgD]T。種群第i個粒子的速度為Vi=[Vi1,Vi2…,ViD]T。

在每一次迭代過程中,粒子通過個體極值和全局極值更新自己的速度和位置,更新公式為:

其中ω為慣性權重因子,其值非負,值的大小影響整體的尋優能力;i=1,2,…,n,n為群體中粒子總數;d=1,2,…,D,表示維數;k為當前迭代次數;Vid為粒子速度;Xid為粒子位置;c1和c2為加速度因子,通常在0~2之間取值,r1和r2為分布在[0,1]之間的隨機數。

粒子群優化算法收斂快,但存在著容易早熟收斂、搜索精度較低、后期迭代效率不高等缺點。因此,提出了一種自適應變異的粒子群優化算法。

2.2AMPSO算法

AMPSO算法指通過一定的準則和判定條件對相應的粒子采取變異操作,產生新的粒子,引導種群向最優解方向收斂[10]。其具體的做法是粒子群優化算法的基本框架中增加隨機變異算子pm,通過對粒子gbest的隨機變異來提高粒子群算法跳出局部最優解的能力,讓算法在發生早熟收斂時,能夠進入解空間的其它區域繼續進行搜索,直到最后找到全局最優解。設fi為第i個粒子的適應度(目標函數值),則整個群體n個粒子的平均適應度favg為:

粒子群歸一化定標因子f為:

種群適應度方差σ2為:

對滿足變異條件的gbest按一定的概率pm變異,pm的計算公式如下:

其中,μ可以?。?.1,0.3]之間的任意數值。假設粒子gbest在當前最優解為pg,在變異算子pm的作用下可能發現更好的位置:

2.3AMPSO算法優化ε-SVM

自適應變異操作拓展了在迭代中不斷縮小的種群搜索空間,使粒子可以跳出之前搜索到的最優值位置,在更大的空間展開搜索,同時保持了種群的多樣性,提高了算法尋找到最優質的可能性[11]。選擇最小化式(18)所示的均方根誤差函數Frmse為目標函數。

可選擇適應度函數為:

AMPSO算法優化混合核ε-SVM的實現過程如下:

①初始化隨機初始化SVM參數組合(C,σ,ε,λ)在解空間中的位置、粒子的初始速度和位置,設置粒子最大速度vmax、最大迭代次數、權重取值范圍以及SVM各參數取值范圍。若則若,則

②計算每個粒子的適應度設置每個粒子的個體極值為當前位置gbest。根據式(13)~式(15)更新適應度值Ffitness和種群適應度方差σ2,令pipresent=Ffitness。計算每個粒子的適應度值,取適應度值最優的粒子個體極值為最初的全局極值pgbest。

③更新粒子的速度和位置值,根據式(11)、式(12)更新粒子的速度和位置。

④根據式(16)計算變異概率pm。

⑤產生隨機數r∈[0,1]如果r<Pm,按式(17)執行變異操作。

⑥比較當前粒子的個體最優極值pibest和當前適應度值pi。若pi>pgbest,則pgbest=pi。

⑦比較更新之后的pj和全局最優位置pgbest。若pj>pgbest,則pgbest=pj。

⑧判斷是否滿足迭代終止條件,滿足則停止迭代,輸出最優的SVM參數組合;不滿足則轉步驟②。當使得最優解的參數組合不唯一時,取C值最小的那組。

自適應變異粒子群優化混合核ε-SVM的流程如圖1所示。

圖1 自適應變異粒子群優化混合核ε-SVM的流程圖

3 實驗與分析

在已有的三組分氣體傳感器的條件下[12],采用HawkEye公司的IR55紅外光源和PerkinElmer公司生產的TPS4339作探測器,對組成的三組分氣體進行了實驗。TPS4339探測器基于熱電偶測溫原理,為2×2矩陣規則排列的4通道探測器,每個通道根據氣體對光譜的吸收特性,選擇適于被測氣體特征吸收光譜通過的濾光片,并在每個通道密封不同紅外濾光片的透射窗口,相互之間沒有信號干擾。通過對CO2、CO和C3H8吸收光譜分析,選擇氣體通道的濾光片濾波范圍分別為:4.33 μm±40 nm、4.65 μm±0.015 nm、3.40 μm±50nm;參考通道濾波范圍:3.93 μm±50 nm。每個通道檢測對應氣體吸收后剩余光強度與參考通道的輸出作比后,經放大、濾波并轉化為3組不同的電信號,通過上位機與MCU串口之間的通訊,按用戶自定義協議對串口發送的A/D采樣后的電壓數據進行解析,上位機將電壓數據存入數據庫,并實時地顯示各通道的電壓波形,上位機對下位機發送來的數據進行分析、處理、擬合出相應待測氣體的濃度,并能將數據導出到Excel表中進行保存,作為模型的輸入。氣體檢測原理框圖如圖2所示。

圖2 氣體檢測原理框圖

將不同體積分數配比的28組混合氣體的其中20組用于網絡模型的訓練,8組用于測試模型的準確度[13-14],以及驗證誤差是否達到理想,混合氣體樣本各單一氣體體積分數控制在CO2為0~20%、CO為0~10%、C3H8為0~5%。選定好最優參數組合(C,ε,λ,σ)后,對訓練集進行訓練,建立SVM回歸模型,之后對測試集進行回歸分析,得到測試集的模型預測結果。

為提高模型預測精度,本實驗針對不同組分氣體采用獨立建模的方法,因此在應用自適應變異粒子群優化算法對混合核ε-SVM的參數優選的過程中,應針對不同氣體分別優化,在本實驗中即分別優化CO2、CO和C3H8化合物的模型參數。僅以CO2氣體分析模型參數優化為例,選取粒子群維數為2,種群數量20,粒子群優化迭代次數200代,慣性權重因子ω∈[0.4,09],Vmax=50,C∈(0,100],ε∈[0.001,10],λ∈[0.50,0.99],σ∈(0,10]。以F(Pgk)≤10-4作為全局收斂條件加速度因子即學習因子c1=1.5,c2=1.7。

實驗是以CO2濃度誤差為適應度函數,本文分別給出了適應度值即濃度誤差隨迭代次數的變化曲線,為了顯示AMPSO算法優化的混合核ε-SVM模型具有優越性,對三種模型進行了對比分析。圖3表示基于AMPSO的混合核ε-SVM模型參數的最優個體適應度的變化曲線,其最優個體適應度為0.000 37。

圖3AMPSO-混合核ε-SVM參數優化過程曲線

圖4表示基于AMPSO的單核ε-SVM參數算法的最優個體適應度的變化曲線,其最優個體適應度為0.001 32。

圖5表示基于PSO的混合核ε-SVM參數算法的最優個體適應度的變化曲線,其最優個體適應度為0.001 48。其中,AMPSO-單核ε-SVM模型中采用的核函數為RBF核參數,該模型在優化過程中,需要優化的參數有懲罰參數c(選取范圍0~100)和RBF核參數g(選取范圍0~1 000),以及靈敏系數ε;PSO-混合核ε-SVM需要優化的參數為(C,ε,λ,σ)。

圖4 AMPSO-單核ε-SVM參數優化過程曲線

圖5 PSO-混合核ε-SVM參數優化過程曲線

由3種模型優化混合核ε-SVM參數結果看,基于AMPSO的混合核ε-SVM模型參數的最優個體適應度為0.000 37為最小,并且其在較小的進化代數適應度值即達到穩定。在針對CO2氣體檢測的三種模型中,優化后的最優參數、所需時間以及均方誤差如表1所示。

表1 3種模型尋優結果對比表

如圖6所示,為AMPSO-混合核ε-SVM模型參數尋優結果圖。其中,橫軸為優化代數,縱軸為適應度值,即模型訓練樣本計算結果的均方誤差。

圖6 AMPSO-混合核ε-SVM參數尋優結果圖

將AMPSO算法優化的混合核ε-SVM得到的最優參數組合(C,ε,λ,σ)=(9.315,0.163,0.657,0.921)代入支持向量機重建傳感器模型,可以得到模型訓練樣本的預測結果,如圖7所示。

圖7 CO2訓練集網絡輸出與實際輸出對比圖

從尋優結果圖6和訓練樣本的預測結果圖7中,可以看出利用訓練集建立的模型對CO2訓練集本身做預測時,模型預測值和CO2實際濃度值很好地吻合,誤差極小。其中訓練樣本的測試結果均方差為4.12×10-5,曲線很好地逼近真實濃度,說明本實驗建立的模型預測精度高,可應用于混合氣體中CO2氣體的回歸預測。

同樣的,可以得到經過AMPSO優化后的混合核ε-SVM建立其他氣體訓練模型。最優參數、尋優所用時間以及均方誤差(MSE)如表2所示。

最終對8組測試樣本氣體進行測試,將三種模型預測得到的3種氣體濃度數據進行對比,結果如表3所示。由表3中的數據,通過誤差分析,兩種算法的檢測結果如表4所示。

表2 AMPSO-混合核ε-SVM尋優結果表

表3 混合氣體濃度測量結果

表4 誤差結果對比

由表3、表4可以看出:通過AMPSO-混合核ε-SVM建立的氣體定量測試模型誤差分析,CO2、CO、C3H8的濃度絕對誤差(MAE)分別滿足±0.1%、±0.2%、±0.002%的誤差要求,相對誤差(MRE)在5%以內,并且誤差明顯低于AMPSO-單核ε-SVM和PSO-混合核ε-SVM模型。由模型訓練過程中的均方差也可以看出此模型在穩定性方面也具有一定優勢。在混合氣體預測過程中,訓練樣本濃度選擇的不同以及樣本容量的不同,都會對均方差(MSE)有所影響,在滿足絕對誤差和相對誤差要求的同時,均方差盡量降低,這點在允許范圍內。因此應用此方法建立氣體定量分析模型是有效可行的。

4 結論

本文將自適應粒子群算法用于優化支持向量機,并且支持向量機的核函數由RBF核函數和多項式核函數結合的混合核函數,以此取代傳統的單核函數支持向量機,在此基礎上建立混合氣體濃度定量檢測分析模型。對濃度范圍分別在0~20%的CO2、0~10%的CO、0~5%的C3H8標準氣體進行定量分析,實驗證明該模型的預測精度明顯高于以往的混合氣體預測模型,符合國家關于尾氣排放的檢測標準,能夠滿足氣體測量的實際需求。

與AMPSO-單核ε-SVM和PSO-混合核ε-SVM模型相比,在樣本容量相同,樣本濃度值不變的前提下,首先,AMPSO-混合核ε-SVM預測模型使得氣體濃度檢測結果相對誤差和絕對誤差均有所降低,預測精度得到提高;其次,收斂速度有所提高,表現在尋優時間短,迭代次數少;再次,AMPSO算法具有一定的抗干擾性,又因為引入了雙核,使得的泛化性能和學習能力有所提高,表現在訓練過程中均方差的減小,使得尋優參數能夠實現穩定預測功能,具有較好的魯棒性。因此,基于自適應變異粒子群算法的混合核ε-SVM模型在對利用汽車尾氣傳感器檢測汽車排放的多組分氣體定量分析建模中具有一定的發展潛力和挖掘空間。

[1]孫輝.基于紅外吸收法多組分氣體分析儀的研制[D].哈爾濱:哈爾濱工業大學,2009.

[2]Li Xiaowei,Che Xiaobo,Ma Jianhui.Based on the Principle of NDIR Infrared CO Concentration Detector[J].Shandong Coal Sci?ence and Technology,2009(4):86-88.

[3]曲健,陳紅巖,劉文貞,等.基于改進網格搜索法的支持向量機在氣體定量分析中的應用[J].傳感技術學報,2015,28(5):774-778.

[4]曲健,陳紅巖,劉文貞,等.基于自適應變異粒子群優化的SVM在混合氣體分析中的應用[J].傳感技術學報,2015,28(8):1262-1268.

[5]Manouchehrian Amin,Sharifzadeh Mostafa,Hamidzadeh,et al.Selection of Regression Models for Predicting Strength and De? formability Properties of Rocks Using GA[J].International Jour?nal of Mining Science and Technology,2013,23(4):495-501.

[6]劉建國,安振濤,張倩.基于傳感器陣列的可燃混合氣體RBF網絡分析[J].裝備環境工程,2013(3):113-116.

[7]湯守鵬,姚鑫鋒,姚霞,等.基于主成分分析和小波神經網絡的近紅外多組分建模研究[J].分析化學,2009,37(10),1445-1450.

[8]單黎黎,張宏軍,王杰,等.一種改進粒子群算法的混合核ε-SVM參數優化及應用[J].計算機應用研究,2013,30(6):1636-1639.

[9]潘峰,李位星,高琪,等.粒子群優化算法與多目標優化[M].北京:北京理工大學出版社,2013:1-192.

[10]余盛威.MATLAB優化算法案列分析與應用(進階篇)[M].北京:清華大學出版社,2015:1-533.

[11]田文奇,和敬涵,姜久春,等.基于自適應變異粒子群算法的電動汽車換電池站充電調度多目標優化[J].電網技術,2012,36(11):25-29.

[12]張一龍.三組分汽車尾氣濃度傳感器的研制哈[D].中國計量大學,2014.

[13]王小川,史峰,郁磊,等.MATLAB神經網絡43個案例分析[M].第1版.北京:北京航空航天大學出版社,2013:1-394.

[14]卓金武,李必文,魏永生,等.MATLAB在數學建模中的應用[M].第2版.北京:北京航空航天大學出版社,2014:1-324.

劉文貞(1990-),女,河南商丘人,在讀研究生,主要研究方向為檢測技術,848990467@qq.com;

陳紅巖(1965-),男,浙江杭州市,教授,研究生導師,浙江大學內燃機工程專業碩士、博士學位;上海交通大學動力與機械工程專業博士后。主要研究領域為汽車電子、發動機排放與控制等,bbchy@163.com。

Application of Mixed Kernel Function ε-SVM Based on Adaptive Mutation Particle Swarm Optimization in Multi Component Gas Detection*

LIU Wenzhen,CHEN Hongyan*,LI Xiaolu,YUAN Yuefeng,GUO JINGjing
(College of Quality and Safety Engineering,China Jiliang University,Hangzhou 310018,China)

Due to the simultaneous measurements of automobile exhaust gas by using the multi-component gases sensor based on the dispersion of light infrared method(NDIR),the text is the result of the cross absorption and in?terference,resulting in the large measurement error and low accuracy.To solve this problem,a kind of mixed kernel function ε-SVM based on adaptive mutation particle swarm optimization algorithm is put forword to establish a mod?el for the quantitative analysis of three component mixture gases.Collect the concentration signals of CO2,CO and C3H8as the model inputs,through the model regression analysis,the outputs are corresponding mixed gases concen?trations.thus,the problem of mutual interference can be solved.Finally,the performance of the model is analyzed through the experimental data,the result shows that the average error of the model is significantly reduced com?pared to the traditional model.

detection technique and automatic device;gas quantitative analysis;mixed kernel function;adaptive mutation particle swarm optimization algorithm;mixed kernel function;SVM

TP274+.2

A

1004-1699(2016)09-1464-07

項目來源:中國計量大學第十九屆學生科研計劃項目(院級)(16-4-26)

2016-04-28修改日期:2016-06-22

猜你喜歡
混合氣體適應度粒子
改進的自適應復制、交叉和突變遺傳算法
Conduit necrosis following esophagectomy:An up-to-date literature review
基于粒子群優化的橋式起重機模糊PID控制
一種基于改進適應度的多機器人協作策略
基于粒子群優化極點配置的空燃比輸出反饋控制
NO、O2及NO2混合氣體考點歸納
混合氣體在聚合物注射成型保壓階段中擴散的分子動力學模擬
基于空調導風板成型工藝的Kriging模型適應度研究
圓柱罐體內氫氣-空氣混合氣體燃燒特性的CFD分析
基于Matlab的α粒子的散射實驗模擬
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合