?

基于自適應加窗spline曲線擬合的拉曼光譜去基線方法

2021-01-06 03:02范賢光康哲銘
光譜學與光譜分析 2021年1期
關鍵詞:曲線擬合階數曼光譜

劉 龍,范賢光, 2*,康哲銘,吳 怡,王 昕, 2*

1. 廈門大學航空航天學院儀器與電氣系,福建 廈門 361005 2. 傳感技術福建省高等學校重點實驗室,福建 廈門 361005

引 言

拉曼散射又稱拉曼效應,是一種基于激光的光譜技術,由印度物理學家拉曼(Raman)[1]于1928年首先發現。作為一種鑒定分子結構的重要手段,拉曼光譜可提供有關分子振動的定量信息,可用于研究組織和細胞內分子的化學組成和結構。同時,拉曼光譜又具備無損傷、無需標記等優點,在生物醫藥、食品監測以及各種疾病診斷等多個領域得到廣泛應用[2-3]。

然而,由于自發拉曼信號很弱,僅為原始激發光信號強度的10-8左右,在利用拉曼光譜儀測試中,不可避免的受到熒光背景干擾,出現基線漂移現象,嚴重影響拉曼光譜的分析應用能力。因此,減少基線漂移,提高拉曼光譜信號的信噪比,變得至關重要。目前,解決該問題的主要策略分為兩大類: 改進實驗方法和數值處理。改進實驗方法中,有偏振調制法,高頻調制法和門控法等[4-6]。雖然可以在一定程度上減少基線漂移,但是其結構復雜、造價昂貴,一般由實驗室自行搭建,用于前沿科學研究,推廣難度相對較大。數值處理中,有頻域濾波、小波變換和曲線擬合等[7-10]。頻域濾波是對拉曼信號進行傅里葉變換,然后設計合適濾波器進行濾波處理的方法。盡管頻域濾波有一定的效果,但是這種方法可能造成拉曼光譜的人為扭曲,且參數設計復雜。小波變換是對拉曼信號作分解處理,得到一系列不同頻率正弦波,實現基線去除的目標。然而,不同拉曼光譜的噪聲和基線頻率不盡相同,尋找一個通用的分解方法比較困難,且計算量和計算復雜度也相對較高。曲線擬合是將拉曼信號中的基線通過多項式擬合出來,然后從拉曼光譜中去除。但是,擬合階數不易確定,且容易導致欠擬合或過擬合現象的發生。階數選擇過少,會導致欠擬合; 階數選擇過多,會導致過擬合。為實現拉曼信號基線的完美去除,需要對信號進行大量的嘗試,計算量相對較大且耗時。本文在不增加實驗設備成本的前提下,針對傳統基線校正的方法進行了改進,提出一種基于自適應加窗spline曲線擬合的拉曼光譜去基線方法,該方法不僅可以夠克服擬合階數不易確定和計算復雜的難題,而且還具備樣條曲線平滑去噪的優點。有效地消除拉曼光譜信號的基線漂移,較好的保留一些較弱的拉曼特征峰,為進一步分析光譜數據和實現拉曼成像提供準確可靠的信息。

1 算 法

1.1 spline曲線擬合原理

spline曲線擬合是將一些指定點連接成一條光順曲線,具有樣條曲線平滑和計算相對簡單的優點,廣泛應用于船體和機翼外形設計等對光滑性要求較高的造型中[11-12]。其中,3次樣條函數,不僅有著較高的精度,而且方便操作。在本文中,將其用于拉曼光譜基線的擬合。

待擬合區間[a,b]分為n段:a=x0

S(x)=S(xj)=aj+bjx+cjx2+djx3,

x∈[xj,xj+1] (j=0, 1, …,n-1)

(1)

其中,共有4n個待定系數,且滿足如下的條件。

(2)

考慮到本文是實現拉曼光譜的基線擬合,首尾兩端處需要具備有連續性和光滑性,所以在首尾兩端滿足第一種邊界條件: 給定y=f(x)在端點的一階導數。

(3)

聯立式(1),式(2)和(3),即可求得三次樣條函數S(x)。

1.2 基于自適應加窗spline曲線擬合算法

3次樣條函數S(x)具備樣條曲線平滑的特點,使用其擬合拉曼光譜基線的同時,又可實現對基線的平滑作用,達到一定的去噪功能。故此,本文基于3次樣條函數S(x),提出了基于自適應加窗spline曲線擬合算法校正基線,其原理如圖1所示。利用3次spline函數擬合算法,通過自適應加窗去基線峰值循環迭代,不斷逼近光譜信號基線,原始信號扣線基線后,即可實現基線校正后的光譜。信號處理方法的基本步驟如下:

(1) 輸入原始拉曼信號R(n維向量)和拉曼峰值搜索的初始步長step1;

(2) 利用譜峰識別算法,對R以step1進行初始搜索,得到R峰值坐標集合。并以概率統計的方法,估算峰值出現頻率最多的頻段位置,得到優化的峰值搜索步長step2。再以step2重復上述操作,得到拉曼光譜谷值搜索的優化步長step3;

(3) 借助譜谷識別算法,對R以step3進行搜索,得到R谷值坐標集合,利用spline函數擬合基線r。再以概率統計的方法,估算谷值出現頻率最多的頻段位置,得到初始加窗函數的寬度Win_step;

(4) 再次利用譜峰識別算法,對r以step3進行搜索,得到r峰值坐標集合,并在峰值位置,對稱加窗去峰值。為防止出現邊緣效應,對r兩端附近出現的峰值加半窗處理。然后利用spline函數擬合基線,得到r1。逐點比較r1和R,取較小的點賦值給r1;

(5) 返回步驟(4)繼續執行,并重新賦值step3=step3/i,Win_step=Win_step/i,其中i是循環次數。直至自適應窗函數寬度Win_step低于閾值Win_min;

(6) 校正后的光譜信號Rcorrect=R-r1。

圖1 自適應加窗spline曲線擬合去基線流程圖Fig.1 Process of baseline fitting by adaptive windowed spline fitting

2 實驗部分

2.1 材料和儀器

選用乙酸丁酯、PMMA作為實驗樣品。實驗儀器選用由QE65Pro,拉曼光纖探頭,激光器組成的模塊化拉曼系統。其中,叉光纖一端接785nm激光器,另一端接光譜儀。

2.2 方法

將實驗樣品乙酸丁酯,PMMA分別置于比色皿和自封袋中,設定激光功率為500 mW, 積分時間為10 s,利用實驗室搭建的模塊化拉曼系統,完成樣品測試,獲得原始拉曼光譜數據R。其中光譜拉曼位移范圍為200~3 300 cm-1,光譜分辨率為1 cm-1。在拉曼光譜擬合基線前,首先設定合適的拉曼峰值搜索的初始步長step1?;谧V峰識別算法,經優化搜索得: step1設定在40~80cm-1范圍最優。本文中選用step1為70 cm-1,完成初始基線r的擬合,如圖2所示。

然后,利用本文算法完成對初始基線的進一步擬合,如圖3所示。由圖3可知,擬合基線能夠很好的通過原始拉曼信號各谷值點,同時擬合基線在拉曼光譜信號特征峰集中的位置區間能夠很好地捕捉到各個特征峰基點; 在特征峰分散的位置區間,又能夠很好地與原始光譜信號逼近,且基線整體變化平緩。

圖2 原始拉曼光譜和初始基線r (a): 乙酸丁酯; (b): PMMAFig.2 Original spectra and its original baseline r (a): n-Butyl acetate; (b): PMMA

圖3 原始拉曼光譜和自適應加窗spline曲線擬合基線 (a): 乙酸丁酯; (b): PMMAFig.3 Original spectra and its baseline by adaptive window spline fitting (a): n-Butyl acetate; (b): PMMA

最后,基于求得的擬合基線,完成拉曼光譜信號基線的校正,如圖4所示。由圖4可知,本文算法校正基線后的拉曼光譜,很好地保留了光譜信號的特征峰段信息。同時,沒有出現多余的波峰,且較好的保留一些較弱的拉曼特征峰,可以用于進一步的消噪平滑以及特征峰的識別和匹配。這為本文算法的可行性和良好性能提供了有力的證明。

圖4 自適應加窗spline曲線擬合去除基線 (a): 乙酸丁酯; (b): PMMAFig.4 Raman spectra after the baseline correction by adaptive window spline fitting (a): n-Butyl acetate; (b): PMMA

3 結果與討論

為進一步驗證本文算法的良好性能,選取傳統多項式擬合方法,零相位高通濾波器[13]和BEADS[14]算法(Baseline estimation and denoising with sparsity)進行比較,圖5給出了三種算法校正乙酸丁酯基線的結果。其中,圖5(a)給出了多項式擬合基線的結果。由于多項式階數對基線擬合結果有較大的影響,本文采用三階和六階作為擬合對照組。由圖5(a)可看出,對于樣品乙酸丁酯的光譜信號,在使用三階多項式擬合基線時,在拉曼位移為2 200 cm-1左右兩側出現了明顯的過擬合和欠擬合現象,擬合基線基本上沒有通過光譜信號的谷值點; 六階多項式擬合基線時,在一定程度上改善了過擬合現象,但是在拉曼位移為2 200~3 000 cm-1范圍,欠擬合現象反而嚴重。因此,傳統多項式擬合基線需要在階數上進行優化,然而擬合的階數又因樣品不同會有所差異,造成多項式擬合基線算法的通用性能不佳。

圖5(b)給出了零相位高通濾波擬合基線的結果,其中濾波器設計采用chebyschev1型。由于濾波器的階數和通帶波紋δ影響擬合結果,本文采用階數1,2,通帶波紋δ為0.1,0.5擬合四組基線。由圖5(b)可看出,在拉曼位移1 600 cm-1左右,基線發生了不同程度的過擬合和欠擬合現象。比較圖5(b)中的擬合基線1和3,2和4可知: 階數相同,δ越大,在拉曼位移1 600 cm-1右側的欠擬合現象有所改善; 比較圖5(b)中的擬合基線1和2,3和4可知: 階數越小,δ相同,在拉曼位移1 600 cm-1左側的過擬合現象有所改善。因此,濾波器擬合基線需要在多個參數之間進行耦合優化,計算較為復雜。

圖5 乙酸丁酯拉曼光譜及其基線 (a): 多項式擬合基線; (b): 零相位高通濾波擬合基線; (c): BEADS擬合基線Fig.5 Raman spectra of n-Butyl acetate and its baseline (a): Baseline by polynomial fitting; (b): Baseline by zero-phase high-pass filtering; (c): Baseline by BEADS fitting

圖5(c)給出了BEADS擬合基線的結果。BEADS算法常用于處理色譜信號,但是也可用于處理其他含有基線干擾的信號。這里用以對照,驗證本文算法的性能。由圖5(c)可知: BEADS算法整體擬合良好,僅在拉曼位移1 170~1 210 cm-1范圍,出現了過擬合現象; 在拉曼位移600 cm-1左側,出現了一定的欠擬合現象。因此,BEADS算法應用到拉曼光譜信號基線去除時,整體性能良好,但是局部擬合結果有待提高。

綜上所述,采用基于自適應加窗spline曲線擬合的拉曼光譜去基線方法,充分利用了spline函數的光滑特性,克服了傳統多項式擬合基線階數不易確定的缺陷,濾波器擬合基線參數設計復雜的弊端,和BEADS算法擬合基線局部性能不佳的瑕疵。同時,在原始光譜信號出現嚴重基線漂移現象時,本文算法仍能夠擬合出光滑的基線,且不易出現欠擬合和過擬合的現象,較好的保留一些較弱的拉曼特征峰,實現了較好的基線校正效果,為進一步分析光譜數據提供準確可靠的信息。

4 結 論

提出了一種基于自適應加窗spline曲線擬合的拉曼光譜去基線方法,首先利用譜峰、譜谷識別算法,借助優化搜索步長得到谷值擬合曲線,然后針對擬合曲線峰值自適應加窗去除并利用spline樣條函數重新擬合基線,最后利用循環迭代的形式,直至窗寬小于閾值,從而實現對拉曼光譜信號基線校正。與傳統多項式擬合基線和濾波器擬合基線等相比,本文算法克服了階數難確定,參數復雜的缺陷,并且整體和局部擬合基線結果較好,通用性能強。同時,對于基線漂移較大的光譜信號,也能夠獲得較好的校正效果,能夠很好地避免欠擬合和過擬合現象。因此,本文提出的算法可以作為一種有效的基線校正方法應用到實際中。

猜你喜歡
曲線擬合階數曼光譜
關于無窮小階數的幾點注記
確定有限級數解的階數上界的一種n階展開方法
曲線擬合的方法
基于曲線擬合的投棄式剖面儀電感量算法
Matlab曲線擬合工具箱在地基沉降預測模型中的應用
Matlab曲線擬合法在地基沉降預測中的應用
一種新的多址信道有效階數估計算法*
關于動態電路階數的討論
BMSCs分化為NCs的拉曼光譜研究
便攜式薄層色譜-拉曼光譜聯用儀重大專項獲批
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合