?

基于拉曼光譜的已知混合物組分定量分析方法

2020-11-05 00:59朱啟兵劉財政雷澤民張麗文
光譜學與光譜分析 2020年11期
關鍵詞:譜峰曼光譜混合物

顏 凡, 朱啟兵*, 黃 敏, 劉財政, 雷澤民, 張 恒, 張麗文, 李 敏

1. 江南大學輕工過程先進控制教育部重點實驗室,江蘇 無錫 214122 2. 北京卓立漢光儀器有限公司,北京 101102

引 言

近年來,基于拉曼光譜的檢測分析方法由于具有無損、非接觸、無化學污染、檢測時間短、檢測結果準確、重復性好、適用于大多數有機和無機化合物等優點,在微生物、法醫分析,鑒定可卡因和其他非法藥物的濫用、食品等領域得到了廣泛的應用[1-3]。在利用拉曼光譜進行混合物組分的定量分析時,不同成分的光譜信號相互重疊,并且由于物質分子之間的相互作用導致它們的振動方式與純物質相比有所不同,這給定量分析帶來了很大困難。

檀兵等[4]利用Voigt函數對原始光譜進行擬合以解決多元素共存條件下的譜峰重疊問題;在此基礎上,利用擬合譜峰的中心波長、光強、半峰全寬和譜峰質心構建特征參數向量,解決了傳統譜峰識別方法難以提取譜峰波形形態特征導致的識別率難以保證的問題。

劉燕德等[5]利用600~3 000 cm-1波段的拉曼光譜,并結合支持向量機(SVM), 偏最小二乘(PLS)等定量分析模型分別對三組分食用調和油中各組分進行了快速定量檢測,其中最優PLS模型的決定系數和RMSE分別為0.990 4和0.018 8。高穎等[6]利用非線性最小二乘法將天然氣拉曼光譜分解為純物質組分的拉曼光譜分量和若干個洛倫茲譜峰之和的形式,建立該組分特征峰面積和對應的濃度之間的模型。粟暉等[7]根據混合物光譜向量與其組分參考光譜向量二者間的空間向量夾角值與組分的相對含量存在線性關系,通過少量已知樣本擬合出夾角值與其含量的標準曲線,實現混合物組分的定量分析。近年來,深度學習方法在光譜定量分析中的應用也得到了初步的應用。Fan等[8]提出了一種基于卷積神經網絡(CNN)模型的混合物組分預測方法,得到了比傳統建模方法更優的結果。Zhang等[9]提出了一種無需數據預處理的光譜定量分析方法,該方法利用一個由三個卷積層,一個平坦層,一個全連接層和一個輸出層組成的卷積神經網絡來進行組分定量分析,并報道了比傳統卷積神經網絡更優的結果。以上方法的預測精度與模型的建立好壞有直接聯系,要取得較高的預測精度則需要大量的已知樣本進行訓練。然而不同組分構成的混合物模型也存在著差異,一旦測量環境和測量對象的組成發生改變,則需要重新收集樣本建立分析模型,因此這類方法難以滿足實際應用需要。

針對傳統機器學習方法存在的訓練樣本難以獲得,模型推廣性能差的問題,本研究基于混合物拉曼光譜及其各組分的關系特性,提出了一種非學習的已知混合物組分的拉曼光譜定量分析方法,解決了傳統建模方法需要大量已知樣本并且模型不具有推廣性等問題。

1 實驗部分

1.1 儀器與樣本

本研究的拉曼光譜數據由北京卓立漢光儀器有限公司的手持式拉曼光譜儀(Finder Edge)進行采集。其激發源為785 nm激光器,激光功率和積分時間可調,光譜范圍為150~2 700 cm-1,光譜分辨率為8~10 cm-1。

本文采集了乙醇、乙腈、丙酮、環己烷、二丙酮醇、丙二酸二乙酯六種純凈物的拉曼光譜。利用這6種純凈物制備了十種不同類型的三元混合物,每種混合物樣本依據其組分配置九種不同的體積比,共90個樣本,表1為這6種純凈物構成的不同組分的三元混合物。

表1 十種不同類型的三元混合物Table 1 Ten different types of ternary mixtures

圖1給出了這6種純凈物的原始拉曼光譜圖。由于這6種物質在常溫下都為無色的有機溶劑,具有相似的官能團,而拉曼光譜主要反應物質的分子結構,因此從圖1中可以看出,任意兩種物質的光譜都存在部分譜峰重疊的情況。

圖1 手持拉曼光譜儀采集的六種純凈物的原始光譜Fig.1 The raw spectra of six substances obtained by a handheld Raman spectrometer

1.2 算法流程與原理

本文提出的基于拉曼光譜譜峰強度最小二乘擬合的已知混合物組分直接定量分析方法主要包括光譜預處理、拉曼光譜譜峰分解、和分解后譜峰線性表示求解三個主要環節。其主要步驟說明如下。

1.2.1 光譜預處理

由六種純凈物的拉曼光譜圖1可知,峰位主要集中于240~2 000 cm-1區域內,因此選擇該區域作為光譜區間。圖2(a)為S1樣本在九種不同體積比下的拉曼原始光譜圖,從中可以看出,拉曼光譜儀采集的原始光譜含有較強的熒光背景,為了減少熒光背景對定量分析的干擾,本文采用連續小波變換和懲罰最小二乘法相結合的方法進行背景校正。圖2(b)給出了背景校正后的拉曼光譜圖,從圖中可以看出,校正后的曲線消除了熒光背景產生的基線對物質拉曼光譜的影響,保留了光譜的有用信息。

1.2.2 拉曼光譜譜峰分解

圖2 (a)S1樣本的拉曼原始光譜;(b)S1樣本的預處理拉曼光譜Fig.2 (a) The raw Raman spectra of S1 sample;(b) The preprocess Raman spectra of S1 sample

拉曼光譜的譜峰形態本質上是洛倫茲線型,由于受儀器和被測樣本自身特性的影響,實際測量得到的拉曼光譜譜峰波形通??捎蒝oigt函數來近似表達[11]

(1)

式(1)中,v為波數;α為譜峰強度;w為譜峰所對應的波數;γ為譜峰的半峰全寬;θ為高斯-洛倫茲系數,0≤θ≤1。對含有l個譜峰區域的光譜y進行解析,實際上就是對l個Voigt峰參數βi=(αi,wi,γi,θi), (i=1, …,l)進行擬合

r(v,x)=y(v)-f(v,x)

(2)

利用LMF算法對方程(2)進行求解。圖4為利用LMF算法將光譜分解成單個Voigt峰的示意圖,從圖中可以看出,分解后的Voigt峰能準確反映各峰的形態。

圖3 區域劃分示意圖Fig.3 Schematic diagram of area division

圖4 基于Voigt的光譜分解示意圖Fig.4 Schematic diagram of spectral decomposition based on Voigt

1.2.3 譜峰的線性表示與求解

對于分解為L個Voigt峰的三組分待測混合物光譜y,可得L個方程

(3)

(4)

利用最小二乘法擬合方程(4),獲得組分系數,并對組分系數進行歸一化處理,得到各組分的體積濃度。

1.3 算法評價指標

本文利用線性相關系數r、均方根誤差RMSE和剩余預測偏差RPD作為算法的性能評價指標。其中r反應預測濃度與實際濃度之間的線性相關程度;RMSE反應預測值與真實值之間的偏差;RPD是真實值的標準差與均方根誤差的比值,證明模型的預測能力,一般以RPD在2和2.5之間的值表示可以進行粗略的定量預測,而在2.5和3之間的值對應較好的預測精度,在3以上則表示極好的預測精度。

2 結果與討論

2.1 數據處理

圖5為純凈物乙醇、丙酮、環己烷以及由這三種組分構成的S3樣本在V3(4∶3∶3)體積比混合下經過連續小波變換尋峰方法尋找到光譜的峰位并預估其譜峰特征參數,基于此作為LMF算法的輸入進行擬合分解,峰位在圖5中用空心圓標記,從中可以看到主要的峰位被完全找到,極少出現漏峰和偽峰的情況。圖6為分解后的多個Voigt峰的疊加形式,每個獨立的Voigt譜峰都可以由某種特定成分的分子振動所產生。例如,乙醇拉曼光譜分解后的主要特征峰的峰位882 cm-1(CC骨架伸縮)、1 052 cm-1(CC伸縮)、1 096 cm-1(CC伸縮)、1 247 cm-1(平面內變形)、1 453 cm-1(CH3CH2變形),均能與原始峰位一一對應。從圖6中可以看出,混合物S3-V3的每個Voigt譜峰均能與其三種組分的至少一個譜峰相對應。

圖5 乙醇、丙酮、環己烷和S3-V3的預處理光譜和峰位Fig.5 The preprocessed spectra and peaks of Ethanol, Acetone, Cyclohexane and S3-V3

圖6 基于Voigt的乙醇,丙酮,環己烷和S3-V3的分解光譜Fig.6 The spectra decomposition of Ethanol, Acetone,Cyclohexane and S3-V3 base on Voigt

2.2 混合物和其組分參考光譜同積分時間和功率下的識別結果

對于分解為L個Voigt峰的待測混合物樣本,通過計算每種組分在混合物每個Voigt峰位光強的貢獻值,依據朗伯-比爾定律中光強與其所占濃度的正比例關系,利用式(4)得到混合物各組分的體積濃度。采用本文提出的算法對混合物及其組分在同一積分時間和功率下的光譜進行定量分析,即選擇表1的S1—S5共5種混合物(每種混合物各9個體積濃度比),共45個樣本。表2為根據組分劃分的預測體積濃度與實際體積濃度的R,RMSE,RPD以及含有該組分的樣本個數。從表2中可以發現,六種組分的預測結果相關系數均在0.95以上,均方根誤差都小于6%,并且RPD指標僅乙醇相對較低,為2.921 5,其余五種組分RPD指標均在3.0以上。圖7為6種組分的散點圖,橫軸為實際體積濃度,依據本研究選用的體積比,其取值為0.1,0.2,0.3,0.5和0.7,縱軸為通過算法預測的體積濃度比。從圖中可以看出,六種組分的濃度與其拉曼譜峰光強都呈現較強的正相關。

表2 混合物和其組分參考光譜同積分時間和功率下的結果Table 2 The quantitative analysis results of the mixture and its component reference spectra under same integration time and power

圖7 預測體積濃度與實際體積濃度的散點圖(a):乙醇;(b):乙腈;(c):丙酮;(d):環己烷;(e):二丙酮醇;(f):丙二酸二乙酯Fig.7 Scatter plot of predicted and actual volume concentrations(a):Ethanol;(b):Acetonitrile;(c):Acetone;(d):Cyclohexane;(e):Diacetone alcohol;(f):Diethyl malonate

2.3 混合物和其組分參考光譜不同積分時間和功率下的識別結果

在實際應用中,為了得到信噪比適當的混合物拉曼光譜數據,往往需要對拉曼光譜儀的功率或積分時間進行調整,從而導致混合物與各組分光譜測量條件的差異。為了驗證算法的適應性,論文也對不同積分時間和功率下的混合物識別結果做了測試,即選擇表1的S6—S10共5種混合物(每種混合物各9個體積濃度比),共45個樣本,組分的參考光譜統一選擇光源功率300 mW和積分時間2 s。表3給出了具體的定量分析結果。由表3可知,六種組分的r均大于0.93,最大均方根誤差為7.94%,除了組分乙醇、乙腈的RPD值小于2.5(分別為2.191 5和2.203 0),其余4種組分的RPD值均接近或大于3.0,證明了該算法具有較強的魯棒性。

表3 混合物和其組分參考光譜不同積分時間和功率下的定量分析結果Table 3 The quantitative analysis results of the mixture and its component reference spectra under different integration time and power

3 結 論

提出了一種基于拉曼光譜譜峰強度最小二乘擬合的混合物組分直接定量分析方法。為了驗證算法的可行性,本研究配置了90個三元混合物樣本,其中樣本與其組分參考光譜同功率和積分時間下的45個,不同功率和積分時間下的45個。結果表明,在同功率和積分時間下,所有組分的相關系數都在0.95以上,均方根誤差均小于6%,RPD最低為2.921 5,其余組分RPD指標均在3.0以上;在不同功率和積分時間下,所有組分的相關系數均大于0.93,最大均方根誤差為7.94%,RPD指標相比同功率和積分時間下的略有下降,但仍大于2.0,滿足混合物組分快速定量分析的要求,證明了該算法良好的魯棒性,在實際應用中具有重要的價值。

猜你喜歡
譜峰曼光譜混合物
多組分纖維混合物定量分析通用計算模型研制
正丁醇和松節油混合物對組織脫水不良的補救應用
X射線光電子能譜復雜譜圖的非線性最小二乘法分析案例
基于無基底扣除的數據趨勢累積譜峰檢測算法
Preoperative maximal voluntary ventilation, hemoglobin, albumin, lymphocytes and platelets predict postoperative survival in esophageal squamous cell carcinoma
巖性密度測井儀工作原理與典型故障分析
基于FPGA的二維譜峰搜索算法硬件架構設計
基于拉曼光譜的面團凍結過程中水分分布的在線監測
混合物按照歐盟CLP進行分類標簽
實用拉曼光譜引論
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合