?

基于機器學習的低濃度多巴胺快速電化學檢測方法研究

2022-11-24 07:19孫樂圣
中國生物醫學工程學報 2022年4期
關鍵詞:電位電極電流

劉 哲 孫樂圣 于 駿 陸 檸 徐 瑩* 郭 淼

1(杭州電子科技大學自動化學院儀器科學與工程研究所,杭州 310018)

2(杭州電子科技大學信息工程學院,杭州 311305)

引言

多巴胺(dopamine,DA)是一種兒茶酚胺類神經遞質,在哺乳動物的心血管和中樞神經系統起著至關重要的作用,且DA、尿酸(uiric acid,UA)等遞質通常是人體生理健康狀況指示劑,其在體液、尿液和血液中的含量反映各種疾病征兆,因此DA 的準確測量具有重要的生理及病理意義[1]。目前,DA檢測的經典方法有多種,包括熒光法、高效液相色譜法、以及分光光度法[2]等,但以上方法均具有操作復雜、靈敏度低及無法選擇性檢測等缺點[3]。電化學法是現場檢測中常用的應用于遞質檢測方法,該方法具有操作簡單、價格低廉、靈敏度高和選擇性高等優點[4]。循環伏安法(cyclic voltammetry,CV)是其中應用最廣泛的電化學檢測方法之一,既能定性分析電化學反應特性,又可以測定電化學參數用于定量檢測待測物,在神經遞質等微量特征物檢測和分析中取得了尚佳的效果[5,6]。

在電化學檢測應用過程中,需要恒電位儀施加高精度電位來維持傳感器的電化學穩定,以得到較準確的輸出信號。本課題組研究了一種基于STM32單片機的便攜式恒電位儀系統,用于DA 溶液的現場快速CV 檢測。然而,恒電位儀普遍存在功能模塊靈敏度和穩定性較低的問題。為提高DA 溶液的檢測精度,利用納米金屬材料高比表面積的特性,結合電沉積技術制備了一種納米修飾層玻碳電極(AuNPs/GCE)以放大前端檢測信號,較其他修飾電極,該電極具有制備簡單、靈敏度高、價格低廉和重復性好等優點,適合用于大樣本量下的DA 分子的快速重復性測定[7,8]。

目前,基于CV 法定量分析DA 濃度的研究中,大多數是利用峰電流和濃度擬合的方法進行未知濃度的測定,例如,Guan 等[9]求取峰電流與DA 濃度間的線性回歸方程作為估計未知濃度的參考,傳感器的靈敏度反映為方程斜率。采用擬合法預測未知濃度時,需要嚴格控制恒定的實驗環境和實驗參數。實際上,在利用恒電位儀系統對DA 溶液進行CV 快速檢測時,隨著實驗人員、實驗環境和實驗要求的不斷變化,無法保證不產生其他干擾因素,這極大影響了CV 曲線對DA 濃度的表征。已有眾多文獻報道了關于影響DA 在修飾電極上CV 響應的重要因素。Ghanbari 等[10]對pH 值如何影響DA電化學反應進行了研究。結果顯示,DA 的陽極峰電位隨pH 的增加發生負向線性移動,隨著pH 值的增加,陽極峰值電流也會增加,當pH 值為7.0 時,陽極峰電流達到最大,隨后電流信號逐漸減小。同時電流響應隨掃速的增加呈線性增加,峰值電流與掃描速度的平方根呈線性關系。Shashikumara等[11]研究發現掃描速率在20 ~200 mV/s 范圍內增加時,峰值電流增加,峰值電位略有正移;隨著pH值的增加,DA 的陽極峰電位向較低的正電位轉移??芍?,在對DA 的CV 檢測中,底液的pH 和掃描速率是重要的干擾因素。在對DA 溶液進行現場快速測定時,若pH 和掃速未知,傳統的峰高與濃度擬合分析方法也就沒有了檢測意義。Zhao 等[6]在對胰島素和葡萄糖的多組分檢測中,胰島素和葡萄糖的CV 響應氧化峰發生重疊,僅依靠傳統電化學檢測方法難以解耦氧化電流,實現各組分準確測定,于是引入人工智能算法克服以上問題。據此,本研究利用機器學習算法構建pH 和掃速混雜干擾下的DA 濃度預測模型,實現多干擾下DA 濃度的準確測定。

XGBoost 算法是一種新興機器學習方法,基于梯度提升樹模型構建集成學習模型,以回歸決策樹作為基模型,計算效率高且適用于小樣本數據分析。Cheng 等[12]利用XGBoost 算法可以實現特征重要性排序的特點,對多金屬離子的實驗數據特征選擇最佳特征子集,以提高預測性能。由于不同的干擾因素會對CV 檢測曲線的不同相應特征產生影響,因此,為降低干擾因素對CV 檢測曲線的相應特征產生的影響,本研究在預測濃度前,通過XGBoost對特征參數進行篩選,以降低實驗數據的冗余度,改善預測性能。首先提取CV 曲線中具有代表性的特征值,以濃度為標簽,實現對CV 檢測數據信息的充分挖掘。然后,基于極端梯度提升樹(extreme gradient boosting, XGBoost) 和隨機森林(random forest,RF) 構建了兩階段 DA 濃度預測模型XGBoost-RF;第一階段基于XGBoost 模型計算特征重要性得分,篩選其中得分較高的特征生成新的數據集;第二階段將新特征集輸入到RF 模型中進行訓練和濃度預測。

本研究利用納米修飾電極和兩階段預測模型XGBoost-RF 相結合的方法,提出一種用于多干擾因素下DA 濃度快速測定的方法,不僅彌補了恒電位儀直接檢測靈敏度較低的缺陷,而且可實現遠程監測、便攜檢測等不同實驗場景下對DA 濃度的定量分析,在底液pH 和掃描速率的干擾下,仍可實現對DA 的高精度預測,降低檢測成本。

1 材料與方法

1.1 試劑與儀器

實驗基于自主研發的便攜式恒電位儀系統完成,其中三電極系統組成為:納米材料修飾電極為工作電極,參比電極為Ag/AgCl 電極,鉑絲為對電極[13]。磷酸鹽緩沖溶液(PBS)濃度為0.1 mol/L,DA、氯金酸(HAuCl4)為分析純,實驗用水為去離子水[14]。場發射掃描電子顯微鏡(SU8010,日本Hitachi 公司)。

便攜式恒電位儀系統由三電極檢測系統、下位機和PC 上位機軟件組成,其中下位機是整個系統的核心,作用是將三電極系統中目標分析物的濃度信息利用電化學原理轉化為電信號并傳遞給PC 上位機,進行并行測量。如圖1(a)所示,三電極系統包括恒電位儀、三電極測試電路和電解質溶液,三電極測試電路由工作電極(WE)、參比電極(RE)和輔助電極(CE)組成,其中工作電極作為測試電極,參比電極為測試提供基準電位,輔助電極提供電流輸出,電化學檢測主要是研究工作電極上發生的電極反應[15],如圖1(b)為該系統整體連接實物圖,該系統可進行并行電化學檢測實驗。便攜式恒電位儀下位機選用STM32 單片機作為控制核心,再配合D/A 轉換模塊、AFE 模塊(傳感器模擬前端)、A/D轉換模塊、藍牙通信模塊和電源模塊組成整個下位機系統,如圖1(c)所示。上位機軟件采用模塊化的設計思想,基于QT Creator4.5.0 集成開發環境采用QT C ++框架開發完成,可以運行于平板等便攜終端[16]。

圖1 便攜式恒電位儀系統示意圖。(a)三電極體系原理圖;(b)便攜式恒電位儀并行檢測;(c)系統框架圖Fig.1 Diagram of portable potentiostat system. (a)Schematic of the three-electrode system; (b) Parallel detection diagram of portable potentiostat; ( c)System frame diagram(a)

1.2 電極制備

分別用1.00、0.30、0.05 μm 氧化鋁粉末拋光玻碳電極,并在蒸餾水中超聲清洗。電極在氮氣吹拂下干燥,然后浸入0.1 M H2SO4電解質的0.1%HAuCl4溶液中,在-200 mV(參比電極為Ag/AgCl)單電位模式下進行電化學沉積,時間為30 s。取出后用水沖洗,晾干備用,即得AuNPs 修飾電極(AuNPs/GCE)。

1.3 DA 檢測實驗

以不同pH 的PBS 緩沖液為支持電解質,在不同掃速下對不同濃度的DA 溶液進行重復性交叉CV 檢測,其中底液pH 分別為5.7、6.3、6.7、7.0、7.4、8.0,掃速參數設置為20、50、70、100、120 mV/s,DA 濃度為0.05、0.07、0.10、0.15、0.30、0.40、0.50 mM,共得到1 620組檢測數據。所有實驗均在室溫下完成。

1.4 濃度預測模型

1.4.1 CV 曲線特征參數

對于實驗得到的DA 溶液CV 檢測曲線,不同濃度和檢測條件下的結果曲線具有較大的差異性。其中,隨著目標分析物濃度的提高,檢測曲線的峰電流和峰面積會增大;隨著掃速的增加,氧化峰電流會發生正移,還原峰電流發生負移,峰面積和基線斜率逐漸增大;由于有質子參與DA 的氧化還原反應,所以隨著pH 值的增加,DA 的峰電位和起始氧化還原電位均負移[17]。綜上所述,為了全面體現實驗結果的信息差異性,選擇峰電流、峰電位、基線斜率、峰面積、起始氧化電位和起始還原電位作為模型的特征變量,各個特征參數的詳細描述見表1。

表1 CV 曲線特征參數Tab.1 Characteristic parameters of CV curve

1.4.2 XGBoost-RF 兩階段預測模型

針對獲取的實驗數據集,某些特征參數會成為預測過程的冗余信息,這些特征不僅會降低訓練效率,還增加了預測誤差。XGBoost 充分考慮了數據的稀疏狀況,減小數據集不均衡對模型泛化性能的影響,而RF 方差和偏差都較低,泛化性能優越,為此建立XGBoost-RF 兩階段模型對CV 檢測數據集進行濃度預測。第一階段利用XGBoost 模型選取重要度得分較高的特征,降低特征集的冗余程度;第二階段將新的特征集輸入到RF 模型中進行濃度準確預測。系統流程圖如圖2 所示,結合便攜式恒電位儀系統和XGBoost-RF 實現不同干擾因素下DA溶液的濃度預測共包含5 個部分:不同濃度DA 溶液的配置、基于便攜式恒電位儀系統的CV 檢測實驗、檢測曲線的特征提取、兩階段預測模型和不同濃度DA 溶液的預測結果。

圖2 主要測試系統分析流程Fig.2 Frame diagram of the measuring system

對于單個決策樹計算特征重要性的依據是該特征分割使模型性能提升的程度,而對于整個XGBoost 模型而言,特征的重要性是該特征在每一棵樹中的表現的綜合評估。每一棵回歸樹的目標函數為

式中,loss() 為損失函數,Ω為復雜度,yi、分別為訓練集標簽和預測標簽,xi為特征參數。

利用貪心算法求取目標函數最小的增益,增益函數為

式中,Gi和Hi分別為第i棵樹的一階和二階導常數,λ為常數系數,γ為模型的復雜度代價。增益值越大,葉節點分裂的損失越小,所以在分割節點時,選擇增益最大的特征[18]??傻?,特征i在第t棵回歸樹的重要度公式為

式中,j為節點,L為節點總數,vj為與j的關聯特征。

綜上,特征i在所有樹的重要度得分計算公式為

式中,n為決策樹的個數,t為決策樹的編號。

將1.4.1 小節提取的10 個特征輸入XGBoost模型中,計算特征重要度得分,進而篩選出對結果影響程度較大的特征用于后續的濃度預測。為使不同特征參數間具有可比性,消除不同量綱對模型預測結果的影響,在第一階段XGBoost 模型特征選取前對數據集進行歸一化處理。

RF 是一種集成學習算法,具有運算速度快,抗噪聲能力強,調整參數少,對數據量的要求低等優點,對小樣本數據集具有適用性。其基本單元是二叉決策樹,每棵樹之間獨立同分布,n棵樹可集成為一個森林形成強回歸器。

隨機森林回歸模型的構建過程

步驟1:從樣本集中有放回地隨機抽取部分數據樣本作為決策樹根節點的樣本集;

步驟2:在決策樹的每個分裂節點處,遍歷每個特征,按照最小均方差原則選擇分裂閾值與最優特征;

步驟3:根據節點的分裂屬性進行分裂直至葉節點,葉節點存儲的是決策樹的輸出結果Ot,t為第t棵樹。

步驟4:重復以上步驟m次即形成擁有m棵數的森林。隨機森林模型的輸出值為每棵樹的輸出平均值O,表示為

具體的XGBoost-RF 預測模型算法流程圖如圖3 所示。特別地,為適應數據集維度較低,且特征參數為連續型的特點,步驟2 中RF 模型中在節點分裂時參與判斷的最大特征數選取所有特征數的開方,提高每個樹模型的擬合能力,決策樹的數目選擇為1 000,使模型的泛化誤差收斂于一個極限值,結合以上參數優化提高模型對本實驗電化學檢測數據的預測能力。為驗證所建立的XGBoost-RF兩階段模型對電化學檢測數據的特征提取和訓練等方面的優異性,建立SVR 預測模型作為對比。

圖3 XGBoost-RF 算法流程Fig.3 Flowchart of XGBoost-RF model

2 結果

2.1 AuNPs/GCE 表征結果

利用不同放大功率下的場發射掃描電鏡圖(FESEM)觀察AuNPs/GCE 表面的微觀形貌,結果如圖4(a)所示。GCE 表面相對光滑,在AuNPs/GCE 表面附著有離散的球狀金納米顆粒,顆粒分布較為均勻,且大小接近,直徑范圍主要在50 nm 左右。這些金納米顆粒均勻排布在電極表面,增大了與DA 的接觸面積,提高了對DA 催化氧化的能力。如圖4(b)所示為裸玻碳電極(A)和納米金修飾電極(B)分別在含有0.1 mM DA 的0.1 mol/L PBS(pH=7.3)溶液中的CV 響應結果(參比電極為Ag/AgCl)??芍?,和GCE 相比,DA 在AuNPs/GCE 上的氧化還原峰峰形比較尖銳,尤其是還原峰的響應明顯增大,而兩者的兩個峰電位基本相同。利用裸玻碳電極、AuNPs/GCE(滴涂法)和AuNPs/GCE(電沉積法)分別對同一DA 溶液(0.1 mM,pH=7.3)進行重復性CV 檢測(n=10)。結果顯示,3 種電極下的氧化峰電流均值分別為(4.10±0.39)μA、(4.12±0.39)μA、(6.69±0.36)μA,相對標準偏差分別為9.60%、9.50%、6.69%,其中DA 在電沉積法制備的AuNPs/GCE 下的氧化峰電流最大,且該修飾電極的重復性最優。

圖4 AuNPs/GCE 表征結果。(a)AuNPs/GCE 的FESEM 圖;(b)不同修飾電極對含有0.1 mM DA的CV 測試曲線Fig.4 Characterization results of AuNPs/GCE.(a) FESEM images of AuNPs/GCE; (b) CV curves of different modified electrodes containing 0.1mm DA

以上結果表明,電沉積法制備的AuNPs/GCE修飾電極對DA 的氧化還原反應具有良好的電催化活性,可實現DA 的高靈敏度、高重復性和快速檢測,便于后期針對較多實驗數據,進行干擾環境下的機器學習預測分析。

2.2 底液pH 和掃速對DA 檢測的影響

以AuNPs/GCE 為工作電極,在不同掃速(20、50、70、100、120 mV/s)下檢測含有0.1 mM DA 的0.1 mol/L PBS(pH =7.3)溶液,其他條件不變,共測得300 組CV 數據。其中一組數據結果如圖5(a)所示,隨著掃速的增加,氧化峰電流發生正移,還原峰電流發生負移,峰面積和基線斜率逐漸增大,且峰電流與掃速平方根呈良好線性相關,R-square 為0.87 和0.89。保持其他條件不變,研究底液pH 對DA 檢測的影響,在AuNPs/GCE 電極上對含有0.1 mM DA 的不同pH 值(5.7、6.3、6.7、7.0、7.4、8.0)0.1 mol/L PBS 溶液進行CV 檢測,掃速為50 mV/s,共測得300 組CV 數據。其中1 組數據結果如圖5(b)所示,隨著pH 值的增加,DA 的峰電位和起始氧化還原電位均發生負移,且峰電位分別與PBS 的pH 呈良好線性相關,R-square 均為0.99。同時,在底液pH 從5.3 增加到7.4 時,氧化峰電流逐漸增大,之后隨pH 增大逐漸降低。綜上所述,底液pH 值和掃速是影響DA 在AuNPs/GCE 電極上CV 響應的重要因素,在測定不同濃度DA 時需要嚴格保證底液pH 和掃速不變,否則DA 的直接檢測結果具有較大的誤差。

圖5 AuNPs/GCE 在不同底液pH 和掃速下對DA 的CV 響應。(a)在不同掃速下對DA 的CV響應(插圖為峰電流與掃速平方根關系圖);(b)在不同pH 下對DA 的CV 響應(插圖為峰電位與pH 線性關系圖)Fig.5 CV responses of DA on AuNPs/GCE at different pH and scan rates. (a) CV response of DA at different scan rates ( The internal illustration shows the relationship between peak current and square root of sweep speed);(b) CV response of DA at different pH (The internal illustration shows the linear relationship between peak potential and pH)

2.3 不同濃度DA 在AuNPs/GCE 上的電化學行為

以AuNPs/GCE 為工作電極,保持其他檢測條件不變,對不同濃度DA 溶液(0.05、0.07、0.15、0.30 和0.50 mM)進行CV 檢測,共測得1 500 組CV 數據。其中一組實驗結果(PBS 溶液pH 為7.5,掃速為50 mV/s)如圖6(a)所示,隨著濃度的增大,CV 曲線的氧化峰電流正移,還原峰電流負移,峰面積和基線斜率均逐漸增大。在0.05~0.50 mM 濃度范圍內,峰電流與濃度呈線性相關,R-square 分別為0.99 和0.97。然而,由于測試的便攜化、遠程化及測試人員的影響,利用恒電位儀對低濃度DA 進行快速測定時,不可避免地使多誤差輸入源測量結果混入,如底液pH 和掃速干擾問題。如圖6(b)為不同底液pH 和掃速下對0.15 和0.30 mM DA 溶液的CV 檢測結果??芍?,在不同pH 和掃速的影響下,DA 檢測曲線的特征參數發生很大改變,其中變化較大的為峰電流、峰電位和峰面積,也就無法利用CV 曲線相關特征與濃度之間的線性關系分析不同濃度DA 檢測曲線并準確測定DA 濃度。對此,基于機器學習算法構建兩階段DA 濃度預測模型,在底液pH 和掃速對DA 測定的干擾下,提升了對DA濃度的預測準確性。

圖6 有無干擾因素對不同濃度DA 的CV 響應。(a)無干擾源(插圖為峰電流與DA 濃度線性關系圖);(b)有干擾源Fig.6 CV response under different concentrations of DA with and without interference factors.(a) Without interference(The internal illustration is the linear relationship between peak current and DA concentration); (b) With interference of pH and sweep speed

2.4 pH 值和掃速干擾下的DA 濃度預測

為驗證XGBoost-RF 兩階段模型在不同干擾因素下對DA 濃度預測的優異性,選用經典模型SVR與XGBoost-RF 進行對比。對混有底液pH 和掃速干擾下的1 620組實驗數據提取特征整理成數據集,并進行歸一化處理。分別輸入80%處理后的數據集到SVR 和XGBoost-RF 進行訓練。XGBoost-RF 第一階段基于XGBoost 的特征重要度得分如圖7(a)所示,氧化峰面積、還原峰基線斜率、還原峰電流、氧化峰電流、氧化峰基線斜率和還原峰電位6 個特征占總特征分值的74%,保留以上特征對RF 訓練,但保留全部特征訓練SVR。

圖7 預測結果(箭頭所指為未經訓練的盲濃度)。(a)特征重要度得分;(b)SVR 預測結果;(c)XGBoost-RF 預測結果Fig.7 Prediction results(The arrows indicate the untrained blind concentrations). (a) Feature importance score; (b) Prediction result of SVR;(c) Prediction result of XGBoost-RF

圖7(b)、(c)分別SVR 對全部特征測試集的預測結果和XGBoost-RF 第二階段基于RF 對特征篩選后的測試集具體預測結果。其中,為了驗證預測模型對未經訓練的DA 盲濃度具有有效預測性,在不同干擾因素下(不同pH 值和掃速)采集了兩組不同濃度(0.10 和0.40 mM)DA 溶液的CV 數據,每組各60 個數據樣本,預測結果如圖7(b)、(c)箭頭標示。從圖中整體預測結果來看,對于多濃度下的未經訓練的DA 濃度,SVR 和XGBoost-RF 預測得到的濃度值與實際濃度值間都達到一定擬合度,但RSquare 分別為0.875、0.943,可知XGBoost-RF 較SVR 的預測效果更佳。兩模型的誤差指標結果如表2 所示,相較于SVR 模型,XGBoost-RF 濃度預測模型的MAE、RMSE 和MAPE%分別降低了53.9%、39.7%和2.7%?;赬GBoost 對重要特征進行篩選后,RF 預測模型的訓練時間降低23%,預測準確度提升7%??芍?,對多干擾因素下的DA 濃度預測,XGBoost-RF 兩階段模型具有更為理想的效果。

表2 預測模型誤差指標對比Tab.2 Comparison of error indicators for prediction models

綜上所述,對于多干擾因素下的DA 溶液CV 檢測數據,XGBoost-RF 濃度預測模型實現了高準確度的預測,未來隨著不同濃度DA 溶液檢測數據對模型的訓練,該模型的泛化性能和預測準確度會進一步提高。

3 討論

目前,國內外基于DA 等神經遞質溶液的電化學檢測主要采用循環伏安法、計時電流法等,并圍繞檢測下限展開,這對于實驗人員、實驗條件具有較嚴格的要求[5,19]。隨著生物醫療等行業對DA 等檢測物的現場檢測、遠程檢測、便攜檢測多種需求逐漸提升,造成實驗人員和實驗場景的不斷變化,從而無法確?,F場快速檢測的實驗條件保持一致,導致實驗結果中混雜入不同程度的干擾,對目標物濃度的測定產生重要影響。已有許多研究顯示,對于DA 的CV 響應中,其陽極峰電位隨pH 值的增加發生負向線性移動,陽極峰值電流也會隨著pH 的增加而增加,當pH 值到達一定值時,陽極峰電流達到最大,隨后電流信號會隨著pH 的增加而減??;同時,掃速在一定范圍內增加時,峰值電流會逐漸增大[10-11]??芍?,掃速和底液pH 是對于DA 的CV 快速測定影響較為突出的兩個干擾因素。

為此,針對在多干擾存在的情況下實現DA 的現場快速測定,本研究提出納米修飾電極和機器學習相結合的方法。目前,已有較多文獻報道了關于提高DA 檢測靈敏度的方法。Liu 等[7]曾通過還原HAuCl4合成一款納米金修飾電極,結果顯示其對DA 表現出良好的電流響應,證明了金納米顆粒對DA 分子具有良好的催化效應。Mahalakshmi 等[8]使用LSV 在聚苯胺修飾電極上原位電沉積AuNPs,研究證明沉積金納米顆粒的修飾電極對DA 具有高效的電催化作用。雖然納米金修飾電極在DA 檢測中的靈敏度和有效性已經得到相關研究人員的認可,但是以上納米金修飾電極的制備過程繁瑣且制備成本高,無法適用于DA 的現場快速測定。本研究利用電沉積技術制備了一種簡易的納米金修飾電極(AuNPs/GCE),用于實現DA 溶液的快速檢測。通過SEM 圖像[見圖4( a)]觀察到該修飾電極表面較均勻附著約50 nm 的納米金顆粒,可實現對DA 分子的有效電催化。另外,該修飾電極的制備操作比較簡便,這會有效提高DA 溶液的測定效率,在上千組DA 快速檢測應用中具有較大優勢。

當前,許多研究開始將機器學習算法引入到電化學檢測領域中,以得到更加優異的檢測效果。例如,Schaumloffel 等[20]為分別量化生物柴油樣品中四種抗氧化劑的濃度,采用電化學微分脈沖伏安法和人工神經網絡(ANN)進行結合,有效克服抗氧化劑混合物之間對檢測結果的相互干擾,4 種抗氧化劑的實際濃度與測定濃度間呈現高度相關性。這表明,引入機器學習算法可有效克服不同實驗條件對電化學測定結果的干擾。根據電化學檢測領域的主要干擾源,本研究首先進行了不同底液pH、掃速和不同低濃度DA 溶液的重復性交叉CV 檢測實驗,以探究多干擾因素下的濃度有效測定。然后對實驗曲線提取具有代表性的特征,其中包括峰電流、峰電位、基線斜率、峰面積、起始氧化電位和起始還原電位等,并整理成特征集。根據實驗數據特征參數呈離散化特點,本研究基于XGBoost 和RF構建兩階段DA 濃度預測模型。第一階段基于XGBoost 模型根據特征參數的重要性得分選取得分較高的特征以降低特征冗余度,并提升模型訓練效率。第二階段將選取的特征輸入到RF 模型中進行訓練和濃度預測。結果顯示,相較于傳統SVR 模型,XGBoost-RF 濃度預測模型的MAE、RMSE 和MAPE%分別降低53.9%、39.7%和2.7%,預測準確度提升7%,預測濃度(其中包括未經訓練的盲濃度)與實際濃度間均具有良好擬合度,R-Square 為0.943,這說明該模型具備較高的預測準確度,且通過特征篩選后,模型的訓練時間降低23%,這一點在快速檢測相關領域具有重要意義。從整體結果來看,在對存在多干擾因素下的DA 濃度預測中,XGBoost-RF 兩階段模型表現出優良的泛化性能和測定效率,說明基于納米修飾電極和機器學習相結合的方法具有良好應用前景。

本研究主要工作機制可概況為:首先,采用本領域的主要經典檢測技術——電化學CV 法進行DA 溶液檢測。其次,為進一步提高檢測靈敏度,選取高導電性和催化性能的納米金粒子作為電極修飾材料,放大由DA 氧化反應所引起電流響應,增強DA 定量檢測精確度。為保證修飾電極的信號穩定性和再現性,采取電沉積技術制備表面均勻、具活性位點的納米粒子。第三,對于檢測結果中由于現場檢測中底液pH 和掃速不同等所造成的干擾,對CV 曲線提取重要特征,并構建XGBoost-RF 兩階段濃度預測模型?;跇涞腦GBoost 模型和RF 模型屬于機器學習領域的經典模型,其中XGBoost 通過正則化以及多階導數精確訓練,其內置的稀疏感知算法,適用于本研究中含有多因素以及多特征的小樣本數據。RF 模型通過多個子樹的集成學習并進行隨機采樣,具備更強的抗干擾能力和泛化能力,易于尋找有效特征并挖掘不同因素間的微小差異,實現高精度預測[21]。下一階段將進一步加強多種電化學方法,如CV 法、計時電流法、差分伏安法等與機器學習相結合的分析[20],[22]。CV 法可提取的特征參量雖較多,但由于CV 法除了分析樣品的定量測試,也主要用于電極動力學分析。因此,在后續的研究中,課題將進一步綜合脈沖伏安法、方波伏安法和計時電流法等其它檢測方法并協同分析,擴充代表性特征參數維度,增強實驗數據的多元化及分析準確度,優化機器學習模型,從提高靈敏度和檢測精度的角度實現對低濃度目標溶液在多干擾因素下的定量分析,促進便攜儀器的工程化及商用化。

4 結論

本研究基于納米金修飾電極、便攜式恒電位儀系統和XGBoost-RF 兩階段預測模型在提高DA 現場檢測準確性的同時,進一步有效降低了主要干擾因素-底液pH 和掃速對DA 現場檢測結果帶來的誤差,為在不同實驗環境下實現DA 的現場快速高精度測定提供了新的思路和方法。未來可針對差分脈沖伏安法和計時電流法等共同進行特征提取以提高實驗數據特征參數,進一步提升預測準確度。

猜你喜歡
電位電極電流
電位滴定法在食品安全檢測中的應用
電流“勤勞”的體現
神奇的電流
針對電極事故的控制系統方案應用
電與電流
電鍍廢水處理中的氧化還原電位控制
淺談等電位聯結
三維電極體系在廢水處理中的應用
三維鎳@聚苯胺復合電極的制備及其在超級電容器中的應用
電流變技術在抑制深孔切削顫振中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合