?

基于自適應主成分分析維度尋優的腦力負荷識別

2022-11-01 05:40曲洪權王飛月龐麗萍
科學技術與工程 2022年26期
關鍵詞:降維電信號腦力

曲洪權, 王飛月, 龐麗萍

(1.北方工業大學信息學院, 北京 100144; 2.北京航空航天大學航空科學與工程學院, 北京 100191)

腦力負荷是一個多維的概念,它涉及工作要求、時間壓力、操作者的能力和努力程度、行為表現和其他許多因素[1]。研究表明,腦力負荷是影響作業績效的重要因素,當作業人員腦力過高時,作業決策的錯誤率會增加,從而導致人因事故的發生[2]。因此,對作業人員進行腦力負荷識別對于提高作業效率,減少人因事故發生具有重要意義。

早期測量腦力負荷的方法主要有行為績效法和主觀評估法[3]。但是,在實際應用時二者都由于其局限性難以進行腦力負荷狀態的實時評估[4]。隨著生物信號檢測技術的發展,諸多科學家嘗試了使用生理信號進行腦力負荷識別,并且發現腦電(electroencephalogram, EEG)信號與腦力負荷狀態具有很高的相關性[5-7]。因此,基于腦電信號的腦力負荷研究成為目前最廣泛的腦力負荷研究方法。并且諸多研究表明,在不同的腦力負荷狀態下,腦電信號在theta、alpha、beta和gamma這4個頻段的功率譜變化敏感。因此,腦電信號在各個頻段中的功率譜也成為近年來腦力負荷研究中最多常用的生理信號特征[8-10]。

然而,在腦電信號的處理中,采集得到的原始腦電信號在各個頻段經過提取特征后會存在明顯的冗余性和無關性。這是由于腦電信號是由多通道腦電帽采集的,采集得到的腦電信號中除了有用的腦電信息外還會存在一些通道之間的重復以及噪音,這會導致計算負荷過高以及準確性降低。特別是在樣本數量較小時,樣本在高維空間中分布會非常稀疏,會影響到分類結果的準確性以及有效性。因此,在特征提取之后,需要對高維特征進行特征選擇或特征融合處理,降低特征空間維度,從而降低計算負荷并提高分類性能。Zhang等[11]比較了5種主要特征選擇算法的腦電信號分類準確性,包括核譜回歸,局部性保留投影,主成分分析,最小冗余最大相關性和Relief,以及4種不同的機器學習分類器,即K-最近鄰、樸素貝葉斯、支持向量機和隨機森林。姜月等[12]提取結合時-頻-空域的初始特征向量, 用主成分分析(principal component analysis, PCA)降維并保留累積貢獻率大于85%的主成分特征, 得到的主成分特征向量用支持向量機分類, 得到91.9%的識別率。Matin等[13]利用主成分分析和獨立成分分析對腦電特征進行降維,然后使用支持向量機對腦電信號進行分類。

針對視覺和操作類任務,現提出一種自適應主成分分析維度尋優方法,并將該方法應用在腦力負荷識別中。由于目前應用主成分分析(PCA)[14]算法進行特征提取的腦電信號識別研究中,對于降維維度的確定大都是通過設定累計貢獻率閾值來確定[12,15-16]。但是,對于同一實驗下的多組數據,由于設備、誤差等原因,數據分布有所差別,導致由相同的累計貢獻率得到的降維維度不一致,在后續訓練分類器時無法確定特征的統一降維維度。為了解決這一問題,本文研究借鑒K-means聚類算法中K值的確定方法[17-18],確定主成分分析的最佳降維維度。該方法考慮在同一種實驗中得到N組實驗數據,通過分析現有的N組實驗數據特征通過主成分分析降維后在各個維度上的分類表現,得到該實驗數據集的最優降維維度。通過該方法得到的最優降維維度可以應用在同實驗的其他數據中,從而為該實驗得到的腦電數據找到一個通用的降維維度,提高識別性能。

現通過5個步驟實現腦力負荷的識別:首先對實驗測量的各組腦電信號進行預處理,其次對預處理得到的腦電信號數據進行特征提取,得到腦電信號的功率譜密度特征,再通過主成分分析算法得到尋優維數范圍各個維度的低維特征,之后利用自適應主成分分析維度尋優方法得到該實驗數據集的最優降維維度,最后將得到的最優維度應用在同實驗的其他數據中對其進行腦力負荷識別。使用該方法進行腦力負荷識別不僅可以提高識別效率,而且有利于同實驗中多組數據的統一研究。

1 自適應主成分分析維度尋優

該方法可以利用實驗數據集中所有實驗數據的信息,在所需尋優維數范圍內求出該實驗數據集的最佳降維維度。需要解決的問題是,給出一個包含不同負荷狀態下的多組實驗腦電實驗數據的數據集,并利用實驗數據集中的N組實驗數據在所需尋優維數范圍[1,M](M

如圖1所示,自適應主成分分析降維維度尋優共分兩個步驟完成。第一步,通過對降維的特征數據訓練分類器,得到尋優維數范圍內各維度的分類精度集合。首先將實驗數據集中的每組實驗數據分別進行特征提取得到實驗數據特征集并確定要查找的最優維度的范圍[1,M],之后將每組數據的特征矩陣分別使用主成分分析算法降維至[1,M]的每個維度并歸一化得到M個維度的實驗歸一化低維特征集,再將每組低維特征數據分別進行訓練分類器并將該維度N組數據的自測試精度求和得到該維度的實驗數據集維度特征分類精度,最后得到M個維度的實驗數據集的分類精度集合W。第二步,根據實驗數據集各維度特征的分類精度,自適應尋優得到實驗數據集的最優降維維度p。首先將數據集的分類精度集合W進行尺度變換得到與其相對應的維度范圍尺度相同的集合X,之后將集合X中的數據與其對應的維度封裝成M個數據對并繪制出實驗數據集維度-精度曲線,再通過計算各維度與其相鄰兩個維度連線之間夾角的正切值得到相鄰維度夾角正切值集合T,集合T中最大正切值對應的維度便是該實驗數據集的最佳降維維度p。

圖1 自適應主成分分析維度尋優概述Fig.1 Overview of adaptive principal component analysis dimension optimization

特征數據降維至p維后進行分類識別,可以在保證分類精度損失較少的情況下,減少分類器的工作量,縮短工作時間,從而提高分類效率。

1.1 特征提取及主成分分析

腦電信號分析可以采用不同的信號處理方法。本文使用已被證明在腦電信號識別中有效的功率譜密度(power spectral density,PSD)估計方法來提取原始信號中的有用特征[8-10]。許多功率譜密度(PSD)估計方法被研究人員用于信號分析。本文利用Thomson多窗譜估計(multitaper spectrum method,MTM)的方法進行功率譜密度估計[19]。MTM方法通過將數據乘上一組正交的窗口函數,計算出一組相互獨立的功率譜估計,可以最小化半帶寬外的頻譜泄露,其中最常用的正交窗為一組相互正交的離散橢球序列(discrete prolate spheroidal sequences,DPSS)。由于腦電信號序列長度為12 min,為了減少隨機起伏,在對腦電信號的各個頻帶特征提取時,首先把信號序列分為若干個2 s的片段,對每段分別使用MTM法計算其在各個頻帶的功率譜密度,然后將頻帶中各個片段的功率譜密度取平均,作為該頻帶完整腦電信號序列的功率譜密度特征。

由于一組腦電信號數據中包含多個電極的腦電信號序列,導致在提取了4種節律的功率譜密度特征后得到的特征矩陣維度過高,導致后續識別模型復雜度過高,因此需要對高維的特征矩陣進行降維處理,本文選用的降維算法是主成分分析算法[14]。主成分分析算法通過線性映射的方法將原始的N維數據降至k維(k

另外,為了將降維后的功率譜密度特征歸一化處理,采用Z-score方法[20]。并使用歸一化后的特征用來作為分類器的輸入。

1.2 自適應維度尋優

假設實驗數據集提取出來的功率譜密度特征經過主成分分析算法降維并歸一化后在最優維度的范圍[1,M]內的分類精度集合為W={w1,w2,…,wM}。將各個維度與其對應的分類精度封裝成M個數據對繪制成實驗數據集的維度—分類精度曲線,如圖2所示,可以發現該曲線是一個“手肘型”曲線,隨著維度的增加,數據特征所保留的信息不斷增多,分類精度逐漸增加,并且在“肘部”分類精度驟然變大,曲線相鄰三點之間連線的夾角更接近直角。這與K-means算法的手肘法求解最優K值十分相似,曲線的“肘部”為最優的降維維度。

圖2 維度-分類精度曲線Fig.2 Dimension-classification accuracy curves

為了準確找到曲線的“肘部”,需要將由分類精度集合W繪制的曲線的橫縱坐標調整為相同的尺度,經過尺度變換后的集合X={x1,x2,…,xM}可由式(1)求得。

(1)

式(1)中:Wmin為集合W的最小值;Wmax為集合W的最大值;M為集合W中數據個數。

曲線上維度與其相鄰兩個維度連線之間夾角的正切值tanθi可由正切公式求得,計算公式為

(2)

式(2)中:i=2,3,…,M-1;ki,i+1=xi+1-xi為維度xi與xi+1兩點連線的斜率;ki-1,i=xi-xi-1為維度xi-1與xi兩點連線的斜率,因此式(2)又可表示為

(3)

式(3)中:i=2,3,…,M-1。

兩連線之間夾角越接近直角,其角度的正切值越大。因此,找到最大正切值對應的維度,則找到了該曲線的“肘部”,也就是最佳維度。

自適應維度尋優具體方法實現如下。

輸入:實驗數據集在最優維度的范圍[1,M]內的分類精度集合W={w1,w2,…,wM}。

輸出:最優降維維度p。

(1)根據式(1)將集合W進行尺度變換得到集合X。

(2)將集合X內M個變換后的數據與其對應的維數封裝成M個數據對。

(3)根據式(3)計算[2,M-1]維度與其相鄰兩個維度連線之間夾角的正切值得到集合T={tanθ2,tanθ3,…,tanθM-1}。

(4)獲取集合T中最大值對應的維數賦值給變量p。

(5)返回p值。

2 實驗與分析

2.1 實驗與數據預處理

本實驗被試為同專業的10名研究生,其年齡在22~24歲,身體健康且為右利手,視力或矯正視力正常。實驗前對被試進行培訓,充分熟悉任務操作。實驗平臺為基于多任務航空情境操作的 MATBⅡ平臺,被試需要在規定時間內對隨機出現的4個子任務(系統監控任務、追蹤監控任務、通信監控任務和資源管理任務)做出反應操作。實驗設置了兩個實驗水平:低負荷和高負荷。不同實驗水平通過子任務呈現不同頻次實現,其中低負荷的任務出現頻次為1次,高負荷任務出現頻次為24次。本實驗腦電采集系統為32電極通道的Neuroscan Neuamps 系 統 (Syn-amps2,Scan4. 3,EI Paso,USA),其中A1和A2電極被設置為參考電極,分別位于左耳和右耳后面。腦電的采樣頻率為1 024 Hz。

本實驗中每名被試均分別在連續9 d的白天及夜晚進行實驗,在每次實驗時需要分別完成兩種負荷下12 min的任務(在完成不同負荷任務中間經過充分休息),并在每次實驗后使用NASA-TLX量表評價該次實驗的合理性,最終共得到180組實驗數據。在數據分析前對每組數據進行預處理,首先將A1和A2的平均值作為參考,并利用0~45 Hz帶通濾波器進行濾波,之后利用重疊滑窗的方式對數據進行切分(切分長度為30 s,重疊長度為15 s)每條數據可以得到47個片段,兩種負荷狀態共94個片段。由于一組腦電數據共有30個通道,采用標準的4個頻帶對每個片段進行特征提取,得到每組數據的特征總維數為120維,尋優維度范圍確定為[1,20]。

2.2 實驗結果

本實驗選擇支持向量機[21-22]分類器作為分類方法對腦力負荷進行分類,將兩種負荷腦電信號提取得到的4個節律的功率譜密度特征作為支持向量機的輸入,選取線性核為核函數。為了得到最優模型參數,對每組數據采用網格搜索法進行篩選,懲罰系數C的搜索范圍為[0.01,1,10]。并且為了確保模型的魯棒性和減少過擬合,在分類算法中進行了交叉驗證分析。

本實驗隨機選擇腦電實驗數據集中的70%的實驗數據(共126組)作為訓練集進行實驗數據集自適應主成分分析維度尋優,并將剩余30%實驗數據(共54組)作為測試集進行后續性能測試。訓練集實驗數據自適應主成分分析維數尋優結果如圖3所示,分別展示了訓練集實驗數據在[1,20]維度上的維度-精度曲線圖以及每個維度與其相鄰兩個維度連線之間夾角的正切值柱狀圖,從圖3可以看出8維對應的點為維度-精度曲線的“肘部”,并且在正切值柱狀圖3中8維時正切值最大,因此經過維度尋優得到的最優維度為8維。

將得到的最優維度分別應用在訓練集以及測試集的實驗數據上,即將腦電實驗數據提取的4種功率譜密度特征降維至8維并利用支持向量機分類器進行腦力負荷識別。腦電數據特征降維至最優維度與未降維的平均分類精度對比如表1所示。

由表1可知,在訓練集實驗數據中,雖然腦電信號特征從120維降至8維,但分類結果相差并不大,平均分類精度僅丟失2.397%;在測試集實驗數據中,降維至最優維度前后的平均分類精度損失也僅只有2.443%。由此可見,該自適應維度尋優方法可以實現在降低腦電數據特征維度的情況下以較少的分類精度損失降低特征數據維度,降低后續識別模型復雜度,提高識別效率。

表1 維度尋優前后平均分類精度對比Table 1 Comparison of average classification accuracy before and after dimension optimization

為了驗證降維至最優維度的分類性能,分別對比了訓練集實驗數據以及測試集實驗數據的腦電數據特征分別降維至最優維度以及其相鄰4個維度的腦力負荷識別分類精度,即將腦電實驗數據提取的4種功率譜密度特征分別降維至6維、7維、8維、9維與10維后進行腦力負荷識別,腦電實驗數據特征降維至最優特征與其相鄰維度后的分類精度對比如圖4所示。

由圖4可知,在訓練集實驗數據中,當實驗數據特征維度由10維降至9維時平均分類精度下降了0.515%,由9維降至8維時平均分類精度下降了0.262%,當維度由8維降至7維時平均分類精度損失開始激增,下降了0.869%,由7維降至6維時平均分類精度下降了0.811%;測試集實驗數據中同樣體現了相同的規律,當實驗數據特征維度由10維降至9維時平均分類精度下降了0.394%,由9維降至8維時平均分類精度下降了0.236%,當維度由8維降至7維時平均分類精度損失開始激增,下降了0.985%,由7維降至6維時平均分類精度下降了0.828%。由此可見,自適應維度尋優方法可以實現在目標尋優范圍區間中找到分類精度激增的維度閾值,從而實現找到保證分類精度的情況下的最低維度,提高識別效率。

圖4 降維至最優維度與其相鄰維度平均分類精度對比Fig.4 Comparison of the average classification accuracy of dimensionality reduction to the optimal dimension and its neighboring dimensions

3 結論

針對視覺和操作類任務,提出了一種自適應主成分分析維度尋優方法,該方法通過分析現有實驗數據特征通過主成分分析算法降維后在各個維度上的分類表現,得到該實驗數據集的最優降維維度。將該方法應用在腦力負荷識別中,得到如下結論。

(1)該方法可以準確尋優得到實驗數據集的最佳降維維數,整個尋優過程全自動無需用戶交互,應用在腦力負荷識別上實現94.960%平均分類準確率。與未降維數據相比,在數據維度減小了112維的情況下平均準確率僅減少了2.397%。因此,提出的基于自適應主成分分析維度尋優的腦力負荷識別可以有效提高腦力負荷識別的識別效率。

(2)將自適應主成分分析維度尋優方法尋優得到的最優維度應用到同實驗的其他實驗數據上進行腦力負荷識別,發現由該方法尋優得到的最優維度可以有效應用在同實驗的其他實驗數據上,在同實驗其他數據的腦力負荷識別上實現94.957%平均分類準確率。與未降維數據相比,在數據維度減小了112維的情況下平均準確率僅減少了2.443%。因此,提出的基于自適應主成分分析維度尋優的腦力負荷識別可得到同實驗數據集上通用降維維數。

猜你喜歡
降維電信號腦力
基于數據降維與聚類的車聯網數據分析應用
基于窗函數法的低頻肌電信號異常分類仿真
基于單片機的心電信號采集系統設計
降維打擊
神經元電生理模型的構建及分析
腦力百分百
幾種降維算法的研究及應用
腦力對對碰
腦力對對碰
腦力對對碰
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合