?

基于多相關性的導聯前向搜索算法用于運動想象分類

2020-12-23 06:30殷飛宇王行愚
關鍵詞:腦電導聯受試者

殷飛宇, 金 晶, 王行愚

(華東理工大學信息科學與工程學院,化工過程先進控制和優化技術教育部重點實驗室,上海 200237)

腦-機接口(BCI)系統是指直接跳過大腦外周神經和肌肉的參與,通過意念實現對外部裝置的控制[1]。由于腦電圖(EEG)信號擁有較短的時間常數和相對較高的時間分辨率,因此成為最廣泛應用于BCI 系統中的腦電信號[2-3]。對于不同的受試者,其在進行同一個思維任務時所影響的皮層區域范圍各不相同,所以僅僅通過生理知識和實驗經驗不能完全確定有效導聯位置和導聯使用數量[4],因此實驗中采取多導聯的方式記錄腦電數據[5]。事實上,多導聯采集腦電數據雖然可以獲得較全的腦電信息,但同時也會引入冗余信息,增加數據維度,影響模型性能并且不利于實際使用[6],因此,選擇優質的導聯組合對提升分類精度非常重要。

傳統的導聯優化算法主要分為3 類:(1)基于神經學的先驗知識。分布在運動想象感知皮層的導聯往往會被認為包含更多有效信息而被選為最終導聯組合,例如 C3 和 C4 等[7]。(2)基于 Wrapper 的導聯優化算法。其核心思想以分類器的分類精度作為導聯搜索策略的評價指標,根據分類結果不斷修正所選導聯子集,選擇的導聯分類準確率高但計算開銷大[8]。(3)基于導聯分布的優化策略。根據導聯之間相關性進行排序選擇,選擇強相關導聯作為最優導聯子集[9]。對于同一個范式下的實驗數據,已有的算法往往根據單個相關性進行導聯選擇,但單個相關性會由于受試者之間的差異性而無法對所有受試者的導聯分布進行準確排序選擇。因此本文提出了結合神經學的先驗知識和基于導聯分布優化策略相結合的導聯選擇算法,在選擇位于運動感知皮層的C3 和C4 導聯后,通過多相關性集成算法前向搜索選擇剩余導聯,從而獲得有效導聯組合,減少數據維度和計算量,提高分類精度。同時,以BCI 競賽IV 中的 dataset I 和 BCI 競賽 III 中的 dataset IVa 兩個公共競賽數據集來檢驗算法的可行性。實驗結果表明,運用MCFS 導聯優化算法不僅大幅減少了導聯集的數目,而且分類精度提升明顯,因此選擇策略具有可行性。

1 運動想象腦電信號數據集

數據集1(Dataset 1)采用的是2008 年第四屆國際腦-機接口大賽的數據(BCI competition IV dataset I),由柏林BCI 研究組提供。實驗選擇4 名健康受試者(分別命名為 a、b、f、g),實驗中計算機屏幕上提示進行左手、右手或腳3 種運動想象思維任務,但單次實驗只進行兩類運動想象任務。實驗共包含200 個運動想象任務,降采樣頻率為100 Hz。BCI 研究組使用59 個有效導聯進行腦電數據的采集。實驗步驟如下:

(1)0~2 s,此時計算機黑屏,受試者處于空閑放松的狀態;

(2)2 s,短暫的蜂鳴聲提示受試者實驗即將開始;

(3)2~6 s,屏幕出現向左、向右或向下的箭頭,受試者根據屏幕箭頭提示,完成相應的運動想象任務。

數據集2(Dataset 2)采用2005 年第三屆國際腦-機接口大賽的腦電數據(BCI competition III dataset IVa),5 名健康受試者(分別命名為 aa、al、av、aw、ay)執行右手和腳兩類運動想象任務。實驗采用118 導聯電極帽,按國際標準10-20 導聯放置,BrainAmp 放大器為腦電采集設備,降采樣頻率為100 Hz,共執行280 個運動想象任務。實驗步驟如下:

(1)0~3.50 s,受試者根據屏幕提示執行運動想象任務;

(2)3.50~5.75 s,受試者在 1.75~2.25 s 內的不固定時間段放松。

Dataset 1、Dataset 2 的實驗范式如圖1 所示。

圖 1 Dataset 1(a)和 Dataset 2(b)的實驗范式Fig. 1 Experimental paradigms of dataset 1 (a) and dataset 2 (b)

2 分析方法

2.1 數據預處理

對Dataset 1 和Dataset 2 都采用提示想象信號出現后到提示信號消失的時間窗,分別將2~6 s 和0~3.50 s 時間序列作為分析數據。由于運動想象具有相關同步/去同步現象,其腦電特征在Mu 節律段(主要分布在 8~13 Hz)[10]和 Beta 節律段(主要分布在13~30 Hz)表現最為明顯,同時腦電信號弱,易混入噪聲,信噪比低,因此本文采用8~30 Hz 帶通濾波器對多導聯EEG 信號進行濾波,去除眼電、肌電等干擾信號對腦電信號的影響,同時保留運動想象事件相關去同步/事件相關同步發生的Mu 和Beta 節律段,得到運動想象思維的有效信號。

2.2 MCFS 算法

其中:cos(·)表示導聯 ci和 cj的角度,角度越小,則兩個導聯的相似程度越高,反之亦然。cin和cjn分別表示導聯ci和cj的時間序列長度。

2.2.3 皮爾森相關分析 皮爾森相關分析(Pearson’s Correlation Analysis,PCA)是一種判別變量之間線性相關性的分析方法[12],具體定義如下:

2.2.5 基于多相關性的導聯搜索算法 MCFS 算法主要分為訓練更新信任值和通過信任值進行導聯優化兩個階段:

表 1 各受試者對于3 種相關性算法的信任值Table 1 Trust values of three correlation algorithms for each subject

(1)分別計算導聯之間在互信息、余弦相似性和皮爾森相關分析下的導聯之間的相關性,然后選擇位于運動感知皮層的C3 和C4 導聯,根據隨機初始化的導聯排序前向搜索,通過訓練集訓練模型,在驗證集上交叉驗證,以分類精度作為評價標準。一旦新增加的導聯提高分類準確率,則該導聯被選用,否則被放棄,與此同時根據式(4)更新對3 種相關性的信任值。

(2)隨機初始化導聯排序后,根據3 種相關性的信任值選擇導聯組合。此時導聯組合f 由P1(P1=0.9)概率的信任值和 P2(P2=0.1) 概率的投票共同決定,然后對導聯組合f 進一步優化。前向搜索導聯組合f,提取共空間模式(CSP)特征后輸入以線性核SVM作為分類器訓練模型,以10 次交叉驗證的分類精度作為評價標準,輸出最優導聯組合fbest。

MCFS 算法流程圖如圖2 所示。

2.3 共空間模式

CSP 算法是一種廣泛使用的腦電信號預處理算法,能夠有效地提取差異性特征[13]。該算法通過設計空間濾波器對腦電信號進行空間投影,使得兩類信號的方差差異性最大,進而實現對兩類信號的分類識別。Xi∈RN*T

假設濾波后的腦電數據為 (N 為有效導聯數目;T 為每個通道的采樣點),則規定單次腦電信號EEG 的空間協方差矩陣求解如下:

圖 2 MCFS 算法導聯選擇流程圖Fig. 2 Flow chart of channel selection with MCFS algorithm

對腦電信號進行特征提取,將投影后的信號Zp做如下變換得到fp,fp即為兩類運動想象任務的特征值。

2.4 交叉驗證

為了減少模型過擬合的可能性,交叉驗證是一個有效的方法[14]。為防止信任值的參數信息被提前學到,本文將數據集分為訓練集(80%)、驗證集(10%)和測試集(10%)。在訓練集上創建模型,通過驗證集10 次交叉驗證修正對3 種相關性的信任值,最終在測試集上測試模型的分類性能。

3 結果與分析

3.1 信任值優化

MCFS 導聯優化算法通過更新3 種相關性的信任值優化最終的導聯組合。從表1 中不難看出,相比其他兩種相關性,互信息的信任值越高,在選擇導聯上的效果越好。對于Dataset 1 的4 名受試者而言,受試者g 的互信息和余弦相似性的信任值非常接近;受試者b 的余弦相關性的信任值高于互信息。對于Dataset 2 中的5 名受試者而言,互信息總是值得信賴的,而余弦相似性和皮爾森相關分析的信任值更為接近,仍有一定的參考價值。因此,本文提出以P1概率信任某一種相關性,同時仍然以P2概率保證其余兩種相關性對導聯選擇的作用。

3.2 導聯優化

對于 Dataset 1 和 Dataset 2,實驗中分別采用59 和118 個導聯記錄腦電數據。事實上,多導聯采集腦電數據雖然可以提供充足的腦電信息,但也會帶入冗余信息和引入噪聲,對腦電分類精度造成影響。本文采用MCFS 算法來選取有效導聯,不但可以減少數據復雜度和計算量,還可以提升分類精度。圖3 示出了選擇全部導聯(All Channels, AC)和所有受試者通過MCFS 導聯搜索算法各自選擇的導聯數。從圖中可以清晰地看出,經過MCFS 算法選擇后,導聯數大幅減少(Dataset 1:59vs13,Dataset 2:118vs35),各受試者經過AC 和MCFS 算法選擇的導聯數如表2 所示。

如表2 所示,對于Dataset 1 中的4 名受試者而言,通過MCFS 算法優化導聯組合后,導聯數目大幅減少,其中受試者a 保留11 導聯,減幅81%;受試者b 保留 4 導聯,減幅 93%;受試者 f 保留 13 導聯,減幅 78%;受試者 g 保留 24 導聯,減幅 59%;4 名受試者平均選擇13 導聯,減幅接近78%。

對于Dataset 2 中的5 名受試者,采用MCFS 算法選取導聯后,受試者aa 僅從118 導聯中選取25 導聯,減幅79%;受試者al 選取28 導聯,減幅76%;受試者 av 選取 52 導聯,減幅 56%;受試者 aw 選取51 導聯,減幅 57%;受試者 ay 選取 19 導聯,減幅84%;5 名受試者平均從118 個電極中選取35 導聯,減幅約為70%。

由此可見,MCFS 算法在降低導聯數目上具有明顯的優勢,因此可以通過MCFS 算法選取導聯數目,節約建立模型時間,有利于在線系統的使用。圖4示出了所選導聯的分布情況。對于Dataset 1,圓圈的顏色表示導聯被選中的次數,其中α 表示該圓圈內導聯被選中的次數;對于Dataset 2, β 表示該圓圈內導聯被選中的次數。如圖4(a)所示,選擇的導聯(α≥2)主要分布在運動感覺區,符合生理學的認知,對于圖 4(b)而言,選擇的導聯(β≥3)也仍然符合這一生理學認知。不僅如此,從圖4 中也可以看出,由于受試者之間的差異,每個受試者所選擇的導聯仍有一定的區別,因此也會出現導聯相對分散的情況。

圖 3 各個受試者在AC 和MCFS 算法下的導聯選擇數Fig. 3 Numbers of channels selected by each subject under AC and MCFS algorithm

表 2 各個受試者在AC 和MCFS 算法下的導聯選擇數Table 2 Numbers of channels selected by each subject under AC and MCFS algorithm

圖 4 Dataset 1 和Dataset 2 的導聯選擇分布圖Fig. 4 Distribution of selected channels for dataset 1 and dataset 2

3.3 導聯優化算法

將MCFS 算法與其他3 種算法進行比較,結果如表3 和表4 所示。其中AC 算法將所有導聯采集的腦電數據用于運動想象分類任務中。3C 算法僅將 3 個通道(即 C3、Cz 和 C4)所采集的 EEG 數據應用于運動想象分類任務中,可以減少因準備時間不足而導致精度降低的問題。CSP-rank 算法是基于CSP 濾波器排序的導聯選擇算法,該算法首先根據濾波器系數絕對值對濾波器分類排序,然后從兩個濾波器中依次選擇次最大濾波器系數值,如遇到重復導聯,則在該濾波器下重新選擇次最大濾波器系數值,直至選到新的導聯。

從表3 和表4 可以看出,無論是單個受試者的分類精度還是不同數據集的平均分類精度,MCFS 算法都有最好的表現。

表 3 Dataset 1 在不同導聯選擇算法下的分類精度Table 3 Classification accuracy of dataset 1 with different algorithms

表 4 Dataset 2 在不同導聯選擇算法下的分類精度Table 4 Classification accuracy of dataset 2 with different algorithms

3.4 導聯優化算法比較

為了進一步體現MCFS 導聯優化算法的優越性,將MCFS 算法與同一數據集的其他方法相比較,結果如表5 所示。文獻[15]提出的智能多目標粒子群導聯選擇算法獲得了60.47%的平均分類精度,相比于MCFS 算法準確率降低了20.53%。Qiu等[16]通過改進序列前向搜索導聯優化算法(Improved Sequential Floating Forward Selection,Improved SFFS),將分類精度提高至67.25%,但是該算法平均精度仍比MCFS 算法低13.75%。文獻[12]提出的基于互信息的導聯選擇算法(僅選用文章中的CCS-CSP 算法),得到平均分類精度78%,比本文算法低3%。

表 5 Dataset 1 在不同導聯選擇算法下的分類精度Table 5 Comparison of classification accuracy with different algorithms for dataset 1

表6 示出了MCFS 算法與其他算法在Dataset 2 上的比較結果。Barachant 等[17]提出的基于瑞利熵的方法,得到78%的平均分類精度,比MCFS 算法低9.4%。Arvaneh 等[18]提出空間稀疏共空間模式(Sparially Sparsed Common Spatial Pattern),提升運動皮層區導聯選擇的權重,減弱非運動皮層區導聯權重,其平均精度比MCFS 算法低5.12%。Belwafi 等[19]提出對腦電信號實現動態濾波的WOLA-CSP 算法得到62.79%的平均分類精度,與MCFS 算法相比低20.11%。Feng 等[20]提出基于多頻帶的CSP 特征提取算法,通過Lasso 算法進一步提取有效特征組合,獲得82.48%的平均分類精度,與MCFS 算法相比低4.92%。

表 6 Dataset 2 在不同導聯選擇算法下的分類精度Table 6 Comparison of classification accuracy with different algorithms for dataset 2

綜上所述,本文提出的MCFS 算法對提升模型的分類性能具有良好的效果。

4 結 論

針對運動想象腦-機接口導聯優化問題,本文提出一種基于多相關性導聯前向搜索(MCFS)算法。該算法可以根據受試者的不同,選擇與運動想象任務相關的腦區所對應的導聯,從而減少無關腦區導聯所采集的腦電數據對分類的干擾。實驗結果表明,對兩個競賽數據集運用MCFS 算法進行導聯選擇時,不僅僅大幅減少導聯數,減少計算量,同時相比傳統算法分類精度也得到較大提升。此外,將MCFS 算法與其他成功的算法相比,仍然可以獲得最高的平均分類精度,同時也為基于運動想象的BCI 系統提供了技術參考。

猜你喜歡
腦電導聯受試者
涉及人的生物醫學研究應遵循的倫理原則
涉及人的生物醫學研究應遵循的倫理原則
認知控制的層級性:來自任務切換的腦電證據*
工作記憶負荷對反饋加工過程的影響:來自腦電研究的證據*
回旋支閉塞引起孤立Ⅰ、aVL導聯ST段抬高型心肌梗死2例并文獻復習
涉及人的生物醫學研究應遵循的倫理原則
18導聯動態心電圖的應用價值研究
涉及人的生物醫學研究應遵循的倫理原則
多類運動想象腦—機接口導聯選擇方法
乒乓球運動員在經驗相關圖形識別中的腦電相干性分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合