?

基于度中心性的認知特征選擇方法

2021-09-18 06:22張笑非黃佳進
計算機應用 2021年9期
關鍵詞:心算特征選擇人腦

張笑非,楊 陽,黃佳進,鐘 寧,5*

(1.北京工業大學信息學部,北京 100124;2.江蘇科技大學計算機學院,江蘇鎮江 212003;3.磁共振成像腦信息學北京市重點實驗室,北京 100124;4.北京林業大學人文社會科學學院,北京 100089;5.前橋工科大學生命科學與信息學系,群馬前橋371-0816,日本)

(*通信作者電子郵箱zhong@maebashi-it.ac.jp)

0 引言

人腦包含諸多功能特定的腦功能網絡(Functional Brain Network,FBN),每個功能網絡又由特定的興趣點(Region Of Interest,ROI)構成。人腦在執行需要注意力的認知任務時,一些腦區的活躍度會增加,而另一些則會降低。功能核磁共振成像(functional Magnetic Resonance Imaging,fMRI)研究的一個熱點就是對大腦血氧水平依賴(Blood Oxygen Level Dependent,BOLD)活動所蘊涵的信息進行分析。Naselaris等[1]認為fMRI 編碼/解碼(Encoding/Decoding)是兩個互補的操作,其中fMRI 解碼能夠通過BOLD 活動來預測實驗刺激相關信息。Correia 等[2]通過對雙語被試口語單詞翻譯的fMRI解碼研究,發現口語翻譯過程中語義信息的激活再現發生在大腦前顳葉中。故大腦皮質體素或大腦圖譜ROI選擇的合理性對于fMRI解碼的有效性至關重要。因此,本文提出一種在fMRI功能連接ROI度中心性(Degree Centrality,DC)計算的基礎上,通過統計對比入組被試整體相同ROI 在執行認知任務時不同認知狀態間的差異顯著性,并以此差異顯著性作為認知特征選擇的依據。此外,在認知特征選擇結果的基礎上,計算人腦認知體系子系統的認知特征指數(Cognitive Feature Index,CFI)和相應的人腦認知系統曲線下面積(Human Brain Cognitive Architecture-Area Under Curve,HBCA-AUC),從而對提出的方法和其他特征選擇方法進行比較。

1 人腦認知體系與認知特征

Fox 等[3]通過研究人腦靜息狀態下對是否任務相關的二分表現程度,發現了大腦在執行目標導向任務時活躍加強腦區所構成的任務正相關網絡(Task Positive Network,TPN),以及活躍降低腦區所構成的任務負相關網絡(Task Negative Network,TNN);此外,初級感覺與運動皮質由于對這兩類網絡都沒有內在的偏好,因此不屬于這兩類網絡中的任意一個。如圖1(a)所示,Power 等[4]通過靜息態功能核磁共振成像(resting state fMRI,rs-fMRI)功能連接研究了健康成年被試的腦功能結構,發現了任務正相關系統(Task Positive System,TPS)由至少3 個主要的子網絡構成,即背側注意網絡(Dorsal Attention Network,DAN)、前額葉-頂葉網絡(Frontal-Parietal Network,FPN)、扣帶回-島蓋網絡(Cingulo-Opercular Network,CON),而任務負相關系統(Task Negative System,TNS)僅僅由一個子網絡構成,即默認網絡(Default Mode Network,DMN)。Yeo 等[5]研究認為,TPN 包括FPN、DAN,以及腹側注意網絡(Ventral Attention Network,VAN)。Hermans等[6]的研究認為顯著網絡(Salience Network,SN)也屬于TPN。Carhart-Harris 等[7]和Tagliazucchi 等[8]以及將視覺網絡、聽覺網絡、體動網絡歸類為低階認知網絡(Lower Cognitive Network),區別于TPN 和TNN 共同構成的高階認知網絡(Higher Cognitive Network)。Markwalter 等[9]認為小腦整合傳遞有關內部和外部環境信息的各種神經輸入,雖然小腦輸入的功能和組織對運動協調、適應和學習等認知活動的作用還有很多未解之謎,但是其毋庸置疑是人腦感覺運動處理的關鍵中心。因此,本文將視覺網絡(Visual Network,VN)、聽覺網絡(Auditory Network,AN)、感覺-運動網絡(Sensori-Motor Network,SMN)、小腦網絡(Cerebellum Network,CN)都歸類為任務支撐系統(Task Support System,TSS)。綜上,本文將人腦認知體系定義為三大系統,即TPS、TNS、TSS。由于Power-264中的記憶提取網絡(Memory Retrieval Network,MRN)、皮質下網絡(SubCortical Network,SCN)缺少文獻證據,以及還擁有一個包含28個ROI功能網絡非確定的集合,因此對Power-264的人腦認知體系劃分結果如圖1(b)所示。

圖1 大腦圖譜的功能網絡及其認知體系Fig.1 Functional networks of brain atlases and their cognitive architectures

圖1(c)給出的是大腦圖譜Dosenbach-160[10]中定義的160個ROI和對應的6個腦功能網絡,圖1(d)是將其160個ROI在人腦認知體系上的劃分結果。如表1 所示,其每個腦功能網絡都能明確對應到TPS、TNS、TSS 中的一個,即每個ROI 能夠劃分到人腦認知體系的特定子系統,此時將ROI 作為認知特征則具有較好的解釋性。不同于以解剖學定義大腦譜圖AAL(Automated Anatomical Labeling)[11]進行的fMRI 研究、如宋源等[12]通過統計特性隨機森林進行特征選擇從而更好地識別出精神分裂癥患者,對人腦認知活動的研究依賴對人腦認知體系的深入理解。當然,對包括Dosenbach-160、Power-264 等大腦圖譜在人腦認知體系上劃分的準確性并不是本文的研究重點,而是旨在對特定認知任務下產生的fMRI數據進行有效的認知特征選擇,并能夠利用人腦認知體系子系統自身功能的特異性對認知特征選擇的準確性進行評價。

表1 Dosenbach-160大腦圖譜的人腦認知體系劃分Tab.1 Human brain cognitive architecture division of Dosenbach-160 brain atlas

2 方法框架及評價標準

2.1 認知特征選擇方法

度中心性是研究大腦網絡的一種基本指標,例如,夏銳等[13]通過研究遺忘型輕度認知障礙患者靜息態fMRI腦網絡、認為度中心性是一種衡量情景記憶能力的潛在指標。因此,本文提出一種基于度中心性的腦功能網絡特征選擇方法(Degree Centrality based Cognitive Feature Selection Method,DC-CFSM),其框架包括兩個階段,如圖2 所示。其中第一階段(Stage1)是對認知實驗產生的fMRI 數據進行功能連接分析,得到每個ROI在不同實驗條件下的度中心性,即大腦圖譜中與該ROI共激活(co-activation)的ROI數量占比。第二階段(Stage2)則對相同ROI 在執行認知任務時不同認知狀態的度中心性進行統計對比,根據差異的顯著性進行認知特征的選擇,即差異越顯著則越適合作為認知特征。

圖2 DC-CFSM的框架Fig.2 Framework of DC-CFSM

2.1.1 ROI度中心性

度中心性的計算首先需要構建大腦圖譜的功能連接矩陣,即計算每對ROI 之間的關聯系數,通常采用Pearson 關聯系數r值。r值本身是一個[-1,+1]內的浮點數,在判斷相應ROI對之間是否存在網絡概念上的邊時,本文則在其r值基礎上求得認知實驗入組被試s在認知狀態c下的關聯顯著性矩陣Ps,c,如式(1)所示:

其中:ps,c,i,j是被試s在認知狀態c下大腦圖譜第i個ROI 和第j個ROI 之間的關聯顯著性P值;n是大腦圖譜中ROI 的個數。由于ps,c,i,j=ps,c,j,i,即Ps,c是一個對稱矩陣。此外,因為每個ROI 自身是完全相關,因此ps,c,i,i為0,即Ps,c對角線上的元素都為0。

其次,通過關聯顯著性ps,c,i,j值判斷相應ROI 對之間是否存在網絡概念上的邊時,需要通過顯著性水平(Significance Level)α值作為閾值進行判斷,即ps,c,i,j<α時,則認為ROI 對之間存在網絡概念上的邊;反之則不存在。因此,該值的選擇對之后的度中心性計算結果將產生重要的影響,但更需要重視的一個問題就是統計分析上是否存在假陽性,這里采用FDR(False Discovery Rate)方法進行校正,Ps,c經過校正后得到P's,c,如式(2)所示:

其中:p's,c,i,j是ps,c,i,j經過校正后被試s在認知狀態c下大腦圖譜第i個ROI和第j個ROI之間的關聯顯著性P值;P's,c仍然是一個對角線元素均為0的對稱矩陣。這里,α值設為統計分析常用的0.05,則可由P's,c得到鄰接矩陣As,c,如式(3)所示:

其中:As,c是一個對角元素全為0 的對稱二值矩陣。對于As,c中的非對角線元素as,c,i,j,當P's,c中相應元素p's,c,i,j<α且i≠j時,as,c,i,j=1;反之as,c,i,j=0。

最后,被試s在認知狀態c下大腦圖譜第i個ROI 的度中心性DCs,c,i的定義如式(4)所示:

2.1.2 認知特征顯著性

認知特征顯著性本質上就是量化被試組所有被試同一ROI 的某個屬性對于認知任務不同認知狀態的區分度,通常對認知狀態區分度越大的ROI越適合作為認知特征。為了方便統計對比不同認知狀態同一(如第i個)ROI的度中心性,首先將所有入組的所有被試在同一認知狀態c下同一(如第i個)ROI度中心性構成一個序列DCc,i,如式(5)所示:

其中S是認知實驗中所有入組被試構成的被試集合。

每一個(如第i個)ROI對認知狀態的區分能力,即認知特征顯著度CFSi定義如式(6)所示:

其中:C是認知實驗中所有實驗條件誘發的認知狀態所構成的認知狀態集合;|C|表示C中元素的數量,k=|C|且|C|≥2;Test 是所選擇的統計檢驗方法,對輸入的多個度中心性序列DCc,i(c∈C)進行統計對比并返回差異顯著性P值。當k=2時,Test可以采用T 檢驗、卡方檢驗;當k≥3時,Test可以采用方差分析(ANalysis Of VAriance,ANOVA)。大腦圖譜中ROI的認知特征顯著度數值越小,越適合作為認知特征。

2.2 認知特征評價方法

本文對認知特征評價的基本思路是對人腦認知體系每個子系統所包含ROI 的認知特征顯著性相對大腦圖譜所有ROI的認知特征顯著性在序上的優先性進行度量。因此,這里設計了一個用于評價人腦認知體系的CFI 計算算法,其中BA是大腦圖譜中所有ROI 構成集合,CFS是大腦圖譜所有ROI 的認知特征顯著度CFSi所構成的集合,BA中的元素與CFS中的元素一一對應。HBCA(人腦認知體系)是一個集合的集合,其自身元素TXS(認知子系統)是一個由大腦圖譜BA中ROI 構成的非空集合,BA中每個ROI 屬于且僅屬于HBCA的一個元素,即TXSu∩TXSv=?,u≠v,且TXSu=BA。算法返回參數CFIS(認知特征指數集)是一個集合,其每一個元素CFIu(認知特征指數序列)是與HBCA每一個元素TXS(u認知子系統)相對應的單調遞增序列,|CFIu|=|BA|+1 且|CFIu|=|CFIv|(u≠v)。算法的具體步驟如下:

CFIS的元素CFI是一個從0到1的單調遞增序列,該序列對應曲線的線下面積代表HBCA中相應認知子系統所包含ROI 作為認知特征的整體質量,即線下面積越大表示該認知子系統在認知實驗過程中的作用越大。因此,認知子系統的認知特征指數CFI對應的人腦認知體系線下面積如式(7)所示:

其中:CFIu是HBCA中第u個認知子系統對應的認知特征指數序列。CFIu中的第一個元素0只是為了便于CFI算法設計,并不參與HBCAaucu值的計算。

3 實驗與結果分析

實驗數據來自國際網絡智能協會(Web Intelligence Consortium,WIC)研究院(http://wi-consortium.org/)的認知實驗“簡單加法/減法心算”[14-15],該認知實驗目標是研究人腦在進行簡單加法或簡單減法時大腦神經活動的規律,共接受了21 名(男12,女9)統計學上無差異的受試者參加。該實驗由WIC 團隊在首都醫科大學宣武醫院進行、并獲得院方倫理委員會的批準。

fMRI 數據處理包括預處理和基于DC-CFSM 的認知特征選擇兩個階段。第一階段的預處理是采用SPM(Statistical Parameter Mapping)[16]完成,包括切片時間校正、頭動校正、空間歸一化,以及平滑處理四個步驟。第二階段認知特征選擇DC-CFSM 的實現采用的是Python 語言及相應的工具包,其中神經影像處理基本操作采用的是NiBabel(https://nipy.org/nibabel/),Pearson 關聯系數計算、FDR 校正,以及統計檢驗對比采用的是SciPy[17]。

本文利用提出的DC-CFSM 計算出Dosenbach-160 大腦圖譜每個ROI分別在簡單加法認知狀態和簡單減法認知狀態下的度中心性,然后通過在被試群體上對每個ROI 在兩種心算認知狀態下的度中心性進行T檢驗統計對比,并根據T檢驗P值的顯著性作為認知特征選擇的依據。圖3 給出了差異性P值小于0.05共25個ROI在兩種認知狀態下的度中心性值,這些ROI來自TPS、TNS及TSS的數量分別為18、0和7。

圖3 基于DC-CFSM的認知特征排序結果Fig.3 Ranking results of cognitive features based on DC-CFSM

圖4 給出的是基于Dosenbach-160 的CFI 曲線和HBCAAUC 結果,TPS、TNS 及TSS 的HBCA-AUC 值分別為0.669 2、0.304 0 和0.468 5。TSS 中最優認知特征是Dosenbach-160 中的18 號ROI,該ROI 是前扣帶回皮質中的一個區域,在所有ROI 中也只能排到第38 位,即TSS 的CFI 曲線首次上升的橫坐標位置。TPS 中的ROI 占據了Dosenbac-160 中最優的8 個認知特征,且全部來自TPS 中的前額葉-頂葉網絡,這與Artemenko等[18]認為成人大腦的心算加工依賴于前額葉-頂葉網絡的觀點相符合。因此,其CFI曲線在橫坐標最開始的8個坐標點上一直處于上升過程,其HBCA-AUC 相較于TNS 和TSS 更高、CFI 曲線也最先達到了最高值。TPS 中最劣認知特征是Dosenbach-160 中的74 號ROI,即中腦島的一個區域,在其之后還有7個ROI和5個ROI分別來自TNS和TSS。

圖4 DC-CFSM的HBCA-AUC Fig.4 HBCA-AUC of DC-CFSM

實驗在相同fMRI 數據上使用了極限樹(Extremely randomized Trees,Extra Trees)、自適應提升(Adaptive Boosting,AdaBoost)、隨機森林(Random Forest)、極限梯度提升(eXtreme Gradient Boosting,XGB)這4種方法計算了Dosenbach-160 中所有ROI 的特征值并進行了排序,并在此基礎上計算了人腦認知體系三個子系統的HBCA-AUC 值,其結果與DC-CFSM 的結果如圖5 所示。Extra Trees、AdaBoost、隨機森林、XGB、DC-CFSM 這5 種方法在TPS 上的HBCA-AUC 分別為0.547 8、0.587 5、0.538 3、0.487 8 和0.669 2,這說明DCCFSM 在這5 種方法中最傾向于選擇TPS 中的ROI 作為認知特征。同樣,這5 種方法在TNS 上的HBCA-AUC 分別為0.382 2、0.432 3、0.552 2、0.456 3 和0.304 0,這 說 明DCCFSM 在這5 種方法中最不傾向于選擇TNS 中的ROI 作為認知特征。

圖5 不同方法的HBCA-AUC值Fig.5 HBCA-AUC values of different methods

如表2所示,采用DC-CFSM 時TPS 的HBCA-AUC 值(0.669 2)比極限樹、自適應提升、隨機森林、極限梯度提升這4 種方法的HBCA-AUC 值,即識別率分別提高了22.17%、13.90%、24.32%和37.19%。相應地,采用DC-CFSM 時TNS的HBCA-AUC 值(0.304 0)比其他4 種方法的HBCA-AUC 值,即誤識率分別降低了20.46%、29.70%、44.96%和33.39%。

表2 DC-CFSM與其他方法的性能對比Tab.2 Performance comparison between DC-CFSM and other methods

Arsalidou等[19]對數字和心算涉及的大腦區域進行的元分析(Meta-Analysis),Dehaene 等[20]對大腦心算進行的通路分析,Klein 等[21-22]利用概率纖維跟蹤方法得到心算處理通路的證據及對數字認知中三碼模型結構連接的分析,都表明心算處理始終會激活成人大腦TPS 中的FPN,包括頂上小葉(Superior Parietal Lobule,SPL)和頂下小葉(Inferior Parietal Lobule,IPL)等頂葉區域,以及額葉下回(Inferior Frontal Gyrus,IFG)、額中葉等額葉區域回(Middle Frontal Gyrus,MFG)和左上額回。Peters 等[23]通過回顧分析,認為兒童的心算處理通常也會涉及到一個與成人心算類似的FPN。Wallis等[24]認為FPN 和CON 在控制工作記憶中起不可分割的作用,其中FPN在注意準備和記憶定向期間負責感知皮層自上而下的活動調節,而CON 在認知控制中起到偏下游的作用、可能與記憶的輸出門控有關。Hagiwara 等[25]對心算任務中的工作記憶進行了功能連接分析,發現額葉和頂葉在工作記憶任務中會協同工作。Dimitriadis 等[26]通過研究發現DMN(TNS 中唯一的功能網絡)在執行心算任務時可能會出現鈍化,并認為該鈍化現象可能源于認知任務期間功能網絡活化的抑制作用。

雖然Extra Trees 的結果從心算認知機制上具有可解釋性,但其計算得到HBCA-AUC 在TPS 上的結果并不顯著高于在TSS 上的結果。類似地,AdaBoost 計算得到HBCA-AUC 在TSS 上的結果也不顯著高于在TNS 上的結果。隨機森林方法得到的HBCA-AUC 在TNS 上的結果比TPS 上的結果略高,這使得在心算認知機制上很難解釋。XGB 方法得到的HBCAAUC 在TPS 上的結果雖然比在TNS 上的結果略高,但均低于在TSS 上的結果,這使得對心算認知機制解釋時具有一定的難度。DC-CFSM 得到的HBCA-AUC 在TPS 上的結果均顯著高于在TNS 和TSS 上的結果、且在TSS 上的結果也顯著高于在TNS 上的結果,因此,相較于其他4 種方法,DC-CFSM 在認知特征選擇上具有最好的心算機制解釋性。

4 結語

本文基于腦功能網絡的度中心性度量,以ROI 在不同認知狀態下的差異顯著性作為認知特征選擇的依據,通過HBCA-AUC 對幾種方法的性能進行了對比,驗證了本文提出的DC-CFSM在認知特征選擇上的優越性。具體體現為:

1)基于人腦功能劃分定義人腦認知體系及其子系統,并對所參考大腦圖譜的ROI 進行歸屬劃分,使得認知特征的選擇和排序具有更好的解釋性;

2)常規的特征選擇方法只是從計算方法上進行特征的選擇,而以度中心性作為特征選擇的依據更能突出ROI 之間共激活而表現出的全局性;

3)本文方法得到的認知特征排序結果更加偏向TPS、且更加偏離TNS,相較于其他方法的結果在認知神經科學上具有更好的自洽性。

雖然本文方法得到的結果在性能評估上最優、且具有更加合理的認知神經科學解釋性,但作為特征能夠對認知計算模型的作用還有待進一步研究。此外,本文方法的通用性還需要在多樣性的大腦圖譜和多來源的fMRI 數據集上作進一步驗證。

猜你喜歡
心算特征選擇人腦
人腦擁有獨特的紋路
讓人腦洞大開的建筑
基于智能優化算法選擇特征的網絡入侵檢測
故障診斷中的數據建模與特征選擇
創意無限的另類漢堡
reliefF算法在數據發布隱私保護中的應用研究
一種多特征融合的中文微博評價對象提取方法
一道難題
從心算大師失算談思維慣性
一道難題
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合