?

基于多期動態增強CT 影像組學特征和多分類器分層融合模型預測肝細胞癌的微血管侵犯

2024-03-18 11:30鐘偉雄梁芳蓉楊蕊夢2
南方醫科大學學報 2024年2期
關鍵詞:特征選擇組學分類器

鐘偉雄,梁芳蓉,楊蕊夢2,,甄 鑫

1南方醫科大學生物醫學工程學院,廣東 廣州 510515;2華南理工大學附屬第二醫院(廣州市第一人民醫院)放射科,廣東 廣州 510180;3華南理工大學醫學院,廣東 廣州510006

肝細胞癌(HCC)是全球第5大常見癌癥,也是癌癥相關死亡的第3大原因[1]。盡管醫療技術的進步在治療HCC方面取得了巨大成就,但HCC的預后仍然很差,肝切除術后的5年復發率為70%,肝移植后的復發率為35%[2-4]。微血管侵犯(MVI)是指門靜脈、包膜內血管或內皮細胞襯覆的血管腔中出現癌細胞巢團[5,6]。有證據表明[4,7-9],MVI是肝切除術后復發和不良預后的獨立預測因素。目前,病理檢查是在手術或活檢后確定HCC患者MVI的金標準,但這種方法在樣本污染或術前穿刺活檢時因瘤內異質性而無效的情況下并不可靠[10]。此外,穿刺活檢可能會增加腫瘤意外出血或種植轉移的風險[11]。因此,迫切需要一種準確且無創的方法來早期預測MVI。

影像組學是疾病診斷和預后預測的一種新方法,在基于CT或MRI的影像組學研究中HCC的MVI預測已取得一定的進展[12-16]。然而,大多數研究只包括多期動態增強CT(DCE-CT)或MRI的一個期相,并且目前尚無統一的最佳預測期相,例如,Yao等[17]基于DCE-CT的平掃期、動脈期、門靜脈期及延遲期構建了4個獨立的影像組學模型,結果表明動脈期和延遲期的預測性能要高于門靜脈期;而Zhang等[18]和Ma等[14]的研究結果顯示門靜脈期影像組學特征表現優于動脈期與延遲期。預測性能還與所使用的分類器密切相關,不同的分類器建立在不同的數學模型上,因此在相同的分類任務中會產生不一致的性能。此外,還有其他研究發現不同特征選擇方法和分類器的組合構建的模型的性能存在明顯差異[19,20];與單一分類器相比,分類器的組合能產生更可靠、更準確的預測結果[21,22]。

因此,本研究創新性地提出了一種基于多準則決策的權重分配算法來實現多期相特征及多分類器的融合,并構建了基于多期DCE-CT影像組學特征和多分類器的分層融合模型用于預測HCC的MVI,最后通過與單期相單分類器的模型以及使用其他集成方式的預測模型進行比較,驗證了所提出模型的有效性。

1 資料和方法

1.1 研究對象

本研究經廣州市第一人民醫院機構審查委員會批準,并根據回顧性研究的性質免除了知情同意的要求,收集了于2016年1月~2020年4月在廣州市第一人民醫院接受DCE-CT術前檢查的新診斷HCC患者(倫理審批號:K-2019-079-01)。納入標準為:經手術病理證實的HCC;術前進行了4期DCE-CT檢查;完成術前實驗室檢查。排除標準為:接受過化療栓塞、射頻消融或經導管動脈化療栓塞等抗癌治療的患者;DCE-CT檢查與手術之間的時間間隔超過兩周。所有手術標本均由1名具有14年肝細胞癌病理診斷經驗的病理學家檢查,通過手術病理確認切除腫瘤的MVI狀態。最后,本研究共納入111例HCC患者(MVI陽性:57例;MVI陰性:54例,表1)。

術前DCE-CT在多臺掃描儀上進行,在靜脈注射造影劑后共分4個期相,包括第1期EAP,18~25 s;第2期LAP,35~40 s;第3 期PVP,50~60 s;以及第4 期EP,120~250 s。每個期相的所有圖像都以DICOM格式存儲,并進行了匿名處理。使用ITK-SNAP軟件(http://www.itksnap.org)分別在第1~4期的CT圖像上逐層進行了可見最大腫瘤邊緣的勾畫,這一工作由兩名分別有著4年和15年的放射診斷經驗的醫師完成,兩位放射科醫師勾畫VOI的一致性通過Dice相似系數進行測量。對于Dice系數大于0.9的病例,取兩名醫師勾畫VOI的交集;對于Dice系數小于0.9的病例,兩位醫師通過溝通討論以解決病變邊界的差異,直至達成共識。隨后使用形態學擴張算法自動將輪廓外擴到距離腫瘤邊緣12 mm處,作為本次研究的VOI,而當接觸到肝臟邊緣、膽管或大的血管(血管內徑≥2 mm)時,則觸碰點處的VOI擴張停止,而其他位置的擴張照常進行。

1.2 方法概述

本文提出了一種創新的基于多期DCE-CT影像組學特征和多分類器分層融合模型。該模型不僅將從HCC患者的4個期相的DCE-CT圖像的VOI中所提取的影像組學特征進行融合,還分別在每一期相內融合了7種最常用的弱分類器的決策信息。期望通過這樣的方式,使得模型能夠有效互補不同DCE-CT期相所提供的診斷信息,提高HCC患者MVI的預測性能,并且規避選擇一個最適合分類器的過程。

整個模型包含4個主要部分:特征提取、特征選擇與模型訓練、分類器層面融合以及期相信息層面融合階段(圖1)。訓練過程如下:提取HCC患者多期相DCECT中的影像組學特征;針對不同的基分類器,分別對每一期相提取的特征進行特征選擇;然后,在4個期相中使用篩選出來的最優特征子集分別訓練基分類器,挑選出最佳的特征子集與基分類器的組合用于構建模型;利用一種基于多準則決策的方法為單個分類器和單個期相分配融合權重與。測試過程與訓練過程類似:從待測的患者的DCE-CT中提取在模型訓練過程中所篩選出的最優特征子集中的影像組學特征;將特征輸入到訓練好的基分類器模型中進行預測;利用權重對每一期相中單個分類器的預測結果進行融合;利用權重對多期相信息進行融合,得到最終的預測結果。

圖1 模型框架示意圖Fig.1 Framework of the proposed model.

1.2.1 特征提取 本次研究從每1例HCC患者的4個DCE-CT期相(EAP、LAP、PVP和EP)中都分別提取3大類共109個候選影像組學特征,包括19個一階統計學特征、15個形態學特征和75個紋理特征。紋理特征又包括24個灰度共生矩陣(GLCM)特征、16個灰度區域大小矩陣(GLSZM)特征、16 個灰度游程矩陣(GLRLM)特征、5個相鄰灰度色差矩陣(NGTDM)特征和14個灰度相關矩陣(GLDM)特征(表2)。上述特征均在Python 3.6.2 環境下使用開源影像組學工具包Pyradiomics[23](版本:3.0.1)進行提取。

表2 提取的影像組學特征Tab.3 Extracted radiomics features

1.2.2 特征選擇 對基于影像組學特征的研究來說,從醫學影像感興趣區域中提取出的特征數目往往十分巨大,甚至遠多于所收集的樣本數量,而且存在部分特征與下游任務不相干、特征與特征間相關性大等特征冗余問題。特征選擇則是在模型訓練過程中,從候選特征集中去除冗余特征,提取最優特征子集的過程。本次研究考慮了13種特征選擇算法,包括5種基于信息論的特征選擇方法(CMIM、DISR、JMI、MIFS和MRMR)、3種基于相似度的特征選擇方法(lap_score、fisher_score 和SPEC)、3 種基于稀疏編碼的特征選擇方法(ll_l21、MCFS 和RFS)以及2 種基于統計學的特征選擇方法(gini_index和t_score)。以上算法均由python開源庫scikit-feature[24]實現。

1.2.3 模型訓練 本次研究選擇了7種常用的弱分類器作為基分類器,包括邏輯回歸(LR)、K近鄰(KNN)、線性判別分析(LDA)、支持向量機(SVM)、樸素貝葉斯分類器(GNB)、多層感知機(MLP)和決策樹(DT)。上述算法均由python開源庫scikit-learn[25]實現。在訓練過程中,采用十折交叉驗證的方式,從訓練集劃分出部分樣本作為驗證集,用于評估基分類器的預測性能,對于每一種分類器均使用上一小節中所述的不同的特征選擇算法篩選出的特征子集進行一次訓練,最終選擇出一個在驗證集上表現最優的最優特征子集用于訓練分類器。

1.2.4 基于多準則決策的權重分配算法 針對基于影像組學的多期相DCE-CT在HCC患者MVI預測的具體問題,需要整合不同DCE-CT期相所提供的信息以及多個分類器的診斷結果,因此,需要在分類器層面上和期相層面上進行兩輪的信息融合。為了解決這一問題,我們提出了一種基于多準則決策的權重分配算法來實現多期相特征和多分類器的融合。本文所提出的算法的主要思想是通過綜合多個不同的角度評價指標為多個待評價對象分配恰當的融合權重。而在經驗上的,若一個對象在更多的評價指標上表現更為優異,其分配到的權重應當會更大?;谶@一原則,算法的具體流程如下:首先定義一個評價矩陣D∈Rn×m作為算法的輸入,其中n為待評價對象(如多個分類器或者多個期相)的數目,m為使用的評價指標數目,評價矩陣D可以通過在模型的訓練階段中對驗證集進行性能評估獲得;評價矩陣D首先按列進行歸一化,使得評價矩陣D的每一列之和為1;隨后,根據公式:

計算得到每個待評價對象的權重ωi,其中表示位于矩陣D中第i行、第j列的元素;接著計算權重歸一化因子K;最后,利用權重歸一化因子K對待評價對象的權重ωi進行歸一化得到最終的融合權重。針對此次研究,所提出算法中使用的評價指標為AUC、ACC、SEN、SPE。算法的偽代碼如表3所示。

表3 基于多準則決策的權重分配算法偽代碼Tab.3 Pseudocode of the proposed multi-criteria decision-making-based weight allocation algorithm

1.2.5 多期相和多分類器融合過程 通過上節所述的基于多準則決策的權重分配算法在訓練階段中確定了各個期相及其對應的基分類器的融合權重后,在測試階段,依次根據公式probm=和在基分類器層面以及期相層面進行兩輪決策融合,得到最終的預測概率。公式中的表示分類器c對測試樣本的期相m的預測概率,表示分類器c在期相m中的多分類器融合權重,probm表示測試樣本在期相m下進行分類器決策融合的預測概率,表示期相m的融合權重,prob為最終的預測概率。

1.3 模型驗證和評估

1.3.1 模型驗證

1.3.1.1 單一期相特征和多個期相特征融合的預測性能比較 為了探討期相融合策略中期相的組合與數目對預測性能的影響,一方面,在使用單一期相預測的情況下,分別對4個期相只在基分類器層面進行一輪決策融合;另一方面,在使用任意2、3個期相組合和全部4個期相預測的情況下,在基分類器層面進行一輪決策融合的基礎上再對期相層面進行第二輪決策融合,對他們的預測性能進行比較。因此,一共可以獲得15個模型,分別表示為和(其中1、2、3、4分別表示EAP、LAP、PVP、EP)。

1.3.1.2 與單期相單分類器的預測性能比較 為了探討分類器決策融合策略對預測性能的影響,針對所提出的模型,一方面,我們分別對4個單期相特征下基分類器與特征選擇算法的組合的性能進行了比較;另一方面,我們還將基分類器與單期相特征下進行分類器決策融合后的模型進行了性能比較。

1.3.1.3 不同基分類器多樣性的預測性能比較 為了探討基分類器多樣性對預測性能的影響,本實驗將參與決策融合的基分類器個數從1個依次增加至7個,對比了這7種模型的預測性能。

1.3.1.4 與集成方法的預測性能比較 本研究還將所提出的模型與8種基于集成方法的分類器進行了對比,分別為AdaBoost[26]、Bagging[27]、CatBoost[28]、Extra Trees[29]、GBDT[30]、LightGBM[31]、Random Forest[32]和XGBoost[33]。具體來說,先將4個期相的特征使用拼接的策略進行融合,再經過特征選擇篩選出最優特征子集后訓練這些集成分類器用于預測。

1.3.2 評價指標 本次研究采用五折交叉驗證的方法對所提出的方法進行評估。評價指標包括ROC 曲線、AUC、ACC、SEN、SPE,公式分別如下:

其中,TP為真陽性,TN為真陰性,FP為假陽性,FN為假陰性。

2 結果

2.1 單一期相特征和多個期相特征融合的預測性能比較

對于單期相融合結果來說,第2期(LAP)有著較高的AUC和SEN,第4期(EP)有著較高的ACC和SPE,而第1期(EAP)的預測性能稍差;對于多期相融合結果來說,融合第2期(LAP)、第3期(PVP)和第4期(EP)獲得了最高的AUC、ACC和SPE,而融合全部的4個期相獲得了最高的ACC和SEN(表4)。

表4 使用單期相和多期相特征決策融合的性能比較Tab.3 Comparison of the performance of models using single-phase feature decision fusion and multi-phase feature decision fusion

2.2 與單期相單分類器的預測性能比較

每個期相下最優最差的分類器與特征選擇算法的組合均不相同,在期相層面進行第二輪決策融合后取得了最優的結果,其中AUC、ACC和SEN有了較大的提升,而SPE僅次于第4期的融合結果(表5)。圖2分別展示了4個期相中每個基分類器的ROC曲線。

圖2 多分類器分層融合模型與其4個期相中每個基分類器的ROC曲線對比分析Fig.2 ROC curves of multi-classifier hierarchical fusion model proposed in this study with each of its base classifiers in the 4 phases.A:EAP;B:LAP;C:PVP;D:EP.

表5 本研究所提出的方法與單期相單分類器結果比較Tab.3 Comparison of the results by the proposed method and those of models with a single phase and a single classifier

2.3 基分類器多樣性的預測性能比較

隨著基于不同數學算法的基分類器加入決策融合過程,AUC、ACC、SEN和SPE四項性能指標均呈現出升高的趨勢,在7種分類器都參與融合時取得了最高的性能(表6)。

表6 使用不同數量的基分類器結果比較Tab.3 Comparison of the results by using different numbers of base classifiers

2.4 與集成方法的預測性能比較

相較于將所有期相特征簡單拼接后再使用一種集成分類器進行預測的策略,本研究所提出的多期相多分類器分層融合的策略能在HCC患者MVI的預測方面取得更優越的性能(表7)。

表7 本研究所提出的方法與八種集成分類器結果比較Tab.3 Comparison of the results of the proposed method and 8 ensemble classifiers

3 討論

本研究提出了一種基于多準則決策的權重分配算法來實現多期相特征和多分類器的融合,并基于此算法構建了基于多期DCE-CT影像組學特征和多分類器分層融合模型用于預測HCC患者的MVI。該模型不僅充分利用了DCE-CT的EAP、LAP、PVP和EP四個期相所提供的診斷信息,還合理地融合了多種基于不同數學原理的分類器的診斷結果。

既往對MVI預測的研究大多基于DCE-CT的單一(或兩個)期相,尤其是門靜脈期和動脈晚期,如韋武鵬等[34]使用門靜脈期影像組學特征構建的LR預測模型,AUC達到了0.793;俞超等[35]利用動脈晚期影像組學特征構建的LR預測模型,AUC為0.778;瞿成名等[36]使用釓塞酸二鈉增強MRI動脈期和肝膽期圖像影像組學特征構建的LR預測模型,AUC為0.734;而Zhang等[18]使用了簡單的特征拼接策略融合DCE-CT的EAP、LAP、PVP 和EP 四個期相的影像組學特征,發現使用單一PVP期相特征的模型性能卻要優于使用多期相特征融合的模型。針對這一現象,本研究首先探討了多個期相特征融合能否帶來MVI預測性能的提升,不同于Zhang等[18]使用簡單拼接的特征級融合方式,采用了決策級融合的方式融合多期相特征,實驗中我們發現,將任意期相組合進行決策融合后至少在會一項性能指標上優于單一期相,大部分的組合在3項性能指標上均有所提升,少部分性能指標介于最優和最差的單一期相之間,并且多數評價指標的最高值出現在3個或者4個期相進行決策融合后,AUC最高達到了0.832,要優于上述研究中使用單一(或兩個)期相特征所構建的模型。這些結果表明MVI的四期相DCE-CT中存在互相補充的診斷信息,只考慮單一期相并不能構建出一個性能優秀的預測模型。

在與單期相單分類器的預測性能比較實驗中我們發現,不同期相中的最優基分類器與特征選擇方法組合不盡相同,原理上最簡單的KNN分類器能在第二期和第四期表現最優,且最優和最差分類器的性能之間存在一定的差距。這說明不同分類器的適用范圍不同,然而大多數研究中[34-37]的MVI 預測模型只選用了邏輯回歸。與本研究相似,李銘浩等[38]使用門靜脈期影像組學特征構建了6 個基分類器模型,其中AUC 最低的為0.76,最高的為0.81,隨后構建了基于6種集成模型的融合模型預測HCC患者的MVI,相比于使用單分類器,在驗證集中將AUC從0.81提升到了0.89,但該研究只考慮了單一期相特征。Zhang等[18]利用多數投票法或權重融合法對分類器進行融合,結果表明這兩種集成方法均能提升HCCMVI的預測性能,但基于ACC的權重融合法提升幅度大于最簡單的多數投票法。針對這一發現,本文提出了一種基于多準則決策的權重分配算法,使用AUC、ACC、SEN和SPE四種評價指標計算融合權重。因此,使用合理的多分類器集成策略不僅能夠規避選擇最佳分類器的過程,還能夠帶來預測性能的提升。

在不同基分類器多樣性的預測性能比較實驗中,我們將參與融合的基分類器數目從1個依次增加至7個,參照表5所展示的結果設計本次實驗,按照基分類器的性能降序排列,從最開始保留性能最好的KNN,到最后加入性能最差的DT,實驗結果顯示隨著分類器的加入四項性能指標均呈現出升高的趨勢;并且,在只使用一個分類器時相當于只在期相層面進行融合,此時性能并沒有達到最高。此外,相比于李銘浩等[38]使用梯度提升決策樹、隨機森林等6種基于決策樹的強分類器作為基分類器,本次實驗使用了7種基于不同數學原理的弱分類器作為基分類器,即便他們的預測性能存在一定程度上的差距,但通過恰當的融合策略也能達到甚至優于大多數基于集成方法的強分類器的性能。這些結果說明了提高基分類器的多樣性能夠帶來預測性能的提高,為了得到一個有效的集成模型,除了將盡可能準確的一些分類器組合起來,還應該讓他們具有更高的多樣性。值得注意的是,本次實驗中這些基于不同數學理論的基分類器與不同的特征選擇算法進行了組合,更進一步地增強了分類器之間的多樣性。

與使用其他8種集成分類器的預測性能相比,本研究所提出的基于多分類器多期相分層融合策略的模型取得了更加優異的預測性能,而使用集成分類器對預測性能的提升有限:第一,這些集成分類器沒有有效的多模態特征處理策略,使用簡單的特征拼接策略串聯四個期相的特征,出現特征數遠大于樣本數目的情況,多期相特征之間復雜的相關性、共線性等潛在聯系沒能夠妥善處理,如何穎等[37]使用簡單的特征拼接策略串聯了動脈期、靜脈期和延遲期的影像組學特征,構建了LR模型預測MVI,AUC僅達到了0.75;第二,這些集成分類器認為每個期相特征對模型的重要性是等同的,然而,研究表明存在某些期相特征對于MVI的預測會更加準確[14,17,18],因此,同等重要性這一假設并不合理,所以需要一個合理的權重分配策略去突出對預測結果貢獻更大的期相特征同時弱化那些貢獻相對要小的期相特征;第三,這些集成分類器大多只基于決策樹這一分類器構建,本研究所提出的模型基于七種不同的分類器進行構建,有研究表明[22],基分類器多樣性的提高能夠帶來預測性能的提升。

雖然本研究所提出的模型在HCC患者的MVI預測方面展現出了不錯的潛力,但是也存在著一些局限性。首先,在基于多準則決策的權重分配算法中所使用的評價指標只考慮了4種最常用指標:AUC、ACC、SEN和SPE,但其他評價指標,例如:陽性預測值、陰性預測值、約登指數以及F1-Score等對于HCC患者的MVI預測這個具體分類任務來說其重要性仍需要作進一步的探究;第二,針對不同的臨床任務在權重分配的過程中引入更多的評價指標、使用不同的性能指標組合或者只考慮這一任務在實際臨床上更加關注的指標等策略能否進一步提高預測性能仍需要繼續驗證;第三,本文所提出的權重分配算法認為所有評價指標具有等同的重要程度,即認為4種指標對于預測HCC的MVI同等重要;第四,在基于多準則決策的權重分配算法中使用的SEN和SPE兩種指標只適用于二分類問題,針對多分類問題需要引入其他評價指標,例如:馬修斯相關系數;最后,本次研究所納入的樣本量較小,可能存在選擇偏倚的問題,后續還需要更多的數據來進一步訓練和完善本研究所提出的模型。

綜上所述,本研究創新性地提出了一種基于多準則決策的權重分配算法來實現多期相特征和多分類器的融合,并基于此算法構建了基于多期DCE-CT影像組學特征和多分類器分層融合模型用于預測HCC患者的MVI,與其他模型相比,該模型能更加精準地預測HCC的MVI,在未來有望用于輔助臨床醫生進行醫學影像診斷,以提升醫生的診斷水平。

猜你喜歡
特征選擇組學分類器
口腔代謝組學研究
BP-GA光照分類器在車道線識別中的應用
基于UHPLC-Q-TOF/MS的歸身和歸尾補血機制的代謝組學初步研究
Kmeans 應用與特征選擇
加權空-譜與最近鄰分類器相結合的高光譜圖像分類
結合模糊(C+P)均值聚類和SP-V-支持向量機的TSK分類器
聯合互信息水下目標特征選擇算法
代謝組學在多囊卵巢綜合征中的應用
基于LLE降維和BP_Adaboost分類器的GIS局部放電模式識別
基于特征選擇和RRVPMCD的滾動軸承故障診斷方法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合