基于多模態超聲成像數據的慢性肝病肝纖維化、炎癥和脂肪變性的智能分級診斷

2023-12-19 14:48魏星月王連雙王媛媛高孟澤羅建文

首都醫科大學學報 2023年6期

魏星月王連雙王媛媛高孟澤何瓊張瑤羅建文*

(1.清華大學醫學院生物醫學工程系, 北京 100084; 2.清華大學精準醫學研究院,北京 100084; 3.首都醫科大學附屬北京地壇醫院超聲科,北京 100015; 4.北京理工大學光電學院北京市混合現實與新型顯示工程技術研究中心,北京 100081; 5.清華大學機械工程學院精密儀器系,北京 100084)

慢性肝病(chronic liver disease, CLD)是中國居民的高發病和常見病,它影響著數億人口[1],對中國居民的預期壽命和生活質量造成了嚴重的負擔和影響。

CLD導致的肝臟病理改變主要有三種形式:肝纖維化、炎癥和脂肪變性。肝臟纖維化在早中期可逆,如果沒有積極的干預措施,病程可能進展為肝硬化、肝衰竭等相關并發癥[2]。肝臟炎癥是肝臟疾病進展的主要病理生理學和病理組織學基礎[3]。脂肪變性是中國第一大肝病,可進展為肝硬化、肝衰竭和肝癌[4]。此外,由于復雜的病理演變過程,臨床上肝臟纖維化、炎癥和脂肪變性往往會相伴出現,因此,同時實現肝臟纖維化、炎癥和脂肪變性這三種病理改變的診斷和評估具有重要的臨床價值。

當前慢性肝病的臨床診斷標準是肝臟穿刺活體組織檢查(以下簡稱活檢),但它存在有創、抽樣誤差等局限[5]。血清生物標志物如丙氨酸氨基轉移酶(alanine transaminase, ALT)、門冬氨酸氨基轉移酶(aspartate aminotransferase, AST)、血小板(platelet, PLT)和聯合生物標志物,如門冬氨酸氨基轉移酶纖維化指數(aspartate aminotransferase to platelet ratio index, APRI)、肝纖維化4因子指數(fibrosis 4 score, FIB-4)[6-7], 雖然已用于CLD的臨床診斷,但是它們通常對早期CLD具有較低的特異度和靈敏度。因此本研究致力于開發一種能同時診斷慢性肝病肝纖維化、炎癥和脂肪變性的無創、準確、便捷、適用性廣的智能診斷方法。

超聲成像具有無創、經濟高效和實時的優點,目前被用作CLD的臨床常規檢查,超聲彈性成像技術[8],如瞬時彈性成像(transient elastography, TE)和二維剪切波彈性成像(shear wave elastography, SWE)可以檢測肝臟硬度等信息,對于肝病的診斷和評估具有重要的臨床價值。因此,本研究從多模態超聲數據中提取多模態超聲特征,如聲衰減系數(ultrasound attenuation parameter, UAP)、Nakagami分布等[9-14],結合機器學習算法,構建一個可以同時實現肝臟纖維化、炎癥和脂肪變性的智能分級評估模型。

1 對象與方法

1.1 研究對象

本研究是一項回顧性研究,從首都醫科大學附屬北京地壇醫院共收集了486例慢性乙型肝炎患者的超聲數據,納入標準:①入院后行超聲引導下肝臟穿刺活檢病理學檢查;②年齡≥18周歲;③病理學診斷標準可以應用Ishak評分系統和NAS評分系統的患者。排除標準:①臨床、實驗室或組織學證據為本項目研究的慢性肝病以外的肝病患者,以及合并患者;②各類合并惡性肝臟腫瘤者;③合并其他系統腫瘤或疑似腫瘤者;④合并心、肺、腦、腎、血液等重要臟器疾病患者;⑤肝穿刺活檢不合格者;⑥超聲二維圖像、SWE、TE及其射頻(radio frequency, RF)數據等任何數據提取失敗的患者;⑦患者可能影響參與該研究的醫療或心理疾病。最終,142例患者的數據被納入本研究(詳細的招募流程如圖1所示)。本研究獲得了首都醫科大學附屬北京地壇醫院倫理委員會的批準[倫理編號:京地倫科字(2023)-026號]。作為歷史性研究可免除研究對象知情同意。

圖1 詳細的患者招募流程Fig.1 Detailed recruitmentTE: transient elastography; SWE: shear wave elastography.

1.2 數據收集

1.2.1 患者一般資料

年齡、性別、身高、體質量等。

1.2.2 血清學指標

ALT、AST、APRI、FIB-4等。

1.2.3 SWE數據

使用Aixplorer超聲成像系統(法國聲科影像公司)對每位患者的肝臟進行3次SWE檢查,生成3組JPEG格式的相同視野下的B模式圖像和SWE圖像。在每個SWE圖像上,選擇直徑為2 cm的圓形感興趣區域(region of interest, ROI)(圖2)。記錄Aixplorer系統在屏幕上自動顯示的ROI內的彈性值的平均值、最大值、最小值和標準差等指標。

圖2 研究方法流程圖Fig.2 Pipeline of the proposed model

1.2.4 TE數據

使用iLivTouch系統 (中國無錫海斯凱爾醫學技術有限公司)對每位患者進行10次TE檢測,生成10組一維M模式下的射頻數據、10組由iLivTouch系統輸出的肝臟彈性模量值和UAP值。

1.2.5 肝穿刺活檢病理結果

對每位患者進行超聲引導下的肝臟穿刺活檢,根據慢性乙型肝炎防治指南(2022年版)[15],肝纖維化分為5級:F0、F1、F2、F3和F4;慢性乙型肝炎患者的炎癥分為4級:A1、A2、A3和A4;根據護理活動評分量表(Nursing Activities Score,NAS)評分系統[16],脂肪變性分為4級:S0、S1、S2和S3。

綜上,除了患者基本信息、血清學指標和病理結果之外,對于每個患者,本研究需要收集的數據包括:3組JPEG格式的相同視野下的B模式圖像和SWE圖像、3組Aixplorer系統輸出的指標、10組RF數據、iLivTouch系統輸出的10個肝臟彈性模量值和10個UAP值。

所有入組患者的臨床資料如表1所示。

表1 入組患者的人口統計學、生理學和組織學特征Tab.1 Demographic, physical, and histologic characteristics of participants

1.3 多模態特征提取

1.3.1 圖像特征

使用邊緣檢測算法將B模式和SWE圖像中的圓形ROI區域提取出來,再對提取出的ROI區域進行特征提取。

對于B模式ROI圖像,使用影像組學方法計算其紋理及強度特征。具體而言,計算強度分布的一階和二階統計量。一階統計特征包括最大值、最小值、均值、中值、熵等。二階統計特征是基于灰度共生矩陣提取了5個紋理特征,即對比度、相關性、能量、均勻性和熵。同時,基于小波變換將每個B模式ROI圖像分解為3個尺度,對每個尺度提取上述一階和二階統計特征,并進行平均。

對于SWE圖像,組織的楊氏模量被偽彩色編碼并疊加在灰度編碼的B模式圖像上,因此,首先需要通過匹配色條法從混合圖像中恢復楊氏模量[17-18],然后再使用與B模式ROI圖像相似的影像組學方法計算該SWE圖像ROI的一階和二階統計特征。

1.3.2 RF特征

對于從iLivTouch獲取的RF信號,計算其香農熵和4個與聲衰減系數相關的特征。進一步地,利用希爾伯特變換從RF信號中獲得包絡信號,提取其一階統計特征,然后,再利用Nakagami分布等來擬合包絡信號,獲得對應的統計學特征。

1.3.3 系統特征

在TE數據采集過程中,留存了每個患者10次采集對應的10個肝臟彈性模量值和10個UAP值,在定量評估中,計算這10個肝臟彈性模量和10個UAP值的中位數和四分位差來作為iLivTouch最終給出的4個系統特征;在SWE圖像采集過程中,也留存了3組Aixplorer設備提供的7個定量指標,計算這7個指標的組間平均值作為Aixplorer最終給出的7個系統特征。

綜上,從收集到的B模式圖像、SWE圖像、RF信號及兩臺超聲設備直接給出的系統指標中,共提取了169個多模態特征,具體信息如圖2的feature extraction部分所示。

1.4 智能診斷系統構建

將上述提取到的169個定量特征結合在一起,輸入到支持向量機(support vector machine, SVM)中,分別進行三種病理改變的分級診斷,包括肝臟纖維化≥F1,≥F2,≥F3, ≥F4,肝炎≥A2,≥A3,≥A4,脂肪變性≥S1,≥S2共9種分級判斷,其中,由于S3級的入組患者只有4例,所以本研究沒有進行≥S3的分級診斷。

1.5 模型評估

為了證明所提出的方法的臨床實用價值,將所提出的基于多模態超聲特征的SVM分類方法和基于血清學指標的SVM分類方法進行對比。對于每種疾病的分級,以肝活檢病理學結果為標簽,采用5折交叉驗證的方式來訓練和評估不同的模型。由于數據樣本較小且分布不均衡,所以本研究沒有單獨設置驗證集來對模型進行驗證。準確率、靈敏度、特異度和受試者工作特征(receiver operating characteristic, ROC)曲線下面積(area under the curve, AUC)[19]及AUC的95%置信區間(confidence interval, CI)被選作評估指標。同時,為了更加客觀地對比不同模型的分類性能,對所提出的模型和其他對比模型的ROC曲線進行了Delong檢驗。

2 結果

2.1 肝纖維化分級

本研究所提出的方法對于肝纖維化的分級結果如表2所示?？紤]到血清學指標APRI、FIB-4和肝臟彈性信息對于肝纖維化的診斷具有重要價值,表2也給出了將APRI、FIB-4、Aixplorer系統指標(記為SWE)和iLivTouch系統指標(記為TE)分別輸入到SVM中并加以訓練之后的評估結果。

表2 肝纖維化分級結果及與臨床指標的對比結果Tab.2 Grading results of liver fibrosis and comparison with clinical indicators

可以看到,本研究所提出的方法對于不同級別的肝纖維化分級的AUC值均在0.8以上,對于肝纖維化≥F3及≥F4,AUC分別達到了0.89和0.87。同時,本研究的方法整體上優于其他四種臨床指標。

根據Delong檢驗結果,可以發現,所提出的多模態超聲特征對比APRI指標具有顯著差異(肝纖維化的不同分級下Delong檢驗的P值均小于0.05),相比FIB-4指標和TE指標(iLivTouch系統提供的關于肝臟彈性信息的指標)在肝纖維化≥F1、≥F2及≥F3上差異有統計學意義,與SWE指標(Aixplorer系統提供的關于肝臟彈性信息的指標)在肝纖維化≥F1分級中差異有統計學意義(P<0.001)。

2.2 肝臟炎癥分級

本研究所提出的方法對于肝臟炎癥的分級結果如表3所示。血清學指標AST、ALT經常被用在肝臟炎癥的臨床診斷中,表3給出了將AST和ALT分別輸入到SVM中并加以訓練之后的評估結果。

表3 肝臟炎癥分級結果及與臨床指標的對比結果Tab.3 Grading results of liver inflammation and comparison with clinical indicators

可以看到,本研究所提出的方法對于不同級別的肝臟炎癥分級的AUC值均在0.8以上,對于肝臟炎癥≥A3及≥A4,AUC達到了0.93,準確率、靈敏度和特異度均在0.86以上。同時,本研究的方法比其他兩個血清學指標具有明顯的優勢。

在Delong檢驗中,所提出的方法和ALT指標在肝臟炎癥≥A2、≥A3及≥A4這3個分級上差異有統計學意義,和AST指標在肝臟炎癥≥A2及≥A3上差異有統計學意義。

2.3 肝臟脂肪變性分級

本研究所提出的方法對于肝臟脂肪變性的分級結果如表4所示。與聲衰減系數相關的指標對于肝臟脂肪變性具有較好的診斷能力,表4給出了將超聲設備直接給出的UAP相關的指標直接輸入到SVM中并加以訓練之后的評估結果。

表4 肝臟脂肪變性分級結果及與臨床指標的對比結果Tab.4 Grading results of liver steatosis and comparison with clinical indicators

可以看到,本研究所提出的方法對于中重度肝臟脂肪變性≥S2具有較好的診斷能力,AUC達到了0.92,準確率、靈敏度和特異度均在0.86以上。同樣,本研究所提出的方法對比超聲設備直接給出的UAP相關的指標具有較大的優勢。在Delong檢驗中,所提出的方法和UAP指標差異無統計學意義。

3 討論

本研究從多模態超聲數據中提取了多模態超聲特征,構建了一個可以同時診斷肝纖維化、炎癥和脂肪變性的智能診斷模型。

本研究所提出的多模態特征在中度或重度肝病的分類中比在輕度肝病的分級中表現得更好。以纖維化為例,分級≥F3(0.89)和F4(0.87)具有更高的AUC,但分級≥F2(0.80)和F1(0.81)則AUC更低。這與早期CLD相對難以識別的臨床認知一致。然而,可以看到,在早期CLD上,本研究所提出的方法比其他臨床特征表現得更好,以纖維化≥F1為例,SWE指標、TE指標、APRI指標和FIB-4指標的準確率和AUC都小于0.7,而所提出的方法在準確率、靈敏度、特異度和AUC上都大于0.73,證明了所提出的多模態特征更適合CLD的診斷。

本研究對所提出的方法和其他對比模型進行了Delong檢驗,結果表明,所提出的多模態超聲特征在肝纖維化≥F2、≥F3及≥F4這3個分級中和SWE指標不具備顯著差異,考慮到本研究所提出的多模態超聲特征包含了SWE指標,該結果可以表明SWE指標(即Aixplorer系統提供的肝臟硬度相關的指標)對于中重度肝纖維化的分級具有重要作用,這與臨床認知一致,即肝纖維化的一個重要表現便是肝臟硬度升高。值得一提的是,SWE指標對于肝纖維化≥F1表現較差(AUC、準確率、靈敏度均小于0.5),表明SWE指標不能很好地診斷早期肝纖維化。而所提出的基于多模態超聲特征的SVM分類方法和基于SWE指標的SVM分類方法的Delong檢驗的P值小于0.001,表明所提出的方法對于SWE指標具有顯著性差異。同時,結合所提出的方法在肝纖維化≥F1分級中的準確率、靈敏度、特異度和AUC均大于0.73,證明了多模態超聲特征對于早期肝纖維化的診斷具有重要價值。

在肝臟炎癥的3個分級中,所提出的方法在整體上相比,AST和ALT指標具有顯著性差異,結合更高的AUC等指標,可以證明多模態超聲特征相比血清學指標AST和ALT對于肝臟炎癥具有更好的辨別效果。

在肝臟脂肪變性的2個分級中,所提出的多模態超聲特征相比UAP指標不具有顯著性差異,表明UAP指標在多模態超聲特征中對于肝脂肪變性的智能診斷貢獻更大。這也與臨床認知一致,即肝臟脂肪變性意味著肝臟中具有大量的脂肪沉積,而脂肪對于超聲信號具有較強的反射和散射作用,導致較高的超聲衰減。

此外,在本研究中,僅招募了142例慢性乙型肝炎患者入組,數據樣本的缺乏限制了所提出模型的性能和泛化能力。更重要的是,這些患者的分級分布不均勻,事實上,如果能獲得一個更大的數據集,那么可以直接實現纖維化的五分、炎癥和脂肪變性的四分級,這可以進一步簡化整套CLD智能診斷系統的規模和復雜度。

在本研究中,筆者提出了一種多模態定量超聲方法,該方法結合了從B模式圖像、SWE圖像、RF信號中基于影像組學方法和超聲組織定征方法提取的多模態特征以及由臨床超聲成像設備直接提供的特征,同時對三種形式的CLD進行分級,即肝纖維化、炎癥和脂肪變性。本研究成功招募了142例慢性乙型肝炎患者,并利用他們的肝活檢結果作為參考標準,以上述提取的多模態特征作為輸入來訓練SVM分類器。結果表明,與血清學生物標志物等臨床特征相比,所提出的多模態特征具有明顯優勢,表明所提出的方法在CLD的臨床篩查、診斷和治療方面具有潛在應用。未來的研究方向如下:①在確保數據分布平衡的同時,擴大數據集規模;②以多分類或回歸模型的方式實現對CLD的分級診斷,以降低整套CLD智能診斷系統的規模和復雜度。

利益沖突所有作者均聲明不存在利益沖突。

作者貢獻聲明魏星月、王連雙:提出研究思路, 設計研究方案, 數據采集、整理,撰寫論文;王媛媛:數據整理分析;高孟澤:協助數據分析;何瓊:協助設計研究方案;張瑤、羅建文:總體把關,論文審定。

基于多模態超聲成像數據的慢性肝病肝纖維化、炎癥和脂肪變性的智能分級診斷