?

基于臨床和CT影像學特征的胰腺囊性病變進展預測模型的建立及驗證

2024-02-28 10:07鄧文祎謝飛揚毛麗李秀麗孫照勇徐凱朱亮金征宇李驍薛華丹
中華胰腺病雜志 2024年1期
關鍵詞:胰管基線進展

鄧文祎 謝飛揚 毛麗 李秀麗 孫照勇 徐凱 朱亮 金征宇 李驍 薛華丹

1中國醫學科學院北京協和醫學院 北京協和醫院放射科,北京 100730;2深睿醫療人工智能研究院,北京 100080;3南京大學醫學院附屬金陵醫院(東部戰區總醫院)放射診斷科,南京 210002

隨著影像檢查設備的不斷進步和人們健康意識的不斷提升,胰腺囊性病變(pancreatic cystic lesions, PCLs)的檢出率逐年升高。研究顯示在磁共振膽胰管成像中,PCLs的檢出率高達49.1%[1]。PCLs存在惡變風險[2],但較低[3],而其手術并發癥的發生率高達30%[4],因此絕大多數患者選擇接受長期影像學隨訪。然而隨之而來的檢查費用給患者帶來巨大的經濟負擔,因此制定準確的病灶進展預測策略,是PCLs臨床管理的關鍵點之一[5]。有研究探討了PCLs進展的風險因素,但是未形成有效的預測模型[6-8]。機器學習通過輸入特征之間的高階交互建立模型,以預測目標結果,廣泛應用于疾病的診斷、鑒別診斷和預后預測研究[9-11]。本研究擬基于患者基線臨床及CT影像特征,建立無手術征象的隨訪PCLs進展風險預測機器學習模型,以幫助臨床更高效地管理PCLs患者,合理分配醫療資源。

資料與方法

一、研究對象

回顧性分析2014年7月至2022年12月間北京協和醫院放射科行腹部薄層增強CT掃描的177例患者、200個PCLs病灶的基線臨床和影像學資料。納入標準:基線檢查時無歐洲PCLs研究小組指南規定的手術征象[12](病灶≥4 cm、壁結節或實性成分、主胰管擴張≥10 mm、顯性黃疸、細胞學或病理檢查陽性)。排除標準:(1)有胰腺實性占位、活動性癌癥或胰腺癌家族史;(2)圖像質量不佳;(3)病灶<5 mm。根據隨訪3年間PCLs病灶是否出現手術征象,將其分為進展組和無進展組。將200個病灶以3∶1的比例隨機分為訓練集(150個)和內部測試集(50個),訓練集進展組病灶51個,無進展組病灶99個;內部測試集進展組病灶17個,無進展組病灶33個?;仡櫺允占?011年10月至2020年5月間南京大學醫學院附屬金陵醫院放射科行腹部薄層增強CT掃描的14例患者、15個病灶作為外部測試集,其中進展組病灶6個,無進展組病灶9個。本研究經醫院倫理委員會批準(批準號:K23C2395),所有患者均簽署知情同意書。

二、CT掃描方法

患者基線檢查CT設備為西門子SOMATOM Definition Flash、SOMATOM Force、SOMATOM go.All和飛利浦IQon Spectral CT。掃描參數:管電壓120 kVp,管電流采用自動mA調節技術,旋轉時間0.5 s,層厚1~3 mm,層間距1 mm,矩陣512×512。經肘靜脈以3.0 ml/s的速率注射對比劑碘普羅胺(優維顯,德國先靈公司)1.2 ml/kg。分別在注射對比劑后20、60、120 s行動脈期、門靜脈期、延遲期掃描。掃描范圍從膈頂到腎臟下緣。

三、觀察指標

1.臨床資料:性別、年齡、血清總膽紅素水平、隱性黃疸、糖尿病史、胰腺炎史及血清CEA、CA19-9水平。

2.CT影像學資料:病灶位置、病灶大小、主胰管管徑、囊壁增厚(>2 mm)或強化、分隔、分隔增厚(>2 mm)或強化、病灶鈣化、胰腺萎縮。其中胰腺萎縮定義為胰頭厚度<2 cm、胰體厚度<2 cm或胰尾厚度<1 cm。

3.隨訪資料:以CT檢查當天為隨訪開始時間,截止時間為影像學(增強CT或MRI)或實驗室檢查結果提示PCLs病灶出現手術征象時,或CT檢查后3年。記錄患者的病灶大小、主胰管管徑、病灶內是否存在壁結節或實性成分、血清總膽紅素水平及細胞學或病理檢查結果。

四、機器學習模型建立和篩選

由2名影像科醫師在對患者的臨床表現和病理信息不知情的情況下完成影像學評估。如測量結果不一致,則與1名高級別影像科醫師討論達成一致意見。納入兩名影像科醫師間測量一致性較好的特征建模,即連續變量組內相關系數(intraclass correlation efficient, ICC)>0.75、分類變量Kappa>0.4的特征。其中連續變量特征采用Z分數歸一化處理,分類變量特征采用獨熱編碼處理。

采用多種特征選擇方法、多種機器學習模型進行組合,并基于10折交叉驗證法篩選最優機器學習模型。其中特征選擇方法包括基于F檢驗的特征選擇算法和L1范數特征選擇算法;機器學習模型包括支持向量機(support vector machine, SVM)、線性判別分析、邏輯回歸、高斯樸素貝葉斯分類器、伯努利樸素貝葉斯分類器、K鄰域分類器和決策樹分類器。

五、最優模型預測性能評價

在10折交叉驗證集上繪制各模型的受試者工作特征曲線(receiver operating characteristic curve,ROC),計算曲線下面積(area under the curve, AUC),取AUC值最高的模型作為最優模型,并在訓練集上重新訓練模型,作為最終的預測模型。在測試集上計算AUC值、靈敏度、特異度和準確度,以評估模型的預測效能。使用置換重要性評估納入最優模型特征的重要程度。建立最優模型的校準曲線,采用Hosmer-Lemeshow檢驗評估模型的臨床適用性。

六、統計學處理

采用SPSS 20.0進行統計學分析。正態分布的計量資料以±s表示,組間比較采用獨立樣本t檢驗;非正態分布計量資料以M(Q1、Q3)表示,組間比較采用Mann-Whitney檢驗;計數資料以個數(%)表示,組間比較采用χ2檢驗或Fisher確切概率法。P<0.05為差異有統計學意義。

結 果

一、一般資料

兩名醫師重復測量影像特征的ICC值為0.857~0.948,Kappa值為0.438~0.793,代表中等至很強的一致性。

訓練集及內部測試集200個PCLs病灶和外部測試集15個PCLs病灶的基線臨床及影像學特征見表1。訓練集和內部測試集的進展組與無進展組在胰腺炎史、病灶大小、主胰管管徑、主胰管擴張、囊壁增厚、分隔存在、分隔增厚間的差異及內部測試集的兩組在性別、病灶鈣化和胰腺萎縮間的差異均有統計學意義(P值均<0.05)。外部測試集的進展組與無進展組的病灶大小和胰管擴張差異亦有統計學意義(P值均<0.05)。

表1 訓練集、內部測試集、外部測試集進展組和無進展組胰腺囊性病變基線臨床及影像學特征比較

內部測試集進展組中位隨訪時間為10.57個月,17個病灶中,8個病灶≥4 cm,4個壁結節或實性成分,2個胰管擴張≥10 mm,2個病灶所在患者顯性黃疸,4個細胞學或病理檢查陽性,出現病灶同時存在兩種及以上手術征象。外部測試集進展組中位隨訪時間為0.48個月,6個病灶中,4個病灶≥4 cm,2個細胞學或病理檢查陽性。

二、機器學習模型的建立及預測效能

應用基于F檢驗的特征選擇算法,從8項臨床特征及11項影像學特征中最終篩選出1項臨床特征(胰腺炎病史)和4項影像學特征(基線病灶大小、囊壁增厚、主胰管管徑和主胰管擴張)進入預測模型(圖1)。SVM、線性判別分析、邏輯回歸、高斯樸素貝葉斯分類器、伯努利樸素貝葉斯分類器、K鄰域分類器和決策樹分類器在交叉驗證集上的AUC值分別為0.899、0.897、0.897、0.888、0.876、0.848和0.830,其中SVM模型的AUC值最高,故作為最優模型進一步評估。

在訓練集、內部及外部測試集上,SVM模型對PCLs進展預測的ROC曲線見圖2,AUC值分別為0.910、0.909、0.944,靈敏度分別為84.3%、82.4%、100%,特異度分別為83.8%、72.7%、77.8%,準確度分別為84.0%、76.0%、86.7%,提示模型預測結果準確且模型可推廣性強。SVM模型在內、外部測試集上的校準曲線如圖3所示,曲線接近對角線。Hosmer-Lemeshow擬合優度檢驗顯示,內部測試集P=0.636,外部測試集P=0.840,代表模型對測試集PCLs進展真實情況的擬合較好。

圖2 SVM模型在訓練集、交叉驗證集、內部及外部測試集上預測胰腺囊性病變進展的ROC曲線

圖3 SVM模型在內部(3A)和外部(3B)測試集上預測胰腺囊性病變進展的校準曲線

討 論

近年來,隨著PCLs檢出率的增加,隨訪患者數量增長,PCLs進展危險因素被廣泛關注。Pandey等[8]發現基線病灶較大的組更易發生美國放射學會偶發病變委員會白皮書中定義的病灶增大。Oyama等[6]發現基線病灶大和主胰管管徑寬與PCLs惡變相關。Tsai等[13]發現分隔和擴張的胰管在進展組(囊生長速度>1 mm/年)PCLs更多見。上述研究顯示通過宏觀影像特征進行PCLs進展風險分層的潛在價值。本研究篩選出基線病灶大小、囊壁增厚、主胰管管徑和主胰管擴張4項影像特征納入模型,其中,基線病灶大小是置換重要性最高的特征,同前述研究結果一致,且福岡指南[14]、美國胃腸病學會指南[15]都推薦以基線病灶大小指導隨訪間隔。Vullierme等[16]發現包括囊壁增厚在內的4個影像學特征與惡性胰腺黏液性囊腺瘤有關。本研究中主胰管擴張和主胰管管徑對PCLs進展風險的預測作用也與前述研究一致。此外,Procacci等[17]發現囊壁或分隔上的鈣化與胰腺黏液性囊性腫瘤惡性風險有關。Nakahodo等[18]發現局灶胰腺萎縮是高級別異型增生的危險因素。本研究中,訓練集和內、外部測試集的進展組病灶鈣化和胰腺萎縮均較無進展組更多見,但僅在內部測試集中差異有統計學意義。本研究還將指南[12,15]中與PCLs惡性相關的臨床危險因素納入分析,最終篩選出胰腺炎史納入模型,與Ohtsuka等[19]的研究結果一致。值得注意的是,上述研究及本研究所選出的與PCLs進展相關的特征均略有不同,原因可能在于不同研究對于進展的定義不同。本研究旨在高效管理PCLs患者,使病灶穩定的患者減少隨訪頻率,而進展高風險患者應密切隨訪以早期發現惡變并手術,故將進展定義為出現手術征象。此外,本研究設置了外部測試集,能夠更全面地評估預測模型的可推廣性,促進模型在臨床上應用。

本研究結果表明,基于PCLs病灶的基線臨床和CT影像特征的SVM模型,能夠在病灶進展發生前相當長的一段時間(內部測試集進展組中位隨訪時間10.57個月)預測進展發生與否,且預測AUC值在內、外部測試集上分別達0.909、0.944,校準曲線顯示,模型的預測概率與實際PCLs進展概率基本相當。該模型納入的特征均是可解釋性強的臨床及宏觀影像特征,經獨立的內、外部測試集驗證具有良好且穩定的預測效能,能夠有效地幫助臨床更高效地管理PCLs患者,合理分配醫療資源。

本研究存在一定局限性。首先,本研究為回顧性研究,樣本量較小,有待后續納入來自多個中心的隨訪患者,以建立更加穩定可推廣的模型。其次,本研究僅基于CT圖像建模。盡管MRI是指南推薦的PCLs隨訪影像檢查手段之一[12],但因其檢查時間長、對患者要求高(憋氣時間長、體內不能有金屬植入物)、價格昂貴,在國內應用不及CT廣泛。多項研究顯示,初診PCLs更常見于CT檢查[20],且CT與MRI對惡性PCLs的診斷準確度相當[21]。綜上所述,本研究基于患者臨床及宏觀CT影像學特征建立PCLs進展的預測模型,后續將進一步結合影像組學及囊液生物標志物建立綜合預測模型,為PCLs的隨訪策略提供更精準的指導。

利益沖突所有作者聲明無利益沖突

作者貢獻聲明鄧文祎:研究操作、數據整理、統計學分析、論文撰寫;謝飛揚、毛麗:研究操作、數據整理、統計學分析;孫照勇、徐凱:工作支持;李秀麗、朱亮、金征宇:研究指導、工作支持;李驍、薛華丹:研究設計、研究指導、論文修改、經費支持

猜你喜歡
胰管基線進展
從胰管改變談胰腺疾病的診斷
胰管擴張的臨床原因及影像學特征
Micro-SPECT/CT應用進展
適用于MAUV的變基線定位系統
航天技術與甚長基線陣的結合探索
一種改進的干涉儀測向基線設計方法
高頻寬帶超聲在學齡前兒童胰腺主胰管顯示中的應用
寄生胎的診治進展
技術狀態管理——對基線更改的控制
我國土壤污染防治進展
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合