李羚 胡大濤 夏春華 李紅霞
安徽醫科大學第三附屬醫院合肥市第一人民醫院1耳鼻咽喉科,2放射科,3腫瘤科(合肥230061)
頭頸部惡性腫瘤為全球七大常見惡性腫瘤之一[1],占全球每年新發惡性腫瘤的5.245%[2],治療多采用手術、放療等手段,淋巴結轉移與否決定著淋巴結清掃和放療的范圍。由于CT 及MRI 對淋巴結性質預判的準確率有限,尤其在短徑<1.0 cm時有較高的漏診率和錯判率,而頸部淋巴結穿刺活檢為有創操作且因取材小,取材位置偏差可能影響淋巴結性質判斷。尋找一種非侵入、準確且安全的診斷方法對頭頸部惡性腫瘤患者極為重要。
影像組學(radiomics)是大數據技術與影像診斷的結合,影像不再只是圖片,更是數據,從影像的感興趣區(region of Interest,ROI)提取巨量特征信息,篩選出具有特征性的數字化信息建立相關的預測模型來定量描述病變的表型,是影像診斷史上的革命,已成為腫瘤診斷的新熱點[3?6]。CT 影像組學特征可用于淋巴結轉移的定量無創預測[7?8],我科與放射科合作,將這一客觀、非侵入、可挖掘、可重現的新興技術與平掃及增強CT 值聯合制作的預測模型應用于頭頸部惡性腫瘤淋巴結轉移的診斷中,取得較常規CT 更好的診斷效果,報道如下。
1.1 一般資料本研究通過了合肥市第一人民醫院醫學倫理委員會批準。資料來源于2017年1月至2020年10月就診于合肥市第一人民醫院,確診頭頸部惡性腫瘤且有明確淋巴結部位、大小、病理描述及治療前2 周內有質量較好的頭頸部CT 影像資料(包括平掃和增強動脈期)的75 例患者的頸部淋巴結201 枚,其中惡性106 枚,良性95 枚,分為兩組:(1)訓練組:將2017年1月至2019年11月獲取的淋巴結113 枚歸為訓練組,其中惡性淋巴結58 枚,良性淋巴結55 枚。(2)測試組:2019年12月至2020年10月的淋巴結88 枚歸為測試組,其中惡性淋巴結48 枚,良性淋巴結40 枚。
納入標準:(1)我院確診的頭頸部惡性腫瘤患者中有明確淋巴結病理及治療前2 周內質量較好的頭頸部CT 平掃及增強影像資料者;(2)淋巴結短徑≥5 mm;(3)在我院CT 檢查前未進行放、化療等治療。
排除標準:(1)在我院行CT 檢查前已進行放、化療等治療;(2)淋巴結短徑<5 mm。
1.2 檢查方法和圖像選擇采用Siemens 雙源CT機,掃描范圍從眉弓上緣至頸根部水平。掃描相關參數:管電流300 mA,管電壓120 kV,掃描層厚為3 ~ 5 mm,矩陣512 × 512。增強掃描常規使用高壓注射器經肘正中靜脈注80 ~ 100 mL 碘海醇(350 mg/mL),以流速2.5~3 mL/s 注入對比劑后采集各期圖像;平掃及增強掃描患者圖像層面必須一致。臨床醫生采集頸部淋巴結病理中有詳細部位、大小及性質的淋巴結,再由2 名臨床診斷經驗豐富的影像醫師在CT 影像上選取可以明確標記的淋巴結,進行數據提取及記錄。
1.3 CT影像感興趣區(ROI)的勾畫及影像特征的提取由一名具有多年臨床診斷工作經驗的影像醫師把每位患者CT 軸位平掃及增強圖像中病灶最大層面(一定是同一層面)從影像PACS 系統中以DIOOM 格式導入開源Mazda 軟件(www.eletel.p.lodz.pl/programy/mazda/,version 4.6),之后采用手動分割方法勾畫ROI,再利用軟件自動提取包括游程矩陣、灰度直方圖、灰度共生矩陣、絕對梯度、小波變換和自回歸模型在內的共計298種影像特征參數。
1.4 影像組學特征的篩選在訓練組中用套索算法(least absolute shrinkage and selection operator,LASSO),通過10 折交叉驗證后選擇AUC 值最大處的λ用作篩選特征,使用R 軟件最小冗余最大相關性算法,進一步去除冗余特征,再對所提取特征作線性歸一處理,最終從298 個特征中共篩選出6 ~ 7 個與頭頸部淋巴結良惡性預測最具相關性的影像組學特征。
1.5 預測模型的建立、驗證和評估在訓練組中運用多因素邏輯回歸分析各診斷因子(性別、年齡、淋巴結短徑、平掃CT 值、動脈期CT 值、影像組學標簽),篩選出具有診斷價值的因子,建立診斷模型并以臨床診斷諾模圖呈現。用此諾模圖預測2019年12月至2020年10月就診于本院的頭頸部惡性腫瘤患者的88 枚淋巴結轉移情況,與術后病理對照。ROC 曲線、AUC 和校準曲線用于評價模型在訓練組和測試組中的診斷效能、校準度。
1.6 統計學方法運用SPSS 24.0和R軟件(https://www.r?project.org/,version 3.4.4)對所有數據進行統計學分析;對符合正態分布和方差齊性假設數據使用獨立樣本t檢驗;不符合者,則使用Mann?WhitneyU檢驗;分類變量采用Fisher 檢驗或χ2檢驗。AUC 為0.5 ~ 0.7 時其診斷價值較低,0.7 ~ 0.9時診斷價值中等,>0.9 時診斷價值較高。P<0.05為差異有統計學意義。
2.1 一般資料的比較訓練組和測試組年齡、性別差異均無統計學意義;良、惡性組患者在訓練組和測試組中所占比例差異無統計學意義(P>0.05);平掃CT 值、動脈期CT 值、影像組學標簽在訓練組和測試組中表現出色,差異具有統計學意義(P<0.05),但淋巴短徑優勢不明顯(P>0.05)。見表1。
表1 訓練組與測試組患者臨床資料比較Tab.1 Comparison of clinical data between training group and test group ±s
表1 訓練組與測試組患者臨床資料比較Tab.1 Comparison of clinical data between training group and test group ±s
變量年齡(歲)性別[例(%)]男 女淋巴結短徑(mm)平掃CT 值動脈期CT 值影像組學標簽(平掃score)影像組學標簽(增強score)訓練組良性組50.51±15.33 21(38.2)34(61.2)6.24±1.97 26.76±10.02 42.95±13.50-0.786±1.136 0.056±0.852惡性組52.81±14.78 23(39.7)35(60.3)11.17±4.55 47.55±110.18 68.79±13.86 0.806±0.854 1.103±0.824 P 值0.619 0.436 0.060 0.004<0.001<0.001<0.001測試組良性組47.08±14.71 17(42.5)23(57.5)6.23±2.21 27.38±10.85 42.98±12.21-0.890±1.271-0.149±0.862惡性組48.29±16.22 28(58.3)20(41.7)11.10±3.60 39.58±9.06 78.02±12.50 0.582±0.807 0.939±0.786 P 值0.712 0.782 0.068 0.028 0.002<0.001<0.001
2.2 建立影像組學標簽及計算影像組學標簽值從298 個特征中共篩選出6 ~ 7 種特征(圖1)分別為 平 掃“S.2.0.Correlat、S.2.2.DifVarnc、S.3.3.Cor?relat、S.5.5.InvDfMom、Vertl_ShrtREmp、WavEnLL_s.1、WavEnHH_s.3”及增強“X_Area_S.1.1.、S.2.?2.Correlat、S.2.?2.DifVarnc、S.4.0.InvDfMom、X_Area_S.5.?5.、Horzl_ShrtREmp”用于建立影像組學標簽。
計算每個淋巴結影像組學標簽值,公式如下。
公式中featurei代表選擇出的影像組學特征值,coefficienti代表每個影像組學特征在glmnet 包選擇特征時所對應的系數值,它表示對應的影像組學特征與頸部淋巴結轉移的相關性權重值,Compensation coefficient 代表Lasso 選擇特征時留下的補償系數。
2.3 預測模型建立分別對5 個有顯著臨床意義的診斷因子與影像組學標簽經過多因素邏輯回歸模型分析,其中,影像組學標簽、平掃CT 值(P)、動脈期強化CT 值(Z)差異有統計學意義,可作為診斷因子(表2)。P 與Z 分別與影像組學標簽聯合制成臨床診斷的諾模圖(圖2,score 表示影像組學標簽值),根據患者相應變量值在Points 線段上賦分后相加,在Total Points 線段上得出總分,輸出相應的預測概率,≥50 為陽性。
表2 多因素邏輯回歸分界結果Tab.2 Results of multiple logistic regression
2.4 診斷效能評價對比各模型在訓練組和測試組中的診斷效能,平掃CT 值+平掃影像組學標簽在訓練組和測試組中AUC 值分別為0.955、0.885(圖3A、B),增強CT 值+增強影像組學標簽在訓練組和測試組中AUC值分別為0.982、0.920,表現出良好的診斷效能(圖3C、D)。影像組學標簽在訓練組和測試組中AUC 值分別為0.940、0.905(圖3E、F),診斷價值較高。平掃CT值+平掃影像組學標簽、增強CT值+影像組學標簽、影像組學標簽和CT征象診斷模型的準確率分別是0.920、0.930、0.801和0.716;敏感性分別是0.925、0.925、0.877和0.792;特異性分別為0.916、0.926、0.716和0.632;且同時具有滿意的校準度(圖3G、H、I、J)。經過檢驗,平掃影像組學+平掃CT值與增強影像組學+增強CT值一致性良好,影像組學聯合預測模型的診斷效能高于影像組學標簽和CT征象診斷模型,差異有統計學意義(P<0.05)。各模型診斷效能見表3。
圖1 影像組學特征篩選和影像組學標簽的建立Fig.1 Screening of radiomics features and establishment of radiomics tags
圖2 臨床診斷的諾模圖Fig.2 nomograms for clinical diagnosis
表3 CT 征象、影像組學標簽及影像組學聯合診斷模型的診斷效能Tab.3 Diagnostic efficacy of CT signs,icomics label and icomics combined diagnostic model
淋巴結的短徑增大、中心壞死是目前CT 判斷淋巴結良惡性的主要依據,一般認為淋巴結越大,轉移率越高,但徐文等[9]報道的病理證實的轉移淋巴結最小為2 mm,本院病理也顯示轉移淋巴結最小為2 mm,而反應性淋巴結亦可明顯增大,本研究顯示淋巴結陽性與淋巴結短徑無相關性,可能因為病例數較少,也可能因為本組不是以患者為研究對象,而是以單個淋巴結為研究對象,旨在發現轉移淋巴結的影像規律,淋巴結發生轉移時淋巴結大小可能還沒發生變化。
淋巴結中央壞死亦可出現在淋巴結炎時,而且形態特征的判斷很難在觀察者間達成高水平一致,故CT 的臨床準確率并不高。本研究顯示CT 診斷的敏感性、特異性、準確率分別是0.792、0.632 和0.716。與陳功研究相似[10],提高淋巴結轉移診斷準確率的技術成為需要。
影像組學是2012年由荷蘭學者提出,將視覺影像信息轉化為定量的影像組學特征研究[11]。在CT/MR/PET?CT/BUS 等掃描之后,醫師對病灶的特征只能進行大小、密度、分葉、邊界、毛刺等肉眼能識別的定性描述,但應用影像組學后可根據圖像數據信息,對疾病做出更詳盡的描述與診斷。
圖3 診斷效能評價Fig.3 diagnosis efficiency evaluation
從影像數據中提取的全部特征就是“影像組學”,挑選出的有預測價值的特征集合就是“影像組學標簽”。從298 個影像特征中篩選出6 ~ 7 種最具有鑒別意義的特征,建立影像組學標簽,根據LASSO 系數大小,其中InvDfmom(逆差距)的貢獻最大,該特征參數反映圖像局部灰度的均勻性,其值越高越說明該區域灰度值缺乏變化,這一結果可能提示腫瘤的異質性跟圖像灰度的均勻性有關聯。在此基礎上,進一步將影像組學標簽的診斷效能單獨進行了分析,在訓練組和測試組中AUC均大于0.905,隨后分別與平掃CT 值、動脈期強化CT 值共同組建影像組學聯合預測模型,兩模型的診斷效能同樣優秀,且兩者一致性良好。因為病例數較少,能否得出可用平掃影像組學+平掃CT值替代增強影像組學+增強CT 值為時尚早。
本研究以有明確部位、大小和診斷的淋巴結作為研究對象,避免了從常規CT 中尋找淋巴結時將直徑小于1 cm 的淋巴結漏掉的情況。但對于較小淋巴結,應用本法還是有困難的。首先,在CT 上很難辨認較小淋巴結,本院具有明確病理的2 mm的最小淋巴結,在CT 影像上與周圍組織很難區分。其次,在影像平面手動勾畫取材時考慮類球形淋巴結的CT 層厚,沿淋巴結邊緣內側1 mm勾畫,又考慮到勾畫范圍內數據足夠,僅做了直徑≥5 mm淋巴結,沒有做到淋巴結大小的全程診斷。
轉移淋巴結可能有被膜外侵及周圍環形增強等特征,在圖像內1~2 mm 取材,可能使這些特征檢測流失。是否可通過立體取材并放大取材范圍或加入新的影像組學特征參數而改善小淋巴結診斷效能有待進一步證實。一個疾病的預測模型,不是簡單的數學關系,它的病理意義是筆者關注的。本研究沒有將頭頸部腫瘤的病理分類,沒有挖掘出不同病理類型淋巴結轉移的影像學特征。另外,因回顧性研究,單個淋巴結病理鏡下特征沒有記錄,不能很好解釋變量變化與病理的關系。
本研究也發現,有些患者影像組學上有可疑淋巴結,但沒有行清掃或沒有掃到的記錄,尤其對咽后壁、縱隔可疑淋巴結,現已不能通過活檢證實,但利用影像組學,有理由考慮存在淋巴轉移。對于這部分淋巴結,應該重點圈出,才能在術后做根治性放療時更準確地確定靶區范圍。
基于CT 影像組學對淋巴結轉移的診斷比傳統評估方法具有更高的靈敏度和特異性[12-14],對頭頸部惡性腫瘤的淋巴結診斷效能亦良好,與活檢相比更具有無創性,可重復性,并可對病灶整體進行分析,有效避免了穿刺活檢及病理取樣的風險和取材誤差。具有簡便、安全、可靠的臨床應用價值。