?

基于低劑量胸部CT深度學習模型自動測量骨密度研究

2024-03-01 03:07趙宇張曉嵐鄭超王敏紅洪薇周運鋒
放射學實踐 2024年2期
關鍵詞:骨密度一致性椎體

趙宇,張曉嵐,鄭超,王敏紅,洪薇,周運鋒

骨質疏松(osteoporosis,OP)是中老年人最常見的骨骼疾病,表現為骨量減少,易引發脆性骨折[1]。隨著我國人口老齡化進程加快,具有高致殘率、高致死率的脆性骨折發病率升高,帶來了不可忽視的社會和醫療負擔,因此早期診斷OP至關重要[2]。雙能X線吸收檢測儀(dual energy X-ray absorptiometry,DXA)和定量CT(quantitative computed tomography,QCT)是目前最常用的骨礦物質密度(bone mineral density,BMD)測量方法,但兩者均對軟硬件有一定要求,且需額外的輻射和費用[3]。健康體檢或針對其他適應證進行的低劑量胸部CT(LDCT)可用于評估體積骨礦物質密度(volume bone mineral density,vBMD),近期研究證明了LDCT聯合QCT椎體骨密度測量在骨質疏松篩查中的作用[4,5]。但LDCT結合QCT測量骨密度需要醫生在工作站上勾畫興趣區(region of interest,ROI),是一項費時、費力的工作。近年來,人工智能在醫學圖像領域的發展為BMD的測量提供了新的機遇,既往研究顯示深度學習模型可從腹部平掃CT中預測腰椎vBMD,與DXA測量結果具有較好的一致性[6]。本研究筆者通過構建以3D-ResUNet和Attention-UNet為基礎的深度學習模型,從LDCT中預測椎體vBMD,并評估該模型診斷骨質疏松的性能。

材料與方法

1.病例資料

回顧性分析2018年6月-2019年12月弋磯山醫院符合以下標準的體檢人群的LDCT資料。納入標準:①年齡≥40歲;②同時行LDCT聯合QCT椎體vBMD測量[7]。排除標準:①圖像質量不佳;②近期注射靜脈對比劑;③脊柱手術史、測量區有嚴重的骨折、脊柱畸形或植入物;④合并任何可能影響脊柱的疾病如脊柱腫瘤及其他代謝性骨疾病等。⑤QCT報告中vBMD L1/L2椎體測量值的比值超過3個標準差(SD)。根據身高、體重計算其BMI指數(BMI=體重/身高2)。最終1406例患者納入研究,男889例,女517例,年齡40~94 (57±10)歲。1406例患者采用隨機數表法按7:3的比例分配至訓練集(train set)及測試集(test set),分別為985例、421例。

2.數據采集

本研究采用GE公司Optima CT540機型,掃描范圍包括肺尖到L2椎體。掃描參數:管電壓120 kV,采用自動毫安技術,螺距1.75:1,掃描視野(scanning field of view,SFOV)500 mm,床高135 mm;重建方式:矩陣512×512,算法:LUNG,層厚1.25 mm、層間距1.25 mm。因本研究的目的是在LDCT中機會性篩查骨質疏松狀態,故未使用骨礦物質等效體模掃描。

3.QCT測量骨密度

LDCT數據傳輸至QCT工作站(美國Mindways QCT PRO工作站)進行異步分析處理。所有分析均由經過培訓并具有使用QCT軟件經驗的放射科醫師進行。操作者選取每個椎體中間層面(采集T12~L2范圍中的兩個完整椎體,一般是L1~L2椎體)進行分析測量,取兩者平均值作為測量結果vBMDQCT[7]。

4.數據處理與模型訓練

圖像分割:使用ITK-SNAP軟件(版本3.8.0,http://www.itksnap.org/)對訓練集數據進行圖像分割。由1名具有5年經驗的放射科醫師在不知患者臨床信息的前提下逐層勾畫胸部的椎骨、鎖骨、肩胛骨和肋骨的骨輪廓得到感興趣區(region of interest,ROI)。

模型訓練:本研究中構建的模型由數坤網絡科技股份有限公司搭建平臺并訓練,模型基于深度卷積神經網絡(deep convolutional neural networks,DCNN)開發,訓練過程分為4步(圖1),最終得到訓練好的骨密度檢測模型。第一步,訓練骨分割模型,以UNet作為基本骨架,骨分割網絡在每個卷積層之前加入了殘差結構,構建了3D-ResUNet。模型的輸入為LDCT檢查的3D數據及人工標注的骨輪廓,輸出為胸部的椎骨、鎖骨、肩胛骨和肋骨分割結果。第二步,加入椎骨關鍵點Attention-UNet模型。在UNet的輸出層之前加入了注意力機制,使得網絡能夠對椎骨骨節的關鍵點進行定位,輸出T12、L1、L2椎體的位置?;谏鲜鲫P鍵點選取腰大肌,基于CT值選取前腹壁皮下脂肪ROI。第三步,去皮質骨處理?;讷@取到的椎骨關建點,分割出對應的椎體子區域并判定其掃描完整性,通過一個半徑為4個體素的球體對椎體掩模(mask)做侵蝕處理,去除椎骨的皮質骨,僅對椎體內的松質骨進行分析。第四步,基于骨密度與CT值的線性關系,使用脂肪、肌肉作為內部校正參數構建如下函數計算椎體骨密度預測結果vBMDAI。

圖1 基于深度卷積神經網絡構建骨密度自動測量模型。

vBMDAI是預測的骨密度值,MUSCLEd、FATd分別是肌肉、脂肪密度值,SPINEct、MUSCLEct、FATct分別是測量得到的椎體、肌肉和脂肪的CT值。

5.統計學分析

使用SPSS 26.0版本軟件進行數據統計。檢驗水準:P<0.05有統計學意義。

深度學習模型與QCT測量的一致性驗證:應用Spearman相關系數分別在訓練集和測試集中檢驗AI模型輸出的骨密度值vBMDAI和QCT測量的骨密度值vBMDQCT的相關性。應用組內相關系數(interclass correlation coefficient,ICC)和Bland-Altman法驗證兩種方法的一致性。應用ROC曲線并計算曲線下面積(area under the curve,AUC)對AI模型診斷OP效能進行評估。

OP的診斷參照《中國定量CT(QCT)骨質疏松癥診斷指南2018版》[8],以vBMD<80 mg/cm3作為骨質疏松癥的陽性判定標準。

結 果

1.一般資料

訓練集與測試集中患者間年齡、性別、身高、體重、BMI、QCT測量的骨密度值vBMDQCT差異均無統計學意義(P值均>0.05,表1)。

表1 訓練集和測試集中患者間臨床資料比較

2.骨密度測量

Spearman相關系數顯示(圖2、3)訓練集中AI模型輸出的骨密度值與QCT測量的骨密度值呈正相關(r=0.957,P<0.001),在測試集中AI模型輸出的骨密度值與QCT測量的骨密度值呈正相關(r=0.955,P<0.001)。在訓練集中組內相關系數(95%置信區間)為0.946(0.940~0.952),在測試集中為0.945(0.934~0.954)。Bland-Altman法分析顯示(圖4、5)訓練集中AI模型與QCT測量的方法差值(95%一致性界限)為-1.425(-21.90~19.05) mg/cm3,0.052%(51/421)的點在95% LoA之外;測試集中差值為-1.23(-21.51~19.05) mg/cm3,0.057%(24/421)的點在95% LoA之外。兩種方法一致性較好。訓練集中ROC曲線結果顯示AI模型輸出的骨密度值診斷骨質疏松的AUC為0.986(95%CI:0.979~0.993),測試集中AUC為0.975(95%CI:0.953~0.997)。靈敏度為42.1%(16/38),特異度為100%(383/383),準確度為94.8%(399/421),陽性預測值為100%(16/16),陰性預測值為94.6%(383/405)(圖6、7)。

圖2 訓練集(n=985),模型與QCT骨密度測量值呈正相關(r=0.957,P<0.001)。 圖3 測試集(n=421),模型與QCT骨密度測量值呈正相關(r=0.955,P<0.001)。 圖4 Bland-Altman分析顯示訓練集中AI模型測量和QCT測量骨密度差值為-1.43(-21.90~19.05)。 圖5 Bland-Altman分析顯示測試集中AI模型測量和QCT測量骨密度差值為-1.23(-21.51~19.05)。 圖6 訓練集AI模型測量的骨密度值診斷骨質疏松(vBMD<80 mg/cm3)的ROC曲線,曲線下面積AUC為0.986。 圖7 測試集AI模型測量的骨密度值診斷骨質疏松(vBMD<80 mg/cm3)的ROC曲線,曲線下面積AUC為0.975。

討 論

早期篩查并及時采取防治措施是降低OP骨折發生率的重要策略,但我國現有BMD測量儀的數量遠不能滿足臨床需求,據統計我國50歲以上人群中接受過BMD檢測的比例僅為3.7%[9]。低劑量胸部CT體檢和新冠肺炎篩查產生了大量CT數據[10]。

本研究通過構建了一套基于DCNN開發的全自動骨密度檢測模型,利用LDCT中預測椎體vBMD并與QCT測量結果進行了比較。研究結果顯示該模型與QCT測量的骨密度值具有很高的一致性,對OP具有很高的診斷效能。

DXA和QCT是測量骨密度的主要方式。QCT采用專用體模和軟件測量松質骨的體積骨密度,不受骨骼體積、形態以及脊柱退行性變的影響,準確性較DXA更高[11]。但QCT需人工勾畫ROI,費時費力;操作者間的一致性難以確定,需要更高頻的專業質控。通過深度學習模型進行ROI的自動勾畫有助于克服人工操作的誤差,大大減少人工成本和節約時間成本,測量結果具有可重復性。利用該模型可在患者進行LDCT檢查時常規篩查OP,患者無需額外接受輻射和費用。

一些國外研究[6,12]探索了通過CT值估算BMD的可能性,報告的相關系數介于0.399和0.891之間,發現腰椎CT掃描的CT值與DXA或QCT測量結果有較好的相關性。大部分研究仍以腰椎CT為基礎[13],基于低劑量胸部CT上進行的研究很少。Kaesmacher等[14]探索了基于校正體模(包括同步和非同步方式)和無體模(基于內部組織校準)的可能,提出了基于內部組織校準的公式。松質骨無明顯界限,提取過程無法直接進行標注分割,本研究構建的模型從自動骨分割開始,椎體定位、去皮質骨到內部組織校準,最終實現全自動輸出BMD值。在測試集中AI模型診斷OP的靈敏度僅為42.1%(16/38),這與數據組成有關。本研究中納入的數據來自體檢人群,患病比例低,僅有9%(38/421),模型后續仍需在患者中進行優化和調整。結果看ICC和Bland-Altman分析可知AI模型與QCT測量的骨密度結果具有很高的一致性。模型的陽性預測值、陰性預測值和準確性都很高,可滿足在健康體檢中增加OP機會性篩查的需求。

筆者對測試集中表現較差的數據進行分析,發現如下3類原因:①脊柱存在輕度骨質增生的患者亦被納入,在松質骨分割時對增生部分過分割,使測量結果偏大。②患者脊柱旋轉或/和曲度較大,影響椎體分割準確性。③受檢者過瘦,皮下脂肪偏薄,影響AI對脂肪的提取。既往研究發現低劑量胸部CT聯合QCT測量的腹內脂肪面積與血脂生化指標、骨密度均有相關性[15,16],不除外多或極少的腹內脂肪面積對骨密度測量產生影響。

本研究存在以下局限性:①為回顧性單中心研究,且數據來自健康體檢人群,無法代表全部人群,尤其是存在骨質疏松風險的人群。下一步需多中心大樣本數據進一步驗證AI模型與QCT測量值的一致性和對OP的診斷效能。②AI模型尚不能預測一些極端情況,例如椎體形態變異、腰椎嚴重退行性病變、皮下脂肪薄等。③本研究以QCT測量結果作為參考標準,可能存在誤差,需要進一步核查QCT勾畫的ROI和體模校正情況。今后的研究中利用深度學習模型有望輔助定量分析腹內脂肪面積等更多指標,挖掘更多影像、臨床信息之間的相關性,提高預測效能。

綜上所述,本研究通過基于DCNN的方法構建了LDCT的骨密度自動測量模型,它不需要額外的設備、特殊的體模和復雜的質控流程,無需依賴影像醫生的經驗,此外,可以回顧性地獲取vBMD數據。因此,該方法可用于擴大骨質疏松癥的人群篩查,特別是在雙能X線吸收法(DXA)受限的國家或地區,對增加普通人群的機會性篩查具有重要的意義。

利益沖突: 所有作者沒有任何利益沖突,未接受任何不當的職務或財務利益。

猜你喜歡
骨密度一致性椎體
預防骨質疏松,運動提高骨密度
關注減污降碳協同的一致性和整體性
注重教、學、評一致性 提高一輪復習效率
經皮椎體成形術中快速取出殘留骨水泥柱2例報道
天天喝牛奶,為什么骨密度還偏低
IOl-master 700和Pentacam測量Kappa角一致性分析
不要輕易給兒童做骨密度檢查
老年骨質疏松性椎體壓縮骨折CT引導下椎體成形術骨水泥滲漏的控制策略探討
超聲檢查胎兒半椎體1例
椎體內裂隙樣變對椎體成形術治療椎體壓縮骨折療效的影響
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合