?

一種基于肝分段和肝癌輪廓融合的放療靶區數據庫建立方法

2022-11-02 07:26申海洋彭祥煒王興李廣欣黎功袁克虹
中國醫學物理學雜志 2022年10期
關鍵詞:勾畫靶區分段

申海洋,彭祥煒,王興,李廣欣,黎功,袁克虹

1.北京清華長庚醫院放療科,北京 102200;2.清華大學深圳國際研究生院,廣東深圳 518000

前言

據2018年GLOBOCAN 數據顯示,全球新發肝癌病例約79 萬例,死亡率居各類惡性腫瘤第2 位[1]。我國是肝癌大國,原發性肝癌是我國第4位常見惡性腫瘤[2],發病人數占全球的55%[3]。2017年,在我國因病早逝的人群中因患肝癌去世的人群排名第5位,死亡率高達30/10 萬人[4],嚴重威脅著人們的健康。手術切除是治療早期原發性肝癌的首選方法[5],在精準肝切除理念的指導下,以肝臟的解剖結構和功能分段為基礎,借助數字外科技術平臺,通過精確的定量分析和手術規劃,以達到徹底清除病灶、最大限度地保留殘余肝臟的結構完整和功能代償、降低手術創傷的目的。精準肝切除的發展極大地提高了肝癌的治療有效率。然而,我國肝癌患者的手術切除率僅為20%~30%,多數患者發現時已達中晚期[6],錯過手術治療時間,只能選擇非手術治療。原發性肝癌對放射治療敏感,其敏感性與低分化鱗癌相當[7]。美國國立綜合癌癥網絡2018年肝膽腫瘤臨床實踐指南指出,對于肝癌,任何位置的腫瘤都可以采用放療手段進行局部治療,并強烈推薦使用圖像引導下的放射治療[8]。

隨著科技的發展,放療技術不斷進步,醫生可以使用三維適形及調強放射治療等新型放療技術向靶區輸送高輻射劑量藥劑,且不會影響肝部的整體功能,使肝癌的放療日趨精準[9]。盡管如此,放療仍然是一種“有損傷性”的治療方式,其產生的損傷與受照射組織的體積、劑量有關。一般來說,肝臟受照射的體積越大,其最大的耐受劑量越小,越容易發生放射性肝損傷[10]?,F有放射治療未考慮肝臟的解剖分段與腫瘤靶區的空間位置關系,并非真正意義上實現精準放療,容易對不同肝段進行高劑量輻射轉送,無法對肝段進行功能性保護,從而增加肝臟功能損傷,造成不良預后[11]。

借鑒精準肝切除的理念,依托人工智能系統,將腫瘤靶區與肝分段解剖及脈管系統的位置關系納入放療計劃設計、優化中考量,最大限度地降低放療對其他肝段的影響,確保剩余肝臟結構完整和功能代償[12-14],將在一定程度上降低放療對正常肝臟組織的損害,進而提高放療在肝癌中的治療效果[15]。在構建人工智能系統的過程中,數據是必需的關鍵基礎設施,在很大程度上決定人工智能系統的性能、公平性、穩健性、安全性和可擴展性[16]?;诖?,本研究提出一種基于肝分段和肝癌輪廓融合的放療靶區數據庫建立方法,進而為肝臟正常組織精準勾畫以及精準放療的發展提供數據支撐。

1 建立數據庫的必要性和依據

1.1 建立數據庫的必要性

放療是以圖像信息為基礎的治療方式,肝癌的放療一般需要經過醫生看診、計算機斷層掃描(CT)模擬定位、磁共振成像(MRI)、靶區勾畫、計劃設計、驗證及治療實施7個步驟。定位階段獲取病灶的圖像信息,同時明確放療實施部位并標記。計劃階段則主要參考患者CT圖像對病灶進行靶區勾畫,經過周密的計算和規劃制定放療處方,盡可能保護危及器官。當前,在靶區勾畫和計劃階段主要以平面圖像為基準進行,缺乏病灶與肝段的位置關系,使實現基于精準肝切除理念的放療成為難點。因此,為實現真正意義上的精準化肝癌放療,必須將具有肝分段與靶區勾畫的圖像進行融合,創建融合圖像數據庫。在融合圖像數據庫的指導下,放療計劃設計和實施可以精確到肝段內,盡可能保護剩余肝臟的完整解剖結構,使得肝癌放療更加精準。

此外,當前已有不少機構研發放療自動靶區勾畫的軟件,但目前尚缺乏統一的結果檢驗標準,尤其針對某一器官組織,從而為自動勾畫軟件的推廣增加了很多難度。融合圖像數據庫為軟件的測試標準提供了一種參考,可以用來測試現有肝部放療自動靶區勾畫軟件,驗證其勾畫質量及勾畫效果,使實現放療靶區勾畫的自動化成為可能[17]。因此,非常有必要構建肝分段及靶區勾畫融合的數據庫推動智慧化放療和精準放療的發展。

1.2 建立標準數據庫的依據

本數據庫參照人工智能醫療器械數據集質量相關的基礎標準,綜合參考醫療器械、信息技術、衛生數據管理、臨床數據管理等相關領域的數據質量要求與評價方式,根據人工智能醫療器械技術特點而進行數據庫的建設[18]。

為了確保既能作為人工智能數據庫訓練的使用,同時也能作為未來的行業驗證標準和規范的數據庫,本數據庫參照多種相關的規范,主要包括YY/T 0287-2017《醫療器械質量管理體系用于法規的要求》、YY/T 0316-2016《醫療器械風險管理對醫療器械的應用》、國家食品藥品監督管理總局《深度學習輔助決策醫療器械軟件審評要點(2019年第7 號)》、GB/T 36344-2018《信息技術數據質量評價指標》、GB/T 34960.5-2018《信息技術:服務治理第5部分:數據治理規范》、GB/T 25000.12-2017《系統與軟件工程:系統與軟件質量要求和評價(SQuaRE)第12 部分:數據質量模型》等[19]。

2 數據庫建立方法

醫學影像數據庫是利用數據庫系統將醫學影像數據信息以匯聚形式展現,根據數據結構對影像數據或數據集進行組織、存儲和管理。標準數據庫建立在良好的數據基礎上,要求數據具有真實性、準確性、完整性及可塑性。數據庫的建立是一個全生命周期的管理過程,需經過數據采集、數據預處理、數據標注及數據集構建等過程,同時在全過程中保證持續的數據質量管理。圖1給出了整個數據庫入庫及使用的流程圖。

2.1 數據采集

數據采集過程依賴臨床機構實際的病例數據。入選病例圖像為肝癌患者的腹部CT 影像資料,作為原始圖像,在醫學影像系統篩選肝癌患者的上述圖像,將數據批量導出。導出時對原始圖像數據進行脫敏處理,隱去所有涉及患者隱私的個人信息,確保數據的采集過程符合倫理要求,最終將所采集的圖像數據匯聚形成初始數據儲存庫留待處理[20]。在之后的流程中,將會分別對同一張原始圖像做帶有肝臟放療靶區勾畫和分區分段輪廓標注工作,最后將兩者圖像融合,實現精準肝切除理念下放療優化。

2.2 數據預處理

數據預處理過程是保證數據庫準確性的基礎,在這一過程中需對數據進行清洗篩選,刪減質量較差、診斷存疑及診斷不符的圖像,留存清晰、典型的高質量圖像,進而形成基礎數據庫。

2.3 數據標注

2.3.1 肝癌放療靶區勾畫在患者的腹部CT 圖像上完成肝癌的放療靶區標注,標注內容包括肝癌病灶的大體靶區(GTV)、臨床靶區(CTV)、計劃靶區(PTV)和危及器官等,標注工作由具有5年以上工作經驗且經統一培訓的放療科醫師完成。標注規則以肝癌放射治療指南為基礎,由放療領域專家制定。隨后,在最大限度保護危及器官的前提下,由物理師進行放療計劃設計,再由醫師進行最終審核,確保無誤后方可納入數據庫形成靶區勾畫標注數據庫。

2.3.2 肝臟分區分段標注在肝臟三維重建圖像上根據肝臟血管膽管樹的走形進行肝臟分區分段的標注。標注規則以肝臟解剖學為基礎,由肝臟外科領域專家制定,標注過程在肝臟外科醫生的指導下進行,核對無誤后形成肝臟解剖分區分段輪廓數據庫。在標注過程中,每1 例圖像均由兩位醫師標注,并通過雙重審核保證標注結果的質量。

2.4 輪廓融合

在輪廓融合階段,通過算法將相互匹配的放療靶區勾畫圖像(圖2)與肝臟解剖分段圖像進行輪廓融合,使得肝臟的分區分段及放療計劃靶區在一個圖像中同時存在(圖3),得到原發性肝癌輪廓融合圖像(圖4),進而實現精準肝切除理念下的肝臟放療優化。

2.5 數據集的劃分與使用

2.5.1 數據集的劃分運用以上方法建立原發性肝癌輪廓融合圖像標準數據庫后,可以為肝癌圖像處理任務提供有效的支撐數據集。例如做靶向肝分割任務時,可以將數據庫按照3:1:1 的比例劃分為訓練集、驗證集、測試集。為了保證數據集劃分的科學性和準確性,3 個數據集中的病人性別、年齡、GTV、CTV、PTV、肝臟體積等數據統計均值盡可能保持一致。訓練集用于最初的算法訓練與制定,讓模型擬合數據樣本;驗證集用于驗證當前模型的泛化能力,并對模型優化更新;測試集用于評估最終模型的泛化能力,進而滿足算法模型的解釋性、準確性及魯棒性要求[21]。

除了上述劃分數據集的方法外,還可以用交叉驗證法使用數據集完成醫學圖像處理相關任務。交叉驗證法的做法是將肝癌數據集劃為均等但不相交的K份,每一份數據集中病人性別、年齡、GTV、CTV、PTV、肝臟體積等數據統計均值盡可能保持均等。之后將K-1份數據集作為訓練集,將另外一份數據集作為測試集,將算法執行K次[22]。

2.5.2 數據集的使用本文構建的肝癌數據庫可以用于基于深度學習的肝分割訓練和測試任務[17]。Unet是著名的醫學圖像分割網絡,運用本文數據集可以訓練Unet 網絡以得到精準肝分割模型。具體流程是:向網絡輸入肝癌圖像,Unet 網絡會將圖像編碼(降采樣)、圖像解碼(升采樣),最后將圖像像素級融合以輸出分割結果,可以計算每一次分割結果與原圖MASK 的Dice 系數作為損失函數,之后反向傳播逐步優化模型[23]。訓練結束后,可以用測試集評估該模型的最終泛化能力,評價指標可以用Dice 系數或者分割結果與原圖MASK 的交并比(IOU)。在肝癌圖像輸入到網絡前,可以使用拉普拉斯算子(Laplace)將圖像濾波,以增強圖像的邊緣信息,這樣可以提高訓練網絡模型對肝癌圖像的分割精度[24]。如圖5所示,展示使用Unet深度學習分割網絡和拉普拉斯算子進行的靶點分割實際效果。

2.6 數據管理支撐體系

標準數據庫的建立除要求對數據進行精確處理外,還需要完善的管理支撐體系保障數據庫的正常運行[25]。數據管理支撐體系包括數據質量系統、數據運維系統及數據安全系統。

數據的數量和質量是決定人工智能應用效果的基礎,對人工智能產品性能起著決定作用,因此數據庫建立過程中對數據的質量有嚴格要求。數據質量系統即運用系統方式對數據的質量進行嚴格控制,以保證數據庫的標準性。標準數據庫建立后,需要依賴數據運維系統進行日常的運行及維護,以確保數據庫的正常運轉[26]。此外,信息安全是網絡時代越來越受重視的領域,標準數據庫中蘊藏著海量的信息,因此需依托一套完善的數據安全系統來保障數據的安全性。經過上述流程,本文所構建的肝癌放療靶區CT影像數據庫概況見表1。

表1 肝癌放療靶區CT影像數據庫建立概況Table 1 Brief introduction of CT image database of radiotherapy target areas in patients with liver cancer

3 總結與討論

本文基于精準肝切除理念提出一種肝癌放療靶區數據庫的建立方法,通過圖像融合技術使肝癌的放射治療精確到肝段,最大限度地減少放療對肝臟正常組織的影響,進而提高患者預后。該數據庫已實現框架的建立,后續會逐步更新更多的肝癌數據。該肝癌數據庫可以用于基于深度學習的肝分割訓練和測試任務,進而得到可以準確進行肝分割的算法模型以實現肝部精準放療。

本文所提出的數據庫建立方法在實際運行中仍存在一些難點,如在標定規則的認可度方面,不同的醫院和專家之間可能存在個性化的差異,因此如何提高標注規則的認可度,使其得到公認是實際操作過程中應該重點關注的環節。另外,在醫生來源方面,不同醫生的準確性存在差異,因此在標注結果的一致性上需要進行質量控制,如通過對一個圖像進行雙標注,提高準確性和一致性。而對于數據庫的標準性,需要經過多次自我測試和第三方測試進行調試和優化,以提高數據庫的普適性。待數據庫可以保證準確性、一致性、普適性后會公開,可為肝癌數據研究提供資源。我國的數據庫建設尚處于滯后狀態,無論是從社會資源投入方面還是數據共享方面,較發達國家均存在較大差距。因此,需集中力量加快數據庫的建設、統一標準、提高質量,為精準放療的發展提供有力的支持。

猜你喜歡
勾畫靶區分段
兩種自動勾畫軟件對危及器官勾畫結果對比分析
肺部靶區占比對非小細胞肺癌計劃中肺劑量體積的影響
放療中CT管電流值對放療胸部患者勾畫靶區的影響
放療中小機頭角度對MLC及多靶區患者正常組織劑量的影響
分段計算時間
烏拉特后旗查干陶勒蓋地球化學環境及其成礦條件分析
分段函數“面面觀”
尋求分段函數問題的類型及解法
3米2分段大力士“大”在哪兒?
找一找
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合