?

基于TCPA數據庫分析宮頸癌蛋白表達及其臨床意義

2022-02-13 10:45王文湛陰克強張三元
中國生育健康雜志 2022年1期
關鍵詞:宮頸癌通路蛋白

王文湛 陰克強 張三元

宮頸癌作為僅次于乳腺癌的發展中國家女性第二大常見惡性腫瘤,主要包括宮頸鱗狀細胞癌和宮頸腺癌,其中腺癌占20%~25%[1-2]。近年來隨著宮頸癌篩查的普及與HPV疫苗的應用,宮頸鱗癌的發病率有下降趨勢,而宮頸腺癌的發病率呈上升趨勢,且趨于年輕化[3],腺癌組織病理學復雜、預后差,其早期診斷與預后判斷顯得尤為重要。

癌癥基因組圖譜(the cancer genome alas,TCGA)是目前使用廣泛、數據維護相對成熟完善的公共組學數據庫,隨著后基因組時代、蛋白質組學、代謝組學研究的不斷深入,利用生物信息學方法處理海量數據,對腫瘤發生發展增加宏觀、整體化的認識成為了目前的重要趨勢,國內外諸多腫瘤領域專家基于TCGA等數據庫在尋找潛在的腫瘤預后、早期篩查、發生發展相關的腫瘤分子標志物等方面進行了大量研究[4-5],本文基于癌癥蛋白質組圖譜(the cancer proteome atlas,TCPA) 數據庫及TCGA數據庫中的宮頸癌蛋白表達與臨床預后數據進行分析,以期尋找宮頸癌預后相關蛋白,并構建風險模型預測宮頸癌預后。

資料與方法

1.數據收集:從TCPA數據庫(https://www.tcpaportal.org/)下載v4.2版本的的CESC患者腫瘤的的反相蛋白芯片(reverse-phase protein arrays,RPPA) 的level 4數據,Dataset ID 為TCGA- CESC -L4,Platform 為MDA_RPPA_Core,共171個樣本的220個蛋白的數據。TCGA數據庫(https://portal.gdc.cancer.gov/,檢索時間:2020.6.22)下載CESC患者的臨床資料,共307例患者。

2.蛋白表達與宮頸癌預后分析及風險模型構建:將蛋白數據與生存資料合并,根據蛋白表達量的中位值將患者分為高表達和低表達兩組,使用Kaplan-Meier方法進行高低表達組之間的總生存期(overall survival,OS)的比較,并作log-Rank檢驗,檢驗標準為P<0.05。同時使用單因素Cox比例風險模型分析蛋白表達與OS的關系,檢驗標準為P<0.05,并繪制火山圖。將同時符合log-RankP<0.05和CoxP<0.05的蛋白篩選出來并使用多因素Cox比例風險模型分析,以向前法和向后法進行篩選,繪制模型蛋白生存曲線,并計算出風險得分,以風險得分中位值為界分為高低風險兩組,并繪制風險生存曲線和風險曲線熱圖。

3.風險模型的獨立預后分析:將風險得分與臨床資料合并,并刪除臨床資料不完整及不確定的數據,共得到78例患者的數據,風險值與患者臨床病理學特征的關系采用χ2檢驗,檢驗標準為P<0.05。并進行單因素及多因素Cox比例風險模型分析風險模型的預后作用,檢驗標準為P<0.05。利用受試者工作特征曲線(receiver operator characteristic curve,ROC),評價風險值在診斷宮頸癌中的靈敏度和特異度,ROC曲線下面積(area under the ROC curve,AUC)評估模型效能。

4.統計學處理:所有的統計分析均在R 3.6.3中進行。KM分析及Cox分析采用survial包,火山圖繪制采用ggplot2及ggrepel包,風險熱圖繪制采用pheatmap包,ROC曲線繪制采用survialROC包。

結果

1.蛋白表達與宮頸癌預后分析及風險模型構建:單因素分析顯示與宮頸癌預后相關的高風險蛋白有ACC1、ASNS、BCLXL、BID、CRAF_pS338、CYCLIND1、FASN、HER3_pY1289、MEK1_pS217S221、MIG6、MRE11、NCADHERIN、PAI1、RAB11、RAD51、SMAD3、STATHMIN、X1433BETA、X4EBP1_pT70、YAP等20種蛋白,低風險蛋白Bcl-2、CD31、CHK1_pS345、ERALPHA_pS118、JAK2、KU80、PDK1_pS241、SF2等8種蛋白(圖1)。單因素及多因素分析及KM分析篩選出來的與預后顯著相關的納入風險模型的蛋白有7個,其中Bcl-2為低風險蛋白(圖2a),CRAF_pS338、CYCLIND1、MEK1_pS217S221、SMAD3、X4EBP1_pT70、YAP為高風險蛋白(圖2b-2g)。風險生存曲線顯示風險得分與預后顯著相關(圖2h),高低分險5年生存率分別為0.547(95%CI:0.398~0.750)、0.813(95%CI:0.681~0.971)。風險曲線熱圖顯示CYCLIND1、MEK1_pS217S221、SMAD3、X4EBP1_pT70、YAP、CRAF_pS338為高風險蛋白,Bcl-2為低風險蛋白(圖3)。

圖1 宮頸癌預后相關的蛋白表達

圖2 蛋白表達與宮頸癌預后的生存曲線

圖3 宮頸癌預后的風險曲線

2.風險模型的獨立預后分析:單因素分析顯示,風險得分與預后顯著相關(表1)。多因素分析顯示,風險得分與預后顯著相關(表1)。風險得分的AUC為0.919(圖4)。

表1 宮頸癌風險模型的獨立預后分析

圖4 風險模型的ROC曲線

討論

本文通過單因素分析顯示與宮頸癌預后相關的高風險蛋白有ACC1、ASNS、BCLXL、BID、CRAF_pS338、CYCLIND1、FASN、HER3_pY1289、MEK1_pS217S221、MIG6、MRE11、NCADHERIN、PAI1、RAB11、RAD51、SMAD3、STATHMIN、X1433BETA、X4EBP1_pT70、YAP等20種,低風險蛋白Bcl-2、CD31、CHK1_pS345、ERALPHA_pS118、JAK2、KU80、PDK1_pS241、SF2等8種。主要集中在腫瘤代謝、細胞周期、凋亡調控、細胞運動等腫瘤研究領域,與腫瘤的發生、發展、侵襲、轉移、耐藥等過程密切相關。

最終發現納入風險模型的CYCLIND1、MEK1_pS217S221、SMAD3、X4EBP1_pT70、YAP、CRAF_pS338六種蛋白作為高風險蛋白。CYCLIND1系典型的細胞周期G1/S期調控蛋白,G1/S期作為細胞周期中信號傳遞及細胞增殖的關鍵調控窗口。CYCLIND1促細胞周期不斷G1/S轉化從而使細胞持續分裂致瘤。有研究[6]表明,CYCLIND1的高表達通常提示宮頸癌預后不良。張倩雯[7]等的研究表明,CIN和宮頸癌中CYCLIND1蛋白表達率高于正常組。周密[8]等的研究表明,宮頸癌新輔助化療后CYCLIND1陽性率降低,且其為影響新輔助化療效果的影響因子。分析可能機制為G1/S轉化致DNA異常轉錄,對化療敏感性降低。這與我們的研究其作為模型蛋白中的高風險蛋白一致。MEK是一類參與絲裂原活化蛋白激酶 (mitogen-activated protein kinase,MAPK)信號轉導的酶家族,已鑒定出7種。其中MEK1、MEK2參與RAS/RAF/MEK/細胞外信號調節蛋白激酶(extracelluar regulated protein kinase,ERK)通路,并最終激活效應分子ERK1/ERK2參與線粒體途徑的凋亡,該通路的過度激活可致細胞惡性增生[9]此外,作為線粒體凋亡途徑中的凋亡抑制分子Bcl-2和促凋亡分子Bax均受到ERK1/2的調節,活化的ERK1/2使BCL-2表達增多、Bax表達抑制,進而通過BCL-2和Bax對線粒體凋亡途徑進行抑制,增強細胞抗凋亡能力,促進細胞生長。預后模型中的蛋白作為經典腫瘤信號通路互相調控的節點或可反映腫瘤信號網絡的核心調控過程。作為腫瘤發生、發展及轉移浸潤密切相關的轉化生長因子β(Transforming growth factor-β,TGF-β)信號傳導途徑的下游信號分子,Smads蛋白家族在宮頸癌細胞的分化、增殖過程中有著重要的意義。韋榮飛等[10]的研究表明Smad3在乳腺癌、肺癌、宮頸癌中均可促進腫瘤細胞遷移。TGF-β信號通路在腫瘤的進展中起著雙相的作用,在初期通過影響細胞周期抑制腫瘤生長。腫瘤進展中,這種抑制作用逐漸減弱甚至消失,使得腫瘤細胞出現生長優勢。這可能與該傳導路中傳導元件突變有關[11]。4EBP1是eIF4E的特異性抑制分子,被PI3K/AKT磷酸化為p-4EBP1后失去對eIF4E的抑制作用,進而通過eIF4E的轉錄因子活性來調控多種基因的表達,作為PI3K/AKT/mTOR這一具有廣泛生物學效應信號通路的關鍵介質,陳鳳霞等的研究[12]表明,p-4EBP1在宮頸癌組織中的含量顯著高于癌旁病灶組織及宮頸上皮內瘤變組織。同時觀察到與宮頸癌旁病灶及宮頸上皮內瘤變組織相比,宮頸癌病灶組織中的CyclinD1 mRNA表達量顯著升高,這與本研究模型中高風險蛋白同時包含了4EBP1、CyclinD1相一致,也體現了蛋白表達在宮頸癌病理生理過程可視化中的意義,蛋白表達的改變必然適于功能的需要或者說功能是通過蛋白的改變來實現的。劉蘭等[13]的研究表明EBP1在癌組織中的表達明顯高于癌旁組織,且表達與腫瘤的臨床分期及淋巴結轉移等預后相關因素密切相關。這也與本研究最終將該蛋白納入預后模型一致。YAP作為經典腫瘤信號通路Hippo通路的核心效應分子,目前被普遍認為是原癌基因,在多種癌癥中均檢測到了YAP的高表達現象,王文慧[14]等的研究表明:YAP1在宮頸癌組織呈高表達,其表達與臨床分期、是否淋巴結轉移關系密切,為宮頸癌的獨立預后影響因素,高表達YAP1的宮頸癌患者預后差。這與本研究模型的研究結果相一致。CRAF是RAF激酶家族的重要成員,可通過激活下游的MEK/ERK信號通路調節細胞增殖及腫瘤耐藥[15],但其在宮頸癌中的研究尚少。

BCL-2家族于1988年發現,作為目前研究最深入、廣泛的經典凋亡調控基因,嚴格調控細胞的凋亡機制。在本研究的模型中,Bcl-2蛋白作為低風險蛋白,隨著表達量的增高,患者風險值降低?,F有的研究表明,在多種人類腫瘤中,均出現了Bcl-2蛋白的過表達[16]。作為凋亡調控基因其機制在于限制細胞的死亡。目前普遍認為Bcl-2的表達水平隨著CIN等級升高,但與這些研究相反,Shukla等的研究表明[17]Bcl-2的表達隨著CIN等級的升高而降低。Bcl-2在宮頸癌進展中的意義尚存在爭議。本研究結果中Bcl-2作為低風險蛋白是在本文數據庫分析中,以風險模型及風險值分析方法下的結果。具體其在宮頸癌發生、發展中的意義尚需進行更加深入的研究。

本研究中,單因素分析所得到的與預后相關的蛋白種類眾多,而最終形成預后模型的蛋白僅剩7種,這可能與納入模型的蛋白處于宮頸癌病理生理過程中的核心過程,與這些蛋白所涉及信號通路的網狀調控相關。這也與我們目前的認識相一致,在腫瘤發展過程中,多種功能協同的信號通路及核心蛋白的改變呈現出協同化態勢以適應腫瘤的發生、發展、浸潤、轉移等生物學行為。

目前隨著宮頸癌疫苗及篩查手段的廣泛普及,宮頸癌的防治效力已得到了極大改善,但早期、內生型宮頸癌的診斷應臨床表現不典型、陰道鏡評估不滿意,存在一定漏診率,此外由于宮頸在生育中所承擔的重要作用,早期提供預后相關信息對保留生育功能等臨床決策十分重要。腫瘤作為一種多病因學且異質性極高的基因病,在現代腫瘤學領域對其認知已進入到不同疾病、不同條件下全基因組廣度的基因、RNA、蛋白質等的表達譜數據近乎完整捕獲的時代,這為從整體發展上把握腫瘤病理生理學的分子機制奠定了基礎,而大量的生物信息學分析方法將低通量所不易捕捉到的分子活動特征涉及的海量數據進行了挖掘,為目前對腫瘤病理生理學的進一步認識提供了新的研究方向。本文中基于對數據庫蛋白與預后數據的分析所構建的風險模型作為宮頸癌的獨立預后因子,AUC為0.804,具有良好的預后預測價值。目前眾多蛋白已被初步明了其在各類腫瘤中的表達量改變、原癌或抑癌效應、在多種信號轉導通路中所扮演的角色、上下游信號的調控、多種通路之間的網狀調控效應以及與臨床病理學特征的關系,但這對理解腫瘤的發生及后續的研究來說遠遠不夠,無法獲取整體視野的認知。本文中所構建的模型為進一步認識、研究海量蛋白質改變及其背后的信號轉導通路與預后之間的關系提供了一種新的思路。但因其僅作為基于TCPA數據庫所涵蓋檢測樣本數據的分析與構建,數據涵蓋的人種、腫瘤的具體分期、病理類型均十分復雜,與中國真實世界的數據之間匹配性如何不得而知,因此該預后模型僅可作為初步的理論探索,后續仍需在中國宮頸癌患者中進一步驗證其蛋白表達并進行預后隨訪,建立自己的數據庫,在我國的真實世界數據庫中進行模型的預后檢測效能驗證,方可進一步評估該模型的預后判斷效能,以期為宮頸癌早期檢測、預后判斷提供可靠靶點與證據。

猜你喜歡
宮頸癌通路蛋白
DJ-1調控Nrf2信號通路在支氣管哮喘中的研究進展
基于改進TF-IDF算法的基因通路富集方法
AngⅡ激活P38MAPK信號通路在大鼠NSAID相關小腸損傷中的機制研究
RNA結合蛋白與惡性腫瘤發生發展關系的研究進展
鋅指蛋白與肝細胞癌的研究進展
細砂糖對法式蛋白糖的質量影響研究
中國首個宮頸癌疫苗廈門誕生
如何選擇不同效價的宮頸癌疫苗?
水通道蛋白的發現
宮頸癌術前介入治療22例近期療效分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合