?

基于TCGA數據庫探索miR-4746-5p在肝癌中的表達及其臨床意義

2022-05-30 03:27程兆瑞程小平孫誠誼
南昌大學學報(醫學版) 2022年2期
關鍵詞:通路肝癌數據庫

程兆瑞,程小平孫誠誼,喻 超

(1.貴州醫科大學a.研究生院; b.附屬醫院肝膽外科,貴陽 550000; 2.南昌大學第一附屬醫院病理科,南昌 330006)

肝細胞癌(HCC)是世界上最常見的癌癥之一,在全球癌癥相關死亡原因中排名第三[1-2]。目前,已知的HCC主要致病因素包括病毒性肝炎、攝入黃曲霉素等有毒物質、非酒精性脂肪性肝炎和酒精相關性肝病等[3-4]。然而,多數HCC患者確診時已是晚期,預后往往不佳。因此,尋找一個有效的生物學標志物和新的治療靶點是一項緊迫且意義重大的任務。microRNA(miRNA)是指序列長度為22~25個堿基的內源性非編碼RNA,通過與靶mRNA的3′非翻譯區(UTR)結合來誘導mRNA降解或抑制其翻譯[4-5]。miRNAs的失調常見于多種人類惡性腫瘤,有研究[6-7]發現miRNAs在細胞凋亡、增殖、分化等生理過程中具有關鍵作用。因此,miRNA已被公認為是HCC診斷與治療中很有前景的治療和預后生物標志物。最新研究[8]發現miR-4746-5p是一種新型的癌癥相關微小RNA,在多種癌癥中異常表達,其表達水平可用于預測患者存活率。雖然已有研究[9]報道miR-4746-5p在肝癌中顯著上調且與肝癌患者不佳預后相關,但未見有探討miR-4746-5p表達與肝癌患者臨床病理特征關系的獨立研究。本研究基于癌癥基因組圖譜(TCGA)數據庫探索miR-4746-5p在肝癌中的表達及其與臨床病理特征、免疫浸潤的相關性,以期為miR-4746-5p在HCC診療及預后預測中的應用提供新的線索和依據。

1 材料與方法

1.1 數據來源

從TCGA數據庫(https://cancergenome.nih.gov/)下載HCC患者的臨床信息和miR-4746-5p的表達數據,用R軟件(v3.6.3)處理并整合數據,剔除生存隨訪數據不全和miR-4746-5p表達缺失的病例樣本。共獲得375例肝癌和50例癌旁肝組織的數據。將375例肝癌以miR-4746-5p表達量的中位數為界,分為高表達組(n=188)和低表達組(n=187)。

1.2 生物信息學分析

mirDIP(http://ophid.utoronto.ca/mirDIP/index.jsp#r)綜合了15個miRNA數據庫[10],可用于預測miR-4746-5p的潛在靶基因。從GEPIA(http://gepia.cancer-pku.cn/)網站下載HCC的差異表達基因?;虮倔w(GO)功能、京都基因與基因組百科全書(KEGG)均基于R軟件以“FDR<0.2和P<0.05”為閾值,用“cluster Profiler”包進行富集分析,用“ggplot2”包進行可視化。利用Kaplan-Meier Plotter網站分析miR-4746-5p的潛在靶基因在HCC中的預后價值。

1.3 通過ssGSEA分析免疫細胞特征

HCC免疫浸潤水平通過單樣本基因集富集分析(ssGSEA)和R軟件中的GSVA包進行分析。首先對腫瘤樣本中的24種免疫細胞進行GSEA分析,然后根據各種免疫細胞的特征基因,從每個腫瘤樣本的基因表達譜中量化每種免疫細胞的相對富集分數。

1.4 統計學方法

采用R語言edgeR軟件包進行統計分析。miR-4746-5p在肝癌組織與癌旁組織的表達差異比較,如果數據符合正態分布,則采用配對樣本t檢驗比較;如數據不服從正態分布,則采用Wilcoxom秩和檢驗。ROC曲線采用“pROC”包生成。miR-4746-5p表達水平與臨床病理參數之間的關系采用Logistic回歸分析。采用Cox單因素、多因素回歸分析和Kaplan-Meier法進行生存分析。采用Spearman相關性分析miR-4746-5p與免疫細胞浸潤水平的相關性以及免疫細胞浸潤水平與miR-4746-5p不同表達的相關性。以P<0.05為差異有統計學意義。

2 結果

2.1 肝癌組織miR-4746-5p的表達差異

通過對TCGA數據庫分析顯示,miR-4746-5p在肝癌組織中的表達明顯高于正常肝組織(P<0.01,圖1A)及配對癌旁組織(P<0.01,圖1B);T3/T4期肝癌患者miR-4746-5p表達水平較T1/T2期患者明顯增高(均P<0.05,圖1C),Ⅲ/Ⅳ期(TNM分期)肝癌患者miR-4746-5p表達水平較Ⅰ/Ⅱ期患者明顯增高(P<0.05,圖1D),組織學水平G3/G4級肝癌患者較G1/G2級患者明顯增高(P<0.05,圖1E)。miR-4746-5p在肝癌ROC曲線下面積為0.891(圖1F)。

圖1 miR-4746-5p在肝癌組織中的表達差異及ROC曲線

2.2 miR-4746-5p表達與肝癌患者臨床病理特征的關系

miR-4746-5p表達水平與TNM分期、組織學分級、年齡、甲胎蛋白水平、是否伴血管侵犯及T分期顯著相關(P<0.05),見表1。

表1 miR-4746-5p表達與臨床病理特征的關系

2.3 miR-4746-5p表達水平與肝癌患者不良預后的關系

Kaplan-Meier分析顯示,高表達組總生存期和疾病特異生存時間較低表達組明顯縮短(P=0.018、0.016,圖2A—B)。單因素Cox分析顯示,T分期、M分期、TNM分期及miR-4746-5p表達水平是影響肝癌患者總生存率的危險因素(P<0.05),進一步多因素Cox分析顯示,TNM分期和miR-4746-5p表達水平是影響肝癌患者總生存率的獨立危險因素(P<0.01),見表2。

圖2 miR-4746-5p表達與肝癌患者不良預后的關系

表2 肝癌預后影響因素的單因素和多因素Cox回歸分析

2.4 miR-4746-5p靶基因富集分析

通過miRDIP數據庫預測,可找到miR-4746-5p的潛在靶基因共821個,利用GO/KEGG對821個靶基因進行GO/KEGG富集分析后發現:生物過程類(BP)靶基因主要富集的條目是“正調節分化相關的細胞形態”“小GTP酶結合活性”“軸突部的組成”(圖3A);靶基因主要富集的信號通路是MAPK信號通路、軸突引導信號通路、自噬信號通路等(圖3B)。

圖3 miR-4746-5p靶基因的富集分析

2.5 miR-4746-5p表達與HCC免疫浸潤水平的關系

Spearman相關分析顯示,miR-4746-5p表達與癌組織中性粒細胞(Neutrophils)、NK細胞(NK cells)、巨噬細胞(Macrophages)、CD8 T細胞(CD8 T cells)等免疫細胞的豐度呈負相關,而與Th2細胞(Th2 cells)、輔助性T細胞(T helper cells)、濾泡性輔助T細胞(TFH)、樹突狀細胞(aDC)等的豐度呈正相關(圖4A);miR-4746-5p表達水平與 Th2 細胞浸潤水平呈顯著正相關(r=0.546、P<0.001,圖4B)。Wilcoxon秩和檢驗結果也同樣顯示,miR-4746-5p高表達組中Th2細胞的富集評分較低表達組顯著升高(圖4B)。

圖4 miR-4746-5p表達與HCC免疫浸潤水平的關系

2.6 miR-4746-5p靶基因的表達水平及其預后分析

首先使用GEPIA數據庫來鑒定肝細胞癌樣本和正常樣本之間的差異表達基因(篩選條件:|Log2FC|臨界值=1,P臨界值=0.01),共篩選出了2207個差異表達基因(圖5A)。并對HCC的差異基因和miR-4746-5p的下游靶基因進行綜合分析后,交集出67個差異靶基因,其中22個基因在HCC中下調(圖5B),進一步通過Kaplan-Meier Plotter網站評估這22個下調基因在HCC預后中的作用(以P<0.05作為篩選條件),結果顯示,ASPG、CXCL12、IGF2、c11orf96、SEC31B 5個基因的表達差異有統計學意義(P<0.05,圖5C)。

圖5 miR-4746-5p靶基因表達水平及其預后生存率分析

圖5(續)

3 討論

盡管關于HCC的靶向藥物開發和臨床綜合治療的研究不斷取得新進展,但仍有很大一部分肝癌患者因疾病發展到晚期才得到診斷,導致預后不佳而死亡。因此,迫切需要尋找一個新的生物標志物來幫助患者確診,改善預后[11]。近年來,隨著大數據發展和高通量測序技術的進步,TCGA數據庫收集并公開共享了大量各種癌癥患者的原始數據,供研究人員進行各種生物信息學研究,為腫瘤的診斷和治療提供重要的生物標志物[12]。最近研究[8,13-15]發現miR-4746-5p作為一種新型的促癌因子,在頭頸鱗癌、肝癌、乳腺癌等腫瘤中顯著上調,并且與患者不良預后相關。ZHANG等[13]研究報道miR-4746-5p在頭頸部鱗癌中過表達,并通過EMT相關通路參與HPV16陽性頭頸癌的進展,影響患者預后。KUMARAN等[15]研究發現miR-4746-5p在乳腺癌組織中特異性表達。

本研究基于TCGA數據庫分析發現:miR-4746-5p在肝癌中的表達顯著高于正常肝組織及配對的癌旁組織;并且miR-4746-5p在HCC中的高表達與晚期臨床病理特征(年齡、病理分期、組織學類型、血管侵犯、AFP水平)和短生存期有關;ROC特異性分析也表明miR-4746-5p對HCC具有較高的診斷價值,這些結果都提示miR-4746-5p可能是HCC的潛在分子靶標。為了進一步探究miR-4746-5p的生物學功能及作用機制,本文利用miRDIP數據庫對miR-4746-5p進行了靶基因預測,共獲得821個潛在靶基因,并在此基礎上進行GO功能注釋及KEGG富集分析。結果顯示其靶基因參與的主要生物學過程有:正調節分化相關的細胞形態、小GTP酶結合活性和軸突部的組成;且主要富集于MAPK信號通路、軸突引導信號通路、自噬信號通路等通路來參與肝癌的惡性發展。本研究還利用GEPIA數據庫下載了HCC中2207個顯著差異基因并與下游靶基因交集后得到67個基因,其中22個基因在肝癌中呈低表達,進一步利用Kaplan-Meier Plotter網站分析并篩選出與肝癌患者預后相關的5個基因(ASPG、CXCL12、IGF2、C11orf96、SEC31B)。BELVISO等[16]研究發現ASPG能夠顯著誘導K562細胞的凋亡從而抑制白血病的發展,是一種有前途的抗癌靶標。KHARE等[17]發現CXCL12可與CXCR4參與結直腸癌細胞的增殖、侵襲、血管生成和轉移。本文結果提示miR-4746-5p可能通過調控ASPG/CXCL12/IGF2/C11orf96/SEC31B軸來促進HCC的發生與發展并導致患者不良預后。本研究還發現,miR-4746-5p表達水平與HCC中多種免疫細胞浸潤水平相關:與Th2細胞和aDC的浸潤水平之間存在中到強的正相關;與TFH細胞、輔助型T細胞的浸潤水平呈顯著正相關,但與巨噬細胞、中性粒細胞、CD8+T細胞、NK細胞浸潤水平呈負相關。有研究[18]表明Th1/Th2平衡的異常變化與多種腫瘤患者的不良預后相關,過高水平的Th2細胞是引起肝癌患者復發轉移的重要危險因素[19]。因此miR-4746-5p可能通過改變免疫細胞浸潤水平來促進HCC的惡性發展,提示miR-4746-5p或是HCC的潛在治療靶點。但是,本研究僅進行了生物信息學分析,未進行臨床樣本收集及細胞水平驗證,后續計劃將在肝癌細胞系中進行關于miR-4746-5p生物學功能及機制的研究。

猜你喜歡
通路肝癌數據庫
DJ-1調控Nrf2信號通路在支氣管哮喘中的研究進展
基于改進TF-IDF算法的基因通路富集方法
AngⅡ激活P38MAPK信號通路在大鼠NSAID相關小腸損傷中的機制研究
舒適護理在肝癌介入護理中的應用
數據庫
數據庫
數據庫
數據庫
TACE術聯合手術治療中晚期肝癌患者65例臨床觀察
關聯通路,低成本破解渠道障礙
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合