韓利民,葉 鋼,鄧 川,代 姣,趙海龍
(1.重慶市長壽區人民醫院內分泌內科,重慶 401220;2.重慶市長壽區人民醫院肝膽外科,重慶 401220;3.重慶市長壽區人民醫院神經內科,重慶 401220;4.重慶市長壽區人民醫院藥學部,重慶 401220;5.遵義醫科大學基礎醫學院病理生理學教研室,貴州 遵義 563000)
黑色素瘤是一種死亡率較高的惡性腫瘤,主要由皮膚或其他器官的黑色素細胞產生。據統計,2020 年全球新發黑色素瘤的人數為324 635 例,因黑色素瘤死亡的人數達57 043[1]。目前黑色素瘤的治療主要包括以下4 種:傳統手術切除、放射治療、化學治療及靶向治療等。越來越多的證據表明,靶向藥物或免疫藥物的輔助治療顯著改善了黑色素瘤患者的總體生存率,是治療黑色素瘤的新途徑[2,3]。然而,多項臨床試驗的結果表明,部分黑色素瘤患者,甚至一些基因突變負荷較高或PD-1/PD-L1 表達較高的人群對以上藥物并沒有有效的反應[4]。研究顯示,處于早期階段的黑色素瘤患者5年生存率高達95%,但晚期轉移性黑色素瘤患者5年生存率僅為5%~10%[5,6]。因此,探索更多有助于黑色素瘤診斷和治療的潛在標志物和靶點具有十分重要意義。
E2F3 是E2F 家族中的轉錄因子之一,主要參與細胞周期調控。近年來,多項證據表明,E2F3 在肺癌、胃癌、乳腺癌、肝癌等多種腫瘤中的表達均明顯升高,并能促進腫瘤的發生和發展[7-10]。然而,E2F3 在黑色素瘤中的變異、表達及臨床意義目前并不完全清楚,因此,本文旨在通過多種數據庫廣泛分析E2F3 在黑色素瘤中的診斷價值及臨床意義。
cBioportal 數據庫是分析癌癥基因組學及其可視化的常用數據庫,可以分析單基因或多基因在不同腫瘤中的變異情況。選擇7 項非轉移性黑色素瘤的臨床測序數據(總共1 905 樣本),在Enter Genes欄中輸入E2F3 后進行分析。通過Oncoprint、Cancer Types Summary、Mutations 菜單獲得E2F3基因在黑色素瘤中的總變異率和變異亞型,通過Comparison/Survive 菜單獲得E2F3 變異組和非變異組的總生存時間曲線圖。
Oncomine 數據庫可挖掘靶基因在不同腫瘤類型及其相應正常組織的表達差異分析數據。Cancer type 設定為malenoma,Gene 設定為E2F3,Analysis Type 設定為Cancer VS Normal Analysis,Data Type 設定為mRNA,設定Pvalue<0.05,Fold Change>2,Gene Rank=Top 10%,最后點擊submit 獲得E2F3基因在黑色素瘤和正常皮膚組織中的表達差異。
選取GSE3189、GSE114445、GSE100050 和GSE46517 4 個黑色素瘤相關數據集。分別通過在線GEO2R 分析工具(P<0.05, Log |FC|≥1)獲得所有差異表達基因,并進一步比較E2F3基因在黑色素瘤和正常皮膚中的表達水平。
OSskcm 數據庫是由中國學者開發專用于黑色素瘤的生存分析數據庫,其數據包括TCGA 和部分GEO 數據集。Gene symbol 輸入E2F3,Data Source選擇TCGA,Split patients by 選擇Upper 50%,Survival 分別選擇OS 和 PFI,最后點擊Kaplan-Meier獲得KM 生存曲線圖,比較E2F3高表達組和低表達組的總生存時間和無進展間隔期時間。
TISIDB 數據庫是基于TCGA 數據分析腫瘤與免疫系統相互作用的綜合數據庫,可分析不同腫瘤中目的基因與免疫治療、淋巴細胞、免疫調節劑、趨化因子、免疫細胞亞型等之間的關系。在Gene Symbol 中輸入E2F3 進行,通過Lymphocyte、Chemokines 和Subtype 菜單獲取黑色素瘤中E2F3基因的表達、甲基化和CNA 水平與各種腫瘤浸潤性淋巴細胞和趨化因子的相關性,以及E2F3表達水平與黑色素瘤不同免疫亞型的相關性。
LinkedOmics 數據庫是一個包含32 種癌癥類型的多組學在線分析數據庫,可進行單基因關聯分析和功能富集分析。選擇TCGA_SKCM 數據集中RNAseq 為數據,以E2F3為目的基因,采用Spearman 法進行分析,最后獲得黑色素瘤中與E2F3基因共表達的相關差異基因及其富集的生物學功能。
CMap 數據庫是一個篩選小分子化合物的化學基因組學數據庫。點擊Query 工具,Query parameters 選擇Gene expression (L1000),以P<0.05,|cor|≥0.5 為切點,將與E2F3表達水平呈正相關基因(61 個)和負相關的基因(35 個)分別輸入“UP-regulated genes”和“DOWN-regulated genes”框后進行分析,最終得出潛在的前五位小分子化合物。
cBioportal 數據庫分析結果顯示E2F3基因在黑色素瘤中仍存在低度變異。在1 905 例黑色素瘤人群中,約4%患者E2F3基因存在CNA 變化或突變,其類型主要包括基因擴增(40 樣本)和缺失(25樣本),見圖1。通過對突變位點分析發現,E2F3在黑色素瘤的突變位點共有21 個,包括E20K、G77S、P89S、R134Q、E140D 等位點,具體位置及編碼蛋白見圖2。
圖1 E2F3 基因在黑色素瘤中變異分析Fig 1 Variation analysis of E2F3 gene in melanoma
圖2 E2F3 基因在黑色素瘤中變異位點Fig 2 The gene mutation sites of E2F3 in melanoma
Oncomine 數據庫結果顯示E2F3基因在多種腫瘤中表達均高于正常組織,其中有2 項研究顯示E2F3在黑色素瘤中表達也明顯升高,見圖3。結果表明,與正常皮膚組織相比,黑色素瘤中E2F3基因表達水平明顯升高(t=5.06 or 9.61,P<0.01),Fold change 值分別為3.146 和3.687,見圖3。通過GSE3189、GSE114445、GSE100050 和GSE465174個黑色素瘤相關GEO 數據集進行進一步分析,結果顯示E2F3基因在黑色素瘤中表達水平均明顯高于正常皮膚組織(P<0.01),具體結果見表1。
表1 E2F3 基因在黑色素瘤和正常皮膚組織的表達(GEO 數據庫)Tab 1 Expression of E2F3 gene in melanoma and normal skin tissues(based on GEO database)
圖3 E2F3 基因在黑色素瘤和正常皮膚組織中的表達(Oncomine 數據庫)Fig 3 Expression of E2F3 gene in melanoma and normal skin tissues (based on Oncomine database)
cBioportal 數據庫結果表明,與非變異組相比,E2F3變異組的黑色素瘤患者總生存期(Overall Survival, OS)明顯縮短(P<0.01),見圖4。OSskcm 數據庫生存分析結果也顯示,黑色素瘤中E2F3基因高表達組患者的OS 和無進展間隔期(Progression Free Interval, PFI)均顯著低于E2F3基因低表達組(P<0.05),見圖4。以上結果均提示E2F3基因變異或表達增高的黑色素瘤患者預后更差。
圖4 E2F3 基因變異和表達水平與黑色素瘤的KM 曲線圖Fig 4 KM curves of E2F3 gene mutation and expression level with melanoma
TISIDB 數據庫結果顯示,E2F3的CNA、甲基化和表達均與黑色素瘤中多種免疫浸潤細胞和趨化因子均顯著相關(Sperman 法),見圖5。E2F3的CNA 水平與pDC(rho:-0.374,P<0.01)、Neutrophil(rho:-0.361,P<0.01)、Th17(rho:-0.337,P<0.01)等淋巴細胞的表達水平呈負相關,與CXCL5(rho:-0.293,P<0.01)、CCL13(rho:-0.265,P<0.01)、CCR1(rho:-0.286,P<0.01)等趨化因子的表達水平呈負相關,見圖5。E2F3的甲基化水平與Th1(rho: 0.302,P<0.01)、Neutrophil(rho:0.294,P<0.01)、Act DC(rho: 0.273,P<0.01)等淋巴細胞的表達水平呈正相關,與CXCL16(rho:- 0.248,P<0.01)、CXCL12(rho:- 0.21,P<0.01)、CCR1(rho:-0.24,P<0.01)等趨化因子的表達水平呈正相關,見圖5。E2F3的表達水平與Th17(rho:- 0.375,P<0.01)、Tcm CD4(rho:-0.369,P<0.01)、Th1(rho:-0.36,P<0.01)、等淋巴細胞的表達水平呈負相關,與CXCL 16(rho:- 0.462,P<0.01)、CCL 22(rho:- 0.296,P<0.01)、CCL 2(rho:-0.288,P<0.01)等趨化因子的表達水平呈負相關,見圖5。
圖5 E2F3 基因突變和表達與黑色素瘤中免疫浸潤細胞和趨化因子的相關性熱圖Fig 5 Correlation heat map of E2F3 gene mutation and expression with immune infiltrating cells and chemokines in melanoma
通過對黑色素瘤的免疫亞型和分子亞型進行進一步分析,結果顯示E2F3表達水平在不同免疫亞型和分子亞型中也具有差異(P<0.05),見圖6。E2F3分別在wound healing 組和RAS_Hotspot 突變組表達最高,而在TGF-b dominant 和BRAF_Hotspot 突變組表達最低,見圖6。
圖6 E2F3 基因在黑色素瘤不同亞型的表達Fig 6 Expression of E2F3 gene in different subtypes of melanoma
LinkedOmics 數據庫結果顯示,以FDR<0.05為條件,黑色素瘤中與E2F3表達相關的差異基因共5 369 個,其中2 856 個基因與E2F3呈正相關,2 513 個基因與E2F3呈負相關,這表明盡管相關基因表達的方向不一致,但這些基因和E2F3共同促進了黑色素瘤的發生和發展,其機制可能與細胞凋亡、細胞增值、細胞周期等生物進程改變有關。BLM、GLO1、HCG18等基因與E2F3基因表達呈顯著正相關,而IFITM3、IGFBP6、KCTD11等基因與E2F3基因表達呈顯著負相關,TOP50的相關基因熱圖見圖7。
圖7 黑色素瘤中與E2F3 基因表達相關前50 個基因的熱圖Fig 7 Heat map of the first 50 genes related to E2F3 gene expression in melanoma
采用GSEA 方法進行GO 和KEGG 生物學功能分析。結果顯示BP 主要集中在核糖核蛋白復合物的生物生成(Ribonucleoprotein complex biogenesis)、DNA 重組(DNA recombination)、RNA 3'-端加工(RNA 3'-end processing)等生物學進程,CC 主要集中在染色體區(chromosomal region)、三級顆粒(tertiary granule)、PcG 蛋白復合物(PcG protein complex)等細胞組分,MF 主要集中在螺旋酶活性(helicase activity)、DNA 二級結構結合(DNA secondary structure binding)、組蛋白結合(histone binding)等分子功能,見表2,圖8。KEGG 結果顯示主要富集在RNA 轉運、真核生物的核糖體生物生成、細胞周期等通路有關,見圖9。
表2 E2F3 相關基因的GO 生物學分析結果Tab 2 GO biological analysis results of E2F3 related genes
圖8 E2F3 相關差異基因的GO 分析結果Fig 8 GO analysis results of E2F3 related differential genes
圖9 E2F3 相關差異基因的KEGG 分析結果Fig 9 KEGG analysis results of E2F3 related differential genes
以P<0.05,|cor|≥0.45 為條件篩選出與E2F3相關的770 個基因,采用STRING(https://cn.string-db.org/)進行在線PPI 網絡繪圖,結果見圖10,并將結果導入Cytoscpae 3.8.0 中,使用MCODE 和cyto-Hubba 模塊進行進一步分析。MCODE 分析結果總共得出9 個模塊,其中評分最高的模塊如下,score=8.667,見圖11。cytoHubba(MCC 計算法)總共得到10 個hub 基因,分別為WDR12、WDR43、RBM28、UTP18、DKC1、PAK1IP1、DDX31、TEX10、TRUB1、TRMT61B,見圖11。
圖10 E2F3 相關基因的PPT 網絡富集圖Fig 10 PPT network enrichment map of E2F3 related genes
圖11 E2F3 相關基因的MCODE (Top1)和hub 基因(Top10)分析結果Fig 11 MCODE ( Top1 ) and hub genes ( Top10 ) analysis results of E2F3 related genes
采用GEPIA 在線數據庫(http://gepia.cancerpku.cn/detail.php)鑒定以上基因在黑色素瘤中的表達,結果發現WDR12、PAK1IP1在黑色素瘤中的表達水平明顯高于正常組織(P<0.01),見圖12。PAK1IP1與黑色素瘤的分期有關(F=2.58,P<0.05),見圖13。以上結果表明WDR12、PAK1IP1在黑色素瘤中具有潛在的診斷價值。
圖12 WDR12、PAK1IP1 在黑色素瘤與正常組織中的表達水平Fig 12 Expression levels of WDR12 and PAK1IP1 in melanoma and normal tissues
圖13 PAK1IP1 與黑色素瘤臨床分期Fig 13 PAK1IP1 and clinical stage of melanoma
通過CMap 數據庫共篩選出2 837 種相關小分子化合物,分數最低的前5 種依次為YC-1(Score=-99.37)、辛伐他?。╯imvastatin,Score=-99.19)、細胞松弛素-d(cytochalasin-d,Score=-99.01)、Deforolimus(Score=-98.94)和細胞松弛素-b(cytochalasin-b,Score=-98.34),見圖14。
圖14 治療黑色素瘤的小分子化合物分數熱圖 (前5 種)Fig 14 Fractional heat maps of the small molecule compounds for melanoma treatment (Top 5)
E2F3是E2F 家族中一個關鍵的轉錄因子,已被證實其在多種腫瘤中表達均增高,并且與腫瘤預后息息相關。E2F3主要參與細胞周期進程、DNA復制、DNA 修復和細胞凋亡等生物學過程,能與組蛋白乙酰轉移酶相互作用,促進細胞周期從G1期進入S 期。具體來說,E2F3分為E2F3a和E2F3b兩種異構體,兩者均有助于E2F3靶基因轉錄的激活。然而,E2F3a屬于基因轉錄的激活劑,而E2F3b卻屬于基因轉錄的典型的阻遏子。因此,在不同研究中,E2F3可能在調節細胞增殖等生物學功能方面表現出不同的作用。目前,E2F3在黑色素瘤的變異、表達和臨床意義并不完全清楚。
通過多種數據庫分析,本研究發現E2F3基因在黑色素瘤中存在低度變異,其表達水平明顯高于正常皮膚組(P<0.01)。具體來看,E2F3基因在黑色素瘤中的變異率為約4%,主要以CNA 變化或突變為主,其突變位點有21 個。E2F3基因在黑色素瘤中表達水平大約是正常皮膚組織的2~3 倍不等,這表明E2F3的表達水平能協助黑色素瘤的早期診斷。在E2F3與黑色素瘤的預后分析中,結果發現E2F3變異組黑色素瘤患者的OS 明顯低于非E2F3變異組(P<0.01),E2F3表達水平升高與黑色素瘤患者的OS 和PFI 縮短有關(P<0.05)。上述結果提示E2F3基因的突變和表達水平可能是預測黑色素瘤患者預后的指標之一。但在多因素回歸分析中,并未能得出E2F3是黑色素瘤的獨立預測指標。
基于腫瘤微環境中免疫浸潤細胞也是腫瘤發生和發展的另一個關鍵驅動因素,本研究進一步分析了E2F3的變異和表達與黑色素瘤中免疫浸潤細胞或趨化因子的相關性。結果發現E2F3的CNA、甲基化和表達均與黑色素瘤中多種免疫浸潤細胞和趨化因子有關(P<0.05)。E2F3的CNA 和表達水平與中性粒細胞、DC、T 細胞亞群和多種趨化因子的表達水平均呈負相關,這表明E2F3變異和表達水平升高能影響腫瘤微環境中免疫浸潤細胞的亞群,進而促進腫瘤的發生,但具體機制尚不清楚。
在上述基礎上,本研究還探究E2F2促進黑色素瘤發生和發展的潛在機制。通過相關數據庫分析,發現黑色素瘤中與E2F3表達相關的差異基因共7 702 個(P<0.05),其中3 956 個基因與E2F3呈正相關,3 746 個基因與E2F3呈負相關。通過KEGG 富集分析,結果發現上述基因主要富集在RNA 轉運、真核生物的核糖體生物生成(Ribosome biogenesis in eukaryotes)等通路有關,這表明E2F3可能通過以上通路參與黑色素瘤的發生和發展。通過對差異基因進行MCODE 和cytoHubba 分析,總共得到10 個hub 基因,其中WDR12、PAK1IP1在黑色素瘤中的表達水平明顯高于正常組織(P<0.01),PAK1IP1與黑色素瘤的分期有關(P<0.05)。以上結果暗示WDR12、PAK1IP1在黑色素瘤中具有潛在的價值。通過GeneCards 網站查詢發現WDR12和PAK1IP1都是核糖體蛋白,主要在細胞核內表達,參與細胞周期、信號轉導等細胞進程。在既往研究中,WDR12已被證實在膠質母細胞瘤和肝細胞癌中表達明顯升高,并且與患者預后呈負相關。體外實驗結果表明敲除WDR12或干擾WDR12表達下能抑制腫瘤細胞的增殖和侵襲,機制與抑制細胞周期和Akt-mTOR-S6K1 信號通路有關[11,12]。而PAK1IP1在HEK293T、A549、H1299 等腫瘤細胞系中均表現出抑制作用,過表達PAK1IP1能誘導p53 途徑阻滯細胞周期抑制細胞增殖[13]。但目前兩者與黑色素瘤并沒有相關研究,其與黑色素瘤關系尚不清楚。
最后本研究通過CMap 數據庫對黑色素瘤治療潛在藥物進行探索,結果發現YC-1、辛伐他汀、細胞松弛素-d、Deforolimus 和細胞松弛素-b 可能是治療黑色素瘤的前5 種的小分子化合物。其中,辛伐他汀、細胞松弛素-d 和細胞松弛素-b 已經在A375 黑色素瘤細胞系中得到驗證,而YC-1 和Deforolimus 與黑色素瘤尚無相關研究。YC-1 是鳥苷酸環化酶激活劑,也是缺氧誘導因子抑制劑,其靶點主要為HIF1A、GUCY1A2 等蛋白,能有效抑制HIF1α 的表達[14]。體外研究發現YC-1 能抑制肝細胞癌和乳腺癌細胞的增殖[15-17]。Deforolimus(MK-8669)是一種選擇性的mTOR 抑制劑,多項臨床試驗結果顯示其單用或聯合應用對肉瘤、惡性血液病以及其他實體腫瘤均良好的抗癌作用[18,19]。以上結果表明YC-1、辛伐他汀、細胞松弛素-d、deforolimus 和細胞松弛素-b 在黑色素瘤的治療中具有潛在的應用前景。
綜上所述,本研究通過多種數據庫從多維度分析E2F3在黑色素瘤中的作用和價值,最終發現E2F3基因的突變和表達水平升高與黑色素瘤的不良預后相關,并通過影響不同腫瘤免疫浸潤細胞亞型參與黑色素瘤的發生和發展,其可能是黑色素瘤的潛在診斷標志物和治療靶點。
作者貢獻度說明:
韓利民:負責文稿的設計和撰寫;葉鋼、鄧川、代姣:負責文章相關數據庫分析;趙海龍:負責文稿的修改和審校。
所有作者聲明不存在利益沖突關系。