?

基于生物學信息技術分析GAS2L3在膠質瘤中的表達及意義

2022-05-11 06:45石爽鐘佳成劉備張彪楊彪牛文勇李柏成覃川鐘東張正保
臨床神經外科雜志 2022年2期
關鍵詞:差異基因細胞周期膠質瘤

石爽,鐘佳成,劉備,張彪,楊彪,牛文勇,李柏成,覃川,鐘東,張正保

腦膠質瘤是中樞神經系統最常見的原發性顱內腫瘤,盡管目前膠質瘤的多模態治療取得一定的進展,但膠質瘤患者的治療仍不理想,對于膠質母細胞瘤患者,其中位生存期仍低于2年[1]。GAS2L3是最近發現的微管蛋白和肌動蛋白結合蛋白,可調節胞質分裂和脫落,在細胞的有絲分裂和胞質分裂中發揮關鍵作用[2]。但是GAS2L3在膠質瘤上的表達及功能,以及是否與膠質瘤的病理分級及患者預后相關尚未研究。本研究擬利用基因表達譜交互分析(Gene Expression Profiling Interactive Analysis,GEPIA)網站評估GAS2L3在正常腦組織和膠質瘤中的表達差異,通過R語言分析腫瘤基因圖譜(The Cancer Genome Atlas,TCGA)數據庫中GAS2L3與膠質瘤的等級與預后的相關性,通過差異分析尋找GAS2L3在膠質瘤中的潛在功能,以期為膠質瘤提供新的治療靶點和研究思路。

1 資料與方法

1.1 數據獲取與處理 從美國TCGA(https://portal.gdc.cancer.gov)數據庫中下載膠質瘤組織轉錄組測序(RNA-seq)數據。按照項目為TCGA-Repository-Brain、疾病類型為低級別膠質瘤(low grade glioma,LGG)和多形性膠質母細胞瘤(glioblastoma multiforme,GBM)、實驗策略為RNA-seq、工作流程的類型為HTseq-Counts進行篩選,共獲得702例膠質瘤組織樣本及其臨床信息。利用R語言(版本號R version 4.0.4)將counts數據與人類基因組注釋文件GTF進行合并處理,生成行為基因、列為樣本的基因表達矩陣。根據樣TCGA的編碼去除6例重復的膠質瘤組織樣本,最終得到696個GBM和LGG組織樣本。

1.2 GAS2L3的表達情況及與膠質瘤等級和預后的關系 在GEPIA(http://gepia.cancer-pku.cn/detail.php gene)網頁中,點擊進入Expression DIY 界面,以GAS2L3為目的基因,分別選取GBM和LGG,以TCGA normal和GTEx data中的正常腦組織為配對,分別在GBM和LGG與Normal組織中對GAS2L3基因進行表達水平的驗證。下載TCGA中膠質瘤RNA-seq和臨床信息,合并后分析GAS2L3表達量與膠質瘤等級的相關性,以GAS2L3表達量的中位數為Cut-off值,繪制Kaplan-Meier生存曲線。

1.3 GAS2L3的風險比 患者信息均來自TCGA數據庫,總共703例膠質瘤病例,去掉6例復發行二次測序后重復數據,696例符合分析標準;其中男351例,女253例(男女比例約為1.38∶1);IDH1突變者423例,野生型253例;1p/19q非聯合缺失490例,聯合缺失168例?;颊叩哪挲g,性別,等級,IDH1突變,1p/19q以及GAS2L3均進行了單因素或多因素的COX回歸分析。

1.4 GAS2L3與膠質瘤增殖、侵襲、凋亡和血管形成的關系 TCGA中膠質瘤數據下載后,在R語言(版本號R version 4.0.4)環境下,使用limma包進行數據歸一化和標準化,考慮到腫瘤基因的非正態分布,采用Spearman計算GAS2L3與人類增殖細胞核抗原(proliferating cell nuclear antigen,PCNA),MKI67,MMP-9,MMP-3,CASP3,CASP8,CD34和PECAM1的相關系數,并繪制散點圖。

1.5 差異表達基因的篩選 在R語言(版本號R version 4.0.4)環境下,使用limma包進行數據歸一化和標準化[3],排除基因長度、測序深度和文庫不同的影響,并進行差異表達基因的篩選,篩選條件為基因表達差異倍數的絕對值(logFC>1且P<0.05)的標準,得到最終有統計學意義的差異基因,并通過熱圖聚類分析差異基因的分布情況,火山圖展示差異基因的差異情況。

1.6 數據庫分析 使用DAVID(https://david.ncifcrf.gov/)數據庫進一步將差異基因分析得到的數據集(logFC>1且P<0.05)塊進行基因本體(Gene Ontology,GO)功能富集,以明確該模塊中的基因所涉及的生物學過程(biological process,BP)、分子功能(molecular function,MF)及細胞定位(cellular components,CC)。同時進行京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路分析,以便于明確這些基因參與到哪些代謝途徑及信號通路,基因集富集分析(Gene Set Enrichment Analysis,GSEA)分析GAS2L3對相關細胞信號通路抑制和激活。

1.7 統計學方法 統計學分析采用R統計學軟件(版本號R version 4.0.4)。腫瘤組織和正常腦組織GAS2L3表達的比較采用one-way ANOVAG方法;Wilcoxon秩和檢驗驗證GAS2L3與膠質瘤等級的相關性;log-rank檢驗GAS2L3與膠質瘤患者預后的關系;GAS2L3的風險比采用單因素或多因素的COX回歸分析,相關性分析采用Spearman相關系數;GAS2L3高表達與低表達組織的差異分析基于負二項分布的統計方法。檢驗水準α=0.05(雙尾)。

2 結 果

2.1 GAS2L3在不同組織的表達差異 GEPIA 數據庫分析結果顯示,與正常腦組織相比,GBM組織中GAS2L3 mRNA 表達水平明顯升高(P<0.05),見圖 1A,但是LGG組織中GAS2L3 mRNA 表達水平與正常腦組織有差異,但無明顯統計學意義,見圖1B。

圖1 GAS2L3在不同組織的表達情況

2.2 GAS2L3與膠質瘤的等級及預后的相關性 在TCGA膠質瘤數據庫中,通過Wilcoxon秩和檢驗發現GAS2L3 mRNA水平隨著膠質瘤的等級表達增高而增高(P<0.05),見圖2A;以GAS2L3表達量的中位數為Cut-off值,繪制Kaplan-Meier生存曲線,log-rank檢驗發現GAS2L3高表達與膠質瘤的預后不良明顯相關,見圖 2B。

2.3 GAS2L3是膠質瘤的不良預后因素 單因素和多因素的方差分析顯示年齡、腫瘤等級、IDH1野生型、及GAS2L3均為患者的不良預后顯著相關,其中1p/19q非聯合缺失單因素分析其與患者的不良預后顯著相關,多因素分析顯示其為患者不良預后因子,但P值處于臨界值。單因素分析顯示中 GAS2L3的風險度為HR=2(95%CI=1.8-2.2),在多因素回歸分析中,GAS2L3的風險比率(hazard ratio,HR)=1.2(95%CI=1.01~1.4),說明GAS2L3的表達量越高,患者的預后越差。這些結果表明GAS2L3的表達水平能夠作為膠質瘤的不良預后因素。見表1。

表1 GAS2L3的表達水平與患者預后的單因素和多因素分析結果

2.4 GAS2L3與膠質瘤和血管形成的相關性 Spearman秩相關顯示,GAS2L3在膠質瘤中與PCNA和MKI67明顯相關,相關系數分別為0.78和0.74;與MMP-9的相關系數為0.68,但與MMP-3的相關系數為0.21;同時本研究還檢測其與膠質瘤凋亡和血管形成的相關系數,與CASP3和CASP8的相關系數為0.68和0.57,與CD34和PECAM1的相關系數分別為0.3和0.53。見圖 3。

圖3 GAS2L3與不同因素相關性散點圖

2.5 GAS2L3不同樣本的差異基因分析 根據TCGA數據庫獲得的696個臨床樣本, 以GAS2L3的表達情況由低到高進行排序,將GAS2L3高表達的膠質瘤樣本與GAS2L3低表達膠質瘤樣本進行差異分析,篩選條件為基因表達差異倍數的絕對值(logFC>1且P<0.05)的標準,共獲取2 887個差異表達基因,火山圖顯示全差異變化情況(圖4A),聚類熱圖顯示2 887個差異分布情況(圖4B)。

A:火山圖展示差異基因表達情況; B:聚類熱圖顯示差異基因的分布情況(logFC>1且P<0.05)

2.6 富集分析 將獲取的2 887個基因通過R4.0.0進行基因ID轉換,通過clusterProfiler、org.Hs.eg.db、enrichplot數據包,對交集基因做GO與KEGG富集分析。GO富集分析顯示GAS2L3在膠質瘤中與細胞膜的膜電位,離子通道和胞質轉運有關(圖5A);KEGG富集分析顯示與細胞的黏附分子,鈣信號內流和蛋白質的溶解和吸收相關(圖5B)。此外GO與KEGG還顯示GAS2L3與細胞周期相關,圖5根據P值從低到高顯示,細胞周期未顯示;GSEA對細胞信號通路分析顯示,GAS2L3激活細胞周期通路(圖6、圖7)。

圖5 差異基因的GO富集和KEGG分析

圖6 GAS2L3差異基因富集的信號通路GSEA分析

圖7 GSEA分析顯示GAS2L3對CELL CYCLE信號通路的激活

3 討 論

本研究通過GEPIA網站分析TCGA和GTEx數據庫中,GAS2L3正常腦組織和腫瘤組織中的表達情況,發現GAS2L3高表達于GBM中。在對TCGA數據庫膠質瘤及其臨床信息數據進行分析后發現,GAS2L3隨著膠質瘤的等級增加表達增強,并且通過生存曲線發現GAS2L3高表達與膠質瘤的預后呈負相關。為了進一步明確GAS2L3在膠質瘤細胞中的生物學功能,本研究通過Spearman秩相關計算了GAS2L3與膠質瘤的增殖和侵襲的指標的相關性,發現GAS2L3與膠質瘤的增殖相關。同時本研究分析了GAS2L3高表達的膠質瘤組織和GAS2L3低表達的膠質瘤組織基因的差異性,選取差異倍數為1倍,具有統計學意義的2 887個基因,分析了這些差異基因在膠質瘤細胞中的潛在功能,發現GAS2L3可能通過對細胞周期蛋白信號通路的激活,促進膠質瘤細胞的增殖。

微管(microtubule,MT)和肌動蛋白細胞骨架是細胞完整性的基礎,因為它們控制著許多細胞活動,包括細胞分裂、生長、極化和遷移,介導MT和肌動蛋白細胞骨架之間的相互作用的蛋白質是許多細胞過程的關鍵,并起著重要的生理作用[4]。GAS2蛋白家族就是連接MT和肌動蛋白骨架的一類蛋白,推測其至少由肌動蛋白結合[actin-binding(CH) domain]結構域和微管結合[microtubule-binding(GAR) domain]結構域組成。盡管GAS2被定義為生長停滯特異性蛋白家族,但迄今為止尚未系統地研究過不同GAS2家族成員在不同疾病中表達模式,相互作用以及生物學功能[5]。GAS2家族包含有GAS2,GAS2L1,GAS2L2和GAS2L3四個成員[5], GAS2蛋白在肝癌[6]、白血病[7]、復發性結腸癌[8]、前列腺癌[9]、乳腺癌[10]和肺腺癌[11]中得到了廣泛得研究,但GAS2L1,GAS2L2和GAS2L3的研究較少,最近的研究顯示GAS2L3是DREAM復合物的靶基因,而DREAM復合物是細胞周期調控的基因轉錄關鍵調節因子,可驅動有絲分裂和胞質分裂所需的許多基因產物的表達[12-13],因此GAS2L3可能參與細胞骨架重組,細胞周期,細胞凋亡和癌癥發展。

為了進一步明確GAS2L3在膠質瘤中的表達模式和生物學功能,本研究基于生物學信息技術進行相關研究。本研究發現GAS2L3高表達于GBM中,但在低級別的膠質瘤細胞和正常的腦組織低表達,并且低級別的膠質瘤細胞和正常腦組織的表達水平無明顯統計學差異,其可能與GBM的惡性生物學行為相關。Ki-67是一種存在于增殖細胞中的核抗原,其表達與細胞周期密切相關,其在細胞周期G0期無表達,但在G1、S、G2、M期均有表達,是反映細胞生長活躍程度的標志,即 Ki-67表達越高,腫瘤細胞生長越活躍,惡性程度越高,它是目前應用最廣泛,也是檢測腫瘤細胞增殖活性最可靠的指標之一。PCNA位于第20號染色體,它是DNA復制和DNA修復所必需的酸性非組胺核輔助蛋白,其分子量為36KD,僅在增殖細胞中合成與表達;目前研究顯示,PCNA的表達水平直接與膠質瘤惡性度相關[14-15]。腫瘤的侵襲涉及多個步驟:(1)腫瘤細胞通過細胞膜表面受體粘附到細胞外基質(extracellular matrix,ECM)層粘蛋白上;(2)活化并釋放的蛋白水解酶前體對ECM的水解;(3)腫瘤細胞通過基底膜遷移,其中ECM的降解是判斷腫瘤具有侵襲性的重要標志之一。目前的研究顯示,MMP-9和MMP-3與膠質瘤的侵襲和遷移密切相關[16-17];在凋亡過程中,caspase幾乎是所有細胞凋亡晚期的最后共同途徑。caspase是一類進化上保守的半胱氨酸蛋白酶家族,激活的 caspase能水解包括細胞生命活動各環節中的蛋白,使細胞皺縮、斷裂、染色質聚集、DNA降解凋亡,其中 caspase-8和caspase-3是兩種執行凋亡調控功能的核心蛋白酶,是細胞凋亡內源性和外源性途徑的必須 caspase分子,目前研究表明caspase-8和caspase-3能夠反映膠質瘤細胞的凋亡,能抑制膠質瘤的生長[18]。CD34和CD31 在新生血管及非新生血管,包括大血管的內皮細胞上,均呈陽性表達,可作為內皮細胞的特異標記物;有研究顯示其表達明顯高于正常腦組織,且隨腫瘤級別增高呈增高趨勢,可用于標記腦膠質瘤標本微血管密度(microvessel density,MVD)[19-20]。本研究分析顯示,GAS2L3與Ki-67和PCNA明顯正相關,與膠質瘤的侵襲、凋亡和腫瘤的微血管形成具有一定的相關性。此外,雖然GAS2L3在GBM特異性表達,但是目前的測序顯示其表達豐度較低,雖然通過臨床數據分析,其與膠質瘤的等級成正相關,與膠質瘤的預后呈負相關,但是其在膠質瘤的生物學功能有待進一步的實驗證實。與此同時,在對GAS2L3高表達和低表達的膠質瘤組織的差異基因分析中,本研究通過GO和KEGG的富集分析發現,GAS2L3相關的基因主要參與膠質瘤細胞膜的膜電位,與離子通道和胞質轉運有關,但仍影響膠質瘤的細胞增殖的細胞周期過程,GAS2L3表達增加激活細胞周期相關的信號通路,其具體的信號通路也需要實驗的進一步證實。

綜上所述, GAS2L3高表達于膠質母細胞瘤中,且其表達強度可能與膠質瘤的等級相關。 GAS2L3可能膠質瘤的增殖密切相關, 與膠質瘤的侵襲、凋亡和腫瘤的微血管形成具有一定的相關性,其可能參與瘤細胞細胞周期信號通路的激活,有望成為膠質瘤生物治療的新靶點。本實驗為尋找膠質瘤的特異靶點提供了基礎,但缺乏進一步細胞內和動物體內的實驗支持,下一步將進行深入的研究。

利益沖突:所有作者均聲明不存在利益沖突。

猜你喜歡
差異基因細胞周期膠質瘤
長鏈非編碼RNA在膠質瘤中的研究進展
成人高級別腦膠質瘤術后復發相關因素分析
植物細胞周期如何“剎車”?
復發膠質瘤組織中miRNA-200c的表達 及作用機制研究
IgG、Integrinβ6、P16在人腦膠質瘤中的表達及其臨床意義
基于高通量測序的藥用植物“鳳丹”根皮的轉錄組分析
基于高通量測序的藥用植物“鳳丹”根皮的轉錄組分析
紫檀芪處理對釀酒酵母基因組表達變化的影響
高危型人乳頭瘤病毒單一類型感染和多重感染對宮頸癌中細胞周期蛋白、抗凋亡蛋白表達量的影響
“細胞增殖(第二課時)”說課稿
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合