?

應用生物信息學探索神經母細胞瘤轉移的關鍵基因

2023-10-13 11:09張守華孟肖振鄒海波李科浩李匡凡
實用臨床醫學 2023年4期
關鍵詞:差異基因關鍵通路

張守華,孟肖振,鄒海波,馮 丹,李科浩,李匡凡,占 敏,徐 晗

(1.江西省兒童醫院普通外科; 2.南昌大學醫學部,南昌 330006)

神經母細胞瘤(neuroblastoma,NB)起源于腎上腺髓質及交感神經節的原始神經嵴細胞,是兒童顱外最常見的惡性實體腫瘤,也是嬰幼兒期最常見的惡性腫瘤[1-2],約占兒童腫瘤的7%~10%。NB的總體患病率大約是1/7000活產兒,男性發病率稍高,因NB死亡的患兒占兒童癌癥相關死亡總數的15%。NB具有很高的轉移潛力,多數患者在診斷時就已經發生遠處轉移,因而預后較差[3-4]。因此,闡明NB轉移的機制,鑒定新的預后生物標志物和治療靶點對NB的臨床治療有重要意義。近年來生物信息學技術不斷發展,其在疾病診斷、預后預測和藥物篩選等方面發揮了越來越重要的作用。依靠生物信息學技術,研究者能夠了解NB細胞周期相關基因及其表達情況。腫瘤轉移過程中參與調控的基因眾多,并且調控基因之間相互作用,相互影響。生物信息學從宏觀上分析大數據,可在多基因水平研究腫瘤,從而有可能更好地闡釋癌癥的發病機制。本研究應用生物信息學分析方法,篩選與NB轉移相關的差異性表達基因,分析這些基因在NB中的表達模式和可能發揮的作用,以期為進一步闡明NB轉移機制提供理論依據。

1 資料與方法

1.1 數據來源

NB基因表達數據集GSE112447(內含20個NB轉移腫瘤組織樣本、37個NB原發腫瘤組織樣本)來自NCBI的Gene Expression Omnibus數據庫(GEO,http://www.ncbi.nlm.nih.gov/geo/)[5]。該數據集的基因測序平臺為Agilent-014850 Whole Human Genome Microarray 4x44KG4112F(GPL6480平臺)。

1.2 基因篩選

利用在線分析工具GEO2R(https://www.ncbi.nlm.nih.gov/geo/geo2r)[6]對數據進行基因表達差異分析,篩選標準:P<0.05,|logFC|>2(FC=變異倍數)。將logFC>2的基因為上調的差異表達基因(up-regulated differentially expressed genes,UDEGs),logFC<-2的基因作為下調的差異表達基因(down-regulated differentially expressed genes,DDEGs)。

1.3 GO和KEGG富集分析

利用具備注釋和可視化功能的DAVID數據庫(http://david.abcc.ncifcrf.gov/)[7]進行GO富集分析和KEGG通路分析[8-9],GO富集分析內容主要有生物學過程(biological process,BP)、細胞組成(cell composition,CC)和分子功能(molecular function,MF)。以FDR<0.05為集合有意義。

1.4 蛋白質相互作用網絡的建立及篩選關鍵基因

將篩選出的差異表達基因導入到STRING數據庫(https://string-db.org/)中分析蛋白間相互作用(protein-protein interaction,PPI)[10],將“minimum required interaction score”設定為“high confidence(0.7)”進行PPI網絡構建。之后,利用Cytoscape軟件對PPI網絡進行可視化整合[11]。分別使用Cytoscape的插件“CytoHubba”中的MCC,DMNC和Stress算法篩選出PPI網絡中排名前15的關鍵基因[12],3種算法得到的前15個基因取交集后得到的共同基因被認為是關鍵基因。

1.5 生存分析

使用UCSC Xena(https://xena.ucsc.edu/)數據庫[13-14]對篩選出的候選關鍵基因進行總體生存分析[15],以P<0.05為差異有統計學意義。

1.6 單基因差異分析

以關鍵基因的相對表達中位值為界,將數據集中的病例樣本分為高、低表達組,篩選2組之間的差異表達基因,認定為CCNB1的衍生基因。同時使用DAVID數據庫對篩選出的差異表達基因進行KEGG通路富集分析,分析關鍵基因及其衍生基因可能參與信號通路。

2 結果

2.1 差異表達基因的篩選

利用GEO2R共篩選出NB轉移和原發腫瘤組織間435個差異表達基因,其中表達上調基因296個,表達下調基因139個,差異表達基因的火山圖見圖1,進一步篩選出表達水平變化幅度排名前50的差異表達基因,差異表達基因的聚類熱圖見圖2。

log3(FoldChange)圖1 差異表達基因火山圖

圖2 差異基因熱圖

2.2 差異基因的功能富集分析

DAVID數據庫GO分析結果顯示:與差異基因相關的生物學過程主要富集在炎癥反應、細胞黏附和補體激活中;差異基因主要分布于細胞外基質和細胞外泌體,與蛋白結合、絲氨酸型內肽酶活性和受體結合功能有關(表1)。KEGG通路富集分析結果顯示,與差異基因有關的主要細胞通路為補體激活通路、PI3K-Akt信號通路和惡性腫瘤轉錄失調信號通路(表2)。GO及KEGG通路富集分析的可視化結果見圖3。

表1 差異表達基因GO分析

表2 差異表達基因KEGG富集分析

圖3 差異基因GO和KEGG富集分析可視化

2.3 差異基因的PPI網絡和關鍵基因篩選

差異基因的PPI網絡見圖4。

圖4 差異基因的PPI網絡

利用STING數據庫構建差異基因的PPI網絡,過濾可信系數<0.7的關系對和孤立蛋白,最終獲得的PPI網絡包括281個節點及846條邊。使用MCC算法,得到PPI網絡中前15位差異基因為CCNB1、CCNB2、CDC45、CDCA8、BIRC5、CENPF、PTTG1、NCAPG、OIP5、MAD2L1、KIF23、KIAA0101、TYMS、CDC6、FAM64A(圖5A);使用DMNC算法,得到的前15位差異基因為MAD2L1、OIP5、KIF23、TYMS、NCAPG、BIRC5、CENPF、PTTG1、KIAA0101、FAM64A、TROAP、TK1、CDC6、CCNB1、CCNB2(圖5B);使用Stress算法,得到的前15位差異基因為CD34、BCL2、CCNB1、ITGAM、TNF、FCGR3A、MPO、TLR2、TYROBP、MMP9、HIST1H2BJ、HIST1H2BO、PTPRC、HIST1H2BL、HIST1H2BB(圖5C)。對上述3種算法得到的基因集合取交集,得到唯一關鍵基因CCNB1(圖5D)。

A:MCC算法得到的關鍵基因;B:DMNC算法得到的關鍵基因;C:Stress算法得到的關鍵基因;D:3種算法獲得的關鍵基因韋恩圖。

2.4 關鍵基因CCNB1的預后分析

利用UCSC Xena數據庫分析關鍵基因CCNB1對NB的預后價值,繪制生存分析曲線(圖6A)。結果顯示CCNB1的表達水平與NB患者總體生存率顯著相關(P=0.000 534 6),即CCNB1低表達的患者與生存率更高;CCNB1在腫瘤未分化或分化程度低的NB患者中的表達水平高于在腫瘤分化NB患者中的表達水平(圖6B,P=0.030 08);CCNB1在MYCN拷貝數擴增的NB患者中的表達水平顯著高于MYCN拷貝數未擴增的NB患者(圖6C,P=0.000 246 5)。以上結果都說明CCNB1和NB患者的預后密切相關。

A:CCNB1基因表達水平高、低的NB患者生存曲線;B:不同分化程度的NB腫瘤間CCNB1基因表達水平比較;C:MYCN擴增程度不同的NB腫瘤間CCNB1表達水平比較。

2.5 CCNB1相關基因的鑒定與其生物學意義

以關鍵基因CCNB1數據集中的中位相對表達值(10.60,n=57)為界值,將患者分為CCNB1高表達組(29例)和低表達組(28例),對2組進行基因差異表達分析,篩選標準:P<0.05,|logFC|>2。隨后對將篩選出的差異表達基因進行KEGG富集分析,結果表明CCNB1及其衍生基因與細胞周期、細胞衰老、p53信號通路等有顯著的相互作用。見表3。

表3 CCNB1高、低表達組差異表達基因的KEGG富集分析

3 討論

NB是兒童顱外最常見的惡性實體腫瘤,起源于腎上腺髓質及交感神經節的原始神經嵴細胞,具有很強的遠處轉移潛力。NB患者經常在確診時即發現遠處轉移,NB晚期和轉移患者的生存率較低。因此,尋找與NB遠處轉移有關的關鍵基因對NB的診斷和預后評估有重要意義。

GEO數據庫中的GSE112447數據集中收錄了20個NB轉移腫瘤組織樣本、37個NB原發腫瘤組織樣本的基因表達數據。通過生物信息學手段,本研究篩選出在NB轉移腫瘤組織和原發腫瘤組織間差異性表達的基因共435個,其中表達上調的基因296個,表達下調基因139個。對差異表達基因進行GO富集分析,結果顯示差異基因主要參與了炎癥反應、細胞黏附和補體激活等生物過程,主要分布于胞外基質、吞噬溶酶體和細胞外泌體[16-17]等細胞成分,并與蛋白結合、絲氨酸型內肽酶活性和受體結合等與腫瘤發生發展關系密切的分子功能有關[18-19]。同時,KGEE通路分析表明,差異基因主要富集于補體信號通路、中性粒細胞胞外殺菌網絡(Nets)形成途徑、ECM受體相互作用信號通路[20]、PI3K-Akt信號通路、IL-17信號通路、惡性腫瘤轉錄失調信號通路和造血細胞調控信號通路。上述信號通路與腫瘤的增殖、侵襲和遷移以及細胞凋亡密切相關[21-22],可能在NB轉移過程中也發揮著重要作用。UBELLACKER等[23]研究顯示,可以通過調節骨髓造血干細胞的功能和分化潛能影響造血微環境,從而抑制和預防骨髓轉移性疾病,改善患者預后。結合KEGG富集分析結果,差異基因可能通過影響造血細胞調控信號通路在NB骨髓轉移過程中發揮重要作用。本研究通過PPI網絡構建和Cytoscape軟件算法,從差異表達基因中篩選出了唯一的關鍵基因——CCNB1。有研究[24]表明CCNB1在NB組織中高表達,且其表達水平與NB患者的預后密切相關,提示CCNB1的表達量越低的患者的預后越好。由此可推測CCNB1可能在NB遠處轉移過程中發揮著重要作用,且與患者預后密切相關。

以TARGET數據集中151例NB樣本的CCNB1基因的中位表達值為界值,將患者樣本分為CCNB1高表達和低表達組。篩選CCNB1高、低表達組間差異表達的基因,并對其進行KEGG通路富集分析,結果表明CCNB1及其衍生基因與細胞周期、細胞衰老、p53信號通路等有顯著富集。SONG等[25]的研究表明CCNB1在細胞周期調控和p53信號通路中起著重要作用,與NB密切相關。另外有研究[26]表明CCNB1通過促進P3泛素化促進HCC中的PI53K和AKT磷酸化并降低P53蛋白表達。參與細胞周期控制的基因表達失調會使細胞命運走向異常,有可能造成不受控制的細胞增殖,進而導致癌癥的發生發展[27]。與筆者富集到的CCNB1及其衍生基因的生物學功能一致,說明CCNB1很可能通過細胞周期,p53信號通路影響NB的惡性程度,促進腫瘤細胞增殖和遠處浸潤轉移。

CCNB1過表達造成的免疫相關信號通路失調可能直接促進腫瘤細胞的異常增殖和轉移。此方向上的進一步深入研究可能揭示新的NB致病機制,靶向該通路的治療方案可能成為未來NB治療的新方向。有研究[28-29]表明,其他腫瘤中CCNB1的蛋白質表達水平高于正常組織。此外,與非侵襲性腫瘤相比,侵襲性腫瘤中的CCNB1表達水平也更高。CCNB1的敲低導致細胞活力和增殖能力顯著降低,這與本研究分析結果一致。

本研究的局限性在于:1)關鍵基因CCNB1的重要性還需生物學實驗驗證;2)只對一個數據集進行了分析,樣本數量較少;3)NB的遠處轉移是多因素共同作用的結果,本研究只從基因表達水平對其進行了單維度分析。

綜上所述,CCNB1基因可能在NB轉移過程中起重要作用,其高表達與患者生存率低相關,可能是評估NB預后的可靠生物學標志物。未來可能作為新的靶點,為NB診斷、治療和預后評估提供新的可能。

猜你喜歡
差異基因關鍵通路
硝酸甘油,用對是關鍵
高考考好是關鍵
基于RNA 測序研究人參二醇對大鼠心血管內皮細胞基因表達的影響 (正文見第26 頁)
紫檀芪處理對釀酒酵母基因組表達變化的影響
Kisspeptin/GPR54信號通路促使性早熟形成的作用觀察
proBDNF-p75NTR通路抑制C6細胞增殖
通路快建林翰:對重模式應有再認識
SSH技術在絲狀真菌功能基因篩選中的應用
Hippo/YAP和Wnt/β-catenin通路的對話
生意無大小,關鍵是怎么做?
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合