?

基于生物信息學方法的胃癌靶點預測研究

2021-06-07 08:03姚遠
國際生物醫學工程雜志 2021年6期
關鍵詞:胃癌通路數據庫

姚遠

天津醫科大學腫瘤醫院,國家腫瘤臨床醫學研究中心,天津市“腫瘤防治”重點實驗室,天津市惡性腫瘤臨床醫學研究中心,胃腸腫瘤生物學研究室 300060

0 引言

胃癌是最常見的消化系統惡性腫瘤[1],我國是世界上胃癌發病率最高的國家之一。目前,臨床上針對胃癌的早期診斷方案尚未健全,因此開展特異性靶點研究對于了解胃癌發生、發展過程及臨床早期診治尤為重要,而揭示胃癌發生、發展的分子機制也對后期相關治療具有重要意義[2]。隨著生物信息學的發展和在線數據庫的不斷完善,根據已驗證的基因表達芯片數據進行研究已成為癌癥研究不可或缺的一部分。本研究中,對胃癌基因芯片GSE63121(miRNA)[3]和GSE2685(mRNA)[4]進行分析,以獲得胃癌中明顯差異表達的基因,并通過基因腫瘤學(gene ontology,GO)和京都基因和基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG)進行富集分析,從而對差異表達基因的作用途徑進行預測,在蛋白質交互作用網絡(proteinprotein interaction networks,PPI)中對差異基因在蛋白水平的作用進行評估,再使用基因表達譜交互分析(gene expression profiling interactive analysis,GEPIA)數據庫和TIMER2.0數據庫對差異表達基因進行再一次篩選富集,以尋找胃癌的關鍵作用靶點。

1 方法

1.1 數據的獲取

從高通量基因表達(gene expression omnibus,GEO)數據庫(http://www.ncbi.nlm.nih.gov/geo/)中檢索到的胃癌相關基因表達芯片為GSE63121(miRNA)和GSE2685(mRNA)。在這些數據中,實驗組為胃癌組織樣本(樣本數均大于15),對照組為正常胃組織樣品。所獲得的基因表達芯片數據提供了足夠的信息進行生物信息學分析。其中,GSE2685數據中包含22例胃癌組織樣本和8例正常胃組織樣本;GSE63121數據中包含15例胃癌組織樣本和15例正常胃組織樣本。

1.2 數據處理與分析

利用GEO數據庫提供的GEO2R在線工具對篩選到2個胃癌相關的基因表達芯片數據進行初步分析,從中提取出基因表達矩陣。隨后,使用R語言提供的DESeq2工具包對基因表達矩陣中的實驗組和對照組數據進行差異基因分析,并根據調整P值和篩選閾值(|Log2FC|)對差異基因進行篩選,其中FC(fold change)表示實驗組和對照組間表達量的比值。篩選標準:P<0.05、|Log2FC|>1.0。繪制胃癌相關差異表達mRNA和miRNA基因的火山圖。

1.3 差異表達miRNA的潛在靶基因預測

使用miRDB(http://mirdb.org/)對基因表達芯片數據中差異表達miRNA的潛在靶基因進行預測,并將預測到的潛在靶基因與篩選到的差異表達基因進行互相映射,得到兩者的共有基因,用于富集分析。

1.4 差異表達基因的GO和KEGG富集分析

使用注釋、可視化和集成發現(the database for annotation,visualization and integrated discovery,DAVID)(https://david.ncifcrf.gov/)數據庫對差異表達基因進行GO和KEGG富集分析。由于DAVID是一套完整的基因功能在線注釋工具,能夠較為方便地為研究者提供基因背后的生物學意義。將篩選到的差異表達基因的基因符號(gene symbol)輸入DAVID數據庫中,進行GO和KEGG富集分析,以P<0.05作為篩選標準。

1.5 蛋白-蛋白相互作用以及網絡構建

為了進一步分析GSE63121和GSE2685中共有的差異表達基因的功能,使用檢索相互作用基因的搜索工具(the search tool for the retrieval of interacting genes,STRING)數據庫(https://string-db.org/)對差異表達基因之間可能存在的或已經通過實驗驗證的蛋白-蛋白相互作用進行評估和預測。將GSE63121和GSE2685中共有的差異表達基因的基因符號(gene symbol)輸入STRING數據庫進行蛋白-蛋白相互作用分析,然后選取相互作用分值大于0.4的基因進行可視化分析。

1.6 基因表達譜分析

使用GEPIA數據庫(http://gepia.cancer-pku.cn/detail.php?gene)分析來自癌癥基因組圖集(the cancer genome atlas,TCGA)數據庫(https://portal.gdc.cancer.gov/)和GTEx數據庫中的胃癌相關差異基因和患者總生存期(overall survival,OS)之間的相關性。

1.7 腫瘤免疫浸潤水平相關分析

使用TIMER2.0(http://timer.cistrome.org/)分析最終篩選到的基因的表達與腫瘤微環境中調節性T細胞(Tregs)浸潤水平的相關性。

2 結果

2.1 差異表達mRNA潛在靶基因預測結果

當以P<0.05、|Log2FC|>1.0為標準時,使用DESeq2工具包共獲得了734種差異表達的mRNA基因(下調和上調的基因數分別為473和261)和20個差異表達的miRNA基因(上調和下調的miRNA數分別為1和19)。(圖1)

圖1 差異表達基因的火山圖

2.2 GO和KEGG富集分析結果

富集分析結果如圖2和圖3所示。從圖中可以發現,差異表達基因主要注釋到GO terms,功能涉及細胞組成或生物發生、應答刺激反應、免疫系統過程、信號轉導及發育過程等。此外,這些差異表達基因可能參與的代謝途徑主要有參與腫瘤發生和發展、細胞焦點連接形成、p13K-Akt信號通路、神經活性配體受體連接途徑以及藥物代謝-細胞色素P450代謝通路。表1和表2種列出了富集分析的詳細結果。上述結果表明,這些差異表達基因可能通過多種代謝途徑來響應機體應對胃癌造成的損傷。

表2 差異表達基因的京都基因和基因組百科全書(KEGG)代謝途徑富集分析結果

圖3 差異表達基因的京都基因和基因組百科全書(KEGG)通路富集分析

表1 差異表達基因的基因腫瘤學(GO)富集分析結果詳情(前20位)

圖2 差異表達基因的基因腫瘤學(GO)富集分析

2.3 差異表達miRNA潛在靶基因預測及共有差異表達基因鑒定結果

miRNA作為一類非編碼單鏈小RNA,在轉錄后水平上調節基因的表達,進而參與多種代謝途徑。為尋找胃癌相關的miRNA并構建miRNA-mRNA調控網絡,本文中對鑒定到的差異表達miRNA的潛在靶基因進行預測,共預測到2 740種潛在靶基因。進一步,將這些潛在靶基因與之前得到的胃癌相關差異表達mRNA的靶基因(共734種)進行相互映射。共篩選到103種差異表達miRNA和mRNA的潛在靶基因,稱為共有差異表達基因,這些基因在胃癌組織均差異表達。上述結果表明,miRNA通過調控mRNA的表達來應答胃癌的發展。

2.4 共有差異表達基因PPI網絡構建

將103種共有差異表達基因的基因符號(gene symbol)輸入STRING數據庫,進行PPI網絡構建,總共得到103個節點,221條邊,平均每個節點的度為4.29,如圖4所示。結果表明,C-X-C基序趨化因子 配 體12(C-X-C motif chemokine ligand 12,CXCL12)、蛋白激酶cAMP依賴性Ⅱ型調節亞基β(protein kinase cAMP-dependent typeⅡregulatory subunit beta,PRKAR2B)、蛋白激酶cAMP依賴性催化β(protein kinase cAMP dependent catalytic beta,PRKACB)、KIT(KIT原癌基因)、C-X-C基序趨化因子配體8(C-X-C motif chemokine ligand 8,CXCL8)、cAMP反應元件結合蛋白1(cAMP responsive element binding protein 1,CREB1)、雌激素受體1(estrogen receptor 1,ESR1)和發動蛋白(Dynamin 1,DNM1)等基因位于調控網絡的中心,且和許多差異表達基因存在相互作用關系,表明這些基因在胃癌形成以及機體應對胃癌的過程中扮演重要的角色。進一步分析可知,CREB1和ESR1這兩種基因與胃癌具有較強的相關性,且在GSE2685數據中,這兩種基因的相對表達量均下調,變化率分別為-1.08%和-1.46%。這兩種基因參與多條代謝通路,如代謝類,免疫調節類等。

圖4 共有差異表達基因的蛋白質交互作用網絡(PPI)構建

2.5 差異表達基因與胃癌預后的關系

在GEPIA數據庫中,當將截斷值(cut off)設置為“median”,以95%CI為篩選標準,并將預后節點設為120個月,此時的生存分析結果如圖5所示。結果表明,CREB1和ESR1低表組胃癌患者的預后明顯著好于高表達組。

圖5 cAMP反應元件結合蛋白1(CREB1)和雌激素受體1(ESR1)表達水平與胃癌患者生存率的關系

2.6 腫瘤免疫浸潤相關性分析結果

由于富集分析結果提示差異表達基因涉及的主要途徑為免疫過程,因此使用TIMER2.0數據庫分析CREB1和ESR1與Tregs細胞豐度的相關性。如圖6所示,CREB1(ρ>0,P=7.21×10-18)和ESR1(ρ>0,P=4.46×10-26)與Tregs細胞的豐度均正相關。該結果提示CREB1和ESR1高表達可能會提高腫瘤微環境中免疫抑制性細胞的浸潤水平。

圖6 cAMP反應元件結合蛋白1(CRE B1)和雌激素受體1(ESR1)與胃癌的Treg細胞的免疫浸潤水平

3 討論與結論

胃癌是消化系統中常見的惡性腫瘤,其早期診斷和治療一直是研究熱點。本研究中使用生物信息學方法分析與胃癌相關的基因表達芯片數據并成功篩選到CREB1和ESR1基因,進而對這兩種基因進行功能富集分析。結果表明,CREB1和ESR1在胃癌患者中表達升高,說明二者參與調節胃癌微環境中免疫系統的構成,且通過調節免疫作用來影響胃癌的發展。

在小鼠結腸炎模型中,alpinetin會上調CREB1與Foxp3啟動子區結合,通過調控miRNA-302/DNMT-1/CREB1信號通路促進Tregs細胞分化。與腫瘤環境相反的是,過表達CREB1在炎癥中可以有效改善病情[5]。在胰腺癌模型中,靶向CREB1可抑制胰腺腫瘤的發展[6]。已有研究結果表明,CREB1在腫瘤組織中異常高表達且對淋巴結轉移有促進作用[7],CREB1可通過調控p-Akt和mTOR信號通路來增強腫瘤細胞的增殖和遷移能力[8]。此外,結直腸癌組織中通常高表達葡萄糖轉運蛋白(glucose transporter 3,GLUT3),而葡萄糖代謝降低時會產生低糖應激效應,通過AMPK/CREB1途徑顯著上調GLUT3[9],同時伴隨不良預后。在乳腺癌模型中,突變激活ESR1會對芳香化酶抑制劑產生抗性,這使ESR1成為潛在的作用靶點[10]。ESR1是乳腺癌中常見的驅動基因[11],表達ESR1時會增強突變信號。研究結果表明,ESR1與轉移性乳腺癌的不良預后相關[12]。在轉移性腫瘤模型中會出現高豐度的基因組突變,這往往與腫瘤的免疫浸潤相關[13-14]。然而,目前尚未見到關于上述機制在胃癌中作用的相關報道。但現有研究結果均支持CREB1和ESR1在腫瘤發生過程中可以影響免疫浸潤,同時調節相關通路,從而對腫瘤細胞的增殖、遷移、凋亡發揮作用。然而,現有的研究均在胃癌指標選擇方面或多或少存在相對局限性,因此開展多種功能交叉聯合診斷研究對臨床有重要意義。

綜上,本研究中使用生物信息學方法找到CREB1和ESR1這兩種胃癌相關的差異表達基因,推測二者在胃癌發生、發展過程中影響免疫浸潤,同時通過相關調節通路影響胃癌細胞的增殖、遷移、凋亡等。CREB1和ESR1有望成為研究胃癌發病機制和分子機制及臨床應用的重要靶點,后續可進一步通過分子生物學實驗和免疫學實驗對其進行功能驗證。

利益沖突所有作者均聲明不存在利益沖突

猜你喜歡
胃癌通路數據庫
數據庫
數據庫
數據庫
數據庫
P53及Ki67在胃癌中的表達及其臨床意義
Kisspeptin/GPR54信號通路促使性早熟形成的作用觀察
胃癌組織中LKB1和VEGF-C的表達及其意義
proBDNF-p75NTR通路抑制C6細胞增殖
胃癌組織中VEGF和ILK的表達及意義
通路快建林翰:對重模式應有再認識
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合