鄒秋鳳,鄒佳英,李麗娟,方小玲,黃文娟
中國人民解放軍聯勤保障部隊第九二四醫院新生兒科(廣西桂林 541000)
潰瘍性結腸炎(ulcerative colitis, UC)是一種病因復雜的慢性非特異性腸道炎性疾病,主要累及結腸和直腸[1]。根據既往流行病學研究報道,UC 的發病率為1~32/10 萬人年[2]。約20%的UC患者確診時<18 歲,小兒UC 的診斷年齡中位數為10~14 歲[3]。與成人UC 相比,小兒UC 的特點是結腸受累更廣泛,疾病更具侵略性[4]。60%~80%的患兒表現為大范圍潰瘍,10 年的手術切除率高達30%~40%[5-6]。近年來,病因不明的小兒UC 發病率呈快速上升趨勢[7]。腸道炎癥和黏膜損傷是UC 的主要形式。正常情況下,黏液層、腸道上皮和腸道免疫系統共同構成腸道物理屏障,避免了腸道細菌和抗原不適當的免疫激活[8]。在UC 狀態下,炎癥和免疫細胞富集在腸道黏膜,腸道通透性發生了變化?;谖㈥嚵泻透咄縋CR 技術,UC 和正常組織的mRNA 表達譜被確定。目前,全基因組關聯研究已確定了UC 的23 個易感基因[9],然而,小兒UC 相關的生物信息學研究有限。本研究基于基因表達綜合數據庫(Gene Expression Omnibus, GEO),采用生物信息學技術探討小兒UC 相關差異表達基因(differentially expressed genes, DEGs)的生物學功能,為小兒UC 的機制研究和診治提供科學依據。
從GEO 數據庫(http://www.ncbi.nlm.nih.gov/geo)下載UC 數據集GSE126124 的基因表達譜(Affymetrix GPL6244平臺,Affymetrix Human Gene 1.0 ST Array)。根據平臺注釋信息文件,將數據集的所有探針ID 轉換為相應的基因符號。GSE126124數據集包含兩組樣本,其中18 個樣本來自兒童UC活檢組織,作為實驗組;19 個樣本來自非炎癥性腸病兒童的腸道活檢組織,作為對照組。
實驗組和對照組之間的初步DEGs 均通過GEO2R(http://www.ncbi.nlm.nih.gov/geo/geo2r)分析獲得。GEO2R 是GEO 內置的網絡工具,通過比較樣本的轉錄組數據來獲取不同樣本間的初步DEGs。對初步DEGs 進行篩選,對于未匹配到基因和匹配多個基因的探針ID 予以刪除。對于重復基因,本研究只保留平均表達倍數最高的基因。最后,篩選矯正后P值<0.05 和基因表達Log 倍數變化(Log fold change,LogFC)絕對值>1 的DEGs,其中LogFC >1 的DEGs 視為高表達基因,LogFC <-1 視為低表達基因。
注釋、可視化和綜合發現數據庫(Database for Annotation, Visualization and Integrated Discovery,DAVID)(http://david.ncifcrf.gov)為輸入的蛋白質和基因列表提供了一個全面的生物學信息在線分析工具。京都基因和基因組百科全書(Kyoto Encyclopedia of Genes and Genomes, KEGG)是一個分析基因功能和相關通路的數據庫。GO 數據庫(Gene Ontology,GO)是一個公認的生物信息學工具,為注釋基因的生物學過程而開發。為了在生物功能水平上分析DEGs,本研究使用DAVID 在線數據庫進行基因功能和通路富集分析,P<0.05 表示差異具有統計學意義。SangerBox(http://sangerbox.com/Tool)用來可視化GO 和KEGG 富集結果。
STRING 數據庫(Search Tool for the Retrieval of Interacting Genes/Proteins,STRING)(http://string-db.org)用來構建DEGs 的蛋白質-蛋白質相互作用(protein-protein interaction, PPI)網絡,平均分>0.4 作為關聯的臨界值。使用Cytoscape 3.9.1 軟件可視化蛋白關聯網絡。此外,Cytoscape的插件MCODE 2.0.0 可根據拓撲結構選擇集群特定網絡,并定位相互作用密集的區域[19]。使用默認參數如下:Node score cut-off=0.2,K-Core=2,MAX depth=100,degree cut-off=2。選取MCODE分數最高的子網進行關鍵基因分析。
Cytoscape 的插件Cytohubba 用于分析子網模塊中的關鍵基因。運用Cytohubba 中MCC 算法篩選出分數排名前10 的基因作為關鍵基因,并使用KEGG 分析關鍵基因的富集通路。
對GSE126124 數據集中18 例UC 樣本和19例對照組樣本數據進行差異分析,確定了153個矯正后P值<0.05 并且LogFC 絕對值>1 的DEGs,包括92 個高表達DEGs 和61 個低表達DEGs?;虮磉_火山圖見圖1-A。
圖1 差異基因的分布和富集分析Figure 1. The distribution and enrichment analysis of differentially expressed genes
生物過程(biological process, BP)功能富集顯示,DEGs 主要富集在對外界刺激的反應、轉運、局域化、免疫系統過程和化合物反應方面(圖 1-B)。細胞成分(cell component, CC)分析顯示,DEGs 主要富集在細胞外區域、細胞間隙和囊泡方面(圖1-B)。KEGG 通路分析顯示,DEGs 主要富集在病毒蛋白與細胞因子及受體的作用、金黃色葡萄球菌感染、百日咳、趨化因子信號通路、補體和凝血級聯等方面(圖1-C)。
分別對高表達和低表達的DEGs 進行GO 功能和KEGG 通路富集分析。在高表達的DEGs 中,BP分析顯示基因主要富集于外部刺激反應、免疫系統過程和壓力反應(圖2-A);CC 分析顯示基因主要富集于細胞外域和囊泡(圖2-B);分子功能(molecular function,MF)分析顯示基因富集于催化活性、金屬離子結合和信號受體結合(圖 2-C);KEGG 通路分析顯示基因主要富集于金黃色葡萄球菌感染、IL-17 信號通路、病毒蛋白與細胞因子及受體的作用、細胞因子-細胞因子受體相互作用、趨化因子信號通路(圖2-D)。另一方面,在低表達DEGs 中,BP 功能分析顯示基因主要富集于轉運和局域化(圖3-A);CC 分析顯示基因主要富集于膜的成分(圖3-B);MF 分析顯示基因主要富集于轉運體活性、跨膜轉運蛋白活性(圖3-C);KEGG 信號通路分析顯示基因主要富集于代謝通路、膽汁分泌、藥物代謝-細胞色素P450(圖3-D)。
圖2 高表達差異基因的GO和KEGG富集分析Figure 2. GO and KEGG enrichment analysis of highly expressed differential genes
圖3 低表達差異基因的GO和KEGG富集分析Figure 3. GO and KEGG enrichment analysis of low expressed differential genes
DEGs 的PPI 分析獲得了116 個基因相互作用網絡(圖4-A)。MCODE 分析PPI 獲得了包含14 個DEGs 構成的高評分網絡(圖4-B)。Cytohubba 對這 14 個DEGs 進行了分析,選取出10 個MCC 評分最高的基因作為關鍵基因(圖4-C)。其中,Cxcl1具有最高MCC 評分,Cxcl2、Cxcl10次之,且均屬于小兒UC 高表達基因(表1)。關鍵基因的KEGG 信號通路分析顯示,這些基因主要富集在趨化因子、病毒蛋白與細胞因子及受體的作用、幽門螺桿菌感染上皮細胞、IL-17 和TNF 信號通路方面(圖4-D)。
表1 10個關鍵基因詳細信息Table1. The detailed information of 10 hub genes
圖4 差異基因和關鍵基因的分析Figure 4. Analysis of differentially expressed genes and hub genes
小兒UC 常見胃腸道表現有血便、便秘和腹痛[10]。由于常見的炎癥性消化道疾病也有類似臨床表現,UC 常被延誤診斷。研究報告稱,當發病年齡<6 歲時,約31%~47%的小兒炎癥性腸病為UC[11]。當前UC 治療措施主要為誘導和維持癥狀緩解[12],主要緩解藥物包括5-氨基水楊酸(5-ASA)和皮質類固醇[13]。5-ASA 是一線治療藥物,其生物學功能如下:①抑制環氧化酶和脂氧化酶,進而誘發前列腺素和白三烯的產生[14];②干擾腫瘤壞死因子對NF-kB 的激活[15]。據報道,糖皮質激素治療通過下調白細胞介素-1、白細胞介素-6、TNF-α 和NF-kB 發揮抗炎作用[16]。此外,糖皮質激素影響mRNA 的穩定性并抑制蛋白質的轉錄合成[17]。另一方面,5-ASA、生物制品和硫嘌呤被用于維持UC 的緩解。作為一種抗TNF-α 的單克隆抗體,英夫利西單抗可誘導表達TNF-α 的細胞凋亡,從而對炎癥反應有治療作用[18]。免疫調節劑,如硫嘌呤和甲氨蝶呤可刺激或抑制體液、細胞介導的免疫反應。硫嘌呤可通過VAV-Rac1 T 淋巴細胞通路和Rac1靶基因促進細胞凋亡[19],其代謝物6-TGN 可下調促炎癥細胞因子TNF 家族[20]。雖然藥物治療可以緩解UC 的進展,但15%的病例仍需手術切除治療[21],因此,有必要確定更多潛在的小兒UC生物標志物。
利用微陣列技術和生物信息學分析來探索基因改變和生物標志物有利于疾病的進一步研究。目前國內外關于小兒UC 的生物信息學研究較少,大部分研究基于成人UC 組織。Noble 等報道了Saa1、Defa5、Defa6、Mmp3和Mmp7基因在成人UC 活檢組織中存在差異表達和上調[22]。Xiu 等基于GSE87473 數據集的生物信息學研究發現,Cdc42、Polr2a、Rac1、Pik3r1、Mapk1和Src基因在成人與兒童UC之間存在病理學差異[23]。然而,這些研究并沒有通過比較正常與病變組織來獲取DEGs。
本研究結果顯示,DEGs 主要富集在病毒蛋白與細胞因子及受體的作用、金黃色葡萄球菌感染、百日咳、趨化因子信號通路、補體和凝血級聯等方面。Ungaro 等[24]報道了炎癥、免疫反應與UC 的病理生理學有關,其過氧化物酶增殖體的激活受體gamma 的表達減少,這是NF-kB 依賴的炎癥負調控因子。趨化因子,如Cxcl8、Ccl2和Ccl5,調節了炎癥性腸病的黏膜炎癥[25]。補體和凝血級聯是一個復雜的免疫系統,在炎癥中起著重要作用[26]。Bone 等人發現補體和凝血級聯在腸道閉鎖和敗血癥大鼠模型中被激活,該研究還發現C5a抗體可以改善該疾病,表明C5a在補體和凝血級聯反應中起重要作用[27]。然而,關于小兒UC 中補體和凝血級聯的研究報道很少。
本研究選擇了關鍵基因并建立了一個核心網絡,表明基因間有緊密的相互聯系。在這些基因中,Cxcl1的MCC 評分最高,為5 888。Cxcl1是Cxc趨化因子家族的一個重要成員,在炎癥性疾病中激活炎癥系統。Xu 等人的研究報道了Cxcl1在UC 患者結腸黏膜的表達水平增加[28]。在治療中,抑制Cxcr1/2軸可能是小兒UC 的一種新的治療策略。同時,一些報道稱使用Cxcr1/2拮抗劑G31P、Sb225002 或敲除Cxcr2后,DSS 誘導的小鼠結腸炎可以得到改善[29-31]。Il1rn是白細胞介素1 受體拮抗劑,研究報道Il1rn可能作為UC 和結直腸癌的共表達基因[32]。Fcγ 受體IIIa(Fcgr3a)的功能多態性被認為與接受抗Tnf治療的炎性腸病患者的反應相關,但在UC 的相關報道較少[33]。此外,S100a12和Ido1在UC 相關研究中也有報道[34-35]。本研究分析的10 個關鍵基因在免疫炎癥中具有相關作用,如Cxcl家族和Cxcr家族。其他關鍵基因在既往UC 相關研究中鮮有報道。此外,較少研究分析小兒UC 的DEGs。本研究結果支持這些基因在UC 中的作用,為小兒UC 疾病發生和發展提供基因相關的理論依據。
綜上所述,本研究利用生物信息學技術,發現小兒UC 腸道組織存在153 個DEGs,其中10個關鍵基因有可能作為診斷和治療的潛在生物標志物。然而,尚需更多的基礎研究來進一步探索這些基因在小兒UC 中的具體機制。