?

基于TCGA數據庫的結直腸癌差異表達基因篩選及CCDC78新基因驗證

2020-07-06 03:55黃世芳陳埏芳湯紹輝
中國病理生理雜志 2020年6期
關鍵詞:細胞株結腸癌引物

黃世芳,陳埏芳,施 穎,鐘 綠,湯紹輝△

(暨南大學附屬第一醫院 1重癥醫學科,2消化科,廣東廣州510630)

結直腸癌(colorectal cancer,CRC)是消化系統常見的惡性腫瘤之一,全世界CRC發病率呈明顯上升趨勢[1]。盡管CRC的治療取得一定進展,但中晚期CRC患者5年生存率仍不樂觀[2-3]。CRC的發生發展與遺傳因素、環境因素以及它們之間的相互作用密切相關,而原癌基因激活、腫瘤抑制基因失活和細胞信號通路功能異常被認為是CRC發生的重要機制[4-5],但其詳細分子機制尚未完全明確。

癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)數據庫是美國國家癌癥研究所(National Cancer Institute,NCI)和美國國家人類基因組研究所(National Human Genome Research Institute,NHGRI)于2006年共同開發的研究項目,旨在采用高通量基因組測序技術對腫瘤標本進行全基因組分析,包括差異表達基因、單核苷酸多態性、拷貝數變異、長鏈非編碼RNA、甲基化數據等,從而在分子水平上挖掘出與腫瘤發生發展、預后相關的基因變異及信號通路[6-9]。高通量測序技術將有助于尋找新的CRC分子治療靶點及CRC早期診斷和預后監測的分子標志物,這對改善CRC患者預后具有重要意義。

本研究通過對TCGA數據庫中大樣本CRC組織基因表達譜RNA測序(RNA sequencing,RNA-Seq)數據進行生物信息學分析,挖掘與CRC預后密切相關的新基因,對篩選出的新基因進行驗證和功能研究,為臨床上CRC診治提供參考資料。

材料和方法

1 研究對象

1.1 數據來源 將納入TCGA數據庫中的410例CRC樣本和30例CRC癌旁組織樣本分別用編號進行區分。這些樣本有完整的mRNA高通量測序結果,且有相應的臨床病理學信息資料?;虮磉_數據級別為level 3。官方授權可以公開發表利用TCGA數據庫的分析研究結果。

1.2 組織標本 22例CRC及配對的癌旁組織[男14例,女8例,年齡(61.1±10.5)歲;右半結腸7例,左半結腸6例,直腸9例;中分化腺癌21例,黏液腺癌1例]收集于暨南大學附屬第一醫院胃腸外科2018年5~9月住院的CRC患者手術切除標本,診斷均經病理組織學檢測證實。組織標本收集后立即放入超低溫冰箱保存備用。本研究由暨南大學附屬第一醫院醫學倫理委員會批準。

1.3 細胞株 人結腸癌細胞株SW480、HT29、SW620和HCT116,人正常結腸上皮細胞株HCoEpiC,人胚腎細胞株293T,均購于ATCC。

2 方法

2.1 生物信息學數據處理

2.1.1 CRC基因表達數據的獲取 TCGA訪問主頁為https://cancergenome.nih.gov/。進入數據下載頁面,癌癥類型為colorectal cancer,選擇TCGA-COAD、Transcriptome Profiling、Gene Expression Quantification和HTSeq-Counts類型數據,進入數據獲取頁面。RNA的表達數據為level 3級別,同時勾選Metadata和Manitest文件,利用GDC Data Transfer Tool下載所需數據。

2.1.2 差異表達基因的篩選及聚類分析 利用R語言R 3.3.1進行數據分析,篩選差異表達基因。設定差異基因的篩選閾值:Padj<0.05,|log2(fold change)|>1。其意義為:mRNA在腫瘤組織與正常組織表達有差異的校正后P值<0.05,改變倍數>2。同時采用heatmap包對差異表達基因進行聚類分析。

2.1.3 差異表達基因的生存分析 使用R-survival包對富集于生物學過程中的差異表達基因進行生存分析并繪制生存曲線圖。首先對基因的表達量按中位數進行分組,表達量高于中位數的為高表達組[CCDC78(coiled-coil domain containing 78)高表達組、PGGHG高表達組和TSPEAR高表達組],表達量低于中位數的為低表達組(CCDC78低表達組、PGGHG低表達組和TSPEAR低表達組)。將差異基因表達量數據和生存數據整合在一起,采用Kaplan-Meier法計算生存時間及累積生存率,結合log-rank檢驗比較生存率的差異,過濾條件為P<0.01。

2.2 RT-qPCR實驗 取1×106個培養細胞,加入1 mL TRIzol,吹打混勻使細胞充分裂解;人體組織標本(10~20 mg)加入液氮充分研磨呈粉末,加入1 mL TRIzol,收取細胞裂解產物。按照說明書提取RNA,測定RNA濃度,逆轉錄RNA成cDNA后進行RT-qPCR檢測。采用2-ΔΔCt法計算目的基因表達量。引物通過Primer 5軟件設計,由蘇州金唯智公司合成。CCDC78的上游引物序列為5'-CAAGGAGCTGGTCGACATT-3',下游引物序列為5'-AGCCGAAGGATCTCACTCT-3';PGGHG的上游引物序列為5'-CTTGACTCTGGGCAGCTTTA-3',下游引物序列為5'-CTCAAATCCCTCTCCTGTTCTC-3';TSPEAR的上游引物序列為5'-GAGCGATCCTCAGAGAGTTTAC-3',下游引物序列為5'-GAGCTGAAGGTGAACAGACA-3';GAPDH的上游引物序列為5'-GGAGTCAACGGATTTGGTCGT-3',下游引物序列為5'-GCTTCCCGTTCTCAGCCTTGA-3'。

2.3CCDC78siRNA(siCCDC78)的篩選 檢索GenBank中人 CCDC78的 mRNA序列(NM_001031737.2),按照siRNA設計原則,設計CCDC78_001、CCDC78_002和CCDC78_003共3對siRNA,另設計1對無任何靶基因的陰性對照siRNA(negative control siRNA,NC siRNA)作為陰性對照,均委托蘇州金唯智公司合成,序列見表1。培養SW480細胞至匯合度為30%~50%,按照Lipofectamine?RNAiMAX轉染試劑說明書轉染siRNA。用RT-qPCR法檢測siRNA的干擾效率,引物同前,每個樣本同時擴增3個復管,并連續進行3次實驗。

表1 CCDC78 siRNA候選序列Table 1.Candidate sequences of CCDC78 siRNA

2.4 pLVX-shRNA2-Puro-shCCDC78慢病毒載體的構建 (1)篩選得到的高效沉默CCDC78基因的siRNA為CCDC78_001(序列見表 1),相應的CCDC78基因靶序列為5'-CCT ACA TGA GCA GCA TGA GGC-3'。(2)設計CCDC78_001的shRNA序列:上游為5'-GAT CCG CCT ACA TGA GCA GCA TGA GGC CTC GAG GCC TCA TGC TGC TCA TGT AGG TTT TTT G-3',下游為 5'-AAT TCA AAA AAC CTA CAT GAG CAG CAT GAG GCC TCG AGG CCT CAT GCT GCT CAT GTA GGC G-3'??寺≥d體pLVX-shRNA2-Puro的酶切位點為BamH I+EcoR I。(3)雙鏈CCDC78_001的制備:將表達CCDC78_001的上游序列和下游序列等體積混合后,煮沸5 min,自然冷卻至室溫。取pLVX-shRNA2-Puro載體行BamH I與EcoR I雙酶切,酶切產物與雙鏈CCDC78_001連接,構建成pLVX-shRNA2-Puro-shCCDC78慢病毒載體。挑取酶切鑒定正確的陽性克隆進行測序驗證,測序引物為U6-F(5'-TAC GAT ACA AGG CTG TTA GAG AG-3')。

2.5 慢病毒包裝及滴度測定 將含有目的基因的慢病毒載體pLVX-shRNA2-Puro-shCCDC78及其陰性對照載體pLVX-shRNA2-Puro分別用293T細胞進行慢病毒包裝,產生高滴度慢病毒,分別稱為rLV-shRNA2-Puro-shCCDC78及其陰性對照rLV-shRNA2-Puro慢病毒。主要過程如下:將重組慢病毒載體及兩種輔助包裝質粒(pHelper 1.0及pHelper 2.0載體)采用脂質體法共轉染293T細胞;轉染后8 h更換為完全培養液,培養48 h后,收集富含慢病毒顆粒的細胞上清液,對其濃縮后得到高滴度的慢病毒濃縮液,在293T細胞中測定并標定病毒滴度,取最佳病毒滴度做后續實驗。

2.6 慢病毒感染SW480和HT29結腸癌細胞株 感染前24 h,取對數生長期的SW480和HT29細胞按每孔2×105接種于24孔板,置于37℃、5%CO2培養箱內培養。24 h后,細胞密度達40%~50%時,加入慢病毒及合適濃度的polybrene。實驗分為shCCDC78組(感染rLV-shRNA2-Puro-shCCDC78的SW480和HT29細胞)及shNC組(感染rLV-shRNA2-Puro的SW480和HT29細胞)。每組設3個復孔。感染12 h后棄上清液,更換為新鮮的完全培養液,72 h后在倒置熒光顯微鏡下觀察綠色熒光蛋白表達情況,挑選熒光強度大的陽性克隆孔逐級擴大培養,即可得到沉默CCDC78表達的穩定細胞株,用于后續實驗。

2.7 穩轉細胞株CCDC78 mRNA表達的檢測 培養shCCDC78組和shNC組SW480細胞,48 h后收集細胞,按TRIzol試劑盒說明抽提細胞總RNA,逆轉錄成cDNA并進行實時熒光定量PCR,檢測CCDC78的mRNA表達,引物同前。

2.8 CCK-8法檢測細胞活力 常規培養shCCDC78組和shNC組SW480和HT29細胞,取生長狀態良好的2組細胞以每孔7×104接種于96孔板,37℃、5%CO2培養箱常規孵育過夜,收集各個時點(24、48和72 h)的細胞,在避光條件下每孔加入10 μL CCK-8溶液,將培養板放到培養箱內孵育1 h,然后將96孔板中的培養液移至酶標板中;酶標儀檢測450 nm處的吸光度(A)。

2.9 Transwell實驗檢測細胞遷移與侵襲 遷移實驗主要步驟如下:培養上述2組細胞48 h后,細胞計數并調整細胞密度,使每種細胞的密度為3×108/L;取細胞懸液100 μL加入Transwell小室,即每孔3×104個細胞,下室加入600 μL完全培養液;在37℃、5%CO2孵育24 h后,取出小室,棄去培養液,用棉簽擦去上室未遷移的細胞,4%多聚甲醛固定20 min,0.1%結晶紫染色10 min,PBS洗滌3次并晾干,顯微鏡下觀察6個視野細胞并拍照計數。對于細胞侵襲實驗,首先用Matrigel包被Transwell小室底部膜的上室面,置于37℃孵育30 min使Matrigel聚合成凝膠,使用前進行基底膜水化,其余步驟同遷移實驗。

3 統計學處理

使用SPSS 23.0統計軟件,實驗數據以均數±標準差(mean±SD)表示,兩組間差異采用Student'st檢驗,多組間差異采用單因素方差分析,生存分析采用Kaplan-Meier法,以P<0.05為差異有統計學意義。采用GraghPad Prism 7作圖。

結 果

1 CRC患者預后相關基因篩選結果

從TCGA數據庫中下載410例CRC組織樣本和30例癌旁組織樣本的RNA-Seq數據,使用DESeq2包進行差異基因篩選,篩選出在CRC與癌旁組織之間有顯著差異表達的基因數目為4 017個,其中表達上調的基因有1 653個,表達下調的基因有2 364個,見圖1。Kaplan-Meier生存分析結果顯示,有69個基因與CRC患者預后差密切相關(P<0.01),其中表達上調的基因有36個。這36個基因中有11個目前尚未在腫瘤研究中被報道,分別是ELFN1-AS1、CCDC78、PGGHG、AGAP3、DPP7、ADAMTSL2、TSPEAR、PCED1A、RNU6-403P、GABRD和BICDL1,見表2。其中RNU6-403P是一個假基因,而ELFN1-AS1是一個lncRNA[10]。因此,我們選擇其中表達上調倍數前3位的基因CCDC78、PGGHG和TSPEAR做進一步研究。生存分析結果顯示,這3個基因高表達與患者生存期縮短顯著相關,見圖2。

Figure 1.Volcanic map of differentially expressed genes between colorectal cancer tissues and adjacent tissues.Padj:adjusted probability.Red dots represent significantly up-regulated genes,green dots represent significantly down-regulated genes,and black dots represent genes with insignificantly differential expression.圖1 結直腸癌組織與癌旁組織間差異表達基因的火山圖

表2 11個尚未在腫瘤研究中報道的表達上調基因Table 2.Eleven up-regulated genes not yet reported in cancer studies

2 CRC患者預后相關基因在CRC細胞株中呈高表達

RT-qPCR結果顯示,與正常結腸上皮細胞株HCoEpiC相比,3個上調基因(CCDC78、PGGHG和TSPEAR)的mRNA表達水平在人結腸癌細胞株中顯著上調(P<0.01),見圖3,其上調趨勢與TCGA數據庫中的RNAseq數據一致。于是,我們選擇表達上調倍數最大的CCDC78基因做進一步研究。

Figure 2.Kaplan-Meier curves for overall survival time of the colorectal cancer patients with different CCDC78(A),PGGHG(B)and TSPEAR(C)expression levels.圖2 CCDC78、PGGHG和TSPEAR基因表達水平與結直腸癌患者預后的關系

Figure 3.Relative mRNA expression levels of CCDC7,PGGHG and TSPEAR in colon cancer cell lines(HCT116,SW620,SW480 and HT29)and normal colon epithelial cells(HCoEpiC)detected by RT-qPCR.Mean±SD.n=3.**P<0.01 vs HCoEpiC.圖3 結腸癌細胞和正常結腸上皮細胞中CCDC78、PGGHG和TSPEAR mRNA的表達水平

3 CCDC78基因在CRC組織中表達水平驗證結果

RT-qPCR結果顯示,CCDC78 mRNA在CRC組織中的表達水平顯著高于配對癌旁組織(P<0.01),見圖4。

4 沉默CCDC78表達顯著抑制結腸癌細胞活力、侵襲與遷移

4.1 siCCDC78篩選結果 RT-qPCR結果顯示,轉染CCDC78_001、CCDC78_002及CCDC78_003這 3對siRNA的SW480細胞中CCDC78 mRNA表達量均有不同程度的降低,其中100 nmol/L的CCDC78_001抑制效率最高,達69%(表3),因此將此siRNA用于后續研究。

4.2 pLVX-shRNA2-Puro-shCCDC78慢病毒載體構建及其慢病毒包裝結果 將載體及兩種病毒包裝輔助質粒共轉染293T細胞,轉染后48 h,在熒光顯微鏡下觀察細胞的轉染效率,顯示幾乎所有293T細胞均發出較亮的綠色熒光,采用倍比稀釋法檢測病毒滴度為1.0×1011TU/L。

4.3 穩轉細胞株CCDC78 mRNA表達水平 與shNC組相比,穩定沉默CCDC78表達的shCCDC78組SW480細胞中CCDC78 mRNA的表達水平顯著降低(P<0.01),見圖5。

Figure 4.Relative CCDC78 mRNA expression level in colorectal cancer tissues and matched adjacent tissues was detected by RT-qPCR.Mean±SD.n=22.**P<0.01 vs adjacent.圖4 結直腸癌組織和配對癌旁組織中CCDC78 mRNA的表達水平

表3 CCDC78 siRNA的篩選結果Table 3.Results of CCDC78 siRNA screening

4.4 沉默CCDC78對結腸癌細胞活力、遷移與侵襲的影響 與shNC組相比,shCCDC78組結腸癌細胞活力顯著降低,遷移和侵襲細胞數均顯著減少(P<0.01),見圖6~8。這說明穩定沉默CCDC78表達可顯著抑制結腸癌細胞活力、遷移和侵襲。

討 論

Figure 5.Relative CCDC78 mRNA expression level in SW480 cells with stable silencing of CCDC78 was detected by RT-qPCR.Mean±SD.n=3.**P<0.01 vs shNC group.圖5 穩轉細胞株中CCDC78 mRNA的表達水平

TCGA數據庫包含了海量的基因測序信息,包括基因組、蛋白質組、轉錄組、表觀組和臨床資料等相關數據[11-12]。利用生物信息學分析工具,從中探尋腫瘤差異性表達基因,分析其與疾病的臨床相關性,可為惡性腫瘤生物標志物和藥物靶標的篩選提供重要線索。Hou等[13]利用TCGA中的379例CRC患者的基因表達數據,通過共表達分析、基因互作網分析、生存分析等綜合分析方法確定了潛在的與CRC預后相關的因素,包括9個DNA甲基化位點、6個miRNA及11個mRNA;Yang等[14]利用TCGA數據庫交叉驗證了 miR-15b、miR-215、miR-145、miR-192、let-7g等miRNA與CRC患者總體生存的相關性,顯示let-7g可以作為預測CRC患者預后的因子之一;Yang等[15]利用TCGA數據庫,經相關分析發現SLC17A9可能在CRC的進展中發揮重要作用,并可能作為CRC預后評估的獨立生物標志物。

本研究利用TCGA數據庫中410例CRC樣本的RNA-Seq數據,采用生物信息學數據處理方法,鑒定了69個與CRC患者預后差密切相關的基因,其中CCDC78是CRC患者顯著高表達的基因之一,CCDC78高表達與CRC患者生存期縮短顯著相關(P=0.002 07),目前在人類腫瘤研究中尚未見報道。由于TCGA數據庫中腫瘤標本數據主要來自美國患者,我們采用RT-qPCR技術檢測結腸癌細胞株(4個細胞株)及中國人CRC標本(n=22)中CCDC78 mRNA的表達水平,結果顯示,結腸癌細胞株和CRC標本中CCDC78的表達也顯著上調,與TCGA數據庫中的RNA-Seq數據一致,進一步表明CCDC78基因異常表達參與CRC的發生發展。

Figure 6.CCDC78 gene silencing significantly inhibited the viability of SW480 and HT29 colon cancer cells.The cell viability was detected by CCK-8 assay.Mean±SD.n=3.**P<0.01 vs shNC group.圖6 沉默CCDC78表達顯著抑制SW480和HT29結腸癌細胞的活力

Figure 7.CCDC78 gene silencing significantly inhibited the migration ability of SW480 and HT29 colon cancer cells.The migration ability was detected by Transwell assay.Mean±SD.n=3.**P<0.01 vs shNC group.圖7 沉默CCDC78表達顯著抑制SW480和HT29結腸癌細胞的遷移能力

Figure 8.CCDC78 gene silencing significantly inhibited the invasion ability of SW480 and HT29 colon cancer cells.The invasion ability was detected by Transwell assay.Mean±SD.n=3.**P<0.01 vs shNC group.圖8 沉默CCDC78表達顯著抑制SW480和HT29結腸癌細胞的侵襲能力

CCDC78基因定位于16p13.3,是一個蛋白編碼基因,包含12個外顯子。CCDC78在肺、脾、腦、淋巴結、胃、大腸、小腸等24種人類組織中表達,其中在肺和脾高表達,在淋巴結、胃、大腸和小腸中等表達,在食管、肝臟和胰腺表達水平很低。CCDC78 mRNA(NM_001031737)長度為1 611 bp,CCDC78蛋白含有438個氨基酸。檢索國內外相關文獻顯示,CCDC78基因可能參與肌肉功能調節,其突變是導致先天性肌病的遺傳學病因之一[16],未見CCDC78基因表達異常與人類腫瘤及其它疾病相關的報道,其詳細生理功能也尚不明確。CCDC78是一個新發現的基因,相關研究很少,在實驗設計時,我們未能找到與CCDC78蛋白完全匹配的商業化抗體,因此在本研究中未能進行蛋白表達方面的實驗,有待今后進一步研究。

為了進一步探討CCDC78基因異常表達在CRC發生中的作用,我們采用RNA干擾技術,觀察敲減CCDC78基因表達對結腸癌細胞株功能的影響。結果顯示,穩定沉默CCDC78表達可顯著抑制SW480和HT29結腸癌細胞株的活力、遷移和侵襲。結合前述來自TCGA數據庫CRC標本的生物信息學分析數據,這些結果提示CCDC78可能是一個新的與CRC預后差相關的癌基因,抑制CCDC78表達有望成為CRC分子靶向治療的潛在新靶點。據我們所知,本研究是第一個有關CCDC78基因異常高表達與人類腫瘤(CRC)發生發展密切相關的報道。

猜你喜歡
細胞株結腸癌引物
DNA引物合成起始的分子基礎
高中生物學PCR技術中“引物”相關問題歸類分析
花菜類雜交種純度鑒定SSR 核心引物篩選
安羅替尼對肺腺癌細胞株A549放射敏感性的影響及機制
miR-21負向調控宮頸癌HeLa細胞株中hTERT的表達
探討腹腔鏡手術在橫結腸癌治療中的臨床應用效果
槲芪癥消湯對人肝癌細胞株HepG2.2.15增殖和凋亡的影響
明悉引物設計 參透PCR技術
結腸內支架聯合腹腔鏡結腸癌根治術在結腸癌合并急性梗阻中的短期及中期療效分析
腹腔鏡下橫結腸癌全結腸系膜切除術的臨床應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合