?

腎透明細胞癌中長鏈非編碼RNA 的鑒定及驗證

2020-07-29 11:56馬慧敏馮鋼
沈陽醫學院學報 2020年4期
關鍵詞:共表達編碼病理

馬慧敏,馮鋼

(1. 皖南醫學院研究生院,安徽 蕪湖 241002;2. 皖南醫學院弋磯山醫院檢驗科)

大量基因組測序和轉錄組分析的研究表明,人類轉錄組不僅包括蛋白編碼RNA,還包括大量的非編碼 RNA[1]。非編碼 RNA 根據其長度分為長、短兩種。microRNA(miRNA)是目前研究最多的短非編碼RNA,在多種癌癥中表達不同,其種子序列與 mRNA 的 miRNA 應答元件(miRNA response element,MRE)之間的堿基配對可抑制mRNA 翻譯并介導 mRNA 衰減[2]。長鏈非編碼RNA(long non-coding RNA,lncRNA)被廣泛定義為長度超過200 個核苷酸的非編碼 RNA[3]。越來越多的研究報道,lncRNA 可以作為競爭性內源RNA(competing endogenous RNA,ceRNA),與miRNA 的MRE 結合,保護目標mRNA 轉錄物不被降解。根據 ceRNA 理論,一些 lncRNA-miRNA-mRNA 網絡已經在一些人類腫瘤中被發現,包括卵巢癌、肺腺癌和頭頸鱗癌[4-6]。lncRNA-miRNA-mRNA 網絡的發現為我們進一步了解腫瘤的增殖和轉移提供了重要線索[7-9]。

腎癌是泌尿系統腫瘤中發病率最高的腫瘤之一。腎透明細胞癌(kidney renal clear cell carcinoma,KIRC)是腎癌中最常見的亞型,是一種惡性侵襲性腎癌,預后不良[10]。過去,人們一直致力于研究KIRC 生物標志物,以提高KIRC 患者的早期診斷和預后,但近年來研究的重點轉變為蛋白編碼基因或 miRNA[11-13]。有研究報道 lncRNA 在KIRC 中異常表達[14-15],但 lncRNA 在 KIRC 中的臨床意義和生物學作用尚未得到充分研究。

癌癥基因組圖譜(TCGA)數據庫為分析不同基因組改變的高通量數據提供了便利,包括非編碼RNA。本研究從TCGA 數據庫中獲取了KIRC 患者的 lncRNA、miRNA 和 mRNA 的表達譜,利用edgeR 工具包檢測 KIRC 中差異表達的 lncRNA、miRNA 和mRNA,通過權重基因共表達網絡分析(WGCNA)選擇與臨床信息相關的lncRNA 模塊。為了闡明lncRNA-miRNA-mRNA ceRNA 網絡中的交互作用,我們利用生物信息學分析預測了lncRNA-miRNA之間的相互作用,以及 miRNA-mRNA 之間的相互作用,同時利用TCGA KIRC 數據集和 KIRC 的臨床樣本,驗證了 lncRNA 在ceRNA網絡中的臨床意義。

1 材料與方法

1.1 TCGA KIRC 數據集 從TCGA 下載了mRNA表達芯片(72 個正常組織,539 個腫瘤組織)和miRNA 表達芯片(71 個正常組織,545 個腫瘤組織),網址為 https://portal.gdc.cancer.gov/,同時下載并提取 KIRC 患者相應的臨床信息。lncRNA表達譜的鑒定根據GENCODE 的注釋確定,網址為 http://www.gencodegenes.org。由于 TCGA數據(TCGA_KIRC_exp_HiSeqV2-2015-02-24)是公開的,我們的研究完全符合TCGA 提供的發布指南,因此不需要獲得當地倫理委員會的額外批準。

1.2 KIRC 中 差 異 表 達 的 mRNA、miRNA 和lncRNA的鑒定 使用 edgeR 工具包檢測 TCGA KIRC 數據集中差異表達的 mRNA、miRNA 和lncRNA[16],閾值設置為 log2(腫瘤組織/正常組織)≥2,偽發現率< 0.01。

1.3 權重基因共表達網絡構建 使用WGCNA R包把所有差異表達的lncRNA 納入權重基因共表達網絡分析[17],根據無尺度網絡分布,軟件自動篩選的軟閾值選擇與KIRC 患者臨床信息最相關的lncRNA 模塊進行進一步探討。

1.4 驗證lncRNA 的臨床作用 通過受試者工作特征(ROC)曲線評估所選模塊中所有lncRNA 的診斷效能,通過 Spearman 相關分析探討 lncRNA表達與臨床病理因素的關系,采用Kaplan-Meier法檢測這些lncRNA 的預后作用,并進行log-rank檢驗。我們還對這些lncRNA 進行了單因素和多因素Cox 回歸分析。雙側P<0.05 為差異有統計學意義。統計分析均采用 SPSS 13.0(SPSS Inc.,Chicago,IL,USA)軟件進行。

1.5 ceRNA 網絡構建 MiRcode 測定lncRNA-miRNA的相互作用,網址為 http://www.mircode.org/[18],從 miRTarBase、TargetScan、miRDB 中 檢 索 到miRNA的靶向 mRNA,網址分別為http://mirtarbase.mbc. nctu. edu. tw /、http://www. targetscan. org/vert_71/、http://www.mirdb.org/。利用 Cytoscape v3.6.1 構建 ceRNA 網絡并進行可視化[19]。

1.6 基于KIRC 的臨床樣本驗證ceRNA 網絡中的lncRNA 為了進一步驗證TCGA 數據庫中lncRNA的作用,利用RT-qPCR 檢測了臨床樣本中lncRNA的表達,收集 33 例 2018 年 1 月至 2018 年 7 月在皖南醫學院弋磯山醫院行無輔助治療的腎切除術(根治性或部分性)患者的癌組織和癌旁組織標本。本研究經皖南醫學院倫理委員會審核通過,并獲得所有參與者的知情同意。相對表達式計算使用 2ΔCT方法[ΔCT = CT(β-actin)-CT(目標基因)]。引物序列見表 1。配對t檢驗比較癌組織和癌旁組織lncRNA 的表達。

2 結果

2.1 KIRC 中差異表達的 lncRNA、miRNA 和mRNA 通過對lncRNA 表達譜的分析,共發現了1 821 個差異表達的lncRNA,其中包括1 211 個上調表達的 lncRNA 和 610 個下調表達的 lncRNA(圖1)。此外,我們還發現了27 個上調表達和29個下調表達的 miRNA,以及1 587 個上調表達和799 個下調表達的mRNA。

表1 引物序列

圖1 癌組織和癌旁組織中差異表達的lncRNAs

2.2 權重基因共表達網絡的構建和關鍵模塊的識別 為了得到差異表達的lncRNA 的功能簇,我們使用WGCNA 進行了基因共表達網絡分析,權重參數 β =3(scale-free R2= 0.95),最小模塊大小設定為30。共檢測到7 個模塊(圖2A),分別為藍色、棕色、綠色、灰色、紅色、藍綠色和黃色,這些模塊中 lncRNA 的數量分別為 109、90、57、154、41、361 和 89。如圖 2B 所示,藍色模塊與病理分期(cor= 0.314,P<0.01)、轉移(cor=0.224,P<0.01)、分級(cor= 0.396,P<0.01)相關性最好。

圖2 權重基因共表達網絡的構建和關鍵模塊的識別

2.3 藍色模塊中lncRNA 的臨床價值 如表2 所示,藍色模塊中有15 個lncRNA 的ROC 曲線下面積在0.9 以上,提示這些lncRNA 可能在KIRC 的發生中發揮了重要作用,并對KIRC 患者具有較高的診斷價值,lncRNA 和臨床病理之間的關系見表3。AC004817.3、AC009549.1、AC011352.1、AC011352.3、AC019069.1、AC114803.1、AC156455.1、AL161937.2、LINC00475、LINC01358、LINC01615、LUCAT1 和NPSR1-AS1 可以預測KIRC 患者病理分期為晚期分 期。AC004817.3、AC009549.1、AC011352.1、AC011352.3、AC019069.1、AC114803.1、AC156455.1、AL161937.2、AL355102.4、LINC00475、LINC01358、LINC01615 和 LUCAT1 可以辨別高病理分級的KIRC 患者。單因素 Cox 分析顯示,AC004817.3、AC009549.1、AC011352.1、AC011352.3、AC156455.1、AL161937.2、AL355102.4、LINC00475、LINC01615、LUCAT1、NPSR1-AS1 與 KIRC 患者的總體生存期相關,多因素 Cox 分析顯示,AL161937.2 和 LUCAT1 可能是 KIRC 的獨立預后指標(P= 0.032,P=0.019),見表 4。如圖 3A、3B 所示,Kaplan-Meier 分析顯示,高表達 AL161937.2 和 LUCAT1的KIRC 患者的總體生存期明顯低于低表達AL161937.2 和 LUCAT1 的 KIRC 患者(P均 <0.01)。

表2 具有KIRC 重要診斷價值的lncRNA 分析結果

表3 lncRNA 的表達與KIRC 的臨床病理因素的關系

2.4 ceRNA 網絡構建 通過MiRcode 一共預測到5 個靶向 AL161937.2 的 miRNA 和 39 個靶向 LUCAT1 的 miRNA。之后,我們根據 ceRNA 機制選擇了 6 個下調表達的 miRNA。通過 TargetScan、miRDB、miRTarBase 等工具進一步預測這 6 種miRNA 的39 個上調表達的靶基因。最后,我們使用 2 個 lncRNA、6 個 miRNA 和 39 個 mRNA 構建lncRNA-miRNA-mRNA ceRNA 網絡,見圖 4。

2.5 臨床樣本驗證ceRNA 網絡中lncRNA 的臨床意義 在 33 例配對的 KIRC 組織樣本中,AL161937.2 在癌組織中的平均表達水平(0.012±0.009)明顯高于其癌旁組織(0.004±0.002)(P<0.01,圖 5A),AUC 為 0.898(P< 0.01,圖5B)。LUCAT1 在癌組織中的平均表達水平(0.021±0.015)明顯高于其癌旁組織(0.006±0.004)(P<0.01,圖 5D),AUC 為 0.924(P<0.01,圖 5E)。如圖 5C 和 5F 所示,AL161937.2和LUCAT1 的高表達與KIRC 的晚期病理分期和病理高分級相關。

表4 單因素和多因素分析預測KIRC 患者的總體生存期

圖 4 lncRNA-miRNA-mRNA ceRNA 網絡

圖5 臨床樣本驗證ceRNA 網絡中lncRNA 的臨床意義

3 討論

已有報道稱lncRNA 在腎癌中異常表達,提示其可能作為癌基因或腫瘤抑制因子[20-21]。此外,也有研究表明,lncRNA 可能適用于KIRC 的診斷,甚至用于預測預后[22-23]。雖然在 KIRC 中有學者研究了單個lncRNA,但基于高通量RNA-seq 數據的研究鮮有報道。本研究利用TCGA 數據庫中的基因表達芯片對KIRC 的差異表達mRNA、miRNA和lncRNA 進行了鑒定,所有差異表達的lncRNA被用來構建權重共表達網絡,通過WGCNA 本研究共鑒定出7 個模塊。其中藍色模塊與腫瘤分期和分級的相關性最好,藍色模塊中的 109 個lncRNA,15 個 lncRNA 對 KIRC 的診斷價值極高,其AUC 均大于0.90。這些lncRNA 的表達與臨床病理因素之間的關系也通過Spearman 相關檢驗得到了驗證,進一步支持了WGCNA 的結果。此外,生存分析表明,AL161937.2 和 LUCAT1 是 KIRC 患者的獨立預后因子,提示其預后價值。

到目前為止,只有少數研究報道了lncRNA 與mRNA,或 lncRNA 與 miRNA 在 KIRC 中的相互作用,關于KIRC 中ceRNA 交互作用的研究報道更少。根據ceRNA 假說,本研究通過生物信息學分析預測了lncRNA-miRNA 相互作用和miRNA-mRNA相互作用,并且構建了一個包含 2 個 lncRNA(AL161937.2 和 LUCAT1)、6 個 miRNA 和 39 個mRNA 的 ceRNA 網絡。

LncRNA AL161937.2(也稱 LOC101927512),位于染色體20q13.13。雖然目前還沒有文獻報道,但本研究發現 AL161937.2 在臨床 KIRC 組織和TCGA KIRC 組織中均較正常組織有明顯上調。此外,AL161937.2 在本研究中被確定為KIRC 新的診斷和預后標志物?;趯?MiRcode 的預測,AL161937.2 有 3 個 MREs,可以與 5 個 miRNA 結合。在這些 miRNA 中,只有 hsa-miR-138-5p 在KIRC 組織中顯著下調[24]。有研究報道,hsa-miR-138-5p 的靶基因 VIM、TERT 和 ZEB2 在 KIRC組織中明顯上調[25-27],并且 VIM、TERT、ZEB2和hsa-miR-138-5p 之間的相互作用分別被Yamasaki等[28]、Zhang 等[29]和 Ding 等[30]證實。因此,本研究推測當 AL161937.2 高表達時,hsa-miR-138-5p會被抑制,導致在KIRC 中VIM、TERT 和ZEB2 的表達增加。

位于 5q14.3 號染色體的 LncRNA LUCAT1(肺癌相關轉錄1)在非小細胞肺癌中首次被發現[31]。最近,已有報道稱 LUCAT1 在某些腫瘤中發揮作用[32-33]。本研究發現 LUCAT1 在臨床 KIRC組織和TCGA KIRC 組織中均有上調,并與腫瘤進展相關,這與 Zheng 等[34]的報道一致。本研究通過MiRcode 預測了 39 個靶向 LUCAT1 的 miRNA,其中 hsa-miR-200c-5p、hsa-miR-506-5p、hsamiR-429、hsa-miR-363-5p、hsa-miR-141-5p 在TCGA KIRC 數據集中均有明顯的低表達[35-37]。已有研究報道,這些miRNA 的靶基因包括VEGFA、TIMP1 和 CXCL10 在 KIRC 中顯著上調[38-40]。此外,hsa-miR-200c-5p、hsa-miR-141-5p、hsa-miR-429、hsa-miR-200c-5p 與 VEGFA 的相互作用、hsa-miR-363-5p 與 TIMP1 的相互作用、hsamiR-200c-5p 與ZEB2 的相互作用已分別得到了前人研究的驗證[41-43]。這些結果表明,LUCAT1 可能與 hsa-miR-200c-5p、hsa-miR-506-5p、hsamiR-429、hsa-miR-363-5p 和 hsa-miR-141-5p產生競爭,從而調控 KIRC 中 VEGFA、TIMP1 和CXCL10 的表達。

在本研究中,我們利用TCGA KIRC 數據集中的大規模樣本,篩選到 2 個潛在的 KIRC 的 lncRNA 生物標志物,并通過 RT-qPCR 驗證了2 種lncRNA 在 KIRC 中的表達。更重要的是,我們構建了 lncRNA-miRNA-mRNA ceRNA 網絡,這為更好地理解KIRC 中的ceRNA 調控提供了新的視角。然而,我們的研究也有一些局限性。首先,我們在33 個臨床樣本中只驗證了2 個lncRNA 的表達,我們的研究結果是否可以推廣到一般人群還有待確定。其次,我們的研究并沒有驗證所有lncRNA與miRNA 之間的相互作用,lncRNA(AL161937.2和LUCAT1)在KIRC 中的功能作用還需要通過實驗進一步驗證。

猜你喜歡
共表達編碼病理
SO2引起巨峰葡萄采后落粒的共表達網絡和轉錄調控分析
UdhA和博伊丁假絲酵母xylI基因共表達對木糖醇發酵的影響
生活中的編碼
病理診斷是精準診斷和治療的“定海神針”
3例淋巴瘤樣丘疹病臨床病理分析
腫瘤病理:從檢查到報告
高世代回交玉米矮稈種質的轉錄組分析
《全元詩》未編碼疑難字考辨十五則
子帶編碼在圖像壓縮編碼中的應用
Genome and healthcare
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合