?

基于4個自噬相關LncRNA表達信息學分析構建肺鱗癌預后風險評分模型

2023-12-14 13:08吳瑤何杰張維
青島大學學報(醫學版) 2023年5期
關鍵詞:鱗癌引物肺癌

吳瑤,何杰,張維

(成都醫學院第一附屬醫院呼吸與危重癥醫學科,四川 成都 610500)

肺鱗狀細胞癌(肺鱗癌)屬于肺癌常見的病理亞型之一[1-2]。雖然近年來對于肺鱗癌病人的治療取得了較大進步,但病人的5年生存率仍然沒有超過20%[3-4]。構建一種新的并且有效的預測模型將有助于肺鱗癌病人的預后判斷和個體化治療。自噬是真核生物進化中一種高度保守的生物學過程[5],自噬和自噬相關基因的調節在腫瘤的發生發展中發揮著重要作用[6]。YANG等[7]對人體肝癌組織和正常肝臟組織對比研究發現,HOX轉錄物反義RNA(HOTAIR)在肝癌組織中表達量顯著高于正常肝組織,并且同時伴隨著自噬基因的高表達,提示在腫瘤細胞中,自噬的強化可能與基因自噬相關長鏈非編碼RNA(LncRNA)過度表達密切相關。高德軍等[8]研究表明,LncRNA可通過靶向調節miR-140-5p促進肺癌細胞的增殖和自噬,抑制凋亡。鑒于LncRNA在肺癌自噬中的重要作用,推測自噬相關LncRNA可能可以作為肺鱗癌的預后標志物。本文旨在用生物信息學方法研究自噬相關LncRNA對肺鱗癌的預后價值并構建預后模型,為肺鱗癌病人的預后評估提供一定參考。

1 資料和方法

1.1 研究對象

從癌癥基因組圖譜(TCGA)官方網站(網址為https://gdc-portal.nci.nih.gov/)下載肺鱗癌病人腫瘤組織和癌旁組織的mRNA測序數據及臨床信息。通過Illumina高通量測序平臺獲得mRNA測序數據。下載的數據內容包含肺鱗癌病人502例腫瘤組織的mRNA表達數據和49例癌旁正常組織的mRNA表達數據。臨床數據包含病人的ID號、年齡、性別、病理分期、生存時間、生存狀態等,為了減少統計學誤差,剔除生存時間少于30 d的病人信息,最終納入482例肺鱗癌病人。

1.2 自噬相關LncRNA的提取

從HADb(http://autophagy.lu/)數據庫中獲得自噬基因232個,通過ActivePerl軟件(版本號5.26)提取232個自噬基因在TCGA的表達譜并分類出LncRNA表達譜。使用R軟件中的“Limma”包(https://www.R-project.org)對mRNA測序表達值進行log2轉換,以|log2(fold change)|>1.5和偽發現率(FDR)<0.05為閾值,對數據進行歸一化和差異表達基因分析。對篩選出的差異表達的自噬基因進行聚類分析,并繪制熱圖。使用R軟件中的“corrplot”包篩選出與自噬基因相關的LncRNA,閾值設定為相關系數(r)絕對值>0.5和P<0.05。

1.3 實驗驗證

1.3.1標本來源 隨機選取成都醫學院第一附屬醫院2016年3月-2019年7月收治的50例肺鱗癌病人手術切除的癌組織及其對應的癌旁正常組織樣本,術后病理結果均證實為肺鱗癌。所有的組織樣本獲取均由病人或家屬簽署知情同意書,并獲得成都醫學院第一附屬醫院倫理委員會批準。

1.3.2引物設計和合成 所有引物的設計和合成均由杭州齊步生物工程(浙江)股份有限公司完成,以GAPDH為內參基因,引物及其序列見表1。

表1 4個LncRNA和GAPDH基因的引物序列

1.3.3實時定量PCR檢測RNA 按照PCR試劑盒使用說明書方法提取組織內總RNA并逆轉錄為cDNA,應用SYBR?Premix Ex TaqTM10 μL進行RT-qPCR,反應在ABI 8000實時定量PCR儀進行,以GAPDH為內參,上游引物(10 μmol/L)、下游引物(10 μmol/L)均0.4 μL,cDNA 1 μL,RNase Free Water 8.4 μL。反應條件設定為:95 ℃預變性30 s;95 ℃、5 s,60 ℃、34 s,共40個循環;60 ℃退火30 s。以2-△△ct表示RNA的相對表達量。

1.4 統計學分析

2 結 果

2.1 納入病人的基本情況

符合納入標準的肺鱗癌病人482例,其中男347例,死亡235例;女135例,死亡94例。肺鱗癌死亡病人平均年齡(68.7±6.9)歲,未死亡病人平均年齡(65.4±8.5)歲,兩組年齡比較差異無顯著性(t=1.79,P>0.05)。病理分期Ⅰ、Ⅱ期與Ⅲ、Ⅳ期病人數比較(χ2=3.64,P<0.05)、有無化療病人例數比較(χ2=6.62,P<0.05)、生存時間比較(t=2.98,P<0.05)差異均有顯著性。見表2。

表2 從TCGA數據庫中下載納入分析的肺鱗癌病人的基本特征(n=482)

2.2 肺鱗癌組織和正常肺組織中差異表達的自噬基因

對502例肺鱗癌病人腫瘤組織和49例癌旁正常肺組織的自噬基因差異分析顯示,滿足條件的自噬基因共有30個。對這些基因進行聚類分析,并繪制熱圖(圖1),結果顯示高表達基因有20個,低表達基因10個。

N:正常組織;T:肺鱗癌組織。

2.3 自噬相關LncRNA的確定

通過Perl軟件共提取出14 142個LncRNA,根據篩選條件,獲得自噬相關LncRNA有89個,結合TCGA來源對應的臨床信息,通過單因素Cox回歸分析,初步篩選出與肺鱗癌預后相關的LncRNA有16個;通過LASSO回歸分析進一步確定了4個關鍵的自噬相關LncRNA,它們分別是AL365356.4、AC012181.1、AL390719.2、AC245060.2。4個自噬相關LncRNA的詳細信息見表3。

表3 4個自噬相關LncRNA的詳細信息

2.4 肺鱗癌預后風險評分模型構建和評價

基于LASSO回歸分析確定的4個自噬相關LncRNA構建預后風險評分模型,其風險評分=0.26×AC245060.2+0.18×AL390719.2+0.23×AC012181.1+0.21×AL365356.4。K-M生存分析顯示,低風險組與高風險組生存曲線存在差異,低風險組生存率較高(χ2=15.267,P<0.05)(圖2A)。ROC曲線分析顯示,3、5年AUC分別為0.746和0.743(圖2B)。同時,高風險組病人4個LncRNA呈現更高的表達水平(圖3A);風險評分分布及風險評分與生存時間的關系分析提示高風險組病人總生存時間更短(圖3B、C)。以總生存時間為因變量,預后模型所計算的風險評分、年齡、性別、病理分期作為協變量進行多因素Cox回歸分析,結果表明風險評分可以作為獨立的預后預測因子(HR=2.100,95%CI=1.541~2.861,P<0.01)。見圖4。

A:高風險和低風險病人的生存分析圖;B:預后模型的3年和5年ROC曲線。

A:高風險和低風險肺鱗癌病人AL365356.4、AC012181.1、AL390719.2、AC245060.2的表達譜熱圖;B:高風險病人和低風險病人的風險評分分布;C:高風險病人和低風險病人的生存狀態分布。

圖4 多因素Cox回歸分析森林圖

2.5 基礎實驗驗證結果

納入肺鱗癌病人50例,男35例,女15例;年齡28~76歲,中位年齡47歲;TNM分期Ⅰ期20例,Ⅱ期15例,Ⅲ期10例,Ⅳ期5例。RT-qPCR檢測顯示,肺鱗癌組織AC245060.2表達水平為3.391±0.275,正常組織0.692±0.016,兩組比較差異有顯著性(t=69.28,P<0.05);肺鱗癌組織AL390719.2表達水平為1.842±0.054,正常組織0.061±0.021,兩組比較差異有顯著性(t=17.35,P<0.05);肺鱗癌組織AC012181.1表達水平為0.867±0.179,正常組織0.117±0.061,兩組比較差異有顯著意義(t=28.04,P<0.05);肺鱗癌組織AL365356.4表達水平為4.786±0.681,正常組織1.064±0.231,兩組比較差異有顯著性(t=36.59,P<0.05)。

3 討 論

LncRNA為一種轉錄本長度大于200個核苷酸的非編碼RNA,缺乏完整的特異性開放閱讀框,且無編碼蛋白質的功能[9-10]。大量研究結果表明,LncRNA可以通過組蛋白修飾、染色質重塑、RNA代謝等諸多生物學過程,在表觀遺傳、轉錄以及轉錄后水平調控自噬基因的表達[11]。LncRNA可以發揮內源性miRNA海綿功能與miRNA相互作用,參與對自噬基因的表達調控;同時,miRNA也可以通過RNA誘導沉默復合物調控LncRNA發揮生物學功能,兩者又可競爭結合mRNA,共同參與腫瘤的發生和發展過程[12-13]。

目前,許多證據表明LncRNA的過表達、缺失或是突變可以通過調控腫瘤的自噬基因而對腫瘤的惡性生物行為產生驅動作用。對長鏈非編碼肺癌轉移相關轉錄本1(LncRNA MALAT-1)的研究顯示,LncRNA MALAT-1下調可以抑制自噬活性,從而抑制A549肺癌細胞的增殖和擴增,促進肺癌細胞的凋亡。此外,一些異常的LncRNA也與肺癌的不良預后密切相關,有研究表明,LncRNA肌動蛋白纖維相關蛋白1-反義RNA1(AFAP1-AS1)在非小細胞肺癌組織中的表達量升高,且高表達AFAP1-AS1的肺癌病人更容易出現淋巴結轉移,總生存時間更短[14]。盡管目前關于LncRNA在肺癌自噬中的研究已有很多,但多數是單個LncRNA對自噬的調節作用,范圍較局限,自噬相關LncRNA在肺鱗癌中的作用和機制以及在臨床預后評估中的應用仍然有待進一步探索。

本研究通過檢索在線數據庫,下載肺鱗癌自噬相關LncRNA表達數據和病人的臨床特征,通過生物信息分析發現,在肺鱗癌中有許多自噬基因相關的LncRNA的表達發生了異常改變,這些基因可能與肺鱗癌的發生、進展以及預后相關。本文初步篩選出了自噬基因相關的LncRNA有89個;進一步進行單因素Cox回歸分析,共篩選出16個自噬相關LncRNA和臨床預后密切相關。但單因素Cox回歸分析每次僅納入一個變量,可能存在過度擬合的現象,因此本文再次引入LASSO回歸分析進行降維。LASSO回歸分析的特點是在擬合廣義線性模型的同時進行變量篩選和復雜度的調整,有選擇性地把變量放入模型以得到更好性能參數,并通過一系列的參數控制模型的復雜度,從而避免產生過度擬合,這樣很好地彌補了單因素Cox回歸分析的不足。本文通過LASSO回歸分析,最終確定了4個關鍵的自噬相關LncRNA構建模型,該模型可區分高風險組和低風險組的病人,而且預測性能較好。最后,多因素Cox回歸分析顯示,風險評分和預后相關,且具有預測獨立性。為了更進一步驗證模型中的4個LncRNA的臨床意義,本研究收集了50例肺鱗癌病人的腫瘤組織標本,檢測其LncRNA的表達量,結果顯示上述4個LncRNA在肺鱗癌組織中的表達水平均高于正常組織,提示這4個自噬相關LncRNA高表達病人可能預后更差。

遺憾的是,雖然本研究結果顯示模型中的4個LncRNA與肺鱗癌預后密切相關,且風險評分可以作為獨立的預后因子,但是目前尚缺乏其臨床研究或者基礎實驗研究,它們在肺鱗癌發生中的作用機制仍不清楚,有待進一步探索。另外,本研究采用的生物信息分析的方法和工具較多,利用系統的方法處理大量的數據是其優勢,但仍然存在一定的不足之處:①大部分數據均來自于TCGA數據庫,未通過其他數據庫如GEO驗證;②預后風險評分模型僅納入了自噬相關LncRNA表達水平,未考慮其他基因改變,如小RNA、環狀RNA等表達水平改變對預后的影響。在下一步研究中,我們將結合自己的驗證數據和隨訪信息開展更為深入的生物學水平的機制研究;同時,考慮納入更多可能影響臨床預后的因素,如吸煙情況、其他非編碼RNA表達水平等,以期構建更為穩定和可靠的預后模型。

綜上所述,本研究通過分析TCGA數據庫信息,構建了一個基于4個自噬相關LncRNA的肺鱗癌預后模型,該模型為肺鱗癌預后的評估提供了有意義的參考。

猜你喜歡
鱗癌引物肺癌
中醫防治肺癌術后并發癥
DNA引物合成起始的分子基礎
高中生物學PCR技術中“引物”相關問題歸類分析
對比增強磁敏感加權成像對肺癌腦轉移瘤檢出的研究
SSR-based hybrid identification, genetic analyses and fingerprint development of hybridization progenies from sympodial bamboo (Bambusoideae, Poaceae)
惡性胸膜間皮瘤、肺鱗癌重復癌一例
基于深度學習的宮頸鱗癌和腺鱗癌的識別分類
火炬松SSR-PCR反應體系的建立及引物篩選
microRNA-205在人非小細胞肺癌中的表達及臨床意義
基于肺癌CT的決策樹模型在肺癌診斷中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合