?

卵巢透明細胞癌特征生物標志物及免疫浸潤分析

2024-02-06 07:08趙軒宇
現代婦產科進展 2024年2期
關鍵詞:性癌標志物卵巢

趙軒宇,姜 艷,隋 峰

(首都醫科大學附屬北京婦產醫院/北京婦幼保健院,北京 100026)

卵巢透明細胞癌(ovarian clear cell carcinoma,OCCC)是一種罕見且特殊病理類型的卵巢上皮性癌,約占所有卵巢癌的10%[1-2]。與其他卵巢惡性腫瘤相比,早期OCCC患者預后良好,但由于其具有固有化療耐藥性及對放化療反應性更低的特點,晚期或復發患者的預后更差[3-4]。區別于其他卵巢上皮性癌,OCCC具有獨特的臨床病理特征和分子生物學差異[1,5-6]。其他卵巢上皮性癌,如子宮內膜樣癌或高級別漿液性癌均有合適的特異性標志物,但目前沒有發現OCCC的特異性生物標志物。已知的肝特異性轉錄因子1β(hepatocyte nuclear factor 1 beta,HNF-1β)和酸性核心酶(napsinA)可作為OCCC輔助診斷指標,但其準確性及臨床價值仍需進一步研究[7-9]。近年來,隨著微陣列技術及生物信息學的發展使疾病相關基因的鑒定更方便。本研究通過搜集OCCC相關基因表達數據,通過機器學習方法篩選其特征生物標志物,并將其與免疫細胞浸潤相關性進行分析,以獲得更有效地區分OCCC與其他病理類型上皮性卵巢癌的特征生物標志物。

1 材料與方法

1.1 數據下載 從GEO(http://www.ncbi.nlm.nih.gov/geo/)數據庫下載GSE6008和GSE29175數據集相關文件[10-11]。GSE6008數據集包含99個卵巢上皮性癌樣本。所有樣本在Affymetrix HG_U133A陣列上進行分析。此外,應用GSE29175數據集作為驗證隊列對差異表達基因及ROC曲線進行驗證。GSE6008和GSE29175數據集詳細信息,見表1。

表1 GSE6008和GSE29175數據集樣本信息[n(%)]

1.2 差異表達基因篩選 使用R中的“limma”軟件包進行差異表達分析(http://www.bioconductor.org/)。根據校正后的P<0.05和差異倍數對數的絕對值>1來確定差異表達基因(differential expression genes,DEGs)[12]。

1.3 DEGs的富集分析 使用R中的各種軟件包進行富集分析以深入了解DEGs相關的生物學功能和通路。包括使用“ClusterProfiler”軟件包進行基因本體論(Gene Ontology,GO)、京都基因和基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)的富集分析[13-15]。

1.4 候選診斷生物標志物的篩選 采用兩種機器學習算法分析OCCC與其他卵巢惡性腫瘤之間的潛在特征。使用最小絕對值收縮與選擇算子(least absolute shrinkage and selection operator,LASSO)和支持向量機遞歸特征消除(support vector machines-Recursive feature elimination,SVM-RFE)方法篩選候選基因。在R中使用“glmnet”軟件包實現的LASSO回歸算法用于識別與OCCC和對照樣本顯著差別的基因。SVM-RFE是一種基于支持向量機算法的特征選擇方法[16]。該方法通過迭代的方式逐步剔除最不重要的特征,直到達到所需的特征數量為止。通過應用這兩種機器學習算法,識別出與OCCC相關的候選特征基因,并在GSE29175數據集中驗證候選特征基因的表達水平。

1.5 候選生物標志物的診斷價值驗證 為了評估候選生物標志物的預測價值,使用GSE6008數據集的mRNA表達數據構建了受試者工作特征曲線(receiver operating characteristic,ROC)。ROC曲線下面積(area under curve,AUC)用于評估生物標志物的診斷效果。此外,使用GSE29175數據集對生物標志物診斷效果進行驗證。P<0.05為差異有統計學意義。

1.6 免疫細胞亞型的鑒定 CIBERSORT(https://cibersortx.stanford.edu/)生物信息學算法定量評估OCCC樣本中免疫細胞浸潤的相對比例以及與對照組之間免疫浸潤情況的差異。CIBERSORT是一種基于基因表達數據的免疫細胞組成解析工具,可分析復雜的混合細胞樣本中各種免疫細胞亞型的相對豐度[17]。通過R軟件中的“corrplot”軟件包對免疫細胞浸潤情況進行相關性分析和可視化。通過R軟件中的“vioplot”軟件包生成小提琴圖,以展示OCCC和對照樣本之間免疫細胞亞型浸潤差異情況。

1.7 統計學處理 使用R軟件(版本4.2.1)。對于連續型變量,正態分布變量采用Studentt檢驗,異常分布變量采用Mann-WhitneyU檢驗。使用“glmnet”軟件包進行LASSO回歸分析,并在R中使用了e1071軟件包進行SVM算法分析。使用ROC曲線分析評估候選特征生物標志物基因的診斷效能。使用Spearman相關性分析研究特征生物標志物與浸潤免疫細胞之間的關系。雙側檢驗,P<0.05為差異有統計學意義。

2 結 果

2.1 篩選差異表達基因 在GSE6008數據集8個OCCC樣本與91個其他病理類型的卵巢上皮性癌樣本之間,共篩選出18個差異表達基因,其中包括16個顯著上調基因和2個顯著下調基因(圖1A、B)。

2.2 差異基因GO、KEGG富集分析 GO分析結果顯示,差異基因在生物過程方面主要在鈉離子跨膜轉運及相關蛋白活性的正調控、細胞衰老、軟骨細胞發育中顯著富集。在細胞組分層面差異基因主要存在于鈉-鉀交換ATP酶復合物,溶酶體膜胞質側以及微絨毛膜中,但富集不顯著。差異基因的分子功能涉及糖胺聚糖結合、氧化還原酶活性、脂肽結合、硫氨基酸跨膜轉運蛋白活性以及受體配體活性,但同樣富集不顯著。KEGG富集分析結果顯示,在甲狀腺激素合成、蛋白質消化吸收、組氨酸代謝以及近端小管碳酸氫鹽回收顯著富集,見表2。

表2 差異基因GO及KEGG富集分析結果

2.3 特征生物標志物的篩選及驗證 通過兩種機器學習的方法共同篩選OCCC的候選特征生物標志物。通過LASSO回歸算法篩出了4個OCCC特征基因(圖2A)。通過SVM-RFE算法篩選出了16個OCCC特征基因(圖2B)。將兩種算法取得的特征基因取交集,共獲得了4個特征基因,分別為PTHLH、FXYD2、EEF1A2和GLRX(圖2C)。

圖2 兩種機器學習算法篩選特征基因

在GSE29175數據集(驗證組)中,分析4個特征基因在OCCC及非OCCC表達水平差異。結果發現,與非OCCC比較,FXYD2基因在OCCC中顯著高表達,差異有統計學意義。PTHLH、EEF1A2和GLRX基因在OCCC與非OCCC中表達量無明顯差異。見圖3。故將FXYD2基因作為OCCC與非OCCC之間鑒別的特征生物標志物,并用后續實驗檢驗其診斷價值。

圖3 在GSE29175數據集中四種特征生物標志物在OCCC與非OCCC間表達水平差異

2.4 特征生物標志物診斷價值的評估及驗證 在GSE6008數據集中,FXYD2基因ROC曲線的AUC為0.999(95%CI為0.992~1),而在GSE29175數據集中,AUC為0.957(95%CI為0.883~1),見圖4。

圖4 FXYD2的ROC曲線

2.5 免疫細胞浸潤分析 通過CIBERSORT算法分別計算出不同免疫細胞在OCCC組及非OCCC組浸潤分數并進行比較,見圖5A。結果發現,與其他病理類型卵巢癌相比,OCCC中靜息肥大細胞免疫浸潤程度明顯升高,差異有統計學意義。對22種免疫細胞進行相關性分析,結果顯示靜息肥大細胞與激活肥大細胞呈顯著負相關,與γδT細胞及幼稚B細胞呈正相關,見圖5B。

圖5 OCCC與非OCCC免疫細胞浸潤及免疫細胞間相關性分析

2.6 特征生物標志物與免疫細胞浸潤相關性分析 FXYD2基因與嗜酸性粒細胞呈弱正相關(R=0.2,P=0.043),與T細胞CD4記憶激活(R=-0.24,P=0.016)、巨噬細胞M0(R=-0.22,P=0.026)呈弱負相關,見表3。

表3 FXYD2基因與免疫細胞相關性分析

3 討 論

OCCC在大多數情況下可以靠特殊形態學特征診斷,但一些具有分泌特征的子宮內膜樣癌或漿液性癌在形態上與OCCC極其相似。在這種復雜的情況下,免疫組化在OCCC的鑒別診斷中起了重要作用。在其他卵巢上皮性癌中常常存在特征性的改變,如高級別漿液性癌中常出現的BRCA或TP53突變,染色體不穩定或復雜核型[18]。SALL4是卵黃囊腫瘤和無性細胞瘤的標志物。但根據現有研究結果,并未發現特異性OCCC生物標志物,PIK3CA的激活突變僅發生在33%的OCCC病例[19-21]。既然OCCC可表現出區別于其他卵巢上皮性癌的形態學特征和生物學特性,而且不同器官來源的透明細胞癌分子遺傳改變相似,推測其可能擁有特征性生物標志物尚未被發現。本研究通過生物信息學方法,分析篩選OCCC的特征標志物并對其診斷效能進行驗證,之后再通過CIBERSORT算法比較OCCC與非OCCC之間免疫細胞浸潤之間的關系,并分析特征標志物與免疫細胞之間的相關性。

將OCCC與非OCCC進行對比,共篩選出16個顯著上調基因和2個顯著下調基因。富集分析結果顯示,這些差異表達基因主要在鈉離子跨膜轉運、細胞衰老等方面富集,表明OCCC的腫瘤離子微環境可能區別于其他卵巢上皮性癌。通過LASSO回歸和SVM-RFE兩種機器學習算法以及通過驗證組驗證后篩選出FXYD2基因作為特征生物標志物。ROC曲線結果表明,FXYD2基因具有良好區分OCCC與非OCCC的能力。FXYD2基因位于染色體11q23,FXYD2蛋白是Na/K-ATP酶的γ亞基,起到酶活性調節作用[22-23]。Na+/K+-ATP酶是一種由α、β和γ亞基組成的寡聚跨膜蛋白,在上皮細胞中高度表達,在腎臟中發揮重要作用[24]。Na+/K+-ATP酶活性是維持膜電位穩態所必需的,并與許多細胞功能和特定疾病的發病機制有關[25]。既往研究在許多癌癥中均發現了Na+/K+-ATP酶上調[26-28]。研究發現,強心苷類,即Na+/K+-ATP酶抑制劑,具有很強的抗腫瘤活性[29-30]。Na+/K+-ATP酶活性或表達的降低也會抑制癌癥細胞的增殖和存活[31]。然而,Na+/K+-ATP酶在腫瘤發生中的作用機制尚不清楚。通過CIBERSORT算法分析OCCC與非OCCC之間免疫細胞浸潤差異,結果發現OCCC中靜息肥大細胞免疫浸潤程度顯著升高,且靜息肥大細胞與激活的肥大細胞呈顯著負相關??赡芴崾久庖呦到y在OCCC的發生發展中起到了重要作用。因肥大細胞參與了調節炎癥和過敏反應,靜息狀態下肥大細胞浸潤程度顯著增加提示OCCC有發生嚴重炎癥反應或過敏反應的基礎[32]。FXYD2基因與嗜酸性粒細胞顯著正相關(R=0.2,P=0.043),與T細胞CD4記憶激活(R=-0.24,P=0.016),巨噬細胞M0(R=-0.22,P=0.026)呈顯著負相關。雖然P值均為顯著,但R值均為弱相關。嗜酸性粒細胞是白細胞的一種,常常在過敏反應,寄生蟲感染或霍奇金淋巴瘤,急性髓系白血病等病理狀態下呈免疫浸潤增高[33]。表明異常的炎癥反應或過敏反應在OCCC與非OCCC之間可能存在差異。此外,T細胞CD4記憶激活是指在第一次遭遇特定抗原后,部分CD4 T細胞會轉化為記憶T細胞[34]。當再次遇到相同抗原時,記憶T細胞會迅速被激活,并產生大量的效應分子,從而加強免疫應答。記憶T細胞的激活可導致多種效應,包括促進B細胞分化為抗體產生的漿細胞、促進CD8 T細胞的活化和細胞毒作用,以及調節其他免疫細胞的活性[35]。記憶T細胞的存在使得體內對抗原的再次暴露時,免疫應答更迅速和更有效。巨噬細胞M0是一類成熟的巨噬細胞前體細胞,處于靜止狀態且能主動調節免疫應答。當M0受到激活信號后,會發生極化分化,分化為巨噬細胞的不同類型,如M1和M2型[36]。FXYD2基因與T細胞CD4記憶激活,巨噬細胞M0呈負相關,表明與非OCCC相比,OCCC在抗原識別、免疫應答等多個免疫環節可能存在抑制。

本研究存在一定的局限性,利用公共數據進行回顧性研究,FXYD2基因高表達以及免疫細胞浸潤的差異僅可能是OCCC在基因水平或免疫細胞水平上的特征,仍需臨床樣本驗證其真實性及有效性。

綜上所述,FXYD2基因高表達可能作為OCCC的特異性標志物之一。與其他卵巢惡性腫瘤相比,OCCC的細胞特征和表達模式可能具有獨特性,其中FXYD2高表達可能是其識別和鑒別的重要特征之一。與非OCCC相比,OCCC可能存在異常的炎癥反應以及細胞免疫及體液免疫相關抑制。

猜你喜歡
性癌標志物卵巢
保養卵巢吃這些
卵巢多囊表現不一定是疾病
乳腺腺樣囊性癌1例
SRSF2、HMGA2和Caspase-3在卵巢高級別漿液性癌及其前驅病變中的表達及意義
如果卵巢、子宮可以說話,會說什么
294例老年人腺樣囊性癌的統計學分析
膿毒癥早期診斷標志物的回顧及研究進展
冠狀動脈疾病的生物學標志物
卵巢上皮性癌組織中PITX2和β-catenin蛋白的表達
腫瘤標志物在消化系統腫瘤早期診斷中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合