?

基于WES 識別中國人群甲狀腺乳頭狀癌新易感基因變異EPB41L4A rs1455421289

2024-01-12 06:15關煦慧子趙艷陽
檢驗醫學 2023年11期
關鍵詞:等位基因甲狀腺癌變異

閆 安 關煦慧子 蔚 田 繆 剛 趙艷陽

(1.北京醫院/北京老年醫學研究所 國家老年醫學中心,北京 100730;2.北京醫院普通外科,北京 100730)

近年來,我國甲狀腺癌的發病率呈快速升高趨勢,2017年新增的患者例數已居全球甲狀腺癌新增患者例數首位[1-2]。目前,甲狀腺癌的診斷主要依靠B超引導下甲狀腺穿刺活檢,但其存在明顯不足:1)屬于有創檢查,且穿刺覆蓋面有限,易漏診;2)主要針對>1 cm的結節[3],不適用于早期診斷;3)僅可獲取微量細胞,準確診斷需要經驗豐富的影像學和病理學醫師,基層醫療機構難以開展。因此,尋找適用于甲狀腺癌早期篩查的特異性生物標志物是目前亟待解決的問題。識別新的甲狀腺癌易感基因可以為尋找早期篩查甲狀腺癌高危人群的生物標志物提供依據。甲狀腺乳頭狀癌(papillary thyroid carcinoma,PTC)遺傳病因學研究發現,PTC發病具有較強的家族遺傳傾向[4-8]和高遺傳異質性[5]。家族性PTC占甲狀腺癌總發病的5%~10%[9]。大型流行病學研究結果提示甲狀腺癌患者的一級親屬是該病的高發人群[4,10],一級親屬的患病風險較對照者高6.8倍[4],其中雙胞胎同胞的患病風險比對照者高23倍[10]。

目前,國內外學者相繼完成了7項甲狀腺癌全基因組關聯研究(genome-wide association study,GWAS),并在人類基因組中定位了28個PTC風險位點,如位于紅細胞膜蛋白帶4.1樣4A(erythrocyte membrane protein band 4.1 like 4A,EPB41L4A)基因非編碼區的rs73227498位點[11]。GWAS結果提示與這些風險位點連鎖的基因中可能存在PTC的易感基因變異。為驗證這一推測,本研究擬對我國500例無血緣關系的散發PTC患者的外周血白細胞基因組DNA進行全外顯子組測序(whole exome sequencing,WES),靶向分析GWAS定位的28個候選基因的蛋白編碼區和側翼選擇性剪接位點序列中潛在影響蛋白編碼的罕見變異,并利用多個大型非腫瘤對照人群的高質量基因分型數據進行病例-對照關聯分析和變異的功能研究,識別中國人群PTC的新易感基因變異,為尋找可用于甲狀腺癌早期篩查且易于檢測的特異性生物標志物提供依據。

1 材料和方法

1.1 研究對象

選取2018—2020年北京醫院行手術治療的286例PTC患者,其中男81例、女205例,年齡21~80歲,用于識別PTC候選基因的變異位點。另選取2021—2022年北京醫院行手術治療的214例PTC患者,其中男73例、女141例,年齡25~83歲,用于驗證變異位點的突變頻率。500例PTC患者均為散發的、無血緣關系的中國漢族人,其中56例僅有頸部淋巴轉移,70例僅有甲狀腺外侵襲,66例同時有頸部淋巴轉移和甲狀腺外侵襲。納入標準:1)術后經病理學檢查確診為PTC;2)能夠獲取外周血白細胞計數結果和甲狀腺癌組織、癌旁組織。排除標準:1)伴有其他部位、其他類型的原發性惡性腫瘤;2)有血緣關系的PTC患者。對照人群的基因分型數據均來自公共數據庫的高質量WES和全基因組測序數據,包括gnomAD數據庫和TOPMed數據庫(包含多人種非腫瘤人群數據)和ChinaMAP數據庫、HUABIAO數據庫(包含非腫瘤中國人群的數據)。本研究經北京醫院倫理委員會批準(2021BJYYEC-044-02),所有研究對象均知情同意。

1.2 候選基因

GWAS定位的28個PTC候選基因[12-18]為:ARSB、BATF、DIRC3、EPB41L4A、FHIT、FOXA2、FOXE1、GALNT18、HTR1B、IMMP2L、INSR、MBIP、MSRB3、NKX2-1、NREP、NRG1、PCNX2、PTCSC3、RARRES1、SEPTIN11、SLC8B1、SMAD3、SNAPC4、SPATA13、STN1、TERT、VAV3和WDR11。

1.3 方法

采集所有患者外周靜脈血2 mL,室溫條件下離心分離白細胞。采用酚-氯仿法抽提白細胞DNA。采用TRIzol試劑(美國Invitrogen公司)提取外周血白細胞和癌組織、癌旁組織的總RNA。取1 μg白細胞基因組DNA,采用SureSelect Human All Exon V6 and V8試劑盒(美國安捷倫公司)建庫,在Novaseq S6000高通量測序平臺(美國Illumina公司)進行150 bp雙端測序。原始測序數據經質控篩選,采用BWA(ver 0.7.15-r1140)軟件與人類基因組參考序列GRCh37進行比對,由ANNOVAR分析軟件完成變異注釋。隨后靶向分析28個PTC關聯基因的蛋白編碼區及其側翼選擇性剪接序列,篩選出符合下列條件的變異:1)人群中變異頻率<0.1%;2)物種間高度保守;3)生物信息學預測存在損傷蛋白結構和/或功能的單核苷酸變異和微小缺失/插入變異。各物種的蛋白氨基酸序列下載自美國國立生物技術信息中心(the National Center for Biotechnology Information,NCBI)數據庫,采用Cluster 3.0軟件進行氨基酸同源比對分析。

采用等位基因特異性定量聚合酶鏈反應(allele-specific quantitative polymerase chain reaction,AS-qPCR)檢測PTC患者組織或白細胞mRNA 中候選變異的等位基因表達情況,以管家基因EIF4H作為內參。EPB41L4Ars1455421289變異的等位基因特異性引物:野生型等位基因上游引物為5'-GACCACGTATTCCATCACGTAAACCTTGTGGAGATCG-3',下游引物為5'-CCAAAATACAAAGTATATGGAGGTCCAGTGTTGA-3';突變型等位基因上游引物為5'-GACCACGTATTCCATCACGTAAACCTTGTGGAGATCC-3',下游引物為5'-GACGGCCCTGAAGGACATCTTGCT-3'。

采用AS-qPCR檢測所有患者外周血白細胞基因組DNA 中候選變異野生型和突變型等位基因的拷貝數變化。以單拷貝基因FOXP2的DNA拷貝數作為內參。EPB41L4Ars1455421289變異的等位基因特異性引物:野生型等位基因上游引物為5'-GACCACGTATTCCATCACGTAAACCTTGTGGAGATCC-3',突變型等位基因上游引物為5'-GACCACGTATTCCATCACGTAAACCTTGTGGAGATCG-3',共用的下游引物為5'-CCACCTAAAACCATATCAGGAAAAGCCAGAG-3'。

1.4 統計學方法

采用SPSS 16.0軟件進行統計分析。通過病例-對照關聯檢測評估變異位點對PTC發病風險的影響,采用比值比(odds ratio,OR)值和95%可信區間(confidence interval,CI)表示風險程度。采用Fisher精確檢驗比較2個組之間變異攜帶頻率的差異。采用Mann-WhitneyU檢驗比較變異等位基因表達和基因組拷貝數變化。以P<0.05為差異有統計學意義。

2 結果

2.1 WES結合靶向分析識別PTC的候選變異

WES的測序深度為97.74×~269.96×,平均測序深度為126.50×。有97.85%的堿基測序深度>10×。靶向分析共發現121個發生在蛋白編碼區的單核苷酸變異,未發現微小缺失/插入變異。位于EPB41L4A基因上的2個極罕見錯義突變[rs1455421289位點c.163G>C:p.D55H(chr5:112307427,NM_001347887.2)和rs761977647位點c.855G>C:p.W285C(chr5:111576448,NM_001347887.2)]潛在影響了編碼蛋白的功能。rs1455421289是EPB41L4A基因蛋白編碼序列上第165位G到C的堿基突變,該堿基轉換導致第55位的天冬氨酸轉變為組氨酸。rs761977647是EPB41L4A基因蛋白編碼序列上第855位G到C的堿基變異,該堿基轉換導致蛋白第285位的色氨酸突變為半光氨酸。生物信息學軟件SIFT、PolyPhen-2和CADD的預測分析結果顯示,rs1455421289位點c.163G>C:p.D55H突變和rs761977647位點c.855G>C:p.W285C突變可能損傷EPB41L4A蛋白的結構或功能,見表1和圖1。這2個錯義突變的野生型氨基酸在物種進化上呈現高度保守,見圖2。

表1 EPB41L4A基因2個極罕見錯義突變分析

圖1 rs1455421289位點c.163G>C:p.D55H變異和rs761977647位點c.855G>C:p.W285C變異在EPB41L4A蛋白氨基酸一級結構中的分布

圖2 rs1455421289位點和rs761977647位點的野生型氨基酸殘基在物種間的進化保守性分析

286例PTC患者中,有3例攜帶rs1455421289位點c.163G>C:p.D55H 變異,1 例攜帶rs761977647位點c.855G>C:p.W285C變異。這2個位點在4個對照人群(gnomAD數據庫、TOPMed數據庫、ChinaMAP數據庫、HUABIAO數據庫)中的攜帶頻率均<0.05%,見表1。

在214 例PTC 患者中,有1 例攜帶rs1455421289位點c.163G>C:p.D55H變異,未發現rs761977647位點c.855G>C:p.W285C變異。在所有500例PTC患者中,rs1455421289的突變頻率為0.8%(4/500),rs761977647的突變頻率為0.2%(1/500)。

2.2 rs1455421289變異的病例-對照關聯分析

以4個大型人群數據庫(gnomAD數據庫、TOPMed數據庫、ChinaMAP數據庫、HUABIAO數據庫)中的282 120名非腫瘤個體的高質量基因分型數據作為對照,分別與PTC患者進行病例-對照關聯分析,其中gnomAD數據庫(134 187名)和TOPMed數據庫(132 345名)是非中國人群的基因分型數據,ChinaMAP(10 588名)和HUABIAO(5 000名)是中國人群的基因分型數據。在gnomAD數據庫和TOPMed數據庫的對照人群中,分別有2名和5名攜帶rs1455421289 位點c.163G>C:p.D55H變異,而ChinaMAP數據庫和HUABIAO數據庫中無個體攜帶該變異,因此正常人群該位點的突變頻率為0.002 5%(7/282 120)。與4個對照人群比較,攜帶rs1455421289位點c.163G>C:p.D55H變異者PTC發生風險顯著升高(OR值分別為40.3、85.4、213.5、541.1,95%CI分別為4.5~361.5、9.5~765.4、57.2~797.2、98.9~2 960.8,P<0.001 )。

2.3 rs1455421289變異的功能分析

在變異攜帶者的癌組織、癌旁組織中,EPB41L4A基因突變型的mRNA相對表達量均顯著高于野生型mRNA(P<0.01)。在變異攜帶者外周血白細胞mRNA中,野生型等位基因G和突變型等位基因C的相對拷貝數差異無統計學意義(P>0.05)。見圖3。

圖3 EPB41L4A基因rs1455421289位點野生型和突變型等位基因表達和基因組拷貝數比較

3 討論

識別甲狀腺癌新易感基因對甲狀腺癌高危人群的早期篩查和健康監測具有潛在的臨床應用價值。為精細定位甲狀腺癌的遺傳病因,研究人員在歐洲和亞洲人群中分別進行了數次甲狀腺癌GWAS[11-12,19],并在人類染色體8p12、9q22.33和14q13.3上頻繁定位到PTC的關聯信號[11-12,19-20]。染色體的定位數據提示與這3個區域緊密連鎖的基因NRG1(8p12)、FOXE1(9q22.33)和NKX2-1(14q13.3)中可能存在PTC的易感變異。然而,本研究對500例中國漢族PTC患者的這些基因進行蛋白編碼區和選擇性剪接位點的靶向測序分析,未發現潛在的、損害蛋白結構或功能的變異位點。本研究的數據提示PTC具有較強的遺傳異質性。這3個候選基因的蛋白非編碼區也可能存在增加PTC風險的表達數量性狀變異位點(expression quantitative trait locus,eQTL)[12]。

EPB41L4A基因編碼的蛋白屬于FERM蛋白家族。該蛋白家族主要參與調節細胞骨架的重排、細胞內運輸和WNT/β-catenin癌信號的傳遞[21]。EPB41L4A在正常甲狀腺組織中的表達豐度較高,但其在甲狀腺癌中的作用尚不明確。2017年,一項基于冰島人群PTC的GWAS在EPB41L4A基因下游12 kb處識別到1個與PTC關聯的常見變異rs73227498A>T(OR=1.37,95%CI為1.23~1.49)[11]。后續的功能實驗數據顯示,與攜帶rs73227498野生基因型AA的患者比較,攜帶純和變異基因型TT的患者甲狀腺組織中EPB41L4A的mRNA及其非編碼RNA(EPB41L4A-203)的表達均顯著增加[22]。該結果提示rs73227498變異可能以順式調控的機制影響上游基因EPB41L4A在PTC患者甲狀腺組織中的表達。

本研究通過對候選基因EPB41L4A進行靶向測序,在4個無親緣關系的中國PTC患者中識別到1個頻發的新PTC易感變異rs1455421289(c.163G>C:p.D55H),其在患者中的突變頻率為0.8%(4/500)。在包括15 588名中國對照個體在內的282 120名非腫瘤對照人群中,僅有7名個體攜帶該突變,這一突變在正常個體中的突變頻率為0.002 5%(7/282 120)。罕見rs1455421289C位點變異攜帶者的PTC發生風險顯著增加(P<0.001)。

rs1455421289(c.G163C:p.D55H)罕見錯義突變位于EPB41L4A基因的FERM功能結構域,氨基酸殘基D55在進化中高度保守,提示該天冬氨酸可能在維系EPB41L4A蛋白的正常結構和功能中發揮重要作用。本研究的功能實驗數據表明,rs1455421289(c.G163C:p.D55H)變異是一個功能性蛋白編碼變異,其C等位基因(突變型)顯著地增加了患者甲狀腺組織和外周血白細胞中突變mRNA的表達豐度。在變異攜帶患者的DNA中,本研究對該變異位點的野生型和突變型等位基因的拷貝數進行分析,排除了突變型mRNA表達豐度的升高是由突變型等位基因拷貝數增加所致。這提示該變異可能增強了患者甲狀腺細胞中突變mRNA的轉錄和/或增加了突變mRNA的穩定性。結合rs1455421289在正常對照人群中的變異頻率、PTC的發生風險,以及生物信息學預測和功能實驗證據,本研究將EPB41L4A(c.G163C:p.D55H)變異判定為潛在致病性變異。

綜上所述,本研究基于WES識別出1個中國人群PTC的高風險變異rs1455421289,在大樣本量PTC患者中驗證該變異的突變頻率有助于進一步明確其在PTC發生中的遺傳風險。此外,進一步探討該罕見突變的生物學功能也有助于認識EPB41L4A基因在甲狀腺癌發生中的作用機制。

猜你喜歡
等位基因甲狀腺癌變異
親子鑒定中男性個體Amelogenin基因座異常1例
分化型甲狀腺癌切除術后多發骨轉移一例
分化型甲狀腺癌肺轉移的研究進展
變異危機
變異
WHOHLA命名委員會命名的新等位基因HLA-A*24∶327序列分析及確認
全甲狀腺切除術治療甲狀腺癌適應證選擇及并發癥防治
DXS101基因座稀有等位基因的確認1例
變異的蚊子
等位基因座D21S11稀有等位基因32.3的確認
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合