?

人ANKRD49基因及其編碼蛋白質的生物信息學分析

2021-08-19 01:03孫佳劉躍華秦軻茹胡金瑞栗馨洋徐白雪龐敏王維王海龍
中國生物制品學雜志 2021年8期
關鍵詞:結構域氨基酸蛋白質

孫佳,劉躍華,秦軻茹,胡金瑞,栗馨洋,徐白雪,龐敏,王維,王海龍

1.山西醫科大學基礎醫學院,山西 晉中 030600;2.山西醫科大學第一醫院呼吸與危重癥醫學科,山西 太原 030001

吸煙可能導致肺癌,生活及工作環境的粉塵、建筑裝修材料、油漆、油煙、空氣污染(汽車尾氣)和肺部慢性病及遺傳因素等也可能導致肺癌。一般而言,工業化程度越高,城市污染越嚴重的地方,肺癌的發病率越高。有調查顯示,我國城市肺癌的發病率為農村的15倍[1]。肺癌是世界范圍內最常見的癌癥死亡原因,非小細胞肺癌(non-small cell lung cancer,NSCLC)是肺癌的主要類型[2]。

癌癥是一個多基因參與的復雜的多因素疾病,抑癌基因的失活或癌基因的過表達是癌癥發生的重要內在因素[3]。同時癌癥又是一個多階段疾病,在癌癥發展的不同階段,有著特定基因的表達或沉默。錨蛋白重復結構域49(ANKRD49)包含4個錨蛋白重復序列,該序列含30~34個氨基酸殘基,介導蛋白質與蛋白質之間的相互作用[4]。在酵母Swi6p、seeptin 7假基因1(Cdc10p)和Notch中首次發現錨蛋白重復結構域[5-6],而這些蛋白質具有重要的生物學功能,如Notch蛋白是細胞信號通路的關鍵組成部分,當重復結構域被突變破壞時,會引起神經系統疾?。?]。小鼠ANKRD49主要在精原細胞、精母細胞和圓形精子細胞中高表達且通過調節NF-κB信號通路對小鼠精原細胞系GC-1發揮抗凋亡作用[8]。文獻報道,ANKRD49蛋白質在胃癌組織中高表達,且該蛋白定位于細胞漿或細胞核[9-10],細胞定位的不同預示著該蛋白質可能在胃癌的發生發展中發揮不同的功能?;蛐酒芯匡@示,ANKRD49基因及其編碼蛋白在高侵襲性肺癌組織中低表達,在低侵襲性肺癌組織中高表達[11-12]。然而,該基因在肺癌發生發展中的具體作用尚未闡明。

人ANKRD49基因的功能少有報道,因此,本文應用生物信息學方法[12],分析了ANKRD49及其編碼蛋白質的理化性質、結構、翻譯后修飾及可能的相互作用蛋白,為該基因及其編碼蛋白質功能的研究提供生物信息支持。

1 材料與方法

1.1 基因及蛋白序列登錄號 人ANKRD49基因登錄號分別為:NM_017704、NM_001126283和NM_019683;人、大鼠、小鼠ANKRD49以及人ANKRD1、Fank1、P16蛋白質的登錄號分別為:AAH17798.1、AAI61982、AAH19777.1、NP_055206.2、NP_660278.3和AAB60645.1。

1.2 分析方法 人ANKRD49基因的基本信息來自Ensembl Genome Brower(http://asia.ensembl.org/index.html)和NCBI(http://www.ncbi.nlm.nih.gov/)數據庫,不同種屬ANKRD49蛋白質的同源性比較采用DNAMAN軟件;人ANKRD49蛋白質與大鼠、小鼠、河貍、蛇、伊蚊氨基酸的同源性,及與其他ANK家族蛋白質進化樹的比對采用DNAMAN軟件;ANKRD49蛋白質的理化性質、等電點、相對分子質量預測采用ProtParam tool軟件;蛋白的二級結構分析及親(疏)水性分析采用DNAMAN軟件,三級結構預測采用SWISS-MODEL軟件;信號肽及跨膜結構預測分別采用SignalP 4.1軟件和TMpred軟件;ANKRD49蛋白質翻譯后修飾分析采用MotifScan軟件,相互作用蛋白質的預測采用CharlesKW數據庫(http://www.geneinfinity.org)。

2 結果

2.1 人ANKRD49基因和蛋白質的基本信息 人ANKRD49基因位于11號染色體的94493629-94499583區間,見圖1。

圖1 NCBI網站分析人ANKRD49基因在染色體中的位置Fig.1 Analysis of position of human ANKRD49 gene in chromosome by NCBI website

人ANKRD49基因的cDNA序列總長度為1 908 bp,cDNA的CDS區始于cDNA序列的第143位堿基,止于第864位堿基,共720個堿基。該基因含有3個外顯子,有7個轉錄本,見圖2。該基因編碼1個含239個氨基酸的蛋白質。見圖3。

圖2 人ANKRD49基因的cDNA序列分析Fig.2 Analysisof cDNA sequenceof human ANKRD49 gene

圖3 人ANKRD49基因編碼蛋白質氨基酸序列分析Fig.3 Analysis of amino acid sequence encoded by human ANKRD49 gene

ANKRD49的分子式為C1192H1860N340O386S5,含有3 783個原子,由239個20種氨基酸組成。其中亮氨酸(Leu)占比最大(12.6%),半胱氨酸(Cys)占比最?。?.8%)。見表1。239個氨基酸中有42個為負電荷氨基酸殘基(Asp+Glu),25個為正電荷氨基酸殘基(Arg+Lys)。其預測的理論等電點為5.00,呈酸性。在280 nm水溶液中的消光系數為36 565 U/(M·cm);在哺乳動物、酵母及大腸埃希菌中的半衰期分別為30、>20、>10 h;不穩定系數為34.25,預測表明該蛋白為穩定蛋白(不穩定系數<40時為穩定蛋白,≥40則為不穩定蛋白)。脂肪系數為80.84;總平均親水性(GRAVY)為-0,預測其為親水蛋白。相對分子質量為27 290.2,包含4個ankyrin重復序列結構域(78-106、107-139、140-172和173-207)。

表1 人ANKRD49蛋白質的氨基酸組成Tab.1 Amino acid composition of human ANKRD49 protein

2.2 人A N KRD49蛋白質的進化分析 利用DNAMAN軟件比對了人、大鼠、小鼠、河貍、眼鏡王蛇和白紋伊蚊的ANKRD49蛋白質氨基酸的組成,發現其同源性高達78.65%,見圖4,提示該蛋白在進化上保守。同時利用該軟件對ANKRD49的進化進行了簡單分析,發現該蛋白與其他含ankyrin重復序列蛋白質的進化具有較高的親緣性,見圖5,進一步提示其為一個保守的蛋白質。

圖4 人、大鼠、小鼠、河貍、蛇、伊蚊的ANKRD49蛋白質氨基酸同源性分析Fig.4 Analysis of amino acid homology among ANKRD49 proteins of human,rat,mouse,beaver,snake and Aedes

圖5 人ANKRD49蛋白質與其他含ankyrin重復序列蛋白質的進化樹分析Fig.5 Phylogenetic tree of human ANKRD49 protein and other proteins containing ankyrin repeats

2.3 人A N KRD49蛋白質的親(疏)水性 利用DNAMAN軟件分析,人ANKRD49蛋白質含有5個親水性參數得分≥1.9的區域(0-17、47-63、64-75、100-109和182-191),ANKRD49整條肽鏈的親水性氨基酸數量大于疏水性氨基酸數量,該蛋白總體表現為親水性,無明顯的疏水性區域,見圖6。ProtParam tool軟件分析,ANKRD49蛋白質的平均親水性系數為0.764,提示其為可溶性蛋白質。

圖6 DNAMAN軟件分析人ANKRD49蛋白質的親(疏)水性Fig.6 Prediction of hydrophilicity(hydrophobicity)of human ANKRD49 protein by DNAMAN software

2.4 人A N KRD49蛋白質的信號肽及跨膜結構 利用SignalP 4.1軟件對人ANKRD49蛋白質的信號肽進行了預測,剪切位點值(C-score)、信號肽值(Sscore)和綜合剪切位點值(Y-score)均在0.1附近,預測人ANKRD49蛋白質不含信號肽,為非分泌型蛋白,在細胞內不進行跨膜運輸,見圖7。

圖7 SignalP 4.1軟件預測人ANKRD49蛋白質的信號肽Fig.7 Prediction of signal peptide of human ANKRD49 protein by SignalP 4.1 software

2.5 人A N KRD49蛋白質的跨膜結構域 利用TMpred軟件分析了ANKRD49的跨膜區結構,結果如圖8所示,紫色細線對應的縱坐標數值表示該蛋白位于膜外的可能性為90%,藍色細線對應的縱坐標數值表示該蛋白位于膜內的可能性為10%,表明人ANKRD49蛋白質屬于非跨膜類蛋白。

圖8 TMpred軟件分析人ANKRD49蛋白質的跨膜性Fig.8 Analysis of transmembrane property of human ANKRD49 protein by TMpred software

2.6 人A N KRD49蛋白質的二級結構 利用DNAMAN軟件預測239個氨基酸組成的ANKRD49蛋白的二級結構,結果見圖9,其中102個(42.68%)可能形成無規則卷曲(紅色細線),83個(34.7%)可能形成α螺旋(綠色細線),54個(22.6%)可能形成β折疊片(藍色細線)。人ANKRD49蛋白質的主要結構為α-螺旋和無規則卷曲,該結構有助于蛋白質的穩定性。

圖9 DNMAN軟件分析人ANKRD49蛋白質的二級結構Fig.9 Analysis of secondary structure of human ANKRD49 protein by DNAMAN software

2.7 人A N KRD49蛋白質的三級結構 利用SWISSMODEL軟件分析人ANKRD49蛋白質的三級結構,可見α螺旋結構和無規則卷曲結構,還有部分β-折疊結構,與二級結構預測結果一致,見圖10。

圖10 SWISS-MODEL軟件分析人ANKRD49蛋白質的三級結構Fig.10 Analysis of tertiary structure of human ANKRD49 protein by SWISS-MODEL software

2.8 人A N KRD49蛋白質翻譯后修飾位點 利用MotifScan軟件,預測獲得4個可能的磷酸化部位,分別為CAMP磷酸化位點、CK2磷酸化位點和PKC磷酸化位點,見表2。

表2 人ANKRD49蛋白質翻譯后修飾分析Tab.2 Analysis of post-translational modification of human ANKRD49 protein

2.9 人A N KRD49蛋白質互作蛋白 利用蛋白質相互作用在線預測工具(http://www.string-db.org/newstring_cgi/show_input_page.pl)分析了人ANKRD49蛋白質可能的相互作用蛋白質為MT3、MPL、HBG1、HBG2、KLF11、ZBED5、ELAVL2和ARHGEF16,見圖11。

圖11 人ANKRD49蛋白質互作蛋白質預測Fig.11 Prediction of interacting proteins of human ANKRD49 protein

3 討論

蛋白質的結構是其功能的基礎,資料顯示,ankyrin結構域是介導蛋白質與蛋白質相互作用的常見結構基序[13]。而含ankyrin結構域的蛋白質通過ankyrin介導蛋白質與蛋白質的相互作用廣泛參與轉錄調控、細胞周期、細胞凋亡、細胞骨架完整性、細胞機械感受和內吞作用等細胞生命活動過程[14]。ANKRD49含有4個ankyrin結構域,蛋白質氨基酸序列比對及進化樹分析提示其是一種進化上保守的蛋白質,在腫瘤發生發展過程中具有重要的生物學功能。通過對腫瘤基因組圖譜(TCGA)數據庫的挖掘,發現ANKRD49在膠質瘤組織中的表達增加,并且ANKRD49的高表達與疾病分級高、總存活率低密切相關。細胞實驗證明,其通過促進人惡性膠質瘤細胞的增殖影響腫瘤的發生發展[15]。人ANKRD49基因及其編碼蛋白質在NSCLC細胞也有表達,但該蛋白在低分化、高侵襲性肺癌組織細胞中高表達,而在高分化、低侵襲性肺癌組織細胞中低表達,提示其參與肺癌發展的后期進程及侵襲轉移[16],然而ANKRD49在肺癌發生發展中的確切作用及潛在機制還未研究。生物信息學方法有助于揭示其可能的理化性質、互作蛋白等信息,為深入研究ANKRD49基因及其編碼蛋白質在肺癌發生發展中的功能提供重要參考價值。

生物信息學分析顯示,人ANKRD49蛋白質含有239個氨基酸,氨基酸組成分析得出該蛋白質為親水的非分泌蛋白和非膜蛋白。氨基酸同源性及進化樹分析顯示,人ANKRD49蛋白質在進化中高度保守,而4個磷酸化位點的存在提示其可能具有重要功能。人ANKRD49蛋白質含有4個ankyrin結構域,提示其可能通過與其他蛋白質相互作用來發揮生物學作用。蛋白質的相互作用預測顯示,ANKRD49可能與KLF11、MT3、MPL、HBG1、HBG2、ZBED5、ELAVL2和ARHGEF16具有相互作用。在這8種互作蛋白中,KLF11和MT3兩個蛋白質研究較多,KLF11是Kruppel樣轉錄因子家族中的成員,在胰腺、肌肉、肝臟等多種組織中廣泛表達,參與調控細胞增殖、糖脂代謝等多種重要的生理及病理過程。研究表明,KLF11在胰腺癌、肺癌等多種腫瘤中的表達量明顯下降,其抑癌作用亦明顯降低,這種異常表達參與了腫瘤的發生發展過程。進一步的研究發現[17],KLF11作為TGF-β信號通路下游的調節因子,參與了由TGF-β信號通路調控的一系列生物學功能,包括促進細胞分化凋亡、抑制細胞增殖、調控胰腺等體內重要臟器的發育并維持其功能等。金屬硫蛋白(metallo-thionein,MT)是一類缺乏芳香族氨基酸、富含半胱氨酸,可以通過SH-基團與眾多金屬離子結合的小分子蛋白質[18]。MT與腫瘤的關系非常密切,它不僅參與腫瘤發生、發展及預后等,而且與腫瘤細胞的分化、某些化療藥物的耐藥性也密切相關。MT在多種惡性腫瘤中均呈現高水平的表達,由此推測其可能為某些惡性腫瘤的生物學標志[19]。MT3又稱神經生長抑制因子,屬于編碼MT的基因,特異表達于中樞神經系統中,不僅具有重金屬解毒和清除自由基等功能,同時具有獨特的神經生長抑制活性,與Alzheimer’s病以及腫瘤的發生、發展進程密切相關[20]。

本研究通過生物信息學技術,結合互作蛋白分析推測人ANKRD49蛋白質可能通過與MT3、KLF11等蛋白質相互作用,從而參與調控癌癥的發生發展。下一步研究將通過免疫共沉淀、Gst-pull down等方法驗證ANKRD49與MT3、KLF11的相互作用,借助基因過表達技術、基因敲低或基因敲除技術進一步研究其在肺癌發生發展中的作用并揭示其作用機制,為肺癌的靶向治療提供可能的作用靶標。

猜你喜歡
結構域氨基酸蛋白質
蛋白質自由
人工智能與蛋白質結構
月桂酰丙氨基酸鈉的抑菌性能研究
蛋白質結構域劃分方法及在線服務綜述
UFLC-QTRAP-MS/MS法同時測定絞股藍中11種氨基酸
重組綠豆BBI(6-33)結構域的抗腫瘤作用分析
組蛋白甲基化酶Set2片段調控SET結構域催化活性的探討
一株Nsp2蛋白自然缺失123個氨基酸的PRRSV分離和鑒定
泛素結合結構域與泛素化信號的識別
氨基酸分析儀測定玉米漿中17種游離氨基酸的不確定度評定
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合