?

革蘭氏陽性菌蛋白結構域特征分析

2020-05-16 14:28高曉偉李鳳敏
生物信息學 2020年1期
關鍵詞:細胞質結構圖陽性菌

高曉偉,李鳳敏

(內蒙古農業大學 理學院, 呼和浩特 010018)

革蘭氏陽性細菌是指在革蘭氏染色劑染色后仍保持原來的藍紫色結晶的細菌,它廣泛存在于人體中,對人體的健康危害極大,因此,研究革蘭氏陽性細菌的蛋白質亞細胞定位具有重要的生物學和醫學意義。到目前為止革蘭氏陽性菌蛋白亞細胞定位的研究相對較少,2007年Shen和Chou[1]建立了一個分為五類的革蘭氏陽性菌數據集,利用Gene Ontology-Pseudo Amino Acid離散模型和Optimized evidence theoretic-K-nearest neighbors方法,然后通過Jackknife測試和獨立數據集測試,成功率分別為82.7%和84.1%。2009年Shen和Chou[2]重新建立了四類革蘭氏陽性菌亞細胞定位數據集,結合基因本體等特征信息,最后總的成功率達到了82.2%。2012年Hu等人[3]構建了GP25革蘭氏陽性菌亞細胞定位數據集,利用Localization motif算法對革蘭氏陽性菌蛋白質亞細胞定位進行預測,總成功率達到了85.9%。2016年在第九屆電氣與計算機工程國際會議上,Julia Rahman等人[4]分別利用Amino Acid Composition和Pseudo Amino Acid Composition特征信息與Physiochemical Property Model特征信息融合對革蘭氏陽性菌蛋白質亞細胞定位進行預測,預測成功率均為73.2%。2017年XiaoXuan等人[5]采用新的算法對四類革蘭氏陽性菌亞細胞定位進行預測,取得了較好的預測結果。在這些預測研究中,提取的特征信息沒有考慮蛋白質的結構域(Domain)特征,結構域通常是由50~400個氨基酸殘基構成的球狀實體,它在蛋白質中可以獨立穩定的存在,并且和完成蛋白質功能有著密切的關系[6]。本文基于Swiss-Prot數據庫構建了4類共700條革蘭氏陽性細菌蛋白質的數據集,對其結構域進行搜索和功能分析,找到了細胞壁區域蛋白質的結構域、細胞外區域蛋白質的結構域、細胞質區域蛋白質的結構域以及細胞膜區域蛋白質的結構域。在PDBsum數據庫中進一步搜索找到了部分結構域所對應的二級和三級結構圖,觀察這些結構圖找到結構域的特征,這些結構域的特征有助于革蘭氏陽性細菌蛋白質亞細胞定位預測,可以進一步了解革蘭氏陽性細菌的發病原理,有望對相應的疾病進行針對性治療。

1 數據集

數據集嚴格按照以下標準構建:(1)從UniProtKB/Swiss-Prot (2018-09)數據庫中檢索關鍵字“Firmicutes”和“Actinobacteria”的所有蛋白序列;(2)在“Subcellular Location”注釋中選擇該蛋白的不同位置,去除“By similarity”、“Probably”等含糊或不確定的術語;(3)在“Sequence”信息中選擇50-3 000 aa蛋白序列;(4)剔除片段“B”、“X”、“Z”注釋序列;(5)為避免同源性偏差,采用軟件CD-HIT對蛋白序列進行相似比對,序列相似性為25%。完成上述步驟后,得到700條革蘭氏陽性菌蛋白質序列,它們分成4個區域分別是:細胞壁(Cell wall)22條、細胞外(Extracell)214條、細胞質(Cytoplasm)252條、細胞膜(Cell membrane)212條。

在Swiss-Prot數據集中的Family&Domains條目下提取每條革蘭氏陽性細菌蛋白質的結構域信息,最后發現細胞壁區域含有結構域信息的革蘭氏陽性細菌蛋白質有10條,細胞外區域有67條蛋白質有結構域信息,在細胞質區域中有78條,而細胞膜區域則有61條。進一步在PDBsum數據庫找到了這些結構域所對應的二級和三級結構圖。表1~表4分別為革蘭氏陽性菌4個位置蛋白質所對應的結構域的名稱和數量,其中小于2條結構域的蛋白質區域沒有列出。

表1 細胞壁蛋白質結構域個數Table 1 Number of cell wall protein domain

表2 細胞外蛋白質結構域個數Table 2 Number of extracellular protein domain

表3 細胞質蛋白質結構域個數Table 3 Number of cytoplasm protein domain

表4 細胞膜蛋白質結構域個數Table 4 Number of cell membrane protein domain

2 革蘭氏陽性細菌蛋白質的結構域分析

2.1 細胞壁區域蛋白質的結構域

由于細胞壁的蛋白質數量只有22條,所以細胞壁蛋白質的結構域數量也不是很多,其中出現次數不小于2次的結構域只有PE結構域和NEAT結構域,在這里分別介紹下這兩個結構域。PE結構域是高度保守的N端親水性結構域[7]。PE結構域是對蛋白質的翻譯和定位起著重要作用的功能結構域,PE結構域大約有110個氨基酸殘基。在細胞壁區域中一共有5條蛋白質含有PE結構域,它們都屬于PE家族。在PDBsum庫中沒有找到PE結構域相對應的二級結構圖和三級結構圖。

NEAT結構域是調控鐵元素表面蛋白的特異性保守結構域,大約由125個氨基酸殘基構成,它的二級結構由1個螺旋束和C端的β發夾組成,其中包含9個平行的β折疊片。革蘭氏陽性細菌中攝取血紅素的最佳系統是lsd系統,在lsd系統中細胞壁作為受體將與血紅素結合,在細胞壁中發揮主要作用的就是高度保守的NEAT結構域[8]。圖1給出的是NEAT結構域的二級結構圖和三級結構圖。

圖1 NEAT結構域對應的結構圖Fig.1 Diagarm of NEAT domain

2.2 細胞外區域的結構域

從表2可以看到細胞外區域出現次數不少于5次的結構域有PINc結構域、N-acetylmuramoyl-L-alanine amidas結構域、PE結構域和Peptidase S8結構域。其中PE結構域是細胞壁和細胞膜共有的結構域。在這里我們主要介紹出現次數最多的PINc結構域,PINc結構域屬于PIN家族,它具有高度的保守性,通常由150個氨基酸殘基構成。在真核生物中,PINc結構域參與mRNA衰變的過程,而且具有核糖核酸酶的功能。在原核生物中,PINc結構域是抗毒素(TA)系統的毒性成分,它們的毒性是由于核糖核酸酶活性產生的。PINc結構域蛋白的活性位點由四種保守的酸性氨基酸組成,這些氨基酸參與二價金屬離子結合和酶的活性過程[9]。在PDBsum庫中并沒有找到PINc結構域相對應的二級結構圖和三級結構圖。

2.3 細胞質區域的結構域

Response regulatory結構域、Histidine kinase結構域和S1 motif結構域是出現在細胞質區域不少于5次的結構域。由于在PDBsum庫中沒有Response regulatory結構域的二級結構圖和三級結構圖,在這里主要介紹Histidine kinase結構域和S1 motif結構域。Histidine kinase結構域屬于HWE家族,Histidine kinase結構域是由二聚組氨酸磷酸受體子域(DPH)和與催化ATP結合的子域(CA)構成,其中DPH是由兩個螺旋束和一個發夾環連接,形成了4個螺旋體束,而CA是一個高度保守的αβ三明治結構,由3個α螺旋和5個β鏈構成。大多數原核生物信號轉導系統和少數真核細胞轉導途徑都和Histidine kinase結構域有關。在革蘭氏陽性細菌的細胞質當中,Histidine kinase結構域起到了同源反應調節劑的作用[10]。在圖2中給出Histidine kinase結構域的二級結構圖和三級結構圖。

S1 motif結構域大量存在于RNA結合蛋白質中,該結構域使用特殊的方式和RNA結合,在細胞質區域當中和mRNA、核糖體相互作用,它對蛋白質的翻譯起到重要的作用。S1 motif結構域和shock蛋白的結構相似,S1 motif結構域一般由70~90個氨基酸殘基構成,由5個反向平行β的折疊片構成[11]。圖3是S1 motif結構域在PDBsum數據庫的二級結構圖和三級結構圖。

圖2 Histidine kinase結構域對應的結構圖Fig.2 Diagarm of Histidine kinase domain

圖3 S1 motif結構域對應的結構圖Fig.3 Diagarm of S1 motif domain

2.4 細胞膜區域的結構域

細胞膜區域出現的次數不小于5次的結構域有ABC transmembrane type-1結構域、Histidine kinase結構域、HAMP結構域,Protein kinase結構域和ABC transporter結構域。其中Histidine kinase結構域是細胞膜和細胞質區域共有的結構域,在細胞質區域的結構域中已經介紹過Histidine kinase結構域,在這主要介紹HAMP結構域和Protein kinase結構域。HAMP結構域是原核生物中跨核膜受體中最后一個沒有被人類發現結構但已經被人廣泛熟知存在的結構域。原核生物通過跨膜受體來感應環境的變化,其胞內和胞外通常由HAMP結構域連接,而且連接點始終位于HAMP結構域的C端,根據以上特征人們猜想HAMP結構域的結構是由兩個具有卷曲線圈特性的螺旋體構成[12]。

從革蘭氏陽性菌到人類,Protein kinase結構域的功能在進化上是高度保守的。Protein kinase結構域是由6個β發夾,7個β凸起和13個螺旋體構成的。Protein kinase結構域在多種細胞過程中發揮作用,包括細胞的分裂、增殖、凋亡和分化。在真核生物中Protein kinase結構域蛋白酶是一類非常廣泛的蛋白家族中的酶,與絲氨酸、蘇氨酸和酪氨酸蛋白酶一樣都具有保守的催化功能。Protein kinase結構域蛋白酶催化ATP轉移到蛋白底物側鏈上的一個或多個氨基酸殘基,導致其結構改變從而影響蛋白功能[13]。圖4給出的是Protein kinase結構域在PDBsum數據庫的二級結構圖和三級結構圖。

圖4 Protein kinase結構域對應的結構圖Fig.4 Diagarm of Protein kinase domain

3 結果與討論

對革蘭氏陽性細菌蛋白質4個亞細胞位置上的結構域種類和個數分別進行了統計,發現PE結構域是革蘭氏陽性菌細胞壁和細胞外兩個區域共同含有的結構域,其對蛋白質的翻譯起著至關重要的作用。而Histidine kinase結構域是細胞質區域和細胞膜區域共同含有的結構域,Histidine kinase結構域在同源中反應起到了調節劑的作用。NEAT結構域是細胞壁區域獨有的結構域,它的主要作用作為細胞壁受體與血紅素結合。PINc結構域是細胞外區域獨有的結構域, PINc結構域參與核糖體RNA的過程同時也具有核糖核酸酶的功能。細胞質區域獨有的結構域是S1 motif結構域,它對蛋白質的翻譯起著重要的作用。Protein kinase結構域是細胞膜區域特有的結構域,它影響著蛋白質的功能。隨著數據庫的不斷完善,會找到更多的結構域特征,利用這些特征信息可以更深入的了解革蘭氏陽性菌蛋白質的結構和功能。

猜你喜歡
細胞質結構圖陽性菌
2020年全國細菌耐藥監測報告(簡要版)
中國共產黨第二十屆中央組織結構圖
動物細胞里的成員
腫瘤醫院感染患者革蘭陽性菌分布與耐藥性及經驗性抗MRSA的研究
概率知識結構圖
替考拉寧與鹽酸萬古霉素治療革蘭陽性菌感染療效和安全性分析
第十九屆中共中央組織結構圖
喹諾酮類藥物的發展史話
高中生物細胞質作用研究
洋蔥細胞質雄性不育基因分子標記研究進展
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合