?

葡萄根癌病病原菌中效應蛋白Tae4與其免疫蛋白Tai4的鑒定與分析

2022-01-21 09:29王鵬飛袁麗芳張慶田王海利慕茜王欽超韓金濤趙紅軍
中外葡萄與葡萄酒 2022年1期
關鍵詞:結構域病原菌基因組

王鵬飛,袁麗芳,張慶田,王海利,慕茜,王欽超,韓金濤,趙紅軍

(1. 山東省葡萄研究院,山東濟南 250100;2. 山東省農藥科學研究院,山東濟南 250100;3. 山東師范大學,山東濟南 250014;4. 龍口市省級農業高新技術產業開發區管委會,山東龍口 265701;5. 農業農村部華東都市農業重點實驗室/山東省葡萄栽培與精深加工工程技術研究中心,山東濟南 250100)

葡萄根癌病是一種細菌性病害,由葡萄根癌病病原菌引起。葡萄根癌病通常在夏季發病,對葡萄極具破壞性。根癌病病原菌可引起葡萄產量的下降,甚至導致葡萄藤的枯死[1]。最早被發現的葡萄根癌病病原菌是Agrobacterium vitis[1-2]。后來,根癌病病原菌Agrobacterium tumefaciens也從葡萄根部被分離出來,說明A. tumefaciens株系也能侵染葡萄,引發根癌病[2]。葡萄根癌病病原菌對葡萄的侵染可以分為3個步驟:第一步是致病菌侵入到葡萄的非原質體部位,匯集在葡萄的根部,再通過根部的傷口入侵[3-4];第二步,病原菌在葡萄的木質部定殖;第三步,通過葡萄木質部的液流散布到葡萄的各個器官和部位[5]。

根癌病病原菌的致病效應子VirA和VirG作為毒力蛋白可以促進根癌病病原菌對葡萄的侵染[1]。狹義上,效應子(又名效應蛋白)可以被定義為一類有利于致病菌侵染植物的蛋白質。當植物的致病菌分泌效應蛋白后,還必須將這些效應蛋白運輸至植物寄主的精確亞細胞位置才能發揮功能,協助致病菌入侵植物。目前,大量的致病菌效應蛋白被報道,這些相關研究的增多使得效應子的特征被逐步分析和明確。研究顯示,效應蛋白有如下特征:(1)具有信號肽;(2)無跨膜區域;(3)包含的氨基酸少于300個;(4)富含半胱氨酸;(5)具有已知的效應子結構域;(6)與已知蛋白功能無同源性等[6]。

六型分泌系統(The type VI secretion system;T6SS)是存在于根癌病病原菌等革蘭氏陰性菌中的分泌系統,因為能分泌一些與致病相關的效應子,并與病原菌致病能力密切相關。然而,人們對六型分泌系統分泌的非致病效應子蛋白研究的較少。目前研究表明,六型分泌系統在細菌競爭中也發揮重要作用。有一種六型分泌系統分泌的非致病效應蛋白稱為Tae4蛋白,在分泌Tae4蛋白后,會系統性地轉運Tae4蛋白并注射到附近細菌的周質空間中。而這種非致病相關的Tae4效應蛋白具有酰胺酶活性,可以水解細菌的肽聚糖進而殺死附近的競爭細菌[7]。有的細菌可免受自身分泌Tae4蛋白的傷害,是因為其六型分泌系統可分泌一種Tai4,它是Tae4蛋白的免疫蛋白。目前有兩種根癌病病原菌A. tumefaciens株系(ATU4346和ATU4347)被發現含有Tai4蛋白和Tae4蛋白[8]。由于這兩個株系缺少完整的基因組,因此無法進行全基因組范圍的Tai4蛋白和Tae4蛋白家族成員鑒定。本研究以具備完整基因組的18個A. tumefaciens和4個A. vitis株系為對象,鑒定這些菌株中含有Tai4蛋白和Tae4蛋白家族成員的確切數目,并分析該蛋白家族成員的特性。對其Tai4蛋白和Tae4蛋白的鑒定與分析可為將來研究如何借助Tae4對一些致病菌進行殺滅奠定基礎。

1 材料與方法

1.1 葡萄根癌病病原菌基因組數據的獲得

18個A. tumefaciens株系完整基因組以及全部蛋白序列信息下載于NCBI的A. tumefaciens基因組數據庫(https://www.ncbi.nlm.nih.gov/genome/browse/#!/prokaryotes/177/),株系名稱分別是:BIMB-1315G、1D1609、CFBP6623、12D1、CFBP6624、186、6N2、1D1460、EML4、CFBP7129、1D1108、6A、15955、FDAARGOS、BIM B-441、CFBP5499、CFBP5877、Q15_94。4個A.vitis株系完整基因組及其全部蛋白序列信息來源于NCBI的基因組數據庫(https://www.ncbi.nlm.nih.gov/genome/browse/#!/prokaryotes/1215/),株系名稱分別是:VAR06-30、VAR03-1、S4以及VAT03-9。

1.2 葡萄根癌病病原菌Tae4和Tai4蛋白家族成員鑒定

用HMMER軟件,基于Tae4結構域(Tae4 domian;Pfam編號為PF14113)的隱馬克夫模型(Hidden Markov Model,HMM),分別搜索18個A. tumefaciens株系和4個A. vitis株系基因組中全部Tae4蛋白,從而鑒定2種葡萄根癌病病原菌的Tae4蛋白家族成員。利用在線軟件SMART(http://smart.embl-heidelberg.de/)確定蛋白是否具有完整的Tae4結構域,剔除無完整Tae4結構域的蛋白。

用HMMER軟件,基于Tai4結構域(Tai4 domian;Pfam編號為PF16695)的隱馬克夫模型,分別搜索18個A. tumefaciens株系和4個A. vitis株系基因組中全部Tai4蛋白,從而鑒定2種葡萄根癌病病原菌的Tai4蛋白家族成員。利用在線軟件SMART(http://smart.embl-heidelberg.de/)確定蛋白是否具有完整的Tai4結構域,剔除無完整的Tai4結構域蛋白。

1.3 葡萄根癌病病原菌Tae4和Tai4蛋白家族成員亞細胞定位及信號肽預測

利用在線軟件TargetP(http://www.cbs.dtu.dk/services/TargetP/)預測Tae4和Tai4蛋白家族成員的亞細胞定位;利用在線軟件NLStradamus(http://www.moseslab.csb.utoronto.ca/NLStradamus/)分析核定位信號。設置參數為:Prediction Cutoff=0.6;用TMHMM2.0軟件(http://www.cbs.dtu.dk/services/TMHMM/)分析跨膜結構域;利用在線軟件SignalP(http://www.cbs.dtu.dk/services/SignalP/)分析信號肽。

1.4 多重序列比對與進化樹分析

利用ClustalX 2.0軟件對Tae4和Tai4蛋白家族成員進行蛋白多重序列比對分析;用MEGA 6.0軟件構建系統發育樹,方法為鄰接法(Neighbor-Joining tree)。設置參數為:自舉值(bootstrap value)被計算1000次。bootstrap value大于70的分支認為是1個組[9]。利用在線軟件Topo-phylogeny(http://bar.utoronto.ca/Topophylogeny/)進行進化樹的拓撲結構分析。

1.5 蛋白基序分析

利用在線軟件MEME suite 5.3.3(https://meme-suite.org/meme/tools/meme)分析Tae4和Tai4蛋白家族成員的保守蛋白基序(motif)。設置參數為:motif發現數量=10,motif長度范圍為10~200個氨基酸[9]。

1.6 蛋白三級結構分析

利用在線軟件SWISS-MODEL(https://swissmodel.expasy.org/)分析蛋白質的三級結構。

1.7 蛋白互作網絡分析

利用在線軟件STRING(https://string-db.org/)分析Tae4和Tai4蛋白家族成員與其他蛋白的互作。數據庫中A.tumefaciens蛋白互作數據來自株系CCNWGS0286。

1.8 選擇壓力分析

利用軟件PAML包中的Code ml program(version 4.7)[10]分析Tae4蛋白編碼基因在進化過程中受到的選擇壓力。利用PAML軟件中的3個選擇壓力位點模型分析。利用位點模型M0(one ratio)分析整體受到的選擇壓力;利用位點模型M8(βandω)貝葉斯分析法(Bayesian Analysis)鑒定Tae4基因進化過程中的正向選擇位點[11]。

2 結果與分析

2.1 葡萄根癌病病原菌中Tae4與Tai4的鑒定與蛋白性質分析

目前,NCBI公布的根癌農桿菌基因組數據包含18個A. tumefaciens和4個A. vitis的完整基因組。在18個A. tumefaciens株系的基因組中鑒定了14個Tae4基因,在4個A.vitis株系的基因組中鑒定了1個Tae4基因和1個Tai4基因。其中,A. tumefaciens物種中只有BIMB-1315G、1D1609、CFBP6623、12D1、CFBP6624、186、6N2、1D1460、EML4、CFBP7129、1D1108、6A、15955、FDAARGOS株系中發現各有1個Tae4基因,其他株系中未發現,且這18個株系基因組中均未發現存在Tai4基因。A. vitis物種中只有VAR06-30株系基因組中被發現1個Tae4基因和1個Tai4基因。并且發現,14個A. tumefaciensTae4基因都存在線形染色體(linear chromosome),而1個A. vitisTae4基因和1個A. vitisTai4基因存在A. vitisVAR06-30株系的環狀染色體(circular chromosome)。

本文發現的Tai4基因編碼蛋白都含有Tae4結構域(Pfam編號為PF14113),其中的A. tumefaciensTae4蛋白都含有EAGR_box結構域(Pfam編號為PF16713)。本文發現的唯一A. vitisTai4蛋白含有1個Tai4結構域(Pfam編號為PF16695)和1個Paramyxo_PCT結構域。此外,用于預測結構域的SMART軟件還檢測到A.vitisTai4蛋白含有一段長度為22個氨基酸的信號肽,序列為“MMYRLLLLGLVGLCVNSQIAAA”。

通過檢測15個Tae4蛋白和1個Tai蛋白的性質發現,15個Tae4蛋白都各自包含166個氨基酸,其半胱氨酸均分別占各自氨基酸含量的1.8%;Tai4蛋白包含151個氨基酸,其半胱氨酸占自身氨基酸含量的2%。A. vitisTae4蛋白的等電點是8.96,分子量是18 446.84;A. vitisTai4蛋白的等電點是6.71,分子量是16 749.02。A. tumefaciens株系CFBP6623和CFBP6624的Tae4蛋白的等電點是8.81,其他12個都是9.05;A. tumefaciens的14個株系Tae4蛋白的分子量在18 214.44到18 353.57之間。15個Tae4蛋白與其他效應子一樣不含有跨膜結構域,A. vitisTai4蛋白也不含有跨膜結構域。經預測,15個Tae4蛋白與A. vitisTai4蛋白都是GPI錨定蛋白,定位于線粒體。先前的研究顯示,促進致病菌侵染植物的效應子都含有信號肽[6]。本研究結果顯示,A. vitisTae4蛋白被預測含有信號肽的可能性略高于14個A. tumefaciensTae4蛋白。在線軟件SignalP分析結果也顯示,A. vitisTai4蛋白含有信號肽。

疏水性分析結果顯示,A. vitisTae4蛋白疏水氨基酸和親水氨基酸的分布與A. tumefaciensTae4蛋白略有差異。而本次鑒定出的1個Tai4蛋白和15個Tae4蛋白既不屬于親水蛋白質也不屬于疏水蛋白質(圖1)。

圖1 蛋白的疏水性分析結果Figure 1 Hydrophobicity analysis of protein

2.2 蛋白序列比對與進化樹分析

將14個A. tumefaciensTae4蛋白利用ClustalX 2.0軟件進行比對發現,A. tumefaciensTae4蛋白比較保守,14個A. tumefaciensTae4蛋白之間的相似度較高。相對而言,A. tumefaciens株系CFBP6623和CFBP6624的Tae4蛋白相對于其他12個蛋白在4個氨基酸位點上有差異,與其他Tae4蛋白差別最大(圖2 A)。A. tumefaciens株系FDAARGOS_1048的Tae4基因的起始密碼子是TCA,終止密碼子是CAT,而其他A. tumefaciensTae4蛋白的起始密碼子都是ATG,終止密碼子都是TGA。A. tumefaciens株系FDAARGOS_1048的Tae4蛋白序列并未因起始密碼子和終止密碼子的區別而有顯著差異,其蛋白序列與大部分A. tumefaciensTae4蛋白相似度高,極為保守(圖2 A)。而將14個A. tumefaciensTae4蛋白和A. vitisTae4蛋白利用ClustalX 2.0軟件進行比對發現,A. tumefaciensTae4蛋白和A. vitisTae4蛋白相似度不高,而A. vitisTae4蛋白和A. vitisTai4蛋白的相似度也不高(圖2 B)。

圖2 蛋白比對結果Figure 2 Alignment of proteins

利用MEGA 6.0軟件構建系統發育樹顯示,14個A. tumefaciensTae4蛋白可以被分為2組。一組包含A. tumefaciens株系CFBP6623和CFBP6624的Tae4蛋白,另一組包含其他12個蛋白。A. vitisTae4蛋白不屬于這兩個組,獨立成為一個孤兒蛋白(圖3)。利用在線軟件Topo-phylogeny分析MEGA 6.0軟件構建系統發育樹的拓撲結構分析顯示,該15個Tae4蛋白可以被分為3組:一組包含A. tumefaciens株系CFBP6623和CFBP6624的Tae4蛋白,另一組包含其他12個蛋白,第三組包含A. vitisTae4蛋白。進化樹的分析結果與ClustalX 2.0軟件比對結果高度一致。

圖3 15個Tae4蛋白的進化樹分析結果Figure 3 The evolutionary tree of 15 Tae4 proteins

2.3 葡萄根癌病病原菌中Tae4與Tai4蛋白結構及互作分析

利用在線軟件MEME suite 5.3.3分析了15個Tae4蛋白和1個Tai4蛋白的保守基序(motif)。結果顯示,14個A. tumefaciensTae4蛋白中可以鑒定出2個保守基序,其中motif1長達71個氨基酸,motif2包含19個氨基酸。15個根癌病病原菌Tae4蛋白間可以鑒定出10個保守基序,每個保守基序都含有10個氨基酸。這10個保守基序在A. tumefaciensTae4蛋白和A. vitisTae4蛋白中排序不同。

利用在線軟件SWISS-MODEL預測了15個Tae4蛋白和1個Tai4蛋白的三級結構(圖4)。由圖4可見,A. tumefaciensTae4蛋白和A. vitisTae4蛋白的三級結構有所區別。A. tumefaciensTae4蛋白結構與SWISS-MODEL蛋白三級結構數據庫中的模板6ijf.1.C具有93.87%的相似度。該模板的蛋白三級結構來源于A. tumefaciensATU4346和 ATU4347株系中的Tae4蛋白的晶體結構[8]。A. vitisTae4蛋白結構與SWISS-MODEL蛋白三級結構數據庫中的模板蛋白4jur.1.A具有41.14%的相似度,且最接近這個模板蛋白。該模板蛋白三級結構來源于陰溝腸桿菌和鼠傷寒沙門氏菌的Tae4蛋白晶體結構[12]。此外,利用在線軟件STRING分析兩種葡萄根癌病病原菌Tae4和Tai4蛋白家族成員在各自物種中與其他蛋白的互作,結果顯示,A. tumefaciensTae4可與10個蛋白互作,包括溶血素協同調節蛋白(Hemolysin-coregulated protein,HCP)、六型分泌系統蛋白VasG等(圖5)。而除了A. vitisTae4蛋白和A. vitisTai4蛋白二者能互作外,沒有預測到這兩個蛋白在A. vitis物種中能與其他蛋白互作。分析基于STRING數據庫中A. tumefaciens株系CCNWGS0286版本的數據。

圖4 蛋白的三級結構預測結果Figure 4 The 3D structure of the protein

圖5 STRING分析A. tumefaciens Tae4蛋白與物種中其他蛋白互作的結果Figure 5 STRING analysis of A. tumefaciens Tae4 proteins with other proteins in species

2.4 兩種葡萄根癌病病原菌中Tae4蛋白編碼基因的選擇壓力

將14個A. tumefaciensTae4蛋白的編碼基因作為一個整體進行選擇壓力分析,PAML軟件的M0模型分析結果顯示,A. tumefaciensTae4蛋白編碼基因整體遭受純化選擇(dN/dS=0.3719)。用PAML軟件只在14個A. tumefaciensTae4蛋白的編碼基因中發現了1個顯著的正向選擇位點(149F)。將14個A. tumefaciensTae4蛋白和1個A. vitisTae4蛋白的編碼基因作為一個整體進行選擇壓力分析,PAML軟件的M0模型分析結果顯示,這15個Tae4蛋白的編碼基因整體遭受正向選擇(dN/dS=2.39292)。PAML軟件M8模型用貝葉斯分析法在這15個Tae4蛋白的編碼基因中發現了27個顯著的正向選擇位點。

3 討論和結論

本研究分析了基因組被測序的18個A. tumefaciens和4個A. vitis株系的Tae4蛋白和Tai4蛋白及其編碼基因。結果顯示,18個A. tumefaciens株系基因組不是全部都含有Tae4基因,并且都不含有Tai4基因。然而,之前的研究顯示,有的A. tumefaciens株系基因組含有Tai4基因,例如ATU4346和ATU4347株系[8]。本研究的4個A. vitis株系中只有VAR06-30株系的基因組含有Tae4基因和Tai4基因。這說明,對于A. tumefaciens和A. vitis,Tae4蛋白和Tai4蛋白雖然可以做為一種攻擊其他病原菌的“武器”及自身免疫這種“武器”的防具[7],但這兩種蛋白的編碼基因并不是該兩種葡萄根癌病病原菌生長發育所必須的基因。也說明A. tumefaciens和A. vitis不同株系基因組之間Tae4和Tai4兩個基因位點的變異程度較高。有的株系基因組Tae4或Tai4基因缺失可能是由于基因組發生了結構變異(Structural Variation,SV)或插入缺失(Indel)。有的A. tumefaciens株系基因組缺失了Tai4基因,說明可能存在其他機制協助這些A. tumefaciens株系抵御自身Tae4蛋白的傷害。另一種可能是這些A. tumefaciens株系的Tae4蛋白具有較小的傷害作用。而這些A. tumefaciens株系是否能抵御其他屬種的Tae4也需要進一步研究。在A. tumefaciens株系中,Tae4基因也存在堿基突變。例如A. tumefaciens株系CFBP6623和CFBP6624相對于其他株系在Tae4基因上存在較多的非同義突變,A. tumefaciens株系FDAARGOS_1048的Tae4基因的起始密碼子和終止密碼子相對于其他株系的Tae4基因存在堿基突變,但都屬于同義突變,并沒有引起氨基酸的改變。

對于A. tumefaciens和A. vitis的Tae4蛋白性質的分析顯示,這些葡萄根癌病病原菌的Tae4蛋白都包含少于200個氨基酸,也不含跨膜結構域,這與之前報道的致病效應子類似[6]。A. tumefaciens和A. vitis的Tae4蛋白共有10個保守基序,然而這些保守基序在這兩個物種中的排列順序不同。這種保守基序排列順序的差別可能導致了這兩個物種中Tae4蛋白較顯著的序列差異。盡管A. tumefaciens和A. vitis的Tae4蛋白都含有Tae4結構域,并且含有較多的保守基序,但是這些保守基序排列順序的差異可能導致功能上的差異,本試驗得到的蛋白互作分析結果也證明了這種差異可能存在。結果顯示,A. tumefaciensTae4可與溶血素協同調節蛋白、六型分泌系統蛋白VasG等互作,而A. vitis的Tae4蛋白則不能。而選擇壓力分析顯示,A. tumefaciens株系的Tae4基因間遭受純化選擇,蛋白之間沒有新功能的產生。而A. tumefaciens和A. vitis的Tae4基因間遭受正向選擇,且鑒定出許多正向選擇位點,正向選擇可能會導致功能分歧或新功能的產生[13]。因此,推測不同葡萄根癌病病原菌間的Tae4基因功能可能存在差異。A. tumefaciens和A. vitis的Tae4蛋白三級結構的差異也較明顯。A. vitisTae4蛋白的三級結構與陰溝腸桿菌和鼠傷寒沙門氏菌的Tae4蛋白晶體結構更為相似。進化樹的結果也證明了A. tumefaciens和A. vitis中Tae4蛋白的差異較大。

綜上所述,該研究認為,不是全部A. tumefaciens株系基因組含有Tae4基因,部分A. tumefaciens株系不含Tai4基因。說明對于A. tumefaciens和A. vitis,Tae4蛋白和Tai4蛋白雖然可以做為一種攻擊其他病原菌的“武器”及自身免疫這種“武器”的防具,但這兩種蛋白的編碼基因并非生長發育所必須的基因。A. tumefaciens和A. vitis的Tae4蛋白的氨基酸序列差異較大,不同葡萄根癌病病原菌間的Tae4基因功能可能存在差異。

猜你喜歡
結構域病原菌基因組
“植物界大熊貓”完整基因組圖譜首次發布
我國小麥基因組編輯抗病育種取得突破
宏基因組測序輔助診斷原發性肺隱球菌
細菌性食物中毒的病原菌調查與預防淺談
植物免疫系統“合作”御敵
結核分枝桿菌蛋白Rv0089的生物信息學分析
黃星天牛中腸中內切葡聚糖酶的鑒定與酶活性測定
早產兒與足月兒發生新生兒敗血癥的特點比較
蛋白質功能預測方法研究進展
RGA法標記植物抗病基因的研究進展
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合