?

SXT/R391元件核心基因的生物信息學分析

2019-12-25 08:43張琪周靜周江林孔娜胡明達彭小川李北平梁龍靳遠任洪廣岳俊杰
生物技術通訊 2019年5期
關鍵詞:宿主元件基因組

張琪,周靜,周江林,孔娜,胡明達,彭小川,李北平,梁龍,靳遠,任洪廣,岳俊杰

軍事科學院軍事醫學研究院生物工程研究所,北京100071

原核生物的可移動遺傳元件(mobile genetic element,MGEs)可通過接合、轉化、轉導等方式介導遺傳物質在不同種屬細菌間的橫向(水平)基因轉移(lateral/horizontal gene transfer,LGT/HGT)。Burrus 于2002 年首次對那些可以從染色體上剪切并整合進宿主染色體,通過接合的方式在細菌細胞之間進行轉移的遺傳元件進行了歸類,稱之為整合性接合元件(integrating conjugative elements,ICEs)[1]。ICEs 兼有質粒和噬菌體的特征,與接合性質粒相似,它可通過接合的方式進行轉移;與質粒不同的是,它們不能自主復制,其復制方式與溫和噬菌體相似,通過整合進宿主染色體,隨宿主染色體一起復制[2]。ICEs 具有吸收和傳播包括毒力因子及耐藥基因在內的多種特性基因進入細菌宿主細胞的功能。它們常賦予宿主細菌新的性狀,如耐藥性和致病性等[3]。

迄今,已在多種細菌中發現了ICEs,但目前還沒有公認的ICEs 分類方法。歐竑宇提出了根據整合酶序列相似性以及核心結構同線性的特征對ICEs 進行分類的方法[4],按照這種方法可以把發現的大部分ICEs 歸為28 個家族。SXT/R391是目前已知的ICEs 中研究最早和最詳細的一個家族[5]。

SXT 元件最早發現于1992 年在印度和孟加拉導致霍亂的O139 群霍亂弧菌MO10 的染色體上,該元件能夠以整合接合的方式進入宿主菌染色體。SXT 攜帶多種耐藥基因,能夠介導霍亂弧菌對磺胺甲惡唑(sulfamethoxazole,Su)、甲氧芐氨嘧啶(trimethoprim,Tm)、鏈霉素(streptomycin,Sm)和氯霉素(chloramphenicol,Cm)的耐藥性。當時根據其攜帶的基因編碼對磺胺甲惡唑和甲氧芐胺嘧啶的抗性而命名為SXT[6]。R391 在上世紀70年代早期被鑒定為賦予抗卡那霉素的質粒,最初被認為是不相容性群質?!癐ncJ”的原生代表。20多年后,很多研究表明R391 和其他被稱作“R 因子”的遺傳元件具有與SXT 高度類似的基因組骨架結構以及固定的染色體插入/重組位點,它們與SXT 實際上屬于同一類型的整合接合元件,因此將這一類元件劃分為同一個SXT/R391 家族。

目前發現的SXT/R391 元件基因組的大小為70~120 kb。SXT/R391 元件的基因組包括核心保守區和可變區兩部分[5,7-8]。SXT/R391 元件的保守區編碼的基因介導SXT 元件的整合/切除、接合轉移和ICEs 生命周期所需的調控,另外一些保守基因的功能未知。SXT/R391 可變區基因的編碼產物主要負責宿主對抗生素的耐藥性、重金屬離子抗性、生物膜形成和細菌運動能力的調節,另外也編碼毒素-抗毒素系統、限制性修飾系統、解旋酶、核酸內切酶等[9]。

作為多藥耐藥(multi-drug resistance,MDR)基因的載體,SXT 元件在菌株間播散可造成新的優勢菌型流行。SXT/R391 元件的進化是造成其擴散能力增強的驅動力。闡明SXT/R391 家族元件的進化特征有助于防止SXT 元件擴散,將對致病菌防控研究起到重要的實踐指導意義。

1 材料與方法

1.1 數據搜集

首先以“SXT/R391”及“ICE”為關鍵詞在PubMed 中搜索獲得含有報道SXT/R391 元件的文獻,通過閱讀文獻獲取SXT/R391 元件的序列信息。接著進行SXT/R391 元件的預測,為了保證獲得完整的SXT/R391 元件序列,我們從基因組序列完整度為完整基因組(Complete Genome)和染色體(Chromosome)狀態的9632 個細菌基因組序列中搜索SXT/R391 元件。通過BLASTp 軟件進行比對,匹配結果中包含整合與剪切模塊(integration/excision module)、DNA 分泌模塊(DNA secretion module)和調控模塊(regulation module)等3 個必需模塊的蛋白區域推斷為潛在的ICE,如果在一段連續區域內(70~130 kb)出現編碼SXT/R391 家族元件的整合酶Int、Ⅳ型分泌系統接合蛋白和調控蛋白SetR 的基因,則預測該基因組存在一個完整的SXT/R391 元件。最終,我們通過文獻和預測獲得83 個SXT/R391 家族元件。

1.2 研究方法

提取SXT/R391 元件的52 個核心基因序列,對83 個元件做Blast 分析,分析每個基因在83 個元件上的分布和復制情況。

1.2.1 重組分析 應用分子生物學軟件包RDP4[10]中的RDP、GENECONV、BootScan、MaxChi、Chimaera 等5 種較為常見的方法,分別探測83 個SXT/R391 元件的52 個核心基因序列的重組事件和重組信號。其中,GENECONV 的參數g-scale 設置為1,允許重組片段內部的錯配;其他方法的參數設置為默認值,不作修改。P≤0.01 為具有統計學顯著性差異。

1.2.2 正選擇分析 選擇在線工具Datamonkey(http://datamonkey.org/)[11]進行SXT/R391 元件核心基因的正選擇壓力分析。首先使用MUSCLE 進行序列比對,提交序列及選擇運算模型。我們選擇了4 種模型,即隨機效應似然法(REL)、固定效應似然法(FEL)、單一祖先計數法(SLAC)及混合效應進化模型方法(MEME)。依據ω 值[ω=dN/dS(非同義置換率/同義置換率)]判斷選擇的方向。當ω>1 且差異顯著時判斷為正向選擇,0<ω<1 時為凈化選擇,ω=1 時為中性選擇。

2 結果

2.1 SXT/R391 元件的序列整理及菌屬分布

通過文獻收集和預測共獲得83 個SXT/R391元件的基因組序列,包括從文獻中提取的54 個和細菌基因組序列中預測的29 個,元件所在宿主基因組的分離時間為1967~2014 年,地理分布包括21 個國家和地區,元件宿主跨越25 個菌屬。在預測的29 個SXT/R391ICE 元件中,有12 個曾經被報道,但未提取和報道元件的完整序列。SXT/R391元件的宿主廣泛(圖1),但分布存在較大偏性,在霍亂弧菌中發現的數量最多,奇異變形桿菌緊隨其后。有趣的是,臨床發現的SXT/R391 元件也都集中在霍亂弧菌和奇異變形桿菌。在環境中發現的SXT/R391 元件大多來自水環境。SXT/R391的菌種分布不均勻,說明元件能在宿主中存在和保藏可能需要滿足一定的遺傳背景。

2.2 核心基因分析

Wozniak 等對13 個SXT/R391 元件的基因組進行了比較分析[7],發現該元件具有52 個核心基因。我們提取了SXT/R391 元件的52 個核心基因序列,對獲得全基因組信息的83 個SXT/R391 元件的全基因組序列進行同源搜索,分析元件的核心基因的分布情況,結果見圖2。

83 個SXT/R391 元件中有一個特殊的成員ICEPmiChn3,該元件缺少20 個核心基因,其中13個發揮接合功能。缺少的20 個核心基因被一個新的由轉座子和耐藥基因組成的基因簇取代。實驗結果表明,該元件的接合功能完全喪失[12],因而ICEPmiChn3 已經不是一個具有完整組件和功能的元件。因此,后續的核心基因數量分析排除了該元件。

經過計算,52 個核心基因中有39 個依然出現在全部元件中。另外有6 個基因僅在1 個元件中缺少,這些基因可稱為軟核心基因(soft core)[13]。另有7 個基因(rumA、s024、s025、s026、traL/E/K)在2 個或2 個以上元件中缺失,其中的rumA、s024、s025、s026都是SXT/R391 元件擴散所需的最小功能基因集合,缺失這些基因可能會影響元件的傳播擴散。以上結果說明從文獻報道的13 個元件中推導出的52 個核心基因并不都是嚴格保守的核心基因,其中有一些基因屬于軟核心基因。

圖1 SXT/R391 的菌屬分布

值得注意的是,83 個元件的整合酶基因有2類,分別為int-1、int-2,2 類間的序列相似性僅為22%。裂解酶xis基因也有2 類,分別為xis-1、xis-2。我們發現在元件中,int-1與xis-1協同出現,int-2和xis-2協同出現。

另外,從圖2 可以看出,traFHG、eex、setC、setD、s082、s083、s084、s086、setR基因在菌株Alteromonas macleodiistr.MED6-ICE 的SXT/R391 元件中出現了整體的基因復制。

2.3 核心基因的融合和裂解

除了基因復制,還有少數核心基因呈現了基因融合/裂解信號。全長rumB基因讀框長度為1269 bp,蛋白產物為423 aa,但該基因在46 個元件表現為2 個及更多的片段(圖3),說明rumB基因發生了基因融合/裂解,可能與位點附近發生的頻繁的插入有關。

此外,trhF與traW在一些元件中為2 個基因。如在元件Proteus mirabilisMD20140901(KX243408)中,trhF讀框[54557..55069],長度513 bp,蛋白產物171 aa;traW讀框[55080..56204],長度1125 bp,蛋白產物375 aa。再如,在元件Vibrio choleraeO37MZ03(JQ345361)中,trhF讀框[26846..27358],長度513 bp,蛋白產物171 aa;traW讀框[27369..28493],長度1125 bp,蛋白產物375 aa。但在元件Providencia stuartiiATCC33672(CP008920)中,對應的2 個基因融合為1 個基因,融合基因讀框[1904626..1906272](基因組位置),長度1647 bp,融合蛋白產物(549 aa)為type-F conjugative transfer system pilin assembly family protein(AIN64681.1)。

圖2 核心基因分布情況

圖3 rumB 基因在不同元件中的分布

2.4 核心基因的重組分析

元件之間的重組能導致形成新的雜合元件,重組事件是SXT/R391 元件多樣性產生的動力之一。有研究報道,SXT/R391 元件核心區存在基因間重組。重組除了發生在基因及基因以上水平,還可能發生在亞基因水平(sub-gene level)。為了探測SXT/R391 元件的亞基因水平重組事件,我們檢測了SXT/R391 元件52 個核心基因的基因內重組。在52 個核心基因中,有22 個核心基因在3種及3 種以上的方法中可以檢測到明顯的重組信號(表1)。

圖4 用紅色標出了重組基因在SXT/R391 元件基因組上的位置,這些基因涉及元件核心基因的全部4 個必需功能模塊,即整合與剪切模塊、DNA 復制及加工模塊(replication/DNA processing module)、DNA 分泌模塊和調控模塊。分泌模塊,即Ⅳ型分泌系統(type Ⅳsecretion system,T4SS)有關基因簇的大部分基因都檢測到了重組信號。此外,還有一些具有重組信號的核心基因為未知功能基因。

2.5 正選擇分析

正選擇(positive selection)也是微生物進化過程中獨立的遺傳變異驅動力,在生物的適應性進化中發揮關鍵作用。我們檢測了SXT/R391 元件基因組中基因的正選擇信號。為了避免重組事件對正選擇分析造成干擾,我們只在未發生重組事件的核心基因上檢測正選擇。計算結果顯示,除去以上分析的22 個發生重組的核心基因,SXT/R391 元件中沒有重組信號的30 個核心基因中有7 個檢測到正選擇信號(表2)。這7 個基因中的mobI和traJ編碼SXT/R391 元件接合轉移所需蛋白,其他5 個基因編碼未知功能蛋白,且不在SXT/R391 ICE 最小功能基因集合(minimal functional SXT/R391 ICE gene set)中,它們對SXT/R391 元件多樣性的貢獻有待進一步研究。

表1 核心基因重組信號檢測

圖4 22 個發生重組的核心基因在SXT/R391 元件骨架上的位置

表2 核心基因的正選擇氨基酸數量與位點

利用I-TASSER 軟件對mobI和TraJ基因編碼的蛋白進行三維結構預測[14]。從預測的三維結構圖(圖5)中可以看出,mobI基因編碼的蛋白上正選擇位點52、104 殘基處于α螺旋結構的端頭,130殘基位于另一α螺旋結構上;TraJ 基因編碼的蛋白發生正選擇的位點62 殘基正處于α螺旋結構的端頭位置,195 殘基位于α螺旋結構上,根據預測該蛋白的191~210 殘基為一個跨膜結構域,正選擇位點195 殘基處于該結構域內。以上位點所處的蛋白結構域或與轉移運輸有關,這些位點受到選擇壓力可能與元件的轉移擴散相關。

圖5 mobI 基因(A)和traJ 基因(B)編碼蛋白的三維結構及正選擇位點

3 討論

作為MDR基因的載體,SXT 元件在菌株間播散可造成新的優勢菌型流行。SXT/R391 元件的進化是造成其擴散能力增強的驅動力。闡明SXT/R391 家族ICEs 的進化特征、遷移模式及其散播的分子機制,有助于防止SXT 元件擴散,對致病菌防控研究有重要的實踐指導意義。SXT/R391 元件的核心基因決定了元件的復制和轉移。重組和正選擇是微生物進化過程中2 種獨立的遺傳變異驅動力,在生物的適應性進化中發揮關鍵作用。本研究收集了目前發現的SXT/R391元件,對核心基因的分布以及核心基因的重組和正選擇兩大進化特征進行了分析。

本研究表明,同源重組和正選擇在SXT/R391元件核心基因的進化過程中發揮了重要作用。我們發現了22 個核心基因在進化中經歷了同源重組,導致了元件相當一部分核心基因的遺傳變異。另外,有7 個核心基因存在正選擇信號,其中2 個基因mobI和traJ與元件的接合轉移有關。元件發生重組和正選擇變異都是為了SXT/R391 元件適合度的提升,從而能適應生態環境的變化。綜上,我們分析了SXT/R391 元件核心基因的特征及適應性進化,為了解SXT/R391 元件的擴散及進化規律奠定了基礎。

猜你喜歡
宿主元件基因組
承壓類特種設備受壓元件壁厚測定問題的探討
牛參考基因組中發現被忽視基因
科學家找到母愛改變基因組的證據
病原體與自然宿主和人的生態關系
血清HBV前基因組RNA的研究進展
龜鱉類不可能是新冠病毒的中間宿主
紫花白及基因組DNA提取方法的比較
中核北方核燃料元件有限公司
帶擾流孔波紋板蓄熱元件的分析
抓住自然宿主
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合