?

副地衣芽孢桿菌FA6全基因組測序及比較基因組學分析

2020-04-06 05:09吳山功豐文雯
水生生物學報 2020年2期
關鍵詞:芽孢基因組測序

趙 帝 吳山功 豐文雯

(1. 中國科學院水生生物研究所農業部水產養殖病害防控重點實驗室, 淡水生態與生物技術國家重點實驗室,武漢 430072; 2. 中國科學院大學, 北京 100049)

地衣芽孢桿菌(Bacillus licheniformis)屬于枯草芽孢桿菌近緣種, 是芽孢桿菌屬中具有重要應用價值的菌種之一, 在工業發酵、農業生產、醫藥衛生、食品保健、水產養殖等領域應用廣泛[1]。盡管同種屬細菌的不同菌株表型非常相似, 但基因組的差異往往很大[2]。隨著研究的深入和技術的進步,不同菌株可以聚類成2支, 這2支的菌株在基因組特征和和表型方面存在細微差異, 因此地衣芽孢桿菌的不同菌株被分為兩個種, 地衣芽孢桿菌或新種副地衣芽孢桿菌(B. paralicheniformis)[3,4]。副地衣芽孢桿菌的細胞呈桿狀, 是一種革蘭氏陽性細菌, 其可以分泌高活性的胞外產物, 包括蛋白酶、脂肪酶和碳水化合物水解酶[3]。其中, 碳水化合物水解酶類主要包含淀粉酶、果膠酶、葡聚糖酶和纖維素酶, 這些酶有助于降解植物性飼料中的復雜的碳水化合物, 從而促進養殖動物對營養物質的吸收, 提高植物性飼料的利用率[5]。然而, 目前關于副地衣芽孢桿菌在水產養殖中研究和報道還很少。

草魚(Ctenopharyngodon idellus)是全球水產養殖產量最大的一個品種。在中國, 草魚的養殖產量占水產養殖總產量的18.2%以上[6,7]。草魚是草食性魚類, 主要以水生植物為食[8], 目前的研究表明草魚消化植物性食物需要依靠腸道微生物的作用[9]。本課題組前期從草魚腸道內分離到1株細菌, 16S rRNA基因序列相似性鑒定表明該菌株與和地衣芽孢桿菌DSM 13的相似性最高(99.5%), 且與地衣芽孢桿菌的生理特性基本相似, 因此最初命名為地衣芽孢桿菌FA6[10], 初步研究發現其可以在腸道內長期定植, 能夠降解淀粉和纖維素等多種碳水化合物。為深入研究地衣芽孢桿菌FA6可能的益生機制, 有必要解析其基因組序列信息。本研究通過三代測序技術對地衣芽孢桿菌FA6進行了基因組測序, 進而深度挖掘其基因組信息, 推測地衣芽孢桿菌FA6可能的益生作用機制, 從而為該菌株在水產養殖中的應用提供了理論依據。同時, 本研究通過比較基因組學分析[11], 將地衣芽孢桿菌FA6與其他不同來源的4株芽孢桿菌菌株進行比較, 研究結果對于理解地衣芽孢桿菌FA6的適應性進化具有重要意義。

1 材料與方法

1.1 菌株培養及基因組DNA提取

將菌株接種于LB液體培養基(胰蛋白胨10 g/L,酵母提取物5 g/L, NaCl 10 g/L), 37℃有氧培養18h,在600 nm的波長下用紫外分光光度計測定吸光度值為1.376。菌液在7000 r/min下離心10min, 收集菌體重量約5 g, 使用QIAamp?DNA Stool Mini Kit(Qiagen, Germany)試劑盒提取基因組DNA, 步驟按照試劑盒說明書進行。最后, 用超微量分光光度計(Nanodrop 8000, Thermo)測定DNA的濃度。

1.2 基因組測序、組裝與注釋

細菌DNA濃度檢測合格后送武漢菲沙基因信息有限公司行全基因組測序。采用全基因組擴增(Whole-genome Amplification, WGA)策略構建不同插入片段的文庫, 使用Qubit 3.0和 Agilent 2100對文庫質量進行檢測。檢測合格后基于PacBio測序平臺對這些文庫進行測序, 使用SMRT LINK 5.0軟件進行數據處理, 采用HGAP軟件[12]和Canu軟件[13]對純三代數據進行組裝。采用Glimmer version 3.02軟件[14]對細菌基因組進行基因結構、開放閱讀框(Open Reading Frame, ORF)及蛋白基因的預測。編碼蛋白質的基因通過與非冗余蛋白數據庫(Non-redundant, NR)、直系同源基因簇數據庫(Cluster of Orthologous Groups of proteins, COG)和基因本體論(Gene Ontology, GO)數據庫[15]進行BLASTp比對,篩選條件為e-value小于等于1e-5, 獲取比對得分最高的條目, 完成蛋白序列功能注釋。全基因組的rRNA和tRNA分別使用RNAmmer version 1.2[16]和tRNAscan-SE[17]進行預測或掃描。

1.3 比較基因組學分析

地衣芽孢桿菌FA6的基因組序列上傳至NCBI(https://www.ncbi.nlm.nih.gov/)的GenBank中, 序列號為CP033198。比較基因組學用于對地衣芽孢桿菌FA6株的基因組序列與已完成測序的近緣芽孢桿菌序列比較分析, 這些菌株包括副地衣芽孢桿菌ATCC 9945a(GenBank: CP005965)、副地衣芽孢桿菌14DA11(GenBank: CP023168)、地衣芽孢桿菌ATCC 14580(GenBank: CP000002)和地衣芽孢桿菌CBA 7132(GenBank: CP021970), 4株細菌的基因組序列及注釋信息下載自GenBank數據庫。統計5株芽孢桿菌基因組的基本特征, 使用Mauve軟件進行基因組共線性分析[18], 設置局部共線區(Locally collinear blocks, LCBs)的最小權重值為143, 其他程序采用默認參數。蛋白編碼基因的京都基因組和基因組百科全書(Kyoto Encyclopedia of Genes and Genomes, KEGG)通路注釋采用KAAS自動化注釋系統完成[19]。此外, 基因組預測的ORFs用于搜索dbCAN(http://csbl.bmb.uga.edu/dbCAN/)[20], 進行碳水化合物活性酶(Carbohydrate-Active Enzymes,CAZy)家族注釋和分析(http://www.cazy.org/), 參數使用E值<10-5, 覆蓋率coverage > 0.35。

2 結果

2.1 基因組裝與注釋

菌株FA6的基因組序列與副地衣芽孢桿菌ATCC 9945a的基因組相似度最高(99.99%), 而與地衣芽孢桿菌DSM 13的基因組的相似度僅為96.01%,因此本研究將其更名為副地衣芽孢桿菌FA6。副地衣芽孢桿菌FA6的基因組由1條環狀染色體組成,大小為4450579 bp, GC含量為45.9%?;蚪M包含4760個預測的蛋白質編碼序列(Coding sequence,CDS), 占整個基因組的88.37%, 平均長度為826 bp。此外基因組包含24個核糖體rRNA、81個轉運tRNA以及278個非編碼ncRNA, 基因組圈圖見圖 1。

CDS進一步與COG數據庫比對, 進行同源基因注釋分類, 根據COG分類標準將基因劃分為25類,以英文大寫字母(A—Z)表示每一類的代碼(圖 2)。共有3438個蛋白獲得COG功能注釋, 其中參與糖類轉運與代謝(G, Carbohydrate transport and metabolism)、轉錄(K, Transcription)、氨基酸代謝及轉運(E, Amino acid transport and metabolism)、核糖體結構及合成(J, Translation, ribosomal structure and biogenesis)以及無機離子轉運和代謝(P, Inorganic ion transport and metabolism)的基因豐度較高, 其數量分別為384、369、346、239和221個。將CDS編碼對應的蛋白序列與GO數據庫比對, 獲得注釋信息和功能聚類。GO數據庫將蛋白序列分為三大類:生物過程(Biological process)、分子功能(Molecular function)和細胞組分(Cellular component)。這三大類又進一步分為多種過程, 注釋結果顯示歸類為代謝過程(Metabolic process)、細胞內過程(Cellular process)、催化活動(Catalytic activity)、黏合(Binding)和細胞組分(Cell part)的基因豐度最高。

圖 1 副地衣芽孢桿菌FA6基因組圈圖Fig. 1 Circle map of the genome of B. paralicheniformis FA6

圖 2 副地衣芽孢桿菌FA6基因組的COG功能分類Fig. 2 Gene distribution based on cluster of Orthologous groups of B. paralicheniformis FA6

根據基因組的注釋信息, 副地衣芽孢桿菌FA6基因組含有128個蛋白酶基因, 32個脂肪酶基因, 1個次級膽汁酸合成相關基因, 以及72個糖苷水解酶酶基因, 這些基因與食物降解相關。此外, 副地衣芽孢桿菌FA6基因組含有7個編碼羊毛硫抗生素(Lantibiotics)相關基因, 包括2型羊毛硫抗生素合成(Type 2 lantibiotic biosynthesis)LanM家族蛋白、羊毛硫抗生素轉運蛋白(Lantibiotic transporter)LanT、羊毛硫抗生素保護ABC轉運蛋白通透酶(Lantibiotic protection ABC transporter permease)MutG和MutE、羊毛硫抗生素保護ABC輸出ATP結合蛋白(Lantibiotic protection ABC exporter ATP-binding protein)、羊毛硫抗生素合成蛋白LanM(Lantibiotic biosynthesis protein LanM)和羊毛硫抗生素轉運ATP結合蛋白(Lantibiotic transport ATP-binding protein)SrtF相關基因。

2.2 五株芽孢桿菌基因組基本特征

5株芽孢桿菌菌株的基因組大小和GC含量相似, 基因組大小在4.21—4.54 Mb, GC含量在45.8%—46.2%(表 1)。同一種細菌的不同菌株的基因組特征更加接近, 副地衣芽孢桿菌FA6在基因組大小和GC含量方面更接近其他副地衣芽孢桿菌菌株。比較5株菌的rRNA和tRNA的數量, 結果顯示, 來源于土壤的副地衣芽孢桿菌ATCC 9945a和地衣芽孢桿菌ATCC 14580的RNA數量相同, 均含有21個rRNA和72個tRNA; 來源于腸道或食物的3株細菌(副地衣芽孢桿菌FA6、副地衣芽孢桿菌14DA11和地衣芽孢桿菌CBA 7132)的RNA數量相同, 均含有24個rRNA和81個tRNA。

2.3 基因組共線性分析

采用Mauve軟件對5株芽孢桿菌的全基因組進行比對分析, 共得到41個LCBs(圖 3)。5株地衣芽孢桿菌的基因組間共線關系較好, 但是存在少量的插入、缺失、倒位和易位等基因重排事件。其中, 相對于其他菌株, 副地衣芽孢桿菌FA6的基因組起始端的3個LCBs, 總長度約45 kb, 出現倒位和易位的現象。

2.4 蛋白編碼基因KEGG注釋比較

對5株芽孢桿菌蛋白編碼的基因進行KEGG注釋(表 2), 副地衣芽孢桿菌FA6、副地衣芽孢桿菌ATCC 9945a、副地衣芽孢桿菌14DA11、地衣芽孢桿菌ATCC 14580和地衣芽孢桿菌CBA 7132分別有1209、1206、1167、1171和1184個代謝相關的基因映射在118個代謝通路上; 分別有284、275、272、266和263個與環境信息處理相關的基因映射在21個代謝通路上。

表 1 副地衣芽孢桿菌FA6與4株芽孢桿菌全基因組序列基本特征比較Tab. 1 General genomic features of Bacillus paralicheniformis FA6 as compared to 4 other Bacillus strains

圖 3 五株芽孢桿菌基因組共線性分析Fig. 3 Synteny block of Bacillus spp. genome

表 2 五株地衣芽孢桿菌的KEGG功能注釋Tab. 2 KEGG annotation of 5 Bacillus strains

2.5 碳水化合物活性酶(CAZy)基因分析

5株芽孢桿菌的基因一共有67個CAZy家族, 包括5個碳水化合物結合結構域家族(Carbohydrate-Binding Module, CBM)、11個碳水化合物酯酶家族(Carbohydrate Esterases, CE)、30個糖苷水解酶家族(Glycoside Hydrolase, GH)、12個糖基轉移酶家族(Glycosyl Transferase, GT)。副地衣芽孢桿菌FA6、副地衣芽孢桿菌ATCC 9945a、副地衣芽孢桿菌14DA11、地衣芽孢桿菌ATCC 14580和地衣芽孢桿菌CBA 7132的CAZy基因數量分別為180、127、131、132和138個; 植物多糖降解酶基因數量分別為34、32、28、27和28個(表 3); 淀粉酶基因(GH13家族)數量分別為5、4、4、4和4個。植物多糖降解酶基因包括纖維素酶、半纖維素酶、脫支酶和寡糖降解酶基因, 這些酶類基因在副地衣芽孢桿菌基因組中的數量分別是5、7、1和21個, 其中纖維素酶基因又包含4個內切纖維素酶基因(3個GH5和1個GH9基因), 1個外切纖維素酶基因(GH48)。

此外, 比較分析發現副地衣芽孢桿菌FA6在CBM50、GH4、GH23、GH28和GT2等家族的基因數量明顯多于其余4株菌。其中, CBM50和GH23均與降解肽聚糖和幾丁質相關。此外, 一些基因僅在副地衣芽孢桿菌FA6的基因組出現, 包括1個CE11基因、1個CE15基因和1個GT30基因。

3 討論

本研究采用三代測序技術, 獲得了副地衣芽孢桿菌FA6的全基因組序列。副地衣芽孢桿菌FA6基因組由一條環狀染色體組成, 大小為4450579 bp, 整體GC含量為45.9%。比較5株芽孢桿菌(副地衣芽孢桿菌FA6、副地衣芽孢桿菌ATCC 9945a、副地衣芽孢桿菌14DA11、地衣芽孢桿菌ATCC 14580和地衣芽孢桿菌CBA 7132)的基因組特征, 發現與地衣芽孢桿菌菌株相比, 菌株FA6基因組特征, 如基因組大小和GC含量, 更接近于副地衣芽孢桿菌菌株?;蚪M共線性分析顯示5株芽孢桿菌的共線性關系較好, 但是不同菌株基因組之間存在倒位和易位等染色體變異事件。染色體的易位可能導致某些基因的融合, 進而導致物種某些功能的改變[21],這可能是同種屬不同菌株出現功能差異的原因。KEGG代謝通路比較分析發現5株芽孢桿菌中環境信息相關的基因數量差異較大, 而本研究中5株芽孢桿菌的來源差異很大, 說明菌株基因組的進化可能是為了適應生存環境。

表 3 五株芽孢桿菌GH家族植物多糖降解酶基因比較Tab. 3 Comparison of predicted GH profiles targeting plant structural polysaccharides in 5 Bacillus strains

羊毛硫抗生素是在革蘭陽性細菌的核糖體上合成的一類作用于細胞膜上的熱穩定小分子抗菌肽, 對革蘭氏陽性菌有抑菌活性, 對革蘭氏陰性菌基本無抑制作用[22]。近年來, 抗菌肽作為抗菌藥物的替代品引起了廣泛關注。副地衣芽孢桿菌FA6基因組中含有多種編碼羊毛硫抗生素相關的基因,如LanM、LanT、MutG和MutE等蛋白基因, 具有修飾和轉運功能, 這對于羊毛硫抗生素的合成開發具有重要意義。同時, 副地衣芽孢桿菌FA6可能可作為抗生素的替代品, 用于預防革蘭氏陽性細菌引起的細菌病。

在天然水體中, 草魚主要以水草為食, 水草細胞壁主要成分是纖維素和半纖維素。纖維素和半纖維素必須在纖維素酶和半纖維素酶的作用下被水解成單糖才能被動物吸收利用[23,24]。然而, 草魚的基因組不含纖維素酶和半纖維素酶基因[25], 而草魚腸道微生物含有大量的纖維素酶和半纖維素酶基因[26], 因此草魚消化植物性食物需要依靠腸道微生物。與其他芽孢桿菌相比, 副地衣芽孢桿菌FA6具有較多的纖維素酶和半纖維素酶基因, 能夠更好地降解植物細胞壁。淀粉是大多數高等植物細胞中一種重要的多糖[27,28], 副地衣芽孢桿菌FA6基因組中有5個淀粉酶基因, 而其他芽孢桿菌只有4個, 因此副地衣芽孢桿菌FA6能夠更好的利用利用植物細胞中的淀粉類多糖。在比較的5株芽孢桿菌中, 副地衣芽孢桿菌FA6含有21個植物寡糖降解酶基因, 是最多的一株。以上這些結果說明副地衣芽孢桿菌FA6具有較為完整的植物糖類水解酶體系, 高度適應植物性成分, 反映了該菌株在草魚腸道中的適應性進化[29]。此外, 副地衣芽孢桿菌FA6基因組中含有大量與氨基酸代謝、脂肪代謝相關的基因, 說明FA6有良好的食物降解能力。因此, 副地衣芽孢桿菌FA6可能可以作為益生菌添加到飼料中, 幫助宿主消化食物成分、提高植食性食物的利用效率。

猜你喜歡
芽孢基因組測序
枯草芽孢桿菌在養雞生產中的應用
牛參考基因組中發現被忽視基因
外顯子組測序助力產前診斷胎兒骨骼發育不良
科學家找到母愛改變基因組的證據
血清HBV前基因組RNA的研究進展
解淀粉芽孢桿菌Lx-11
解淀粉芽孢桿菌的作用及其產品開發
側孢短芽孢桿菌A60
中草藥DNA條形碼高通量基因測序一體機驗收會在京召開
基因測序技術研究進展
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合