?

紫九牛葉綠體基因組密碼子偏好性分析

2022-09-07 08:53梁湘蘭黃青青嚴其偉覃逸明
廣西植物 2022年8期
關鍵詞:葉綠體同義基因組

郭 松, 梁湘蘭, 黃青青, 盧 祥, 嚴其偉, 張 鵬, 覃逸明 *

( 1. 廣西科技師范學院 食品與生化工程學院, 廣西 來賓 546199; 2. 廣西科技師范學院 特色瑤藥資源研究與開發重點實驗室, 廣西 來賓 546199 )

密碼子是聯結生物體內遺傳物質和蛋白質翻譯的紐帶(謝平,2017;柳燕杰等,2020),在生物體內起著重要作用。20種常見氨基酸,除了蛋氨酸(methionine,Met)和色氨酸(tryptophane,Trp)具有單一密碼子外,其余氨基酸均由2~6個同義密碼子編碼(胡曉艷等,2019)。同義密碼子的使用具有非均一性的特點(梁菲菲,2010)。某一物種或者某一基因傾向使用一種或者使用幾種特定的同義密碼子的現象稱為密碼子的使用偏好性(codon usage bias,CUB)(吳憲明等,2007)。密碼子偏好性是生物長期進化過程中所形成,不同物種間密碼子使用的偏好性不同(趙森等,2020)。隨著高通量測序技術的發展,目前已經有多種藥用植物葉綠體基因組完成了密碼子偏好性的分析,對于探索物種進化及提高外源基因的表達水平起到了推動作用。

紫九牛為傳統老班瑤藥“虎牛鉆風”中的“?!鳖愃幬?,來源于鼠李科屬植物翼核果()的根和莖,別名血風藤、鐵牛入石、紅穿破石、青筋藤、牛參等?,庒t認為紫九牛具有養血祛風、舒筋活絡、固腎益精等功效(覃迅云等,2001),民間常用其治療慢性肝炎、肝風化、風濕筋骨疼痛、風濕性關節炎、腰肌勞損等疾病(林明琛等,2020)?,F代醫藥學研究表明,紫九牛中富含翼核果醌和大黃素等活性化合物(應百平等,1988;王雪芬等,1993),具有抗菌、止咳、抗腫瘤等活性(Wang et al.,2008;梁冰等,2012;Hu et al.,2020)。作為一種經典瑤藥,已經開始被廣泛應用于多種疾病的開發治療,但是對于紫九牛葉綠體基因組密碼子偏好性的分析,尚未有研究。

本文利用Codon W 1.4.2、在線軟件CUSP和Chips、R語言等軟件和程序,對紫九牛葉綠體基因組的密碼子進行分析,研究其密碼子的偏好性以及偏好性形成的因素,并確立最優密碼子,為紫九牛葉綠體基因組基因的改良,目標基因的優化提供依據。

1 材料與方法

1.1 葉綠體基因組序列的獲得

紫九牛葉綠體基因組序列信息由本實驗室測序獲得,已上傳NCBI數據庫(GenBank登錄號為MT974496),共有91條可以編碼蛋白質的基因序列(coding DNA sequence,CDS)。選擇其中長度大于300 bp的蛋白質編碼序列為分析樣本,最終得到50條CDS用于后續的分析。

1.2 分析方法

1.2.1 密碼子偏好性相關參數分析 使用軟件Codon W 1.4.2計算紫九牛葉綠體基因組同義密碼子的相對使用度(relative synonymous codon usage, RSCU)。根據RSCU分析的結果:當RSCU=1時,該密碼子不存在偏性(吳妙麗等,2019;梁曉靜等,2020);當RSCU>1時,同義密碼子中偏好使用該密碼子,并將該密碼子確定為高頻密碼子(林濤等,2002),反之亦然。使用在線軟件Chips可以分析各CDS的有效密碼子數(effective number of codons,ENC),ENC值可以反映密碼子偏倚性的強弱,其取值范圍為20到61,當ENC值為20時,同義密碼子完全處于偏倚狀態,當ENC值為61時,則表明同義密碼子沒有偏倚(趙森等,2020);ENC值從大到小偏倚性由弱變強,通常ENC值45作為區分偏倚性強弱的標準(吳憲明等,2007)。通過在線軟件CUSP,分析各CDS的GC含量,分別用GC、GC、GC來表示密碼子第一、第二、第三位的G/C含量,用GC來表示三個密碼子的平均GC含量。

1.2.2 影響密碼子偏好性的因素 使用軟件SPSS 19.0對各CDS中不同位置的GC,即GC、GC、GC、GC,以及密碼子數目(N)和ENC進行相關性分析,判斷各參數之間的相關性,進而判斷密碼子偏好性受到的因素影響。通過中性繪圖,分析GC和GC的平均值GC和GC的相關性。將各CDS同義密碼子的第三位堿基GC(用GC表示)和ENC利用R語言作ENC-plot分析,標準曲線方程為ENC=2+GC+{29/[GC+(1-GC)]}(羅洪等,2015)。并利用標準方程求出ENC,根據ENC=(ENC-ENC)/ENC,根據數據分析50個基因中ENC的期望值與實際值的相差程度。

1.2.3 最優密碼子的確定 以ENC為基準,從兩端各選10%的基因,即兩端各選5條CDS,以ENC值較小的5條CDS確定為高基因表達庫,ENC數值較大的5條CDS確定為低基因表達庫,將從兩端篩選出來的兩個高低基因庫的基因序列分別整合到兩個fasta文件中,通過軟件Codon W 1.4.2來分析其RSCU值,以得到高低基因庫的△RSCU,將△RSCU≥0.08的密碼子確定為高表達的優越密碼子(林濤等,2002)。若一密碼子既符合高表達優越密碼子的條件,又符合高頻密碼子的條件,則將該密碼子確定為最優密碼子(劉慧等,2017)。

2 結果與分析

2.1 偏性

2.1.1 RSCU分析 通過軟件Codon W 1.4.2分析了紫九牛葉綠體基因組50條CDS中的各同義密碼子的相對頻率,結果如表1所示。各同義密碼子中RSCU>1的有29個,其中以A/U結尾的有28個,說明了紫九牛葉綠體基因偏好以A/U結尾。

表 1 紫九牛葉綠體基因組中各氨基酸的RSCU分析Table 1 RSCU analysis of amino acids in chloroplast genomes of Ventilago leiocarpa

2.1.2 GC含量及ENC分析 通過在線軟件CUSP和Chips分析了紫九牛各CDS不同位置的GC含量,結果如表2所示??梢钥闯鯣C平均含量:GC(47.38%)>GC(39.81%)>GC(29.60%),GC含量最高,GC含量最低,不同位置的GC含量存在較大差異。而此處ENC值的范圍為37.350~55.547,平均值為48.227,其中ENC值大于45的有40個,小于45的僅有10個,進一步說明了紫九牛葉綠體基因組密碼子具有較弱的偏好性。

表 2 紫九牛葉綠體基因組50條CDS序列密碼子不同位置的GC含量Table 2 GC contents in different positions of codons in chloroplast genomes 50 CDS of Ventilago leiocarpa

2.2 影響偏性的因素

2.2.1 相關性分析及中性繪圖分析 利用軟件SPSS 19.0對50條CDS序列密碼子不同位置的GC、密碼子數量N以及ENC值進行相關性分析,結果如表3所示。GC與GC、GC沒有顯著相關性,而與GC、N以及ENC呈顯著相關性,三位堿基的組成存在差異,初步說明了紫九牛葉綠體基因受到選擇作用的影響。ENC與GC、GC達到顯著相關的水平,說明了紫九牛葉綠體基因的后兩位密碼子的堿基會影響密碼子的使用偏好性。

表 3密碼子各位置GC含量、數量N及ENC值相關性分析Table 3 Correlation analyses of GC content, number (N) and ENC on chloroplast genomes of Ventilago leiocarpa

以GC和GC的平均值GC為縱坐標,GC為橫坐標進行中性繪圖分析,結果如圖1所示。結果表明,相關系數=0.131,相關性不顯著,密碼子偏好性主要受到選擇的影響。

圖 1 紫九牛葉綠體基因中性繪圖分析Fig. 1 Neutrality plot analysis of chloroplast genes of Ventilago leiocarpa

2.2.2 ENC-plot分析 由圖2可知,紫九牛葉綠體基因主要分布于標準曲線附近,密碼子偏好性主要受到突變的影響。通過表4分析可知,密碼子基因組限在-0.05~0.05附近的基因占52%,組限在其以外的占48%。

圖 2 紫九牛葉綠體基因組的ENC-plot分析Fig. 2 ENC-plot analysis of chloroplast genomes of Ventilago leiocarpa

表 4 ENC比值頻數分布Table 4 Number distribution of ENC ratio

2.3 最優密碼子的確定

利用軟件Codon W 1.4.2來計算高低基因庫中各同義密碼子的RCSU值,進而得到△RSCU,結果如表5所示。由表5可知,△RSCU≥0.08的密碼子有22個,其中大于0.3的有14個,大于0.5的有5個。由表1可知,RSCU>1的密碼子有29個。將兩者共有的密碼子確定為最優密碼子,最終得到密碼子15個,分別為GAA、UUG、AUU、GUU、CAA、AAC、GCU、UCU、CCU、ACU、ACA、UGU、GUA、CGU和GGU,其中有14個以A/U結尾。

表 5 紫九牛葉綠體基因組最優密碼子分析Table 5 Analysis of optimal codons in chloroplast genomes of Ventilago leiocarpa

3 討論與結論

在紫九牛葉綠體基因組的RSCU分析中,由于TAG、TAA和TGA為葉綠體通用密碼子表64種密碼子中的終止密碼子,不編碼任何氨基酸,而ATG是蛋氨酸唯一密碼子,TGG是色氨酸唯一密碼子,沒有偏性,在RSCU分析中被剔除(柳燕杰等,2020)。剩下的59種密碼子中,RSCU>1的有29個,RSCU<1的有30個,約各占一半, 且并未發現RSCU>2的密碼子,初步說明了紫九牛的密碼子存在較弱的偏好性。而且,在50個基因中,表示密碼子偏倚程度的ENC值小于45的僅有10個,ENC 的平均值為48.277,大于45,這進一步說明紫九牛密碼子的偏好性較弱。29個RSCU>1的密碼子當中,有28個密碼子以A/U結尾,這與已經發表的大多數物種例如美國紅梣()(柳燕杰等,2020)、云南藍果樹()(原曉龍等,2020)、蒺藜苜蓿()(楊國鋒等,2015)等葉綠體密碼子偏好性較弱且偏好以A/U結尾的結果一致。

密碼子是生物體內聯結核酸和蛋白質的鑰匙,而密碼子的使用頻率在不同植物和基因中存在差異,這種密碼子偏好性是物種在長期進化和對環境的適應過程中形成的(趙洋等,2016)。密碼子的偏好性是多個因素共同作用的結果,中性選擇影響和方向突變影響是兩個主要因素,關于二者在密碼子偏好性形成中的作用大小是當下關于密碼子偏好性研究所關注的熱點。生物在進化過程中形成穩定的密碼子偏好性,即相對固定的密碼子使用模式,其中GC含量是生物基因組中堿基組成的一個重要指標(楊國鋒等,2015),在基因組的演變中具有重要意義。方向性突變的強弱可以通過GC含量判斷,尤其是密碼子的第三位堿基。由于密碼子第三位受到的選擇壓力比前兩位小,故GC常常被用來衡量密碼子偏好性的指標(柳燕杰等,2020)。紫九牛葉綠體基因組中GC與GC,GC沒有顯著相關性,說明偏好性受到選擇的影響,這與已經報道了的美國紅梣 ()(柳燕杰等,2020)、黃芩 ()(王文斌等,2018)、普通油茶 ()(王鵬良等,2018)、樟樹 ()(秦政等,2018)的葉綠體特征相同。而ENC-plot分析中,密碼子大部分都位于標準曲線附近,只有少量基因的ENC值離標準曲線較遠,表明密碼子偏好性還受到突變作用的影響,與蒺藜苜蓿()(楊國鋒等,2015)相類似。

我們此次將RSCU>1且△RSCU≥0.08的密碼子確定為最優密碼子,得到15個最優密碼子為GAA、UUG、AUU、GUU、CAA、AAC、GCU、UCU、CCU、ACU、ACA、UGU、GUA、CGU和GGU。其中,以A/U結尾有14個,這與上述中的紫九牛葉綠體基因組密碼子偏好以A/U結尾的結論一致。

在紫九牛葉綠體基因工程的外源基因載體設計時選用以A/U結尾的最優密碼子可以提高外源基因的表達效率。紫九牛葉綠體基因組偏好性的研究以及最優密碼子的確立,為優化目標基因,通過基因工程來改良紫九牛的性狀提供了科學的依據。同時,對于物種的進化,以及提高外源基因表達水平具有重大意義。

猜你喜歡
葉綠體同義基因組
“植物界大熊貓”完整基因組圖譜首次發布
宏基因組測序輔助診斷原發性肺隱球菌
祈使句小練
until用法鞏固精練
共生
人不吃飯行嗎
一種快速提取微藻完整葉綠體及其DNA的方法
同義句轉換專項練習50題
對“葉綠體中色素的提取和分離實驗”的改進
同義句轉換專練
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合