?

伊犁郁金香葉綠體基因組密碼子偏好性分析

2024-03-19 05:55劉偉強秦斗文史國民徐庭亮巨秀婷
中國野生植物資源 2024年2期
關鍵詞:偏性密碼子葉綠體

劉偉強,秦斗文,史國民,徐庭亮,巨秀婷*

(1.青海大學 農牧學院, 青海 西寧 810016; 2.青海省園林植物與觀賞園藝重點實驗室/青海大學高原花卉研究中心, 青海 西寧 810016)

伊犁郁金香(Tulipa iliensisRegel)屬于我國野生的郁金香種質資源之一,生境以山前平原和低山坡地居多,主要分布在我國新疆地區的部分草場,面積達數十萬畝[1],此外在中亞地區也有分布[2]。伊犁郁金香是百合科郁金香屬的多年生草本植物,外花被片背面綠紫紅色或黃綠色,內花被片黃色[3],花期3 ~ 5 月,具有良好的觀賞、飼用等價值,被評價為優良性狀突出的野生郁金香之一[4],良好的生態適應性也為其優良性狀的開發提供更多可能。前人基于伊犁郁金香已開展了種子萌發特性[5-6]、引種栽培[7-8]、遺傳多樣性[9]等多方面的研究。

葉綠體是地球上植物細胞內光合作用的主要場所,也是可以獨立遺傳復制的重要細胞器[10]。植物葉綠體基因組的數目、順序相對保守且具有相對穩定的結構,所含遺傳信息豐富[11],常被用于群體進化、種質資源鑒定及群體遺傳學研究,在植物的進化過程中具有十分重要的作用[12]。在大多數植物漫長的進化過程中,密碼子獨特的使用方式和使用偏好性會逐步形成,即使是同種植物的不同基因之間,密碼子的偏好也會存在一定的差異。如酸棗[Ziziphus jujubavar.spinosa(Bunge) Hu ex H. F.Chow]葉綠體基因組密碼子使用偏性的影響因素中,來自外界的選擇壓力起主要作用[13];而金銀花大毛花(Lonicera japonicaThunb.)[14]、無刺龍舌蘭(Yucca treculeanaCarrière)[15]在選擇壓力和突變的共同作用下出現使用偏性。通過對葉綠體基因組中的密碼子選擇行為的分析,可以幫助研究者更好地認識葉綠體中的功能基因的表達規律和進化方式,進而加深對植物進化關系的認識[16]。

為更準確地將野生種質資源的優良園藝性狀應用到郁金香的分子輔助育種過程中[17],葉綠體工程育種作為一種新型技術為植物導入外源基因提供新的途徑。根據最優密碼子來設計外源基因表達載體,可以起到優化外源基因在葉綠體基因組中表達的作用[18],為郁金香分子育種提供優良的遺傳基因奠定基礎。本研究通過對伊犁郁金香葉綠體基因組的密碼子組成、偏性特征及影響因素、最優密碼子進行分析,為野生郁金香資源開發、優良性狀的遺傳改良、外源基因表達及葉綠體工程育種等提供技術支撐和理論依據。

1 材料與方法

1.1 材料來源

從課題組前期測序得到的伊犁郁金香葉綠體基因組(NCBI 登錄號:MT316023)中根據各基因的注釋結果,剔除了序列長度小于300 bp、重復基因和內部存在終止密碼子的序列,獲得53條可以編碼蛋白的基因序列(Coding DNA sequence,CDS)用于密碼子各項參數分析。

1.2 分析方法

1.2.1 密碼子偏好性相關參數分析

利用CodonW1.4.2 軟件分析伊犁郁金香葉綠體基因組篩選到的53 條序列的密碼子的偏好性參數,得到各CDS 的有效密碼子(Effective number of codon, ENC)、相對同義密碼子的相對使用度(Relative synonymous codon usage, RSCU)。通過EMBOSS:cusp 在線工具(http://emboss.toulouse.inra.fr/cgi-bin/emboss/cusp)計算出伊犁郁金香葉綠體基因組不同基因的GC總含量(GCall)以及各密碼子第1位(GC1)、第2 位(GC2)、第3 位(GC3)的GC 含量[19]。利用SPSS 22.0 對以上各參數進行相關性分析。

1.2.2 密碼子堿基組成的差異性分析

中性繪圖分析以GC3為橫坐標,GC12(GC1和GC2的均值)為縱坐標,利用R 語言繪制散點圖,完成GC3與GC12相關性分析[20]。

1.2.3 堿基組成對密碼子偏好性影響分析

GC3和ENC 值分別作橫坐標和縱坐標,繪制散點圖進行ENC-plot 分析,通過構建標準曲線[21],結合散點與標準曲線的距離,判斷伊犁郁金香密碼子偏好性的主要影響因素。若散點距標準曲線較近說明受突變影響,反之則受自然選擇的影響。為了能夠精確散點與標準曲線的距離,根據公式ENC 比值[(預期ENC 值-實際ENC 值)/預期ENC 值]計算ENC 比值頻率,對密碼子偏好性的影響因素進行精確分析。

1.2.4 堿基奇偶偏好分析

計算密碼子第3 位上的A、T、C、G 的含量,以A3/(A3+ T3)為縱坐標,G3/(G3+ C3)為橫坐標進行PR2-plot分析,以無偏倚的點為中心點繪制散點圖。根據圖中散點分布的位置判斷第3位堿基的偏倚方向來分析密碼子偏好性的影響因素[22]。

1.2.5 最優密碼子確定

對53 條伊犁郁金香的CDS 序列進行ENC 值排序,從高低兩端各選出10%的基因,構建高低表達庫篩選高表達密碼子。利用高表達RSCU和低表達RSCU 的差值,計算ΔRSCU。將ΔRSCU ≥ 0.08 的密碼子定為高表達優越密碼子,RSCU值 > 1的密碼子定為高頻密碼子,同時滿足高頻率密碼子和高表達優越密碼子確定為最優密碼子[23]。

2 結果與分析

2.1 密碼子偏好性相關參數分析

根據伊犁郁金香葉綠體基因組密碼子組成分析和ENC 值計算(表1),發現不同基因的GC含量有差異。GC1、GC2、GC3的平均含量分別為46.66%、39.39% 和27.15%,總體的GC 含量GCall為37.73%,其中GC3的平均含量最低,說明GC3偏好以A/U 結尾。為明確伊犁郁金香葉綠體基因組密碼子使用偏性程度,根據53 條CDS 序列的ENC 值的范圍,發現ycf3基因的ENC 值最大為62.28,rps18基因的ENC 值最小為38.33,表明不同基因密碼子的偏性程度具有差異。ENC 值的理論取值范圍為20 ~ 61,當ENC 值越接近20 說明其偏性越強,ENC 值越接近61 則越弱[24],一般以ENC 值35 作為區分密碼子使用偏好性強弱的標志[25]。伊犁郁金香葉綠體基因組中所有基因的ENC 值均分布于38.33 ~ 62.28 之間,大于標準值35,表明伊犁郁金香葉綠體基因組的密碼子使用偏好性較弱。

表1 伊犁郁金香葉綠體基因組GC含量以及ENC值Tab. 1 The GC content and ENC value of chloroplast genome of T. iliensis

對伊犁郁金香葉綠體基因組的GC1、GC2、GC3、GCall及ENC 值進行相關性分析(表2),發現GCall與GC1、GC2和GC3之間均呈極顯著正相關(P< 0.01),GC1和GC2呈極顯著正相關(P< 0.01),而GC3與GC2無顯著相關性(P> 0.05),說明密碼子第1 位和第2 位的堿基組成具有一定的相似性,但是與第3位有差異。ENC 與GC1、GC2相關性不顯著(P>0.05),但與GC3的相關性系數為0.539,達到極顯著相關水平(P< 0.01),說明GC3會影響密碼子的使用偏性。

表2 伊犁郁金香葉綠體基因組各相關參數的相關性分析Tab. 2 Correlation analysis of parameters related to each gene in the chloroplast genome of T. iliensis

對伊犁郁金香葉綠體基因組的RSCU進行分析(表3),發現53個序列中RSCU > 1的密碼子共有31個,其中16 個以U 結尾,13 個以A 結尾,1 個以G 結尾,1 個以C 結尾,表明伊犁郁金香葉綠體基因組密碼子更趨向于A/U結尾。

表3 伊犁郁金香葉綠體基因組相對同義密碼子使用度Tab. 3 Relative synonymous codon usage of chloroplast genome of T. iliensis

2.2 密碼子堿基組成的差異性分析

中性繪圖分析是通過分析不同的堿基組成來判斷密碼子偏好性的主要影響因素,主要通過GC12和GC3的相關程度進行評價。若GC12和GC3相關性顯著,則突變為偏好性的主要影響因素,若相關性不顯著,則選擇壓力為其偏好性的主要影響因素[26]。根據伊犁郁金香密碼子的中性繪圖分析(圖1),圖中每一個散點代表一個基因,GC3的取值范圍在0.19 ~ 0.36之間,GC12的取值范圍在0.30 ~ 0.55之間,并得到GC12與GC3的相關系數為0.309,回歸系數為0.417。表明GC1、GC2、GC3的堿基組成之間存在差異,相關性并不顯著。因此,自然選擇是影響其偏好性的主要因素。

圖1 中性繪圖分析Fig. 1 Analysis of neutrality plot

2.3 堿基組成對密碼子偏好性影響分析

ENC-plot 分析(圖2)結果表明,伊犁郁金香葉綠體基因組的部分基因圍繞標準曲線周圍分布,大部分基因分布在標準曲線下方且離標準曲線的距離較遠,說明伊犁郁金香葉綠體基因組密碼子的偏好性主要受到自然選擇的影響。

圖2 ENC-plot分析Fig.2 Analysis of ENC-plot

根據標準曲線公式計算發現,部分基因距標準曲線較近,實際ENC 值與預期ENC 值接近,部分基因位于標準曲線下方較遠位置,實際ENC 值與預期ENC值存在一定的偏距。ENC比值頻數表(表4)可以更直觀的比較實際ENC 值與預期ENC 值的差異,發現ENC 比值為-0.05 ~ 0.05 的有23 個,占比為43%;分布在-0.05 ~ 0.05以外的基因有30個,占比為57%,大部分基因離預期ENC 值較遠,表明自然選擇是伊犁郁金香葉綠體基因組密碼子偏好性的主要影響因素。

表4 ENC比值頻數分布Tab. 4 Distribution of ENC ration

2.4 堿基奇偶偏好分析

PR2-plot 分析主要根據第3 位堿基的偏倚方向來分析密碼子偏好性的影響因素。在PR2-plot 分析中(圖3),觀察各散點的分布發現大多數基因位于右下方,說明嘧啶T 的使用頻率大于嘌呤A 的使用頻率,嘌呤G的使用頻率大于嘧啶C的使用頻率。PR2-plot分析表明伊犁郁金香葉綠體基因組密碼子使用偏好性不僅受突變的影響,同時也受到自然選擇的影響。

圖3 PR2-plot分析Fig. 3 Analysis of PR2-plot

2.5 最優密碼子分析

結合伊犁郁金香葉綠體基因組的RSCU(表3),以RSCU 值 > 1 為標準篩選到高頻密碼子共31 個,并從構建的高低表達庫中以ΔRSCU ≥ 0.08 為標準篩選到高表達密碼子共22個(表5)。根據最優密碼子的選擇標準(同時滿足高頻率密碼子和高表達優越密碼子)確定18 個最優密碼子,分別為GCU、CGA、CGU、UGU、CAA、GAA、GGU、AUU、CUA、UUA、AAA、UUU、CCU、AGU、UCU、ACU、GUA 以及GUU,其中以U 結尾有11 個,以A 結尾有7 個,說明伊犁郁金香葉綠體基因組偏愛使用以A和U堿基結尾的密碼子。

表5 伊犁郁金香葉綠體基因組最優密碼子分析Tab. 5 Optimal codon analysis of chloroplast genome in T. iliensis

3 討論

3.1 密碼子堿基組成

密碼子是生命信息的基本遺傳單位[27],編碼同一氨基酸的同義密碼子被使用的頻率各異,而頻繁使用的密碼子決定了其使用偏好模式[28]。本研究得到的伊犁郁金香葉綠體基因組密碼子不同位置的GC含量不同,而GC3含量的多少是生物密碼子堿基組成的重要衡量指標[29]。通過對伊犁郁金香葉綠體基因組篩選出的53 條CDS 序列進行密碼子偏好性分析,得到GC3的含量為27.15%,說明伊犁郁金香偏向使用A/U 類型的密碼子,在向日葵(Helianthus annuusL.)[30]、二喬玉蘭(Yulania soulangeanaSoul.-Bod.)[31]等物種研究中也得到類似的結論。

3.2 影響密碼子偏性因素

堿基突變、自然選擇、密碼子各位置堿基含量、tRNA 豐度和基因序列長度等多種因素都被認為會對密碼子的使用模式產生影響[32]。根據中性繪圖分析、ENC-plot 分析的結果判斷伊犁郁金香葉綠體基因組密碼子偏好性的主要影響因素,發現使用頻率為T > A、G > C,說明影響密碼子偏好性的主要影響因素是自然選擇,這與馬尾松(Pinus massonianaLamb.)[33]、苦蕎[Fagopyrum tataricum(L.)Gaertn.][34]、辣椒(Capsicum annuumL.)[35]等密碼子偏好性的影響因素一致。但是根據PR2-plot 分析的結果認為突變也是伊犁郁金香葉綠體基因組密碼子偏好性的影響因素之一,而密碼子偏好的選擇也會受多重因素的影響,如香花油茶(Camellia osmanthaYe CX, Ma JL et Ye H.)[36]的相關研究中同樣認為突變和自然選擇共同影響著密碼子的偏好選擇模式。

3.3 最優密碼子

功能基因的轉錄、翻譯和表達均受到密碼子的影響,選擇最優密碼子可在構建基因表達載體時有效提高基因的表達效率[37]。在本研究中通過構建高低基因表達庫,共篩選到18 個最優密碼子,此前有研究表明葉綠體基因中最優密碼子的數量因物種不同而異。29 種木蘭科(Magnoliaceae)[38]植物的葉綠體基因最優密碼子數在14 ~ 22之間,7種睡蓮屬(NymphaeaL.)[39]植物研究中最優密碼子介于14 ~ 17 個;而在秋茄(Kandelia obovataSheue et al.)[40]的研究中僅確定了3 個最優密碼子;西藏凹乳芹(Vicatia thibeticade Boiss.)[41]的最優密碼子數量為4個。以上研究結果再次證實了同義密碼子使用偏好特性是在多種因素共同影響下形成的。對伊犁郁金香葉綠體基因組使用模式的研究可為后續野生郁金香資源開發、優良性狀的遺傳改良、外源基因表達及葉綠體工程育種等提供技術支撐和理論依據。

猜你喜歡
偏性密碼子葉綠體
獨行菜抗逆相關轉錄因子LaDREB密碼子偏性與進化分析
密碼子與反密碼子的本質與拓展
10種藏藥材ccmFN基因片段密碼子偏好性分析
看待中藥毒性 厘清三大誤區
密碼子偏性分析方法及茶樹中密碼子偏性研究進展
南方紅豆杉葉綠體非編碼序列PCR體系優化及引物篩選
茶樹CsActin1基因密碼子偏性分析
茶樹葉綠體DNA的PCR-RFLP反應體系優化
煙草葉綠體密碼子的偏好性及聚類分析
鈣過量對茶樹光合特性及葉綠體超微結構的影響
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合