?

硬頭黃竹葉綠體基因組密碼子偏好性分析

2024-04-08 06:46龔明貴白娜李影姜霞
江蘇農業科學 2024年3期

龔明貴 白娜 李影 姜霞

摘要:以硬頭黃竹葉綠體基因組為研究對象,使用CodonW、CUSP以及R語言等軟件分析密碼子偏好性形成的主要原因。結果表明:(1)硬頭黃竹葉綠體基因組密碼子的平均GC含量為39.59%,且GC1>GC2>GC3,表明密碼子偏好使用以A/U結尾的堿基;(2)硬頭黃竹大多數有效密碼子數(ENC)在35以上,適應指數(CAI)為0.166,說明其密碼子偏好性較弱;(3)中性繪圖分析、ENC-plot和PR2-plot分析表明,自然選擇對硬頭黃竹葉綠體基因組密碼子使用偏好性產生重要影響;(4)最終篩選出硬頭黃竹葉綠體基因組有GCA、GCU、GAU、GGU及AAA等14個最優密碼子,多數以A/U結尾。本研究結果可為硬頭黃竹葉綠體基因組水平上的研究提供依據。

關鍵詞:硬頭黃竹;密碼子偏好性;葉綠體基因組;最優密碼子

中圖分類號:S188? 文獻標志碼:A

文章編號:1002-1302(2024)03-0067-06

葉綠體是植物體內進行能量轉換和光合作用的場所[1]。植物葉綠體中含有一套獨立的遺傳物質,其規模小、拷貝數多、遺傳特性穩定,且含有大量的遺傳信息[2]。葉綠體基因組編碼與光合作用有關的蛋白質,含有豐富的遺傳信息[3]。密碼子是維系蛋白質與DNA之間的橋梁,也是識別和傳遞生物體遺傳信息的載體[4]。密碼子的使用偏好性是指不同種類的生物在蛋白質翻譯過程中傾向于使用特定的簡并密碼子的現象[5]。在物種演變過程中,密碼子的使用偏好性體現為受到自然選擇和突變的影響不同[6]。不同物種密碼子的偏好性有較大差異,因此,對物種密碼子偏好性的分析,可為利用基因工程技術改良植物等研究奠定理論基礎[7]。

硬頭黃竹(Bambusa rigida)屬于竹亞科簕竹屬的中型叢生竹種,其適應性強、產量高,是優質紙漿原料,桿材堅固厚實,經濟價值高[8],在我國廣東、貴州、四川、廣西、江西等省大量分布[9]。目前,未曾有針對硬頭黃竹葉綠體基因組密碼子使用偏好性的研究報道,本研究以硬頭黃竹葉綠體基因組序列為研究對象,對其密碼子偏好性使用模式進行分析,以期得到影響硬頭黃竹葉綠體基因組密碼子偏好性的主要因素,并篩選出其最優密碼子,為后續葉綠體基因工程中提高外源基因在載體內表達等研究提供理論基礎。

1 材料與方法

1.1 葉綠體基因組序列的獲取

從NCBI數據庫中獲取硬頭黃竹葉綠體基因組編碼區的CDS序列,硬頭黃竹(GenBank登錄號:MT648824.1)有84條CDS序列。為了減少取樣誤差,利用生物信息學軟件(Geneious)剔除長度<300 bp 的CDS序列,最終硬頭黃竹保留56條CDS序列用于后續分析。

1.2 分析方法

1.2.1 密碼子組成分析

運用CodonW 1.4.2計算有效密碼子數(ENC)和適應指數(CAI)等。通過在線軟件CUSP計算密碼子第1、2、3位堿基的GC含量(GC1、GC2、GC3)以及平均GC含量(GCall),然后利用SPSS 25.0、Excel 2019及R語言等數據處理軟件對數據進行分析處理。

1.2.2 相對同義密碼子使用度分析

運用CodonW 1.4.2對同義密碼子相對使用度(RSCU)進行計算分析,RSCU值是指該密碼子的實際使用頻率與其理論使用頻率的比值[10]。若密碼子的使用沒有偏好性,則RSCU=1。當RSCU>1時,表明該密碼子為使用較多的密碼子,反之亦然。

1.2.3 中性繪圖分析

中性繪圖分析可對影響葉綠體基因組密碼子使用偏好性的主要因素進行首次分析判斷。以GC3為x坐標,GC12(GC1和GC2的平均值)為y坐標,利用Excel 2019繪制散點圖,對GC3和GC12的相關性進行分析。若回歸系數接近于1,則GC12和GC3相關性顯著,3個位置堿基組成相似,說明基因突變是影響密碼子使用偏好性的主要因素,反之,3個位置堿基組成有較大差別,則說明自然選擇是主要因素。

1.2.4 ENC-plot繪圖分析

ENC-plot繪圖分析用于判斷突變在密碼子使用偏好性中的影響,可將密碼子偏好性情況進行圖片可視化。散點圖和曲線圖組成ENC-plot分析圖,以GC3為x坐標,ENC值為y坐標,利用R語言構建散點圖,并在散點圖中添加ENC值的標準曲線,標準曲線公式:ENC=2+GC3+29/[GC23+(1-GC3)2][11]。若基因位點靠近或在標準曲線上,則密碼子使用偏好性主要由突變決定;若基因位點遠離標準曲線,則主要由自然選擇決定。

1.2.5 PR2-plot偏倚分析

計算各基因中密碼子的第3位上A、T、C、G的含量,以G3/(G3+C3)為x坐標,A3/(A3+T3)值為y坐標,繪制散點圖并對其進行分析,圖中的中心點代表A和T、C和G的使用頻率一樣,表明密碼子使用偏好性是由基因突變造成的[12]。

1.2.6 最優密碼子分析

將ENC值作為衡量密碼子偏好性的重要指標,ENC值與密碼子的偏好性呈負相關,選取升序排列后的ENC值的前后兩端各10%的基因,并以此為基礎建立高、低表達基因庫[13]。根據CodonW軟件計算2個表達庫中密碼子的RSCU值和ΔRSCU值(ΔRSCU=RSCU高表達-RSCU低表達),同時滿足高頻密碼子和高表達密碼子(ΔRSCU≥0.08)2個條件的為最優密碼子。

2 結果與分析

2.1 密碼子組成分析

運用CUSP和CodonW 1.4.2分析硬頭黃竹葉綠體基因組CDS序列的堿基組成(表1),硬頭黃竹的T3S、A3S、C3S、G3S分別為44.98%、41.81%、18.30%、18.11%,T3S和A3S遠高于G3S和C3S,表明硬頭黃竹葉綠體基因組密碼子的第3位堿基以A/U結尾為主。硬頭黃竹的ENC值為50.60,適應指數(CAI)為0.166,表明硬頭黃竹葉綠體基因組密碼子偏好性比較弱。

硬頭黃竹葉綠體基因組密碼子的平均GC含量為39.59%,且GC1(47.50%)>GC2(39.89%)>GC3 (31.38%)(表1),ENC值的范圍為39.04~61.00,共有49條CDS序列的ENC值大于45,在密碼子上GC未均勻分布(表2)。根據ENC值及3個位置的GC含量的相關性分析(表3)發現:ENC值與GC1、GC2相關性不顯著,與GC3相關性極顯著,說明密碼子使用偏好性形成中GC3的影響作用大于GC1、GC2。

2.2 相對同義密碼子使用度分析

對硬頭黃竹葉綠體基因組蛋白編碼序列RSCU分析(表4)表明,在硬頭黃竹中編碼亮氨酸(Leu)的密碼子UUA表現最明顯,其RSCU值為1.93,其次是編碼丙氨酸(Ala)的密碼子GCU和編碼精氨酸(Arg)的AGA,兩者的RSCU值都是1.73。表中為硬頭黃竹葉綠體基因組密碼子56條CDS序列的RSCU值,從中篩選出32個高頻密碼子,其中以A、U、C、G結尾的密碼子分別有13、16、2、1個,說明硬頭黃竹葉綠體基因組密碼子偏好以A和U結尾。

2.3 中性繪圖分析

中性繪圖分析結果(圖1)表明,硬頭黃竹GC12、GC3的數值范圍分別為32.68%~52.03%、23.42%~51.11%。Pearson相關系數分別為0.314、0.138,進一步說明GC12和GC3的相關性不顯著?;貧w系數分別為0.265 8、0.412 8,說明硬頭黃竹受自然選擇影響壓力較大。

2.4 ENC-plot繪圖分析

ENC值的大小可表明密碼子偏好性的強弱,ENC>35表明密碼子偏性弱[14]。分析結果(圖2)

顯示,硬頭黃竹葉綠體基因組的ENC值基本上都>35,說明其密碼子偏好性較弱。硬頭黃竹只有少數基因位于期望曲線上或其附近,實際ENC值和預期ENC值相差不大,說明該部分基因的密碼子偏好性主要受突變的影響;多數基因離標準曲線距離較遠,實際ENC值和預期ENC值有差距,說明該部分基因的密碼子偏好性主要受自然選擇的影響。分析結果顯示,硬頭黃竹的葉綠體基因組密碼子偏好性主要受到自然選擇的影響。

2.5 PR2-plot繪圖分析

對硬頭黃竹葉綠體基因組的第3位堿基T3/A3和G3/C3的關系進行奇偶校驗分析。PR2-plot分析結果(圖3)顯示,基因位點在平面圖4個區域內分布并不均勻,在A3/(A3+T3)<0.5和G3/(G3+C3)>0.5區域范圍內分布最多,表明第3位堿基使用頻率為T>A、G>C,表明密碼子的第3位堿基在選擇上具有偏好性,同時說明硬頭黃竹葉綠體基因組密碼子的使用主要受自然選擇的影響。

2.6 最優密碼子的確定

對硬頭黃竹的ENC值進行升序排列,前10%為高表達基因,后10%為低表達基因,從硬頭黃竹葉綠體基因組中得到6個高表達基因rps18、rpl16、psbA、rps14、petB、ndhA和6個低表達基因rpl2、ycf3、cemA、ndhE、atpE、infA。對RSCU和ΔRSCU進行計算(表5),硬頭黃竹葉綠體基因組有32個高頻密碼子,篩選出GCU、GAU等20個高表達密碼子,最終確定14個密碼子作為硬頭黃竹葉綠體基因組的最優密碼子,分別為GCA、GCU、GAU、GGU、AAA、UUA、CCA、CCU、CGA、CGU、UCC、ACU、GUA、GUU,這13個最優密碼子13個以A/U結尾,1個以C結尾。

3 討論與結論

基因組數據為密碼子偏好性的分析提供有力支撐,堿基的組成情況也會影響密碼子的偏好性,密碼子的使用偏好性會受到自然選擇或突變的影響[15-16]。本研究對硬頭黃竹葉綠體基因組密碼子進行使用偏好性分析,篩選出了56條CDS序列,分析表明GC1>GC2>GC3,可見密碼子在3個位置上的分布并不均勻,密碼子偏好使用以A或U結尾的堿基。這與復羽葉欒樹(Koelreuteria bipinnata Franch.)[17]和千果欖仁(Terminalia myriocarpa van Huerck et Muell.-Arg.)[18]等植物葉綠體基因組密碼子偏好性較為相似,也說明這些植物葉綠體基因組密碼子的使用模式相似且高度保守。利用ENC值可以判斷密碼子偏好性的程度,當ENC>35時,說明密碼子偏好性比較弱;反之,說明偏好性強[19],本研究得出硬頭黃竹葉綠體基因組中多數ENC值>35,表明硬頭黃竹葉綠體基因組密碼子使用偏好性較弱。

為了更清楚影響密碼子使用偏好性的因素,本研究對硬頭黃竹葉綠體基因組密碼子進行了中性繪圖、ENC-plot以及PR2-plot分析。在中性繪圖分析中,硬頭黃竹的回歸系數為0.265 8,說明硬頭黃竹更多受到自然選擇的影響;在ENC-plot分析中,硬頭黃竹的多數基因離標準曲線距離較遠,實際ENC值和預期ENC值存在差異,表明了這些基因的密碼子偏好特性主要受自然選擇的制約;在PR2-plot繪圖分析中,硬頭黃竹葉綠體基因組的大部分基因都在平面圖的右下方,這表明4個堿基的使用頻率不同,即T>A、G>C,同時表明硬頭黃竹葉綠體基因組密碼子的使用更多的是受自然選擇的影響。結合以上分析得出結論:影響硬頭黃竹葉綠體基因組密碼子偏好性的主要原因是自然選擇。這與美國紅梣(Fraxinus pennsylvanica Marsh.)[20]、降香黃檀(Dalbergia odorifera)[19]以及云南油杉(Keteleeria evelyniana)[21]等植物研究結果基本一致。但在乳油木(Vitellaria paradoxa C.F. Gaertn)[22]和銀白楊(Populus alba)[23]等植物中影響密碼子偏好性的因素主要為突變,說明密碼子的使用偏好性受選擇和突變等多種因素影響。

本研究利用RSCU、ENC值篩選出GCA、GCU、GAU以及GGU等14個最優密碼子,最優密碼子大部分以A或U結尾。在硬頭黃竹與抽筒竹[24]、毛竹[25]等其他禾本科植物的葉綠體基因組密碼子偏好性的比較中,具有高度一致的密碼子偏好性及使用模式,都是以A或U結尾。然而,在毛竹全基因組的最優密碼子多以G、C結尾,這與硬頭黃竹葉綠體基因組中的最優密碼子不同,可反映出核基因組和葉綠體基因組在密碼子偏好性方面不同。

本研究基于硬頭黃竹葉綠體基因組CDS序列,對硬頭黃竹的葉綠體基因組進行密碼子組成、中性繪圖、PR2-plot繪圖及ENC-plot繪圖等分析比較,最終得出自然選擇為影響硬頭黃竹葉綠體基因組密碼子的使用偏性的主要因素。篩選出硬頭黃竹葉綠體基因組有14個最優密碼子,為后續硬頭黃竹葉綠體基因工程中提高外源基因在載體內的表達等研究提供理論基礎。

參考文獻:

[1]丁 銳,胡 兵,宗小雁,等. 杓蘭葉綠體基因組密碼子偏好性分析[J]. 林業科學研究,2021,34(5):177-185.

[2]Wright F.The ‘effective number of codons used in a gene[J]. Gene,1990,87(1):23-29.

[3]畢毓芳,溫 星,潘雁紅,等. 葉綠體DNA條形碼在林木中的應用及研究進展[J]. 分子植物育種,2020,18(16):5444-5452.

[4]周 濤,楊 林,舒軍霞,等. 3種含笑屬植物葉綠體基因組密碼子偏好性分析[J]. 西部林業科學,2022,51(3):91-100.

[5]Dang Y K,Dong Y Y,Ren G P. Codon codes:codon usage bias influences many levels of gene expression[J]. Scientia Sinica Vitae,2019,49(7):839-847.

[6]趙 英,付海天,金 剛,等. 木薯葉綠體基因組密碼子偏好性分析[J]. 江西農業學報,2022,34(4):46-52.

[7]辛雅萱,黎若竹,李 鑫,等. 杧果葉綠體基因組密碼子使用偏好性分析[J]. 中南林業科技大學學報,202 1(9):148-156,165.

[8]王路君,蔡春菊,唐曉鹿,等. 硬頭黃竹地上生物量分配特征及模型構建[J]. 南京林業大學學報(自然科學版),202 5(1):189-196.

[9]何 川,劉 渝. 硬頭黃竹竹材物理力學性質研究[J]. 世界竹藤通訊,2012,10(3):19-22.

[10]毛立彥,黃秋偉,龍凌云,等. 7種睡蓮屬植物葉綠體基因組密碼子偏好性分析[J]. 西北林學院學報,2022,37(2):98-107.

[11]楊 林,譚 萍,姜月影,等. 3種木蓮屬瀕危藥用植物葉綠體基因組密碼子偏好性分析[J]. 中國中醫藥信息雜志,2022,29(8):93-99.

[12]唐曉芬,陳 莉,馬玉韜. 密碼子使用偏性量化方法研究綜述[J]. 基因組學與應用生物學,2013,32(5):660-666.

[13]尚明照,劉 方,華金平,等. 陸地棉葉綠體基因組密碼子使用偏性的分析[J]. 中國農業科學,201 4(2):245-253.

[14]Jiang Y,Deng F,Wang H L,et al. An extensive analysis on the global codon usage pattern of baculoviruses[J]. Archives of Virology,2008,153(12):2273-2282.

[15]李顯煌,楊生超,辛雅萱,等. 燈盞花葉綠體基因組密碼子偏好性分析[J]. 云南農業大學學報(自然科學),2021,36(3):384-392.

[16]侯 哲,婁曉鳴,李 昂,等. 11種唐松草屬(Thalictrum)rbcL基因的密碼子偏好性研究[J]. 江蘇農業科學,2023,51(3):46-53.

[17]肖明昆,聶愷宏,沈紹斌,等. 復羽葉欒樹葉綠體基因組密碼子偏好性分析[J]. 西南林業大學學報(自然科學),2023,43(3):56-63.

[18]余 瀟,趙振寧,杜 春.千果欖仁葉綠體基因組特征及密碼子偏好性分析[J]. 山西農業大學學報(自然科學版),2022,42(6):81-92.

[19]原曉龍,李云琴,張勁峰,等. 降香黃檀葉綠體基因組密碼子偏好性分析[J]. 廣西植物,202 1(4):622-630.

[20]柳燕杰,田旭平,李 倩. 美國紅梣葉綠體基因組密碼子偏好性分析[J]. 江蘇農業科學,2020,48(15):83-88.

[21]李江飛,王 瑜,顏廷雨,等. 云南油杉葉綠體基因組密碼子偏好性分析[J]. 中南林業科技大學學報,2022,42(4):30-39.

[22]原曉龍,李云琴,張勁峰,等. 乳油木葉綠體基因組密碼子偏好性分析[J]. 分子植物育種,2020,18(17):5658-5664.

[23]Raubeson L A,Peery R,Chumley T W,et al. Comparative chloroplast genomics:analyses including new sequences from the angiosperms Nuphar advena and Ranunculus macranthus[J]. BMC Genomics,2007,8:174.

[24]李江平,秦 政,國春策,等. 抽筒竹葉綠體基因組的密碼子偏好性分析[J]. 竹子學報,2019,38(2):79-87.

[25]黃笑宇,許在恩,郭小勤.基于全基因組的毛竹同義密碼子使用偏好性分析[J]. 浙江農林大學學報,2017,34(1):120-128.

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合