?

密花豆葉綠體基因組序列特征及密碼子偏好性分析

2023-11-02 16:01吳民華葉曉霞譚靖怡王燊沈詩煥黃瓊林
南方農業學報 2023年6期

吳民華 葉曉霞 譚靖怡 王燊 沈詩煥 黃瓊林

DOI:10.3969/j.issn.2095-1191.2023.06.005

摘要:【目的】分析密花豆葉綠體基因組序列特征及密碼子偏好性,為密花豆種質鑒定、分子育種及資源保護利用提供理論參考?!痉椒ā坷酶咄繙y序技術對密花豆的葉綠體基因組進行測序,結合生物信息學軟件和工具對序列進行拼接、注釋及序列特征和密碼子偏好性分析,并通過構建系統發育進化樹解析密花豆的進化地位?!窘Y果】密花豆葉綠體基因組全長為152275 bp,是由83924 bp的大單拷貝(LSC)區、25113 bp的反向重復A(IRA)區、18125 bp的小單拷貝(SSC)區和25113 bp的反向重復B(IRB)依次排列而成的環狀雙鏈四分體分子。密花豆葉綠體基因組共注釋到129個基因,包括84個蛋白編碼基因(PCGs),8個rRNA和37個tRNA。密花豆葉綠體基因組在自然選擇為主的多因素作用下,偏好使用以A或T結尾的密碼子,最優密碼子是GCT、AGA、CGA、AAT、TGT、CAA、GAA、GGT、CAT、ATA、TTA、AAA、TTT、CCT、TCA、ACT、TAT和GTT。從密花豆葉綠體基因組檢測到117個SSR位點,由單、二、三、四核苷酸重復基元組成,其中以單、二核苷酸復基元數量較多,分別占SSR位點總數的50.4%和36.8%,且單、二、三、四核苷酸重復基元均以A或T及其組合為主。葉綠體基因組在密花豆屬內和屬間均存在較明顯的堿基突變,密花豆與同屬的美麗密花豆的葉綠體基因組序列相似性最高,說明二者親緣關系最近?!窘Y論】密花豆葉綠體基因組具有植物葉綠體基因組典型的結構特點,在密花豆屬內及屬間均有較好的鑒別效果,且其密碼子偏好性是多因素共同作用的結果,其中自然選擇是主要決定因素,但堿基突變以及其他因素對密碼子使用偏好也有一定影響。

關鍵詞:密花豆;葉綠體基因組;序列特征;密碼子偏好性;系統發育分析

中圖分類號:S567.19? ? ? ? ? ? ? ? ? ? ? ? ?文獻標志碼:A 文章編號:2095-1191(2023)06-1633-13

Sequence characteristics and codon bias analysis of chloroplast genome from Spatholobus suberectus Dunn

WU Min-hua1,YE Xiao-xia1,TAN Jing-yi2,WANG Shen2,SHEN Shi-huan3,

HUANG Qiong-lin1*

(1School of Basic Medicine,Guangdong Medical University,Zhanjiang,Guangdong? 524023,China;2School of Pharmacy,Guangdong Medical University,Zhanjiang,Guangdong? 524023,China;3The First Clinic Medicine College,Guangdong Medical University,Zhanjiang,Guangdong? 524023,China)

Abstract:【Objective】This work was aimed to clarify the sequence features and codon bias of chloroplast genome from Spatholobus suberectus Dunn,and provide theoretical reference for germplasm identification,molecular breeding and resource conservation and utilization of S. suberectus. 【Method】S. suberectus chloroplast genome was sequenced using high-throughput sequencing technology and then was assembled,annotated and analyzed by means of bioinformatics softwares and tools. A phylogenetic tree was also constructed to understanding the evolution status of S. suberectus. 【Result】The chloroplast genome of S. suberectus was an annular double-chain molecule with a size of 152275 bp,which was successively composed of a large single copy(LSC) with 83924 bp,an inverted repeat A(IRA)with 25113 bp,a small single copy(SSC) with 18125 bp and an inverted repeat B(IRB)with 25113 bp. The chloroplast genome annotated 129 genes,including 84 protein-coding genes(PCGs),8 rRNA and 37 tRNA. The chloroplast genome of S. suberectus tended to use the codon ended with A or T under the action of multiple factors dominated by natural selection,and the preference codons were identified as GCT,AGA,CGA,AAT,TGT,CAA,GAA,GGT,CAT,ATA,TTA,AAA,TTT,CCT,TCA,ACT,TAT,GTT. A total of 117 SSR loci were detected from the chloroplast genome of S. suberectus,which were composed of mononucleotide,dinucleotide,trinucleotide and tetranucleotide repeat motifs. The number of mononucleotide and dinucleotide repeat motifs was higher,accounting for 50.4% and 36.8% of the total number of SSR loci respectively,and the mononucleotide,dinucleotide,trinucleotide and tetranucleotide repeat motifs were mainly A or T and their combinations. There were obvious base mutations in the chloroplast genome both within and among the genera Spatholobus. The chloroplast genome sequences of S. suberectus and S. pulcher were the most similar,and the two were most closely related.【Conclusion】The chloroplast genome of S. suberectus possesses typical structure of plant chloroplast genome and preferable identification capability among the Spatholobus and other genera. The codon bias of S. suberectus chloroplast genome is a synergistical result of multiple factors. Among them,natural selection contributes most,and the base mutation and others also have a certain impact.

Key words: Spatholobus suberectus Dunn; chloroplast genome; sequence characteristics; codon bias; phylogenetic analysis

Foundation items: Guangdong Basic and Applied Basic Research Foundation(2018A030310116); Zhanjiang Science and Technology Plan Project (2019A01008)

0 引言

【研究意義】密花豆(Spatholobus suberectus Dunn)為豆科(Leguminosae)密花豆屬(Spatholobus)攀援植物,為我國特有的物種,主要分布在廣東、廣西、福建等嶺南?。▍^)(中國植物志編輯委員會,1995)。密花豆的藤莖可供藥用,稱雞血藤,因可分泌紅棕色樹脂而得名。雞血藤苦泄溫通、微甘能補,入肝、腎經,既能活血通絡而止痛,又補血舒筋而止痛,可用于月經不調、痛經、經閉、風濕痹痛、麻木癱瘓、血虛萎黃等病癥的治療(國家藥典委員會,2020),為我國傳統常用大宗中藥材,也是雞血藤膠囊、花紅片、婦科千金片等十余種知名中成藥的主要組方原料。由于雞血藤的顯著療效和廣泛應用,導致密花豆種質資源被大量開采和挖掘,野生資源的種群遭到嚴重破壞,生存狀態變差,更新遲緩。密花豆在廣東和廣西有一定規模的仿野生栽培,但規范化程度低,無法滿足市場供應和臨床需求(榮廣天,2016;蕭曉吉等,2022)。加強密花豆種質鑒定、系統發育分析、栽培育種等基礎研究已成為雞血藤資源保護和可持續利用的重要課題。葉綠體基因組是存在于核基因組之外的另一種遺傳系統(孫孟濤等,2022),具有序列短而易獲取和解析(樊守金等,2022)、基因組成較恒定但有適中的堿基突變和核苷酸置換率(倪梁紅等,2015)等特點。另外,葉綠體基因組中存在類型較豐富、多態性較高的簡單重復序列(Simple sequence repeat,SSR),可用于植物分子標記的開發(王化坤等,2006)。開展葉綠體基因組的高通量測序及其序列解析,對推動密花豆種質鑒別、系統發育分析、分子標記輔助育種等研究具有重要的意義?!厩叭搜芯窟M展】被子植物的葉綠體基因組呈保守的環狀雙鏈四分體結構,長度為115~165 kb,由大單拷貝(Large single copy,LSC)區、反向重復A(Inverted repeat A,IRA)區、小單拷貝(Small single copy,SSC)區和反向重復B(Inverted repeat B,IRB)4個部分依次排列而成(Daniell et al.,2016;李裕華等,2020)。葉綠體基因組一般含有110~130個功能基因,除了少數功能未明確外,絕大多數與植物光合作用和葉綠體自身復制相關(張同武,2012;Zhang et al.,2012;趙振寧等,2023)。葉綠體基因組序列的編碼區和非編碼區具有不同的進化速率,可提供豐富的分類信息,其中編碼區序列的變異水平較低,適用于屬、科或更高階物種之間的分類研究,而非編碼區的突變程度較高,可用于屬內甚至種內物種的多樣性分析(倪梁紅等,2015)。目前,葉綠體基因組序列在物種鑒別、多樣性分析和系統發育分別等方面已有廣泛應用。Choi等(2018)利用中藥番杏葉綠體基因組序列探究中藥番杏在石竹科內的系統發育關系和進化地位,結果顯示番杏屬與松葉菊屬的親緣關系更近。Zhou等(2018a)比較中藥大黃3種同屬基源植物[掌葉大黃(Rheum palmatum)、唐古特大黃(R. tanguticum)和藥用大黃(R. officinale)]的葉綠體基因組序列,結果發現三者間存在8個高變異區域,表明葉綠體基因組可用作大黃藥材鑒別的超級DNA條形碼。王崇等(2021)基于甘薯葉綠體基因組序列開發出11個葉綠體SSR分子標記及其擴增引物,將其應用于104個甘薯品種的遺傳多樣性分析,并構建其葉綠體SSR指紋圖譜。由于選擇壓力和堿基突變等因素的作用,植物在進化過程中會出現密碼子偏好性的現象(Athey et al.,2017)。這種現象普遍存在于植物葉綠體基因組,且具有物種特異性(Ma et al.,2014;原曉龍等,2021)。密碼子偏好性與mRNA的轉錄調控、外源基因的表達及蛋白的翻譯速度和準確率密切相關(Chen et al.,2017;Zhou et al.,2018b),從而影響基因及其編碼蛋白的結構和功能(Zelasko et al.,2013)。此外,密碼子偏好性還可揭示物種之間進化關系,近緣物種的密碼子使用模式通常較相似。目前已有大量植物葉綠體基因組密碼子偏好性被研究報道。Wang等(2022)比較了40個山茶科物種的密碼子偏好性,結果發現其密碼子偏好性主要取決于自然選擇,且間接影響這些物種特有基因的表達,并基于密碼子偏好性可進一步解析物種間的系統發育關系。Li等(2023)分析了3份咖啡種質的密碼子偏好性,基于此發現煙草和酒釀酵母是咖啡基因表達的良好宿主,為后續咖啡基因轉化和分子育種提供參考?!颈狙芯壳腥朦c】密花豆的葉綠體基因組信息匱乏,目前鮮見有關密花豆葉綠體基因組序列特征及密碼子偏好性分析的研究報道,限制了密花豆種質資源的保護和開發利用?!緮M解決的關鍵問題】利用高通量測序技術對密花豆的葉綠體基因組全序列進行測序,結合生物信息學方法分析其序列特征,探究密花豆葉綠體基因組的密碼子偏好性,并通過構建系統發育進化樹解析密花豆的進化地位,為密花豆種質鑒定、分子育種及資源保護利用提供數據支持。

1 材料與方法

1. 1 樣本采集及處理

密花豆采集于廣西欽州市靈山縣,清洗干凈后置于硅膠袋中保存。參照吳民華等(2023)的方法,采用磁珠法植物基因組DNA提取試劑盒(北京康為生物科技有限公司)提取密花豆的基因組DNA,并采用NexteraXT DNA文庫制備試劑盒(Illumina,美國)構建的DNA文庫,后續用于高通量測序。

1. 2 序列獲取、拼接和注釋

采用Illumina NovaSeq測序平臺進行雙末端測序,測得的原始序列經NGS QC Toolkit進行過濾處理,獲得高質量讀序。運用SPAdes軟件以De novo模式進行序列組裝,并使用PLANN工具對葉綠體基因進行注釋,并將拼接序列和注釋信息上傳至GenBank數據庫(登錄號為OQ809071)。最后,使用OGDRAW工具制作葉綠體基因組圖譜,使其結構可視化。

1. 3 葉綠體基因組密碼子偏好性分析

1. 3. 1 基因篩選 以密花豆葉綠體基因組所有的蛋白編碼基因(Protein coding genes,PCGs)為對象,剔除重復序列、長度小于300 bp的序列、非ATG作為起始密碼子的序列、終止密碼子異常及內部存在終止密碼子的序列后,余下的序列用于密碼子偏好性分析。

1. 3. 2 密碼子組成分析 采用CodonW和CUSP等軟件計算PCGs的相對同義密碼子使用度(Relative synonymous codon usage,RSCU)、有效密碼子數(Effective number of codons,ENC)、總GC含量(GCall)及各編碼密碼子的首位、次位和末位堿基的GC含量(依次以GC1、GC2和GC3表示)等參數,并利用SPSS 22.0進行各參數間的相關分析。但RSCU>1.00時,表示該密碼子使用頻率高于其他同義密碼子;當RSCU≤1.00時,表示該密碼子使用頻率等于或高于其他同義密碼子。ENC取值范圍為20.00~61.00,其值越大,密碼子偏好性越弱,反之密碼子偏好性越強。

1. 3. 3 繪圖分析 采用Origin進行中性繪圖分析、ENC-plot分析和PR2-plot分析,以確定影響密花豆葉綠體基因組密碼子偏好性的因素。(1)以GC1和GC2的平均值GC12為縱坐標,GC3為橫坐標,繪制中性分析散點圖,并進行直線擬合,獲得回歸方程和相關系數(R2),再根據回歸系數(即回歸方程的斜率)和R2判斷密碼子偏好性的影響因素。若回歸系數趨向0,說明密碼子偏好性由自然選擇主導;若回歸系數趨向1.000,則堿基突變是影響密碼子偏好性的主要因素。(2)以ENC作為縱坐標,GC3為橫坐標繪制散點圖,并參考楊祥燕等(2022)的公式計算各基因的預期ENC(ENCexp),再以ENCexp為橫坐標,GC3為橫坐標繪制標準曲線,獲得ENC-plot分析散點圖。若絕大部分基因分布在標準曲線的遠處,則說明自然選擇是影響密碼子偏好性的主要因素,反之,堿基突變是影響密碼子偏好性的主要因素。然后計算ENC比值,即ENC比值=(ENCexp-ENC實際)/ENCexp,并統計各組段的基因個數和頻率,直觀展示ENC-plot的分析結果。(3)以G3/(G3+C3)為橫坐標,A3/(A3+T3)為縱坐標,繪制PR2-plot分析散點圖,對各密碼子第3位堿基的使用差異進行分析。根據圖中各點所處的位置判斷密碼子偏好的方向和程度,若位于中心位置,表示其密碼子偏好性不受自然選擇的影響。

1. 3. 4 最優密碼子確定 將所有用于密碼子偏好性分析的基因按ENC從小到大進行排序,在ENC最大和最小兩側各取5個基因分別建成高表達基因組和低表達基因組,計算各密碼子在2個表達基因組的RSCU差值(ΔRSCU),參考Wright(1990)的方法,以RSCU>1.00且ΔRSCU>0.08為標準,確定密花豆葉綠體基因組的最優密碼子。

1. 4 葉綠體基因組SSR分析

參考吳民華等(2023)設定的參數,分別采用MISA在線工具分析密花豆葉綠體基因組的SSR序列特征。

1. 5 葉綠體基因組比較分析

從GenBank下載的美麗密花豆(Spatholobus pulcher)、紫礦(Butea monosperma)、雞冠刺桐(Erythrina crista-galli)和常春油麻藤(Mucuna sempervirens)葉綠體基因組序列。分別采用IRcope和mVISTA比較密花豆葉綠體基因組與美麗密花豆、紫礦、雞冠刺桐和常春油麻藤的葉綠體基因組在全序列和SC/IR邊界的差異。

1. 6 系統發育分析

從GenBank下載豆科的美麗密花豆(S. pulcher)、紫礦(B. monosperma)、雞冠刺桐(E. crista-galli)、常春油麻藤(M. sempervirens)、大果油麻藤(Mucuna macrocarpa)、木豆(Cajanus cajan)、蟲豆(Cajanus crassus)、蔓草蟲豆(Cajanus scarabaeoides)、苦參(Sophora flavescens)、苦豆子(Sophora alopecuroides)和越南槐(Sophora tonkinensis),薔薇科的皺皮木瓜(Chaenomeles speciosa)和木瓜(Chaenomeles sinensis),景天科的四葉紅景天(Rhodiola quadrifida)和唐古紅景天(Rhodiola tangutica)等3個科共15種植物的葉綠體基因序列,并以百合(Lilium brownii)作為外群,采用MAFFT進行多重比對和校正,隨后使用RAxML軟件基于GTRGAMMA模式構建系統發育進化樹。

2 結果與分析

2. 1 葉綠體基因組結構分析結果

如圖1所示,密花豆葉綠體基因組全長為152275 bp,由83924 bp的LSC、25113 bp的IRA、18125 bp的SSC和25113 bp的IRB依次排列而成的環狀雙鏈四分體結構。密花豆葉綠體基因組的GC含量為35.2%。

如表1所示,密花豆葉綠體基因組共注釋到129個基因,包括84個PCGs、37個tRNA和8個rRNA。從拷貝數上看,除4個PCGs(ndhB、rps7、rpl2和rpl23)、7個tRNA(trnM-CAU、trnL-CAA、trnV-GAC、trnI-GAU、trnA-UGC、trnR-ACG和trnN-GUU)及全部rRNA為雙拷貝外,其余基因均為單拷貝。從內含子數量來看,共有16個基因存在1個內含子,包括9個PCGs(atpF、petB、petD、ndhA、ndhB、rps16、rpl2、rpl16和rpoC1)和7個tRNA(trnK-UUU、trnG-UCC、trnL-UAA、trnV-UAC、trnI-GAU和trnA-UGC),有2個PCGs(clpP和ycf 3)各含有2個內含子,其他基因則無內含子。

2. 2 密碼子偏好性分析

2. 2. 1 密碼子堿基組成分析 從密花豆葉綠體基因組中篩選出42個用于密碼子偏好性分析的PCGs,共含有17483個密碼子。由表2可知,42個PCGs的GC1為29.75%~57.56%,平均為45.26%,GC2為25.88%~54.68%,平均為38.40%,GC3為20.59%~35.83%,平均為26.27%,GCall為25.95%~43.15%,平均為36.64%,密碼子3位堿基的GC含量依次降低,說明密碼子以A/T結尾的頻率遠高于以G/C結尾的頻率。ENC為35.25~54.32,平均為44.38,ENC在45.00以上的PCGs數量占50%,說明密花豆葉綠體基因組的密碼子使用偏好性不明顯。

GC含量、ENC和密碼子數量進行相關分析,如表3所示。GC1、GC2和GC3均與GCall呈極顯著相關(P<0.01,下同);GC1與GC3呈顯著正相關(P<0.05,下同),說明堿基組成有一定的相似性,而GC2與GC3無顯著相關性(P>0.05),說明堿基組成存在明顯差異。ENC與GC1和GCall均呈顯著正相關,與GC3呈極顯著正相關,說明ENC主要受GC3影響,與GC1和GCall存在一定的關聯。此外,密碼子數量與GC2呈顯著負相關,且兩者對ENC均無明顯影響。

2. 2. 2 中性繪圖分析 密花豆葉綠體基因組中性繪圖分析結果如圖2所示。GC12為0.29~0.43,GC3為0.21~0.26,全部基因均處于坐標軸對角線的左上側,GC12與GC3的相關系數為0.045,回歸系數為0.307,說明二者無明顯相關性,暗示GC12和GC3的進化方式并無關聯。自然選擇和堿基突變均影響密花豆葉綠體基因組的密碼子偏好性,但自然選擇是主要決定因素。

2. 2. 3 ENC-plot分析 密花豆葉綠體基因組ENC-plot分析如圖3所示,大多數基因處于標準ENC曲線的下方,ENC實際距離ENCexp較遠,僅有少數基因分布在曲線附近,說明密花豆葉綠體基因組的密碼子偏好性主要是由自然選擇作用的結果,堿基突變的作用較小。由表4可知,ENC比值位于-0.05~0.05區間的基因有9個,這些基因的ENC實際趨近于ENCexp,而位于其他區間的基因有33個,這些基因的ENC實際與ENCexp相差甚遠,進一步證實密花豆葉綠體基因組的密碼子偏好性主要由自然選擇起決定作用。

2. 2. 4 PR2-plot分析 由圖4可知,圖中大多數基因位于右下象限內,說明在密碼子末位堿基的使用頻率上,T高于A,且G高于C。在其他3個象限內,也有少量基因零散分布,提示密花豆葉綠體基因組的密碼子偏好性是多因素共同作用的結果。

2. 2. 5 最優密碼子的確定 密花豆葉綠體基因組編碼各種氨基酸的密碼子及其RSCU如表5所示。編碼亮氨基酸的TTA具有最大RSCU,達2.10,而編碼亮氨酸的CTC、CTG和編碼絲氨酸的AGC具有最小的RSCU,為0.31。共有30種密碼子的RSCU>1.00,其中29種密碼子是以A或T結尾,僅有1個以G結尾,即編碼亮氨酸的TTG。

由表5還可知,根據高表達基因和低表達基因的RSCU計算所得ΔRSCU,該值大于0.08的密碼子有24個。按照預設的最優密碼子標準,即ΔRSCU>0.08且RSCU>1.00,最終確定密花豆葉綠體基因組編碼各種氨基酸的最優密碼子共有18個,分別是GCT、AGA、CGA、AAT、TGT、CAA、GAA、GGT、CAT、ATA、TTA、AAA、TTT、CCT、TCA、ACT、TAT和GTT。

2. 3 SSR序列特征分析結果

由表6可知,密花豆葉綠體基因組共有117個SSR位點,分別由單、二、三、四核苷酸重復基元組成,無五、六核苷酸重復基元。其中單核苷酸重復基元數量最多,占SSR位點總數的50.4%;其次是二核苷酸重復基元,占SSR位點總數的36.8%。在單、二、三、四核苷酸重復基元中,分別以A/T、AT/AT、AAT/ATT和AAAT/ATTT為主要重復基元??梢?,密花豆葉綠體基因組SSR主要是由A或T及其組合構成。

2. 4 SC/IR邊界比較分析結果

如圖5所示,5種植物葉綠體基因組相鄰的SC和IR之間均分別形成4個邊界,即JLB、JSB、JSA和JLA。除了常春油麻藤的JLB位于rps3和間隔區外,其余植物的JLB均位于rps19基因內,分別在5'端的51、51、49和68 bp處。密花豆和美麗密花豆的JSB均位于ycf1基因中,紫礦的JSB位于ycf1和ndhF基因重疊區,雞冠刺桐的JSB則位于ycf1和ndhF基因間隔區,而常春油麻藤的JSB位于ndhF基因中。5種植物的JSA均位于ycf1基因的另一個拷貝中,分別在5'端的500、476、475、1249和471 bp處。5種植物的JLA均位于基因間隔區,其中密花豆、美麗密花豆、紫礦和常春油麻藤的JLA位于rpl2基因的另一個拷貝和trnH基因之間,而雞冠刺桐的JLA則位于rps19和trnH基因之間。

2. 5 序列差異分析結果

豆科蝶形亞科菜豆族刺桐亞族5種植物密花豆、美麗密藥豆、紫礦、雞冠刺桐和常春油麻藤的葉綠體基因組序列差異如圖6所示,這些植物的葉綠體基因組之間存在較明顯的序列差異,非編碼區的堿基突變程度高于基因的編碼區,且SC的變異程度較IR大。密花豆與同屬的美麗密花豆的核苷酸序列相似性最高,但仍有多個區域存在堿基變異??梢?,葉綠體基因組在密花豆屬內及屬間均有較好的鑒別效果。

2. 6 系統發育分析結果

由圖7可知,密花豆與同屬的美麗密花豆最先聚在一起,形成密花豆屬分支,隨后再與紫礦屬、木豆屬、刺桐屬、黧豆屬和苦參屬共同聚成豆科分支;景天科和薔薇科植物分別單獨聚成一分支??梢?,系統發育進化樹的聚類效果良好,可直觀反映密花豆的進化地位。

3 討論

隨著新一代高通量測序技術的快速發展和序列解析方法的更新迭代,細胞器基因組的序列測定和解讀程序更趨容易、成本更加低廉(Heather and Chain,2016)。本研究發現,密花豆葉綠體基因組為長度為152275 bp的環狀雙鏈四分體分子,編碼129個基因,從功能上看主要是與光合作用和葉綠體自身復制相關的基因,其結構和基因組成與大多數植物如高良姜(黃瓊林,2021)等單子葉植物、鐵冬青(黃紅寶等,2022)等雙子葉植物相似,具有植物葉綠體基因組的典型特征。本研究系統地探究了密花豆葉綠體基因組的密碼子偏好性,結果發現密碼子3個位置的GC含量存在明顯差異,且GC1>GC2>GC3,說明密碼子首位、次位和末位的堿基組成不同,且末位堿基以A/T居多,與千果欖仁(余瀟等,2023)、金銀花大毛花(張加強等,2023)等植物的研究結果一致。通過繪圖分析,發現密花豆葉綠體基因組的密碼子偏好性主要是自然選擇的結果,而堿基突變以及其他因素也參與該進化過程,也是造成楸樹(李鳳等,2021)、菠蘿(楊祥燕等,2022)等多種植物密碼子偏好性的原因。密花豆葉綠體基因組RSCU>1.00的密碼子中有96.7%是以A或T結尾,而且確定的最優密碼子均以A或T結尾,表明密花豆在葉綠體進化過程中偏好使用以A或T結尾的密碼子。相同情況也出現在露兜樹(吳民華等,2023)、峨眉鳳仙花(趙秋燕等,2023)等植物中。上述結果暗示,陸生植物葉綠體基因組具有較保守的GC含量和密碼子使用偏好性。

SSR是植物基因組存在一種短的高頻重復DNA序列,是植物分子育種、遺傳進化分析等研究中常用的分子標記(黃瓊林,2022)。本研究在密花豆的葉綠體基因組中共找到117個SSR位點,主要分布在LSC和基因間隔區,且以A/T單核苷酸重復為主要類型,推測與密花豆葉綠體基因組的低GC含量相關。密花豆的SSR分布和類型與閉鞘姜(吳永飛,2023)、祁連圓柏葉(趙明等,2023)等大多數植物相似。

在前人研究中,黃瓊林等(2015,2016)利用葉綠體基因matK和rbcL成功鑒別密花豆(雞血藤)與大血藤、常春油麻藤等常見易混淆品,證實了葉綠體基組序列應用于密花豆品種鑒定的可行性。本研究序列比較分析也發現,密花豆不僅與常春油麻藤等屬外植物的葉綠體基因組存在較明顯的序列差異,與同屬的美麗密花豆也有多處堿基突變,表明葉綠體基因組是探究密花豆真偽鑒別和系統關系的理想分子工具。

由于葉綠體基因組是研究被子植物系統進化關系和分類地位的理想工具(Song et al.,2019)。本研究基于葉綠體基因組分析密花豆在豆科內的進化地位,結果發現密花豆與美麗密花豆最先形成獨立分支,形成單系類群,說明二者的親緣關系最近,與傳統植物分類相符(中國植物志編輯委員會,1995)。在科內,密花豆屬則與紫礦屬的分類位置更近。目前GenBank數據庫中可獲取的密花豆屬植物葉綠體基因組信息尚少,后續仍需利用更多的密花豆屬植物葉綠體基因組序列來構建密花豆的系統發育進化樹,以期全面地理解密花豆及近緣物種的進化關系,為密花豆的分子輔助育種提供參考。

葉綠體基因組不僅是研究植物物種鑒定和系統進化的理想工具,也是基因遺傳轉化的良好介質。自1988年首次在衣藻中成功實現葉綠體遺傳轉化后(Boynton et al.,1988),擬南芥、煙草和番茄等多種高等植物也先后實現了基因遺傳轉化(崔柳青等,2012)。隨著藥用植物的葉綠體基因組序列相繼研究和解析,基于葉綠體基因工程培養高產、優質、強抗逆性的藥用植物優勢植株有望實現。本研究開展的密花豆葉綠體基因組測序及序列特征分析,為密花豆的葉綠體遺傳轉化提供豐富的基因信息,葉綠體基因工程將是今后密花豆品種選育、性狀改良和增產豐產的重要研究方向之一,進而緩解密花豆的資源匱乏難題。

4 結論

密花豆葉綠體基因組具有植物葉綠體基因組典型的結構特點,在密花豆屬內及屬間均有較好的鑒別效果,且其密碼子偏好性是多因素共同作用的結果,其中自然選擇是主要決定因素,但堿基突變以及其他因素對密碼子使用偏好也有一定影響。

參考文獻:

崔柳青,李一帆,潘衛東. 2012. 葉綠體基因工程研究進展[J]. 生物技術通報,(6):1-6. [Cui L Q,Li Y F,Pan W D. 2012. Progress of studies on chloroplast genetic engineering[J]. Biotechnology Bulletin,(6):1-6.] doi:10. 13560/j.cnki.biotech.bull.1985.2012.06.025.

樊守金,郭秀秀. 2022. 植物葉綠體基因組研究及應用進展[J]. 山東師范大學學報(自然科學版),37(1):22-31. [Fan S J,Guo X X. 2022. Advances in research and application of plant chloroplast genome[J]. Journal of Shandong Normal University (Natural Science),37(1):22-31.] doi:10.3969/j.issn.1001-4748.2022.01.003.

國家藥典委員會. 2020. 中華人民共和國藥典(一部)[S]. 北京:中國醫藥科技出版社. [Chinese Pharmacopoeia Commission. 2020. Pharmacopoeia of the People’s Republic of China (Volume 1)[S]. Beijing:China Medical Science Press.]

黃紅寶,何應會,黃欣,孫開道,秦波,黃耀恒. 2022. 鐵冬青葉綠體全基因組及系統進化分析[J]. 農業研究與應用,35(5):7-14. [Huang H B,He Y H,Huang X,Sun K D,Qin B,Huang Y H. 2022. Chloroplast whole genome of Ilex rotunda and its phylogenetic analysis[J]. Agricultural Research and Application,35(5):7-14.] doi:10.3969/j.issn. 2095-0764.2022.05.002.

黃瓊林,馬新業,詹若挺,陳蔚文. 2015. 雞血藤及其混偽品matK基因分析和分子鑒定[J]. 北方園藝,(17):94-98. [Huang Q L,Ma X Y,Zhan R T,Chen W W. 2015. Comparative analysis and molecular identification of matK gene from Spatholobus suberectus and its adulterants[J]. Northern Horticulture,(17):94-98.] doi:10.11937/bfyy.201517024.

黃瓊林,馬新業,詹若挺,陳蔚文. 2016. 基于rbcL條形碼的雞血藤真偽鑒別[J]. 江蘇農業科學,44(6):57-60. [Huang Q L,Ma X Y,Zhan R T,Chen W W. 2016. Authentication of Spatholobus suberectus and its adulterants based on rbcL barcode[J]. Jiangsu Agricultural Science,44(6):57-60.] doi:10.15889/j.issn.1002-1302.20012.016.06.01.

黃瓊林. 2021. 高良姜葉綠體基因組測序與特征分析[J]. 熱帶作物學報,42(1):1-6. [Huang Q L. 2021. Complete sequencing and analysis of chloroplast genome from Alpinia officinarum Hance[J]. Chinese Journal of Tropical Crop,42(1):1-6.] doi:10.3969/j.issn.1000-2561.2021. 01.001.

黃瓊林. 2022. 高良姜轉錄組簡單重復序列位點分析[J]. 時珍國醫國藥,33(2):386-389. [Huang Q L. 2022. Analysis on SSR loci from Alpinia officinarum transcriptome[J]. Lishizhen Medicine and Materia Medica Research,33(2):386-389.] doi:10.3969/j.issn.1008-0805.2022.02.33.

李鳳,辛靜,辛雅萱,肖遙,屈亞亞,王軍輝,麻文俊,辛培堯. 2021. 楸樹葉綠體基因組密碼子偏性分析[J]. 南方農業學報,52(10):2735-2743. [Li F,Xin J,Xin Y X,Xiao Y,Qu Y Y,Wang J H,Ma W J,Xin P Y. 2021. Codon usage bias of chloroplast genome in Catalpa bungei C. A. Mey.[J]. Journal of Southern Agriculture,52(10):2735-2743.] doi:10.3969/j.issn.2095-1191.2021.10.013.

李裕華,任永康,趙興華,劉江,韓斌,王長彪,唐朝暉. 2020. 禾本科主要農作物葉綠體基因組研究進展[J]. 生物技術通報,36(11):112-121. [Li Y H,Ren Y K,Zhao X H,Liu J,Han B,Wang C B,Tang Z H. 2020. Research progress on chloroplast genome of major gramineous crops[J]. Biotechnology Bulletin,36(11):112-121.] doi:10. 13560/j.cnki.biotech.bull.1985.2020- 0285.

倪梁紅,趙志禮,米瑪. 2015. 藥用植物葉綠體基因組研究進展[J]. 中藥材,38(9):1990-1994. [Ni L H,Zhao Z L,Mi M. 2015. Research progress of chloroplast genome in medicinal plants[J]. Journal of Chinese Medicinal Materials,38(9):1990-1994.]doi:10.13863/j.issn1001-4454. 2015.09.046.

榮廣天. 2016. 密花豆種質資源ISSR分析[D]. 長沙:中南林業科技大學. [Rong G T. 2016. ISSR analysis on the diversity of Spatholobus suberectus germplasms[D]. Chang-sha:Central South University of Forestry & Technology.]

孫孟濤,張峻鑫,黃體冉,楊明峰,馬蘭青,段留生. 2022. 虎杖葉綠體基因組結構與變異分析[J]. 生物工程學報,38(5):1953-1964. [Sun M T,Zhang J X,Huang T R,Yang M F,Ma L Q,Duan L S. 2022. Genome structure and variation of Reynoutria japonica Houtt. chloroplast genome[J]. Chinese Journal of Biotechnology,38(5):1953-1964.] doi:10.13345/j.cjb.210843.

王崇,王連軍,楊新筍,雷劍,柴沙沙,張文英,焦春海,田小海. 2021. 104個甘薯品種的cpSSR指紋圖譜構建及遺傳多樣性分析[J].熱帶作物學報,42(6):1549-1556. [Wang C,Wang L J,Yang X S,Lei J,Chai S S,Zhang W Y,Jiao C H,Tian X H. 2021. Construction of cpSSR fingerprints and genetic diversity analysis of 104 sweet potato varieties[J]. Chinese Journal of Tropical Crops,42(6):1549-1556.] doi:10.3969/j.issn.1000-2561.2021. 06.006.

王化坤,婁曉鳴,章鎮. 2006. 葉綠體微衛星在植物種質資源研究中的應用[J]. 分子植物育種, 4(S1):92-98. [Wang H K,Lou X M,Zhang Z. 2006. Application in germplasm resource research using chloroplast simple sequence repeat[J]. Molecular Plant Breeding,4(S1):92-98.]

吳民華,鄒振寧,葉曉霞,梁艷清,陳妹,黃瓊林. 2023. 露兜樹葉綠體基因組結構與序列特征分析[J]. 中藥新藥與臨床藥理,34(1):115-122. [Wu M H,Zou Z N,Ye X X,Liang Y Q,Chen M,Huang Q L. 2023. Structure and sequence characteristics of chloroplast genome from Pandanus tectorius[J]. Traditional Chinese Drug Research and Clinical Pharmacology,34(1):115-122.] doi:10.19378/j.issn.1003-9783.2023.01.016.

吳永飛,楊雪蓮,顏麗,王霞,胡小京. 2023. 閉鞘姜葉綠體基因組特征及其系統發育分析[J]. 種子, 42(4):10-17. [Wu Y F,Yang X L,Yan L,Wang X,Hu X J. 2023. Analysis on chloroplast genome characteristics and phylogeny of Helenia speciosa[J]. Seed,42(4):10-17.] doi:10.16590/j.cnki.1001-4705.2023.04.010.

蕭曉吉,李苗苗,詹若挺,韓正洲,劉軍民. 2022. 密花豆野生及栽培資源調查與分析[J]. 中藥材,45(7):1592-1297. [Xiao X J,Li M M,Zhan R T,Han Z Z,Liu J M. 2022. Resource investigation and analysis of wild and cultivated Spatholobus suberectus[J]. Journal of Chinese Medicinal Materials,45(7):1592-1597.] doi:10.13863/j.issn 1001-4454.2022.07.010.

楊祥燕,蔡元保,譚秦亮,覃旭,黃顯雅,吳密. 2022. 菠蘿葉綠體基因組密碼子偏好性分析[J]. 熱帶作物學報,43(3):439-446. [Yang X Y,Cai Y B,Tan Q L,Qin X,Huang X Y,Wu M. 2022. Analysis of codon usage bias in the chloroplast genome of ananas comosus[J]. Chinese Journal of Tropical Crops,43(3):439-446.] doi:10.3969/j.issn.1000-2561. 2022.03.001.

余瀟,趙振寧,杜春. 2022. 千果欖仁葉綠體基因組特征及密碼子偏好性分析[J]. 山西農業大學學報(自然科學版),42(6):81-92. [Yu X,Zhao Z N,Du C. 2022. Analysis of the complete chloroplast genome sequence characteristics and its code usage bias of Terminalia myriocarpa[J]. Journal of Shanxi Agricultural University(Natural Science Edition),42(6):81-92.]doi: 10.13842/j.cnki.issn 1671-8151.202207004.

原曉龍,劉音,康洪梅,陳中華,李云琴,王毅. 2021. 蒜頭果葉綠體基因組密碼子偏好性分析[J]. 西南林業大學學報

(自然科學),41(3):15-22. [Yuan X L,Liu Y,Kang H M,Chen Z H,Li Y Q,Wang Y. 2021. Analysis of codon usage bias in chloroplast genome of Malania oleifera[J]. Journal of Southwest Forestry University,41(3):15-22.] doi:10.11929/j.swfu.202001047.

張加強,劉慧春,王杰,許雯婷,周江華,周開元. 2023. 金銀花大毛花葉綠體基因組密碼子的偏好性分析[J]. 浙江農業學報,35(4):821-830. [Zhang J Q,Liu H C,Wang J,Xu W T,Zhou J H,Zhou K Y. 2023. Analysis on codon usage patterns of chloroplast genome of Lonicera japonica cv. Damaohua[J]. Acta Agriculturae Zhejiangensis,35(4):821-830.] doi:10.3969/j.issn.1004-1524.2023.04.09.

張同武. 2012. 植物細胞器基因組測序、組裝及比較基因組學研究[D]. 杭州:浙江大學. [Zhang T W. 2012. The whole genome sequencing,assembly and comparative genomic research of plant organelle[D]. Hangzhou:Zhe jiang University.]

趙明,張宏斌,李偉,趙祜,劉建海,趙國生,趙興鵬,呂東. 2023. 祁連圓柏葉綠體基因組序列特征分析[J]. 植物資源與環境學報,32(3):1-11. [Zhao M,Zhang H B,Li W,Zhao H,Liu J H,Zhao G S,Zhao X P,Lü D. 2023. Ana-lysis on chloroplast genome sequence characteristics of Juniperus przewalskii[J]. Journal of Plant Resource and Environment,32(3):1-11.] doi:10.3969/j.issn.1674-7895.2023.03.01.

趙秋燕,曹孟會,李新藝,周敏,魏春梅,張茜,瞿素萍,黃海泉,黃美娟. 2023. 瀕危植物峨眉鳳仙花葉綠體基因組分析[J]. 福建農業學報,38(2):174-182. [Zhao Q Y,Cao M H,Li X Y,Zhou M,Wei C M,Zhang X,Zhai S P,Huang H Q,Huang M J. 2023. Complete chloroplast genome of endangered Impatiens omeiana[J]. Fujian Journal of Agricultural Sciences,38(2):174-182.] doi:10. 19303/j.issn.1008-0384.2023.02.007.

趙振寧,孫浩田,宋雨茹,余瀟. 2023. 山楂屬植物葉綠體基因組特征與密碼子偏好性分析[J]. 江蘇農業學報,39(2):504-517. [Zhao Z N,Sun H T,Song Y R,Yu X. 2023. Chloroplast genome characteristics and codon usage bias analysis of Crataegus L.[J]. Jiangsu Journal of Agricultural Sciences,39(2):504-517.] doi:10.3969/j.issn.1000-4440. 2023. 02.024.

中國植物志編輯委員會. 1995. 中國植物志(41卷)[M]. 北京:科學出版社:190-192. [Committee of Flora of China. 1995. Flora of China (Volume 41)[M]. Beijing:Science Press:190-192.]

Athey J,Alexaki A,Osipova E,Rostovtsev A,Santana-Quintero L V,Katneni U,Simonyan V,Kimchi-Sarfaty C. 2017. A new and updated resource for codon usage tables[J]. BMC Bioinformatics,18:391. doi:10.1186/s12859-017-1793-7.

Boynton J E,Gillham N W,Harris E H,Hosler J P,Johnson A M,Jones A R,Randolph-Anderson B L,Robertson D,Klein T M,Shark K B. 1988. Chloroplast transformation in Chlamydomonas with high velocity microprojectiles[J]. Science,240(4858):1534-1538. doi:10.1126/science. 2897716.

Chen S Y,Li K,Cao W Q,Wang J,Zhao T,Huan Q,Yang Y F,Wu S H,Qian W F. 2017. Codon-resolution analysis reveals a direct and context-dependent impact of indivi-dual synonymous mutations on mRNA level[J]. Molecular Biology and Evolution,34(11):2944-2958. doi:10.1093/molbev/msx229.

Choi K S,Kwak M,Lee B,Park S. 2018. Complete chloroplast genome of Tetragonia tetragonioides:Molecular phylogenetic relationships and evolution in Caryophyllales[J]. PLoS One,13(6):e0199626. doi:10.1371/journal.pone. 0199626.

Daniell H,Lin C S,Yu M,Yu M,Chang W. 2016. Chloroplast genomes:Diversity,evolution,and applications in genetic engineering[J]. Genome Biology,17(1):134. doi:10.1186/s13059-016-1004-2.

Heather J M,Chain B. 2016. The sequence of sequencers:The history of sequencing DNA[J]. Genomics,107(1):1-8. doi:10.1016/j.ygeno.2015.11.003.

Li Y Q,Hu X,Xiao M? K,Huang J X,Lou Y Q,Hu F G,Fu X F,Li Y N,He H Y,Cheng J H. 2023. An analysis of codon utilization patterns in the chloroplast genomes of three species of Coffea[J]. BMC Genomics Data,24(1):42. doi:10.1186/s12863-023-01143-4.

Ma L N,Cui P,Zhu J,Zhang Z H,Zhang Z. 2014. Translational selection in human:More pronounced in housekeeping genes[J]. Biology Direct,9:17. doi:10.1186/1745-6150-9-17.

Song Y,Zhang Y J,Xu J,Li W M,Li M F. 2019. Characteri-zation of the complete chloroplast genome sequence of Dalbergia species and its phylogenetic implications[J]. Scientific Report,9(1):20401. doi:10.1038/s41598-019-56727-x.

Wang Z J,Cai Q W,Wang Y,Li M H,Wang C C,Wang Z X,Jiao C Y,Xu C C,Wang H Y,Zhang Z L. 2022. Compara-tive analysis of codon bias in the chloroplast genomes of Theaceae species[J]. Frontiers in Genetics,13:824610. doi:10.3389/fgene.2022.824610.

Wright F. 1990. The ‘effective number of codons’ used in a gene[J]. Gene,87(1):23-29. doi:10.1016/0378-1119(90)90491-9.

Zelasko S,Palaria A,Das A. 2013. Optimizations to achieve high-level expression of cytochrome P450 proteins using Escherichia coli expression systems[J]. Protein Expression and Purification,92(1):77-87. doi:10.1016/j.pep. 2013.07.017.

Zhang T W,Fang Y J,Wang X M,Deng X,Zhang X W,Hu S N,Yu J. 2012. The complete chloroplast and mitochondrial genome sequences of Boea hygrometrica:insights into the evolution of plant organellar genomes[J]. PLoS One,7(1):e30531. doi:10.1371/journal.pone.0030531.

Zhou Y X,Nie J,Xiao L,Hu Z G,Wang B. 2018a. Comparative chloroplast genome analysis of rhubarb botanical origins and the development of specific identification mar-kers[J]. Molecules,23(11):2811. doi:10.3390/molecules 23112811.

Zhou Z,Dang Y,Zhou M,Yuan H,Liu Y. 2018b. Codon usage biases co-evolve with transcription termination machinery to suppress premature cleavage and polyadenylation[J]. Elife,7:e33569. doi:10.7554/eLife.33569.

(責任編輯 陳 燕)

收稿日期:2023-04-28

基金項目:廣東省基礎與應用基礎研究基金項目(2018A030310116);湛江市科技計劃項目(2019A01008)

通訊作者:黃瓊林(1986-),https://orcid.org/0000-0001-5248-8253,博士,副教授,主要從事醫學生物化學研究工作,E-mail:perfecthql @163.com

第一作者:吳民華(1981-),httpss://orcid.org/0000-0003-4454-5507,博士,副教授,主要從事中藥分子藥理研究工作,E-mail:wugdmczp @gdmu.edu.cn

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合