?

直穗小檗葉綠體基因組特征及系統發育分析

2024-03-19 04:35任玉玲李幸兒孫勝男趙成周
關鍵詞:密碼子葉綠體小檗

李 雪, 任玉玲, 趙 艷, 李幸兒, 孫勝男, 趙成周, 李 萍

(1.青海大學生態環境工程學院,青海 西寧 810016;2.青海大學醫學院,青海 西寧 810163;3.青海大學藏醫學院,青海 西寧 810016)

小檗屬(Berberis)植物種類繁多,全世界有594種,主要分布于亞洲、南美洲、北美洲和歐洲,中國有近230種,是世界上小檗屬物種多樣性最豐富的國家[1]。小檗屬植物是青藏高原主要漿果樹種之一,果實中富含維生素C、有機酸等多種生物活性物質,具有解熱和利尿的作用[2]。藥用價值方面,小檗果實能夠起到鎮靜和抗心律失常的作用,可用于治療高血壓、心律不齊和一些神經元疾病[3]。直穗小檗(B.dasystachyaMaxim.)是小檗科(Berberidaceae)小檗屬植物,生長于海拔800~3 400 m的山地灌叢中。直穗小檗的根、莖、葉、花和果實中含有多種化合物[4-6],例如花青素、生物堿、黃酮類以及酚類化合物,已被用于治療發燒、黃疸、風濕病、腎臟和膽結石等多種疾病[7]。小檗堿是小檗中最重要的功能化合物之一,是一種天然生物堿,具有許多藥用價值,其抗氧化、抗增殖和抗炎作用已在細胞試驗、動物模型和人體研究中得到廣泛證實。Wu et al[8]研究了小檗堿對糖尿病大鼠腎損傷的影響和作用機制,結果表明,小檗堿顯著降低了糖尿病大鼠的血糖、胰島素、總膽固醇和甘油三酯水平。因此,分析直穗小檗葉綠體基因組結構特征,說明直穗小檗在小檗科植物中的系統發育位置,對小檗屬物種資源鑒定和遺傳多樣性分析具有重要意義。

葉綠體是植物光合作用的主要場所,攜帶獨特的遺傳信息,遺傳系統由封閉的環狀DNA分子組成[9]。陸生植物葉綠體基因組長度為107~218 kb,具有典型的四分體結構,包括一段小單拷貝(small single copy,SSC)區、一段大單拷貝(large single copy,LSC)區,以及將這兩段分開的兩個反向重復區(inverted repeat, IR),即IRa和IRb[10]。近年來,高通量測序技術的出現促進了葉綠體基因組學的快速發展,NCBI基因組數據庫中提供了近千種完整的葉綠體基因組序列,這些結果為研究物種進化關系發揮了重大作用[11]。葉綠體基因組結構和排列順序比核基因組更保守[12],因此被廣泛應用于物種鑒定和系統發育分析。在小檗屬植物葉綠體基因組研究中,李述成等[13]分析了小檗屬9個物種的葉綠體基因組結構特征,并構建系統發育樹,為該屬物種的分類提供了依據。Feng et al[14]對威寧小檗(B.weiningensis)進行了葉綠體基因組測序分析,豐富了該屬物種的遺傳數據信息。

本試驗利用高通量測序技術,結合生物信息學方法獲取直穗小檗完整葉綠體基因組序列,通過分析其基因組結構特征,對直穗小檗及其近緣類群進行系統進化分析,為直穗小檗的系統進化、遺傳多樣性研究以及資源保護提供數據基礎。

1 材料與方法

1.1 材料

直穗小檗新鮮葉片采自青海省循化撒拉族自治縣清水鄉孟達村(102°40′29″E,35°47′30″N)。經青海大學孫勝男副教授鑒定為小檗科小檗屬直穗小檗。標本存放于青海大學生態環境工程學院,表型特征如圖1所示。

1.2 方法

1.2.1 DNA提取及葉綠體基因組測序 采用CTAB法[15]提取直穗小檗全基因組DNA,并使用1%瓊脂糖凝膠電泳檢測DNA的完整性。在質檢合格后,使用超聲粉碎儀將DNA切割為500 bp的片段,進行純化、末端修復、3′端加A以及接頭連接等處理,最后通過PCR擴增形成了測序文庫。在文庫質檢合格后,使用Illumina Hiseq系統進行測序。

1.2.2 葉綠體基因組組裝與注釋 過濾測序得到的原始數據,去除接頭序列及低質量的片段,保留高質量數據,參考其同源小檗屬鮮黃小檗(B.diaphanaMaxim.)葉綠體基因組(GenBank登錄號為MZ962404)的保守序列,利用SPAdes和Getorganelle軟件對直穗小檗的葉綠體基因組進行組裝[16]。得到的葉綠體組基因通過CPGAVAS2軟件[17]進行編碼基因注釋。最后,利用在線注釋軟件Ogdraw(https://chlorobox. mpimp-golm. mpg. de/OGDraw. html)繪制葉綠體基因組環狀結構圖。對直穗小檗基因組序列進行組裝注釋,并將其上傳至GenBank數據庫(登錄號為MZ983398)。

1.2.3 重復序列分析 利用MISA網站(https://webblast.ipk-gatersleben.de/misa/)搜索直穗小檗葉綠體基因組中的簡單重復序列(simple sequence repeat,SSR),設置單核苷酸重復次數≥10,二核苷酸重復次數≥5,三核苷酸重復次數≥4,四核苷酸、五核苷酸和六核苷酸SSR重復次數≥3,分析直穗小檗葉綠體基因組SSR位點。

1.2.4 密碼子偏好性分析 使用CodonW v1.4.2軟件[18]對直穗小檗葉綠體基因組同義密碼子的相對使用度(relatively synonymous codon usage, RSCU)進行分析統計。RSCU>1表示該密碼子使用存在偏好性,RSCU<1表示該密碼子使用率較低,RSCU=1表示該密碼子使用無偏好性。

1.2.5 IR邊界擴張和收縮分析 利用IRscope網站(https://irscope.shinyapps.io/irapp/)對直穗小檗及其近緣物種朝鮮小檗(B.koreana)、蘭山草(Ranzaniajaponica)、鮮黃連(Plagiorhegmadubium)、粗毛淫羊藿(Epimediumacuminatum)、裸花草(Achlystriphylla)、云南八角蓮(Dysosmaaurantiocaulis)以及傘花山荷葉(Diphylleiacymosa)葉綠體基因組4個區域邊界的差異進行分析。

1.2.6 系統進化分析 從NCBI數據庫下載31個小檗科植物葉綠體基因組,選擇4個與小檗科親緣關系較近的木通科(Lardizabalaceae)植物為外類群,利用MEGA 7.0軟件的最大似然法(maximum likelihood,ML)構建系統發育樹,自展值(bootstrap value)設為1 000[19]。

2 結果與分析

2.1 葉綠體基因組結構特征

clean data中pair-end reads總數為12 380 854;clean data總堿基數為3 695 961 752 bp;質量值大于或等于20、30的堿基數所占的百分比分別為96.82%、92.01%。

直穗小檗葉綠體基因組的形狀為閉合的雙鏈環狀分子,全長為167 036 bp。具有典型的四分體結構:包括37 400 bp的反向重復序列(inverted repeat sequence,IRs)、18 802 bp的SSC和73 434 bp的LSC?;蚩侴C含量38.16%,其中,IRs區的GC含量最高(40.85%),SSC區的GC含量最低(32.57%)(圖2)。

圖2 直穗小檗葉綠體基因組圖譜Fig.2 Chloroplast genome map of B.dasystachya

小檗葉綠體完整基因組共編碼144個功能基因,包含99個蛋白質編碼基因、37個tRNA基因和8個rRNA基因。在這144個基因中有32個基因在IRs區域呈現雙拷貝,分別為7個tRNA編碼基因(trnV-GAC、trnR-ACG、trnN-GUU、trnL-CAA、trnI-GAU、trnI-CAU、trnA-UGC)、4個rRNA編碼基因(rrn4.5、rrn5、rrn16、rrn23)以及21個蛋白編碼基因(ycf1、ycf2、rps3、rps7、rps8、rps11、rps12、rps19、rpl2、rpl14、rpl16、rpl22、rpl23、rpl36、rpoA、psbB、psbH、psbN、psbT、ndhB、infA)(表1)。

表1 直穗小檗葉綠體基因組注釋信息1)Table 1 Annotations of B.dasystachya chloroplast genome

2.2 葉綠體基因組編碼的基因分類

直穗小檗葉綠體基因組編碼的基因可根據功能劃分為3類,分別是遺傳系統基因、光合系統基因、其他基因和未知功能基因。與遺傳相關的基因有83個,包括37個tRNA基因、8個rRNA基因、18個核糖體小亞基基因、15個核糖體大亞基基因和5個DNA依賴性RNA聚合酶基因。光合系統相關基因總共有50個,包括5個光系統Ⅰ基因、19個光系統Ⅱ基因、5個細胞色素b/f復合體基因、6個ATP合酶亞基、1個二磷酸核酮糖羧化酶大亞基因、12個NADH脫氫酶亞和2個轉錄起始因子。最后一類包括5個其他基因和6個未知功能基因(表1)。

在直穗小檗葉綠體全基因組編碼的基因中,共有16個基因含有內含子,包括10個蛋白質編碼基因(rps16、atpF、rpoC1、ycf3、clpP、petB、rpl2、rpl16、ndhA和ndhB)和6個tRNA基因(trnA-UGC、trnK-UUU、trnG-UCC、trnL-UAA、trnV-UAC和trnI-GAU)。直穗小檗葉綠體基因組中除ycf3(726和747 bp)和clpP(729和737 bp)含有2個內含子外,其余14個基因均含有1個內含子。內含子長度最長的為trnK-UUU(2 495 bp),最短的為trnG-UCC(58 bp)(表2)。

表2 直穗小檗葉綠體基因組內含子的長度和位置Table 2 Length and location of introns in B.dasystachya chloroplast genome

2.3 重復序列分析

在直穗小檗葉綠體基因組序列中,共統計到了109個SSR,其中包括80個單核苷酸重復序列(73.4%)、10個二核苷酸重復序列(9.2%)、4個三核苷酸重復序列(3.7%)、7個四核苷酸重復序列(6.4%)和8個六核苷酸重復序列(7.3%),未發現五核苷酸重復的SSR。SSR基因序列堿基組成中,單核苷酸重復所占比例最高,且主要由A/T組成,其他重復序列也以A和T為主,表明直穗小檗葉綠體基因組SSR序列偏好A/T堿基(表3)。

表3 直穗小檗葉綠體基因組中SSR類型及數量Table 3 Types and number of SSR in B.dasystachya chloroplast genome

2.4 密碼子偏好性分析

對直穗小檗密碼子使用偏好性(表4)分析表明:RSCU>1的密碼子有31個,其中以A/T堿基結尾的有29個;RSCU<1的有31個,其中以G/C堿基結尾的有28個;RSCU=1的密碼子有2個。說明直穗小檗葉綠體基因組密碼子更加偏好A/T堿基,與其基因組和蛋白編碼基因較低的GC含量一致。

表4 直穗小檗葉綠體密碼子偏好性分析1)Table 4 Codon usage bias of B.dasystachya chloroplast genome

2.5 IR邊界擴張和收縮分析

為了探索IR區的擴張與收縮情況,將直穗小檗葉綠體基因組與小檗科內近緣屬的葉綠體基因組進行比較(圖3)。結果表明,8個小檗科植物葉綠體基因組長度為152 468(P.dubium)~169 224 bp(R.japonica),IR區域的長度為24 711(A.triphylla)~37 924 bp(R.japonica),LSC區域的長度為73 434(B.dasystachya)~87 080 bp(D.cymosa),SSC區域的長度為16 599(P.dubium)~20 698 bp(A.triphylla)。位于IR區邊界及邊界附近的基因主要有rpl22、rpl2、rps19、ycf1、ndhF、trnN、trnH。所分析的8個物種中,ndhF基因全部位于SSC區間,trnH基因全部位于LSC區間。朝鮮小檗SSC/IRb(junction of SSC/IRb, JSB)和SSC/IRa(junction of SSC/IRa, JSA)邊界附近缺失1個ycf1基因。朝鮮小檗、直穗小檗和蘭山草JSB邊界均未注釋到rps19基因,但都在LSC區間注釋到了clpP基因。

圖3 直穗小檗及近緣物種葉綠體基因組的4個連接邊界Fig.3 Four junction sites of chloroplast genomes of B.dasystachya and related species

2.6 系統進化分析

選擇已發表的小檗科葉綠體基因組為內類群,與小檗科親緣關系較近的4個木通科植物為外類群,構建ML系統發育樹(圖4)。發育樹將所分析的植物分為2大支:一大支包括所有小檗科植物,另一大支為外類群木通科植物。小檗科這一大類分支又分為5個亞分支:山荷葉屬(Diphylleia)、桃兒七屬(Sinopodophyllum)、鬼臼屬(Dysosma)以及裸花草屬(Achlys)為一支,淫羊藿屬(Epimedium)和鮮黃連屬(Plagiorhegma)為一支,蘭山草屬(Ranzania)、山槐葉屬(Bongardia)、紅毛七屬(Caulophyllum)、囊果草屬(Leontice)為一支,小檗屬(Berberis)和十大功勞屬(Mahonia)聚為一支。

“*”代表直穗小檗。 所有的葉綠體基因組均下載于NCBI,登錄號如下:傘花山荷葉(Diphylleia cymosa, NC_037908);日本山荷葉(Diphylleia grayi, NC_037901);桃兒七(Sinopodophyllum hexandrum, KT445939);南方山荷葉(Diphylleia sinensis, NC_037907);云南八角蓮(Dysosma aurantiocaulis, NC_037902);西藏八角(Dysosma tsayuensis, NC_037904);川八角蓮(Dysosma delavayi,NC_037899);八角蓮(Dysosma versipellis, NC_037898);貴州八角蓮(Dysosma majoensis, NC_037900);六角蓮(Dysosma pleiantha, NC_037905);小八角蓮(Dysosma difformis, NC_037906);裸花草(Achlys triphylla, NC_037726);三枝九葉草(Epimedium sagittatum, NC_029428);時珍淫羊藿(Epimedium lishihchenii, NC_029944);擬巫山淫羊霍(Epimedium pseudowushanense, NC_029945);粗毛淫羊藿(Epimedium acuminatum, NC_029941);長蕊淫羊藿(Epimedium dolichostemon, NC_029942);朝鮮淫羊藿(Epimedium koreanum, NC_029943);鮮黃連(Plagiorhegma dubium,NC_038103);蘭山草(Ranzania japonica, NC_039677);山槐葉(Bongardia chrysogonum, NC_042220);紅毛七(Caulophyllum robustum, NC_042221);囊果草(Leontice armeniaca, NC_042400);牡丹草(Gymnospermium microrrhynchum, NC_030061);南天竹(Nandina domestica, DQ923117.1);阿里山十大功勞(Mahonia oiwakensis,MN735221);闊葉十大功勞(Mahonia bealei, NC_022457);直穗小檗(Berberis dasystachya Maxim, MZ983398);朝鮮小檗(Berberis koreana, NC_030063);黃蘆木(Berberis amurensis, NC_030062);威寧小檗(Berberis weiningensis, MW018363);三葉木通(Akebia trifoliata, KU204898);長萼木通(Archakebia apetala,MK468518);串果藤(Sinofranchetia chinensis, NC_041488);貓兒屎(Decaisnea insignis, NC_035941)。

3 討論

葉綠體基因組在長期的進化過程中形成了高度保守的基因組結構。然而,由于過去幾十年測序技術和成本的限制,葉綠體基因組研究進展緩慢。近年來,隨著測序技術的不斷完善和推廣,植物葉綠體基因組研究已廣泛應用于系統發育學、譜系地理學以及植物資源分類和鑒定等方面[20-21],是研究植物系統發育和進化的重要材料[22]。本研究利用高通量測序技術和生物信息學分析方法對直穗小檗葉綠體全基因組進行了分析,研究結果與大多數被子植物葉綠體基因組數據相符。直穗小檗葉綠體基因組呈現典型的環狀四分體結構,全長167 036 bp,其中,LSC為73 434 bp,SSC為18 802 bp,IRs為37 400 bp。共編碼144個功能基因(99個蛋白質編碼基因、37個tRNA基因以及8個rRNA基因)。GC含量38.16%,這與威寧小檗[14]、科爾切斯淫羊藿(EpimediumpinnatumFisch)[23]以及闊葉十大功勞(Mahoniabealei)[24]的基因數據基本相同,IRs區的GC含量最高(40.85%),SSC區的GC含量最低(32.57%),GC含量越高,DNA密度越大,DNA序列越穩定[25]。

葉綠體基因組IR/SC邊界位置的變化在不同物種間是普遍存在的現象,即使是同一科的物種也會有差異。本研究對小檗屬8種植物的葉綠體基因組進行了IR邊界分析,結果表明,朝鮮小檗JSB和JSA邊界附近均缺失1個ycf1基因。ycf1是質體基因組中的第二大基因,對植物生存至關重要。ycf1跨越SSC和IR區域,在大多數植物中,SSC區域中的ycf1具有序列變異性[26]。ycf1存在于苔蘚(Marchantiapolymorpha)[27]、煙草(Nicotianatabacum)[22]和牡丹(Marchantiapolymorpha)[26]等高等植物的葉綠體基因組中,但在水稻(Oryzasativa)、玉米(Zeamays)[28]以及蘭花(Orchidaceae)[29]等單子葉植物的葉綠體基因組中缺失。因此,葉綠體基因組中的ycf1并不是被子植物的必需基因。推測葉綠體基因組中丟失的基因已經轉移到了核基因組中,但目前尚未鑒定出核基因組中的ycf1同源物[30]。這些研究結果為小檗屬植物進化關系研究提供了新的依據。

重復序列是重要的遺傳標記,由于其母系遺傳、穩定性高以及具有高等位基因多態性等特點,常被用于研究物種遺傳多樣性和進化關系[31]。本研究在直穗小檗葉綠體基因組中檢測到109個SSR位點,其中大部分是由A/T堿基組成的單核苷酸重復序列,與桃兒七(Sinopodophyllumhexandrum)[32]和淫羊藿屬(Epimedium)[33]等其他小檗科植物重復序列特征相似。此外,所有的SSR位點中,A/T、AT/TA、ATA/TAT/TTA等A/T重復類SSR占總數的90%,與大多數已報道的物種一致。研究表明,基因組中較低的GC含量有利于維持物種的熱力學穩定性,GC含量通常與DNA的穩定性呈正比,GC含量越低,越容易產生更多的突變位點[34]。因此,這些重復序列為直穗小檗遺傳多樣性研究提供了可選用的分子標記。

直穗小檗葉綠體基因組含有31個高頻密碼子(RSCU>1),其中94%以A/T堿基結尾。這表明直穗小檗葉綠體基因組偏好使用以A或T堿基結尾的密碼子。密碼子使用偏好性在原核生物和真核生物中普遍存在,相關研究表明,密碼子使用偏好性與多種生物學因素有關,包括基因組大小、基因表達水平、基因翻譯起始信號、tRNA豐度等[35]。因此,密碼子使用偏好性作為植物基因組的基本特征,為基因組生物學研究提供了重要信息。

本研究基于NCBI已公布的小檗科主要屬的物種葉綠體基因組,以木通科的三葉木通、長萼木通、串果藤和貓兒屎為外群,構建了ML系統發育樹,并分析了直穗小檗的進化地位和親緣關系。結果表明,直穗小檗與朝鮮小檗、黃蘆木以及威寧小檗的親緣關系最近,同時與十大功勞屬的阿里山十大功勞和闊葉十大功勞聚為一支,這與李述成等[13]的研究結果基本一致。在分類學上,小檗屬和十大功勞屬被認為是姐妹類群,這與小檗科植物的形態學研究結果基本一致。研究還發現,小檗屬和十大功勞屬的花粉形態具有較高的一致性,二者種子形態十分相似,均為長卵球形或多卵球形,長寬比接近,種皮紋飾均為網紋型[36]。因此,葉綠體全基因組序列分析在一定程度上支持了小檗科植物的系統發育關系。

綜上所述,本研究成功獲取了直穗小檗的完整葉綠體基因組序列,并對其進行了詳細分析,包括基因組結構、重復序列、IR邊界以及密碼子偏好性等特征的解析。此外,通過構建系統發育樹,揭示了直穗小檗與其他相關物種的親緣關系。這些研究結果為深入研究直穗小檗的遺傳資源、物種鑒定以及系統進化等提供了重要的理論依據。

猜你喜歡
密碼子葉綠體小檗
小檗堿治療非酒精性脂肪肝病相關通路的研究進展
貴州野生小檗屬植物土壤與植株微量元素相關性及富集特征
密碼子與反密碼子的本質與拓展
交泰丸中小檗堿聯合cinnamtannin D1的降血糖作用
10種藏藥材ccmFN基因片段密碼子偏好性分析
黃芩苷-小檗堿復合物的形成規律
南方紅豆杉葉綠體非編碼序列PCR體系優化及引物篩選
茶樹CsActin1基因密碼子偏性分析
茶樹葉綠體DNA的PCR-RFLP反應體系優化
煙草葉綠體密碼子的偏好性及聚類分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合