?

茶樹葉綠體基因組的研究與應用進展

2024-03-12 14:31楊雨青譚娟汪芳彭順利陳婕譚明燕呂美艷周富裕劉聲傳
生物技術通報 2024年2期
關鍵詞:葉綠體茶樹基因組

楊雨青 譚娟 汪芳 彭順利 陳婕 譚明燕 呂美艷 周富裕劉聲傳

(1.貴陽學院生物與環境工程學院,貴陽 550005;2.貴州省農業科學院茶葉研究所,貴陽 550006)

茶樹(Camellia sinensis)是世界上最古老、最受歡迎的非酒精飲料經濟植物,是一種多年生自交不親合異花授粉作物,具有高度遺傳異質性[1-2]。我國茶樹種質資源豐富,由于頻繁引種馴化、雜交和多倍體化,其起源、進化、分類等方面復雜多樣,而難以有效保護開發利用,對其有效鑒定、明確其系統進化及親緣關系等備受關注[3-4]。

越來越多的植物葉綠體基因組被破譯,增強了對植物葉綠體生物學、胞內基因轉移、多樣性和遺傳基礎的理解,促進作物改良、生產高價值的農業或生物醫藥產品[5]。茶樹等植物葉綠體基因組具有非重組、單倍體、單親遺傳、進化速率適中、序列和結構高度保守等特征,已應用于資源的鑒定、起源、進化和分類等方面研究[5-6]。Li 等[6]比較分析了一些山茶屬植物葉綠體基因組,認為序列重復與插入缺失是誘導葉綠體基因變異的主要動力。Peng等[7]研究發現栽培型茶樹葉綠體基因組的序列和結構較野生型茶樹更保守,其變異為核苷酸多態性和序列插入。閆明慧等[8]通過葉綠體基因組測序分析,初步明確了‘信陽10 號’與其他茶樹資源的進化關系。目前,仍有不少茶樹資源的葉綠體基因組未被破譯。本文論述了植物葉綠體基因組的起源、遺傳方式、基本特征,著重述評了已公布茶樹葉綠體基因組的測序技術、特征、基因類型、基因序列,概述了其應用現狀,并探討了其未來應用與發展方向,以期為相關研究提供參考。

1 植物葉綠體基因組

20 億年前藍細菌(Cyanobacteria)被真核細胞捕獲,最終產生了葉綠體[9-10]。經過一個世紀的爭論,20 世紀60 年代葉綠體DNA 的存在被證實[11-12]。1986 年,第一個完整葉綠體基因組在煙草(Nicotiana tabacum)中獲得,隨后蔬菜、水果、谷物、飲料、油類和糖類等植物的葉綠體基因組相繼被破譯[13]。20 世紀80 年代末,外源基因被整合至葉綠體基因組中穩定表達,在90 年代表現出典型的母系遺傳[12]。Kaundun 等[14]基于簡單重復序列(single sequence repeat,SSR)標記分析,表明茶樹葉綠體基因組為母系遺傳。

葉綠體是植物進行光合作用的細胞器,其完整的結構和功能是光合作用正常進行的前提。脂肪酸、氨基酸、多種植物激素前體和次生代謝物的合成也發生在葉綠體中。葉綠體還參與植物對多種生物與非生物脅迫的響應,被認為是植物響應外界環境的感受器[15]。利用葉綠體的這些特征,在重要作物中研發具有特異農藝性狀的產品一直難以實現,但開發的酶等商業產品,已運用于果汁加工、提高棉纖維吸水率、天然清潔劑等[16]。

多數植物的葉綠體DNA 為雙鏈環狀,傘藻(Acetabularia)等少數植物為線狀[17-19]。多數高等植物的葉綠體基因組為高度保守的四分體結構,包含一段大單拷貝區(large single copy,LSC)、小單拷貝區(small single copy,SSC)以及將這兩段分開的、序列相同的一對反向重復(inverted repeat,IR)區(IRa和IRb,長度為20-30 kb)[5]。植物葉綠體基因組為107-218 kb,其長度變化主要由IRs 的收縮和擴張引起,含95-145 個編碼基因,按功能不同分為與光合作用、葉綠體基因表達、生物合成相關的基因,以及未知功能的開放閱讀框[12,20]。植物葉綠體基因組進化速率適中(約為核基因組進化速率的1/3)[21]、基因含量相對穩定[22]、編碼區和非編碼區的進化速率差異顯著[23-24]、重組率低[25-26]。葉綠體基因組序列揭示了綠色植物系統發育框架,以及葉綠體基因組轉移到其他真核生物的復雜歷史。葉綠體基因之間不一致的歷史信號表明整個質體組可能存在可變的限制條件,進一步理解和緩解這些限制條件可能為生物工程提供新機會[16]。

2 茶樹葉綠體基因組

2.1 測序技術

基因組測序技術不斷發展,一代(Sanger 測序)、二代(454 焦磷酸、Solexa 和SOLiD 測序)到三代(PacBio SMRT、PacBio Sequl 和納米孔測序)測序,費用降低、精度顯著提高[27]?!F觀音’ ‘黔茶1 號’‘武夷水仙’ ‘白葉1 號’等葉綠體基因組測序運用二代測序,‘Sangmok’ ‘大紅袍’ ‘白雞冠’ ‘鐵羅漢’等以二代測序為主,輔以三代測序。隨著測序技術的快速發展,破譯更多、更準確的葉綠體基因組,將極大豐富茶樹葉綠體基因組數據庫。

2.2 基因組特征

目前,已在NCBI 上公布了33 份茶樹資源的葉綠體基因組,大小為153 044-158 916 bp,GC 含量為37.2%-37.34%,LSC、SSC、IRs 長度分別為64 665-87 213 bp、16 463-19 155 bp、24 627-27 900 bp。IRs 邊界隨著葉綠體基因組的進化而有所擴張或收縮,不同茶樹資源葉綠體基因組IRs 邊界區的連接位置有細微差異,具體為LSC/IRb 或IRa/LSC 邊界無差異,IRb/SSC 和SSC/IRa 邊界存在微小差異(圖1)。相較于野生茶樹,栽培型茶樹葉綠體基因組長度變化較小,基因數量和GC 含量較穩定[7]。

圖1 五個茶樹品種葉綠體基因組LSC、SSC 和IR 邊界比較Fig.1 Comparison of the LSC,IR and SSC border regions among the chloroplast genomes of five tea cultivars

茶樹葉綠體基因組有97-141 個編碼基因,包括蛋白編碼基因60-100 個、tRNA 基因24-47 個、rRNA 基因8 個(少數4-5 個)。多數編碼基因含1個內含子,cloP、clpP 和ycf3 等一些特殊基因含2個內含子[28-29]。Yang 等[4]分析發現‘黔茶1 號’IRs區的ycf2 序列最長,編碼2 298 個氨基酸。在‘龍井43’和‘武夷水仙’中發現rps12 是反式剪接基因[30]?;蜻x擇壓力分析表明,相較于其他茶組資源,‘西蓮1 號’中的6 個基因(accD、ndhC、petB、rpl16、rpoC1 和rpoC2)可能處于正選擇狀態[31](表1)。

表1 已公布茶樹葉綠體基因組Table 1 Published chloroplast genomes of tea plants

共顯性SSR 廣泛分布于葉綠體基因組中,是研究系統發育和群體遺傳學的重要分子標記[43-44]。茶樹葉綠體的SSR 主要為單核苷重復序列(A/T 重復為主),有少量雙堿基及多堿基重復序列。在‘信陽10 號’葉綠體基因組中共檢測到74 個SSR,其中,有56 個單核苷重復(A/T 重復)、二核苷酸重復4 個(AT/AT 重復)[8]?!抨?0 號’等17 個茶樹品種的LSC、IRs 區核苷酸多樣性較低(平均為0.001 35),SSC 區相對較高(平均為0.058 08),區域邊界高度保守(圖1)[8]。成楊等[45]分析發現江華苦茶居群的32 份資源葉綠體DNA 變異率約為0.78%。密碼子使用偏差(codon usage bias,CUB)是基因組的一種獨特性質,是指編碼序列中同義密碼子的非隨機使用。Yengkhom 等[46]比較分析了阿薩姆茶(C.sinensis var.assamica)、中國茶(C.sinensis var.sinensis)和毛肋茶(C.pubicosta)的葉綠體蛋白質編碼基因發現,這些基因富含AT,其高表達與CUB 高度相關。Shi 等[40]研究發現,山茶屬植物葉綠體基因ycf15 有完整的編碼框,經轉錄產生但無任何功能,認為假基因轉錄普遍,葉綠體DNA 轉錄后加工可能涉及非功能基因的復雜剪接。

2.3 基因類型

茶樹葉綠體的功能基因分為光合作用相關基因、自我復制相關基因、生物合成相關基因和其他未知功能基因4 類(表2[8,29,33],圖2)。光合作用相關基因包括光合系統Ⅰ基因、光合系統Ⅱ基因、ATP合成酶基因、NADH 脫氫酶基因、二磷酸核酮糖羧化酶大亞基基因、細胞色素復合物基因等。自我復制相關基因包括tRNA 基因、rRNA 基因、RNA 聚合酶亞基基因、核糖體大亞基基因、核糖體小亞基基因等,多數為tRNA 基因。葉綠體中生物合成相關基因,主要包括成熟酶基因、囊膜蛋白乙酰輔酶A羧化酶亞基基因、c 型細胞色素合成基因、轉錄起始因子基因等。其他未知功能基因,即一些未知功能的開放閱讀框,約有7 個?!抨?0’葉綠體基因組中有47 個光合系統基因、59 個遺傳系統基因、5 個生物合成相關基因、2 個未知功能基因[8]?!埦?3’葉綠體基因組中有45 個光合系統基因、76個遺傳系統基因、4 個生物合成相關基因、6 個未知功能基因[29]?!S金芽’葉片光系統電子傳遞途徑酶基因CsLFNR1.1 表達響應光照強度變化,隨著光強增加表達量提高,可能與其葉片黃化相關[47]。圖3 顯示,‘安化’‘龍井43’‘云抗10 號’分別存在特有葉綠體基因。結果表明,不同茶樹資源的葉綠體基因類型存在一定的差異,具有一定的遺傳特性。

表2 茶樹葉綠體基因組基因類型Table 2 Gene types of the chloroplast genome in tea plants

圖2 栽培型茶樹完整葉綠體基因組的基因圖譜Fig.2 Gene map of the complete chloroplast genome of cultivated tea plants

2.4 基因序列

中國栽培型茶、印度阿薩姆茶葉綠體基因組基因序列存在一定差異,栽培型茶與野生型茶樹之間的葉綠體基因組基因序列差異更大[8,48]。在栽培型茶樹中,最可變的基因是ycf1;一些中國栽培型茶的rps12 無內含子;印度阿薩姆茶和‘云抗10 號’無orf42、ycf1 和ycf15(圖2)[7]。栽培型茶樹之間的psaA_ycf3、petL_petG 和ycf1_ndhF 一致性相對較低;栽培型茶樹和野生型茶樹之間的atpH_atpI、trnEUCC_trnT-GGU、psaA_ycf3、ycf15_trnLCAA、ycf1_ndhF 和ndhG_ndhI 一致性相對較低(圖2)[7]。中國栽培型茶樹之間的ycf1、trnV-GAC_rps12 序列不一致,如‘龍井43’的ycf1 有9 bp 插入序列(TCC TTC TTC/GAA GAA GGA);栽培型阿薩姆茶之間的rnN-GUU_ndhF、rrn5_trnR-ACG 序列不一致,如‘云抗10 號’的rnN-GUU_ndhF 有72 bp 插入序列[7]。野生型茶樹葉綠體基因的核苷酸多樣性水平約為栽培型茶樹的6.6 倍,但栽培型茶樹也有少數基因如rps16、rps4、trnL-UAA_intron 的核苷酸多樣性水平高于野生型茶樹,這些基因主要位于LSC,可用作鑒定資源的潛在分子標記[7]??傮w上,栽培型茶樹的葉綠體基因組較野生型茶樹保守。

3 茶樹葉綠體基因組的應用

3.1 分類鑒定

茶組植物是山茶屬內分類學問題最多的類群,對其有效分類鑒定是進行這些資源保護與利用的前提與基礎[49]。葉綠體基因組數據已應用于茶樹系統發育研究,日本等產茶國家基于葉綠體基因組序列,研究山茶屬植物間親緣關系[50-51]。Zhu 等[52]構建30 種山茶屬植物的葉綠體基因組系統發育樹發現,安龍瘤果茶(C.anlungensis)與膜葉茶(C.leptophylla)、毛葉茶(C.ptilophylla)、毛肋茶(C.pubicosta)、大苞茶(C.grandibracteata)和茶(C.sinensis var.sinensis)親緣關系較近。Hao 等[53]利用此方法,分析發現大廠茶(C.tachangensis)與禿房茶(C.gymnogyna)、大理茶(C.taliensis)聚為一類,與茶(C.sinensis var.sinensis)、阿薩姆(C.sinensis var.assamica)、白毛茶(C.sinensis var.pubilimba)親緣關系遠。此外,羅祥宗等[54]利用已公布的茶組植物葉綠體全基因組,篩選出16 對引物,共含25 個SNP 位點,可用于茶樹品種的母系溯源和鑒別。

相較于核基因組的分子標記,葉綠體DNA 條形碼更加簡便、高效、準確,葉綠體基因組相關的條形碼將顯著提高不同物種的鑒別率[55]。生命條形碼聯盟建議將葉綠體基因rbcL、matK、trnH-psbA 和核基因ITS 作為陸地植物通用的DNA 條形碼[56]。溫貝貝[57]發現matK 和rbcL 組合對山茶屬植物64 份資源的鑒別率最大。毛娟[58]對臨滄6 個居群的453個茶樹個體的rpl32-trnL 多態性分析,得到7 種葉綠體單倍型。聶傳朋等[59]初步篩選出matK、rcbL 可用作茶樹DNA 條形碼。

葉綠體基因組具有單親遺傳、不發生重組和非編碼區比編碼區進化速率更快的特點,而用于居群遺傳多樣性有效評價[60-61]?;诤薙SR 和葉綠體DNA 序列分析結果一致,城步峒茶的遺傳變異主要存在于居群內[62]。進化速率較快的葉綠體基因組片段(rcbL、rpl16、trnH-psbA、trnL-F 和rpl32-trnL)在茶樹等植物遺傳多樣性分析中得到了不少應用[63-66]。

3.2 起源、馴化研究

中國型茶樹、中國型阿薩姆茶樹與印度型阿薩姆茶樹之間的譜系是否一致長期有爭議。比較葉綠體基因分析表明,印度型阿薩姆茶樹、中國型茶樹可能經歷了不同馴化,起源不同[67]。Li 等[48]通過比較分析‘武夷水仙’(三倍體)、中國型茶樹、中國型阿薩姆茶、印度型阿薩姆茶等山茶屬植物的葉綠體基因組,支持3 個獨立馴化起源假說。吳艾琳[68]利用葉綠體rpl32-trnL 和trnG-S 分析了大理茶和厚軸茶(C.crassicolumna)27 個居群的遺傳多樣性和遺傳結構,認為茶樹存在分別以大理茶、厚軸茶為起源中心的2 條傳播途徑。比較葉綠體基因組分析表明,‘鳳凰單叢’、福建烏龍茶品種與其他栽培型茶樹聚為一類,但這兩種烏龍茶資源相對獨立地交叉嵌入山茶屬植物中,‘鳳凰單叢’與其他烏龍茶品種之間親緣關系近,總體上烏龍茶資源的葉綠體基因組變異低、進化保守[48]。

3.3 白化機制研究

多數白化茶樹品種適制名優綠茶,但其白化分子機制仍不明確[35]。茶樹白化現象與葉綠體的發育等密切相關,一些葉綠體基因參與茶樹葉綠體發育,但這些基因的RNA 編輯位點仍未明確[69]。在細胞器中,不同家族的RNA 編輯因子組裝成RNA編輯復合體,特異識別編輯位點進行編輯[70]。Zhao等[69]對‘華白1 號’‘白葉1 號’和‘龍井43’中的11 個RNA 編輯位點差異編輯效率測定,鑒定到10 個多細胞器RNA 編輯因子(multiple organellar RNA editing factor,MORF),其中‘華 白1 號’的CsMORF9.2 表達水平顯著下調,可能參與了其新梢白化。此外,Zhang 等[71]對6 個茶樹品種葉綠體matK 和ndhD 的RNA 編輯分析發現,matK-701 可能參與了葉色變化。

4 總結與展望

我國茶樹種質資源豐富,很有必要對其復雜的起源、進化、分類、特異性狀等進行有效鑒評,進而對其高效保護與創新利用。相較于核基因組,結構簡單的、較小的、保守的葉綠體基因組更有助于這方面的研究。不少茶樹資源的起源、馴化機制還未明確。目前已破譯了少量茶組植物葉綠體基因組,揭示了部分葉綠體基因組的基因類型和序列特征,但其結構變異機制仍未明確。葉綠體基因的RNA 編輯、水平基因轉移、核質互作等方面仍需深入研究。

葉綠體基因組有約50%部分包含不保守的基因間隔區和調控序列,若缺乏這些序列,葉綠體基因組轉化難以成功。茶樹中還未明確通用的葉綠體DNA 條形碼,一些單個葉綠體基因片段已被開發成DND 條形碼,用于茶樹分化研究,但對整個葉綠體基因組在茶樹種內分化特別是新品種分化的有效性知之甚少。

隨著高通量測序及生物技術的快速發展,茶組植物葉綠體基因組測序數量和精度的增加,對茶樹葉綠體基因組的深入研究,將會提高茶樹資源的分類鑒定效率,進一步明確其起源、演化、馴化機制,開發高效通用DNA 條形碼,深入揭示白化茶樹白化分子機理,推動葉綠體基因工程發展。

猜你喜歡
葉綠體茶樹基因組
牛參考基因組中發現被忽視基因
山茶樹變身搖錢樹
兩個推薦茶樹品種
南方紅豆杉葉綠體非編碼序列PCR體系優化及引物篩選
茶樹灣
基因組DNA甲基化及組蛋白甲基化
有趣的植物基因組
古茶樹研究概述
茶樹葉綠體DNA的PCR-RFLP反應體系優化
基因組生物學60年
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合