?

煙草KNOX基因家族的結構與表達模式分析

2019-02-23 07:15劉向真王根發金立鋒李澤鋒王宇博楊永鋒
煙草科技 2019年2期
關鍵詞:內含子同源外顯子

劉向真,王根發,金立鋒,張 林,魏 攀,王 晨,李澤鋒,王宇博,王 燃,楊永鋒,王 中*

1.河南中煙工業有限責任公司技術中心,鄭州經濟技術開發區第三大街9號 450000

2.中國煙草總公司鄭州煙草研究院,鄭州高新技術產業開發區楓楊街2號 450001

3.河南農業大學煙草學院,鄭州市金水區農業路63號 450002

4.鄭州大學生命科學學院,鄭州高新技術產業開發區科學大道100號 450001

植物 KNOX(KNOTTED1-like homeobox)基因屬于同源異型盒(Homeobox)基因家族,該家族成員編碼一類具有同源異型盒結構域的轉錄因子,廣泛參與調控植物體的形態建成、模式形成等生理活動[1-2]。典型的同源異型盒結構域包含由60個氨基酸殘基組成的3個螺旋區,其中前兩個螺旋區結合形成環(Loop)結構,第2和第3個螺旋區形成螺旋-轉角-螺旋結構[3]。但也存在一些非典型的同源異型盒結構域,由63個氨基酸組成非典型的DNA結合域,在其第1個與第2個螺旋之間存在3個額外的氨基酸(P-Y-P),因此該類型基因也被稱為TABLE(Three Amino-acid Loop Extension)基因家族[4-5]。在植物中,TABLE基因主要包括KNOX和BELL(BEL1-like homeodomain)兩大類。KNOX基因幾乎在所有的植物中均有分布[1],第1個植物KNOX基因是在玉米(Zea mays)中發現的Knotted1(Kn1)基因[6],隨后陸續從多種植物中克隆出了KNOX基因,并且發現該基因家族成員的數量隨著多細胞二倍體(Multicellular diploid)植物的進化而逐漸增加[1,7-10]。單細胞綠藻和紅藻植物只含有1個KNOX基因,而在陸生植物中KNOX蛋白一般是由多個成員的基因家族編碼[11]。根據結構和進化關系,可以將這些成員分為兩組(ClassⅠ和Ⅱ),隨后又發現了雙子葉植物特有的第3個組(Class Ⅲ)[12-13]。在單細胞綠藻(Chlamydomonas reinhardtii)中,KNOX蛋白的主要功能是調控配子體的性別,以及受精卵的發育[14-15]。在苔蘚植物(Physcomitrella patens)中,盡管兩組KNOX基因主要在孢子體中表達,但其編碼的KNOX蛋白功能發生了明顯分化。ClassⅠKNOX蛋白能夠促進細胞的增殖[16],而ClassⅡKNOX蛋白抑制配子體的發育[17]。被子植物中ClassⅠ在頂端分生組織(Shoot apical meristem,SAM)的形成和保持過程中發揮著重要作用[18-19],此外還參與了諸如復合葉種葉剝離、節間伸長、花序形態結構建成、寄生植物與宿主間的維管連接等生理過程[20-23]。ClassⅡKNOX基因在被子植物的根、莖、葉和花中有表達,該組基因主要參與調控了植物器官的分化[24],同時能夠抑制花序莖中維管束纖維次生壁的合成[25-26]。

除了上述的功能分化外,ClassⅠ和ClassⅡKNOX蛋白還表現出功能上的拮抗作用。ClassⅠKNOX基因主要在分生組織表達,但當其在葉片組織異位表達時,植株表現出ClassⅡKNOX基因功能缺失的表型;相反ClassⅡKNOX基因主要在發育的葉片中表達,當其在SAM人為表達時,會產生stm(ClassⅠKNOX)功能缺失的表型[24]。KNOX蛋白還參與調控了多種物質的合成代謝,包括赤霉 素(Gibberellicacid,GA)、細 胞 分 裂 素(Cytokinin,CK)、木質素(Lignin)等[25,27]。研究表明ClassⅠKNOX蛋白能夠抑制活性GA的合成,同時促進CK的積累。如煙草NTH15(Nicotiana tabacum homeobox 15)通過直接抑制GA20ox(GA 20-oxidase gene)基因的表達,進而抑制赤霉素的合成[28]。玉米 KNOTTED1(KN1)則能夠直接誘導ga2ox1基因的表達,后者編碼的酶能將活性赤霉素轉化為非活性赤霉素[29],同時玉米KNOX蛋白還能抑制木質素的合成[30]。在擬南芥和水稻中則發現KNOX蛋白能夠促進CK合成相關基因的轉錄[31-32]。

煙草是一種重要的模式植物,因此煙草基因組學研究具有重要理論和現實意義。目前,煙草中克隆到的KNOX基因有兩個,除NTH15基因外還發現NtKNATM1基因在腋芽和頂芽中高量表達[33]。利用煙草基因組數據庫,鑒定煙草KNOX家族所有成員,通過序列分析、系統進化分析以及基因表達模式分析,旨在為揭示煙草KNOX基因在植物形態建成、激素信號、物質合成代謝過程中的功能提供理論依據。

1 材料與方法

1.1 材料與儀器、試劑

利用普通煙草品種紅花大金元(Nicotiana tabacum L.)、林煙草(Nicotiana sylvestris)和絨毛狀煙草(Nicotiana tomentosiformis)為試驗材料。2017年3月播種,煙苗長出4片真葉時移栽入獨立的盆缽中置于國家煙草基因研究中心溫室內。生長條件設定為28℃光照16 h,23℃黑暗8 h。紅花大金元煙苗正常生長至盛花期,分別采集花、花蕾、頂芽、葉、莖和根等組織樣品,液氮速凍后放入-80℃冰箱備用。分別采集苗期、旺長期和成熟期的林煙草和絨毛狀煙草的根、莖樣品,液氮速凍后立即放入-80℃冰箱中保存,備用。

植物多酚RNA提取試劑盒、實時熒光定量試劑盒以及凝膠回收試劑盒均購自北京艾德萊生物科技有限公司;反轉錄試劑盒購自北京康潤誠業生物科技有限公司;限制性內切酶購自寶生物工程(大連)有限責任公司;TransTaq?高保真Taq酶試劑盒購于北京全式金生物技術有限公司;其他常規試劑均為國產分析純試劑,引物由北京六合華大基因科技有限公司合成。核酸提取、濃度測定和基因表達水平檢測分別采用混合型碾磨儀MM400(德國Retsch公司)、超 微 量 分 光 光 度 計Nanodrop 2000(美國Thermo公司)和熒光定量PCR儀C1000TMThermal Cycler(美國BIO-RAD公司)。

1.2 方法

1.2.1 RNA提取和cDNA合成

利用植物多酚RNA提取試劑盒,嚴格按照操作說明書提取植物材料的總RNA。提取過程中,用RNase-free DNase I去除基因組DNA的污染。提取完成后,分別用瓊脂糖凝膠電泳和Nanodrop 2000檢測RNA樣品的質量和濃度。cDNA第一鏈的合成按照Gene Star M-MLV反轉錄試劑盒說明書進行,轉錄完成后再次用Nanodrop 2000檢測cDNA樣品的濃度,并將其稀釋至40 ng/μL,保存于-20℃冰箱備用。

1.2.2 生物信息學分析

以Knotted-1-like為關鍵詞檢索中國煙草基因組數據庫V4.0,獲得普通煙草、林煙草和絨毛狀煙草中的候選KNOX基因。接著用Pfam(http://pfam.xfam.org/search)檢測各候選基因編碼蛋白質的功能域,剔除功能域缺失基因。隨后用MEME(http://meme-suite.org/)進一步確認煙草KNOX保守功能域的序列,用ExPASY's Compute Pi/Mw(http://web.expasy.org/compute-pi)計 算 各 煙 草KNOX蛋白的分子量和等電點?;虻耐怙@子/內含子結構用 GSDS(http://gsds.cbi.p-ku.edu.cn/)進行分析。隨后用DNAMAN V6.0比對各基因的基因序列和編碼區序列(Coding sequence,CDS),并進行驗證。

根據數據庫中各基因所在的染色體信息,利用MapInsect軟件繪制各基因的染色體定位圖。用Knotted-1-like為關鍵詞搜索NCBI GeneBank數據庫,獲得其他植物中的KNOX同源基因。本研究中使用的同源基因分別來自擬南芥(Arabidopsis thaliana,AtKNAT1/NP_192555、AtKNAT2/NP_177208、AtKNAT3/NP_197904、AtKNAT4/NP_196667、AtKNAT5/NP_194932、AtKNAT6/AAF87007、AtKNAT7/AAG 408 58、AtSTM/Q38874)、石 斛 蘭(Dendrobium grex,DgDOH1/CAB88029)、牽?;ǎ↖pomoea nil,InPKn2/AB016000)、西 紅 柿(Lycopersiconesculentum,LeThox2/NP_001298112.1、 LeTKn3/AAD00252、Solyc07g007120、Solyc12g010410、Solyc08g041820、Solyc08g080120、Solyc04g077210、Solyc02g081120、Solyc01g100510)、水稻(Oryza sativa,OsHOS58/BAB 55658、OsHOS59/AB007628、OsHOS66/BAB55660、OsJNBa0035I24.10/AAR87205、OsJNB b0094O03.2/AAP68879、OsOSH1/JQ2379、OsOSH10/XP_469241、OsOSH15/NP_911093、OsOSH45/T03874、 OsOSH6/NP_914102、OsOSH71/BAA79226、Osrough_sheath1/BAA79225)、楊樹(Populus tremula,Pt568092/XP_002317151.3、Pt570713/XP_002318951.2、Pt581961/XP_024456722.1、Pt61066/XP_002304900.2、Pt658310/XP_002315682.3、 Pt662050/XP_024437653.1、 Pt 672778/XP_002324571.2、Pt738080/XP_002324571.2、Pt88373/PNT01023.1、PtKN1/XP_002301134.1、PtKN AT3/XP_024459660.1、PtKNAT3b/PNS92233.1、PtKN AT4/AKE81086.1、PtKNAT6/PNT25501.1、PtKNAT7/XP_002299569.2)、卷柏(Selaginella moellendorffii,SmKNOX1/EFJ21442、SmKNOX2/EFJ07541、SmKN OX3/EFJ05362、SmKNOX4/XP_002969147)、馬鈴薯(Solanum tuberosum,StPOTH1/T07777)、玉 米(Zea mays,ZmAZM440326/NP_001105852.1、 ZmAZM 459391/NP_001150419.1、Zmgn1/AAP76320、Zmkn1/AAP76321、Zmlg3/AAD13611、Zmlg4a/AAP31409、ZmRS1/Q41853)。利用Clustal X比對收集到的植物KNOX氨基酸序列,將比對結果導入MEGA5,采用Neighbor-joining方法(自舉檢驗1 000次)構建植物KNOX的系統進化樹。

1.2.3 基因表達分析

采用熒光定量PCR方法檢測煙草KNOX基因在不同組織中的表達水平,各基因特異性引物見表1。qPCR反應體系20μL,包括2×SYBR Green Master 10μL、基因上下游引物(10μmol/L)各1μL、cDNA模板(40 ng/μL)3 μL,加ddH2O補足至20 μL。qPCR反 應 程 序:95℃ 3 min;95℃ 10 s,60℃30 s,45個循環;信號采集,最后運行熔解(65~95℃)程序。采集3株植物樣品混合為1個生物學重復,每個植物組織設置3個生物學重復,每個生物學重復樣品各檢測3次。反應結束后根據循環閾值(CT值),用 2-ΔΔCT或者 2-ΔCT

方法計算基因的相對表達量[34]。

2 結果與分析

2.1 煙草KNOX基因的鑒定

通過檢索中國煙草基因組數據庫V4.0中普通煙草基因組的數據,共獲得24個注釋為Homeobox protein knotted-1-like的基因,通過Pfam分析發現其中6個基因編碼的蛋白缺少KNOX典型的KNOX I、KNOXⅡ或者ELK功能域。剔除后,共在普通煙草基因組中鑒定出18個NtKONX基因。分別在兩個二倍體祖先種絨毛狀煙草和林煙草中鑒定出5和8個KNOX基因。如表2所示,普通煙草NtKNOX基因編碼區長度在903~1 281 bp之間,編碼的氨基酸長度為300~426個,蛋白質分子量為33.87~47.10 kD,等電點4.61~6.58。祖先種絨毛狀煙草NtomKNOX基因均含有5個外顯子,林煙草中7個NsylKNOX基因含有5個外顯子,1個NsylKNOX基因含有6個外顯子。大多數普通煙草NtKNOX基因均含有至少5個外顯子,只有Ntab0202830和Ntab0782930基因ID含有4個外顯子,表明這兩個基因可能在四倍體煙草形成后發生了內含子丟失。根據煙草KNOX基因之間以及與其他物種同源KNOX基因間的序列相似性,將普通煙草NtKNOX基因分為9組,分別命名為NtSTM和 NtKNAT1~8(表 3)。 林 煙 草 基 因 組 中 沒 有NsylKNAT1基因,而絨毛狀煙草中缺少NtomSTM、NtomKNAT1、NtomKNAT2和 NtomKNAT8基因。這表明絨毛狀煙草中KNOX基因家族可能發生了基因丟失現象。比對普通煙草NtKNOX基因序列與祖先種同源基因序列的相似性,發現每對NtKNOX基因中有1個與林煙草同源基因相似度更高,另外1個與絨毛狀煙草同源基因的相似性更高。因此,進一步將普通煙草KNOX基因命名為NtKNOXS或NtKNOX-T(表3)。

表1 基因表達水平檢測引物Tab.1 Primers for detecting gene expression

2.2 煙草KNOX基因的染色體定位及進化分析

為了明確各NtKNOX基因在普通煙草染色體組上的分布,繪制了18個NtKNOX基因在普通煙草各染色體上的分布圖,見圖1。18個NtKNOX基因有15個已經明確定位到染色體上,分別分布在12條不同的染色體上,而NtKNAT3-T、NtKNAT6和NtKNAT7-S基因則位于目前尚未定位的片段重疊群(Scaffold)上。NtKNOX基因在12條染色體上的分布很分散,只有第4、6和18號染色體上含有兩個NtKNOX基因,其余9條染色體上各含有1個NtKNOX基 因(圖 1)。 其 中 NtKNAT2-TA/NtKNAT2-TB、NtKNAT8-TA/NtKNAT8-TB兩對基因序列幾乎完全一致,而且在4號和6號染色體上的距離非常接近,表明這兩對基因可能由同源基因復制產生。

表2 3個煙草種中KNOX基因信息Tab.2 Characteristics of KNOX genes in three tobacco species

表3 3個煙草種中KNOX同源基因的命名Tab.3 Homologous KNOX genes in three tobacco species

圖1 普通煙草NtKNOX基因的染色體分布Fig.1 Chromosome location of NtKNOX genes

根據玉米、擬南芥、石斛蘭、牽?;?、西紅柿、水稻、楊樹、卷柏、馬鈴薯和3個煙草種中KNOX的氨基酸序列,經序列比對后用MEGA5軟件構建植物KNOX的系統進化樹,如圖2所示。植物KNOX基因家族被明顯地分為兩支:KNOXⅠ和KNOXⅡ。KNOXⅠ又可以被進一步分為KNOXⅠ-A、KNOXⅠ-B和KNOXⅠ-C 3組。同樣,KNOXⅡ也可以繼續分為KNOXⅡ-A和KNOXⅡ-B兩組。KNOXⅠ和KNOXⅡ兩個大的分支均包含來自于單子葉植物和雙子葉植物的成員,表明這兩個分支的形成可能發生在單雙子葉植物分離之前。但KNOXⅠ-A和KNOXⅡ-A分支中的成員都來自于雙子葉植物,表明這兩支可能是雙子葉植物特有的KNOX蛋白。KNOXⅠ-B分支雖然包括單子葉植物和雙子葉植物成員,但成員數目和植物種類較少,擬南芥AtKNOX在該分支中則沒有分布,表明這個分支在植物中的分布可能不十分普遍。煙草KNOX蛋白在所有分支中均有分布,但在每個分支中其分布的數量并不相同。如煙草KNAT2和KNAT6分布在KNOXⅠ-A分支,該分支還包括來自擬南芥的AtKNAT2和AtKNAT6,這與之前對基因的命名一致。煙草KNAT8位于KNOXⅠ-B分支,STM和KNAT1位于KNOXⅠ-C分支;KNAT2、KNAT4和KNAT5位于KNOXⅡ-A分支,而KNAT7則位于KNOXⅡ-B分支(圖2)。

2.3 煙草KNOX基因結構及蛋白結構域

通過分析煙草KNOX基因結構發現,所有煙草KNOX基因長度都在4 kb以上,并且均含有3個以上的內含子和4個以上的外顯子(圖3)。不同組煙草KNOX基因中內含子長度變化非常大,如KNOXⅠ-A組中各煙草KNOX基因包含的最大內含子長度在 5.6~22.8 kb,而 KNOXⅠ-B、KNOXⅠ-C和KNOXⅡ-B組中各煙草KNOX基因包含的最大內含子長度為3~3.6 kb;而KNOXⅡ-A組中各煙草KNOX基因中最大的內含子長度只有2.5 kb左右(圖3)。KNOXⅠ中各外顯子的長度比較保守,如第1個外顯子(以KNOXⅠ-B中各基因排序)長度為234~381 bp,第2個外顯子長度為117~123 bp,第3個外顯子長度為106~142 bp,第4個外顯子長度為230~254 bp,第5個外顯子長度為152~207 bp(圖3)。其中第2和第3個外顯子之間的內含子在KNOXⅠ-C組中發生了丟失,形成了1個247 bp的外顯子。KNOXⅡ組中各煙草KNOX基因的第1個外顯子長度變化較大,其余外顯子的長度都比較保守。如各基因間第1個外顯子的長度為318~699 bp,而第2個外顯子長度均為121 bp,第3、4、5個外顯子長度分別為190、132和141 bp。

圖2 植物KNOX家族系統進化分析Fig.2 Phylogenetic analysis of KNOX family in plants

通過序列的多重比對分析發現,煙草KNOX蛋白序列有4個相對保守的區域(圖4A),進一步的功能域分析證實這4個區域依次是KNOX1、KNOX2、ELK和HOX(Homeobox KN)結構域,并確定了每個位置上最大可能的氨基酸頻率(圖4B)。其中HOX結構域的保守性最高,表現出TALE同源異型盒蛋白家族的典型結構特征,即第1和第2個螺旋間插入3個額外的氨基酸(P-Y-P)。這4個功能域在煙草KNOX基因上的分布與進化分組密切相關,如KNOX1功能域的編碼區分布在KNOXⅠ組各基因的第1和第2個外顯子上,而KNOXⅡ各基因的KNOX1功能域編碼區只存在于第1個外顯子上(圖3)。除了KNOXⅠ-C組中的基因外,幾乎所有煙草KNOX2功能域的編碼區都能被內含子分開。ELK功能域的編碼區在KNOXⅠ組各基因中分布在同一外顯子上,而在KNOXⅡ各基因中是被內含子分割成兩段。所有基因的HOX功能域編碼區都被最后1個內含子分為兩部分(圖3)。

2.4 煙草KNOX基因的表達

普通煙草盛花期的葉、莖、根、花蕾、花和頂芽中NtKNOX基因的表達水平檢測結果如圖5A和5B所示,所有煙草NtKNOX基因均在頂芽組織中的表達水平最高,而且各組織中KNOXⅡ類基因的表達水平整體高于KNOXⅠ類基因。此外,所有的NtKNOXⅡ類基因還在根和花中表現出較高的表達水平,而大多數NtKNOXⅠ類基因在其他組織中的表達水平均很低,除了根中高表達的NtKNAT1和NtKNAT8基因(圖5A)。在不同發育時期的林煙草中,NsylKNAT4基因的表達水平在根中始終最高,而在葉片中表達水平最高的是NsylKNAT3和NsylKNAT5基因(圖5C)。NsylKNAT3和NsylKNAT5基因在幼苗期根中的表達水平很低,但在成熟期根中明顯升高,同樣的成熟期葉片中NsylKNAT7基因的表達水平也明顯升高。絨毛狀煙草中NtomKNAT3基因在根和葉中表達水平均很高(圖5D),而NtomKNAT7主要在根中表達,NtomKNAT5主要在葉中表達。這種組織表達的差異性表明煙草KNOX基因的功能存在明顯分化。

圖3 煙草KNOX基因的外顯子和內含子結構Fig.3 Gene structures of KNOX genes from tobacco

3 討論

普通煙草被認為是由兩個二倍體祖先種林煙草和絨毛狀煙草雜交后,經染色體加倍形成的異源四倍體[35]。理論上普通煙草中NtKNOX同源基因的數目應等于林煙草和絨毛狀煙草中KNOX同源基因數目的總和,但序列比對和進化分析發現,林煙草基因組中沒有NsylKNAT1基因,而絨毛狀煙草中則缺少NtomSTM、NtomKNAT1、NtomKNAT2和NtomKNAT8基因。相反,普通煙草中NtKNAT2-T和NtKNAT7-T則進一步發生了同源復制,表明在二倍體煙草(尤其是絨毛狀煙草)中KNOX基因家族趨于縮減,而在四倍體煙草中則逐漸擴張。煙草KNOXⅠ類成員的進化途徑可分為3個分支(即KNOXⅠ-A、KNOXⅠ-B和KNOXⅠ-C),而KNOXⅡ類成員的進化則分為2個分支,各分支成員間的基因結構(包括長度、內含子數目等)發生了明顯變化。前人研究表明,KNOX基因結構與基因表達間存在很好的對應關系[36],因此這種基因結構的變化可能導致煙草各KNOX同源基因的功能分化及產生新的功能?;虮磉_的分析結果也證實了這一結論,普通煙草中NtKNOXⅡ基因幾乎在所有組織中的表達水平都高于NtKNOXⅠ基因,而NtKNOXⅠ基因除了在頂芽中表達水平很高之外,在其他組織中表達水平均很低。這種KNOX基因的表達模式與已報道的其他物種一致,表明植物KNOX蛋白在功能上可能具有高度的保守性[5,37]。此外,還發現二倍體煙草根和莖中有不同的基因表現出最高的表達水平,預示著其功能的明確分化。而在普通煙草中所有NtKNOX基因的表達模式很接近,表明與野生祖先種相比,NtKNOX各成員的功能在普通煙草形成過程中發生了變化。目前,越來越多的植物KNOX基因以及與其相互作用的基因被陸續鑒定出來[38]。KNOX的功能除了最初的調控植物形態發育外[18],還調控了植物多種激素[5]和次生代謝物[27]的合成代謝。因此,深入分析煙草KNOX基因家族成員的結構和表達模式,將有助于進一步揭示不同植物中KNOX基因的進化關系,為研究該類基因在煙草中的功能奠定基礎。

圖4 煙草KNOX蛋白功能域分析Fig.4 Functional domain analysis of KNOX proteins from tobacco

圖5 煙草KNOX基因的表達水平Fig.5 Expression levels of KNOX genes from tobacco

4 結論

本研究中分別從普通煙草、林煙草和絨毛狀煙草中鑒定出18、8和5個KONX基因。根據序列的相似性,將煙草KNOX基因分為9組,分別命名為STM和KNAT1~8。系統進化分析表明,煙草KNOX蛋白在所有分支中均有分布,但是每個分支中分布的數量并不相同,表明煙草KNOX的進化是連續而又有所偏重。同一進化分支中煙草KNOX蛋白的功能域以及其編碼序列在基因結構上的分布高度保守,預示著其功能的冗余。普通煙草中NtKNOXⅡ類基因的表達水平整體高于NtKNOXⅠ類基因,林煙草根和葉片中表達水平最高的基因分別是NsylKNAT4和NsylKNAT3/NsylKNAT5,絨毛狀煙草中NtomKNAT3基因在根和葉中表達水平均很高,而NtomKNAT7主要在根中表達,NtomKNAT5主要在葉中表達。

猜你喜歡
內含子同源外顯子
外顯子跳躍模式中組蛋白修飾的組合模式分析
以同源詞看《詩經》的訓釋三則
線粒體核糖體蛋白基因中內含子序列間匹配特性分析
外顯子組測序助力產前診斷胎兒骨骼發育不良
“鋌”有“直”義的詞源學解釋——兼說/直/義的同源詞族
不同方向內含子對重組CHO細胞中神經生長因子表達的影響
更 正
外顯子組測序助力產前診斷胎兒骨骼發育不良
陸地棉GhDHN1基因結構及內含子生物信息學分析
同源賓語的三大類型與七項注意
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合