?

歐洲山楊bHLH轉錄因子家族全基因組分析

2021-06-03 02:23沈方圓王嵐春
關鍵詞:擬南芥結構域家族

沈方圓, 王嵐春, 李 校

(四川大學生命科學學院 生物資源與生態環境教育部重點實驗室, 成都 610064)

1 引 言

bHLH (basic helix-loop-helix)是存在于真核生中最廣泛的一類轉錄因子家族,也是植物中最大轉錄因子家族之一,可以通過與靶基因中特定的基序結合來調控基因的表達.bHLH轉錄因子包含保守的bHLH結構域,由一個位于N′端的堿性區域(basic region)和一個位于C’端的α螺旋1-環-α螺旋2 (helix-loop-helix)結構組合而成.堿性區域是bHLH轉錄因子與靶基因的識別區域,含有大量的堿性氨基酸,能與靶基因中保守的六核苷酸E-box (5′-CANNTG-3′)結合,且多數可識別G-box(5′-CACGTG-3′).HLH區域為一個長度可變的環連接兩個由疏水氨基酸組成的親水α螺旋構成.通常,依賴HLH中疏水氨基酸的相互作用,形成同二聚體或異二聚體的二聚結構域,促進蛋白質間的互作.目前,bHLH轉錄因子家族全基因組水平的系統分析已在多種模式植物中進行.2003年,Toeldo-Oritz等人[1]在擬南芥中鑒定出162個成員,被分為21個亞家族.2006年,Li等人[2]從水稻中鑒定到了167個成員,分為22個亞家族.番木瓜、玉米和土豆中分別被鑒定出73、208和159個bHLH家族成員,且被劃分為15~25個亞家族不等[3-5].

在植物中,bHLH是僅次于MYB類的第二大轉錄因子家族,其家族成員廣泛參與植物的新陳代謝、活性成分合成、金屬離子內穩態以及信號激素調節等重要生物學過程,還在植物的生長發育和環境應激中扮演著重要角色[6].SPATULA是植物中第一個已知的在花器官發生中起作用的bHLH基因,基因突變的研究表明,它促進心皮邊緣和由心皮產生的花粉道組織的生長[7].2011年,Ju-Seok等人[8]在水稻中發現水稻bHLH轉錄因子家族成員OsbHLH148,構成水稻中OsbHLH148-OsJAZ-OsCOI1信號模塊,作用于茉莉酸調控的抗旱性基因表達的初始響應.Ji等人[9]從紅毛柳中克隆出一個bHLH基因——ThbHLH1,該基因特異性結合G-box motif,可以正向調控P5CS、BADH、CAM、POD、SOD、LEA、HSP等一系列提升非生物脅迫耐受性的基因.這些基因的高表達導致脯氨酸和甜菜堿水平升高,提高作為第二應激信使的Ca2+水平,增強過氧化物酶(POD)和超氧化物歧化酶(SOD)活性,從而減少活性氧(ROS)的積累,增強植物的非生物抗逆性.SlPRE2作為番茄中果實發育的調節劑,通過赤霉素途徑影響植物對赤霉素的響應[10].ZmPTF1在玉米中是磷酸饑餓誘導bHLH轉錄因子,參與玉米根系發育和是ABA合成、信號通路和耐旱性的正向調節因子[11].

歐洲山楊(Populustremula),楊柳科楊屬植物,耐寒、喜光,廣泛分布于北半球,在中國分布于新疆阿爾泰等地區.歐洲山楊同時具有觀賞性和實用性的樹種,可作為造張和人造纖維的原材料.同時,作為云杉林的主要先鋒樹種和伴生樹種之一,擁有綠化荒山保持水土的作用,此外也因其秋葉變紅,常作為風景林區、城鄉綠化的候選樹種.2018年,歐洲山楊全基因組組裝完成,使得從全基因組水平上研究歐洲山楊抗逆基因家族和進行后續轉錄分析成為可能,為科研工作者增加楊柳科植物的研究材料.本研究使用一系列生物信息學方法對歐洲山楊基因組中bHLH轉錄因子家族成員進行系統地鑒定,并對保守殘基、染色體分布、基因結構和系統發育關系進行分析,最后通過轉錄組分析篩選出參與干旱脅迫應激的bHLH轉錄因子.這些結果和信息為進一步研究歐洲山楊bHLH基因的進化和生物學功能提供良好的基礎.

2 材料與方法

2.1 材 料

從PopGenIE[12]數據庫(http://popgenie.org/)下載歐洲山楊(P.tremula)全基因組序列、蛋白質序列及注釋文件;擬南芥bHLH轉錄因子家族的蛋白質序列從擬南芥tair[13]數據庫(https://www.arabidopsis.org/)中獲取.

2.2 方 法

2.2.1 歐洲山楊bHLH轉錄因子家族的鑒定 為了鑒定歐洲山楊bHLH家族,從Pfam(http://pfam.xfam.org/)[14]中獲取植物bHLH轉錄因子家族的HMM模型(PF00010),使用HMMER 3.3[15]軟件對歐洲山楊的蛋白質數據庫進行本地搜索,然后以擬南芥bHLH蛋白質序列作為目標序列用blastp對歐洲山楊的蛋白質數據庫進行比對,將兩種方法得到的結果去冗余.最后使用SMART[16]在線軟件(http://smart.embl-heidelberg.de/)和CDD[17]數據庫(https://www.ncbi.nlm.nih.gov/cdd)驗證預測的蛋白序列中bHLH結構域的完整性.

2.2.2 多序列比對及系統發育分析 使用ClustalW[18]軟件對167條歐洲山楊bHLH蛋白的bHLH保守結構域進行多序列比對,參數為默認設定.系統進化樹在MEGA5[19]軟件中使用鄰接法構建,其Bootstrap值為1000.

2.2.3 motif分析及基因結構的鑒定 將預測的歐洲山楊bHLH家族蛋白序列提交至MEME[20](http://meme-suite.org/)檢索序列中的保守基序,motif的預期搜索個數設置為10.使用GSDS2.0(http://gsds.cbi.pku.edu.cn)[21]對bHLH基因序列的外顯子/內含子結構進行解析.

2.2.4 染色體定位和基因復制分析 利用歐洲山楊基因組的注釋信息,將各個bHLH轉錄因子家族成員的基因定位到染色體中.再使用MCScanX[22]軟件掃描bHLH基因間的共線性以檢測基因復制事件.

2.2.5 歐洲山楊bHLH基因的表達分析 從ENA數據庫(https://www.ebi.ac.uk/ena)[23]下載歐洲山楊受干旱脅迫根部樣本(SRA號:ERR380521)和正常生長的野生型根部樣本(SRA號:ERR380515)轉錄組數據,運用HISAT2+Stringtie[24-25]流程計算各基因表達量,再使用edgeR[26]對兩組數據進行差異表達分析,選擇logFC絕對值大于1且FDR小于0.001的基因為差異表達基因.

3 結果分析

3.1 歐洲山楊bHLH轉錄因子家族鑒定

為了全基因組鑒定歐洲山楊中bHLH轉錄因子家族,我們首先使用方法中描述的兩種方法,再根據Carretero-Paulet等人[27]計算的標準最終從歐洲山楊的蛋白質序列中,鑒定出167個含有保守bHLH結構域(PF00010)的PtbHLH蛋白,且歐洲山楊bHLH轉錄因子蛋白的數量與其他植物,如擬南芥(162個)、水稻(170個)、芝麻(130個)中bHLH轉錄因子數量基本吻合[2,28].根據Toeldo-Oritz等人[1]對擬南芥bHLH基因家族進行命名的規則,將歐洲山楊bHLH轉錄因子命名為PtbHLH1到PtbHLH167.

3.2 歐洲山楊bHLH保守殘基鑒定

通過使用clustalx軟件對167個歐洲山楊bHLH結構域的蛋白質序列進行多序列比對,并根據保守度大于50%的殘基生成一致性序列.歐洲山楊bHLH結構域包含35保守的氨基酸殘基,其中10個存在于咸性區域部分,9個在第一個α螺旋,1個在loop中,還有15個在第二個α螺旋中(圖1).兩個螺旋間的環狀區域在氨基酸數量和排列順序上顯示出顯著的差異.PtbHLH蛋白家族中大多數成員的環狀區域一般由6~16個氨基酸組成,但有三個成員有較長的環形區域分別是PtbHLH17(80個)、PtbHLH73(63個)和PtbHLH16(39個).

圖1 歐洲山楊bHLH轉錄因子家族的保守結構域Fig.1 The conserve domain of P.tremula bHLH proteins

3.3 bHLH轉錄因子亞家族分類及進化分析

為了分析PtbHLH的進化關系,利用擬南芥和歐洲山楊中保守的bHLH蛋白質結構域使用鄰接法構建系統發育樹(圖2).系統發育樹表明,擬南芥和歐洲山楊共被分為了22個亞家族,其中Ⅶ、ⅩⅥ、ⅩⅦ、ⅩⅧ、ⅩⅩⅩ、ⅩⅪ和ⅩⅫ這7個亞家族中只有擬南芥bHLH,這可能是由于個別PtbHLH在進化過程中的丟失所造成.在22個亞家族中,Subfamily Ⅱ是最大的一個亞家族同時也是PtbHLH數量最多的家族,分別擁有11個AtbHLH和28個PtbHLH.Ⅶ和Ⅺ為最小的亞家族,只有4個成員,其中Ⅶ只含有擬南芥bHLH,Ⅺ只含有歐洲山楊bHLH.所有的PtbHLH轉錄因子家族成員被分到15個亞家族中.早先的研究結果表明,植物中bHLH轉錄因子家族一般可分為15~25個亞家族,因此我們的結果與此一致.

圖2 歐洲山楊和擬南芥bHLH轉錄因子家族的系統發育樹Fig.2 Phylogenic analysis of bHLHs from P.tremula and A.rabidopsis

Pires和Dolan[29]的研究結果表明,被子植物中大多數bHLH蛋白的多樣性早在4.43億年前早期陸地植物中就建立起來,且在進化過程中一直高度保守.為探究歐洲山楊bHLH基因家族的進化地位,基于六種植物的bHLH保守區進行系統發良分析,這六種植物分別為雙子葉植物——擬南芥(Arabidopsisthaliana)、單子葉植物——水稻(Oryzasativa)、楊屬——毛果楊(Populustrichocarpa)、苔蘚植物——小立碗蘚(Physcomitrellapatens)、綠藻——萊茵衣藻(Chlamydomonasreinhardtii)和歐洲山楊(圖3).歐洲山楊167個bHLHs分布在除2、9和14亞家族外的11個亞家族中,同樣也可能存在成員在進化過程中丟失的情況.根據亞家族分類,6個PtbHLH與綠藻植物bHLH在2號亞家族中聚為一類,151個與苔蘚植物bHLH在8個亞家族(3-4、6-8、10-11和13)中聚在一起.因此推測,這6個和151個PtbHLH可能分別由藻類和苔蘚的祖先進化而來.

圖3 歐洲山楊等6種植物的系統進化關系Fig.3 Phylogenic relationships of six plants including P.tremula

3.4 bHLH蛋白的GO注釋和功能分析

為了理解歐洲山楊bHLH的功能,我們對PtbHLH進行了GO注釋,結果如圖4所示.大多數預測的PtbHLH蛋白定位在細胞核內,且具有蛋白二聚體活性和DNA結合活性.涉及植物生長發育過程的PtbHLH蛋白最多,約占58%,其次是光刺激反應和代謝過程占40%.此外,PtbHLH蛋白還參與到脅迫反應、細胞分化和生物合成等過程.目前為止,大約40%的擬南芥bHLH基因家族的功能已被鑒定.系統發育分析表明,有39個PtbHLH與已知功能的AtbHLH有緊密的關系,因此它們可能與其擬南芥同源蛋白有相似的功能(表1).

表1 歐洲山楊bHLH轉錄因子家族成員功能

圖4 PtbHLH蛋白的GO注釋Fig.4 Gene ontology annotation of ptbHLH proteins

3.5 bHLH轉錄因子亞家族基因結構及motif分析

為了得到更多的歐洲山楊bHLH轉錄因子家族的信息,我們分別使用GSDS和MEME對PtbHLH的基因結構和保守基序進行預測.結果表明:7個PtbHLH基因只有外顯子,110個PtbHLH基因有3-7個外顯子,10個PtbHLH基因有9個及以上外顯子(圖5).同一亞家族內的PtbHLH基因在內含子和外顯子的數量及長度上有很大的相似性,而在不同的支系中又存在著顯著的差異.例如每個屬于亞家族ⅩⅨ的成員,除了PtbHLH157,他們的基因都包含2個外顯子;分支Ⅸ中成員的外顯子和內含子數目為7~8個.PtbHLH家族蛋白的motif分析確定了10個假定的保守蛋白基序(圖5).大多數PtbHLH蛋白序列(不包括PtbHLH112和PtbHLH64)都擁有兩個高度保守的基序:motif1和motif2,分別用紅色和天藍色方塊表示.Motif1含有32個氨基酸,由堿性區域、α螺旋1和環狀結構組成;Motif2有29個氨基酸,代表bHLH結構中的第二個α螺旋.在每個亞家族中,大多數蛋白質保守基序的組成是相似的.例如,亞家族Ⅰ的所有成員都含有motif1、2、3、5和7;亞家族Ⅰ的所有16個成員都鑒定出motif1、2和4.基因結構和motif分析結果都進一步支持了轉錄因子家族的進化分類關系.

圖5 歐洲山楊bHLH家族的基因結構和motif分布Fig.5 Conserved motifs and gene structures analyses of PtbHLHs

3.6 bHLH轉錄因子亞家族染色體定位及基因復制分析

根據注釋信息將每個PtbHLH基因定位到歐洲山楊染色體上,結果如圖4所示.所有167個bHLH轉錄因子家族成員無規律、不均勻的分布在歐洲山楊19條染色體上,其中2號染色體上有23個,是擁有PtbHLH數量最多的染色體;其次是5號和6號染色體,有19個基因數量最少的是17號染色體,只含有1個PtbHLH.之前的研究表明,串聯重復是植物基因家族擴展的主要原因之一,我們在歐洲山楊中發現了2個串聯復制事件分別是位于3號染色體的PtbHLH60/PtbHLHL111和位于18號染色體的PtbHLH38/PtbHLHL108.形成串聯復制的基因事件的基因來自同一個亞家族,且擁有相似的基因結構.

3.7 歐洲山楊根部bHLH基因對干旱脅迫的應答分析

在植物中bHLH轉錄因子主要通過調節相關基因的表達從而對非生物脅迫進行適應性應答.為了解歐洲山楊根部組織中bHLH在應對干旱脅迫時的作用,對正常生長和干旱條件下生長的歐洲山楊根部bHLH基因進行差異表達分析.依據logFC>1或<-1和FDR<0.001的條件篩選出了4個差異表達的PtbHLH基因,其中PtbHLH102和PtbHLH122表達量顯著上升,PtbHLH138和PtbHLH10顯著下調.PtbHLH122是擬南芥AtbHLH130的直系同源基因,AtbHLH130能促進鉀離子的吸收從而調節根木質部的滲透,保證營養從根部運輸到芽,從而維持質膜的穩定,防止植物體內水分持續流失[30].

表2 干旱和正常植株中表達差異顯著的PtbHLH基因

4 討 論

bHLH轉錄因子家族在植物種是僅次于MYB類的第二大轉錄因子家族,對植物生長發育過程中存在廣泛的影響,在抗逆相關的調控網絡和信號通路中起關鍵作用.但目前對bHLH轉錄因子家族的研究大多集中在擬南芥、土豆和水稻等模式植物中,楊柳科植物中涉及較少.

本研究利用生物信息學方法從歐洲山楊全基因組中鑒定出167個bHLH轉錄因子.堿性區域(basic region)和α螺旋1-環-α螺旋2(helix-loop-helix)組成的bHLH保守結構域在PtbHLH中由62個氨基酸組成,其中有32個保守度大于50%的氨基酸.N端堿性區域高度保守的Glu-15和Arg-58是決定DNA綁定E-box(CANNTG)區域的關鍵氨基酸殘基;兩個螺旋中保守性大于95%的Leu-69、Pro-81和Leu-176都與之前在其他植物bHLH結構域的研究一致.隨后,對提取的歐洲山楊和擬南芥的bHLH蛋白質結構域進行系統發育分析,并根據擬南芥bHLH家族的亞家族分類和進化樹的拓撲結構,將歐洲山楊bHLH家族分為15個亞家族.基因結構和Motif分析的結果顯示,同一亞家族中的成員大多都具有相似的保守基序組成結構和相似的內含子/外顯子分布.這一結果進一步證明PtbHLH亞家族分類的合理性,同時也暗示了屬于相同亞家族的不同成員可能具有共同的進化起源,和相似的生理功能.根據注釋信息,這167個bHLH基因的全部隨機無規律的分布在19條染色體上,其中chr2是擁有PtbHLH最多的染色體.使用MCScanX軟件,我們檢測到PtbHLH60/PtbHLHL111和PtbHLH38/PtbHLHL108兩個基因復制事件,說明串聯復制在基因家族的擴張過程中起到一定的作用.從歐洲山楊與其他5種植物bHLH的進化關系推測有90%的PtbHLH源自于早期陸地植物,4%源自于藻類植物祖先.這一結論與Pires和Dolan[29]的研究結果一致.

雖然目前對歐洲山楊bHLH轉錄因子的功能尚未有深入的研究,但在此我們根據擬南芥中已知功能的AtbHLH和進化樹中的聚類情況推測出39個PtbHLH的功能.例如,PtbHLH77、PtbHLH37和PtbHLH149與AtbHLH31在進化樹中被聚為一簇,而AtbHLH31已知在擬南芥中具有控制花瓣大小的功能,因此推測PtbHLH77、PtbHLH37和PtbHLH149同樣也具有相似的功能.這39個PtbHLH分別涉及繁殖和調節生長發育等過程,廣泛地參與各類信號通路.PtbHLH116調節根毛生長,PtbHLH17和PtbHLH4參與植物精子與卵細胞的結合過程,PtbHLH97和PtbHLH51涉及油菜素甾醇信號轉導途徑等.除此之外,本研究對歐洲山楊根部干旱脅迫應答相關的bHLH進行了分析.4個PtbHLH基因在干旱根部組織和正常根部組織中差異表達,其中PtbHLH122是擬南芥bHLH130的直系同源基因,可能通過促進鉀離子吸收,調節根部細胞滲透壓以應對干旱脅迫.本研究對歐洲山楊bHLH轉錄因子家族進行全基因組水平的鑒定和分析,為進一步研究PtbHLH在歐洲山楊生長發育、抗逆調節中的作用提供了基礎資源.

猜你喜歡
擬南芥結構域家族
細菌四類胞外感覺結構域的概述
《小偷家族》
皿字家族
家族中的十大至尊寶
結核分枝桿菌蛋白Rv0089的生物信息學分析
黃星天牛中腸中內切葡聚糖酶的鑒定與酶活性測定
蛋白質功能預測方法研究進展
擬南芥
口水暴露了身份
一株特立獨行的草
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合