?

干旱脅迫下野生大豆ABC轉運蛋白轉錄組測序分析

2019-08-17 06:47張小芳喬亞科王冰冰李桂蘭
核農學報 2019年8期
關鍵詞:野生大豆基因簇家族

張小芳 喬亞科 王冰冰 徐 燕 張 鍇 李桂蘭

(河北科技師范學院農學與生物科技學院,河北秦皇島 066600)

野生大豆(Glycine soja)是栽培大豆的近緣野生種[1]。研究表明,野生大豆中攜帶著特有的新基因[2],而栽培大豆在人工馴化過程丟失了許多與環境適應相關的重要基因,包括一些與抗逆相關的基因[3]。因此對野生大豆抗逆基因的挖掘具有重要意義。

三磷酸腺苷結合盒(ATP-binding cassette, ABC)跨膜轉運蛋白是植物細胞膜蛋白的重要組成成分,參與植物激素運輸、氣孔調節、次生代謝物的運輸以及響應環境脅迫等過程[4]。最初人們對ABC 轉運蛋白家族的研究多集中于多藥耐藥性研究[5-6],隨著對ABC轉運蛋白家族的進一步研究發現,植物中任何特定的生理過程都至少需要1 個ABC 轉運蛋白[7],因此對植物ABC 轉運蛋白的研究具有重要意義。

近年來,已有關于植物ABC 轉運蛋白家族的結構和轉運機制的研究報道[8-10],除對擬南芥[11]、水稻[12]的ABC 轉運蛋白家族進行整體研究外,在鐵皮石斛[13]、葡萄[14]和黃瓜[15]等中也開展了部分基因的研究,鑒定的ABC 轉運蛋白主要在ABCB、ABCC 和ABCG 家族[16-19]中。目前大豆的基因組已經完成測序,但關于豆科ABC 轉運蛋白各家族相關基因的研究尚鮮見報道[20-21]。

隨著高通量轉錄組測序技術的發展,利用生物信息學對轉錄組測序的深入挖掘已成為研究重點[22-25],目前,已有多種具有特定功能的大豆或野生大豆基因被挖掘與利用[26-29]。本研究以抗旱性較強的野生大豆永46 為試驗材料,對其轉錄組測序結果進行功能注釋后,以ABC 轉運蛋白為關鍵詞進行篩選,對獲得的ABC 轉運蛋白進行多角度分析,探討ABC 轉運蛋白家族與干旱之間的關系,以期為ABC 轉運蛋白家族基因的挖掘和利用提供一定的理論依據。

1 材料與方法

1.1 試驗材料

以河北科技師范學院野生大豆種質資源課題組篩選鑒定的抗旱性強的野生大豆永46 為試驗材料[30],采自河北省秦皇島市昌黎縣,并在河北科技師范學院植物細胞工程實驗室保存。

1.2 轉錄組測序

將野生大豆永46 的種子播種于營養缽中,出苗后保留長勢一致的幼苗10 株,設3 次生物學重復。定期澆定量霍格蘭營養液,在苗齡達30 d 時,加入20%PEG 6000 進行干旱脅迫處理,分別在處理前(0 h)及處理后6、12、24 和48 h 取同一個葉位的復葉,按照RNA 提取試劑盒[TaKaRa(日本)]提供的方法提取野生大豆葉片總RNA。取2 μL 所得RNA 用1%瓊脂糖凝膠電泳檢測。檢測合格后送至深圳華大基因科技有限公司進行測序,具體步驟參考張小芳等[31]的方法。

1.3 功能注釋及ABC 轉運蛋白關鍵詞搜索

BLAST 比對到公共數據庫,包括非冗余數據庫(non-redundant, NR)、基因本體論數據庫(Gene Ontology,GO)、京都基因與基因組百科全書數據庫(Kyoto Encyclopedia of Genes and Gnomes,KEGG),之后以ABC 轉運蛋白為關鍵詞進行篩選,最終獲得ABC轉運蛋白家族相關信息。

1.4 數據分析

根據獲得的ABC 轉運蛋白家族信息,利用Excel 2007、ClustalX 和MEGA5.1 分析獲得的ABC 轉運蛋白基因簇的關系。

2 結果與分析

2.1 ABC 轉運蛋白相關基因簇信息分析

對轉錄組中39 183 條基因簇以ABC 轉運蛋白為關鍵詞在NR、GO、KEGG 3 個數據庫中進行篩選,結果共有337 條基因簇被注釋,這些基因簇的表達量FPKM 值介于0~180.57 之間,序列拼接長度介于165~6 827 bp 之間。這些被注釋的基因簇中,87.83%在3 個數據庫中均有注釋,3.86%只注釋到了1 個數據庫中。有299 條被GO 數據庫注釋、321 條被KEGG 數據庫注釋、146 條被NR 數據庫注釋。GO 本體中注釋的細胞組分數據庫有13 個,分子功能數據庫有34 個,生物過程數據庫有68 個;NR 數據庫中注釋的ABC 轉運蛋白家族有8 個,包括ABCA、ABCB、ABCC、ABCD、ABCE、ABCF、ABCG 和ABCI(表1)。KEGG 注釋的有28 個代謝途徑分支,排名前10 的為K05658(226 個)、K00924(102 個)、K12843(81 個)、K05681(80 個)、K04733(54 個)、K05666(40 個)、K02065(20 個)、K13430(15 個)、K05643(13 個)、K05663(13 個)。

表1 ABC 轉運蛋白家族相關基因簇統計Table 1 Statistical of Unigene about ABC transporter family

2.2 ABC 轉運蛋白相關差異表達基因分析

對獲取的原始基因簇信息進行差異表達基因(differentially expressed genes,DEGs)篩選,篩選閾值為P-value ≤0.05, | log2Fold Changes | >1,其中Fold Changes 為處理材料與未處理材料中基因表達量的比值,對于差異表達基因,其log2Fold Change>0 時,則認為該差異表達基因是上調的, 反之, 若log2Fold Changes<0,則認為該差異表達基因是下調的。篩選獲得的DEGs 共182 個。干旱脅迫處理12 h 時涉及到的差異表達基因最豐富。在干旱脅迫處理12 h 時,差異表達基因為118 個,其中上調基因93 個,下調基因25個。干旱脅迫處理24 h 時,差異表達基因涉及范圍變小,與未經干旱脅迫(0 h)相比,僅有36 個表現為差異表達,與干旱脅迫處理12 h 相比,上調基因減少,下調基因增多,說明部分基因在干旱脅迫處理24 h 時表達量上調,之后恢復原始表達量或低于原始表達量。干旱脅迫處理48 h 時,其變化趨勢與干旱脅迫處理24 h相同,涉及的差異表達基因數無明顯變化,較干旱脅迫處理24 h 表現為差異表達的基因僅有14 個(圖1)。

圖1 不同脅迫處理時期的差異表達基因統計分析Fig.1 Statistical analysis of DGEs under different stress treatment periods

2.3 ABC 轉運蛋白相關差異表達基因功能分析

2.3.1 GO 功能顯著性富集分析 GO 共有3 個本體(ontology), 分別描述基因的細胞組分(cellular component)、分子功能(molecular function)、生物過程(biological process)。在被注釋的13 個細胞組分數據庫、34 個分子功能數據庫和68 個生物過程數據庫中分別有11 個、28 個和50 個數據庫注釋到差異表達基因。由圖2 可知,多數基因有分子功能和生物學過程注釋。分子功能主要為 ATP 酶活性(ATPase activity)、蛋白激酶活性(protein kinase activity)、轉運活性(transferase activity)、氧化活性(oxidoreductase activity)等;生物學過程主要為嘌呤核苷酸分解過程(purine ribonucleotide catabolic process)、磷酸化合物代謝過程( phosphate-containing compound metabolic process)、蛋白質修飾(cellular protein modification process)、囊泡運輸(vesicle-mediated transport)、羧酸轉運(carboxylic acid transmembrane transporter activity)、激素應答(response to hormone stimulus)等。

圖2 3 個GO 本體中數量排名前10 的GO 分類統計情況Fig.2 The number of top 10 in 3 gene ontology classification

由表2 可知,6 個細胞組分數據庫、4 個分子功能數據庫和17 個生物過程數據庫中注釋的基因均表現為差異表達,在細胞組分本體中,主要定位在細胞膜系統中,與ABC 轉運蛋白作用場所相符;在分子功能本體中,功能分類為轉運活性或轉移酶活性,與其作用功能相一致;在生物學過程本體中,注釋的生物學過程多樣,充分體現了ABC 轉運蛋白的功能多樣性。

2.3.2 KEGG 功能顯著性富集分析 在KEGG 數據庫中注釋的28 個途徑分支中,有9 個途徑分支被注釋到了ABC 轉運蛋白途徑(map02010)。這9 個途徑分支分別是 K05641 ( ABCA1)、K05643(ABCA3)、K05658 ( ABCB1)、K05663 ( ATM)、K05656 ( ABCB9)、K05657 ( ABCB10)、K05666(ABCC2)、K05677(ABCD3)、K05681(ABCG2), 共包括ABCA、ABCB、ABCC、ABCD 和ABCG 5 個亞家族。K05658 途徑在各個時期均出現差異表達基因,K05681 途徑在各個時期均有上調基因分布,K05666 途徑在各個時期均有下調基因分布,K05663 途徑僅在干旱脅迫處理48 h/6 h 有下調基因分布,且下調基因僅有1 個。在各時期中,干旱脅迫處理6 h 和12 h 的差異表達基因最多,之后基因表達量變化范圍變小,直至恢復到原始水平(表3)。

2.3.3 NR 功能聚類分析 對符合篩選條件的182 個差異表達基因在NR 數據庫注釋功能,獲得差異表達基因的蛋白信息(有14 個沒有注釋,共統計168 個)。用鄰接法對差異表達基因的氨基酸序列進行進化分析。分析結果表明,可將這168 個差異表達基因分為三大類25 小類。第一大類有3 小類,包括43 個差異表達基因,第二大類有6 小類,包括43 個差異表達基因,第三大類有16 小類,包括82 個差異表達基因。第一大類主要是ABC 轉運蛋白家族的ABCE(1 個)、ABCF(5 個)、ABCG 家族(23 個)以及多藥耐藥蛋白(pleiotropic drug resistance protein);第二大類主要是ABC 轉運蛋白家族的ABCB(21 個)與ABCC(17 個)家族;第三大類涉及基因最為廣泛,除ABCA 家族(4個)、ABCD 家族(2 個)外,還包括鋅指結構域蛋白(zinc finger CCCH domain-containing protein)、U-box 結構域蛋白(U-box domain-containing protein)、L 型外源凝集素受體蛋白(L-type lectin-domain containing receptor kinase)、富亮氨酸重復受體蛋白(leucine-rich repeat receptor-like serine/threonine-protein kinase)以及其他不同的蛋白激酶家族成員等。在進化分析時,NR注釋功能為ABCI 家族的蛋白序列共有3 個(ABCI10、ABCI11、ABCI19),這3 個序列分別聚類在了第二大類、第一大類和第三大類中(圖3)。

表2 不同GO 下的差異表達基因注釋統計Table 2 Statistical of DEGs in different GO

對注釋功能為ABC 轉運蛋白家族的基因進行統計分析。除ABCC 家族外,各家族中涉及的差異表達基因多為上調基因;ABCA 家族共涉及4 個基因,3 個為上調基因,1 個為下調基因;ABCB 家族共涉及21 個基因,其中glysoja_016804 表達量差異倍數達-10.75,glysoja_ 023579 表達量差異倍數達10.54, 為注釋到的基因中表達量變化最大的2 個基因;ABCC 家族共涉及17 個基因,表達量變化明顯,最高差異表達倍數為9.32;ABCD 家族共涉及2 個基因,表達量變化幅度較小;ABCE 家族僅涉及1 個基因,且該基因為上調基因;ABCF 家族共涉及5 個基因,均表現為上調表達;ABCG 家族共涉及23 個基因,上調表達較多;ABCI家族共涉及3 個基因(表4)。

表3 差異表達基因的KEGG 通路富集分析Table 3 Statistical of DEGs in different pathway

表4 ABC 轉運蛋白家族的差異表達基因分析Table 4 Statistical of DEGs in ABC transporter family

圖3 差異表達基因的親緣關系分析Fig.3 Genetic relationship analysis of DEGs

2.4 基因表達量分析

對同時注釋到GO 和KEGG 數據庫,且注釋基因均差異表達的基因在干旱脅迫處理12 h 前的表達量變化進行匯總分析。由表5 可知,不同基因的原始表達量存在差異,glysoja_008864 和glysoja_010956 在干旱脅迫處理0 h 的FPKM 值均在100 以上,而glysoja_017978 和glysoja_047568 在干旱脅迫處理0 h 的FPKM 值均為0;多數基因在干旱脅迫處理12 h 表達量變化最明顯,glysoja_005213 和glysoja_010956 則在6 h 的表達量變化最明顯,而glysoja_008864、glysoja_010547 和glysoja_024284 在干旱脅迫處理12 h 前的表達量變化無明顯差異;glysoja_010547 和glysoja_013434 的注釋均為APK1A,其原始表達量差距不大,glysoja_002097 和glysoja_010956 的注釋均為ABCC 家族,但原始表達量差異較大。

3 討論

本研究系統分析了野生大豆8 類ABC 轉運蛋白基因對干旱脅迫的響應,結果表明,不同處理時期對應基因種類和數目不同,同一基因在不同處理時期表達量也不同。在氨基酸進化分析時,聚類結果并未被分為8 類,說明在進化上有一定的保守性,但功能發生了改變,說明其結構域發生變化,對基因產物的功能產生了一定的影響。通過對野生大豆干旱脅迫下的ABC轉運蛋白家族基因的系統研究,為挖掘具有抗旱功能的ABC 轉運蛋白的研究提供了新思路。

本研究在GO 生物學過程聚類分析中,部分GO條目未被注釋到,差異表達基因在5 個以上的GO 條目增加了GO:0009154(嘌呤核苷酸分解代謝過程)、GO:0006796 (含磷酸鹽化合物代謝過程)、GO:0006464(細胞蛋白質變性過程)、GO:0006468(蛋白質磷酸化)、GO:0006952(防御反應)和GO:0010038(金屬離子響應);在KEGG 途徑中,ABCA、ABCB、ABCC、ABCD 和ABCG 家族成員注釋為差異表達,表明這5個亞家族與干旱相關,注釋的GO 本體與朱璐等[32]注釋結果略有不同。

表5 差異表達基因表達量分析Table 5 Analysis on the expression of DEGs

Byrne 等[33]發現黑麥草在亞硒酸鈉的誘導下ABCA 家族的基因表達量顯著增加,Maathuis 等[34]發現AtATH14 與AtATH15 在鹽脅迫下表達下調;Wu等[35]發現AtABCB19 可以使種子萌發后下胚軸快速的伸長。Lee 等[36]發現AtABCB14 可通過將蘋果酸鹽從質外體運輸到保衛細胞, 提高滲透壓來調控氣孔對CO2的響應, 從而調控氣孔的開合;AtABC5 也可以通過調節氣孔開閉來增強植物的抗逆性[37];擬南芥中AtABCG40、AtPDR12 基因的表達能夠提高植物的抗旱能力[2];水稻OsABCG36 基因也參與了植物的抗旱反應[38];大豆GmPDR12 基因在水楊酸及功能類似物質的誘導下能夠快速大量表達[7]。本研究中,注釋到的ABCA 家族基因既有上調也有下調,注釋基因有ABCA1、ABCA2 和ABCA7;ABCA1 主要參與膽固醇的逆轉運過程[39],AtABCA2(別名AtATH1)與擬南芥的開花相關[40],ABCA7 與人體的阿爾茨海默病相關[41],但在植物中的功能尚不清楚;注釋到的ABCB 家族基因上調和下調明顯,注釋基因有ABCB1、ABCB4、ABCB6、ABCB11、ABCB13、ABCB25、ABCB26 等,與徐杏等[42]的研究結果一致;注釋到的ABCC 家族除已知的與干旱脅迫相關的ABCC5 外, 還包括ABCC8、ABCC10、ABCC13 和ABCC14 等,AtABCC10 證實與病原反應相關[13], AtABCC13 與營養生長相關[32];注釋到的ABCG 家族包含的基因種類最多,關于ABCG11、ABCG14、ABCG22、ABCG32、ABCG36 基因功能已有研究報道[11,43],本研究中還注釋到了ABCG3、ABCG7、ABCG15、ABCG21、ABCG41(PDR13)等,AtABCG3 參與PC-Cd 的運輸[44];VvABCG7 與葡萄的胚珠發育有關[11],注釋到的ABCD 家族僅包含2 個基因(ABCD1和ABCD2),研究表明ABCD1 可能對植物與病原菌、有害動植物以及共生體間相互作用有關鍵作用[45],ABCD2 的功能仍未知,尚需要進一步的研究證明。

4 結論

本研究結果表明,野生大豆ABC 轉運蛋白基因在干旱脅迫12 h 差異表達數量最多,且在24 h 和48 h無明顯差異。ABC 轉運蛋白的不同家族基因對干旱脅迫的響應存在差異,ABCB、ABCC 和ABCG 家族的響應基因最多,ABCE 家族的響應基因最少。出現差異表達的基因也是ABCB、ABCC 和ABCG 家族最多,ABCE 家族最少。在GO 生物學過程中,嘌呤核苷酸分解代謝過程的注釋基因最多。在注釋到KEGG 途徑的ABC 轉運蛋白途徑中,K05658(ABCB1),K05681(ABCG)和K05666(ABCC)的注釋基因最多,K05663(ATM)最少。本研究結果為抗旱基因的挖掘提供了新的基因資源。

猜你喜歡
野生大豆基因簇家族
吉林省野生大豆考察收集與評價
冀東地區野生大豆幼苗期耐鹽堿特性鑒定
HK家族崛起
冬瓜高通量轉錄組測序及分析
《小偷家族》
野生大豆利用價值的研究進展
皿字家族
家族中的十大至尊寶
遼寧省部分地區野生大豆資源考察與收集
腸球菌萬古霉素耐藥基因簇遺傳特性
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合