?

迷宮栓孔菌熱激蛋白基因的生物信息學與表達分析

2023-12-29 08:20楊旭欣馮連榮池玉杰韓樹英
關鍵詞:木屑迷宮結構域

楊旭欣,馮連榮,池玉杰,韓樹英

(1.東北林業大學林學院,黑龍江 哈爾濱 150040;2.遼寧省楊樹研究所,遼寧 營口 115000;3.周口師范學院生命科學與農學學院,河南 周口 466001)

熱激蛋白(heat shock proteins, HSPs)在廣義上被稱為應激蛋白,是有機體在高溫、干旱、自由基損傷等逆境脅迫因子的刺激下[1],正常蛋白受到抑制而誘導細胞合成新的或數量增加的一類應激蛋白。它們是一類在系統發育上高度保守的蛋白質,廣泛存在于原核細胞和真核細胞中[2]。迄今為止,在植物、動物和微生物中都發現存在熱激反應。熱激蛋白種類繁多,目前尚無明確的分類標準[3-4],多數依據蛋白質分子量大小將其分為HSP100、HSP90、HSP70、HSP60和小分子HSPs[small HSPs(sHSPs),15~42 kDa]5個亞類[5-6],其中HSP100家族承擔了重要的蛋白質解聚功能。HSP104/ClpB 為HSP100 家族成員,其同系物在真核生物中稱為HSP104,在細菌中稱為ClpB。相較于經典分子伴侶HSP70 阻止蛋白質聚集的功能,HSP104/ClpB 可以逆轉蛋白質聚集[7]。HSP104/ClpB屬于AAA+超家族,是依賴于腺苷三磷酸(adenosine triphosphate, ATP)的分子伴侶[8-9]。核苷酸結合域(nucleotide-binding domains,NBDs)為Clp 家族分類的主要判別標準,HSP100/Clp家族主要分為2類:Ⅰ類中含有2個NBDs,Ⅱ類中只含有1 個NBD。HSP104/ClpB 屬于Ⅰ類,其單體主要由4 部分構成:N-端、NBD1、NBD2 及2 個NBDs 間的接頭(linker)。相較于同類別的ClpA、ClpC、ClpD,HSP104/ClpB 的特點為2 個NBDs 間的接頭長度最長[7,10-12]?,F階段對HSP104/ClpB 的研究主要集中在嗜熱細菌和大腸埃希菌(Escherichia coli)等模式菌種上,而在真菌細胞及其他高等真核細胞中對HSP104的研究較薄弱。

迷宮栓孔菌(Trametes gibbosa),又稱偏腫栓菌、偏腫革裥菌(Lenzites gibbosa)[13],是我國東北林區常見的一種白腐菌,在櫟、榆、椴等闊葉樹的倒木、枯木、木樁或活立木上生長(一年生),引起木材呈白色海綿狀腐朽[14]。本研究構建了迷宮栓孔菌在木屑處理下不同時間點的轉錄組文庫,通過對轉錄組的分析篩選出迷宮栓孔菌中所有的HSPs,對其進行鑒定分類和相關的生物信息學分析,并針對HSP100 家族的基因序列和蛋白結構進行深入研究。本研究結果可為HSPs 在真菌中的研究提供參考,也為迷宮栓孔菌在脅迫應激方面的研究提供數據支持與理論依據。

1 材料與方法

1.1 試驗材料

供試菌株迷宮栓孔菌(T.gibbosa)CB1 從采于長白山的野生迷宮栓孔菌子實體中通過組織分離法分離得到,試驗菌種保存于馬鈴薯葡萄糖瓊脂(potato dextrose agar, PDA)培養基上及4 ℃冰箱中。小黑楊(Populus simoniiCarr.×P.nigraL.)木段由黑龍江省齊齊哈爾市林業和草原局提供,試驗前去皮,制成碎木屑,備用。低氮天冬酰胺-琥珀酸(low nitrogen asparagine-succinic acid, LNAS)培養基在實驗室自配[15]。

RNAprep_Pure多糖多酚植物總RNA提取試劑盒購自天根生化科技(北京)有限公司;第1 鏈cDNA 合成試劑盒(PrimeScriptTM1st Strand cDNA Synthesis Kit)、定量用反轉錄試劑盒[PrimeScriptTMRT Reagent Kit with gDNA Eraser (Perfect Real Time)]、ExTaq酶、DL15000 DNA標志物購自寶生物工程(大連)有限公司;2×實時定量聚合酶鏈反應(polymerase chain reaction, PCR)擴增預混液[2×SYBR Green qPCR Master Mix (Low Rox)]試劑盒購自美國Bimake生物科技有限公司。引物合成及測序均由生工生物工程(上海)股份有限公司完成。

1.2 轉錄組文庫構建及熱激蛋白基因家族分析

1.2.1 轉錄組文庫構建

將保存的菌株在PDA 培養基平板上于26 ℃培養7~10 d以進行活化,然后用直徑5 mm的打孔器取菌落邊緣的菌餅并接種于含有1%葡萄糖的75 mL LNAS液體培養基的錐形瓶中,每瓶接種5個菌餅,在26 ℃培養箱中靜置預培養10 d,然后將培養菌絲的錐形瓶分別于0、3、5、7、11 d進行隨機取樣(以0 d 為對照組,在木屑處理組中每瓶添加2 g 滅菌木屑),每個時間點選取5瓶菌絲混合為1個樣品,每個樣品進行3組生物學重復。將干燥的菌絲樣品收集至凍存管中,在液氮中速凍,然后于-80 ℃冰箱中保存。將冷凍的菌絲樣品送至北京百邁客生物科技有限公司進行轉錄組文庫構建,并利用相關軟件將測序得到的待分析數據的高質量讀長(clean reads)與JGI數據庫中迷宮栓孔菌參考基因組(http://genome.jgi.doe.gov/Tragib1/Tragib1.home.html)進行序列比對,得到一整套轉錄本信息和每個基因的表達量。轉錄組文庫構建方法及基因表達的基本信息詳見文獻[16]。

1.2.2 熱激蛋白基因家族分析

在轉錄組文庫中進行所有熱激蛋白基因檢索,根據蛋白質直系同源簇(clusters of orthologous groups of proteins, COG)、基因本體(gene ontology,GO)、京都基因和基因組數據庫(Kyoto Encyclopedia of Genes and Genomes, KEGG)、基因的進化譜系-非監督直系群數據庫(evolutionary genealogy of genes with non-supervised orthologous groups database,eggNOG)、Swiss-Prot、蛋白質家族(protein family,Pfam)數據庫基因注釋的結果,依據分子量進行分類,并參照NCBI Blast(https://blast.ncbi.nlm.nih.gov/Blast.cgi)及Swiss-Model(https://swissmodel.expasy.org/)比對結果,對每個檢索到的基因進行再次確認?;谒械腍SPs 氨基酸序列,利用MEGA_X 軟件構建系統發育樹:首先用MUSCLE軟件進行同源比對,然后采用鄰接(neighbor joining, NJ)法構建系統發育樹,并利用iTOL 在線工具(https://itol.embl.de/itol.cgi)進行美化。對所有熱激蛋白基因在COG、GO、KEGG中進行功能注釋與分析。通過系統發育樹構建及迷宮栓孔菌熱激蛋白基因家族分析,篩選得到2個HSP100家族基因gene_2622和gene_6466,并對它們進行生物信息學與表達量分析。

1.2.3 熱激蛋白基因的理化性質及結構分析

分別利用ProtParam(https://web.expasy.org/protparam/)、SignalP-5.0(https://services.healthtech.dtu.dk/service.php?SignalP-5.0)及TMHMM-2.0(https://services.healthtech.dtu.dk/service.php?TMHMM-2.0)等工具對迷宮栓孔菌中所有的HSPs氨基酸序列進行理化性質分析、信號肽及跨膜區預測,并利用Swiss-Model對其三級結構進行預測。

1.3 HSP100 家族基因分析

1.3.1 2 個HSP100 基因克隆及生物信息學分析

對篩選出的2 個HSP100 家族基因gene_2622和gene_6466進一步進行分析,分別將其命名為Tg-hsp104-1和Tg-hsp104-2??寺∵@2個基因全長序列的引物信息如下:Tg-hsp104-1-F,5′-TCTCTTG TCTGCCCTCTTG-3′;Tg-hsp104-1-R,5′-GCGGT GAGTTGGGTAGAA-3′。Tg-hsp104-2-F,5′-ATG GCTTCCTCTATGA-3′;Tg-hsp104-2-R,5′-GCCG ATTCGCTCTACACT-3′。以反轉錄cDNA為模板,利用ExTaq酶,在退火溫度為45 ℃的條件下對Tg-hsp104-1和Tg-hsp104-2進行PCR 擴增,然后將擴增產物送至生工生物工程(上海)股份有限公司進行測序。綜合測序結果、轉錄組文庫及JGI 數據庫中的參考基因組進行核苷酸及氨基酸序列分析。利用GSDS 2.0 軟件(http://gsds.gao-lab.org/)對Tghsp104-1和Tg-hsp104-2核苷酸序列進行可視化。利 用NCBI 的CD-Search(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)對Tg-HSP104-1 和Tg-HSP104-2 進行氨基酸序列和保守結構域預測,并利用GraphPad Prism 8.4.0軟件進行可視化分析;利用Swiss-Model進行三級結構建模,結合序列分析,利用PyMol軟件對蛋白結構進行標注。

1.3.2 2 個HSP100 基因表達量分析

依照1.2.1節的方法進行菌絲培養和收集,提取在木屑處理下不同時間點的RNA并反轉錄成cDNA。以三磷酸甘油醛脫氫酶基因(gpd,GenBank登錄號為JN564734)作為內參基因,在退火溫度為56 ℃的條件下以兩步法對Tg-hsp104-1和Tg-hsp104-2進行實時熒光定量PCR(real-time fluorescent quantitative PCR,qRT-PCR)擴增。引物信息如下:Tg-hsp104-1-F,5′-AAGGCGAGCGGGAGAA-3′;Tg-hsp104-1-R,5′-GATGCGACTGGGCGATT-3′。Tg-hsp104-2-F,5′-GTTGGCCCGTGGAAAGC-3′;Tg-hsp104-2-R,5′-GCGGAGGATGGAGATGGTT-3′。gpd-F,5′-AA CGGTTTCGGTCGTATCGG-3′;gpd-R,5′-CTTGCC CTCGACCCAGAGCT-3′。采用Microsoft Excel 2013和GraphPad Prism 8.4.0軟件對數據進行處理,并利用SPSS 24.0 軟件對數據進行差異顯著性檢驗(鄧肯法)。

2 結果與分析

2.1 迷宮栓孔菌的HSPs 家族分析

2.1.1 迷宮栓孔菌的HSPs 基因分類

在轉錄組文庫中對迷宮栓孔菌所有熱激蛋白基因進行檢索,結果共檢索到32 個熱激蛋白基因,根據編碼蛋白的分子量分別歸屬于HSP100(2 個)、HSP90(2 個)、HSP70(7 個)、HSP60(1 個)、sHSPs(20 個,其中,4 個HSP40,2 個HSP31,10 個HSP20,2 個HSP12,2 個HSP10)(附 表1,http://www.zjujournals.com/agr/CN/10.3785/j.issn.1008-9209.2022.10.261)。迷宮栓孔菌熱激蛋白基因系統發育樹如圖1 所示,同類別HSPs 基因聚類在一起,但2個HSP31 基因(gene_5587和gene_6895)親緣關系較遠。

表1 迷宮栓孔菌熱激蛋白基因的KEGG通路富集Table 1 KEGG pathway enrichment of HSP genes in T. gibbosa

圖1 迷宮栓孔菌熱激蛋白基因系統發育樹(NJ法)Fig.1 Phylogenetic tree of HSP genes in T. gibbosa (NJ method)

2.1.2 迷宮栓孔菌HSPs 家族功能注釋

迷宮栓孔菌的32個HSPs基因在COG數據庫中被注釋的有27個,屬于2個功能類目,其中,有25個屬于O 類(蛋白翻譯后修飾、蛋白質折疊、伴侶蛋白),占比92.59%,有2個屬于R類(一般功能預測),占比7.41%;而未被注釋的5個基因都為sHSPs基因??梢?,在迷宮栓孔菌中熱激蛋白的主要功能為蛋白翻譯后修飾、蛋白質折疊和伴侶蛋白;而sHSPs種類繁多,在細胞內分布廣泛,其功能更待深入研究。

對HSPs基因進行GO注釋和富集分析,結果如圖2 所示。HSPs 基因被顯著富集到“生物過程”的20 個二級類目、“細胞組分”的14 個二級類目及“分子功能”的11 個二級類目中。根據GO 分類和富集分析可知,HSPs 廣泛分布于細胞中,發揮多種重要功能,在應激條件下對蛋白質的折疊有重要意義,參與熱激反應,具有分子伴侶特性、與ATP 結合的特性和ATP酶活性,在其發揮功能過程中存在能量依賴性。

圖2 迷宮栓孔菌熱激蛋白基因的GO富集Fig.2 GO enrichment of HSP genes in T. gibbosa

KEGG通過分子網絡路徑圖體現大分子功能與代謝通路的關系。在本研究的32個HSPs基因中有18個被注釋,分布在5條通路中(表1),其中只有內質網中蛋白質加工通路的校正后p值小于0.05,為顯著富集的通路。HSPs 基因在KEGG 中的分類注釋與通路富集結果表明,迷宮栓孔菌的熱激蛋白還參與了RNA降解、內吞作用、蛋白質輸出等通路,但以內質網中蛋白質加工通路最重要。

2.2 迷宮栓孔菌HSPs 理化性質和結構分析

2.2.1 理化性質分析

對所有HSPs的理化性質進行分析(附表2,http://www.zjujournals.com/agr/CN/10.3785/j.issn.1008-9209.2022.10.261),發現迷宮栓孔菌HSPs 家族成員的氨基酸數量及分子量與其對應的HSPs 亞類有直接關系,其理論等電點為4.81~9.10,均為疏水蛋白。在32個HSPs成員中,有10個HSPs的不穩定系數小于40,穩定性較好;另外22個HSPs的不穩定系數大于40,其中sHSPs 亞類成員中有18 個為不穩定蛋白,占sHSPs亞類成員的90%??梢?,迷宮栓孔菌HSPs的穩定性因亞類的不同而有所差異,且sHSPs 在體外測試中穩定性普遍較差。

2.2.2 蛋白質三級結構預測

對迷宮栓孔菌HSPs 的三級結構進行預測,結果發現不同類別的HSPs 結構截然不同,各類別代表性結構如圖3所示。HSP100為六聚體環狀結構,通過構象延展和封閉的相互轉換,提供了“棘輪式”(ratchet-like)結構[17-18];HSP90 為同源二聚體結構,與ADP 結合時呈“V 型”(V-shape),通過與ATP 結合,其構象以“鉗形運動”(pincer-like motion)實現從開放到閉合的轉換[19];HSP70的功能與其輔助分子伴侶HSP40 有緊密聯系,在HSP40 和底物的刺激下,HSP70 將ATP 水解為ADP,并捕獲底物[20-21];HSP60為蛋白質折疊所必需的蛋白,為七聚體環狀結構,在HSP10 的協作下,構成“安芬森籠”(Anfinsen cages)結構[22],促進錯誤折疊的多肽鏈的展開。

圖3 迷宮栓孔菌不同類別熱激蛋白的三級結構Fig.3 Tertiary structures of different classes of HSPs in T. gibbosa

2.3 迷宮栓孔菌HSP100 家族基因分析

Tg-hsp104-1和Tg-hsp104-2為 迷宮 栓 孔菌HSP100 家族基因,編碼的產物蛋白具有重要的解聚功能。HSP100 家族中的HSP104 雖為分子伴侶,但其與經典的分子伴侶HSP70的功能有所不同,故篩選出HSP100家族基因予以進一步分析。

2.3.1 基因克隆及序列分析

根據轉錄組文庫分析和JGI 數據庫中參考基因組可知,基因Tg-hsp104-1長度為2 663 bp,Tg-hsp104-2長度為2 789 bp。以45 ℃退火溫度進行PCR擴增,2個基因都擴增得到單一且明亮的條帶(圖4),并與預計長度一致,測序結果與轉錄組序列和基因組序列比對成功。以測序結果為主,結合轉錄組分析和JGI數據庫中參考基因組數據,對上述2個HSP100基因進行分析,其內含子與外顯子分布情況如圖5所示,其保守結構域都比對到了ClpB結構域上。

圖4 HSP100基因PCR擴增電泳圖Fig.4 Electrophoretogram of HSP100 genes by PCR amplification

圖5 迷宮栓孔菌HSP100基因序列結構Fig.5 Sequence structures of HSP100 genes in T. gibbosa

2.3.2 氨基酸序列分析

HSP104/ClpB屬于Clp家族,是AAA+超家族的一員。HSP104/ClpB包含6個結構域:1個不固定的N-端結構域、2 個AAA+模塊(NBD1 和NBD2,其中,NBD1 由AAA 結構域和AAA 蓋結構域組成,NBD2 由AAA 結構域和C-端結構域組成),以及插入在NBD1 和NBD2 之間的連接結構域(接頭)[7,11]。在NBDs 中有十分保守的Walker A、Walker B 基序和一個重要的精氨酸指保守殘基[11,23]。

Tg-HSP104-1 和Tg-HSP104-2 的 氨 基 酸 序列結構如圖6A~B所示。Tg-HSP104-1共有819個氨基酸(amino acid, aa),通過NCBI 的CD-Search 預測,第80—789 aa 比對到了ClpB 上,2 個AAA 結構域分別在第127 aa處和第532 aa處有Walker A保守基序,在第194 aa 處與第600 aa 處有Walker B 保守基序,在第322個精氨酸(arginine, Arg)處與第772個Arg 處分別為NBD1 和NBD2 精氨酸指結構的保守殘基。Tg-HSP104-2共有899 aa,第7—865 aa比對到了ClpB上,2個AAA結構域分別在第215 aa處和第620 aa 處有Walker A 保守基序,在第285 aa 處與第688 aa 處有Walker B 保守基序,在第414 個Arg與第804 個Arg 處分別為NBD1 和NBD2 精氨酸指結構的保守殘基。

圖6 迷宮栓孔菌HSP100氨基酸序列結構Fig.6 Amino acid sequence structures of HSP100 in T. gibbosa

Walker A 和Walker B 保守基序為NBDs 重要的識別序列。精氨酸指結構與相鄰亞基結合的核苷酸相互作用,被認為在ATP 水解酶和細胞通信中發揮重要作用[11]。Walker A 基序的序列特點為Gx2GxGK(S/T),其中,G是甘氨酸,K是賴氨酸,S是絲氨酸,T是蘇氨酸,x是任何殘基;Walker B基序的序列特點為hhhhDE,其中,h 是疏水殘基,D 是天冬氨酸,E是谷氨酸[24];精氨酸指結構位于β鏈之后,其前后序列具有hxxxhxxhxxxxRxxxxxxxxh的特點,其中R是精氨酸。精氨酸指保守殘基的詳細信息仍然較少,相比于序列保守,其更傾向于結構保守[8,25-26]。

2.3.3 三級結構分析

從圖6A~B中可以看出,Tg-HSP104-2蛋白序列更為完整,Tg-HSP104-1 較之缺少了N-端結構域,故以Tg-HSP104-2 為例進行三級結構建模。Tg-HSP104-2為六聚體結構(圖7A~B),呈棘輪狀,每個單體都相同,共同通過螺旋嵌套形成六聚體構象來發揮功能。每個單體由N-端、NBD1、NBD2、接頭構成[10](圖7C)。如圖7D~E 所示,Tg-HSP104-2單體的NBD1 和NBD2 上半部分由α螺旋-β折疊-無規卷曲組成較大的αβα-核苷酸結合結構,下半部分由α螺旋-β折疊-無規卷曲組成較小的α-螺旋結構。NBD1 和NBD2 在結構上有一定的差異,兩者的AAA保守結構域都為一個較大的αβα-核苷酸結合結構,但NBD1的AAA蓋保守結構域是一個較小的α-螺旋結構,而NBD2的C-端保守結構域是一個αβ結構[8]。

圖7 迷宮栓孔菌Tg-HSP104-2的三級結構分析Fig.7 Tertiary structure analysis of Tg-HSP104-2 in T. gibbosa

2.3.4 表達情況分析

對Tg-hsp104-1和Tg-hsp104-2進行qRT-PCR分析,結果如圖8所示。添加木屑處理組的表達量相較于對照組明顯上升,2個基因的表達量在木屑處理第3天時即呈現顯著上調趨勢,生長后期表達量均有所回落,但都比對照組高。這說明在木屑處理下迷宮栓孔菌HSP100基因表達量有明顯上調趨勢。

圖8 木屑處理不同時間的基因表達情況Fig.8 Gene expression levels at different time under the sawdust treatment

3 討論與結論

本文探究了迷宮栓孔菌HSPs 家族的分類、功能及結構。HSPs 家族的功能預測結果及HSP100結構分析結果與現有研究[17-18,24-26]較為一致。但通過理化性質分析發現,相較于其他亞類,sHSPs 的穩定性較差。本研究對HSP100 的分類、所屬蛋白家族及超家族關系進行了系統闡述,并通過木屑處理下HSP100 基因的表達量分析,推測其與木屑中的次生代謝物質有關,可能參與對有害物質的適應過程。

在大腸埃希菌的ClpB 中,Walker A 基序負責與ATP 結合,而Walker B 基序負責ATP 的水解;Walker A 位于核心β-折疊的第一鏈和隨后的α-螺旋之間,在核苷酸結合和金屬離子配位方面發揮重要作用;Walker B 與核心β-折疊的第三鏈相關,包含參與ATP 水解和金屬離子配位的殘基[27]。ClpB存在ClpB95 和ClpB80 這2 種亞型,兩者為同一個轉錄本合成的不同亞型,其不同之處在于ClpB95含有一個高度可移動的N-端結構域[28]。在迷宮栓孔菌中,Tg-HSP104-2 具有完整的6 個結構域,而Tg-HSP104-1 不含N-端結構域,與Tg-HSP104-2也不為同一個轉錄本。

qRT-PCR驗證結果表明,2個HSP104基因在木屑處理下表達量都明顯上調。這種上調表達可能的原因是白腐菌在利用營養物質時優先利用單糖,之后才利用木質纖維素。木屑中的木質素含有松柏醇、芥子醇和對香豆醇3 種不同類型的苯基丙烷單體,這3 類醇通過共聚化產生了高度抗生物降解的芳香高聚物,因而對絕大多數微生物的攻擊均有抗性[29]。在試驗初期,迷宮栓孔菌主要利用LNAS培養基中的葡萄糖,加入木屑后,由于木屑中含有抗性代謝物,在用木屑處理初始階段,處理組相較于對照組可視為脅迫環境,有可能存在一些蛋白聚集情況,而2個HSP104基因與產物的上調表達更有利于對蛋白的解聚,以維持蛋白的功能。熱激蛋白對抗性代謝物質刺激作出反應,表達量上升,說明HSP104 在有害物質的脅迫方面可能發揮作用,并在脅迫消除后一段時間內保持一定的含量。

前期研究發現,迷宮栓孔菌在化學染料降解方面有顯著作用[30],通過探究其HSPs 家族分類、理化性質及結構,并對篩選出的HSP100 基因進行分析驗證,為后續有針對性地構建功能性菌株提供了依據,有助于提高迷宮栓孔菌在染料脅迫環境下的適應能力和降解能力,進而在環境保護與生態修復中發揮作用。此外,通過對迷宮栓孔菌HSPs 家族基因研究,有助于探索白腐菌菌株對逆境的適應機制,提高其在不同環境條件下對木質素的降解能力,從而在能源利用方面發揮作用。

猜你喜歡
木屑迷宮結構域
木屑
蛋白質結構域劃分方法及在線服務綜述
大迷宮
迷宮
重組綠豆BBI(6-33)結構域的抗腫瘤作用分析
捕網迷宮
組蛋白甲基化酶Set2片段調控SET結構域催化活性的探討
油頁巖與木屑混合熱解特性研究
創造獨一無二的迷宮
泛素結合結構域與泛素化信號的識別
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合