?

陸地棉GhERL1基因的鑒定及生物信息學分析

2022-02-15 03:31劉文豪孔憲輝王旭文司愛君馬麒趙福相余渝
綠洲農業科學與工程 2022年2期
關鍵詞:擬南芥氣孔氨基酸

劉文豪,孔憲輝,王旭文,司愛君,馬麒,趙福相,余渝

(新疆農墾科學院棉花研究所/農業農村部西北內陸區棉花生物學與遺傳育種重點實驗室,新疆 石河子 832000)

植物細胞外信號主要由質膜定位的類受體蛋白激酶(Receptor-like kinases,RLKs)感知。類受體蛋白激酶是由一個信號肽、一個富含半胱氨酸的細胞外結構域、一個跨膜結構域和一個預測的細胞內激酶結構域組成的一類跨膜蛋白[1]。這些激酶參與細胞間通信協調植物組織的生長和發育,控制植物地上器官的伸長、葉片形成、花的發育和表皮分化[2],進而影響不同植物物種的非生物脅迫耐受性。棉花是我國重要的經濟作物,對抗病、抗逆優質棉的培育是解決產量問題的根本途徑,而分析關鍵基因的調控網絡、差異表達及理化特性具有重要研究意義。

擬南芥ERfs家族受體(ERECTAfamily receptor,ERfs)是一個古老的富含亮氨酸重復序列的RLKs家族,該基因家族由ERECTA(ER)、ERECTA-LIKE1(ERL1)和ERL2組成[3]。研究表明,擬南芥ER介導的信號通路通過調節核小體動力學來促進細胞增殖,調節花序結構形成[4]。整個擬南芥ER家族基因的缺失導致了顯著的矮化癥、側向器官尺寸減小和花朵發育異常,包括花瓣極性擴張、心皮伸長以及花藥和胚珠分化的缺陷[5]。青枯病菌極易引起擬南芥突變體植株Ler(Landsbergerecta)產生萎蔫病,而轉基因植株Ler對青枯病菌的抗病性顯著增強??赡苁荅R基因通過感知來自青枯病菌的外部生物刺激,然后激活信號通路,導致對病原體的抵抗力增加[6]。目前,已經在菠菜、馬鈴薯、葡萄、黃瓜、大豆、高粱、楊樹、小麥、水稻、番茄等植物中有關于ER基因家族成員研究的相關報道。大豆質膜上ER將光信號傳遞給胞質中的光敏色素,光敏色素進入核內與轉錄因子相互作用,啟動赤霉素和生長素相關基因表達,促進植株下胚軸的伸長[7]。高粱ER家族基因SbER1和SbER2的表達水平均隨著干旱脅迫程度的加深而逐漸提高,可能在抗旱機制中發揮作用[8]。PdERECTA改變氣孔的發育模式降低氣孔密度,從而限制水的消耗,增強楊樹的耐旱性[9]。高溫脅迫下小麥TaERECTA基因的表達促進過氧化物酶和相關底物的合成,提高對脅迫產生活性氧的分解速率,以保護細胞免受高溫脅迫引起的損傷和死亡[10]。過表達擬南芥ER的轉基因番茄和水稻品系在溫室和田間試驗中顯示出更好的耐熱性。此外,過表達ER的轉基因擬南芥、番茄和水稻植物的生物量增加[11]。

迄今為止,陸地棉ERECTA家族成員ERL1基因尚未被綜合分析,對生物和非生物脅迫的反應過程中發揮的作用尚未得知,其涉及的調控網絡及差異表達尚不清楚。為了研究ERL1基因在植物生長發育和脅迫響應中的作用,本研究通過生物信息學方法獲取陸地棉ERL1基因序列,進一步分析其理化性質、序列特征、亞細胞定位、染色體位置,并對不同脅迫條件下陸地棉ERL1基因的表達模式進行研究。實驗結果將培育抗逆優質高產的新品種提供新的基因資源。

1 材料與方法

1.1 GhERL1蛋白理化性質分析

在NCBI(https://www.ncbi.nlm.nih.gov/)數 據 庫下載陸地棉ERL1基因序列和蛋白序列,利用SMART網站(http://smart.embl.de/)進行結構域的預測分析,TMHMM2.0(https://services.healthtech.dtu.dk/)分析蛋白的跨膜結構,ProtScale(https://web.expasy.org/protscale/)預測蛋白親疏水性。使用Prot-Param(https://web.expasy.org/protparam/)分 析理論等電點、帶正負電荷的氨基酸殘基、分子式、總原子數、不穩定系數、脂肪指數。

1.2 GhERL1蛋白的二級結構和三級結構分析

在SOPMA網站(https://npsa-prabi.ibcp.fr/)頁面輸入氨基酸序列,依據多序列比對和多級系統進化分析,設定默認參數,預測二級結構的四種狀態[12]。在線網站SWISS-MODEL(https://swissmodel.expasy.org/)上傳氨基酸序列,運行建模二級結構進一步折疊形成的結構域[13]。

1.3 GhERL1蛋白的亞細胞定位分析

為準確了解GhERL1蛋白在表達調控中所具有的功能,本研究從蛋白質數據中篩選特征向量構建數據集,使用在線網站Predictprotein(https://predictprotein.org/)和Plant-mPLoc(http://www.csbio.sjtu.edu.cn/)進行亞細胞定位預測。

1.4 GhERL1基因的表達模式分析

為了研究陸地棉發育過程中GhERL1基因的差異表達,從陸地棉轉錄組數據庫(PRJNA248163)獲取GhERL1基因在根莖葉不同組織的基因表達量,以及在開花后不同時間纖維、胚珠等部位的基因表達量。使用TB-Tools軟件和GENESCLOUD網站進行差異表達分析、熱圖構建。

1.5 GhERL1蛋白互作網絡分析

利用String(https://string-db.org/)在線工具分析GhERL1蛋白-蛋白相互作用網絡[14]。輸入蛋白序列,根據蛋白名稱、來源、注釋和序列相似性來進行蛋白質關聯的功能性和物理性分析。

2 結果與分析

2.1 GhERL1蛋白理化性質分析

GhERL1蛋白具有ER家族典型的LRR富集區和(S_TKc)絲氨酸/蘇氨酸蛋白激酶區,參與接收上游配體信號(圖1A)。GhERL1蛋白序列含有998個氨基酸,在N端存在一個跨膜區位于第20到39個氨基酸之間,而第1-19個氨基酸在膜內,第40-998個氨基酸在膜外,跨膜區參與外部信號的傳輸(圖1B)。每個位點的氨基酸得分正值表示疏水性,負值表示親水性,GhERL1蛋白平均親/疏水性值為-0.027,具有較弱的親水性(圖1C)。而通過Prot-Param分析得知,GhERL1蛋白序列分子量為110198.57,理論等電點為5.76,帶負電荷氨基酸殘基有100個,帶正電荷氨基酸殘基有80個,分子式C4916H7832N1304O1480S41,總 原 子數為15573。不穩定系數34.14,屬于穩定蛋白類別。脂肪族氨基酸指數105.19。

2.2 GhERL1蛋白的二級結構和三級結構分析

SOPMA分析發現(圖2),GhERL1的蛋白質序列含有998個氨基酸,而在這些氨基酸的分布排列中α螺旋403個,所占比例為40.38%;β轉角29個,所占比例2.91%;延伸鏈120個,所占比例為12.02%;無規卷曲446個,所占比例為44.69%。

圖2 GhERL1蛋白二級結構預測Figure 2 Prediction of secondary structure of GhERL1 protein

基于結構基因組學,把GhERL1的蛋白序列輸入在線網站SWISS-MODEL,通過搜索序列結構模型相同的同源模型建立骨架,得到該蛋白三級結構的Cartoon模型,而這個模型的氨基酸排列順序與二級結構預測基本相符,注釋表明蛋白三級結構含有類受體蛋白激酶特有的絲氨酸/蘇氨酸結構域,進一步驗證了GhERL1蛋白結構的準確性(圖3)。

圖3 GhERL1蛋白三級結構預測Figure 3 Tertiary structure prediction of GhERL1 protein

2.3 GhERL1蛋白的亞細胞定位分析

細胞中蛋白質合成后轉運到特定的細胞器中,只有轉運到正確的部位才能參與細胞的各種生命活動,如果定位發生偏差會對細胞功能產生重大影響。亞細胞定位的生物信息學研究作為亞細胞蛋白質組學實驗研究的補充,相互驗證與促進。本研究通過Plant-mPLoc預測結果表明該GhERL1蛋白定位在細胞膜,PredictProtein網站預測結果同樣表明該蛋白定位在細胞膜(圖4)。

圖4 GhERL1蛋白亞細胞定位Figure 4 Subcellular localization of GhERL1 protein

2.4 GhERL1基因的表達模式分析

利用陸地棉轉錄組數據庫對GhERL1基因進行表達模式分析。根據基因表達量值分析GhERL1基因的表達模式,在不同發育時期的子葉中表達存在差異性,第48小時的子葉表達量最高,第24小時的子葉中表達量最低(圖5A)。在纖維形成的第20天基因表達量最高,在第10天表達量最低(圖5B)。在開花后第1天的胚珠中表達量最高,第10天的胚珠中表達量最低(圖5C)。GhERL1基因在陸地棉植株的根、莖、葉的表達模式存在顯著的差異性,在根中的表達量最高,而在莖中的表達量相對最低(圖5D)。

在模擬的冷、熱、鹽、干旱脅迫下,GhERL1基因的表達量與對照(未處理)相比,具有一定的差異性。在冷脅迫3小時的時候表達量最高,干旱脅迫6小時的時候表達量最高,熱脅迫3小時的時候表達量最高,鹽脅迫12小時的時候表達量最高(圖5E)。當受到生物或非生物脅迫時,GhERL1基因通過上調或下調表達發揮其功能。推測其可能在低溫、干旱、鹽堿化等環境的脅迫中發揮重要作用。

圖5 GhERL1基因在不同組織的表達分析Figure 5 Expression analysis of GhERL1 gene in different tissues

2.5 GhERL1蛋白互作網絡分析

蛋白通過彼此之間的相互作用構成蛋白質相互作用網絡,來參與生物信號傳遞、基因表達調節、能量和物質代謝及細胞周期調控等生命過程的各個環節[15]。在STRING數據庫中的蛋白互作網絡中可找到GhERL1蛋白和EPF2(表皮模式因子2,Epidermal patterning factor 2)、TMM(受體類蛋白,Protein too many mouths-like)、SERK1(體細胞胚胎發生受體激酶1,Somatic embryogenesis receptor kinase 1)、BRL3-1(受體樣蛋白激酶BRI1-like 3,Receptor-like protein kinase BRI1-like 3)等蛋白存在相互作用(圖6)。氣孔作為水氣交換的通道,對于優化植物光合效率、增強環境適應能力具有重要的作用。植物可以通過改變氣孔的孔徑和分布適應環境脅迫,減少植株損傷[16]。GhERL1蛋白與TMM形成復合體參與識別氣孔調節肽EPF2等,調節氣孔發育過程中免疫應答,調控內在生理、發育過程以適應不斷變化的環境。

圖6 蛋白互作網絡分析Figure 6 Protein interaction network analysis

3 討論

類受體蛋白激酶是植物生長的重要調節因子,ERf家族受體與氣孔發育、莖尖分生組織功能、花細胞分化和生物/非生物脅迫有關[17]。本研究通過利用生物信息學方法對陸地棉GhERL1的理化性質、結構功能和表達模式等進行分析。

通過理化性質分析發現GhERL1蛋白的平均疏水性為-0.027,具有較弱的親水性。而疏水性是水對非極性分子產生的排斥作用,在蛋白質的結構、構象及與其他蛋白質的相互作用等方面具有重要作用,與蛋白質的功能和性質密切相關。蛋白質的不穩定系數與其結構有關,GhERL1不穩定系數34.14,屬于穩定蛋白類別。GhERL1蛋白二級結構主要由α-螺旋和無規卷曲構成,β-轉角和延伸鏈的占比較少。GhERL1蛋白三級結構建模有助于了解GhERL1蛋白在結構的可視化,以及蛋白一蛋白相互作用和蛋白質功能分析方面的應用。植物蛋白質的亞細胞定位是功能基因組學的重要內容,而植物細胞的主要分區包括細胞膜和其他內膜系統、細胞核、細胞質以及位于其中的線粒體、葉綠體、高爾基體和內質網等各種細胞器[18]。GhERL1蛋白定位于細胞膜,感知膜外的富含半胱氨酸的多肽,在組織中實現細胞間的通信。

本研究分析了GhERL1基因在陸地棉不同組織的表達模式,發現GhERL1基因在葉中的表達量較高,可能參與葉片細胞發育,調控器官形態建成。GhERL1基因在根組織具有高表達量,而根組織具有吸收水分和固定地上部分的功能,還具有向土壤輸入有機質和感知根部周邊環境變化的作用,推測其在根系網絡中具有重要功能。GhERL1基因在陸地棉植株的不同組織中均具有表達量,可能與陸地棉的整個生長過程相關。而這不同組織的表達量存在差異性,表明其在不同組織的不同發育階段發揮著特有的功能。在蛋白-蛋白調控網絡中,發現GhERL1編碼蛋白與EPF2、TMM、SERK1、BRL3-1等蛋白存在相互作用。擬南芥EPF2在葉片表皮細胞發育中調節細胞密度,影響氣孔形成,可在不影響養分吸收的前提下提高植物的抗旱性,對植物的生存和產量至關重要[19]。TMM的突變會導致擬南芥葉片的氣孔模式缺陷,會消除莖部的氣孔形成。陸地棉SERK1基因編碼富含亮氨酸的重復受體蛋白激酶,在花藥發育和花粉粒的形成中有一定作用[20]。組成相互作用網絡的這些編碼蛋白主要參與信號轉導等途徑,它們可能在陸地棉生長發育和響應脅迫反應中起重要作用。

4 結論

棉花在生長發育過程中,會受到高溫、鹽堿、干旱、營養缺乏、病菌侵害等各種惡劣因素影響。然而,棉花細胞可以感受外界逆境信號,激活抗逆信號通路,引起自身防御機制反應。本研究分析了GhERL1的序列結構和功能預測模擬,為大田育種廣泛應用GhERL1改良作物生產潛力提供科學依據。而在GhERL1蛋白互作調控網絡發現的這些蛋白質和基因有可能在未來解決一系列嚴重的農業問題,包括提高作物用水效率,以及改善高溫、鹽堿壓力對作物的影響。

猜你喜歡
擬南芥氣孔氨基酸
玉米葉氣孔特征對氮素和水分的響應及其與葉氣體交換的關系
富天冬酰胺蛋白增強擬南芥輻射抗性的研究
某灰鑄鐵汽油機缸體電機面氣孔的解決探討
月桂酰丙氨基酸鈉的抑菌性能研究
KD490:一種軟包鋰離子電池及其制作工藝
UFLC-QTRAP-MS/MS法同時測定絞股藍中11種氨基酸
HPLC法同時測定阿膠強骨口服液中4種氨基酸
兩種LED光源作為擬南芥生長光源的應用探究
重型車用氣缸蓋濕型砂鑄造氣孔缺陷的降低
木醋液與6-芐基腺嘌呤對擬南芥生長的影響研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合