?

薏苡轉錄組中密碼子使用偏好性分析

2022-05-16 08:57張重菊趙懿琛趙德剛
種子 2022年4期
關鍵詞:堿基擬南芥氨基酸

張重菊, 趙懿琛, 趙德剛,2

(1.貴州大學山地植物資源保護與種質創新省部共建教育部重點實驗室/生命科學學院/茶學院, 貴陽 550025;2.貴州省農業科學院, 貴陽 550006)

生物體在生長發育過程中表現出來的特異性性狀主要是蛋白質的不同所引起的,蛋白質作為生物體主要成分之一,維持生命體的活動具有舉足輕重的作用。一個氨基酸可對應多個密碼子,這種現象稱為密碼子的簡并性[1]。密碼子的簡并性具有非常重要的生物學意義,在面對極端環境時,可以減少生物體內堿基突變帶來的危害,進而維持群體的穩定性,編碼同一氨基酸的密碼子稱為同義密碼子,理論上生物內同義密碼子在無外界環境干擾或堿基突變的情況下使用的頻率是相同的[2]。由于環境對物種的選擇以及其他因素的干擾,同種物種相同基因對密碼子的使用也存在差異[3],即生物體為了適應環境壓力,在選擇使用密碼子時,會優先選擇一些有利于自生生長發育的密碼子,這些密碼子稱為最優密碼子,即密碼子使用存在著偏好性[4]。在物種生存過程中,被優先選擇使用的密碼子對于物種生存具有舉足輕重的作用,如基因表達調控、轉錄以及翻譯過程、GC含量[5-6]。此外,根據密碼子的特性,在進行遺傳轉化工作中,選擇適宜的宿主細胞,增加轉化效率[7],所以研究密碼子偏好性對生物學遺傳轉化研究具有重大意義。

薏苡(Coixlachrymal-jobiL.)又稱為水玉米、晚念珠、六谷迷等,多為一年生或多年生禾本科薏苡屬植物。薏苡仁、莖、葉、根中含有極為豐富的營養物質,具有 “天下第一米”、“禾本科植物之王”、 “生命健康之禾”等美譽。薏苡仁含有酚類、黃酮類、多糖、蛋白質、纖維、維生素和油脂等物質[8-9],所以薏苡逐漸成為人們研究的重要農作物之一。目前關于薏苡基因的研究相對其成分分析和藥食作用較少,具有較大的研究空間,所以本試驗結合薏苡轉錄組數據對薏苡密碼子的偏好性進行分析,選擇出在薏苡中發揮重要功能的關鍵密碼子,培育出優良抗病的薏苡。該研究在提取薏苡總RNA后得到轉錄組數據,根據轉錄組數據中確定的54 275個基因密碼子進行分析,分析中采用了密碼子相對使用頻率、ENC(Etfective Number of Codons)與GC 3 s關聯分析及PR 2-plot偏倚分析等分析方法。此外,為了表明薏苡密碼子的使用具有自身特異性,將其密碼子與3種單子葉植物(水稻、高粱和玉米)、雙子葉植物(擬南芥)、真核生物(釀酒酵母)以及原核生物(大腸桿菌)進行比較,分析薏苡與它們對于同義密碼子的使用模式。本研究可為促進薏苡基因遺傳轉化提供理論基礎,也可為培養優質薏苡種質資源給薏苡導入異源基因有一定的參考價值。

1 材料與方法

1.1 材 料

本實驗室所采用的植物材料為薏苡,通過Trizol法提取薏苡總RNA,并進行反轉錄得到cDNA,將cDNA進行測序得到54 275個基因序列。此外,利用Codon Usage Database在線軟件的水稻、高粱、玉米、擬南芥、釀酒酵母以及大腸桿菌等生物相關密碼子信息,與薏苡進行比較。

1.2 方 法

1.2.1同義密碼子相對使用頻率分析

RSCU(Relatives Snonymous Codon Usage, RSCU)指編碼某一氨基酸所特指的密碼子和全部能編碼該氨基酸的一切密碼子的比值。通常生物體內的密碼子是隨機被選擇應用的,但是事實并非如此,RSCU值可判斷是否存在密碼子使用偏好,RSCU小于1時,說明該密碼子被低頻率使用;當RSCU等于1時,說明該密碼子被隨機使用,而當RSCU大于1時,說明該密碼子被高頻率使用[10]。

1.2.2GC 12-GC 3關聯性分析

采用2016版Office軟件中的Excel和GraphPad軟件對轉錄組數據中的GC 12和GC 3分別作縱坐標和橫坐標作圖進行相關性分析,其中GC 12為G 3和C 3值的平均值。對此進行分析可評價自然選擇壓力及突變對密碼子使用偏好造成的影響[11]。

1.2.3ENC-GC 3 s關聯性及ENC比值頻數分布分析

ENC(Effective Number of Codons, ENC)是指所有能編碼成氨基酸的密碼子數量,最大值為61,最小值為20。ENC值越小,偏好性越強,反之則越弱。GC 3是為密碼子第三位是G或者C的頻率。本文將ENC和GC 3值分別作圖進行分析[12]。分布在標準曲線兩側附近表示外界環境對該生物密碼子使用影響較小,密碼子的使用特征主要由堿基突變所決定[13]。

ENC比值=[(ENC理論值-ENC實際值)/ENC理論值]來統計ENC的頻數分布[14],薏苡密碼子使用特征的影響因素作進一步的分析[11]。

1.2.4薏苡密碼子奇偶偏性分析(PR 2-plot)

以A 3/(T 3+A 3)、G 3/(G 3+C 3分別為橫坐標和縱坐標作圖,判斷密碼子第三位A 3、T 3、G 3、C 3對密碼子組成的影響??v橫中分線劃分該圖為4個部分,當G和C(或者A和T)所占比例相近時,基因密碼子偏好性完全受突變影響;若其組成比例相差過大時,表明密碼子使用偏好性受自然選擇和其他因素共同影響[11,15]。

1.2.5薏苡與其他物種的GC含量及密碼子使用頻率比較

本研究利用Excel軟件結合一定的公式對薏苡各基因密碼子的使用頻率進行計算。并將其與水稻、高粱、玉米、擬南芥、釀酒酵母和大腸桿菌的密碼子使用頻率進行比較分析,比值≥2或≤0.5表示兩物種間密碼子使用偏好性差異較大[16]。將薏苡與以上這幾種物種的密碼子使用頻率作熱圖分析薏苡密碼子使用差異性。

2 結果與分析

2.1 RSCU值分析

Codon W軟件作為一款密碼子分析利器,在對一個物種或者基因的密碼子進行分析時,密碼子的相對使用統計信息(表1)可以在此軟件中獲得,這些信息包括密碼子的GC含量(GC content)、ENC值、密碼子的偏好指數(Codon Bias Index, CBI)等。密碼子分析中常使用同義密碼子的相對使用頻率判斷一個密碼子是否被常用。

表1 薏苡同義密碼子的相對使用度統計Table 1 Relative usage of codons in Coix lachryma-jobi L.

薏苡的RSCU結果如表2所示,以A或U堿基結尾的密碼子中,RSCU值中比1大的密碼子有16個,如UUG、CUC、CUG等;RSCU為1的密碼子僅存在AAU這1個;RSCU比1小的有15個,如UUU、UUA、CUA等,這些密碼子大部分具有較高或較低的偏好性,極少密碼子沒有偏好性,以A或U結尾的密碼子當RSCU值中大于1時偏向于使用U作為結尾。此外,以堿基C或G作第三位的密碼子的RSCU值中大于1的密碼子有10個,如UUG、CUC、CUG等;RSCU等于1的密碼子僅有AGC這1個,小于1的有21個,如UUG、CUC、GUC等,這些密碼子同樣具有很低的偏好性或無偏好性,以堿基G或C為第三位堿基的密碼子當RSCU值中大于1時偏向于使用C結尾。薏苡偏好使用的密碼子中大多數以A或C作第三位堿基,推測薏苡在進化過程中受到其他因素影響時,發生突變的可能性較大。薏苡在對3個終止密碼子的使用中,UAA的使用頻率相對于UAG和UGA較小。

表2 薏苡基因編碼氨基酸的同義密碼子的相對使用頻率Table 2 Relative usage frequency of synonymous codons gene encoding amino acids in Coixlachrymal-jobi L.

2.2 GC 12與GC 3關聯性分析

分析GC 12和GC 3兩者之間的關聯性,結果(圖1)發現,兩者之間的相關性較弱(R2=0.125 3),擬合曲線(Y=0.412X+0.196 2)。大多數位點分布在對角線(CG 12=GC 3)之外,說明該生物密碼子受堿基突變和自然選擇壓力的影響較大。

2.3 ENC與GC 3 s的相關性分析

以各基因ENC值為縱坐標,GC 3值為橫坐標作圖分析(如圖2),從圖中可以觀察到一部分基因位點分布在標準曲線(Y=27.77+105.8X-109.5X2,R2=0.533 6)周圍,同樣說明薏苡密碼子使用受自身堿基突變壓力所影響,另一部分分布在距離標準曲線較遠的位置,說明薏苡在進化過程中密碼子的使用也會受到外界環境的干擾。

圖1 GC 12-GC 3關聯分析Fig.1 Association analysis of GC 12-GC 3

圖2 PR 2 bias-plot分析Fig.2 Analysis of PR 2 biasplot

2.4 奇偶性偏倚分析(PR 2-plot)

對薏苡基因PR 2偏倚分析如圖3所示,薏苡基因位點下半部分略少于上半部分,薏苡左半部分明顯多于右半部分,即A和U所占比例相差不大,但是G和C所占比例相差較大。表明在密碼子的第三個堿基上C使用最多,U次之,這個結果與密碼子相對使用頻率分析一致。

ENC比值頻數主要分布在-0.05~0.05之間,有9 579個基因,占總基因的36.53%,其次是分布在-0.15~-0.05之間,有15 904個基因,占總基因的29.67%,再者就是0.05~0.15之間的占12.26%,其他的便分布在不同組內。說明ENC期望值與觀測值之間具有不同程度的差異且薏苡密碼子的ENC比值相對較低,說明薏苡密碼子偏好性使用除了受自身堿基突變影響之外,還受到自然選擇不同程度的影響。

圖3 ENC與GC 3關聯分析Fig.3 Analysis of ENC and GC 3 relationship

表3 ENC比值頻數分布Table 3 Frequency distribution of ENC ratio

2.5 薏苡密碼子與多物種密碼子的GC含量及密碼子使用頻率的比較

本研究從Codon Usage Database數據庫中提取得到單子葉植物水稻、高粱和玉米以及雙子葉植物擬南芥,真菌釀酒酵母和原核生物大腸桿菌的相關信息,選取以上物種密碼子的關鍵信息與薏苡的密碼子偏好性進行比較,結果如表5所示,薏苡與水稻、高粱、玉米這3種植物比,前者與后三者的一部分密碼子使用頻率比值≥2或≤0.5的分別有4種、1種和4種,與作為典型的雙子葉植物擬南芥相比有2種,與真菌釀酒酵母的和原核生物大腸桿菌的分別有5種和6種。薏苡的密碼子使用頻率與以上幾種生物之間存在一定的差異,但是與同為禾本科植物的高粱差異最小,說明兩者具有較近的親緣關系。相比其他物種而言,擬南芥與大腸桿菌或許是薏苡基因異源轉化的最佳載體。

表4 薏苡與其他生物密碼子偏愛性比較Table 4 Comparison of codon preference between Coix lachryma-jobi L. and other biological codons

表4(續)

表5 不同物種密碼子GC含量Table 5 GC content of codon in different species

3 討 論

堿基序列上3個連續排列的堿基稱之為密碼子,之前的研究推測一個氨基酸對應著一個密碼子,或者是一個氨基酸對應著兩個密碼子,但是都被一一推翻,最終證實一個或者多個密碼子可參與合成一個氨基酸,蛋白質翻譯過程中的這種特征稱為密碼子的簡并性[17]。密碼子的該特性能夠使生物體基因在受到環境變化或者其他因素的影響下發生的堿基突變而增加對環境的適應,從而減少對生物體的傷害。每一種生物對密碼子的使用都有自己的獨特性,不同生物體之間可能相似或者同類生物之間相差極大。對物種的密碼子使用特征進行分析,可為優化生物遺傳轉化途徑作理論基礎。

對物種進行偏好使用頻率較大的密碼子分析,其功能的軟件通常采用Codon W,RSCU表示某一氨基酸的特指密碼子與能翻譯成該氨基酸的全部密碼子進行相比,得到的數值稱為同義密碼子之間的相對使用頻率。對薏苡密碼子的RSCU值分析發現,薏苡對密碼子使用存在一定的偏好性,總共有26個密碼子具有偏好性,且多以A或U結尾。

對薏苡各基因密碼子進行GC 12與GC 3和ENC與GC 3的關聯性分析發現,GC 12與GC 3的關聯性強,密碼子使用主要受到堿基突變的影響。進一步對ENC與GC 3的關聯性分析表明,該生物密碼子主要受到自身堿基突變的影響,其次還受到自然選擇和其他因素的影響。PR 28-plot圖分析基因密碼子中的第三位GC發現,圖上半部分表示密碼子中使用A堿基的頻率比使用U堿基的頻率大,下半部分則表示使用U堿基的頻率比使用A堿基的頻率大;豎線右邊部分表示使用G堿基的頻率比使用C堿基的頻率大,豎線右邊部分表示使用C堿基的頻率比使用G堿基的頻率大。薏苡使用的密碼子偏好以C和U結尾。

將薏苡密碼子的GC含量和使用頻率與水稻、高粱、玉米、擬南芥、釀酒酵母以及大腸桿菌進行比較發現,主要決定氨基酸種類的第一、二位堿基所占比例與同為禾本科單子葉植物的水稻、高粱和玉米存在較小的差異,這對將薏苡歸類為禾本科單子葉植物提供了有力的證據,同時這與王蘭蘭[18]對薏苡GA 2ox蛋白同源序列分析的結果中薏苡與高粱具有非常近的親緣關系一致。進一步分析發現,單子葉植物與雙子葉植物之間無論是密碼子的GC含量還是使用頻率都存在一定的差異。目前,關于煙草、擬南芥等雙子葉模式植物的研究很多,但是對于單子葉植物除了水稻之外,還需挖掘更多典型的單子葉植物進行研究,且此類植物在轉化上還需進一步的優化。對此可以為薏苡基因遺傳異源轉化篩選出轉化效率更高的受體植物,薏苡與雙子葉植物擬南芥的差異最小,所以擬南芥可能是驗證薏苡基因功能的最佳受體植物,且在煙草中已證實薏苡GA 2氧化酶基因具有矮化功能[18]。與其他外源表達載體相比,釀酒酵母和大腸桿菌密碼子偏好性存在的差異都較小,可見大腸桿菌真核表達體系或者釀酒酵母表達體系都適合作為薏苡基因的異源表達實驗載體,但相比于酵母表達體系,大腸桿菌表達體系具有更多范圍的用途,大腸桿菌的pET表達載體對于外源蛋白具有表達最高產量、最快速度、最高效率的優選表達載體[19]。目前關于薏苡遺傳轉化的相關研究報導極少。薏苡莖尖遺傳轉化已被證實[19],但是轉化效率極低,所以對薏苡密碼子的使用模式進行分析,了解其密碼子的偏好性,通過有目的地修改堿基組成,提高堿基表達水平的同時,有望提高薏苡的轉化效率,培育出優良的薏苡種質資源,為我國薏苡產業良好發展奠定一定的理論基礎。研究受體系統的密碼子偏好性,有利于為驗證薏苡基因而尋找適合的轉化載體,綜合轉錄后調控、轉化等因素,優化密碼子組成來提高轉化效率[20]。

猜你喜歡
堿基擬南芥氨基酸
飼料氨基酸釋放動態對豬氮素利用影響的研究進展
基因“字母表”擴充后的生命
創建新型糖基化酶堿基編輯器
科學解讀食物中的蛋白質如何分“優劣”
生命“字母表”迎來新成員
生命“字母表”迎來4名新成員
補氨基酸不如吃雞蛋
擬南芥
口水暴露了身份
一株特立獨行的草
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合