?

紫蘇密碼子偏好性分析及fad3基因的異源表達預測

2017-11-20 02:46張天緣
山地農業生物學報 2017年5期
關鍵詞:異源密碼子紫蘇

張天緣,沈 奇,宋 莉*

(1.貴州大學 生命科學學院/農業生物工程研究院,貴州 貴陽 550025;2.貴州省油菜研究所,貴州 貴陽 550008)

*通訊作者:宋 莉(1971-),女,博士,副教授,主要研究方向:植物基因工程研究;Email:lpsssl@126.com。

紫蘇密碼子偏好性分析及fad3基因的異源表達預測

張天緣1,沈 奇2,宋 莉1*

(1.貴州大學 生命科學學院/農業生物工程研究院,貴州 貴陽 550025;2.貴州省油菜研究所,貴州 貴陽 550008)

紫蘇α-亞麻酸(ALA)含量極高,其合成相關基因偏好性及異源表達宿主的闡明,是揭示紫蘇不飽和脂肪酸調控機制及表達生產的重要前提。本研究從密碼子特性、有效密碼子數、相對使用度、最優密碼子、堿基相關性、奇偶偏好性及異源表達特性等方面,對不同形成時期的紫蘇種子轉錄組序列進行密碼子偏好性分析,并對篩選出的pfFAD3s基因進行三種微生物異源表達預測分析比較。結果表明:紫蘇轉錄核酸序列中的GC含量為45.85%,大部分基因密碼子偏好性相對較弱,其蛋白編碼基因密碼子偏好以A/T結尾;pfFAD3s基因異源表達的適宜微生物宿主為釀酒酵母。分析結果為進一步研究紫蘇ALA合成的分子調控奠定了基礎,并為其微生物基因工程生產提供了一定依據。

紫蘇;密碼子偏好性;異源表達

不同生物的蛋白質編碼基因對簡并密碼子使用頻率不相同,構成了物種特異的密碼子偏好性[1]。密碼子偏好性除了受自然選擇[2]和壓力突變[3]影響之外,還受mRNA二級結構、基因長度、G+C含量、蛋白結構[4-7]等因素影響。密碼子偏好性是影響基因異源表達的重要因素。在合成生物學及基因工程研究中,對密碼子偏好性的優化可以大幅提高基因表達水平,增加目標物質的調控及產量[8-11]。伴隨著測序技術的迅猛發展,草菇、擬南芥、川母貝、菠蘿[12-15]等多個物種的密碼子偏好性得到了很好研究。

紫蘇PerillafrutescensL.,是我國衛生部首批公布的60種藥用型植物之一[16]?!吨袊幍洹?015年版本收錄其三個藥用部位,分別為紫蘇葉、紫蘇梗、紫蘇子[17]。紫蘇種子中α-亞麻酸含量可達65%,是陸生植物α-亞麻酸含量最高的物種之一,經濟價值較高。目前,紫蘇α-亞麻酸的合成及調控途徑研究已受到廣泛關注,利用該合成途徑重要基因進行異源表達生產是紫蘇利用的一個主要方向。研究表明,通過密碼子優化后的oAiFADS17表達量大幅提高[11],FAD7基因在雙子葉植物異源表達也能獲得理想的效果[18]。本研究通過對紫蘇種子轉錄組數據密碼子進行分析研究,為進一步開發利用紫蘇和異源表達其基因產物奠定基礎。

1 材料與方法

1.1材料

實驗材料為貴州省油菜研究所自育新品種“M40”開花至種子完熟后2、6、10、14、18、22、26 d的紫蘇種子。紫蘇種子轉錄組數據為課題組測序獲得。使用天根試劑盒提取總RNA,進行Illumina測序。獲得數據使用Trinity軟件組裝形成unigene庫,并過濾除去長度低于300 bp的序列用于本研究的數據來源。大腸桿菌(Escherichiacoli)、釀酒酵母(Saccharomycescerevisiae)、畢赤酵母(Pichiapastoris)密碼子偏好性數據來源于Codon Usage Database數據庫中。

1.2分析方法

1.2.1紫蘇種子蛋白質編碼基因密碼子特性分析 使用Codon W1.4.2軟件(http://codonw. sourceforge. net/)對紫蘇種子蛋白質編碼基因密碼子特性的計算和統計分析,得到鳥嘌呤和胞嘧啶總量(G+C)、密碼子第3位堿基成分(A3、G3、C3、T3)、密碼子第3位的C+G含量(GC3)。密碼子第1、2位的G+C含量(GC12)等數據。

1.2.2紫蘇種子表達基因有效密碼子數分析 參照Fuglsang[19]的方法,使用有效密碼子數(effective number of codons,ENC)來評估單個密碼子使用頻率的偏好程度。數據區間為20~61。數值越接近20,密碼子使用偏好性越強。

1.2.3同義密碼子相對使用度分析 參照Sharp[20]的方法,應用同義密碼子相對使用度(relative synonymous codon usage,RSCU)的數據來衡量密碼子使用偏好性。如果RSCU=1則說明密碼子使用無偏好性;如果RSCU>1則表明該密碼子使用頻率較高;反之RSCU<1。

1.2.4最優密碼子分析 采用高表達優越密碼子分析方法[21]進行最優密碼子分析,統計所有基因的ENC值,有序數據集的上下10%區間形成高RSCU集合和低RSCU集合。根據兩個子集的△RSCU值及卡方檢驗確定最優密碼子。

1.2.5中性繪圖分析 采用中性繪圖用來研究影響密碼子偏好性的因素,以密碼子第一、二個堿基的G+C平均含量為縱坐標,以密碼子第三個堿基的G+C含量為橫坐標繪圖,分析密碼子第一、二位與第三位堿基組成的相關性[22]。

1.2.6PR2分析 采用PR2(parity rule 2,PR2)進行奇偶偏好分析[22],計算每個基因A3/(A3+T3)和G3/(G3+C3),分別作縱坐標和橫坐標,以平面圖顯示各基因堿基組成。為了避免由第三位堿基對A/T或T/A和G/C或C/G的突變不均衡,分析時僅選擇以下氨基酸密碼子:絲氨酸(TCA、TCC、TCG、TCT)、亮氨酸(CTA、CTC、CTG、CTT)、脯氨酸、精氨酸(CGA、CGC、CGG、CGT)、蘇氨酸、纈氨酸、丙氨酸和甘氨酸。

1.2.7關鍵基因異源表達分析 統計大腸桿菌、畢赤酵母、釀酒酵母密碼子偏好性,并與紫蘇的密碼子使用情況進行比較。通過注釋和近源比對得到α亞麻酸合成相關的關鍵基因,分析關鍵基因所含有的密碼子與異源宿主的稀有堿基的異同,預測異源表達最適宿主。

2 結果與分析

2.1蛋白質編碼基因密碼子特性分析

經過濾獲得紫蘇種子轉錄組數據共包括13825條完整開放閱讀框序列。使用Codon W對完整開放閱讀框序列進行密碼子使用模式分析。結果顯示,所有完整開放閱讀框序列總長度為16 417 617 bp,N50=1 503 bp,平均GC含量為45.85%,GC含量在30.4~68.3%之間。紫蘇GC含量平均值比大腸桿菌基因組GC含量平均值52.35%要低,但高于畢赤酵母平均GC含量42.73%及釀酒酵母平均GC含量39.77%要稍稍略高。第一二位堿基的GC含量變幅在30.9~83.3%之間,其平均GC含量為47.62%。第三位堿基的GC含量變幅在15.3~91.3%之間,平均GC含量是44.00%。第三位堿基A和T的使用頻率(30.70和38.39%)略高于C和G使用頻率(26.29和39.09%),表明紫蘇種子發育過程對A和T結尾的密碼子使用的偏好程度大于G和C密碼子。第三位堿基平均GC含量略高于畢赤酵母密碼子第三位堿基平均含量42.16%,比釀酒酵母密碼子第三位堿基平均GC含量38.10%略高,但比大腸桿菌密碼子第三位堿基平均GC含量55.62%要低很多,研究表明紫蘇種子密碼子使用并無對堿基使用的特殊偏好,其密碼子使用特點與大腸桿菌的差別最大,與釀酒酵母和畢赤酵母的差別略小。

表1 不同物種密碼子平均GC含量Tab.1 Average GC content of different species Codon

2.2紫蘇種子表達基因有效密碼子數分析

紫蘇種子有效密碼子數ENC分布范圍是26.22~61,平均值ENC為53.39。通常將ENC為35作為區分密碼子偏好性強弱的標準[23]。紫蘇種子基因有23條基因的ENC小于35,表明紫蘇種子表達基因整體水平密碼子偏好性較低,只有少數基因有密碼子偏好性。顯示只有少數密碼子偏好性受到選擇影響的基因應該落在標準曲線下方較遠的位置(圖1)。相關性分析表明(表2),GC和GC3及GC12均達到極顯著水平,但是GC3和GC12存在很弱的相關性,密碼子成分明顯不同。ENC值與密碼子數也沒有達到顯著水平,表明密碼子數對ENC影響很弱,排除了基因長度過短對密碼子偏好性的影響。

2.3同義密碼子相對使用度分析

紫蘇種子編碼基因密碼子RSCU值大于1的有25個,表明紫蘇偏好使用這些密碼子(表3)。除了只由一種密碼子編碼的Trp和Met外,編碼Cys的UGU和UGC以及編碼Leu的CUG也都均無偏好性。RSCU>1的密碼子主要是以U和A結尾,說明這兩個密碼子是編碼基因最偏愛的密碼子,GC使用頻率較低。

圖1 ENC繪圖分析Fig.1 Analysis of ENC and GC3 relationship

注:“**”在0.01水平上顯著相關。

2.4最優密碼子分析

最優密碼子統計分析表明,有31個密碼子是紫蘇種子發育時期所需的最優密碼子,它們分別是UUU,UUA,UUG,CUU,CUA,AUU,AUA,GUU,GUA,UAU,CAU,CAA,AAU,AAA,GAU,GAA,UCU,UCA,CCU,CCA,ACU,ACA,GCU,GCA,UGU,CGU,CGA,AGU,AGA,GGU,GGA(表4),分別編碼Phe,Leu,Ile,Val,Tyr,His,Gln,Asn,Lys,Asp,Glu,Ser,Pro,Thr,Ala,Cys,Arg和Gly 18個氨基酸。其中Leu、Ser、Arg包含3個最優密碼子。除了UUG外,所有的最優密碼子都是A或T結尾,說明紫蘇偏愛使用A/T結尾的密碼子。

表3 同義密碼子使用度Tab.3 RSCU analysis

注:“*”表示RSCU大于1。

表4 最優密碼子分析Tab.4 Uasge bais analysis

注:“*”代表最優密碼子。

2.5中性繪圖分析

權衡選擇對密碼子使用模式的影響運用中性繪圖分析(neutrality plot)。結果表明(圖2A),GC12的取值范圍是0.309~0.833,GC3的取值范圍是0.153~0.913,兩者相關系數為0.233,回歸系數為0.43。紫蘇種子中GC3及GC12的相關性較低,說明紫蘇的密碼子的使用易受突變的影響。

2.6PR2分析

注:A. 中性繪圖,B.PR2繪圖

圖2 紫蘇密碼子使用模式圖
Fig.2 Codon usage pattern plot of Perilla

通過PR2(圖2B)分析了基因部分氨基酸的嘌呤含量和嘧啶的關系,圖中結果表明紫蘇中堿基T使用頻率大于堿基A;堿基G使用頻率大于堿基C。正常情況下突變應該均衡,但紫蘇種子發育并不均衡,說明紫蘇種子密碼子使用模式不只受到突變的影響,還可能受到其他因素影響。

2.7關鍵基因異源表達預測

根據紫蘇轉錄組注釋信息及與近源比對,預測其pfFAD3s基因在不同宿主表達情況。首先比較了紫蘇和畢赤酵母、釀酒酵母、大腸桿菌的密碼子偏好性情況。統計分析表明,畢赤酵母5個最稀有的密碼子是CGG,CGC,GCG,CCG,CGA,不存在紫蘇偏好的密碼子。釀酒酵母中5個最稀有的密碼子分別為:CGG,CGC,CGA,UGC,CCG,也不存在紫蘇偏好的密碼子。大腸桿菌中5個最稀有的密碼子分別為: AGA,AGG,AUA,CGA,CGG,有2個是紫蘇使用的密碼子(AGG和AGA)。如果表達基因中含有較多的AGG和AGA密碼子,很可能難以在大腸桿菌中表達。綜上分析表明,紫蘇密碼子偏好性與大腸桿菌的差異巨大。進一步統計這3條基因中存在三種宿主稀有密碼子的比例,結果表明畢赤酵母稀有密碼子在這三條基因中所占的比例是3.42~11.74%,釀酒酵母稀有密碼子所占的比例為3.65~9.69%,大腸桿菌稀有密碼子所占的比例最寬,范圍在3.19~21.17%之間,可見釀酒酵母和畢赤酵母稀有堿基所占比例比大腸桿菌稀有堿基所占比例整體水平偏低。DN26137基因和DN23844基因含有釀酒酵母稀有堿基的比例最少(表5),推測釀酒酵母更利于這兩條基因表達;而DN35418基因含量大腸桿菌和畢赤酵母稀有密碼子的數目少于釀酒酵母,但差別不大,推測這三種宿主均適合該基因異源表達。對基因進行異源表達時,如果基因存在宿主的稀有密碼子的比例很高,我們可以根據宿主偏好的密碼子來對基因進行優化,多使用優勢密碼子,以提高表達水平。

3 結論與討論

編碼基因密碼子存在冗余性,自然界中61組編碼堿基只能編碼20種氨基酸,每種氨基酸利用1~6個同義密碼子編碼。異源基因表達活性與密碼子偏好性具有密切關系,通過密碼子改造后進行酵母表達生產青蒿酸可實現青蒿素的工業化生產[24],并大幅度提高目標產物產量。張琦等[25]對FAD4的ATG上游+4位基因進行改造,將A變成G進行釀酒酵母轉化研究,獲得FAD4高效表達。目前,研究密碼子偏好性,并根據最優密碼子設計構建基因異源表達已成為合成生物學及基因工程研究中的重要內容。

表5 紫蘇pfFAD3s基因中不同宿主的稀有密碼子數Tab.5 Number of rare different hosts codon in perilla pfFAD3s

中草藥中廣泛含有重要次生代謝產物,其調控基因的異源表達及密碼子偏好性分析具有重要意義。本研究對紫蘇種子密碼子偏好性進行全面分析,發現紫蘇主要偏好A或T結尾的密碼子,而G和C使用頻率略低,符合雙子葉植物密碼子偏好的特點[26]。紫蘇密碼子偏好的確定對于未來在轉基因工程中對載體和宿主的選擇有重要的指導意義,針對紫蘇偏好的密碼子進行優化,從而提高翻譯效率和表達能力,也為異源表達選擇合適的宿主提供參考。紫蘇密碼子使用特點與大腸桿菌的差異較大,與畢赤酵母和釀酒酵母的差異略小。參與其α-亞麻酸合成途徑的fad3分析表明,釀酒酵母可能是適合紫蘇a-亞麻酸基因異源表達的理想宿主。隨著大量編碼油脂代謝通路的關鍵基因已被克隆,改造這些基因來提高受體細胞的油脂已經成為一個油脂生產的主要研究方向,本研究從生物信息學角度初步探明了紫蘇密碼子偏好性和異源表達宿主,這對紫蘇基因工程開展具有重要的意義。

[1] Ikemura T.Correlation between the abundance of Escherichia coli transfer RNAs and the occurrence of the respective codons in its protein genes: a proposal for a synonymous codon choice that is optimal for the E. coli translational system[J].JournalofMolecularBiology,1981, 146(1):1-21.

[2] Trotta E.Selection on codon bias in yeast: a transcriptional hypothesis[J].NucleicAcidsResearch,2013,41(20):9382-95.

[3] Bulmer M.The selection-mutation-drift theory of synonymous codon usage[J].Genetics, 1991, 129(3):897.

[4] Zama M. Codon usage and secondary structure of mRNA[J].NucleicAcidsSymposium, 1990(22):93-94.

[5] Duret L, Mouchiroud D.Expression pattern and, surprisingly, gene length shape codon usage in Caenorhabditis, Drosophila, and Arabidopsis[J].ProceedingsoftheNationalAcademyofSciencesoftheUnitedStatesofAmerica,1999,96(8):4482-4487.

[6] Knight R D, Freeland S J,Landweber L F.A simple model based on mutation and selection explains trends in codon and amino-acid usage and GC composition within and across genomes[J].GenomeBiology,2001,2(4):1-13.

[7] Gupta S,Majumdar S T,Ghosh T.Studies on the relationships between the synonymous codon usage and protein secondary structural units[J].Biochemical&BiophysicalResearchCommunications,2000,269(3):692-696.

[8] Feng L,Chan W W,Roderick S L,etal.High-level expression and mutagenesis of recombinant human phosphatidylcholine transfer protein using a synthetic gene: evidence for a C-terminal membrane binding domain[J].Biochemistry,2000,39(50):15399-15409.

[9] Kotula L, Curtis P J.Evaluation of Foreign Gene Codon Optimization in Yeast: Expression of a Mouse IG Kappa Chain[J].Biotechnology(NY),1991,9(12):1386-1389.

[10] Gao F,Li Y,Decker J M,etal.Codon usage optimization of HIV type 1 subtype C gag, pol, env, and nef genes: in vitro expression and immune responses in DNA-vaccinated mice.[J].AidsResearch&HumanRetroviruses,2003,19(9):817-823.

[11] 梅甜甜,陳海琴,郝光飛,等.一種新ω-3脂肪酸脫飽和酶的克隆表達和活性鑒定[J].食品與發酵工業,2016,42(8):31-37.

[12] 蔣 瑋,呂貝貝,何建華,等.草菇密碼子偏好性分析[J].生物工程學報,2014,30(9):1424-1435.

[13] 范三紅,郭藹光,單麗偉,等.擬南芥基因密碼子偏愛性分析[J].生物化學與生物物理進展,2003,30(2):221-225.

[14] 李 瀅,匡雪君,孫 超,等.川貝母轉錄組密碼子使用偏好性分析[J].中國中藥雜志,2016,41(11):2055-2060.

[15] 陳 哲,胡福初,王祥和,等.菠蘿轉錄組基因密碼子使用偏好性分析[C].中國熱帶作物學會2016年學術年會論文集,2016.

[16] 沈 奇,秦信蓉,王仙萍,等.種植密度對紫蘇經濟產量及農藝學性狀的影響[J].農業科學與技術:英文版,2014(9):1516-1520.

[17] 中國藥典.一部[S].北京:中國醫藥科技出版社,2015.

[18] 王海波,郭俊云,姚晴晴,等.植物質體型ω-3脂肪酸去飽和酶7基因的密碼子偏性分析[J].基因組學與應用生物學,2015,34(11):186-189

[19] Fuglsang A.The effective number of codons for individual amino acids: some codons are more optimal than others[J].Gene,2003,320(3):185-190.

[20] Sharp P M,Li W H.The rate of synonymous substitution in enterobacterial genes is inversely related to codon usage bias[J].MolecularBiology&Evolution,1987,4(3):222-230.

[21] Stenico M,Lloyd A T,Sharp P M.Codon usage in Caenorhabditis elegans:delineation of translational selection and mutational biases[J].NucleicAcidsResearch,1994,22(13):2437.

[22] Zhang WJ,Zhou J,Li Z F,etal. Comparative analysis of codon usage patterns among mitochondrion, chloroplast and nuclear genes in Triticum aestivum L[J].JournalofIntegrativePlantBiology,2007,49(2):246-254.

[23] Wright F.The effective number of codons' used in a gene[J].Gene,1990,87(1):23-29.

[24] Paddon C J,Westfall P J,Pitera D J,etal.High-level semi-synthetic production of the potent antimalarial artemisinin[J].Nature,2013,496(7446):528-32.

[25] 張 琦,李明春,孫 穎,等.轉譯起始密碼子周邊序列的改變對Δ6-脂肪酸脫氫酶基因表達的影響[J].微生物學報,2004,44(4):536-539.

[26] 劉漢梅,何 瑞,張懷渝,等.玉米同義密碼子偏愛性分析[J].農業技術生物學報,2010,18(3):456-461.

AnalysisofCodonBiasandpfFAD3sHeterologousExpressioninPerillafrutescens(L.)TranscriptionalGeneSequence

ZHANGTian-yuan1,SHENQi2,SONGLi1*

(1.CollegeofLifeSciences/InstituteofAgro-Bioengineering,GuizhouUniversity,Guiyang,Guizhou550025,China;2.GuizhouRapeseedInstitute,Guiyang,Guizhou550008,China)

Perilla is one of the best oil crops with high level of α-linolenic acid (ALA). It is important to reveal the regulatory mechanisms of ALA biosynthesis for its industrial production, based on the codon usage bias and appropriate heterologous host of perilla genes. In this study, codon characteristics, codon numbers, relative synonymous codon usage, optimal codon, base correlation, parity rule and microbial heterologous expression ofpfFAD3swere respectively analysed for gene using, according to the RNA sequence from seven development period of perilla seeds. Results showed that GC content was 45.85% in transcribed perilla sequences. Most gene codon bias were not obvious and tend to end with A/T base.Saccharomycescerevisiaemay be a more suitable host forpfFAD3sexpression. This research provides a foundation for the synthesis regulation mechanism of perilla ALA and its large-scale production by microbial gene engineering.

perilla;coden usage;heterologous protein expression

2017-03-27;

2017-05-16

國家自然科學基金項目(31360067);貴州省科技廳農業攻關項目(黔科合NY字[2016]3052號);貴州省科學技術基金項目(黔科合J字[2014]2020號)。

Q755

A

1008-0457(2017)05-0014-08國際DOI編碼10.15958/j.cnki.sdnyswxb.2017.05.003

猜你喜歡
異源密碼子紫蘇
近岸水體異源遙感反射率產品的融合方法研究
基于EM-PCNN的果園蘋果異源圖像配準方法
密碼子與反密碼子的本質與拓展
歲歲紫蘇
臉譜與假面 異源而殊流
10種藏藥材ccmFN基因片段密碼子偏好性分析
解脂耶氏酵母異源合成番茄紅素的初步研究
茶樹CsActin1基因密碼子偏性分析
煙草葉綠體密碼子的偏好性及聚類分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合