?

基于RSCU與QRSCU的F/10和 G/11木聚糖酶家族密碼子偏好性的比較

2010-03-15 01:51趙靜靜齊斌丁利娟唐旭清
食品與生物技術學報 2010年5期
關鍵詞:編碼方法同義密碼子

趙靜靜, 齊斌,2, 丁利娟,3, 唐旭清*

(1.江南大學理學院,江蘇無錫214122;2.無錫職業技術學院,江蘇無錫214122;3.無錫市青山高級中學,江蘇無錫214100)

木聚糖酶是可將木聚糖降解成低聚木糖和木糖的一類酶的總稱,它可以將木聚糖降解為寡聚木糖、木糖和少量單糖,其主要分為 F/10和 G/11兩個家族。F/10和 G/11木聚糖酶家族在空間結構上屬于兩種不同的折疊類型。F/10家族木聚糖酶三維結構為(α/β)8折疊桶類型。G/11家族木聚糖酶三維結構為β折疊片為主所構成的單個結構域。目前木聚糖酶廣泛應用于工業領域,比如制漿造紙、飼料加工、釀酒、烘焙食品、制備功能性低聚糖、臨床、環境保護等領域。

由于木聚糖酶在工業應用方面的重要作用,長期以來,人們對其做了大量研究[1-5]。在對F/10和G/11木聚糖酶的研究中,其重要的內容之一便是對其同義密碼子的研究。比如,劉亮偉等人[1,3,5]用生物信息學的方法,研究了 F/10和 G/11木聚糖酶氨基酸二聯體同最適溫度、最適p H值的關系、木聚糖酶的分子進化以及用主成分分析的方法對F/10和 G/11木聚糖酶分類等一系列的問題。作者則是綜合了石秀凡等人[6]基于氨基酸編碼方法下對同義密碼子偏好性及朱平等人[7-8]基于擬氨基酸基因編碼方法下對同義密碼子的偏好性的研究成果,運用兩種編碼方法,進行編程,分別計算RSCU和QRSCU,得出兩種編碼方法下同義密碼子都偏好使用以g/c結尾的密碼子,而且基于擬氨基酸基因編碼方法下,其結論更加明顯。

1 材料與方法

1.1 數據庫的構建與編程

根據文獻[1]中Swiss-Prot數據庫中木聚糖酶的登錄號,尋找 GenBank和 EMBL-EBI數據庫中對應的編碼序列,建立木聚糖酶基因的編碼序列庫.文中取了F/10木聚糖酶家族的28條序列,總共包含13 790個密碼子,GC占編碼區堿基總數的48.2%。G/11木聚糖酶家族的33條序列,總共包含12 077個密碼子,GC占編碼區堿基總數的50.6%。

F/10木聚糖酶的編碼序列庫(28條序列):O59859,P07528,P26223, P29417, P33559,P40942, P40943, P40944, P45703, P51584,P56588,Q60041,Q60042,Q00177,Q60037,Q12603,P14768, P07986, P10478,P23556,P23360, P07529, P48789, P49942, P23030,O60206,P23557。

G/11木聚糖酶的編碼序列庫(33條序列):O43097,P00694,P09850,P17137, P18429,P23031,P26220, P26515, P29127, P33557,P33558,P35811, P36217, P36218, P45705,P45796,P48791, P48824, P54865, P55328,P55329,P55330, P55331, P55332, P55333,P55334,P55335,P77853,P83513,Q06562,Q12667,Q53317。

文中所用的數據都是用C語言編程完成的。

1.2 密碼子的相對使用度

1.2.1 氨基酸編碼方法及RSCU 同義密碼子是指編碼同一種氨基酸的兩個或兩個以上的密碼子。自遺傳密碼破譯以來大量的研究發現,同義密碼子的使用與基因表達存在著密切的關系。作者用密碼子的相對使用度來研究密碼子的偏好性。

由文獻[6]知,基于氨基酸編碼方法下的同義密碼子的相對使用度(RSCU)計算公式為:RSCU=同義密碼子的觀測數/同義密碼子的期望數,同義密碼子的期望數=氨基酸的同義密碼子出現次數/編碼此種氨基酸的同義密碼子數。

1.2.2 擬氨基酸基因編碼方法及QRSCU 基因組遺傳密碼字典自確立以來,在40年的科學研究中被不斷的擴充和完善。作為生命組成不可缺少的一個部分,該遺傳密碼顯示出了它在進化上的復雜性和適應性,但也充分地顯示了人類在遺傳密碼認識上的局限性。正因為這些原因,人們完全揭示遺傳密碼內在特性的道路還很漫長,還需要進行不斷的研究和嘗試。目前,有學者從另一角度對此進行了大量探討,其中擬氨基酸基因編碼方法就是一個重要形式。

定義1:令WC≡{tgg,tgt,tga,tgc},RS≡{agg,agt,aga,agc},LF≡{ttg,ttt,tta,ttc},M I≡{atg,att,ata,atc},ED ≡{gag,gat,gaa,gac},-Y≡{tag,tat,taa,tac},KN ≡{aag,aat,aaa,aac},QH≡{cag,cat,caa,cac},S’≡{tcg,tct,tca,tcc},R’≡{cgg,cgt,cga,cgc},L’≡{ctg,ctt,cta,ctc}。Let ZU={G,V,ED,A,WC,LF,-Y,S’,RS,M I,KN,T,R’,L’,QH,P},則ZU稱為擬氨基酸集,這里,-Y為新終止子,但是(tga∈)WC不是終止子[7]。

由文獻[8]知,基于擬氨基酸基因編碼方法下同義密碼子的相對使用度(QRSCU)也相應被提出,其計算公式為:QRSCU=同義密碼子的觀測數/同義密碼子的期望數,同義密碼子期望數=擬氨基酸的同義密碼子出現次數/編碼此種擬氨基酸的同義密碼子數。

1.3 密碼字的偏好性強度劃分

與[1]的強度劃分相似,計算出兩個家族中編碼序列在氨基酸編碼方法和擬氨基酸基因編碼方法下密碼子偏好性數值后,為了區分兩個木聚糖酶家族在兩種編碼方法下密碼子偏好性差異及分析密碼子偏好使用情況,分別對其進行了強度劃分.因此做如下規定:

1)基于氨基酸編碼方法下以 G/11家族中偏好性最高值2.0和最低值0.181 8為標準,將這兩個數據之間的差距劃分為4個等級,劃分如下:A無偏好性:RSCU≤1.0;B低度偏好性:1.0

2)基于擬氨基酸基因編碼方法下以F/10家族中偏好性最高值2.808 899和 G/11家族中偏好性最低值0.010 8為標準,將這兩個數據之間的差距劃分為 4個等級,劃分如下:A無偏好性:QRSCU≤1.05;B低度偏好性:1.05≤QRSCU≤1.3;C中度偏好性:1.3≤QRSCU≤1.4;D高度偏好性:QRSCU≥1.4。見表3、4。

2 結果與分析

根據1.1節中所建立的數據庫,包括 F/10木聚糖酶的編碼序列庫(28條序列)和 G/11木聚糖酶的編碼序列庫(33條序列),按1.2節所給出的公式進行計算,得出相對使用度RSCU和擬相對使用度QRSCU表,見表1~2。

表1 基于氨基酸編碼方法下F/10和G/11的密碼子偏好情況Tab.1 Codon bias of F/10 and G/11 based on amino acids coding method

續表1

續表1

表2 基于擬氨基酸基因編碼方法下F/10和G/11的密碼子偏好情況Tab.2 Codon bias of F/10 and G/11 based on quasi-amino acids coding method

續表2

續表2

高度和中度偏好密碼子類型見表3~4。

表3 基于氨基酸編碼方法下F/10與G/11木聚糖酶密碼子偏好性Tab.3 Codon bias of F/10 and G/11 xylanase based on amino acids coding

表4 基于擬氨基酸基因編碼方法下F/10木聚糖酶密碼子偏好性Tab.4 Codon bias of F/10 and G/11 xylanase based on quasi-amino acids coding

2.1 基于氨基酸編碼方法下的密碼子偏好情況分析

由表1所列出的基于氨基酸編碼方法下F/10木聚糖酶家族和G/11木聚糖酶家族的同義密碼子的相對使用情況可以看出:

1)在 F/10木聚糖酶家族中除了{R,D,E,Stop}家族偏好使用a/t結尾的密碼子外,所有的氨基酸均偏好使用以g/c結尾的密碼子。而在 G/11木聚糖酶家族中除了以g/c結尾的密碼子偏好使用外,有6種氨基酸偏好使用以t結尾的密碼子。

2)F/10與 G/11木聚糖酶家族中,在由兩個密碼子組成的氨基酸中,其中{a,t,c}{a}{c}所含密碼子數量遠大于{a,t,c}{a}{t};{g}{a}{t}所含密碼子數量遠大于{g}{a}{c};{a,c}{a}{g}所含密碼子數量遠大于{a,c}{a}{a};{g}{a}{a}所含密碼子數量遠大于{g}{a}{g}。

由表3所列出的氨基酸編碼方法下 F/10與G/11木聚糖酶家族的密碼子的偏好性還可以得出如下結論:

1)兩個家族都偏好使用以g/c結尾的密碼子,與以前的研究結果一致。F/10家族中除了ctg,gga外高度偏好性的密碼子都包含在 G/11中。這說明F/10相對集中在幾種主要的密碼子,而 G/11密碼子偏好性種類更加多樣,這與分子進化的結果相互印證。

2)F/10家族17個主要偏好性密碼子(高度、中度)中有12個以 g/c結尾,只有5個以a/t結尾,顯示了氨基酸偏好使用以g/c結尾的密碼子。G/11家族21個主要偏好性密碼子(高度、中度)中有13個以g/c結尾,只有8個以a/t結尾,也顯示了密碼子偏好使用以g/c結尾的密碼子。當然,這種效果還不是太好。

3)雖然高度偏好的密碼子g/c結尾的大于a/t結尾的,但隨著密碼子偏好程度降低,以a/t結尾的密碼子數目與以g/c結尾的密碼子數目趨于接近,而且以上結果與[1]中結果一致。

2.2 基于擬氨基酸基因編碼方法下的密碼子偏好情況分析

由表2所列出的擬氨基酸基因編碼方法下F/10與G/11木聚糖酶家族的密碼子偏好性可以看出:

1)F/10和 G/11木聚糖酶家族在{G,RS,S’,-Y,T,KN,QH,LF,MI,V,L’,WC}這些擬氨基酸家族中都偏好使用以g/c結尾的密碼子。擬氨基酸{A,R’,P}在F/10木聚糖酶家族中偏好使用以g/c結尾的密碼子,而在 G/11木聚糖酶家族偏好使用以t結尾的密碼子,以g/c結尾的密碼子次之。

2)F/10木聚糖酶家族中除了{ED}外,所有擬氨基酸都偏好使用以g/c結尾的密碼子,G/11木聚糖酶家族中除了{R’,ED,A,P}外,所有擬氨基酸都偏好使用以g/c結尾的密碼子。

3)F/10與 G/11木聚糖酶家族中,當密碼子的第一位堿基為a時,則擬氨基酸偏好使用以c結尾的密碼子。

4)F/10木聚糖酶家族中,除了第二位堿基為g外,當第一位堿基為t時,擬氨基酸偏好使用以c結尾的密碼子。而 G/11木聚糖酶家族中,當第一位堿基為t時,所有的擬氨基酸都偏好使用以c結尾的密碼子。

5)F/10與 G/11木聚糖酶家族中,當第一位堿基為g時,除了第二位堿基為t的密碼子外,其它的都避免使用以g結尾的密碼子.

由表4所列出的擬氨基酸基因編碼方法下F/10與 G/11木聚糖酶家族的密碼子偏好性還可以得出如下結論:

1)兩個家族都偏好使用以g/c結尾的密碼子,這與以往研究結果一致。F/10家族中除了tgg外高度偏好性的密碼子都包含在 G/11中。說明F/10相對集中在幾種主要的密碼子,而 G/11密碼子偏好性種類更加多樣,這與分子進化的結果相互印證。

2)F/10家族14個主要偏好性密碼子中(高度、中度)有10個以 g/c結尾,只有4個以a/t結尾,顯示了擬氨基酸基因偏好使用以g/c結尾的密碼子。G/11家族19個主要偏好性密碼子中(高度、中度)有13個以g/c結尾,只有6個以a/t結尾,也顯示了擬氨基酸偏好使用以g/c結尾的密碼子,且該結果比在氨基酸編碼方法下效果還要好;

3)雖然高度偏好的密碼子g/c結尾的大于a/t結尾的,但隨著密碼子偏好程度降低,以a/t結尾的密碼子數目與以g/c結尾的密碼子數目趨于接近,而且以上結果也與[1]中結果一致。

3 結 語

首先,根據上面的研究,給出基于氨基酸編碼方法與基于擬氨基酸基因編碼方法下的密碼子偏好情況對比見表5。

表5 兩種編碼方法下密碼子偏好性對比Tab.5 Codon bias comparison of two kinds of coding method

1)基于氨基酸編碼方法下F/10家族有{D,E,Stop}3種氨基酸偏好使用以a/t結尾的密碼子,其余的都偏好使用g/c結尾的密碼子?;跀M氨基酸基因編碼方法下 F/10家族只有{ED}偏好使用以a/t結尾的密碼子,其余的都偏好使用g/c結尾的密碼子;

2)基于氨基酸編碼方法下 G/11家族有{L,A,P,R,C,D,E,Stop}八種氨基酸偏好使用以a/t結尾的密碼子外,其余的都偏好使用g/c結尾的密碼子?;跀M氨基酸基因編碼方法下 G/11家族中除了{R’,ED,A,P}四種擬氨基酸偏好使用以a/t結尾的密碼子外,其余的都偏好使用g/c結尾的密碼子;

3)兩種編碼方法都體現了氨基酸更偏好使用以g/c結尾的密碼子,而且以c結尾的密碼子比以g結尾的密碼子更偏好使用,且兩種編碼方法下F/10木聚糖酶的密碼子偏好性都優于 G/11木聚糖酶的密碼子偏好性;

4)由表5我們還可以得出基于擬氨基酸基因編碼方法比基于氨基酸編碼方法能更好的體現密碼子偏好性,與文獻[8]的結論一致。

同義密碼子的使用并非隨機的均勻的,其具有一定的偏好性,作者通過計算RSCU與QRSCU分析了 F/10及 G/11木聚糖酶家族密碼子偏好性,結果發現:

1)密碼子偏好性與生物進化密切相關。由表3與表4可知,兩種編碼方法下幾乎全部的 F/10高度偏好性密碼子都包含在 G/11中,G/11比F/10家族中偏好性密碼子種類多。同樣的由表5可以看出無論是基于哪種編碼方法 F/10家族都比 G/11家族更偏好使用以g/c結尾的密碼子。這些性質均可用文獻[2]中分子進化的觀點說明,因為F/10在進化時間上相對于 G/11較長,所以其偏好性趨于均衡;

2)擬氨基酸基因編碼方法更能體現密碼子的偏好性。文中的表格顯示了基于擬氨基酸基因編碼方法能更好的體現密碼子偏好性,與文獻[8]的結論一致。該結論充分驗證了擬氨基酸分類對于 F/10和G/11木聚糖酶家族在偏好性上是充分顯現的,且與分子進化的觀點是一致的,從而對研究蛋白質結構并預測蛋白質的相互作用的分子機制有著重要幫助。

[1]劉亮偉,秦天蒼,翟繼,等.F/10及 G/11木聚糖酶家族密碼子偏好性分析[J].河南農業大學學報,2008,42:223-227.LIU Liang-wei,QIN Tian-cang,ZHAI Ji,et al.Analysis on codon bias in F/10 and G/11 xylanase[J].Journal of Henan Agricultural University,2008,42:223-227.(in Chinese)

[2]劉亮偉,秦天蒼,王寶,等.木聚糖酶的分子進化[J].食品與生物技術學報,2007,26:110-116.LIU Liang-wei,QIN Tian-cang,WANGBao,et al.Molecular evolution of xylanase[J].Journal of Food Science and Biotechnology,2007,26:110-116.(in Chinese)

[3]蘇玉春,陳光,白晶,等.木聚糖酶的產生條件優化[J].吉林農業大學學報,2008,30:793-796.SU Yu-guang,CHEN Guang,BAI Jing,et al.Production and growth condition of xylanase fromAspergillus niger[J].Journal of Jilin Agricultural University,2008,30:793-796.(in Chinese)

[4]邵蔚藍,毛忠貴,薛業敏.極端耐熱木聚糖酶基因在大腸桿菌中的高效表達[J].食品與發酵工業,2003,29:20-25.SHAO Wei-lan,MAO Zhong-gui,XUE Ye-min.Expression of xylanase B gene of thermotoga maritima inEscherichia coli[J].2003,29:20-25.(in Chinese)

[5]劉亮偉,秦天蒼,劉新育,等.熱穩定性木聚糖酶結構模擬及分析[J].河南農業大學學報,2007,41:304-308.LIU Liang-wei,QIN Tian-cang,LIU Xin-yu,et al.Modelling and analysis of the structure of thermo stable xylanase[J].Journal of Henan Agricultural University,2007,41:304-308.(in Chinese)

[6]管維紅,徐振源,朱平.用非線性預測方法研究蛋白質序列的特性(Ⅱ)[J].食品與生物技術學報,2008,27(2):71-75.GUAN Wei-hong,XU Zhen-yuan,ZHU Ping.Nonlinear Prediction Analysis of Properties in protein sequences(Ⅱ)[J].Journal of Food Science and Biotechnology,2008,27(1):103-105.(in Chinese)

[7]ZHU Ping,TANG Xu-qing,XU Zhen-yuan.The structure analysis of protein sequence based on the quasi-amino acids code[J].Chinese physics B,2009,1:363-367.

[8]朱平,高雷,徐振源.基于擬氨基酸編碼方法下的同義密碼子的偏好性仍與結合強度密切相關[J].物理學報,2009,6:714-719.ZHU Ping,GAO Lei,XU Zhen-yuan.The usage degree of synonymous codon is close correlated with the strength of combination based on the quasi-amino acid coding[J].Acta Physica Sinica,2009,6:714-719.(in Chinese)

[9]石秀凡,黃京飛,柳樹群,等.人類基因同義密碼子偏好的特征以及與基因 GC含量的關系[J].生物化學與生物物理進展,2002,29:411-414.SHI Xiu-fan,HUANGJing-fei,LIU Shu-qun,et al.The features of synonymous codon bias and GC-content relationship in human gene[J].Prog Biochem Biophvs,2002,29:411-414.(in Chinese)

[10]楊瀟,胡軍,陳祥貴.人類蛋白編碼基因外顯子譜和同義密碼子偏好的研究[J].西華大學學報:自然科學版,2008,27.YABG Xiao,HU Jun,CHEN Xiang-gui.Study on the relationship between exonic pattern and codon bias of human protein-coding gene[J].Journal of Xihua University:Natural Science,2008,27(2):79-82.(in Chinese)

[11]顧萬君,馬建民,周童,等.不同結構的蛋白編碼基因的密碼子偏好性研究[J].生物物理學報,2002,18:81-86.GU Wan-jun,MA Jian-ming,ZHOU Tong,et al.Codon usage in genes coding for protein swith different tertiary structures[J].Acta Biophysica Sinica,2002,18:81-86.(in Chinese)

[12]LIU LW,ZHANGJ,CHEN B,et al.Principal component analysis in F/10 and G/11 xylanase[J].Biochem Biophys Res Commum,2004,322:277-280.

[13]Xie T,Ding D.The relationship between synonymous codon usage and protein structure[J].FEBS letters,1998,434:93-96.

[14]管維紅,徐振源,朱平.用非線性預測方法研究蛋白質序列的特性(Ⅰ)[J].食品與生物技術學報,2008,27(1):71-75.GUAN Wei-hong,XU Zhen-yuan,ZHU Ping.Nonlinear prediction analysis of properties in protein sequences(Ⅰ)[J].Journal of Food Science and Biotechnology,2008,27(1):71-75.(in Chinese)

猜你喜歡
編碼方法同義密碼子
密碼子與反密碼子的本質與拓展
until用法鞏固精練
可變摩擦力觸感移動終端的漢語盲文編碼設計
西夏文《同義》重復字研究
10種藏藥材ccmFN基因片段密碼子偏好性分析
西夏文《同義》考釋三則
毫米波大規模MIMO系統中低復雜度混合預編碼方法
茶樹CsActin1基因密碼子偏性分析
一種新的星載InSAR直接地理編碼方法
淺析公路工程物資的分類及編碼方法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合