?

2種果蠅(Drosophila melanogaster與D.sechellia)線粒體及NADH dehydrogenase subunit基因的密碼子偏好性分析

2018-05-14 08:59王鵬飛高歡歡蘇玲蔣錫龍吳新穎楊立英任鳳山王詠梅
安徽農業科學 2018年1期
關鍵詞:基因簇密碼子果蠅

王鵬飛 高歡歡 蘇玲 蔣錫龍 吳新穎 楊立英 任鳳山 王詠梅

摘要 [目的]分析2種果蠅( Drosophila melanogaster與D.sechellia )線粒體基因組及NADH dehydrogenase subunit基因的密碼子偏好性。[方法]利用CodonW1.4計算密碼子偏好性參數的相關參數。[結果]2種果蠅線粒體中蛋白編碼基因的AT含量比GC含量更高。 D.sechellia 的線粒體基因組的密碼子偏好性比黑腹果蠅 D.melanogastera 的線粒體基因組的密碼子偏好性略強。2種果蠅線粒體基因組中各蛋白編碼基因CDs中,RSCU值大于1的密碼子都是以A或U結尾,而并不以C或G結尾。2種果蠅線粒體基因組及NADH dehydrogenase subunit基因簇基因的密碼子偏好性都可能受到突變壓力影響。 D.melanogaster 線粒體基因組中不存在密碼子CGC。NADH dehydrogenase subunit 3基因的密碼子偏好性可能比其他NADH dehydrogenase subunit基因更高。此外,盡管大部分NADH dehydrogenase subunit基因偏愛使用A或U結尾的密碼子,但是在NADH dehydrogenase subunit 6基因中,有2個AU結尾的密碼子(AGA、GCA)的RSCU也為0。[結論]該研究結果為2種果蠅線粒體的進化研究提供了新觀點。

關鍵詞 果蠅;葡萄;線粒體;密碼子偏好性;NADH dehydrogenase subunit;RSCU

中圖分類號 S188文獻標識碼 A文章編號 0517-6611(2018)01-0096-06

Abstract [Objective]To analyze codon usage bias in Drosophila melanogaster and D. sechellia mitochondrion and NADH dehydrogenase subunit gene family. [Method] We calculated the related codon usage bias parameter using the software CodonW1.4. [Result] We found the AT content was higher than the CG content of the protein coding genes of the two kinds of fruit fly mitochondrion. The codon usage bias of D. sechellia mitochondrion was stronger than the codon usage of D. melanogastera . The codons whose RSCU was more than 1 end with “A or U” rather than end with “C or G” in the two kinds of fruit fly mitochondrion. The codon usage bias of NADH dehydrogenase subunit gene family of the two kinds of fruit fly mitochondrion may be affected by mutation pressure. D. melanogastera mitochondrion didnt contain the codon “CGC”. The codon usage bias of NADH dehydrogenase subunit 3 gene was stronger than other NADH dehydrogenase subunit gene family members. Additionally, though NADH dehydrogenase subunit gene family prefers using the codons end with “A or U”, the RSCU of codons AGA and GCA were both 0. [Conclusion] The study provided the new views for research of evolution of the two kinds of fruit fly mitochondrion.

Key words Fruit fly;Grape;Mitochondrion;Codon usage bias;NADH dehydrogenase subunit;RSCU

果蠅是一種體長約3 mm的小型昆蟲,屬于雙翅目(Diptera)、果蠅科(Drosophilidae),在全世界各地均有發現[1-2]。果蠅的生命周期短,但繁殖力極強[1],其主要以腐爛水果為食,對葡萄、櫻桃、楊梅等果樹的危害極大[3],果蠅也是葡萄酸腐病的主要傳播者。果蠅的種類很多,包括 Drosophila melanogaster(黑腹果蠅)、D.sechellia、D.pseudoobscura、D.nasuta、D.obscura、D.navojoa、D.suzukii(斑翅果蠅)等。目前公布的基因組包括D.melanogaster、D.sechellia、D.pseudoobscura、D.nasuta等20種,但是大多沒有拼接完全,且對于果蠅基因組的比較分析較少。 目前,D.melanogaster與D.sechellia 的線粒體基因組序列已經公布[4-6],這為果蠅線粒體(mitochondrion)基因組的比較分析提供了基礎。昆蟲的線粒體基因組與其他動物的線粒體基因組一樣,含有37個基因,其中蛋白編碼基因僅有13個,這13個基因中包括7個NADH dehydrogenase subunit基因,ATP合成酶基因 ATP6、ATP8,細胞色素氧化酶基因COX1、COX2、COX3等[7]。

蛋白編碼基因的密碼子包括64個三聯密碼子,這些三聯密碼子有的屬于同義密碼子,即可以編碼相同的氨基酸。這64種三聯密碼子一共可以編碼20種氨基酸。在基因組或基因中,不同同義密碼子的被使用頻率是不同的,這就是所謂的密碼子使用的偏好性[8- 9]。突變壓力(mutation pressure)和自然選擇(nature selective pressure)被認為是造成這種密碼子使用偏好性的2種最主要的原因[8]。1981年,Kimura[10]引入密碼子使用偏好性(codon usage bias)這一概念來衡量密碼子的使用頻率。如果編碼基因的密碼子使用偏好性與GC含量相關,則表明密碼子的使用偏好性受突變壓力影響[11-12];反之,則說明密碼子的使用偏好性是受自然選擇壓力影響的[13-14]。

目前,果蠅線粒體的密碼子偏好性及不同果蠅線粒體密碼子偏好性的比較工作尚未開展,而該工作將為果蠅線粒體的分子進化提供一點理論基礎。因此,對2種果蠅的線粒體基因組密碼子偏好性進行了分析,并對二者的線粒體密碼子偏好性進行了綜合比較。NADH dehydrogenase是由線粒體中各個亞基基因編碼的亞基組成的[15],在果蠅或其他昆蟲中,NADH dehydrogenase subunit基因家族是線粒體中最大的家族[7]。為了了解果蠅線粒體中NADH dehydrogenase subunit類基因的密碼子偏好性如何,并且比較所有的NADH dehydrogenase subunit基因的密碼子偏好性及其所受的選擇壓力,筆者研究了2種果蠅中NADH dehydrogenase subunit基因簇的密碼子偏好性,以及不同NADH dehydrogenase subunit基因的基因特異的密碼子偏好性,以期為2種果蠅線粒體的分子進化提供新觀點。

1 材料與方法

1.1 2種果蠅線粒體基因組數據的獲得

黑腹果蠅 D.melanogaster 的線粒體基因組及其蛋白編碼基因信息下載于NCBI genome database(https://www.ncbi.nlm.nih.gov/nuccore/NC_024511.2)。果蠅 D.sechellia 的線粒體基因組及其蛋白編碼基因信息來源于NCBI genome database(https://www.ncbi.nlm.nih.gov/nuccore/NC_005780.1)。

1.2 密碼子使用偏好性參數的計算

利用軟件CodonW1.4計算同義密碼子相對使用頻率(relative synonymous codon usage,RSCU),最優密碼子使用頻率(frequency of optimal codons,FOP),GC3s(GC3s為密碼子第3位GC含量),密碼子偏好指數(codon bias index,CBI),密碼子適應指數(codon adaptation index,CAI)等參數。

1.3 相關性分析

為了研究密碼子使用偏好性所受到的影響因素,筆者還分析了FOP、CBI、CAI與外顯子GC含量和外顯子GC3s的相關性。采用軟件JMP9.0(SAS Institute,Inc.,Cary,NC,USA)進行相關性分析,采用T-test 雙尾檢驗進行顯著性分析。

2 結果與分析

2.1 2種果蠅線粒體基因組的密碼子偏好性

結果顯示,2個果蠅線粒體基因組中都有13個基因,包括NADH dehydrogenase subunit1、2、3、4、4L、5、7基因, COX1~3,ATP6,ATP8以及CYTB, 且13個基因的排序是一致的。2個果蠅線粒體基因組中13個基因的CDs序列被用于計算密碼子偏好性指數。 D.melanogaster 的線粒體基因組中全部CDs的平均GC含量是21.53%,而全部CDs的平均GC3s(同義密碼子第3位GC)含量僅有5.2%。 D.sechellia 的線粒體基因組中全部CDs的平均GC含量是22.05%,而全部CDs的平均GC3s含量僅有7.97%。這2種果蠅線粒體中蛋白編碼基因的GC含量均低于50%,說明2種果蠅線粒體中蛋白編碼基因的AT含量更高。最優密碼子使用頻率(frequency of optimal codons,FOP)、密碼子偏好指數(codon bias index,CBI)、密碼子適應指數(codon adaptation index,CAI)等都是衡量密碼子偏好性的一些參數[16]。結果顯示 D.melanogaster 的線粒體基因組中全部CDs的FOP、CBI、CAI這3個指數分別略低于 D.sechellia 的線粒體基因組中全部CDs的FOP、CBI、CAI數值(表1)。這說明 D.sechellia 的線粒體基因組的密碼子偏好性比 D.melanogastera 的線粒體基因組的密碼子偏好性略為強烈。

為揭示密碼子使用偏好性是否受到突變壓力或者自然選擇的影響,分析了FOP、CAI、CBI與外顯子GC含量和外顯子GC3s含量的相關性。結果顯示,在 D.melanogaster 的線粒體基因組中,FOP與GC含量相關性并不顯著( P =0.71)。CAI,CBI與GC含量呈正相關(CAI與GC含量的相關系數 r=0.48,P <0.01;CBI與GC含量的相關系數 r=0.17,P <0.01)(表2)。FOP,CAI與GC3s含量呈正相關(FOP與GC3s含量的相關系數 r=0.30,P <0.01;CAI與GC3s的相關系數 r=0.66,P <0.01)。CBI與GC3s含量雖然是顯著正相關,但是相關系數較低( r<0.10,P <0.01)。

由表2可知,在 D.sechellia 的線粒體基因組中,FOP與GC含量相關性不顯著( P =0.48)。雖然CAI與GC含量呈顯著正相關,但是相關系數較低( r<0.10,P <0.01)。CBI與GC含量呈正相關( r=0.26,P <0.01)。FOP、CBI與GC3s含量呈正相關(FOP與GC3s含量的相關系數 r=0.30,P <0.01;CAI與GC3s的相關系數 r=0.65,P <0.01)。CBI與GC3s含量雖然呈顯著正相關,但是相關系數較低( r<0.10,P<0.01)。

在 D.melanogaster 的線粒體基因組中,27個密碼子的同義密碼子相對使用頻率(relative synonymous codon usage,RSCU)大于1。由圖1可知,這些RSCU值>1的密碼子都是以A或U結尾的。密碼子GCU(編碼丙氨酸)的RSCU值為3.17,是最大的,而密碼子AGC(編碼絲氨酸)的RSCU值為0.04,僅大于密碼子CGC(編碼精氨酸)。密碼子CGC的RSCU值為0,說明在果蠅 D.melanogaster 的線粒體基因組中,這個密碼子是沒有的,而密碼子GCU在果蠅 D.melanogaster 的線粒體基因組中的使用頻率最高,密碼子AGC的使用頻率最低。

在 D.sechellia 的線粒體基因組中,25個密碼子的RSCU大于1。與 D.melanogaster 的線粒體基因組相同,全部這些RSCU值>1的密碼子都是以A或U結尾的。密碼子UUA(編碼亮氨酸)的RSCU值為3.95,是最大的,而密碼子GGC(甘氨酸)的RSCU值為0.03,是最小的。密碼子UUA在果蠅 D.sechellia 的線粒體基因組中的使用頻率最高,密碼子GGC的使用頻率最低。

2.2 2種果蠅NADH dehydrogenase subunit基因簇的密碼子偏好性

在 D.melanogaster 的NADH dehydrogenase subunit基因簇中,只有ND4和ND4L是以ATG為起始密碼子。 D.melanogaster 的NADH dehydrogenase subunit基因簇中CDs的平均GC含量是18.57%,而CDs的平均GC3s(同義密碼子第3位GC)含量僅有4.46%,都低于線粒體基因組中全部CDs的平均數值。 D.melanogaster 的NADH dehydrogenase subunit基因簇中CDs的平均CBI值略高于線粒體基因組中全部CDs的平均數值,而FOP和CAI的平均值均略低于線粒體基因組中全部CDs的平均數值。在 D.sechellia 的NADH dehydrogenase subunit基因簇中,也只有ND4和ND4L是以ATG為起始密碼子。 D.sechellia 的NADH dehydrogenase subunit基因簇中CDs的平均GC含量是19.13%,而CDs的平均GC3s(同義密碼子第3位GC)含量僅有5.09%,都略低于線粒體基因組中全部CDs的平均數值。 D.sechellia 的NADH dehydrogenase subunit基因簇中CDs的平均FOP、CAI和CBI值都略低于線粒體基因組中全部CDs的平均數值,但是均略高于 D.melanogaster 的NADH dehydrogenase subunit基因簇中CDs的平均FOP、CBI和CAI值(表3)。

由表4可知,在 D.melanogaster 的NADH dehydrogenase subunit基因簇中,FOP、CAI、CBI與GC含量呈顯著正相關(FOP與GC含量的相關系數 r=0.77,P <0.01;CAI與GC含量的相關系數 r=0.58,P <0.01;CBI與GC含量的相關系數 r=0.76,P <0.01)。FOP、CAI、CBI與GC3s含量也呈正相關(FOP與GC3s含量的相關系數 r=0.35,P <0.01;CAI與GC3s含量的相關系數 r=0.41,P <0.01;CBI與GC3s含量的相關系數 r=0.30,P <0.01),但相關系數都不如其與GC含量的相關系數高。

在 D.sechellia 的NADH dehydrogenase subunit基因簇中,FOP、CAI、CBI與GC含量呈顯著正相關(FOP與GC含量的相關系數 r=0.70,P <0.01;CAI與GC含量的相關系數 r=0.44,P <0.01;CBI與GC含量的相關系數 r=0.69,P <0.01)。FOP、CAI、CBI與GC3s含量也呈顯著正相關(FOP與GC3s含量的相關系數 r=0.66,P <0.01;CAI與GC3s含量的相關系數 R=0.41,P <0.01;CBI與GC3s含量的相關系數 r=0.66,P <0.01)。

在 D.melanogaster 的NADH dehydrogenase subunit基因簇中,25個密碼子的同義密碼子相對使用頻率大于1。全部這些RSCU值>1的密碼子都是以A或U結尾的。密碼子CUG(亮氨酸)、CCG(脯氨酸)、CAC(組氨酸)、CGC(精氨酸)的RSCU值為0,說明在果蠅 D.melanogaster 的NADH dehydrogenase subunit基因簇中,這些密碼子不被使用。

在 D.sechellia 的NADH dehydrogenase subunit基因簇中,22個密碼子的RSCU值>1。與 D.melanogaster 的NADH dehydrogenase subunit基因簇相同,全部這些RSCU值>1的密碼子都是以A或U結尾的(圖2)。

2.3 果蠅中各類NADH dehydrogenase subunit基因的密碼子偏好性

比較果蠅中各類NADH dehydrogenase subunit基因的密碼子偏好性指數,結果顯示NADH dehydrogenase subunit 1基因的GC含量最高(21.8%),而NADH dehydrogenase subunit 6的GC含量最低(15.3%)。NADH dehydrogenase subunit 2基因的GC3s含量最高(16.7%),NADH dehydrogenase subunit 6基因的GC3s含量最低(2.9%)。NADH dehydrogenase subunit 1基因的FOP值最高(0.258),NADH dehydrogenase subunit 4L基因的FOP值最低(0.138)。NADH dehydrogenase subunit 3基因的CBI和CAI值最高(CBI=-0.213;CAI=0.138),NADH dehydrogenase subunit 4L基因的CBI和CAI值最低(CBI=-0.384;CAI=0.077)(表5)。

在NADH dehydrogenase subunit 1基因中,21個密碼子的同義密碼子相對使用頻率大于1。全部這些RSCU值>1的密碼子都是以A或U結尾的。20個密碼子的RSCU值為0,說明在果蠅的NADH dehydrogenase subunit 1基因中,這些密碼子不被使用,而這些密碼子都是以C或G結尾的。 在NADH dehydrogenase subunit 2基因中,25個密碼子的同義密碼子相對使用頻率大于1。全部這些RSCU值>1的密碼子都是以A或U結尾的。8個密碼子的RSCU值為0,這些密碼子都是以C或G結尾的。在NADH dehydrogenase subunit 3基因中,20個密碼子的同義密碼子相對使用頻率大于1。全部這些RSCU值>1的密碼子都是以A或U結尾的。23個密碼子的RSCU值為0,這些密碼子都是以C或G結尾的。在NADH dehydrogenase subunit 4基因中,24個密碼子的RSCU值>1。全部這些RSCU值>1的密碼子都是以A或U結尾的。10個密碼子的RSCU值為0,這些密碼子都是以C或G結尾的。在NADH dehydrogenase subunit 4L基因中,24個密碼子的RSCU值>1。全部這些RSCU值>1的密碼子都是以A或U結尾的。27個密碼子的RSCU值為0,這些密碼子都是以C或G結尾的。在NADH dehydrogenase subunit 5基因中,23個密碼子的RSCU值>1。全部這些RSCU值>1的密碼子都是以A或U結尾的。8個密碼子的RSCU值為0,這些密碼子都是以C或G結尾的。在NADH dehydrogenase subunit 6基因中,23個密碼子的RSCU大于1。全部這些RSCU值>1的密碼子都是以A或U結尾的。27個密碼子的RSCU值為0,這些密碼子中,除了密碼子AGA(編碼精氨酸)、GCA(編碼丙氨酸),其余都是以C或G結尾的(圖3)。

3 討論

研究顯示,2種果蠅線粒體基因組中各蛋白編碼基因CDs的FOP值與各蛋白編碼基因CDs的GC含量都不相關,FOP是最優密碼子的使用頻率。后面關于較為高頻密碼子(RSCU>1)[17]的分析結果顯示,2種果蠅線粒體基因組中各蛋白編碼基因CDs中,RSCU值大于1的密碼子都是以A或U結尾,而并不以C或G結尾。這可能是各蛋白編碼基因CDs的FOP值與各蛋白編碼基因CDs的GC含量都不相關。但密碼子偏好指數(CBI),密碼子適應指數(CAI)與GC含量呈正相關,說明2種果蠅線粒體基因組的密碼子偏好性可能受到突變壓力影響[11-12]。 在2種果蠅的線粒體基因組中,編碼全部20種氨基酸的密碼子都存在,但是64種密碼子中的CGC在 D.melanogaster 中是不存在的。 D.sechellia 線粒體基因組中含有全部64種密碼子,但是其高頻和低頻使用的密碼子與 D.melanogaster 是不一樣的。2種果蠅的高頻密碼子都偏好以A或U結尾,而不偏好使用C或G結尾。相反,很多低頻密碼子是以GC結尾的。在2種果蠅中,NADH dehydrogenase subunit基因簇基因的GC含量,GC3s含量以及其他密碼子偏好性指數均略低于各自線粒體基因組的GC含量,GC3s含量以及其他密碼子偏好性指數。但是,在2種果蠅中,NADH dehydrogenase subunit基因簇基因的FOP、CBI、CAI與GC、GC3s的相關性,都比線粒體全部蛋白編碼基因的FOP、CBI、CAI與GC、GC3s的相關性更高。這說明在2個果蠅中,NADH dehydrogenase subunit基因簇基因的密碼子偏好性都可能受到突變壓力影響[11-12]。 相比較只有1種密碼子CGC在 D.melanogaster 中線粒體基因組不存在,在黑腹果蠅的NADH dehydrogenase subunit基因簇基因中,很多GC結尾的密碼子是不被使用的。在不同的果蠅NADH dehydrogenase subunit基因中,NADH dehydrogenase subunit 3基因的CBI和CAI的平均值比其他NADH dehydrogenase subunit基因都高,而其平均FOP值也是第二高的。這說明NADH dehydrogenase subunit 3基因的密碼子偏好性可能比其他NADH dehydrogenase subunit基因更高[16]。此外,盡管大部分NADH dehydrogenase subunit基因偏愛使用A或U結尾的密碼子,但是在NADH dehydrogenase subunit 6基因中,有2個AU結尾的密碼子(AGA、GCA)的RSCU也為0。

參考文獻

[1] 萬永奇,謝維.生命科學與人類疾病研究的重要模型——果蠅[J].生命科學,2006,18(5):425-429.

[2] 林清彩,王圣印,周成剛,等.鈴木氏果蠅研究進展[J].江西農業學報,2013,25(6):75-78.

[3] 高歡歡,翟一凡,陳浩,等.斑翅果蠅和黑腹果蠅侵害的葡萄微生物多樣性的動態變化[J].應用昆蟲學報,2017,54(2):309-316.

[4]RUBIN G M,YANDELL M D,WORTMAN J R,et al.Comparative genomics of the eukaryotes[J].Science,2000,287(5461):2204-2215.

[5] SMITH C D,SHU S Q,MUNGALL C J,et al.The Release 5.1 annotation of Drosophila melanogaster heterochromatin[J].Science,2007,316(5831):1586-1591.

[6] CLARK A G,AGUADE M,PORCELLI D.Evolution of genes and genomes on the Drosophila phylogeny[J].Nature,2007,450(7167):203-218.

[7] 孫錚.昆蟲基因組密碼子使用及進化分析[D].泰安:山東農業大學,2009.

[8]HERSHBERG R,PETROV D A.Selection on codon bias[J].Annu Rev Genet,2008,42:287-299.

[9] PLOTKIN J B,KUDLA G.Synonymous but not the same:The causes and consequences of codon bias[J].Nat Rev Genet,2011,12(1):32-42.

[10] KIMURA M.Possibility of extensive neutral evolution under stabilizing selection with special reference to nonrandom usage of synonymous codons[J].Proceedings of the national academy of sciences of the USA,1981,78(9):5773-5777.

[11] CHEN S L,LEE W,HOTTES A K,et al.Codon usage between genomes is constrained by genome-wide mutational processes[J].Proceedings of the national academy of sciences of the USA,2004,101(10):3480-3485.

[12] KNIGHT R D,FREELAND S J,LANDWEBER L F.A simple model based on mutation and selection explains trends in codon and amino-acid usage and GC composition within and across genomes[J].Genome biology,2001,2(4):1-13.

[13] GHAEMMAGHAMI S,HUH W K,BOWER K,et al.Global analysis of protein expression in yeast[J].Nature,2003,425(6959):737-741.

[14] INGVARSSON P K.Gene expression and protein length influence codon usage and rates of sequence evolution in Populus tremula [J].Molecular biology and evolution,2007,24(3):836-844.

[15] HATEFI Y,RAGAN C I,GALANTE Y M.The enzymes and the enzyme complexes of the mitochondrial oxidative phosphorylation system[M]//MARTONOSI A.The enzymes of biological membranes.2nd ed.New York:Plenum Press,1985:1-70.

[16] GUO Y,LIU J,ZHANG J F,et al.Selective modes determine evolutionary rates,gene compactness and expression patterns in Brassica [J].Plant J,2017,91(1):34-44.

[17] SHARP P M,LI W H.The codon adaptation index:A measure of directional synonymous codon usage bias,and its potential applications[J].Nucleic Acids Res,1987,15(3):1281-1295.

猜你喜歡
基因簇密碼子果蠅
果蠅遇到危險時會心跳加速
2021年大櫻桃園果蠅的發生與防控
密碼子與反密碼子的本質與拓展
冬瓜高通量轉錄組測序及分析
小果蠅助力治療孤獨癥
基于改進果蠅神經網絡的短期風電功率預測
10種藏藥材ccmFN基因片段密碼子偏好性分析
腸球菌萬古霉素耐藥基因簇遺傳特性
海洋稀有放線菌 Salinispora arenicola CNP193 基因組新穎PKS 和NRPS基因簇的發掘
茶樹CsActin1基因密碼子偏性分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合