?

棗轉錄組序列的微衛星特征分析

2015-12-20 05:49魏琦琦賈寶光李承想
中南林業科技大學學報 2015年6期
關鍵詞:微衛星堿基基因組

魏琦琦,林 青,賈寶光,吳 煉,李承想,張 琳

(中南林業科技大學 a. 經濟林培育與保護省部共建教育部重點實驗室;b. 林學院,湖南長沙 410004)

棗轉錄組序列的微衛星特征分析

魏琦琦a,b,林 青a,b,賈寶光a,b,吳 煉b,李承想a,b,張 琳a,b

(中南林業科技大學 a. 經濟林培育與保護省部共建教育部重點實驗室;b. 林學院,湖南長沙 410004)

運用Illumina測序平臺的RNA-seq技術對中秋酥脆棗的花、果實和棗吊進行了轉錄組測序,并對測序獲得的Unigene進行微衛星特征分析。經序列組裝和拼接,共獲得34 587個Unigene,運用Misa軟件分析發現12 624個微衛星。在所得轉錄組序列的單堿基至五堿基微衛星中,以單堿基微衛星最多(6 314個,50.02%),并以A/T(6 217個,98.46%)為主要重復單元;二堿基微衛星(3 335個,26.42%)次之,其中以AG/CT(2 532個,75.92%)類型最多;再次是三堿基微衛星(2 871個,22.74%);最后是四堿基和五堿基微衛星,二者僅占所有微衛星信息的0.82%。單堿基微衛星所占比例最多,為棗最優勢微衛星,而且其重復單元次數的變化明顯高于其他重復類型,表明單堿基在整個棗轉錄組中變異最為活躍。

棗;轉錄組測序;RNA測序;微衛星特征

棗Ziziphus jujubaMill.是我國重要的經濟林樹種之一,迄今已有7 000多年的栽培利用歷史,具有重要的經濟和生態價值[1]。棗果實營養價值高,亦可藥用,棗產業在我國經濟林果產業中發揮著重要作用。我國棗資源豐富,品種繁多,近年來國內外學者利用SSR、RAPD、AFLP等分子標記技術對棗的品種分類、鑒別以及遺傳多樣性方面開展了研究[2-4]。

SSR即為微衛星標記,是均勻分布于真核生物基因組中的簡單重復序列[5],由1~6個核苷酸的串聯重復片段構成,由于重復單位的重復次數在個體間呈高度變異性并且數量豐富,因此微衛星標記的應用非常廣泛。微衛星標記可鑒別雜合體和純合子,對隱性性狀的選擇十分有利。與其他分子標記相比較,SSR具有以下優點:(1)共顯性,能夠提供比顯性標記更多的信息;(2)位點豐富且隨機均勻地分布在整個基因組中;(3)以PCR為基礎,技術簡便,易于操作,重復性及穩定性好[6]。SSR具有影響轉錄、基因調節、蛋白質功能以及基因組構建等功能[7-8]。它具有比其它分子標記更多的可檢測等位基因,被公認為目前遺傳學研究中最令人信賴的分子標記之一。目前,在棗中開發了一些SSR標記,如馬秋月等[9]利用454高通量測序技術對棗(‘金絲小棗’)基因組進行了部分測序,在基因組水平上分析了棗微衛星的特點。

為進一步開發微衛星標記資源,本研究利用Illumina測序平臺的Hiseq 2000高通量測序技術對棗花、棗果實和棗吊進行了轉錄組測序,并對獲得的Unigene序列進行微衛星特征分析,以期為我國棗品種鑒別以及遺傳研究提供標記和序列資源。

1 材料與方法

1.1 植物材料

采集中秋酥脆棗的花、果實和棗吊作為實驗材料,迅速于液氮中冷凍后,在-80 ℃中保存。

1.2 文庫構建及轉錄組測序

采用Ambion試劑盒結合CTAB法提取各棗材料的總RNA,RNA等量混合后,構建cDNA文庫,而后用Illumina平臺的Hiseq 2000 RNASeq技術對棗的轉錄組進行測序,再對其測序數據進行處理與分析,采用Trinity軟件對clean reads進行組裝,通過序列之間的overlap信息組裝得到contig,再根據序列的paired-end信息和contig之間的相似性對contig進行聚類,然后在局部進行組裝得到轉錄本,最后從局部中挑選最長的轉錄本作為unigene。對于多樣品的組裝,由于后續的表達豐度、差異基因分析等內容均建立在同一套參考基因的基礎上,對樣品間得到的基因序列作進一步的聚類,整合得到對應這個物種的unigene數據庫。

1.3 轉錄組序列中微衛星的數據統計

采用MISA軟件對組裝獲得的Unigene序列進行微衛星特征分析,查找重復基元包括:單堿基≥10次,二堿基≥6次,三堿基≥5次,四堿基≥5次,五堿基≥5次,六堿基≥5次的重復序列。在統計各重復序列時,將基序的所有可能的+1移碼及其互補序列都視為同一個序列類型[10-11]。

2 結果與分析

2.1 轉錄組測序組裝結果及統計

轉錄組測序共獲得37 107 202條Clean Reads,對Clean Reads進行組裝拼接獲得2 098 231條contig序列。Contig序列長度主要分布在0~2 000 bp之間,其中以0~300 bp序列數量居多,約占總contig序列數量的98.63%,大于2 000 bp的序列數量約占總contig序列數量的0.2%。轉錄本(Transcript)長度主要分布在200~2 000 bp之間,在1 000~2 000 bp序列數量最多,約占總轉錄本數量的27.98%。(見表1)。

表1 中秋酥脆棗轉錄組組裝測序結果Table 1 Assembly sequencing results of transcriptome of Z.jujuba cv. ‘Zhongqiusucui’

組裝拼接獲得34 587條unigene,序列長度主要分布在200~3 000 bp范圍內,平均長度為953.25 bp,200~2 000 bp序列數量最多,占全部unigene序列數量的87.47%,2 000~3 000 bp的unigene序列有2 866條,占全部unigene序列數量的8.29%,大于3 000 bp的unigene序列有1 471條,占4.25%(見表2)。

2.2 微衛星類型及數目統計

使用Misa軟件,共發現12 624條微衛星重復序列,對棗轉錄組中單堿基至六堿基重復完整型微衛星和復合型微衛星進行分析發現,以完整型微衛星為主,共有10 453條,占總微衛星的82.8%,而復合型微衛星只有2 171條,占17.2%。在完整型微衛星中,單堿基完整型微衛星(5 076個,40.21%)最多,其次是二堿基完整型微衛星(2 788個,22.08%)和三堿基完整型微衛星(2 501個,19.81%),而四堿基和五堿基完整型微衛星最少(88個,0.7%)。本研究中未發現六堿基重復的微衛星(見圖1)。

表2 中秋酥脆棗的Unigene的長度統計Table 2 Numbers and proportions of Unigene of Z.jujuba cv. ‘Zhongqiusucui’ in different lengths

圖1 SSR類型及數目Fig.1 Types and numbers of microsatellite in SSR database

2.3 不同重復基序微衛星的頻率

在棗轉錄組微衛星數據庫中,共有12 624條微衛星序列。單堿基微衛星最多(6 314個,50.02%),并以A/T類型為主;其次是以AG/CT類型最多的二堿基微衛星(3 335個,26.42%);再次是三堿基微衛星(2 871個,22.74%);四堿基和五堿基微衛星最少,共有104個,只占所有微衛星信息的0.82%(見表3)。

表3 不同類型微衛星的頻率Table 3 Frequency of classified repeat SSRs

在對棗不同類型重復單元微衛星中各重復單元數量的變化情況的統計得出:在2種單堿基重復微衛星中,以A/T為最主要的重復單元,共有6 217個,占98.46%,而C/G只占1.54%(見圖2)。

圖2 單堿基微衛星的頻率Fig.2 Frequency of mononucleotide repeat SSRs

二堿基重復類型有4種(AC/GT、AG/CT、AT/AT和CG/CG),其中AG/CT重復的數量最多,共有2 532個,占總數的75.92%;其次是AT/AT(531個,15.92%);再次是AC/GT(271個,8.12%);而CG/CG只有一個(見圖3,封三)。

三堿基重復類型有10種,AAG/CTT重復的數量最多,共有1 070個,占37.27%;其次是ATC/ATG(375個,13.06%)和ACC/GGT(373個,12.99%);再次是AAC/GTT(260個,9.05%)、AAT/ATT(224個,7.8%)和AGG/CCT(220個,7.66%),其他重復堿基則相對較少(見圖4,封三)。

在18種四堿基重復類型中,以AAAT/ATTT重復數量為最多,共31個(33.33%),其次為AAAG/CTTT(21個,22.58%)(見圖5,封三)。

五堿基重復類型有9種,AAAAT/ATTTT重復數量最多,有3個,占27.27%(見圖6,封三)。

由分析結果知,棗的微衛星數量隨著重復次數增加而呈遞減趨勢,其中以單堿基微衛星最為明顯,二堿基微衛星次之,再次是三堿基微衛星,四堿基微衛星和五堿基微衛星重復次數最少。

3 結論與討論

(1)棗不同重復序列結構微衛星類型

高通量RNA-seq測序具有高精度、不需要參考基因組信息、低成本、應用范圍廣等優勢,尤其可為非模式植物轉錄組學的研究提供捷徑。本研究利用Illumina高通量測序技術對棗轉錄組進行測序,共獲得約2 098 231條contig序列和34 587個unigene序列。而后再對unigene數據庫得到的unigene序列進行SSR標記開發的分析。

按照微衛星重復序列結構的不同,將其分為完整型微衛星、不完整型微衛星以及復合型微衛星。完整型微衛星一般是由1種串聯重復序列以不間斷的重復方式構成的單一重復類型的微衛星;不完整型微衛星是指2個或2個以上的同種重復序列被3個或3個以下的非重復堿基分隔開;復合型微衛星指2個或2個以上的串聯核心序列被3個或者3個以上連續的非重復堿基所間隔,但這種連續性的核心序列重復數不得少于5[12]。

根據其重復序列結構的重復類型不同將微衛星重復序列進行分類,并對由此獲得的12 624條微衛星重復序列中單堿基至六堿基重復完整型和復合型進行分析得出:大部分為完整型微衛星,共有10 453條,占總微衛星的82.79%;而復合型微衛星只有2 171條,占總微衛星的17.2%。又針對完整型微衛星進行分析得出:以單堿基重復完整型微衛星為最多,其次是二堿基重復完整型微衛星,再次是三堿基重復完整型微衛星,四堿基和五堿基重復完整型微衛星最少,未發現六堿基。在棗的基因組序列微衛星特征研究中,六堿基重復微衛星出現的頻率(40.1%)明顯高于其他類型,之后依次為復合堿基(18.0%)、單堿基(17.1%)、四堿基(8.1%)、二堿基(7.5%)、三堿基(7.0%)、五堿基(2.2%)[9:83]??梢?,棗轉錄組比基因組低級基元頻率高,而高級基元比基因組的低。

(2)棗優勢重復堿基類型分析

本研究中,單堿基微衛星出現的頻率(50.02%)明顯高于其他類型,其次是二堿基微衛星(26.42%),再次是三堿基微衛星(22.74%),四堿基微衛星(0.74%)和五堿基微衛星(0.08%)最少。從基元重復次數來看,棗微衛星數量隨著重復次數增加而呈遞減趨勢,堿基重復次數越少,微衛星數量下降速率越快。其中以單堿基微衛星最為明顯,二堿基微衛星次之,再次是三堿基微衛星,四堿基微衛星和五堿基微衛星重復次數最少。單堿基微衛星集中在10~23次重復,二堿基微衛星是6~12次重復,三堿基微衛星是5~8次重復,四堿基微衛星是5~6次重復,五堿基微衛星僅集中于5次重復。通常認為SSR位點的變異頻率與基元重復數存在一定的正相關,即重復次數越多,SSR產生變異的可能性越大[13]。本研究中單堿基重復微衛星為棗最優勢微衛星,所占比例最多,而且單堿基微衛星重復單元次數的變化明顯高于其他重復類型,其次是二堿基微衛星,這在一定程度上說明單堿基在整個棗轉錄組中變異最為活躍。

(3)棗優勢重復單元堿基組成分析

在2種單堿基重復微衛星中,以A/T為最主要的重復單元;4種二堿基重復類型是AG/CT重復的數量最多,其次為AT/AT;10種三堿基重復類型中AAG/CTT重復的數量最多,其次為ATC/ATG和ACC/GGT,再次為AAC/GTT、AAT/ATT和AGG/CCT,其他重復堿基則相對較少;在18種四堿基重復類型中, AAAT/ATTT的重復數量最多,其次是AAAG/CTTT;五堿基重復類型有9種,AAAAT/ATTTT重復的數量最多。由此發現棗不同重復堿基類型優勢重復單元的共同特點是富含A和T堿基。不同植物中優勢重復單元不同:杜仲轉錄組微衛星中,出現頻率高的2個重復類型是AG/TC和CT/GA,其次是AC/TG和AGA/TCT[14];南方紅豆杉轉錄組中,出現頻率高的重復類型是AAG/CTT、AGG/CCT、AGC/CTG、ATC/ATG、AG/CT、AT/AT[15]。同一物種不同組織器官優勢重復單元不同:在茶樹轉錄組微衛星中占優勢的前3種重復類型是CT/AG 、TC/GA和AT/TA,其次是A/T[16];在茶樹花轉錄組中單堿基至六堿基重復單元中出現頻率最高的類型分別是A/T、AG/CT、AAG/CTT、AAAG/CTTT、AAAAT/ATTTT 和 AAAAAC/GTTTTT[17]。

在微衛星重復序列中,如CA、GA、GT等重復可以通過影響DNA的結構而影響DNA重組,因此微衛星中的重復單元堿基組成在很大程度上會影響生物的生命活動[18]。造成不同植物基因組中不同重復堿基類型及重復單元偏好性的原因除了與不同物種間的真實微衛星信息差異有關外,可能還與不同微衛星查找工具中的參數設置有一定關系[19]。

(4)微衛星技術在棗研究中的應用前景

微衛星序列廣泛分布于真核生物基因組的編碼區和非編碼區,通過對棗轉錄組中微衛星序列特征的分析,對開發大量高效的微衛星分子標記提供了重要的信息資源,另外對于在轉錄組序列中發掘的微衛星序列,它是具有基因功能的序列,有助于開發出棗的重要基因關聯的微衛星標記。本研究中所得到的棗轉錄組微衛星對以后該物種的進化、遺傳多樣性、棗品種的鑒別及分子標記輔助育種等方面的研究奠定基礎。

[1] 原勤勤, 文亞峰, 劉 儒, 等. 棗優良品種親緣關系的ISSR分析[J]. 經濟林研究, 2012, 30(1): 56-61.

[2] 王永康, 田建保, 王永勤, 等. 棗樹品種品系的AFLP分析[J]. 果樹學報, 2007, 24(2): 146-150.

[3] 智福君, 賈彥麗, 梁海永, 等. 利用RAPD技術進行棗樹的品種鑒定[J]. 華北農學報, 2009, 24(增刊): 110-114.

[4] 麻麗穎, 孔德倉, 劉華波, 等. 36份棗品種SSR指紋圖譜的構建[J]. 園藝學報, 2012, 39(4): 647-654.

[5] Mrazek J, Guo X, Shah A. Simple sequence repeats inprokaryotic genomes [J]. PNAS, 2007, 10(4): 8472-8477.

[6] 許靖詩, 烏云塔娜, 葉生晶, 等. 梨種質資源SSR引物的篩選與評價[J]. 中南林業科技大學學報, 2012, 32(7): 80-85.

[7] Kashi Y, King D G. Simple sequence repeat as advantageous mutators in evolution [J]. Trents in Gentic, 2006, 22(5): 253-259.

[8] Lawson M J, Zhang L. Patterns of SSR distribution in the Arabidopsis thaliana and rice genomes [J]. Genome Biology,2006, 7(2): R14.

[9] 馬秋月, 戴曉港, 陳贏男, 等. 棗基因組的微衛星特征[J]. 林業科學, 2013, 49(12): 81-87.

[10] Jurka J, Pethiyagoda C. Simple repetitive DNA sequence from primates: complication and analysis [J]. Joumal of Molecular Evolution, 1995, 40(2): 120-126

[11] Cardle L, Ramsay L, Miboume D,et al.Computional and experimental characterization of physically clustered simple sequence repeats in plants [J]. Genetics, 2000, 156(2): 847-854

[12] Weber J L. Informativeness of human (dC-dA) n’ (dG-dT) n Polymorphisms [J]. Genomics, 1990, 7(4): 524-530.

[13] Schl?tterer C. Evolutionary dynamics of microsatellite DNA [J].Chromosoma, 2000, 109(8): 365-371.

[14] 黃海燕, 杜紅巖, 烏云塔娜, 等. 基于杜仲轉錄序列的SSR分子標記的開發[J]. 林業科學, 2013, 49(5): 176-181.

[15] 李炎林, 楊星星, 張家銀, 等. 南方紅豆杉轉錄組SSR挖掘及分子標記的研究[J]. 園藝學報, 2014, 41(4): 735-745.

[16] 楊 華, 陳 琪, 韋朝領, 等. 茶樹轉錄組中SSR位點的信息分析[J]. 安徽農業大學學報, 2011, 38(6): 882-886.

[17] 王麗鴛, 韋 康, 張成才, 等. 茶樹花轉錄組微衛星分布特征[J], 作物學報, 2014, 40(1): 80-85.

[18] Biet E, Sun J S, Dutreix M. Conserved sequence preference in DNA binding among recombination proteins: an effect of ssDNA secondary structure [J]. Nucleic Acids Research, 1999, 27(2):596-600.

[19] 閻毛毛, 戴曉港, 李淑嫻, 等. 松樹、楊樹及桉樹表達基因序列微衛星比對分析[J]. 基因組學與應用生物學, 2011, 30(1):103-109.

Microsatellites characteristics of transcriptomic sequences fromZiziphus jujubacv. ‘Zhongqiusucui’

WEI Qi-qia,b, LIN Qinga,b, JIA Bao-guanga,b, WU Lianb, LI Cheng-xianga,b, ZHANG Lina,b
(a. Key Lab. of Cultivation and Protection for Non-wood Forest Tree Co-constructed by China Education Ministry and Hunan;b. College of Forestry, Central South University of Forestry and Technology, Changsha 410004, Hunan, China)

Transcriptome sequencing was conducted on fruits, fl owers, and bearing shoots of eliteZiziphus jujubacv. ‘Zhongqiusucui’by using Illumina-based RNA-seq technology. The microsatellites characteristics were then analyzed from the obtained unigenes. The assembled unigenes were totally 34 584, from which 12 624 microsatellites repeats were detected with Misa software. In the 1~5 bases repeat microsatellites, the mononucleotide repeat microsatellites (MNRs) were the maximum in quantitative terms (6 314, 50.02%), of which the A/T (6 217, 98.46%) was the main repeating MNRs; the next was the the dinucleotide repeat microsatellites(3 335, 26.42%), in which AG/CT was the most common DNRs(2 532, 75.92%); the third was trinucleotide repeat microsatellites(2 871,occupying 22.74%); the last was tetranucleotide and pentanucleotide repeat microsatellites( the least, accounting for 0.82% of the total microsatellites). It is concluded that the MNRs was the preponderance among Z. jujuba, and changes in the number of the MNRs repeat motifs was higher than the others, which indicates that the mononucleotide is the most active motif in the variation from theZ. jujuba’s transcriptome.

Ziziphus jujuba; transcriptome sequencing; RNA sequencing; microsatellite characteristics

S727.3;S665.1

A

1673-923X(2015)06-0093-05

10.14067/j.cnki.1673-923x.2015.06.017

2014-09-24

國家“十二五”農村領域科技計劃課題(2013BAD14B03)

魏琦琦,碩士研究生 通訊作者:張 琳,副教授,博士;E-mail: triwoodtim918@126.com

魏琦琦,林 青,賈寶光,等. 棗轉錄組序列的微衛星特征分析[J].中南林業科技大學學報,2015,35(6):93-97.

[本文編校:吳 彬]

猜你喜歡
微衛星堿基基因組
“植物界大熊貓”完整基因組圖譜首次發布
酰胺質子轉移成像和擴散峰度成像評估子宮內膜癌微衛星不穩定狀態
綠鰭馬面鲀全基因組微衛星分布特征
基于轉錄組西施舌微衛星標記開發及隱種鑒定
花斑無須鯰(Ageneiosus marmoratus)全基因組微衛星分布特征研究
牛參考基因組中發現被忽視基因
科學家找到母愛改變基因組的證據
應用思維進階構建模型 例談培養學生創造性思維
血清HBV前基因組RNA的研究進展
中國科學家創建出新型糖基化酶堿基編輯器
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合