?

基于RNA-seq技術的江鱈轉錄組SSR位點信息分析

2019-11-27 11:01蔣艷琳楊天燕周劍光
淡水漁業 2019年6期
關鍵詞:微衛星堿基核苷酸

孟 瑋,蔣艷琳,張 林,楊天燕,周劍光

(1.浙江省海洋水產研究所,浙江省海洋漁業資源可持續利用技術研究重點實驗室, 農業農村部重點漁場漁業資源科學觀測實驗站,浙江舟山 316021; 2.浙江海洋大學水產學院,浙江舟山 316022; 3.中國水產科學研究院長江水產研究所, 農業農村部水產品質量安全風險評估實驗室(武漢),武漢 430223)

江鱈(Lotalota)隸屬于鱈形目(Gadiformes)鱈科(Gadidae)江鱈屬(Lota),是鱈科魚類中僅有的生活在淡水中的珍稀經濟種,也是少數極地附近分布的魚類之一,具有較高的商業開發潛力和科學研究價值[1-2]。有關江鱈繁殖生物學領域的研究,目前國內學者已開展了其精子保存、胚胎和幼體發育、苗種培育和病害防治等方面的工作[3-7],近年來江鱈人工繁殖和飼養馴化技術也相繼在黑龍江[8]、新疆[9]、河北[10]、貴州[11]、北京[12]等省市獲得重大突破,但有關江鱈種質資源多樣性保護和良種選育方面的基礎性研究仍存在空白。

微衛星DNA又稱為簡單重復序列(SSR)、簡單序列長度多態性(SSLP)或短串聯重復序列(STRs),通常由1-6個堿基組成基本單元,呈串聯重復狀散布于真核生物基因組中的重復序列[13-14]。作為一種共顯性分子遺傳標記,微衛星技術具有多態性信息容量高、在基因組內分布廣泛且均勻、易于檢測等優點,已大量應用于魚類遺傳連鎖圖譜構建和QTL定位、個體識別和親本鑒定、種群遺傳多樣性分析和系統發育重建等領域[15-16]。關于江鱈SSR分子標記技術的研究,Sanetra等[17]于2005年首次構建了江鱈基因組富集文庫,并報道了21對多態性二核苷酸微衛星位點(CA)15和(CT)15信息。上述研究為江鱈遺傳學背景和分子標記開發提供了寶貴的基礎數據資料。然而,由于傳統方法開發SSR標記的數量較少且程序復雜,所能揭示的江鱈遺傳多樣性水平有限。近年來,以RNA-seq為代表的二代測序技術因具有效率高、速度快和通量大的優點,成為解決制約傳統分子標記開發方法瓶頸問題的有效手段,使得大規模開發微衛星標記成為現實。

本研究擬采用轉錄組測序RNA-seq方法,運用生物信息學方法挖掘江鱈微衛星標記,并探討其分布規律和組成特征,研究結果以期為開展江鱈遺傳多樣性以及系統分化分析、開發有效分子標記并進行輔助育種等提供寶貴資料。

1 材料與方法

1.1 樣品采集

研究用10尾江鱈于2019年3月采自新疆維吾爾自治區額爾齊斯河流域的布爾津河,剪取肝臟、腎臟和腦組織充分浸泡于RNAhold(北京Transgen生物)保存液中備用。

1.2 總RNA提取和cDNA文庫構建

取約100 mg組織,采用TRIzol法提取總RNA[18]。采用Nanodrop、Qubit 2.0、Aglient 2100方法分別檢測RNA樣品的純度、濃度和完整性符合要求后,將不同個體的組織樣品mRNA進行等量混合。采用美國Clonetech公司的SMART(Switching Mechanism At 5' end of the RNA Transcript)試劑盒構建cDNA文庫。文庫構建完成后,分別使用Qubit2.0和Agilent 2100方法對文庫濃度和插入片段大小進行檢測,使用Q-PCR方法對文庫的有效濃度進行準確定量,以保證文庫質量。

1.3 建庫測序和拼接組裝

基于Illumina Hiseq4000高通量測序平臺,測序讀長為PE150。對獲得的江鱈各組織混合樣本轉錄組Raw data進行過濾,去除接頭序列及低質量Reads后得到高質量Clean data。使用Trinity軟件[19]對序列進行組裝拼接得到轉錄本序列,所有測序讀段通過De novo組裝生成重疊群和單一序列。

1.4 SSR位點篩選

使用MIcroSAtellite identification tool(http://pgrc.ipk-gatersleben.de/misa/misa.html)軟件對江鱈轉錄組中Unigene 進行序列分析,搜索和鑒定簡單重復序列(SSR)。通過分析鑒定出6種類型的SSR:單堿基重復SSR、雙堿基重復SSR、三堿基重復SSR、四堿基重復SSR、五堿基重復SSR和六堿基重復SSR。按照Weber[20]提供方法將微衛星DNA核心序列的差異將其分為完美型、非完美型和混合型三種類型。

2 結果

2.1 江鱈轉錄組中SSR的分布及頻率

經過濾后的Reads片段進行質控,共得到20.78 Gb的Clean Data,平均GC含量為53.16%,且樣品Q30堿基百分比不小于87.91%。通過聚類、從頭組裝和拼接,獲得總長為7.49×107bp的Unigene共計106 084條,平均長度為706 bp。所有的Unigene中,共識別了17 619個SSR位點,包含SSR位點的Unigene序列數量為10 893條,占總Unigene的10.27%。其中,含有超過1個SSR位點的Unigene序列數量為4 427個,以復合形式存在的SSR 數量為1 208個。利用MISA軟件對篩選得到的1 kb以上的Unigene做SSR分析,結果見表1所示。

江鱈轉錄組中SSR含量較為豐富,一至六核苷酸重復類型均存在。不同類型SSR的比例差異較大,單核苷酸、二核苷酸和三核苷酸重復占總SSR位點數的98.71%。其中,單核苷酸重復類型的數量最多(7 102個),占總SSR位點數的40.31%;其次是二核苷酸和三核苷酸重復類型,分別為6 749個和3 540個,占總SSR 位點數的38.31%和20.09%;四、五、六核苷酸重復類型的數量很少,累計僅占總SSR 位點數的1.29%。江鱈轉錄組SSR位點的序列總長達到270 630 bp,其中不同核苷酸重復類型的SSR位點的堿基總長表現為二核苷酸>單核苷酸>三核苷酸>四核苷酸>六核苷酸>五核苷酸。SSR 位點的平均長度是15.36 bp,各類型SSR 位點的平均長度分別是13.72、15.99、16.99、21.05、30.00和44.00 bp(表1)。從分布情況看,江鱈轉錄組中平均約每4.25 kb就出現1個SSR。

表1 江鱈轉錄組SSR位點分布情況

注:比例:各核苷酸SSR在總SSR中所占比例;頻率:含有SSR的位點數目與總Unigene數目的比值;平均距離:Unigene總長度與SSR數目的比值。

江鱈轉錄組中鑒定出的SSR序列中,完美單堿基重復(p1)、完美雙堿基重復(p2)、完美三堿基重復(p3)、完美四堿基重復(p4)、完美五堿基重復(p5)和完美六堿基重復(p6)分布數量分別為148.07、134.91、75.26、4.40、0.09、0.28 Mb,其中p1和p2數量較多,p3次之,p5數量最少,每Mb長度的Unigene序列上僅有0.09個。

2.2 江鱈轉錄組中SSR位點重復單元類型與頻率特征

江鱈轉錄組中共檢測到236種不同基序序列類型的SRR位點,從單核苷酸重復到六核苷酸重復依次有4、16、60、124、8、24種類型。其中,單核苷酸A/T、G/C重復基序具有絕對優勢,分別占總SSR位點數的22.45%和13.05%;二核苷以AC/GT重復基序為主,所占比例為20.82%;三核苷酸重復中GGA/TCC重復基序數量最多,占總位點數量的4.11%;剩余幾種重復基元類型所包含的重復基序類型比例均較低。江鱈SSR位點重復單元分布出現頻率最多的單元是A/T(3 956個,占22.45%), 其次是G/C(2 300個,占13.05%),而五核苷酸、六核苷酸重復累計所占頻率僅為0.02%和0.07%(表2)。

在江鱈轉錄組SSR位點中,以10次重復次數最多,達2 788個位點,占總SSR位點的15.82%;其次為6次重復,位點個數為2 457,占總位點數的13.95%。統計5~12 次重復的SSR 位點共有11 823個,占總SSR位點的67.10%,13~24 次重復的SSR位點共有2 888個,占16.39%(圖1)。

3 討論

本研究基于高通量測序對江鱈轉錄組進行測定,一次性可開發微衛星位點高達17 000余個。通過統計分析發現,江鱈混合組織轉錄組中含有SSR位點的Unigene占10.27%,這一比例高于銀鯧(Pampusargenteus)[21],低于黃姑魚(Nibeaalbiflora)[22]。SSR評價分布距離4.25 kb,低于大鱗副泥鰍(Paramisgurnusdabryanus)6.99 kb[23],高于巨魾(Bagariusyarrelli)2.07 kb[24]。SSR的密度可能由多種因素影響,如SSR檢測標準,轉錄組結構和測序數據大小等。在重復序列中,單核苷酸重復(占比35.5%)的SSR為主要類型,其次為二核苷酸重復(32.29%)和三核苷酸重復(6.35%)。這與銀鯧(P.argenteus)[21]、黃姑魚(N.albiflora)[22]、銀鲴(Xenocyprisargentea)[25]等魚類的結果類似,但不同于牙鲆(Paralichthysolivaceus)[26]等以二核苷酸重復為主的魚類,這可能與重復序列的種屬特異性有關。在單核苷酸重復中,以A/T為主,在二核苷酸重復中,以AC/GT為主,與其它魚類結果一致[21-25]?;虻闹貜痛螖凳俏⑿l星多態性的重要指標,江鱈微衛星的重復次數介于5~24之間,重復次數為10的微衛星數量最多,隨著重復次數的增加,微衛星的數量慢慢下降。微衛星重復次數的變化,是微衛星序列在復制過程中滑移使得原序列長度擴增形成,可能在進化過程中受選擇壓力影響[27-28]。在結構基因中,這些重復次數的變化可能會引起基因的移碼突變,對基因的功能有重要影響,是進化遺傳研究中的一個重要的關注點。

表3 SSR主要重復單元的類型及分布比例

圖1 江鱈轉錄組中SSR重復次數分布圖Fig.1 Distribution of the repeats number of SSR repeats in L.lota transcriptome

SSR標記多態性的高低是判斷其可用性的重要依據,而SSR長度是影響其多態性的重要因素??傮w上來看,江鱈轉錄組SSR的片段長度從10~66 bp均有分布,大部分集中在10~24 bp,占SSR總數的87.24%。其中最大的片段長度為六核苷酸重復11次。根據Temnykh等[29]的研究,當SSR長度≥20 bp時出現多態性較高,長度在12~19 bp的SSR多態性中等,而當長度在12 bp以下時多態性極低。按照這一標準,將小于12 bp的SSR過濾掉以后,獲得具有中等多態性的SSR位點10 079個(比例為57.21%),具有較高的多態性的SSR位點3090個(比例為17.55%)。根據以上結果,推測本研究中江鱈轉錄組SSR多態性在中等以上。這與Dreisigacker等[30]研究發現高級基元SSR多態性普遍比低級基元的低這一結論相似。本研究通過轉錄組測序開發了大量候選江鱈SSR標記,種類豐富、可用性高、覆蓋整個基因組,研究結果可為這種珍稀冷水性魚類今后開展種質資源的保護、遺傳圖譜構建和人工輔助育種等研究提供理論基礎。

猜你喜歡
微衛星堿基核苷酸
單核苷酸多態性與中醫證候相關性研究進展
酰胺質子轉移成像和擴散峰度成像評估子宮內膜癌微衛星不穩定狀態
綠鰭馬面鲀全基因組微衛星分布特征
徐長風:核苷酸類似物的副作用
基于轉錄組西施舌微衛星標記開發及隱種鑒定
花斑無須鯰(Ageneiosus marmoratus)全基因組微衛星分布特征研究
應用思維進階構建模型 例談培養學生創造性思維
中國科學家創建出新型糖基化酶堿基編輯器
Acknowledgment to reviewers—November 2018 to September 2019
生命“字母表”迎來新成員
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合