?

牛場辣椒的全基因組SNP標記分析

2022-05-16 08:58黃冬福何建文江葉莎付文婷范高領詹永發石燕金王楠藝
種子 2022年4期
關鍵詞:牛場測序染色體

黃冬福, 何建文, 江葉莎, 付文婷, 范高領, 吳 迪, 詹永發, 石燕金, 王楠藝

(1.貴州省農業科學院辣椒研究所, 貴陽 550009; 2.遵義市農業農村局, 貴州 遵義 563000)

辣椒為茄科辣椒屬植物,有極大的利用價值,營養價值高可鮮食,是一種重要的調味品,富含的辣椒堿具有一定的藥用價值,辣椒紅素可用于食品及化妝品的著色。貴州六枝特區的牛場辣椒于2014年被認定為國家地理標志產品,具有果色深紅,肉厚,辣味適中,香氣濃郁等優異品質[1]。辣椒基因組上含有多種分子標記。在眾多的分子標記中,SNP(單核苷酸多態性)最重要且最具吸引力,其高水平的多態性、共顯性、高通量、豐富的信息量[2]廣泛用于作物育種中的遺傳多樣性分析、基因組關聯分析及比較基因組學[3-6]。

國內外研究者獲得了辣椒的大量SNP標記。Siddique等[7]對188個辣椒重組自交系個體和352個辣椒材料進行重測序,開發了666 405個SNP標記,結合經典的QTL定位和全基因組關聯分析,獲得了3個賦予疫病廣譜抗性的主效QTL。Wu等[8]對287個辣椒材料進行重測序,獲得了9 557 790個SNP,通過全基因組關聯分析,發現調控26個辣椒農藝性狀的2 126個候選基因。Wang等[9]對辣椒不育系和保持系的線粒體基因組測序,獲得了兩者間的112個SNP,結合已知的CMS(細胞質雄性不育)基因特征,篩選出2個最有可能決定CMS的ORF。Han等[10]對208份辣椒材料進行重測序,開發了109 610個SNP標記,發現99個SNP與辣椒素顯著關聯。孫茜[11]對辣椒抗感黃瓜花葉病毒(CMV)的基因池進行重測序,獲得了51 969 152個SNP標記,結合關聯分析和經典的QTL定位,發現了抗CMV的1個主效QTL和2個微效QTL。趙紅[12]對349份國內辣椒核心種質進行重測序,平均每份種質獲得了7 425 498個SNP,通過全基因組關聯分析,發現94個SNP與果實辣味等20個性狀顯著關聯。

就目前的研究來看,各研究者開發了大量辣椒SNP標記,但是所用品種沒有涉及牛場辣椒,而利用已有的SNP標記重新篩選牛場辣椒特異的SNP費時費力且無法保證數量與質量。另外,各研究者開發SNP采用的是簡化基因組測序法,基于此法開發的SNP無法覆蓋全基因組,SNP的數量及密度遠不如全基因組測序法。因此,本研究利用全基因組重測序分析牛場辣椒的SNP標記,為牛場辣椒遺傳圖譜構建、重要農藝性狀基因挖掘、遺傳改良、品種鑒定與保護奠定基礎。

1 材料與方法

1.1 材 料

牛場辣椒(CapsicumannuumL.),2014年被農業部認定為地理標志農產品,由貴州省辣椒研究所保存。取苗期的葉片用于全基因組重測序。

1.2 基因組DNA提取與DNA質量檢測

采用DNA secure Plant Kit(TIANGEN)試劑盒提取基因組DNA;1%瓊脂糖凝膠電泳檢測DNA是否降解和污染;NanoPhotometer?spectrophotometer (IMPLEN, CA, USA)檢查 DNA 純度;使用2.0 Flurometer (Life Technologies, CA, USA)檢測DNA 濃度。

1.3 測序文庫構建

分別取檢測合格的DNA 樣品700 ng,通過Covaris破碎機打斷成長度為350 bp的片段,使用NEB Next?Ultra DNA Library Prep Kit(NEB, USA)構建文庫,并將index codes添加到每個測序樣本中。使用AMPure XP系統(Beckman Coulter,Beverly,USA)純化DNA,DNA片段的3′末端腺苷酸化后,連接具有發夾環結構的NEB下游銜接子以準備雜交;PCR反應前使用電泳來選擇指定長度的DNA片段,在USER酶(NEB,USA)的作用下,37 ℃ 15 min、95 ℃ 5 min;然后用Phusion High-Fidelity DNA聚合酶、Universal PCR引物和Index(X)引物進行PCR, PCR產物用AMPure XP系統進行純化。文庫構建完成后,先使用Qubit 2.0軟件進行初步定量,稀釋文庫至1 ng/μL,隨后使用Agilent Bioanalyzer 2100軟件對文庫的insert size進行檢測,insert size符合預期后,使用Q-PCR方法對文庫的有效濃度進行準確定量(文庫有效濃度>2 nmol/L),保證文庫質量。

1.4 全基因組測序和質量控制

利用Illumina HiSeq 2000平臺進行全基因組測序,測序生成的原始圖像數據文件經堿基識別轉化為原始測序序列(Illumina pipeline CASAVA v 1.8.2),然后通過質量控制去除以下不能用的reads,且兩端reads均去除:

1) 帶文庫構建接頭的reads;

2) 未知堿基超過10%的reads;

3) 低質量堿基(測序質量值≤5)超過50%的reads。

1.5 序列比對

質控后的有效測序數據經BWA軟件比對到參考基因組(https://www.ncbi.nlm.nih.gov/genome/10896,v1.0),比對結果經SAMTOOLS和PICARD軟件(http://picard.sourceforge.net)去除重復。

1.6 變異檢測及注釋

設定參數(-q 1-C 50-m 2-F 0.002-d 1000),用samtools軟件檢測原始的SNP,然后用如下標準進行過濾:

1) 變異位置的測序深度>4;

2) 質量值>20。

用ANNOVAR軟件對SNP進行變異注釋。

2 結果與分析

2.1 測序數據產出及與參考基因組比對分析

由表1可知,經過全基因組重測序,共獲得785 408 260條Raw reads,平均讀長150 bp,堿基總長為117.8 Gb;通過質量控制去除帶接頭的reads、未知堿基超過10%的reads以及低質量(Q值≤5)堿基數超過50%的reads,得到高質量的clean reads;clean reads共有783 349 390條,覆蓋98.23%的基因組;去除clean reads中的非特異reads,獲得771 948 477條有效reads,其中758 748 158條reads能錨定到“遵辣1號”參考基因組上,配對率為98.29%,平均測序深度為36.35×。

表1 牛場辣椒測序數據產出及與參考基因組比對情況Table 1 The sequencing data of Niuchang pepper and the result compared with the reference genome

2.2 染色體上SNP的分布規律和特征

根據與參考基因組的比較,SNP分為純合和雜合類型,分別占SNP總數的59.12%、40.88%。每條染色體上的SNP總數不同,10號染色體上SNP總數最多(1 371 387個),4號染色體上SNP總數最少(349 894個)。每條染色體上純合和雜合SNP的數量也不同, 10號染色體上的純合SNP最多(889 193個),9號染色體上的純合SNP最少(169 010個),9號染色體上的雜合SNP最多(779 326個),4號染色體上的雜合SNP最少(93 614個),具體見表2。

每條染色體上密度最高區域SNP出現頻率不同,10號染色體上密度最高區域SNP出現頻率最高(1 904個/100 kb),4號染色體上密度最高區域SNP出現頻率最低(1 162個/100 kb),具體見表3和圖1。

表2 每條染色體上SNP的數量Table 2 The number of SNP on each chromosome

表3 每條染色體上SNP密度最高區域及其出現頻率Table 3 The frequency of SNP in highest SNP densityarea of chromosomes

2.3 基因組不同位置SNP分布特征

牛場辣椒基因組中的SNP分布在5個不同位置:基因上游、基因內、基因下游、基因上游/下游、基因間。(基因上游是指基因上游1 kb區域;基因內指基因內部;基因下游指基因下游1 kb區域;基因上游/下游指基因上游1 kb區域,同時也在另一基因的下游1 kb區域;基因間指兩個基因間區)。5個不同位置的SNP數量不同且差異顯著,SNP數量從多到少依次為基因間>基因內>基因上游>基因下游>基因上游/下游(表4),基因間、基因內、基因上游、基因下游的SNP占比依次為94.68%、3.64%、0.9%、0.74%(圖2)。

基因內不同位置所含SNP數量也不同,基因內包含外顯子、內含子、剪接位點3個位置,所含SNP數量分別為51 242、281 002、288個,SNP數量從多到少依次為內含子、外顯子、剪接位點。針對外顯子區域,根據SNP變異引起的密碼子變化, 可將SNP分為4種類型:終止子獲得、終止子缺失、同義突變、非同義突變,數量分別為710、188、19 079和31 265,SNP數量依次為非同義突變>同義突變>終止子獲得>終止子缺失。

圖1 每條染色體上的SNP密度熱圖 Fig.1 The density heat map of SNP on each chromosome

圖2 牛場辣椒基因組中不同位置的SNP數量差異Fig.2 The number difference of SNP on the different position in the genome of Niuchang pepper

表4 牛場辣椒基因組中SNP的位置及相應數量Table 4 The position and corresponding number of SNP in the genome of Niuchang pepper

2.4 SNP突變頻譜

全基因組SNP突變可分為6類:T∶A>G∶C,T∶A>C∶G,T∶A>A∶T,C∶G>T∶A,C∶G>G∶C和C∶G>A∶T。以T∶A>C∶G為例,此種類型SNP突變包括T>C和A>G。由于測序數據既可比對到參考基因組的正鏈,也可比對到參考基因組的負鏈,當T>C類型突變出現在參考基因組正鏈上,A>G類型突變即在參考基因組負鏈的相同位置,所以將T>C和A>G劃分成一類。C∶G>T∶A的數量最多(3 109 688個),C∶G>G∶C的數量最少(474 542個)。T∶A>G∶C、T∶A>A∶T、C∶G>G∶C、C∶G>A∶T為顛換,總數為3 057 408個,T∶A>C∶G及C∶G>T∶A為轉換,總數為6 094 214個,發生轉換的數量是顛換的1.99倍(圖3)。

圖3 SNP突變頻譜Fig.3 The mutation frequency and type of SNP

3 討論與結論

3.1 基于WGRS技術開發辣椒SNP標記的高效性

辣椒全基因組序列的公布為其分子育種帶來前所未有的機遇。想要開展辣椒分子育種,就必須對群體中所有個體進行基因分型。利用傳統方法對辣椒進行基因分型費用高、耗時耗力,低水平的分子標記也是基因分型的重要挑戰?;谛乱淮鷾y序技術(NGS)的基因分型通量高、成本低、分子標記密度高。

全基因組重測序(WGRS)是新一代測序技術(NGS)的一種。利用WGRS技術開發分子標記具有標記密度大、有效標記多、準確率和特異性高、穩定性好的優勢。本研究利用WGRS技術共鑒定出9 141 358個SNP,SNP的出現頻率為1個/366 bp,其中51 242個SNP位于外顯子。Ahn利用WGRS技術獲得了6 840 889個辣椒SNP,其中39 955個SNP位于外顯子[13]。

相比而言,利用簡化基因組測序開發SNP標記的效率較低。Nimmakayala等[14]利用簡化基因組測序僅獲得66 960個辣椒SNP,SNP的出現頻率為1個/40.7 kb,其中僅有2 521個SNP位于外顯子。Nimmakayala等[15]采用簡化基因組測序獲得77 407個辣椒SNP,SNP的出現頻率為1個/35.6 kb,其中26 697個SNP位于外顯子。由此可見,利用WGRS獲得的SNP標記數量、出現頻率、外顯子上的SNP數量遠高于簡化基因組重測序[14-15]。

功能標記是分子標記的一種,基于功能基因內的多態序列開發,與常規的分子標記相比,與表型的連鎖程度更緊密[16],外顯子上的SNP最可能作為功能標記。因此,通過檢測功能標記能更準確地預測表型,在加速育種進程的同時極大地提高了標記輔助選擇的準確性。本研究獲得的51 242個外顯子SNP作為潛在的功能標記,將成為辣椒分子育種的有力武器。

3.2 牛場辣椒SNP標記分布特征

SNP在牛場辣椒基因組上的分布表明,基因間的SNP數量比基因內多,是基因內的26倍,內含子區域的SNP數量比外顯子多,是外顯子區域的5.5倍,這種分布規律與Kim等[17]的研究結果相似。外顯子上,SNP引起的終止子獲得有710處,終止子獲得是指堿基突變導致終止密碼子提前出現。其產生截短的蛋白質,從而使基因散失原來的功能,并進一步引發作物表型變異。因此,終止子獲得對基因功能研究具有重要意義。AFS1基因發生5 bp缺失及G/A轉換,翻譯提前終止,導致水稻小穗異常,小穗上多出一個外稃狀器官,內稃發生不同程度的退化[18]。GmSG基因發生A/G轉換,翻譯提前終止,導致大豆種皮顏色由黃色轉變為黃/綠色[19]。SNFL1基因單內含子上最后一個堿基發生單核苷酸突變,翻譯提前終止,導致水稻旗葉變短變窄[20]。OsCUL 3 a蛋白翻譯提前終止,導致水稻flg 22、幾丁質誘導的活性氧、發病相關基因的表達量明顯增加,進而產生類病斑[21]。

本研究發現,牛場辣椒10號染色體上的SNP數量最多,且18.17%的純合SNP位于該染色體上,4號染色體上的SNP數量最少,與Nimmakayala[15]的研究結果不同,Nimmakayala的研究顯示辣椒3號染色體上SNP數量最多,9號染色體上SNP數量最少,與Ahn[13]的研究結果也不同,Ahn的研究顯示辣椒品種PRH 11號染色體上SNP數量最多,8號染色體上SNP數量最少。造成不同染色體上SNP分布頻率差異的原因可能是不同研究者使用的辣椒品種不同。

SNP引起的點突變可分為轉換和顛換?,F有研究表明,人類基因組CpG中的胞嘧啶C能自發脫氨基變成胸腺嘧啶T,導致C∶G>T∶A的轉換比T∶A>C∶G的轉換多,同時,轉換比顛換更容易發生,且轉換的SNP是顛換的2倍[22]。牛場辣椒C∶G>T∶A的轉換比T∶A>C∶G的轉換多,且轉換的SNP數量明顯高于顛換,是顛換的1.99倍,與前人的研究結果基本一致。

本研究對牛場辣椒進行全基因組重測序,獲得了9 141 358個SNP,SNP的出現頻率為1個/366 bp,展示出WGRS技術開發辣椒SNP標記的高效性;其中51 242個SNP位于外顯子上,外顯子上的SNP具有開發成功能標記的巨大潛力,功能標記與表型的連鎖程度更緊密,能極大地提高標記輔助選擇的準確性,是辣椒分子育種的有力武器;外顯子上的SNP產生了710處終止子,終止子獲得會產生截短的蛋白質,使基因散失原來的功能,并進一步引發作物表型變異,對基因功能研究具有重要意義。

猜你喜歡
牛場測序染色體
新一代高通量二代測序技術診斷耐藥結核病的臨床意義
宏基因組測序輔助診斷原發性肺隱球菌
洛絨牛場
洛絨牛場
星星·詩歌原創(2021年10期)2021-11-04
生物測序走在前
基因測序技術研究進展
多一條X染色體,壽命會更長
為什么男性要有一條X染色體?
規?;雠H旱慕Y構及防疫要求介紹
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合