?

團頭魴高密度遺傳連鎖圖譜的建立及性別QTL定位

2021-04-21 07:59曹景龍王衛民
關鍵詞:團頭魴連鎖圖譜

曹景龍,王衛民

華中農業大學水產學院/農業動物遺傳育種與繁育教育部重點實驗室/農業農村部淡水生物繁育重點實驗室,武漢 430070

團頭魴(Megalobramaamblycephala),俗稱武昌魚,隸屬鯉形目(Cypriniformes)鯉科(Cyprinidae)魴屬(Megalobrama),是我國特有的草食性養殖經濟魚類。目前已有2個團頭魴新品種在全國推廣應用,年總產量近80 t。由于團頭魴生長快,肉質細嫩,營養價值高,深受廣大消費者的喜愛。然而團頭魴自然分布非常狹窄,主要分布在長江中下游及其附屬水體,其遺傳多樣性低,近親繁殖極易引起經濟性狀衰退[1]。各地團頭魴養殖群體先后出現了生長速度減慢、性成熟提早、抗逆性能降低、體型變薄和肉質品位下降等種質衰退現象,故開展團頭魴種質資源和遺傳改良相關研究勢在必行。

魚類的生長和生殖關系密切[2],許多重要的經濟性狀都在雌雄間表現出明顯的差異,了解此類魚的性別決定機制對于研究其性別控制育種至關重要。2015年梅潔[3]總結出14種養殖魚類雌性個體明顯大于雄性,例如:半滑舌鰨(Cynoglossussemilaevis)[4]、鯉(Cyprinuscarpio)、褐牙鲆(Paralichthysolivaceus)[5]和泥鰍(Misgurnusanguillicaudatus)[6]、大黃魚(Larimichthyscrocea)[7]等。有11種養殖魚類雄性個體顯著大于雌性,如黃顙魚(Pelteobagrusfulvidraco)和尼羅羅非魚(Oreochromisniloticus)[8]等。在傳統的養殖模式中,部分魚類雌雄個體生長速度不同,雌性較雄性個體性成熟早,進行繁育活動消耗大量的能量,導致其生長速度減緩以及影響群體均勻度[9]。通過調控此類魚類性別比例,實現單性化養殖,可避免魚類生長過程中因生殖活動而消耗能量,使吸收的營養物質主要在肌肉中沉積,提高魚體生長速度、肉質和經濟價值[10]。人工養殖條件下團頭魴1~2 a就可以達到性成熟,但是雌性團頭魴因為懷卵導致個體生長速度下降,抗應激能力下降,活魚運輸容易死亡。因此,了解團頭魴性別決定機制以及性別相關QTL的定位對團頭魴的性別控制育種具有重要意義。

性別控制育種需要準確判別親本的遺傳性別,但對于團頭魴群體,其兩性的外部形態差異不明顯[11],也沒有異形性染色體[12-13],依靠傳統方法無法根據外部形態或組織學觀察鑒定其遺傳性別,甚至無法準確地判別其表型(生理)性別,所以需要開發團頭魴的性別相關的分子標記,用以輔助性別控制育種。水產養殖動物的多數重要經濟性狀都是數量性狀,不僅由多個基因控制,且易受環境等因素的影響,例如性別、生長速度、肉質、抗病抗逆以及飼料的利用率等[14]。挖掘數量性狀位點(quantitative trait locus,QTL)的最終目的是利用與目標性狀緊密連鎖的分子標記進行分子標記輔助選擇育種(marker-assisted selection,MAS),從而促進對性狀的遺傳改良[15]。而要快速獲得與性狀相關的QTL位點,首先要構建高密度、高質量,且能覆蓋整個基因組的遺傳連鎖圖譜。

自1997年美國農業部啟動5種水產養殖動物基因組計劃以來,水產養殖動物的基因組研究取得快速進展,構建遺傳連鎖圖譜的水產動物種類和圖譜密度也在不斷增加[16]。在2014年時就已經有40多個水產養殖物種構建了遺傳連鎖圖譜,并繪制出超過20個水產養殖動物的重要經濟性狀的QTL位置[17]。近幾年,更多的水產養殖動物以及更加精確的遺傳連鎖圖譜也陸續被公布[18-21]。而團頭魴遺傳連鎖圖譜的研究起步較晚,發展緩慢。2000年,林紅[22]采取互為測交的遠緣雜交作圖策略及RAPD標記第一次構建了團頭魴的遺傳圖譜,該圖譜包含14個遺傳標記和4個連鎖群。2002年葛芹玉[23]在林紅研究的基礎上,采用遠緣雜交和單配子分型技術結合RAPD構建了團頭魴的遺傳圖譜,共獲得6個連鎖群,由21個標記組成。2017年,Wan等[24]構建出基于SNPs分子標記的團頭魴的高密度遺傳連鎖圖譜,14 648個高質量的SNP標記被成功分配至24個連鎖群。

本研究采用擬測交策略構建作圖群體,通過簡化基因組測序并參考筆者所在實驗室自行組裝的團頭魴第3代全基因組開發SNP標記,構建出團頭魴新一代高質量、高密度遺傳連鎖圖譜,對性別性狀進行了QTL定位,并在QTL的置信區間中篩選到一個性別相關的候選基因,以期為團頭魴性別分子標記輔助育種以及單性化養殖奠定基礎,從而進一步推動團頭魴的遺傳改良工作。

1 材料與方法

1.1 作圖群體

試驗選擇團頭魴“華海1號”[1]正常生長性成熟雌雄個體,采用擬測交策略構建F1代為作圖群體,本研究所有動物和實驗均按照國家科學技術委員會的《實驗動物管理條例》進行。于2016年在華中農業大學水產學院教學基地進行團頭魴的人工繁育,剪取父母本鰭條樣本,分裝于凍存管中用液氮速凍,24 h后轉至-80 ℃超低溫冰箱長期保存備用。繁殖后子代在此基地培育。子代1齡時,隨機抽取197尾子代個體,解剖檢測并記錄其生理性別,剪取個體鰭條,用95%乙醇固定后,于-20 ℃保存用于DNA提取。

1.2 DNA提取

采用醋酸銨法提取DNA樣本,方法步驟如下:

(1)剪取適當鰭條樣本,剪碎并放置于600 μL的組織裂解液中;(2)加入6 μL蛋白酶K(20 mg/mL),混勻;(3)放于65 ℃水浴鍋中水浴2~4 h,每隔15 min搖晃1次,或56 ℃過夜;(4)組織裂解后冷卻至室溫,加入200 μL醋酸銨(7.5 mol/L),混勻并放置冰上5 min;(5)4 ℃,12 000 r/min,離心10 min。取上清液500 μL至干凈的1.5 mL離心管;(6)4 ℃,12 000 r/min,離心10 min,轉移上清液于新離心管;(7)加入等體積約500 μL的異丙醇,輕輕搖動可見白色絲狀沉淀;(8)4 ℃,12 000 r/min,離心10 min,棄上清;(9)加入1 mL 70%乙醇,輕搖混勻,4 ℃,12 000 r/min,離心10 min,棄上清;(10)重復步驟(9),棄上清,干燥15 min;(11)加入50 μL或100 μL ddH2O,溶解DNA;(12)使用Nandrop2000 (Thermoscientific,美國)檢測DNA的濃度和質量,并用1%瓊脂糖凝膠電泳檢測完整性。提取合格的樣本DNA送至華大公司測序建庫。

1.3 文庫建立及群體SNP的篩選

本研究采用RAD測序方法,使用Hiseq2500(華大基因,中國)對199個樣本的DNA文庫進行測序。建庫成功樣本包含2個親本及197 F1子代個體。以筆者所在實驗室完成的第3代團頭魴基因組為參考挖掘SNP標記。首先對原始數據進行過濾處理,去除接頭污染和低質量reads,得到高質量的Clean data數據用于后續的比對分析。過濾采用華大自主研發的Soapnuke (華大基因,中國)軟件進行,具體過濾條件如下:(1)去除含有adapter的reads;(2)去除低質量reads(堿基質量值小于等于15的堿基占10%);(3)去除含N堿基的比例大于10%的reads。然后將過濾到的Clean data按照reads前段4~8 bp的barcode序列信息拆分為每個文庫數據,并去除barcode堿基,最后統計每個樣本的數據量。使用短序列比對軟件BWA(Version:0.7.12-r1039)的mem算法將Clean reads比對到參考基因組上,最后將每個樣本數據經過過濾和校正后,采用GATK 3.3.0和SAMtools 2.6.2兩個軟件對群體的SNP進行變異檢測,挖掘高質量SNP標記。

1.4 作圖SNP的篩選及注釋

接下來對適合構圖的分子標記進行篩選。SNP標記的基因型編碼根據遺傳學通用的二等位編碼規則,可分為8種分離模式(aa×bb、ab×cc、ab×cd、cc×ab、ef×eg、hk×hk、lm×ll、nn×np)。其中aa×bb僅適用于近交群體(如RIL、DH、F2等),其余標記適用于雜交群體(如CP)[25]。本研究作圖群體屬于CP群體,根據群體類型,對開發的標記進行如下篩選:

1)親本篩選:首先過濾掉親本中有缺失的位點,接著過濾掉親本都為純合的位點。

2)子代篩選:對于子代中的位點其GQ(genotype guality)<20的,標記為缺失;若子代為純合位點,其深度<4的標記為缺失;若子代為雜合位點,其深度<5的以及次等位堿基深度<2的都標記為缺失。

3)缺失率篩選:將材料與方法“1.4 2)”中得到的結果,進行缺失率篩選,將缺失率>10%的位點過濾,并且在1 kb的物理距離上只允許有1個marker存在。

4)卡方篩選:根據CP群體各類型標記的分離情況,我們用卡方檢驗過濾偏分離標記,在α=0.01水平進行卡方檢驗,最終獲得的標記用于遺傳圖譜的構建。

1.5 遺傳圖譜的構建

將上述過濾后的SNP標記,導入LepMap2.0軟件進行遺傳圖譜的構建。首先采用該軟件Filtering功能對標記進行進一步過濾,獲得可用的作圖標記。再采用該軟件的Separate Chromosomes功能進行連鎖群的劃分,將LOD值設置為10時,可將剩余標記分配至不同連鎖群,最后使用Order Markers功能計算各個連鎖群遺傳距離,最終獲得團頭魴的遺傳圖譜。

1.6 QTL定位及候選基因的篩選

根據第F1子代雌雄性狀的統計,結合得到的團頭魴高密度遺傳圖譜,采用MapQTL6.0分析軟件的多QTL區間作圖法(muliti-QTL mapping,MQM)對性別性狀進行QTL定位。具體方法為:

(1)按照CP群體類型分別整理性狀數據、連鎖群數據、樣品基因型數據成MapQTL6.0要求的格式,導入軟件。(2)對性別表型進行置換檢測(permutation test)檢驗,確定各表型在每個連鎖群上的LOD閾值。(3)選擇MQM mapping分析方法。 (4)根據顯著性閾值,對結果進行過濾,篩選出跟性狀顯著關聯的位點。(5)以LOD值3.0作為初始閾值,確定QTL數目及其在連鎖群上的位置。

QTL命名方法按照QTL+連鎖群+編號命名,其中QTL以大寫Q表示。統計QTL置信區間內包含的SNP標記,參考團頭魴第3代全基因組,對標記上下游500 kb進行基因篩選,并在NR數據庫內完成基因功能注釋。

2 結果與分析

2.1 原始數據的產出及SNP的篩選

研究共獲得1 863.65 Mb Reads數據,測序平均Q20為94.26%,平均Q30為89.69%,平均GC含量為37.51%,樣本GC分布正常。堿基識別結果顯示,各樣本Q30(即堿基測序準確率為99.9%以上)比例均在90%左右;利用堿基類型分布分析調查了AT、GC分離情況,結果顯示父本、母本和子代的GC含量分別為37.61%、37.62%和37.51%(表1)。

表1 各樣本測序數據統計Table 1 Summary of sequencing information

將得到的Clean date與團頭魴參考基因組序列進行比對,每個樣本數據經過過濾和校正后,采用GATK3.3.0和SAMtools 2.6.2兩個軟件對群體的SNP進行變異檢測,共獲得高質量SNP標記324 733個。SNP在基因組各染色體上的密度分布見圖1。

2.2 作圖SNP的篩選

群體變異檢測共得到SNP位點324 733個,根據通用的二等位基因編碼規則,對所得標記進行分型,本研究家系屬于CP作圖群體,選擇3種親本的多態性位點,使其對應3類基因型。雄性雜合與雌性純合編碼基因型為lm×ll,雄性純合和雌性雜合編碼基因型nn×np,雄性、雌性均雜合編碼基因型為hk×hk。通過親本篩選、子代篩選、缺失率篩選以及卡方篩選,最終獲得構圖標記10 809個,這些SNP中,轉換標記有6 328個,占58.54%;顛換標記有4 481個,占41.46%,轉換顛換之比為1.41(表2)。

表2 SNP標記類型與分類Table 2 SNP marker types and classification

2.3 遺傳圖譜的構建

以篩選到的10 809個SNP標記為基礎,采用LepMap2.0軟件的Filtering功能對所得SNP標記進行進一步過濾,最終共獲得10 795個作圖標記,被分配至24個連鎖群,與團頭魴單倍體染色體數目一致。該遺傳連鎖圖譜全長2 578.45 cM,包含10 795個SNP標記,包括3 703個雌性特異標記、3 947個雄性特異標記和3 145個共有標記,可整合為4 034個簇(Bin Marker),平均遺傳距離為0.24 cM(表3)。

表3 遺傳連鎖圖譜信息統計表Table 3 Information of genetic linkage map

24個連鎖群長度介于61.702 cM(LG24)至165.672 cM(LG14)之間,平均長度為107.439 cM,標記間平均遺傳間隔介于0.14 cM(LG7)至0.37 cM(LG14)之間。其中LG1上分布了最多的SNP標記(720個),該連鎖群長度為158.107 cM,相鄰標記間平均遺傳距離僅為0.22 cM;而LG24上分布了最少的SNP標記(216個),其長度為61.702 cM,相鄰標記間平均遺傳距離為0.29 cM。24條連鎖群的Max Gap長度介于2.546 cM(LG7)至54.066 cM(LG14)之間,而每個連鎖群中Gap <5 cM的平均比例為99.49%(介于98.12%至100.00%之間)。使用JoinMap 4.0 軟件繪制遺傳連鎖圖譜(圖2)。

圖2 團頭魴高密度遺傳連鎖圖譜Fig.2 The high-density genetic linkage map of M. amblycephala

2.4 性別相關QTL定位結果

利用軟件MapQTL6.0對團頭魴性別相關QTL進行定位。取LOD顯著閾值3.0進行分析,取97%的置信區間,即LOD峰值降低1時對應的區域。這樣共檢測到4個QTL。表4統計了團頭魴性別相關QTL的連鎖群位置、置信區間大小、區間內SNP標記名稱及數目、各標記的遺傳位置、LOD值和表型解釋率等信息。4個性別相關QTL分布于LG8、LG13、LG15、LG18連鎖群上,置信區間內共包含14個SNP標記,單個SNP位點的LOD值介于3.18~4.17,解釋表型變異介于5.1%~10%。根據QTL的定位信息,使用Map Chart2.2軟件繪制了團頭魴性別相關QTL在連鎖群上相對位置圖(圖3)。

表4 團頭魴性別QTL定位結果Table 4 Sex related QTL mapping results in M. amblycephala

圖3 性別QTL在遺傳連鎖圖譜上的位置Fig.3 The position of gender QTL on the genetic linkage map

2.5 性別相關候選基因的篩選

參考團頭魴的第3代全基因組信息,對QTL置信區間進行基因查找,共得到253個基因(Q-8-1區間包含132個基因、Q-13-1區間包含31個基因、Q-15-1區間包含22個基因、Q-18-1區間包含68個基因),在NR數據庫內完成基因功能注釋。通過基因功能分析,發現1個參與生殖過程的基因,該基因位于Q-13-1號QTL區間內,chr8-3076586號SNP位點附近,編號為TTF29452。將此基因序列在NCBI數據庫進行比對,注釋到了基因DCTN2。DCTN2全稱為動力蛋白激活蛋白2(p50)(dynactin 2 (p50)),參與微管形成,有絲分裂和細胞增殖以及細胞極性的建立和維持。此基因在斑馬魚、鯽和金線鲃(Sinocyclocheilus)等水產動物基因組中均有發現。此基因很可能是與團頭魴性別決定密切相關的關鍵候選基因。TTF29452基因序列信息見圖4。

圖4 TTF29452序列信息Fig.4 DNA sequence of TTF29452

3 討 論

遺傳圖譜被廣泛地應用于圖位克隆、目標基因定位、比較基因組和分子標記輔助育種等研究中,高密度、高質量的遺傳圖譜的構建是在基因組水平進行遺傳學研究的重要基礎。團頭魴遺傳圖譜的研究較少,已發表的圖譜屬于中低密度的遺傳圖譜,標記數目少,分辨率低,無法進行QTL的精準定位、分子標記的篩選和目標基因的定位。

遺傳圖譜的構建受到親本的多態性、作圖群體和作圖標記的影響。團頭魴達到性成熟需要1~2 a時間,世代周期長,建立近交群體難度較大。所以本研究在大規模的團頭魴養殖群體中,挑選性成熟度較好的雌雄個體作為親本,在保證了親本的基因信息多態性的同時,通過擬測交法構建F1子代群體為作圖群體,作圖群體構建簡單快速,滿足水產動物遺傳圖譜構建的要求。

簡化基因組測序能大幅降低基因組的復雜度,能夠低成本地開發大量的SNP位點,常用于遺傳變異檢測、高密度遺傳圖譜構建、重要性狀候選基因定位和群體遺傳進化分析。單核苷酸多態性(SNP)標記作為目前最具應用潛力的第3代分子標記,具有遺傳穩定性高、位點豐富且分布廣泛以及檢測快速、易實現自動化分析等特點,被廣泛地應用到遺傳圖譜構建、QTL定位和標記輔助選育等眾多方面。本實驗通過RAD-seq測序構建基因文庫,并開發SNP標記。最后得到1 863.65 Mb Reads數據,樣本Q30比例均在90%,測序深度分別為52.344×、56.002×和17.301×,表明此次測序質量較好。

通過篩選得到的324 733個高質量SNP標記,最終得到10 795個SNP標記,用以團頭魴遺傳連鎖圖譜的構建。該圖譜擁有24個連鎖群,連鎖群數目與團頭魴單倍體染色體數目一致,全長2 578.45 cM,平均長度為107.439 cM,標記的平均遺傳距離為0.24 cM,表明本研究構建的遺傳圖譜密度高,質量好且標記分布均勻。相對于團頭魴已經發表的遺傳連鎖圖譜,本研究構建的遺傳連鎖圖譜在連鎖群的完整度、標記數量、圖譜長度以及標記平均距離等方面均有所提升,是團頭魴現階段密度及質量最好的遺傳連鎖圖譜。

以團頭魴高密度遺傳圖譜為基礎,在LOD閾值>3.0下,共檢測到4個性別相關QTL。其中位于8號連鎖群上的QTL,Q-8-1區間峰值SNP標記chr11_21532086,LOD值最大為4.17。其表型解釋率為10%。雖然Wan等[24]對團頭魴性別性狀進行了QTL定位,但是其LOD值僅為2.18,表型解釋率為4%,相對其結果,本研究定位的QTL更加準確。

通過基因功能分析,在Q-13-1號QTL區間內,chr8-3076586號SNP位點附近,注釋到基因DCTN2(TTF29452)。該基因功能為細胞極性的建立和維持。DCTN2基因屬于動力蛋白激活蛋白(dynactin,DCTN)家族的亞基之一,DCTN是擁有的6個亞基的多亞基蛋白質,包括DCTN1、DCTN2、DCTN3、DCTN4、DCTN5和DCTN6。DCTN家族基因的研究主要集中于哺乳動物腫瘤的發生、癌細胞的病變等,在水產動物研究報道較少。根據已有的報道,DCTN家族已有2個亞基被發現可能參與性別形成過程:鄭波等[26]以小鼠精子為研究對象,向小鼠的生精小管內注射DCTN1的小干擾RNA(siRNA)進而干擾DCTN1的表達。3周后取附睪尾部精子進行形態學分析,發現注射DCTN1 siRNA 組的精子尾部畸形率明顯上升,說明DCTN1在精子變形中發生重要作用,影響了精子尾部的形成。魏敏[27]對半滑舌鰨的DCTN5基因進行了相關的功能研究。通過RACE-PCR獲得了DCTN5的2個轉錄本(DCTN5-tv1、DCTN5-tv2)。通過熒光定量PCR測定了2個轉錄本在性腺、肝、腦、鰓、皮膚、肌肉、腸、脾、腎、心臟、胃、鰭條12種組織中的表達水平。最后發現DCTN5-tv2主要在性腺中表達,在其他組織中表達量非常低,推測DCTN5-tv2可能參與性腺的發育和分化過程。本研究所篩選到的性別關鍵候選基因DCTN2是否參與團頭魴性別分化的具體過程,還需要進一步的驗證。

綜上,本研究所構建的高密度遺傳連鎖圖譜,篩選到的性別相關QTL位點、連鎖標記以及候選基因,為我們后續開展團頭魴的分子標記輔助育種、性別相關功能基因精細定位等研究提供了豐富的基礎資料和重要的理論依據。

猜你喜歡
團頭魴連鎖圖譜
繪一張成長圖譜
專注零售連鎖空間打造
庫里受傷的連鎖效應
布拉格Burrito Loco連鎖快餐店
補腎強身片UPLC指紋圖譜
八指魚
主動對接你思維的知識圖譜
團頭魴幼魚飼料中α-亞麻酸、亞油酸的適宜含量
雌核發育團頭魴的形態和遺傳特征分析
團頭魴生長相關基因在不同發育時期生長軸組織的表達分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合