?

三維基因組學概述及其在家畜生物育種方面的研究進展

2022-04-07 01:12任妍妍趙楊楊張子敬付長其田全召王二耀雷初朝黃永震
中國牛業科學 2022年6期
關鍵詞:染色質基因組位點

任妍妍,彭 巍,劉 賢,趙楊楊,張子敬,付長其,張 君,田全召,王二耀,雷初朝,黃永震*

(1.西北農林科技大學動物科技學院,陜西 楊凌 712100;2.青海省畜牧獸醫科學院,青海大學,西寧 810016;3.河南省畜牧總站,鄭州 450008;4.河南省鼎元種牛育種有限公司,鄭州 450000;5.河南省農業科學院畜牧獸醫研究所,鄭州 450002)

在過去20年,人類、小鼠、牛、羊等先后完成了基因組圖譜繪制,我們對核苷酸編碼的一維DNA分子有了深入了解,但哺乳動物的DNA線性長度可長達2 m,它是如何存在僅有10 nm左右的細胞核內的呢?早期的二維線性基因組不能解釋基因的調控元件是如何與距離它們幾萬甚至十幾萬個核苷酸的靶基因相互作用。研究發現,染色體的多級高度折疊和纏繞是以核小體為基本單位進行的,形成動態的復雜空間結構,在僅有10 nm左右的細胞核中折疊,其在空間中的有序折疊,在調節基因表達中起著重要作用。許多研究表明,原本線性距離非常遠的調控因子可以通過染色質拓撲結構達到空間上的近距離調控。細胞核中染色質的存在位置不是無序的,而是受精密的調控,它們之間有千絲萬縷的聯系,并且其存在方式和位置都對基因表達調控起著重要的作用。隨著染色質捕獲技術的發展,染色質三維結構逐漸被揭示,按照結構單元大小和分辨率被分為4個層級:染色質疆域(chromosome territories,CTs)、染色質區室(chromatin compartments)、拓撲關聯結構域(topologically associated domains,TADs)、染色質環(chromatin loops,CLs)。對三維基因組的研究能更好地探究基因間的互作機制以及染色質的空間結構對動物生長發育的作用。

1 三維基因組的結構單元

1.1 染色質疆域

細胞核內的每條染色質相對獨立,不同染色質僅在邊界有重疊,而且能與其他染色質發生相互作用的區域稱為染色質疆域(chromosome territories,CTs)。染色質疆域是最早被發現的基因組空間結構,早期細胞學家通過顯微鏡和熒光原位雜交技術對大量動、植物,微生物細胞進行了研究,發現染色質并非隨機分布在細胞核中,而是具有一定的結構和規律,不同染色質占據不同的空間[1]。CT在細胞核內的分布與染色質大小、基因密度、轉錄活性等有關?;蛎芏雀?,轉錄相對活躍的染色質在細胞核中通常位于更中心的位置;而低基因密度的染色質通??拷毎说倪吘塠2]。在同一CT中,基因富集和轉錄活躍區域的DNA片段更頻繁地定位于CT的邊界處[3]。越來越多的證據表明,不同的染色質疆域只在其邊界處發生重疊[4],且重疊的染色體之間存在相互作用,使得與遺傳疾病相關的染色體間易位成為可能。

1.2 染色質區室

2009年,Lieberman Aiden等[5]首次利用Hi-C技術揭示了染色體內部基因組區域之間具有明顯的相互作用,并將基因組區分為兩個相對分隔的A區室和B區室。A/B區室代表開放和關閉兩種不同狀態的染色體區域(chromatin compartments),A Compartment是轉錄激活區,與基因富集區域、常染色質和轉錄活躍區域相關,表觀遺傳修飾標記更為富集,如DNaseⅠ高敏位點和組蛋白H3K4me3等;B Compartment與基因沙漠、異染色質和轉錄抑制區域相關,富集更多的抑制性組蛋白標記,如H3K27me3[6]。染色質間的相互作用更多發生在同一個區室內的位點之間。在細胞核中,染色質的空間分布不是隨機的,通常與細胞核結構有關,A區室通常位于細胞核內部,B區室主要定位于周圍的核纖層和核仁附近。最近有研究提出,通過分子模擬A/B區室的形成是經由染色質片段相分離過程:當一段染色質結合在核纖層或其它核小體上時,與之相同狀態的其他染色質也會隨之結合進而引發相分離,形成A/B區室[7]。有研究發現[8],在細胞分化成熟的過程中往往伴隨部分染色質區段的A/B區室轉變。在T細胞分化成熟過程中,其基因組A/B分區持續發生轉變,其中57.6%由B區室轉變為A區室,37.4%由A區室轉變為B區室,僅4.9%的區域在A/B分區上的存在反復。

1.3 拓撲關聯結構域

2012年5月,Job Dekker團隊[9]在小鼠失活的X染色體中心發現了大小介于200 kb~1 Mb之間的一系列離散的拓撲關聯結構域(topologically associated domains,TADs)。當Hi-C互作圖譜的染色質分辨率提高到40 kb或更高時,在互作熱圖上高度自我相關的染色質區域表現為大小不一,具有明顯間隔的“三角形”[10],每條染色體均由多個結構單元組成,即拓撲關聯結構域(TAD),“三角形”的邊界被稱為TAD邊界。TADs是細胞核內染色質折疊的二級結構單元,在核空間中形成獨立的結構模塊,是一個高度自關聯的不間斷區域,其內部染色質相互作用強,相鄰區域之間有明顯的邊界且相互作用弱[10]。同一個TAD內的基因通常處于相似的活性或非活性狀態?;蚪M活性與非活性狀態的改變總是發生在TAD邊界附近,這說明TAD邊界處可能具有隔離功能。Dixon等[11]在人類和小鼠4個細胞系上利用Hi-c技術研究發現TAD位置及其邊界在不同細胞類型間及人和小鼠間均高度保守,即使在細胞分化過程中也表現出相對穩定的狀態,該研究結果支持了TAD邊界及其隔離功能在哺乳動物細胞中具有重要意義。TAD邊界處富含CTCF結合位點、看家基因、轉錄起始位點和一些短散在重復序列。黏連蛋白復合體和阻遏子CTCF是TAD邊界處的主要結合蛋白,兩者對TADs的定位和結構的穩定性發揮了重要作用[12]。還有研究發現,TAD邊界與DNA復制域邊界存在大量重疊,暗示TADs可能與DNA復制有關。2014年,Pope等[13]在人類和小鼠細胞系中研究了TADs與DNA復制的關系,得出結論“TADs是DNA復制時序調控基本單元”,DNA復制時序往往與染色質狀態密切相關,處于活躍狀態的染色質在細胞分裂階段會更早地被復制,而抑制狀態的染色質則會被較晚地復制??偟膩碚f,TAD作為染色質三維結構基本功能單位,占基因組結構的絕大部分,廣泛存在于不同的細胞類型和不同的物種中,與細胞分化、基因表達調控、疾病發生和機體免疫等有著密切關系。

1.4 染色質環

在1 kb的分辨率下,Rao等[14]發現了直接調控基因表達最精細的結構和功能單元:染色質環(chromatin loops,CLs),這是一種由簡單染色質纖維折疊而形成的環狀結構。染色質環是可以實現遠距離調控基因轉錄的結構,它是由TAD內的遠端調控元件通過染色質三維立體折疊或碰撞使與其靶基因在空間上可以相互接近從而調控基因。染色質環大小通常在數百kb,遠小于TAD,在Hi-C互作圖譜上顯示為更加細小的互作峰[15]。染色質環的兩端通常與啟動子、增強子等基因調控元件相連,這些基因調控元件對不同細胞的基因表達量有很大影響,且形成染色質環的基因表達量也高于沒有形成染色質環的基因表達量,暗示染色質環與基因激活和基因表達調控有關[16]。染色質環之間沒有重疊,大多數的CL中都存在CTCF和黏連蛋白亞基,CTCF和黏連蛋白共同參與了染色質環的形成。早期有研究,將CTCF或cohesin敲除后會抑制染色質環的形成,部分基因的表達量也發生變化,缺少兩者中的任意一個都會破壞染色質環的結構,進一步證實了染色質環與基因激活和基因表達調控有關[17]。目前,染色質環形成機制尚不清楚,早期生物學家利用CTCF結合位點信息預測基因組的折疊方式,并提出“環擠壓模型”解釋染色質折疊成環機制[18]。染色質環在不同物種、不同細胞系間具有相對的特異性和保守性,通過對染色質環的深入研究,可以初步了解染色質更深層次的三維結構及其與基因調控表達的關系。

2 三維基因組分析方法

2.1 熒光原位雜交技術

FISH即染色體熒光原位雜交(flourescence in situ hybridization,FISH)是通過將熒光素標記的DNA探針與樣本細胞核內的DNA目標序列雜交,從而獲得細胞核內染色體或基因狀態的信息[19]。早期生物學家以顯微鏡和熒光原位雜交技術對染色質三維結構進行研究,可以進行基因定位的單細胞分析。由于技術方法的限制,染色質結構只能在低分辨率下解讀,而核組織的一般原則或個別基因的特征無法被高效且清晰地觀察到[20]。目前此方法應用較少,隨著染色質構象捕獲技術的發展,才深入了解了基因組內染色質的三維結構信息。

2.2 染色質構象捕獲技術(3C)

2002年Job Dekker等[21]開發了染色質構象捕獲(capturing chromosome conformation,3C)新技術并應用于酵母染色質互作觀察。3C技術通過生物學分析可以將特定位點之間的三維互作信息反映到二維互作圖譜上,從而確定特定DNA位點與相鄰位點的互作情況[22]。3C技術的基本操作步驟為:(1)分離細胞,利用甲醛固定樣本,使細胞發生原位交聯,此步可使空間上相鄰的染色質片段發生共價連接;(2)可利用限制性內切酶或超聲波將DNA分子切割成特定大小的片段,該步驟可消化DNA—蛋白質復合物;(3)在極低DNA濃度條件下利用DNA連接酶將空間上接近的DNA片段優先發生連接,此步可降低DNA片段之間發生隨機連接;(4)提取處理過的DNA,最后設計兩個特定基因位點的上下游引物進行PCR擴增,檢測新連接片段的相對豐度,則可以判斷這兩個特定位點是否存在遠距互作[23]。

3C技術只能驗證一個位點與另一個位點之間的相互作用,而且每驗證一對位點的相互作用就需要設計一對特異性引物,操作復雜,在實際應用中存在一定的局限性[24]。為了解決3C技術中存在的不足,科研工作者們先后又發明了基于3C技術的各種衍生技術,例如4C(circularized chromosome conformation capture,4C),5C(carbon-copy chromosome conformation capture,5C),Hi-C(High-throughput chromosome conformation capture,Hi-C),ChIA-PET,ATAC-seq等技術[25]。其中4C技術可以檢測一個位點對多個位點的互作;5C技術可同時測定多個位點的相互作用;Hi-C能夠檢測所有目標基因組位點的所有位點的相互作用;ChIA-PET技術類似于Hi-C技術,改善了測序過程中產生的噪音;ATAC-seq能檢測開放區域染色質的DNA序列。3C及其衍生技術的快速發展,極大地促進了其在不同領域的廣泛應用。

2.3 Hi-C

在3C衍生技術中,Hi-C技術應用最為廣泛,可以一次性檢測所有染色質片段互作信息。2009年Job Dekker等[26]發明了Hi-C技術,它結合了染色體構象捕獲和高通量測序技術,它是以整個細胞核為研究對象,利用新一代測序技術與分子標記,研究DNA在整個染色質中的空間位置,通過捕獲全部DNA在染色質內的互作模式,從而得到高分辨率的染色質三維結構信息。Hi-C操作技術與3C技術有所不同,主要步驟為:(1)加入甲醛以固化基因組中參與染色質互作的蛋白質;(2)用限制性內切酶切割固定后的染色質。限制性內切酶有兩種:6 bp和4 bp的限制性內切酶,后者的分辨率更高;(3)得到具有平末端和粘性末端的片段,修復末端并添加生物素標記;(4)使用T4 DNA連接酶連接互作片段,將未互作的DNA片段去生物素,得到交聯片段;(5)利用超聲波或其他方法再次打斷片段;(6)用鏈霉親和素磁珠將富集生物素標記的片段進行捕獲,制作文庫并進行高通量測序,最終獲得高通量染色質互作信息[27]。

Hi-C技術被廣泛應用于疾病風險預防、輔助動物基因組裝、挖掘基因調控組件、識別三位基因組結構變化等研究工作中。雖然Hi-C技術可以提供全基因組所有染色質位點之間的互作信息,但Hi-C技術中也存在很多問題,其中包括:實驗成本高、測序量大、測序過程中噪音大、過程繁瑣、周期長等缺陷[28]。為了解決這些問題,科研工作者們開發了一系列Hi-C優化技術,如原位Hi-C(in situ Hi-C)和基于酶切酶連的Hi-C(Digestion-Ligation-Only Hi-C,DLO Hi-C)等技術。原位Hi-C技術通過在細胞核原位完成交聯、酶切、連接步驟,同時縮短了實驗周期,減少了假陽性結果。在DLO Hi-C技術中,生物素標記這一步驟被去除,僅需2輪簡單的酶切酶連反應就可以構建高質量的DLO Hi-C測序文庫,其主要優點是縮短試驗時間、降低了試驗成本和測序成本、噪音、數據提取以及后期分析的難度,可以獲得更有效的交互數據[28]。

2.4 CRISPR研究三維基因組的技術方法

成簇規律間隔短回文重復序列及其相關蛋白(clustered regularly interspaced short palindromic repeats/CRISPR-associated protein,CRISPR/Cas)是細菌和古菌在面對病毒入侵時出現的原核生物適應性免疫系統[29-30]。當外源DNA入侵時,細菌會啟動自身的適應性免疫系統,迅速獲取病毒基因的序列,然后整合到自己基因組內的一個特定位點,形成CRISPR重復—間隔基因座,從而獲取對病毒的抗性,當外源DNA再次入侵時,CRISPR重復—間隔基因座便會轉錄并加工為crRNA(CRISPR RNA),并引導DNA核酸內切酶Cas9蛋白到達病毒基因的位置,執行切割功能,從而破壞病毒基因。CRISPR/Cas系統的效應酶不止Cas9蛋白,Cas蛋白家族有很多類型的Cas酶,包括Cas9、Cas13、Cas12等[31]。通過CRISPR系統不僅能夠切割病毒的基因,還能夠被設計成特異地刪除與3D基因組結構相關的基因組片段,進而研究由此引起的基因表達改變,CRISPR-Cas9基因編輯技術可對靶向基因進行特定DNA修飾的技術,該技術可以用于制作細胞或動物模型的基因組調控元件的插入、刪除、反轉,并且可以用來研究三維基因組調控生命過程的機制,以及腫瘤、神經退行性病變等各種疾病的治療中[32]。

CRISPR/Cas9系統在三維基因組中的應用主要依賴于能夠特異性結合基因的CRISPR/Cas序列,利用這一特性,可將修飾或未修飾的Cas9蛋白招募到特定的基因組位點上,使活細胞的特定染色體片段的時空動態可視化,對基因組進行切割和功能改造[33]。三維基因組中存在大量的染色質重排,可以利用DNA大片段編輯技術進行模擬,包括DNA片段刪除、重復、移位、反轉等[34]。若將CTCF 區域或者染色質環的邊界區域設計為基因組大片段刪除的對象,就可以通過刪除這些區域破壞3D基因組的結構,進而研究這些區域對于基因表達的影響和功能。染色質架構蛋白CTCF的結合位點被CRISPR/Cas9雙切系統進行反轉、插入或敲除,其研究結果都表明了CTCF對于維持細胞三維基因組架構和動態調控都具有重要作用[32,35]。有研究[36]利用DNA片段編輯技術將基因組部分進行刪除與反轉,發現DNA復制時間發生了變化,說明這些片段可能包含一些調控DNA復制時間時空特性的重要元件。單獨刪除與共同刪除這些元件對DNA復制的影響不同,說明這些元件之間在發揮作用時可能存在相互依賴性[31]。Hi-C結果也表明這些元件的刪除會影響基因組區室劃分以及拓撲結構域的強度。將基因組位點在三維空間直接可視化,能夠幫助理解基因組的空間架構以及與基因表達調控等生命活動的關系[31]。該方法是利用CRISPR/Cas系統結合基因組的序列特異性,失活的dCas9(nuclease-deactivated Cas9,D10A和H841A)熒光蛋白嵌合體可以被 sgRNA招募到基因組的特定位點,從而使活細胞的特定染色體片段的時空動態可視化[33]。dCas9/sgRNA復合體的穩定性以及dCas9蛋白結合DNA的高親和性使得該方法可以被廣泛地應用于細胞三維基因組特定位點標記[37]。隨著高通量技術的發展,相信基因組3D結構會被揭示得更加清楚,從而實現深入研究染色質空間構象、信號轉導通路、轉錄因子調節機制、基因表達機制等問題。

3 三維基因組學在家畜方面的研究進展

染色質三維結構是重要的表觀遺傳因素,與基因表達調控、發育及疾病等密切相關[38]。在動物育種中,探索遠距離基因互作、非編碼DNA調控元件對基因轉錄調控的影響,構建動物三維轉錄調控網絡,探索研究三維基因組學相關技術在動物科學上的應用,揭示影響國內外畜禽品種生長速度、瘦肉沉積率[39]、產肉能力[40]、繁殖等重要經濟性狀形成的新機制。

3.1 在畜禽中的研究

在國內,西北農林科技大學動物科技學院已完成秦川牛肌肉基因組三維結構及其對肌肉發育相關基因的轉錄調控研究[6]。結果發現胎牛和成年牛肌肉的loop結構存在大量差異,包含447個增強子,其中與基因啟動子成環的增強子有240個;構建了牛肌肉基因組調控元件互作圖譜,在共計4716對啟動子—增強子互作中有142個肌肉發育相關基因受到303個增強子調控,這些結果為肌肉發育的分子調控機制分析提供了數據支持。對這些基因的相關研究能夠有效避免如世代間隔時間長,改良效率低、優良種質資源浪費等現如今育種工作所面臨的問題[41]。

豬是重要的經濟家畜,在生物醫學領域具有重要的應用價值,染色質三維結構是重要的表觀遺傳因素,與基因表達調控、發育和疾病等密切相關。然而豬染色質三維結構仍是一個新的探索領域[42]。中國農業科學院王彥芳團隊等[43]構建了豬體細胞染色質三維結構圖譜,追蹤豬在早期胚胎發育過程中染色質空間構象重編程過程。這項研究表明,在胚胎成功發育過程中,染色質結構重編程的速率可能起著關鍵作用。該研究成果為豬染色質結構的進化研究提供了理論依據,并為提高豬的輔助生殖效率提供了參考價值。西北農林科技大學曾文先教授團隊[44]系統研究了豬精原干細胞和分化精原細胞的染色質三維空間結構,進一步闡明了精原干細胞分化過程中的高級染色質動態變化。研究首次明確了精原干細胞分化過程中的三維基因組空間結構變化及其對基因表達的重要調控作用,對揭示精原干細胞分化的分子機制具有重要意義,極大地擴展了人們對豬精原干細胞發育進程的認識。四川農大動科學院豬遺傳育種團隊[45]通過空間轉錄組學技術,從單根肌纖維分辨率的水平揭示了3種不同肌纖維亞型的在能量代謝和脂質沉積上的差異。并且在現有豬參考基因組的基礎上,補充完善注釋了大量調控性轉錄本;并采用Hi-C技術重構了豬脂肪組織的染色質三維空間結構。該研究對豬肉質性狀形成的分子機制進行了深入解析,并為以后開展分子育種提供了重要基礎數據和理論支持。

河南農業大學家禽團隊劉小軍教授[46]通過比較地方品種盧氏雞和快大型AA肉雞在三維基因組結構上的差異,首次揭示了染色質拓撲結構域(TAD)變化對雞肌纖維發育和肌內脂肪(IMF)沉積的影響,該研究加深了我們對肌肉發育和脂質積累過程中染色質動力學的理解,而且還揭示了雞肌肉發育和IMF沉積的表觀遺傳調控新機制。四川農業大學李地艷教授團隊[47]對雞不同卵泡發育時間點的顆粒細胞進行了研究,利用多組學聯合分折對卵泡發生過程中的關鍵階段染色質構象動態變化規律進行深入解析。結果表明,作為染色質高級結構蛋白的CTCF在雞的三維基因組結構形成中起到了重要作用。這一研究結果為家禽分子育種過程中提高卵母細胞質量、發育能力及其受精后種蛋質量提供了重要的理論依據,為高繁殖性能新雞種的選育及繁殖性狀研究提供了新思路。有研究人員解析北京鴨的三維基因組空間構象[48]通過Hi-C數據發現IGF2BP1基因由于遠距離增強子的自然突變,導致在胚胎期起生長促進作用的IGF2BP1基因在北京鴨出殼后仍不斷表達,提高了飼料利用率從而體格變大。該研究結果為鴨子的經濟性狀的遺傳改良提供了理論依據。

4 小結和展望

隨著分子生物學的快速發展,在現代生物育種中,人類已經積累了大量的數據和信息在生物大分子結構和功能上,例如核酸和蛋白質,現代動物育種技術還結合了遺傳學理論、生物技術、計算機、系統工程等育種方法,實現分子育種,從遺傳上改良種質并使其達到最大的經濟效益,提高選種選配的效果,提高育種的準確性。

三維基因組學被廣泛應用于醫學、生命科學、農業科學等多個領域。本文主要介紹了其在動物科學方面的研究進展,DNA的三維結構極大地影響了生物復雜性狀的形成,例如畜禽上的肉用性狀、毛色性狀、體型、對飼料的利用率等。

我國目前存在引入大量外來品種,導致本地品種在市場中的占比很小的問題,許多畜禽品種依賴進口,種業內在的核心技術創新不足,國內大量種質資源僅有很少一部分進行研究,真正有用的基因類型還沒有被發掘,地方特色種質資源開發不足,種質資源消失的風險加劇,種質資源的發掘保護要和種質資源庫建設同時進行,先要有足夠的種質資源達到量變,以此為基礎,才能引發研發創新的質變。

三維基因組學是基因組學研究的熱點前沿領域之一,聯合轉錄組、表觀組、代謝組等多組學的分析,揭示染色質構象與具體基因功能的關系。三維基因組學研究基因組各種元件的功能及其調控關系,可以進一步識別和分析關鍵突變及其機制,是高技術與高維數據分析驅動的新組學研究,其可以將目前已知的二維平面數據立體化起來,使得系統生物學有了更深層次的探究。因此對我國重要家畜的三維基因組結構進行系統分析,不但為精準育種和重要經濟性狀改良提供理論依據,也為我國農業科技的持續創新提供有力的基礎支撐。

猜你喜歡
染色質基因組位點
染色質開放性與動物胚胎發育關系的研究進展
哺乳動物合子基因組激活過程中的染色質重塑
鎳基單晶高溫合金多組元置換的第一性原理研究
牛參考基因組中發現被忽視基因
CLOCK基因rs4580704多態性位點與2型糖尿病和睡眠質量的相關性
血清HBV前基因組RNA的研究進展
染色質可接近性在前列腺癌研究中的作用
“哺乳動物卵母細胞生發泡染色質構型的研究進展”一文附圖
二項式通項公式在遺傳學計算中的運用*
紫花白及基因組DNA提取方法的比較
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合