?

單細胞RNA測序在畜禽遺傳育種中的研究進展

2024-03-11 03:24李鈺潔陳洪波徐珂何小麗喬木吳俊靜彭先文梅書棋徐忠
畜牧與獸醫 2024年3期
關鍵詞:單細胞測序發育

李鈺潔,陳洪波,徐珂,何小麗,喬木,吳俊靜,彭先文,梅書棋,徐忠*

(1. 湖北省農業科學院畜牧獸醫研究所/動物胚胎工程及分子育種湖北省重點實驗室,湖北 武漢 430064;2. 武漢輕工大學動物科學與營養工程學院湖北省家畜種業技術創新中心,湖北 武漢 430023;3. 廟嶺畜牧獸醫站,湖北 鄂州 436031)

測序技術發展源于1970年,在幾十年間,各種測序方法經歷了快速演變,并被應用于各種特定的研究方向,為復雜的生物系統提供了許多寶貴的理論依據。單細胞測序技術主要由單細胞基因組測序(single cell DNA sequencing,scDNA-seq),單細胞RNA測序(single cell RNA sequencing,scRNA-seq)和單細胞表觀基因組測序這三類測序構成,在腫瘤、發育生物學、微生物學、神經科學等領域發揮重要作用,正成為生命科學研究的焦點。2017年10月16日,“人類細胞圖譜計劃”首批擬資助的38個項目正式公布,單細胞測序進入繁榮的新時代。近年來單細胞基因組測序通過研究單細胞分辨率的基因組突變測序分析,初步探索了人類胚胎和器官發育譜系圖譜。單細胞表觀基因組測序可以從單細胞染色質狀態、三維基因組、組蛋白修飾和轉錄因子結合等方面研究細胞表觀遺傳調控機制。轉錄組測序是研究基因表達的主要手段,被廣泛應用于畜禽功能基因挖掘和分子遺傳網絡調控機制研究中。傳統的轉錄組測序是在多細胞基礎上進行的,實際得到的是大量細胞基因表達數據的平均值。scRNA-seq是在單細胞水平對轉錄組進行高通量測序分析,研究單個細胞的行為及其內部基因表達情況,可以揭示細胞群體差異和細胞發育譜系關系[1]。與傳統轉錄組測序技術相比,scRNA-seq能檢測出混雜樣品測序所無法獲得的細胞異質性信息[2],進行新細胞的鑒定,成為了不同領域中研究細胞異質性的有效工具[3]。自2009年首個單細胞轉錄組測序技術發布以來[4-5],scRNA-seq已被越來越廣泛地應用于基礎科學研究中。目前單細胞測序技術在畜禽遺傳育種上的研究迅速,為提高育種效率提供新的理論技術,促進畜牧產業的發展。本文對scRNA-seq技術的流程要點及其在畜禽遺傳育種中的應用進展進行綜述,分析目前研究存在的挑戰,為畜禽相關研究提供理論依據。

1 單細胞RNA測序技術

scRNA-seq是對單個細胞進行轉錄組范圍的分析,需要分離和裂解單細胞,將其RNA逆轉錄為cDNA,然后擴增cDNA以生成高通量測序文庫。隨著測序技術的不斷發展,scRNA-seq數據的快速生成克服了大量RNA序列對樣本中所有細胞的基因表達進行平均的缺陷,避免了單個細胞特性的丟失,能夠根據單個細胞的表達譜特性對個體進行高精度的鑒別,并能夠傳達出基因間的調控關系,追蹤發育過程中不同細胞譜系的軌跡。目前使用的scRNA-seq技術幾乎都包含了單細胞懸液制備、單細胞分離、文庫構建與測序及數據分析這四個步驟。

1.1 單細胞懸液的制備

實體組織通常采用機械法,簡單無污染,但人工機械裂解組織會由于動作幅度和速度差異使活細胞的獲得率有差異,且容易造成細胞損傷。酶消化法[6-8]是使組織間和細胞間的連接水解,但其孵育條件的控制有一定難度,固體組織細胞易結成團,細胞得率低,且組織的酶消化會影響scRNA-seq數據分析的基因表達偽影,適合的樣本種類包括肝臟、腎臟、心肌等。機械-酶消化法是兩種方法的組合,可在許多情況下用來縮短整體處理時間。

1.2 單細胞分離

制備的單細胞懸液可以依據其樣本的特點,選擇有限稀釋法、顯微操作法、激光捕獲顯微切割、熒光激活流式分選以及微流控裝置[9-10]等方法分離為單個細胞。其中有限稀釋法是一種常用的分離單細胞的方法,它通過人工或機器操作移液來稀釋細胞懸液,雖然操作簡單,但效率不高,成功率也較低。顯微操作法可以分離出特定的細胞,但是對操作要求很高,通量小。激光捕獲顯微切割[11]是利用激光切割并捕獲細胞,容易破壞細胞所含的遺傳物質。熒光激活流式分選是一種利用不同熒光探針對來標記目標細胞的技術,可在短時間內通過檢測器分離,通量高,但是操作需要大量的細胞[12]。微流控裝置分離,是在封閉的微流控設備中執行細胞捕獲、分選和裂解,最大限度減少了操作過程中受到外源RNA和核糖核酸酶污染的機會[13],且通量大,效率高。目前使用最廣泛的是基于液滴的微流體,包括inDrop、Drop-seq[14]和10× Genomics三個技術。inDrop細胞捕獲效率極低,適用于分析非常小的組織樣本,10× Genomics獲得的數據比Drop-seq質量更高[15]。10× Genomics目前是最主流的選擇,但當樣本比較豐富時,Drop-seq成本相對低一些,相反,當進行低豐度轉錄本的檢測或需要自定試驗方案時,選擇inDrop比較合適[16]。

1.3 單細胞文庫構建及測序

由于不能直接對RNA進行測序,所以需要先逆轉錄單個細胞中的RNA并獲取cDNA鏈,并進一步通過擴增獲得大量單個細胞中的RNA的cDNA,制備基因測序文庫,然后對細胞進行測序獲得基因表達數據。

目前,10× Genomics公司應用液滴微流控技術的測序平臺以其極高的細胞通量與較低的價格被廣泛應用,它能大規模且準確反轉錄出單個細胞的基因并完成測量,一次測序可以捕捉到約80 000個細胞,并且單細胞覆蓋度高。通過分別捕獲單個細胞并裂解,然后進行逆轉錄以選擇mRNA并獲得cDNA。隨后,將擴增出的cDNA用于測序文庫的制備,即通過生成液滴,使用帶有條形碼的珠上引物來區分單個細胞,并應用獨特的分子標識符(UMI)進行偏差校正。10× Genomics公司的Chromium系統[17]將含寡核苷酸barcode[18]序列的凝膠珠(Gel Beads)首先與細胞和試劑混合,隨后在微流控交界處與油-表面活性劑溶液混合,形成GEMs(油包水的微體系)。之后細胞裂解,凝膠珠自動溶解釋放大量barcode序列,每個逆轉錄產生的cDNA分子包含一個UMI信息[19]和每個GEM共享的條形碼,對含barcode的cDNA進行PCR擴增,構建標準測序文庫,識別細胞的為10× barcode,識別mRNA分子的為UMI。

1.4 單細胞RNA測序數據分析

越來越多的生物信息分析方法被開發出來專門用于scRNA-seq數據的分析與理解。由于scRNA-seq原始數據存在一些缺點,包括高水平的噪聲、過度分散、表達序列的檢測率低、稀疏性和較低的轉錄材料捕獲等,所以需要一些統計方法和生物信息學技術工具來提取相關信息[20]。其中涉及的主要步驟是質量控制(QC)、歸一化、降維、聚類、可視化(t-SNE)結果和差異表達分析(DEA)[21](圖1)。目前單細胞分析用到的軟件主要是FastQC、Cell ranger和Seurat、Monocle。QC是單細胞RNA測序數據的預處理步驟,從數據中刪除低質量的細胞,去除低質量的堿基[1]。Cell ranger是10× Genomics的數據分析軟件,可直接輸入Illumina原始數據(raw base call,BCL)輸出表達定量矩陣、降維、聚類以及可視化結果。t-SNE[22]是一種降維技術,將多維數據非線性的轉換為低維數據,和主成分分析(PCA)差異在于PCA在實現數據降維的同時,也實現了噪聲去除,而t-SNE主要用于數據展示,將不能可視化的多維數據降維到低維,進行數據的可視化展示。聚類工具(如Seurat)[23]用于識別樣本中的細胞類型,進行細胞集群分析。軌跡分析工具(如Monocle)[24]被用于研究基因如何在發育過程中變化,分析單細胞基因的表達數據,來推斷細胞發展軌跡[25]。

圖1 scRNA-seq數據分析

2 單細胞RNA測序技術在畜禽遺傳育種中的應用

單細胞RNA測序技術已被廣泛應用于醫藥、腫瘤、生殖、免疫、組織器官等醫療領域,在動物遺傳育種方面的研究和應用也愈加廣泛。本文以物種分類(表1)對單細胞RNA測序技術在畜禽領域的研究進行綜述。

2.1 單細胞RNA測序在豬遺傳育種上的應用

單細胞轉錄組測序可以用于豬生殖發育領域,擴大豬優秀品種遺傳資源,改良豬的重要性狀。在豬的生殖細胞領域,Liu等[26]對豬生精囊段的卵母細胞進行scRNA-seq,發現155個基因在亮甲酚藍陰性和陽性的卵母細胞之間有明顯的差異表達,證明CDC5L在豬卵母細胞的成熟與早期胚胎發育時期很重要,研究結果為家畜良種快速擴繁和改善胚胎體外生產效率提供重要依據。Zhang等[27]為描述豬精子發生圖譜,通過單細胞RNA測序對約16 966個豬睪丸細胞進行分析,確定了豬睪丸中不同細胞類型在豬精子生成中有明顯差異表達基因,鑒別出未分化和分化精原細胞新的細胞表面標記分別是CD99和PODXL2,對研究豬的精原細胞分化可能有幫助。雷佩佩[28]研究揭示了豬精原細胞的異質性,篩選出了CDH1和CD99為未分化精原細胞的潛在分子標記,而分化的精原細胞其潛在分子標記是PODXL2,這為更深入的研究豬精原細胞分化和精子發生提供了理論依據。

隨著人們生活水平的提高,豬肉質風味成為重點研究的經濟性狀,尤其是豬的骨骼肌與豬脂肪細胞的發育。Qiu等[29]利用單細胞RNA測序,證實瘦肉型豬在骨骼肌中保留的肌系細胞比例高于肥胖型豬,且瘦肉型豬肌系細胞的細胞質和內質網中的Ca2+濃度都較低,闡述了瘦肉型豬脂肪沉積少的重要原因。張愨[30]鑒定了豬皮下和肌內前體脂肪細胞的亞群及潛在的細胞特異性標記基因,對兩種組織關鍵細胞類型進行比較分析,發現了其共有的特異表達PI15的多能干細胞和豬肌內前體脂肪細胞中特異表達TNNI2和ACTN2的成肌細胞,豐富了對豬皮下和肌內脂肪生成過程的認識,為豬肉品質改良提供了理論依據。

另外在胚胎方面的研究,Du等[31]通過對體外受精(IVF)或孤雌生殖激活(PA)的豬早期胚胎中獲得的單個子代和囊胚的轉錄組進行了分析,發現IVF組內的差異表達基因與PA組內的差異表達基因不同,DNA甲基化因子(UHRF1/2和DNMT1/3A/3B)在體外和體內胚胎的表達水平和變化趨勢存在很大差異,對研究胚胎發育至關重要的基因和通路提供重要支持。Li等[32]研究了豬胸腰椎、肋骨原基的單細胞轉錄組圖譜,分析了發育中的豬胸腰椎和肋骨原基細胞組成及HOXA10表達的差異,這為研究胚胎成骨和發育提供了理論依據。Tian等[33]針對豬胚胎在著床期流失的問題,利用scRNA-seq研究了與胚胎植入相關細胞類型的基因表達軌跡,HBE1和HBZ在紅系細胞中唯一表達,PEG10在滋養層細胞中唯一表達,將為破解豬胚胎著床的分子機制提供幫助。這些研究成果可以為優秀豬種繁育和豬肉品質改良等相關研究提供理論和實踐基礎。

2.2 單細胞RNA測序在牛遺傳育種上的應用

對牛的生殖細胞、胚胎和脂肪細胞的研究有利于提高優秀種牛的繁育水平。在牛上實施單細胞轉錄組學分析,為研究單個細胞在復雜性狀中的作用提供理論支持。Lavagi等[34]研究發現,牛在第2天與第3天其胚胎單細胞轉錄組圖譜存在異質性,同源異行框基因CDX2調控牛胚泡中的多個滋養細胞基因,NANOG和GATA6分別是外胚層和原始內胚層第2次世系分離的兩個關鍵基因,SALL1(參與多能性)和FOSL1(參與滋養外胚層發育)的胚胎轉錄在16細胞階段開始,證實了胚泡發育在胚胎的基因組激活時期是不同步的。Gao等[35]分別從斷奶前后的兩個荷斯坦小牛瘤胃上皮組織中獲得了5 064個和1 372個單個細胞的scRNA-seq數據,確認了不同細胞簇的細胞類型及其標記基因。將它們與人類和小鼠胃上皮細胞進行比較確認細胞身份。這項研究為在牛中實施單細胞轉錄組學分析做出了初步努力,并對牛瘤胃組織上皮細胞類型及其在斷奶期間的發育情況做出了闡述,唯一高表達SLC16A1和SLC4A9的細胞類型可能在揮發性脂肪酸吸收中發揮重要作用,揭示了單細胞水平的細胞類型在復雜性狀中的作用。

在牛的脂肪、毛囊上的研究有利于了解牛肌肉和毛絨性狀的發生,幫助提升牛分子育種水平。Lyu等[36]利用scRNA-seq技術分析了牛的衛星細胞的組成,支持牛衛星細胞是由轉錄和成肌狀態不同的亞群組成的假說以及牛的肌肉內脂肪來源于纖維脂肪生成細胞的假說。證明了牛的衛星細胞在成肌潛力方面是異質的,分析了衛星細胞(PAX7、PAX3)、成肌細胞(MYOD1、MYF5)、纖維脂肪生成(FAP)細胞(PDGFRA)和分化的成肌細胞或肌細胞(MYOG)的標志物的富集表達,利于了解支配牛骨骼肌組成、發育和生長的遺傳與生理機制,改善牛骨骼肌質量。葉娜[37]利用scRNA-seq揭示天祝白牦牛在生長期其表皮細胞譜系和真皮細胞譜系在毛囊發育中的分化軌跡,研究了牦牛生長期其毛囊發育過程所涉及到的表皮細胞(KRT14、KRT15)、毛干細胞(LHX2)、上皮分化細胞(SBSN、KRTDAP、KRT1、KRT10)等,為牦牛的毛絨性狀的分子育種方面提供理論研究基礎。上述研究可以更好的理解牛的生殖發育機制,改善牛的肌肉品質。

2.3 單細胞RNA測序在羊遺傳育種上的應用

目前scRNA-seq技術在羊上的研究主要在生殖細胞發育、毛囊發育等方面。對綿羊睪丸、羊毛的毛囊異質性和羊毛卷曲分子機制的研究,Yang等[38]從成年綿羊睪丸的11 772個細胞中收集scRNA-seq數據,經過鑒定,發現綿羊生殖細胞有幾種不同的類型,確定了一些特異性標記基因,如EZH2、SOX18、SCP2、PCNA和PRKCD,這為綿羊精子發生的全面單細胞轉錄組學研究提供了新的見解。Wang等[39]利用單細胞RNA測序技術揭示了毛囊細胞的分化和空間特征,同時通過鑒定和分析直毛與卷毛在特定細胞中的異質表達,發現IGFBP3與VCAN有相同的表達模式,認為它們與毛乳頭細胞的聚集性生長特征密切相關,闡明了羊毛彎曲的分子機制,為研究綿羊毛囊發育生物學和綿羊的育種提供幫助。

在山羊中,Li等[40]采用scRNA-seq分析了吉寧灰山羊群體不同階段卵泡顆粒細胞(GC)的基因表達及其標記基因,發現不同群體之間的基因表達差異在不同發育階段非常明顯,許多標記基因在不同發育階段也差異表達,ASIP和ASPN在GCs早期高表達,INHA、INHBA、MFGE8和HSD17B1在GCs生長期高表達,IGFBP2、IGFBP5和CYP11A1在晚期高表達。這些標記基因可以作為山羊卵泡GC發育的參考基因,這可能有助于揭示卵母細胞發育潛力。在山羊睪丸細胞中的研究中,Yu等[41]將奶山羊睪丸組織分離成單細胞進行scRNA-seq測序,分析其精子發生和體細胞發育過程,通過檢測和篩選,確定了精原細胞中的特定候選標記基因(TKTL1和AES),發現的新特征基因可為雄山羊生殖提供重要分子標記,為奶山羊育種研究提供理論與技術支持。以上研究可以為綿、山羊生殖和綿羊毛囊發育提供新的理解。

2.4 單細胞RNA測序在雞遺傳育種上的應用

scRNA-seq技術在家禽上研究較少,Li等[42]首次用單細胞RNA測序技術分析雞骨骼肌在肌肉發生和脂肪形成的增生與肥大階段的異質性,篩選和鑒定肌內脂肪特異性表達基因,提供了骨骼肌中肌細胞和脂肪細胞的細胞特異性表達基因,APOA1和COL1A1基因被鑒定為雞肌內脂肪細胞的Marker基因,為肌內脂肪的生成提供新的見解,有助于研究雞肉品質性狀分子標記的開發。Rengaraj等[43]將一種新的生殖細胞示蹤方法運用到轉基因雞模型中,通過CRISPR/Cas9基因編輯將綠色熒光蛋白(GFP)插入到雞生殖細胞特異性標記基因DAZL(雞生殖細胞發育與維持的關鍵因子)中,構建了DAZL::GFP轉基因雞,再分離純化雄性和雌性生殖細胞,利用scRNA-seq進行分析,可以研究禽類生殖細胞發育過程中特有的機制、轉錄圖譜和細胞異質性,與上述在骨骼肌中的研究共同為改善雞肉品質和了解禽類生殖發育提供新的思路。

2.5 單細胞RNA測序在其他畜禽遺傳育種上的應用

馬產業是我國畜牧業的重要組成部分。目前scRNA-seq除了在豬、牛、羊和雞等常見畜禽上有應用,對馬也有研究進展。Sage等[44]將scRNA-seq技術用來探索冷凍的馬支氣管肺泡灌洗液(BALF)的細胞組成,對從患哮喘馬中分離出的4 631個細胞進行分析,確定了16個主要細胞類型群:單核/巨噬細胞(CD163、CD68)、T細胞(CD2、CD3D、CD3E、CD3G)、B/漿細胞(MS4A1、CD79A、CD79B)、樹突狀細胞(CD83、CCR7)、中性粒細胞(TG、RGS2、LILRA5、CSF3R)和肥大細胞(LTC4S、HPGDS、GCSAML、MS4A2),核糖體蛋白基因在T細胞和B漿細胞中高度表達。研究結果表明,scRNA-seq技術適用于冷凍保存的馬BALF細胞,可以識別其主要細胞群體以及未探索研究過的T細胞和巨噬細胞亞群,這可能對馬呼吸系統疾病(如馬哮喘)的免疫機制提供理論依據。

3 總結與展望

能夠準確進行細胞亞群分類以及識別是現在亟需解決的技術挑戰。scRNA-seq涉及到與群體RNA測序相關的更高水平的技術噪聲和數據復雜性,干擾了細胞聚類和標記識別的準確性,Song等[45]描述了有更好聚類性能的基于entropy subspace分離的降噪聚類(ENCORE)的細胞聚類算法,減少scRNA-seq分析中的噪聲并提高細胞聚類的準確性,但發現ENCORE在運行過程中消耗內存較大,這也提示了細胞聚類算法的一個研究機遇。

如何整合其他的技術與單細胞轉錄組一起分析也是目前的一個挑戰。目前,scRNA-seq方法很少能夠傳達有關轉錄過程的實時信息,并且每個細胞的RNA圖譜只能被分析一次[46],Erhard等[47]提出一種單細胞巰基連接的RNA烷基化代謝標記測序技術scSLAM-seq,能更好理解單細胞水平轉錄活性的差異。scRNA-seq沒有轉錄物在組織中的空間信息,因此scRNA-seq與空間轉錄組學[48]的整合可以產生組織中細胞亞群的高分辨率圖譜。如Biancalani等[49]提出一種Tangram方法,將sc/snRNA-seq數據與包括MERFISH、STARmap、smFISH、空間轉錄組學和組織學圖像等數據相結合[50-52],可映射任何類型的sc/snRNA-seq數據。目前在人和小鼠上已經有scRNA-seq與scATAC-seq的組合研究[53-55],期待之后在畜禽上能有研究進展,促進未來遺傳育種技術發展。相信隨著科技的不斷發展,scRNA-seq的研究會更加廣泛,而不限于應用于腫瘤、免疫和神經發育等生物醫學領域[56]。

猜你喜歡
單細胞測序發育
杰 Sir 帶你認識宏基因二代測序(mNGS)
二代測序協助診斷AIDS合并馬爾尼菲籃狀菌腦膜炎1例
人工智能助力微生物單細胞鑒定
孩子發育遲緩怎么辦
刺是植物發育不完全的芽
中醫對青春發育異常的認識及展望
聯合SNaPshot和單倍型分析技術建立G6PD缺乏癥單細胞基因診斷體系
基因捕獲測序診斷血癌
單細胞測序技術研究進展
發育行為障礙的早期識別
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合