?

轉錄組學主要研究技術及其應用概述

2019-11-27 22:01郭光艷秘彩莉
生物學教學 2019年10期
關鍵詞:組學基因組測序

劉 偉 郭光艷 秘彩莉

(河北師范大學生命科學學院 石家莊 050024)

1 轉錄組學簡介

遺傳學中心法則表明,遺傳信息在精密的調控下通過信使RNA(mRNA)從DNA傳遞到蛋白質。因此,mRNA被認為是DNA與蛋白質之間生物信息傳遞的“橋梁”,而所有表達基因及其轉錄水平的綜合被稱作轉錄組(transcriptome)。轉錄組這個概念最初由Velcuescu等[1]在研究酵母基因表達時提出。研究轉錄組的轉錄組學(transcriptomics)與蛋白質組學和代謝組學一樣,均屬于功能基因組學研究范疇[2],是一門在整體水平上研究細胞中所有基因轉錄及轉錄調控規律的學科[3]。作為一種新的研究方法,轉錄組學利用全部基因的表達調控、蛋白質功能等信息來解決生物學問題,將基因組學研究帶入了一個高速發展的時代。轉錄組學的研究目的不僅是不同轉錄組樣本中每個基因的表達水平的變化,也包括轉錄組的定位和注釋及每個基因在基因組中的功能和結構的測定。對基因及其轉錄表達產物功能研究的功能基因組學,將為疾病控制和新藥開發、作物和畜禽品種的改良提供新思路,為人類解決健康問題、食物問題、能源問題和環境問題提供新方法。

轉錄組學作為一個率先發展起來的技術已經在生物學前沿研究中得到了越來越廣泛的應用。廣義轉錄組指從一種細胞或者組織的基因組所轉錄出來的RNA總和,包括編碼蛋白質的mRNA和各種非編碼RNA(ncRNA),如rRNA、tRNA、核仁小RNA(snoRNA)、小核RNA(snRNA)、微RNA(mRNA)和其他ncRNA等。轉錄組學從整體水平研究基因的功能和基因結構,揭示特定生物學過程中的分子機理。目前,已廣泛應用于微生物和動植物基礎研究、臨床診斷和藥物研發等領域。

2 轉錄組學的相關技術

由于測序價格昂貴、基因序列數目有限,轉錄組學研究者只能進行極少數特定基因的結構功能分析和表達研究。近十幾年,分子生物學技術的快速發展使高通量分析成為可能,這為真正意義上的轉錄組學的研究奠定了基礎。這些高通量研究方法主要分為兩類: 一類是基于雜交的方法,主要是指微陣列技術(microarray)、基因芯片(microassay)技術;一類是基于測序的方法,這類方法包括表達序列標簽技術(expression sequence tags technology, EST)、基因表達系列分析技術(serial analysis of gene expression, SAGE)、大規模平行測序技術(massively parallel signature sequencing, MPSS)、RNA測序技術(RNA sequencing, RNA-seq)。其中,microarray和EST技術是較早發展起來的先驅技術,SAGE、 MPSS和RNA-seq是高通量測序條件下的轉錄組學研究方法,有助于了解特定生命過程中相關基因的整體表達情況,進而從轉錄水平揭示生命過程的代謝網絡及調控機理。

2.1 微陣列技術 微陣列技術是分子生物學領域具有里程碑式意義的重大突破,同時它可以測量不同樣本中成千上萬個基因在不同環境和不同狀態下的表達水平?;虮磉_數據是基于DNA微陣列技術而產生的反映基因轉錄產物mRNA豐度值的一種數據。

2.1.1 cDNA微陣列 cDNA微陣列的制備過程包括: ①對各種生物隨機克隆和隨機測序所得的cDNA片段進行歸類;②把每一類cDNA片段的代表克隆(代表一個獨立基因)進行體外擴增,并將得到的大小和序列不同的片段分別進行純化;③利用機械手高速、高密度、有序地將它們點樣固定在玻片硅晶片或尼龍膜上制備成cDNA微陣列;④以此cDNA微陣列對各基因的表達情況進行同步分析。它的特點是造價低、適用面廣、研制周期短、靈活性高。

2.1.2 寡核苷酸微陣列 寡核苷酸微陣列的主要原理與cDNA微陣列類似,主要是通過堿基互補配對原則進行雜交,來檢測對應片段是否存在和存在量的多少。它與cDNA芯片的本質差別在于寡核苷酸的探針片段相對較短(一般為20~70 nt)。寡核苷酸微陣列的探針經過優化,長度基本一致,而且Tm也相差不大。比較而言,cDNA微陣列具有以下優點: 無需擴增,可避免擴增失敗而影響實驗;減少非特異性雜交,能夠有效地區分同源序列的基因;雜交溫度均一,可提高雜交效率;減少了微陣列片上探針的二級結構。

2.2 基因芯片技術 基因芯片是基于核酸雜交的一種轉錄組研究技術,該技術利用紅、綠熒光染料分別標記實驗樣本和對照樣本cDNA,將樣本混合后與基因芯片雜交,可顯示實驗樣本和對照樣本基因的表達強度[4]。目前,基因芯片主要應用于基因表達檢測、尋找新基因和基因突變以及基因文庫作圖等方面研究。

基因芯片技術比較成熟,能夠準確地檢測較高表達的基因。但因雜交背景高,受基因拷貝數的限制無法檢測出低豐度基因,且數據庫數據有限,可能出現注釋錯誤。

2.3 表達序列標簽技術(EST) 基因表達序列標簽(expressed sequence tags, ESTs)為長約200~800 bp的cDNA部分序列。當人類基因組計劃剛剛開始時,一些科學家就主張cDNA測序應該先于基因組測序進行,原因是基因組的編碼區代表了基因組絕大部分信息,而編碼區長度只有總基因組長度的3%,因此可以用最低的代價、最短的時間獲得最多、最有用的信息。

一個典型的真核生物mRNA分子由5′端轉錄非翻譯區(5′-UTR)、開放閱讀框架(ORF)、3′端轉錄非翻譯區(3′-UTR)和聚A [poly(A)]四部分組成,其cDNA具有對應的結構。對于任何一個基因,其5′-UTR和3′-UTR都是特定的,即每條cDNA的5′端或3′端的有限序列可特異性地代表生物體某種組織在特定的時空條件下的一個表達基因。通過對生物體EST的分析,可以獲得生物體內基因的表達情況和表達豐度。要獲得生物體EST信息,通常應先構建其某個代表性組織的cDNA文庫,從中隨機挑取大量克隆,根據載體的通用引物進行測序,一般可以得到5′或3′端的200~500 bp的堿基序列,然后將測得的EST序列與網上已有的EST數據庫進行比較,對生物體基因的表達豐度進行分析。

2.4 新一代高通量測序技術 主要介紹三種:

2.4.1 基因表達系列分析技術(SAGE) SAGE技術是由Velculescu等人[5]在1995年提出的,是一種可以定量并同時分析大量轉錄本的方法。1998年,Powell[6]利用生物素標記的PCR引物合成生物素標記的接頭,并利用鏈霉抗生素蛋白磁珠綁定接頭,有效地去除了一些多余的接頭,從而提高了SAGE技術的分析效率。SAGE技術的理論依據主要有兩點: 第一,來自cDNA特定位置的一段9~13 bp的序列包含有足夠的信息作為確認唯一一種轉錄物的SAGE標簽(9個堿基能夠分辨49個不同轉錄物);第二,將來自不同cDNA的SAGE標簽集于同一克隆中進行測序,就可以獲得連續的短序列SAGE標簽,而這些SAGE標簽可以顯示對應的基因表達情況。

2.4.2 大規模平行測序技術(MPSS) MPSS技術是由Brenner等[7]在2000年建立的以測序為基礎的大規模高通量的基因分析技術。其方法的理論基礎[8]是: 一個標簽序列(一般為10~20 bp)含有其對應cDNA的足夠識別信息,將標簽序列與某種長的連續分子連接在一起,可以便于克隆和測序分析,而每個標簽序列的出現頻率又能夠代表其相應基因的表達量。

2.4.3 RNA測序技術(RNA-seq) 該技術首先將細胞中的所有轉錄產物作為cDNA文庫,然后將cDNA文庫中的DNA隨機剪切為小片段(或先將RNA片段化后再轉錄),再在cDNA兩端加上接頭,并利用新一代高通量測序儀測序,直到獲得足夠的序列,最后將所得序列通過比對或從頭組裝形成全基因組范圍的轉錄譜。

3 轉錄組學相關技術的應用

3.1 微陣列技術 主要介紹該技術用于基因組表達差異研究以及基因點突變與多態性研究。

3.1.1 表達差異的研究 1995年Schena[9]等用了48個PCR擴增的cDNA探針點制的微陣列片分析了野生型和轉基因的擬南芥中基因表達差異,并且在同一張玻片上使用不同的熒光染料同步進行差異比較。近年來,研究多集中于突變型與野生型、環境脅迫型與正常生長型、激素處理組與未處理組或者不同組織器官之間基因表達差異的比較。Ma等[10]利用寡核苷酸微陣列研究了玉米3個雄性不育突變體和可育植株花藥4個發育階段的基因表達情況,檢測到了近9 200個正、反義轉錄本。通過比較每個突變體與其可育花藥的基因表達差異,篩選到了一大批可能與花藥分化相關的重要轉錄因子和調控因子。

3.1.2 基因點突變及多態性檢測 現用于治療艾滋病(AIDS)的藥物,主要是病毒逆轉錄酶和蛋白酶的抑制劑,但在用藥3~12月后常出現耐藥性,其原因是逆轉錄酶和蛋白酶基因都能產生一個或多個點突變。逆轉錄酶的四個常見突變位點是Asp67-Asn、 Lys70-Arg、 Thr215-Phe/Tyr和Lys219-Gln,四個位點同時突變較單一位點突變對藥物的耐受能力成百倍增加[11]。如將這些基因突變部位的全部序列構建為DNA芯片,則可快速地檢測患者體內發生的是一個還是多個基因突變,這對指導治療和預后具有十分重要的意義。

3.2 表達序列標簽技術的應用 主要介紹以下5個方面的應用:

3.2.1 繪制基因組物理圖譜 通過已知的EST序列設計引物,并對基因組BAC文庫進行PCR,能顯示擴增條帶的那個克隆就是EST在染色體上的位置,這個EST就可以被定位在相關染色體上,并進而亞定位至染色體的某個區段。另外,還可以用EST序列提供的探針與基因組BAC文庫雜交,同樣能將某個已知EST在染色體上定位和亞定位。

3.2.2 基因的電子克隆 電子克隆技術是以算法為核心,以計算機和互聯網為工具,利用現有的表達序列標簽(EST)和生物信息數據庫,對其中大量的EST進行分類、整合和組裝,直接獲得大片段或cDNA全長的方法。電子克隆技術的出現,可充分利用現有的信息資源,特別是利用其他模式生物的EST信息,快速發現目標基因。

3.2.3 分離鑒定新基因 對某一特異組織或某一生長發育階段的cDNA文庫進行隨機的部分測序,得到大量EST,將這些EST作查詢項在GenBank的子數據庫dbEST中進行同源查找,同時將由EST推出的氨基酸序列作為查詢項在聚異三聚氰酸酯(polyisocyanurate foam, PIR)中查找類似物,可以識別這些基因到底是什么基因;對于那些在以上數據庫中沒有找到類似物的EST,再把它們置于6個開放閱讀框下,翻譯出推定的氨基酸序列,將可能的氨基酸序列作為查詢項,在PIR數據庫中查找類似物,如果有類似物,就認為這個EST代表著這個蛋白的基因。而那些在dbEST和PIR數據庫中都沒有類似物的EST,就可能是完全新的基因,需要進一步識別和研究。

3.2.4 通過EST尋找SSR和SNR分子標記 從EST數據庫中篩選簡單重復序列(SSR)和單核苷酸多態性(SNP)的主要優點在于,這樣篩選出來的SSR和SNP分子標記直接與基因的編碼區相對應,即得到的往往是基因相關標記。篩選的大致步驟為: EST重疊群的組裝;通過對大量重復的EST進行序列比較,識別出候選SSR或SNP;對候選SSR或SNP進行確認。EST還可在基因結構分析(內含子、外顯子識別)、基因表達及重組蛋白表達的分析中具有重要作用。

3.2.5 RNAi技術的研究 RNAi指外源性雙鏈RNA(dsRNA)能抑制細胞內與其序列同源的基因表達。在進化上,這可能是生物調控基因表達及抵御病毒侵染或轉座子誘導DNA突變的一種共有的生理機制。該技術最大的優點就是可以獲得大規模的缺失突變體,能為基因功能的研究提供很好的研究工具。同時EST作為序列標簽,很好地實現表型相關的基因克隆。

3.3 新一代高通量測序技術的應用 主要介紹三個方面:

3.3.1 SAGE技術同時檢測大量的基因轉錄本 一個測序反應可得到40個左右標簽序列,同時由于SAGE技術的靈敏度很高,可以檢測出低豐度表達的基因,是一種預測基因數目和發現新基因的有效途徑。SAGE還可用于在不同生理狀態、不同環境或不同生長階段的細胞或組織的基因表達圖譜構建,對不同狀態下基因表達水平的定量或定性比較。

3.3.2 MPSS可提供某一cDNA在體內特定發育階段的拷貝數 MPSS的這一功能,為在轉錄水平上進行基因表達分析提供了強有力定性和定量手段。MPSS所獲得的基因序列可提供PCR引物,通過比較EST數據庫等進行基因定位,也可轉化為分子標記構建遺傳圖譜等,因此該技術可廣泛用于動植物分類學和遺傳學、功能基因組學、蛋白質組學等研究領域。

3.3.3 RNA-seq能在單核苷酸水平對任意物種的整體轉錄活動進行高精確度檢測 可以用于分析真核生物復雜的轉錄本的結構及表達水平,提供最全面的轉錄組信息。從而可以在總體上全面研究基因表達,制定構建基因表達圖譜的首選策略,用以發現新的基因。

3.4 在代謝工程領域中的應用 動物細胞系目前已經被廣泛用于蛋白質藥物等產品的大量生產上,利用動物細胞表達蛋白其優勢在于有助于蛋白質正確折疊、組裝并進行翻譯后的修飾,目標蛋白質可正常行使其功能。轉錄組分析在減少細胞代謝負擔、控制細胞貼壁性、調控細胞生長活性等方面有成功的應用。

3.5 在藥用植物研究中的應用 目前,1/3以上的臨床用藥來源于植物提取物或其衍生物。隨著分子生物學向各個學科領域的滲透及蛋白質學和生物信息學的應用,闡明藥用植物天然活性成分生物合成途徑及其關鍵酶,實現關鍵酶基因的克隆與體外高效表達,利用現代生物技術手段及次生代謝工程,大規模生產藥用植物的有效成分將成為未來發展方向之一。

3.6 在瓜菜作物上的應用 轉錄組技術因具有測序通量高、時間短且成本低、信息量大等優勢,現已被廣泛應用于瓜菜作物轉錄組的研究中,如辣椒、南瓜、西葫蘆、西瓜、黃瓜、甘薯、大蒜、西蘭花、番茄等作物。這些研究運用RNA-seq技術,有助于發現瓜菜作物轉錄組的重要基因和SSR分子標記。此外,瓜菜作物在受到生物和非生物因素影響后,會引起自身代謝失衡等生理狀態的變化,而運用轉錄組學方法,可以研究特定時間、特定狀態下內源因子和外源因子調控的基因表達差異情況,在瓜菜非生物脅迫和抗病機制研究應用方面前景廣闊。

4 展望

隨著各種轉錄組學研究技術的發展,尤其是RNA-Seq技術的應用,轉錄組學研究已經進入了一個全新的階段。轉錄水平調控是生物體最主要的調控方式,對生物體細胞RNA的調控機制研究可以從基因組水平上進行。就目前來看,轉錄組測序技術正逐步取代傳統測序方法(如基因芯片技術)而成為研究基因的主要手段?,F階段,轉錄組學技術因其低成本和方便性已經受到廣泛重視。

猜你喜歡
組學基因組測序
PET影像組學在乳腺癌中的研究進展
兩種高通量測序平臺應用于不同SARS-CoV-2變異株的對比研究
“植物界大熊貓”完整基因組圖譜首次發布
我國小麥基因組編輯抗病育種取得突破
宏基因組測序輔助診斷原發性肺隱球菌
基于影像組學的直腸癌術前T分期預測
第一代基因組設計的雜交馬鈴薯問世
牛參考基因組中發現被忽視基因
生物測序走在前
基因測序技術研究進展
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合