?

病毒宏基因組學在新發病毒快速確認中的優勢

2021-11-29 14:09張文代紫苑鮑思雯茅慶慶
江蘇大學學報(醫學版) 2021年1期
關鍵詞:基因組學基因組核酸

張文,代紫苑,鮑思雯,茅慶慶

(江蘇大學醫學院,江蘇 鎮江 212013)

自然界中存在著數量龐大的未知新型病毒種類,而人類認知的病毒只占所有潛在病毒類型的0.1%[1],這些潛在的未知新型病毒極易造成新發病毒感染性疾病。研究人員經過實地調查研究結合統計學方法,認為哺乳動物體內尚未發現的未知病毒有近百萬種[1-2]。傳染病專家預計在未來相當長一段時間內,人類新發傳染病的病原體將主要來自動物體攜帶的未知新型病毒[3]。隨著科學技術、工農業和交通工具的快速發展,人類和資源的流通及人類接觸自然領域的速度和頻率迅速提高,這導致新發傳染病的發生案例逐年增多。近30年來全球出現的新發傳染病達100多種,并以每年新發2~3種的態勢發展,對人類健康危害巨大,已經成為全球公共衛生領域關注的焦點[4]。從近年來新發或再發的傳染病案例來看,其病原體多為病毒,如2020年全球爆發感染的SARS-CoV-2[5-6],頻繁爆發的新型禽流感病毒(avain influenza virus)[7]、中東呼吸綜合征冠狀病毒(MERS-CoV)[8]、寨卡病毒(Zika virus)[9]等。此外,臨床上尚有一些不明病因急性或慢性感染性疾病,給特異性診療帶來巨大困難。如臨床急性或慢性胃腸道疾病中有近40%的病例無法查出病因[10-11],有10%~20%的急性肝炎及30%的隱發性慢性肝病的病原體尚不明確[12-14];其中有些臨床不明病因的感染性疾病已經被證實與新發病毒的感染有關[15-17]。新發病毒的感染具有不可預知性且不易被傳統方法檢出,對此人類還沒有有效的早期防治措施。因此,新發病毒性病原體的快速確認技術對于臨床治療及疫情防控至關重要[8]。

目前,臨床上傳統的病毒檢測方法主要包括基于病毒基因的各類(RT-)PCR和基于病毒抗原抗體的血清學檢測。但這些方法的局限性是要提前預知病毒的基因序列或蛋白質序列信息,因此只能用于檢測已知病毒或變異幅度較小的毒株,而對于變異度較大或未知新型病毒則不能有效檢出。對于未知新型病毒,科研工作者可以用傳統的組織細胞培養法或電鏡觀察法確認其病原學特征,但這些方法也有其不可克服的局限性,其中細胞培養法只能針對部分病毒,且新型病毒的容納細胞在短時間內難以確定。而電鏡法則耗時耗力、靈敏度較低且不易定性鑒定病毒。近年來,隨著病毒分子生物學和下一代測序(next generation sequencing,NGS)等技術的不斷發展,一些新的病毒高通量檢測方法被應用到未知新型病毒的挖掘中,其中病毒宏基因組學技術越來越成為人類獵取未知病毒的高效工具[18-20]。

1 病毒宏基因組學原理

宏基因組也稱微生物環境基因組,由Handelsman等于1998年提出,其定義為環境中全部微小生物遺傳物質的總和[21],包括可培養的和不可培養的微生物的基因,目前主要指環境樣品中的細菌和真菌的基因組總和。與細菌和真菌相比,病毒的顆粒及基因組均遠小于它們。在傳統的宏基因組學研究中,病毒基因序列由于占比太小或被淹沒在海量的真菌及細菌基因序列中,難以被發現并進行分析。因此傳統的宏基因組學分析方法無法用來進行病毒群落分析[22]。病毒宏基因組學在宏基因組學的基礎上發展而來,主要用來解析特定環境或生物樣品中的病毒組,其概念由Edwards等[23]在2005年首次提出。隨后,美國加州大學的Delwart教授及美國哥倫比亞大學Lipkin教授對該方法進行了改進和發展,使該技術更加適用于大多數已知病毒和未知新型病毒的快速鑒定[2,22]。利用該技術,科研人員已經能夠檢測出可以感染人類及其他脊椎動物的病毒類型如圖1所示。除了人類及其他脊椎動物的病毒群落,該技術在大氣、土壤、植物病毒群落及噬菌體群落解析方面也有了大量的應用[20,22,24-25]。

該研究技術利用了病毒顆粒的兩個典型特征,即病毒顆粒小且核酸有致密的蛋白質衣殼保護?;诖颂攸c,可以利用微孔濾膜過濾的方法將樣品中真核及原核細胞與病毒顆粒分離開來,進而利用核酸消化酶(包括RNA酶和DNA酶)去除濾液中游離的非病毒衣殼保護的核酸,使樣品內病毒核酸占比顯著提高,從而可以利用下一代測序技術充分獲得樣品內的病毒核酸信息。因此,病毒宏基因組學摒棄了傳統宏基因組學對病毒組學研究的缺陷,可直接鑒定病毒群落的遺傳物質,不需要預先進行病毒基因序列特異性擴增。其測序技術早期通過一代測序技術(Sanger法)獲得病毒基因序列,隨后迅速發展到通過下一代測序來分析包括人類和動物糞便、血液、組織和呼吸道分泌物等樣本內的所有病毒序列組成。病毒宏基因組學中所謂“深度測序”主要集中在發現病毒及識別未知新型病毒或對已知病毒的變異類型進行研究,以更好地了解它們的遺傳及進化規律,從而達到對病毒群落進行無偏好性識別,且消除了在細胞培養中預先擴增后病毒多樣性降低的影響。例如,本次新冠病毒肺炎暴發感染之初,世界首個SARS-CoV-2全基因組序列便是通過病毒宏基因組學方法獲得[5]。

2 病毒宏基因組學技術流程

病毒宏基因組學分析流程主要包括樣品內病毒核酸富集、文庫構建、下一代測序、生物信息學分析幾個主要步驟,加上后期新發病毒與特定疾病關聯性驗證,其詳細分析技術路線如圖2所示。

2.1 病毒核酸富集

由于絕大多數病毒的基因組遠小于真核及原核生物基因組,如果事先不進行病毒核酸富集而直接對臨床樣本進行核酸測序,將導致真核及原核遺傳物質(包括游離基因組序列和核糖體RNA序列)的背景較高[26]。為了減少這類背景噪音,可以使用微孔濾膜(包括0.45 μm)過濾方法來純化病毒,以排除較大的其他大型顆粒。過濾后的濾液通過核酸酶(包括RNA酶和DNA酶)消化大量存在于臨床樣本中的裸露細胞核酸,病毒核酸因被病毒衣殼保護而不被核酸酶消化。當樣本體積較大時,例如在環境研究中,也可以使用超速離心方法從預期密度帶中濃縮和提純病毒顆粒[27]。

2.2 文庫構建及下一代測序

經過上述處理步驟之后,盡管樣品內病毒核酸的相對占比大幅度提高,整個樣品內核酸的絕對濃度卻會顯著降低。因此,在病毒宏基因組學研究中,不管使用基于哪種測序方法進行基因文庫的構建,病毒核酸都需要進行擴增,才能產生下一代測序平臺所需的大量DNA。對于RNA病毒,則首先需要將其RNA基因組逆轉錄成cDNA。各種不依賴已知序列的DNA擴增方法已經被成功地使用,其中隨機引物法目前占據主導地位。該方法將隨機引物(通常為6堿基隨機引物)放置在特定標簽序列的3′端,隨機引物的簡并性允許引物在病毒RNA或DNA基因組的整個長度內退火[24]。將這樣的引物放置在病毒序列的兩端進行兩輪延伸之后,再用其攜帶標簽序列作為引物進行多輪PCR擴增,即可獲得大量病毒DNA,然后再通過特定方式加上適用于下一代測序的接頭序列進行深度測序。近年來,單引物等溫擴增(single primer isothermal amplification,SPIA)和多重置換擴增(multiple displacement amplification,MDA)兩種等溫擴增技術也在病毒宏基因組學研究中大量使用,特別是針對特定目的病毒(如呼吸道樣品內的SARS-CoV-2)的核酸檢測方面取得了良好的效果[28]。

羅氏公司454測序系統是最早用于未知新型病毒挖掘的高通量測序工具。該測序方法可產生較長的讀長,其單個讀長可達到500 bp,這便于識別高度變異的病毒序列[29]。隨后,Illumina公司下一代測序分析平臺由于兼具讀長(單個讀長可達300 bp)和測序深度兩大特點而成為病毒宏基因組學研究的主要測序方法。近來Pacific Biosciences及Oxford Nanopore推出的三代測序技術,可以在數小時而不是幾天內提供大量更長讀長的測序數據,使得病毒宏基因組學研究更加快速、結果更加可靠[30]。然而,測序高錯誤率是這些高通量技術固有的缺點。在病毒宏基因組學分析中,通常使用BLASTx搜索分析樣品內的病毒序列,下一代測序中的移碼突變會改變病毒基因組內的開放閱讀框(open reading frame,ORF),從而干擾蛋白質相似性搜索,繼而影響高變異型病毒的鑒別。使用基于核苷酸序列相似性搜索(如BLASTn)時,移碼突變對鑒別已知病毒病原體的影響則較小。當然,如果樣品內病毒滴度比較高或下一代測序的深度較深,那么測序過程中產生的突變則可以被序列拼接過程中的高覆蓋率所糾正。盡管下一代測序也可以用來檢測罕見的病毒變異(如HIV抗藥性突變體),但在野生型病毒準種鑒定方面卻需謹慎使用[31]。

2.3 病毒宏基因組學研究中的生物信息學分析

為了便于識別未知新型或高度變異型的病毒,下一代測序所產生的原始數據需要經過從頭拼接,以將文庫內所有DNA短序列組裝成更長的重疊群。完成這一分析的軟件眾多,包括適用于Windows系統的CLC genomic workbench和Linux系統的ENSEMBLE assembler等[32]。序列拼接完成后,使用NCBI開發的BLAST工具,在核酸或蛋白質公共數據庫中搜索重疊群和未組裝的單體序列。核苷酸相似性搜索(BLASTn)可以快速識別與已知病毒物種序列密切相關的序列。而與公共數據庫中的已知病毒核酸具有高度分歧度的病毒序列則無法使用核苷酸相似性搜索來識別,需要將它們的潛在翻譯產物與所有已知病毒蛋白序列數據庫進行更嚴格的計算比較(BLASTx),以檢測較弱的匹配?;谥丿B群或者單體序列的BLASTx搜索結果可以直接導入其他軟件,獲得某個樣品內病毒群落的組成。實現此類分析的一個常用軟件為MEGAN 6.0,它不但可以顯示某個文庫內的病毒群落組成,還可以根據序列數的多少給出樣品內各類病毒的相對含量信息,有利于判斷樣品病毒群落內的優勢病毒[33-35]。此外,該軟件還可以根據不同樣品的BLASTx搜索結果進行橫向比較,從而分析一組樣品不同樣品間病毒群落及特定病毒的異同,確定一個研究群落內的優勢病毒類型,有利于確定特定疾病與某種病毒感染的相關性。一般來說,一旦潛在的新的病毒科、屬及種的全基因組序列被獲得,它的遺傳分類地位及其與已知病毒科屬種之間的遺傳關系可以很快通過系統發育分析來確定[36]。在此過程中,需要檢索與待分析病毒相關的已知科屬種病毒的代表毒株的基因組或保守蛋白序列,經過序列多重比對(multiple sequence alignment,MSA),使用系統發育分析軟件(如Mega 7.0及MrBayes等)構建系統發育樹,從而直觀表示新型病毒的遺傳分類地位[37]。對來自任何特定宿主群體(如脊椎動物、節肢動物、原生動物、植物和原核生物)的新病毒科的鑒定將有助于在其他宿主中檢測它們的同源病毒。

3 新發病毒與特定疾病的關聯分析

目前,部分常見病仍然沒有確切病原,包括部分急性胃腸炎、急性呼吸道感染、肝炎和腦炎等。此外,一些自身免疫性疾病和癌癥也可能是由仍未確定的病毒感染觸發。因此,病毒宏基因組學為識別此類疾病的候選病原體提供了一種簡單的工具。近年來,病毒宏基因組學技術測定了大量人類和動物體內的病毒群落[20]。雖然眾多未知新型病毒是在不明病因的患者臨床樣本中發現的,但它們在臨床樣本中的存在和發現可能是一種巧合,與這種特定疾病的發生沒有必然聯系,而只是反映了機體內的無害感染[18,25]。一種鑒定出的新病毒可能真的是感染人類的病毒,也可能只是簡單地攝入或吸入,然后一過性地通過腸道或支氣管腔而并不感染人體。研究發現,在人類和動物糞便中普遍檢測到攝入的植物、動物和昆蟲病毒核酸[37-38]。檢測到這類核酸只是證明了它們在消化道中具有存活的能力。而人類血清中特異性抗體的檢測可以用來證明病毒在人體內的復制。不同于人類腸道、呼吸道分泌物或皮膚樣品檢測到的病毒,血液、組織或腦脊液中檢測到的病毒更可能是病毒復制的證據。但病毒在人類體內的復制不能被認為是病毒致病的確鑿證據,因為病毒可以在易感細胞培養過程中繞過宿主限制,而且許多病毒可以在體外非宿主物種的細胞系中生長。因此,研究新發病毒的感染與特定疾病的關聯分析就尤為重要,可以防止不必要的干預,如抗生素治療,并改進治療措施和傳播預防。

對于新發病毒與特定疾病的關聯性研究,可以在病毒宏基因組學研究獲得病毒基因組序列的基礎上,使用(RT-)PCR法比較患者和健康對照樣本中的病毒攜帶率,也可以輔以定量PCR檢測方法比較疾病群體與健康對照群體體內病毒載量。在病毒流行感染期間,病毒特異性抗體的檢測也是判斷特定疾病與該病毒感染相關性的重要依據。當然,由于不同人群的病毒暴露和易感性可能有很大差異,因此疾病群體和對照樣本需要在流行病學上高度匹配,特別是年齡及地理來源。如不能將疾病群體與對照樣本正確匹配可能會導致錯誤結果。疾病關聯研究最好也涉及來自不同地區或國家的不同年齡組。這種關聯研究的結果可以高度提示新發病毒的致病作用。最終,要確切證明疾病與新發病毒感染之間的關聯,需要不同的研究小組使用不同的患者和對照樣本進行確認。使用特定的抗病毒藥物或接種病毒后,感染者恢復期血清特異性抗體的降低、癥狀的減輕、疾病患病率的降低是證明新發病毒致病性的直接方法。但這些措施只針對高致病性和流行的病毒感染。新發病毒致病性的最終確認首先取決于如上所述的疾病關聯性試驗。

4 病毒宏基因組學技術用于臨床快速診斷的展望

誠然,病毒宏基因組學技術目前還存在成本高、分析步驟煩瑣、分析周期長等不足之處。一旦這些重要的障礙被突破(當然這些缺陷相信會很快解決),病毒宏基因組學技術將是一個很具潛力的快速診斷臨床病毒感染的方法。同時,在生物制品的開發和制造過程中,該技術也可以用來檢測病毒污染[39-40]。該方法要實現從科研到臨床快速診斷,縮短整體技術流程所需的時間是首先要解決的問題,從臨床樣本采集到序列數據生成和生物信息學分析的時間縮短到具有臨床意義的1天乃至數小時,有利于臨床的早診斷、早治療,這將提高人們利用測序方法進行臨床診斷的吸引力。成本問題是另外一個急需解決的問題,當單一病毒檢測的成本相當低時,則可以把病毒檢測作為醫療單位常規檢查之一。當然,持續存在的DNA污染問題和極低水平的病毒核酸檢測的醫學意義也需要解決。如果上述問題能夠成功解決,病毒宏基因組學技術有望成為單一全覆蓋式的病毒快速檢測方法,從而取代臨床許多病毒特異性測試。此外,在科研領域,新病毒的發現、病毒基因組的重新測序及病毒基因突變等方面,病毒宏基因組學技術仍然會廣受歡迎。

猜你喜歡
基因組學基因組核酸
“植物界大熊貓”完整基因組圖譜首次發布
全員核酸
我國小麥基因組編輯抗病育種取得突破
核酸檢測點上,有最可愛的平江人
第一次做核酸檢測
第一代基因組設計的雜交馬鈴薯問世
牛參考基因組中發現被忽視基因
核酸檢測
本草基因組學
本草基因組學
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合