?

哪些動物病毒會感染人?計算機競相找答案

2022-06-27 09:54編譯槳篤繪
世界科學 2022年6期
關鍵詞:卡爾森蝙蝠病原體

編譯 槳篤繪

鼠痘于20世紀30年代被人類首度發現,是一種烈性傳染病,能在老鼠群體內傳播且對它們高度致命,不過科學家長期以來從未將其視為人類的潛在威脅。然而,現在的情況似乎有所不同。美國喬治城大學生物學家科林·卡爾森(Colin Carlson)博士和他的同事——以及他們計算機上的病毒預測模型——發現鼠痘病毒并不簡單。

過去幾年,卡爾森等人嘗試通過機器學習,對計算機進行編程,令其能夠自主學習認知病毒,預測可能感染傷害人類的微生物。他們的計算機梳理了大量關于這些病原體動物宿主的生物學和生態學信息,以及病毒自身的基因組等特征。隨著時間的推移,機器開始認識到某些因素有助于預測病毒是否有可能蔓延到人類身上。

美國喬治城大學的生物學家科林·卡爾森一直在對計算機進行編程以促使其自學病毒知識

當算法確認了某種已知病毒的跨物種傳播風險,卡爾森和同事就會將其列入“風險名單”。在近期的工作中,算法出人意料地將鼠痘病毒放到了危險病原體名單的前列。

用卡爾森的話說:“我們每次運行AI模型,都會認為它有著很大的威脅?!?/p>

卡爾森等人通過文獻發現了一場暴發于1987年中國農村的疫情。那次疫情令很多學齡兒童感染并出現喉嚨痛和手腳發炎的癥狀,但此后一直被人遺忘。直到幾十年后,一組科學家對疫情期間收集保存的咽拭子樣本進行測試,發現其中含有鼠痘病毒DNA。然而他們的這項工作雖于2012年發表,卻幾乎沒有引發關注。如果卡爾森等人編寫的計算機程序預測準確,鼠痘病毒就需要被重新審視。

科學界已經確定了大約250種由動物病毒跨物種傳播而引起的人類疾病,例如來自黑猩猩的HIV引發艾滋病,由蝙蝠攜帶的SARS最終導致非典。

在科學家看來,理想的情況是在某個病毒溢出至人類以前就認出它來,但病毒學家所需要研究的動物病毒太多了,到目前已有1 000多種來自哺乳動物的病毒被學界確認,而且此數據很可能還不到真實數目的百分之一——部分研究者推測哺乳動物攜帶數以萬計的病毒,另一些學者則懷疑這個數目高達幾十萬。

卡爾森博士的合作對象、疾病生態學家芭芭拉·韓

為識別潛在的新溢出效應,包括卡爾森博士在內的不少專家都在使用計算機尋找隱藏于科學數據中的模式。

卡爾森博士的合作對象、美國卡里生態系統研究所的疾病生態學家芭芭拉·韓(Barbara Han)表示:“AI模型就像研究者的另一雙眼睛,幫我們看到原本看不到的維度?!?/p>

韓博士第一次接觸機器學習是在2010年。計算機科學家幾十年來一直致力于開發此項技術,并嘗試利用它構建強大工具。如今,機器學習已經使得計算機能夠發現欺詐性信貸以及識別人臉,但很少有人將機器學習應用于疾病預判。韓博士想知道可否用它來回答某些懸而未決的生物學問題,例如為什么不到10%的嚙齒動物物種攜帶著已知能感染人類的病原體。

她向計算機輸入有關嚙齒類動物的信息(從斷奶年齡到種群密度),然后機器就瞄準那些已知攜帶大量跨物種病原體的嚙齒動物,尋找它們身上不同于其他鼠類的特征。

一旦計算機創建了一個模型,韓博士就可以把它用在動物身上,以測試其準確度,看看它給出的危險鼠類名單是否符合真實情況。最終,她發現AI模型的準確率高達90%。

接著,韓博士和同事轉向嚙齒動物身上尚未被發現向人類溢出的病原體,借助模型列出了一份高風險物種名單,其中北美西部的山地田鼠(Montane Vole)和北部食蝗鼠等物種極有可能是高危病原體的攜帶者。

在研究人員向計算機提供的所有特征中,最重要的是嚙齒動物的壽命。短壽物種往往攜帶更多病原體,這可能是因為它們的演化動力將更多資源用于繁殖而非建立強大免疫系統。

韓博士等人在研究過程中梳理了生態數據庫和學術文獻,以尋找有用數據。最近,一些學者創建了專門用于給計算機傳授病毒方面知識的數據庫。

2022年3月,卡爾森博士和同事公布了一個名為VIRION的開放存取數據庫,該庫目前已收集50萬條有關9 521種病毒及其3 692種動物宿主的信息,并且還在不斷擴增庫存。

像VIRION這樣的數據庫現可就新型流行病提出更具針對性的問題。當新冠病毒來襲時,卡爾森博士、韓博士和他們的同事創建了計算機程序,用以識別最有可能攜帶SARS-CoV-2相關病毒的動物。

SARS-CoV-2屬于β冠狀病毒屬。這個家族還包括SARS和MERS病毒。大多數情況下,β冠狀病毒會感染蝙蝠——2020年1月人類首次發現新冠病毒之時,已知有79種蝙蝠是β冠狀病毒的攜帶者。但科學家們還沒系統性地對全部(1 447種)蝙蝠開展搜索工作以尋找它們身上的β冠狀病毒蹤跡(此類項目需要數年方可完成)。

通過將各種蝙蝠的生物學數據(包括飲食和翅膀長度等)輸入計算機,卡爾森博士、韓博士和他們的同事創建了一個模型,可預測哪些蝙蝠最有可能包藏β冠狀病毒。他們借助模型發現了超過300種滿足“藏毒”條件的蝙蝠。

自2020年開始預測至今,研究人員總共確認了47種攜帶β冠狀病毒的蝙蝠——這47種全部位列該AI預測名單。

美國俄克拉荷馬大學的疾病生態學家丹尼爾·貝克爾(Daniel Becker)也參與了β冠狀病毒研究,用他的話說:“基于體型之類的簡單特征就可實現對病毒的高效預測,這樣的預測工具真的令人震驚?!?/p>

需要指出的是,如果專家確實發現了某個危險目標,他不能即刻宣稱它對人類構成迫在眉睫的威脅。研究團隊必須先進行大量實驗來確認。

加州大學戴維斯分校的流行病學家普拉納夫·潘迪特(Pranav Pandit)博士指出,這些AI模型在很大程度上仍是一項正在探索的工作,還不夠完善,它們的預測比隨機選擇更優,但顯然可以更優?!艾F在還不是可以大膽相信和發布此類預測結果的時候,我們還不能根據計算機的答案告知全世界,這是一種從動物傳至人類的病毒?!?/p>

英國格拉斯哥大學計算病毒學家納爾杜斯·莫倫策(Nardus Mollentze)和同事開創了一種可顯著提高模型準確度的方法。他們的模型并不著眼于病毒的宿主,而關注它的基因。計算機經深度學習后掌握了洞察病毒基因的方法。對于那些可能感染人類的危險病原體,AI知道怎么找出其基因中的細微特征。

北部食蝗鼠是韓博士團隊預測的一種攜帶危險病原體的物種

莫倫策等人的模型在超過70%的時間里都展現出準確識別危險病毒的能力。他們目前還無法闡清這個基于基因的模型如此優秀的原因,但也已略有頭緒:人體細胞可以識別外來基因并向免疫系統發出警報,而能感染人體細胞的病毒或許具備模仿人類DNA以實現偽裝的能力。

當莫倫策和同事將模型應用于動物病毒后,他們列出了272個具有高溢出風險的種類。這個數目對病毒學家而言太多了,他們做不到深入研究近三百種病原體。美國落基山實驗室(RML)的病毒學家艾米·德威特(Emmie de Wit)負責監督關于SARS-CoV-2、流感及其他病毒的研究。用他的話說,“我們真的需要縮小范圍”。

莫倫策博士也承認,他們需要找到一種確定最危險病毒的方法,“這只是一個開始”。

莫倫策正在與卡爾森等人合作,嘗試將病毒基因的數據,以及病毒宿主的生物學和生態學相關數據合并起來。他們通過此方法獲得了一些不錯的結果,其中包括鼠痘病毒的跨物種風險。

其他類型的數據也可能提高預測準確度。例如,病毒最重要的特征之一是其表面包裹的糖分子。不同病毒有著不同的“糖被”模式。有的病毒可以利用糖被來躲避宿主的免疫系統,有的則能借助糖分子鎖定新細胞,引發新感染。

近期,卡爾森等人發表評論稱,機器學習可能會從病毒及其宿主細胞的糖被處獲得很多見解??茖W家已經掌握了大量相關知識,但尚未將其轉化成可用于機器學習的形式。

德威特博士表示,“機器學習模型有朝一日可以指導像她這樣的病毒學家研究動物病毒,它必能令我們受益無窮”。但德威特也指出,迄今為止的模型主要集中于病原體感染人體細胞的可能性,而在引發新的人類疾病之前,病毒還必須實現人與人之間的傳播,且能引起嚴重病癥——她等待著能設計出這方面預測的新一代模型?!拔覀冋嬲腩A測的,不一定是哪些病毒會感染人類,而是哪些病毒會引發疫情?!?/p>

資料來源 The New York Times

猜你喜歡
卡爾森蝙蝠病原體
加入“今天俱樂部”
野生脊椎動物與病原體
病原體與自然宿主和人的生態關系
卡爾森國象棋王遭遇挑戰
伊犁地區蝴蝶蘭軟腐病病原體的分離與鑒定
病原體與抗生素的發現
蝙蝠
海航收購卡爾森 全球化戰略再下一城
蝙蝠女
蝙蝠為什么倒掛著睡覺?
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合