?

治療性抗體可開發性評估研究進展

2021-03-26 02:30AnthonyMackitzDZISOO任麗萍謝詩揚周雨薇
電子科技大學學報 2021年3期
關鍵詞:開發性信息學抗體

Anthony Mackitz DZISOO,任麗萍,謝詩揚,周雨薇,黃 健*

(1.電子科技大學生命科學與技術學院 成都610054;2.成都東軟學院健康醫療科技學院 成都611844)

抗體在重大疾病的預防、診斷與治療中起著至關重要的作用??贵w相關基礎與應用研究,既具有重大科學意義,又與國民經濟和社會發展息息相關??茖W家對抗體的研究已先后7次獲得了諾貝爾獎。例如,1901年,首枚諾貝爾生理學與醫學獎,授予了德國科學家馮·貝林,表彰他開創了血清療法,尤其是在治療急性呼吸道傳染病白喉中的成功應用。當前,新冠肺炎肆虐全球,康復患者血漿療法臨危受命,其實質是馮·貝林開創的抗體過繼被動免疫療法。又比如,已廣泛使用的新冠病毒IgM/IgG抗體膠體金法快速檢測試劑盒,臨床試驗中的托珠單抗治療新冠肺炎重癥患者,均依賴于1984年榮獲諾貝爾獎的雜交瘤單克隆抗體技術。

由于抗體既是生物醫學科學研究不可或缺的工具,又是疾病防治的利器,所以抗體產業迅速發展壯大。尤其是抗體藥物,已經給人類健康與生物醫藥產業帶來了革命性變革,不少化學小分子不能作用的蛋白成為抗體治療的高效藥靶。據統計,美國FDA批準上市的抗體藥迄今已多達92種,適應癥范圍覆蓋了各類腫瘤、多種自身免疫性疾病、眼科及一些罕見病等多個方面,年銷售額約1000億美元。近十年來,全球最暢銷藥物前十強中,抗體藥物占據半壁以上江山,近年更是屢拔頭籌。例如,治療多種自身免疫病的阿達木單抗,單個品種的年銷售額就已接近200億美元;淘選該單抗所用到的噬菌體展示技術也獲得2018年諾貝爾獎。

目前,全球正在進行I、II期臨床試驗的抗體藥物超過550種,另有79種已進入開發的最后階段,再創新高[1]。但是,即便是人源或人源化抗體,即便已進入到臨床試驗階段,最終能夠成功開發上市的只有15%左右[2]。如何提高抗體開發的成功率,降低開發后期失敗帶來的人力、物力、財力的浪費及時間上的耽擱是抗體產業界想要解決的重大難題。由于二代測序與噬菌體展示抗體技術的廣泛應用[3-5],全球研究機構與制藥公司臨床前階段的候選抗體數以萬計。只有從中找出具有理想藥效、安全性和藥代動力學特性,并且具有理想的理化特性,滿足生產、制劑工藝各項技術要求的先導抗體,才能提高后期開發的成功率。上述過程就是抗體的可開發性(developability)評估[6]。目前,化學小分子的成藥性可用簡單成熟的“里賓斯基5規則”來快速評估[7],但抗體大分子還沒有類似評價標準。因此,如何全面、合理、快速地對海量候選抗體進行可開發性評估,是抗體藥物開發領域亟待解決的關鍵科技問題。本文結合國內外抗體可開發性評估的研究現狀,聚焦抗體生物信息學尤其是可開發性預測研究的進展,總結存在的問題,提出可能的解決方案。

1 抗體可開發性的實驗研究

抗體藥物開發是資金與技術密集型行業,充滿挑戰。一個抗體藥從臨床前到批準,開發費用超過10億美元[8]。為了降低后期研發失敗的風險與損失,提高成功率,臨床前階段就要對候選抗體進行可開發性評估。廣義上,可開發性評估包括:有效性與安全性、可生產性(manufacturability)、系列理化特性等3個部分[6]。傳統上,開發者用于篩選抗體的首要標準是抗體與相應抗原的親和力,可用酶聯免疫吸附、石英晶體微天平、表面等離子體共振、功能測試等實驗進行檢測[9];其次是抗體在動物實驗中的藥效、藥代動力學特性及安全性??缮a性相關的影響因素主要包括抗體生產細胞系穩定性、表達水平、純化回收率、放大生產性能、制劑穩定性、生產成本等,是涉及細胞工程、抗體工程、發酵工程、藥劑學等相關大量實驗技術的系統工程。其中,HEK滴定可測定抗體表達水平,常用來反映可生產性[10]??贵w的有效性、安全性與可生產性主要取決于抗體本身的生物物理與生物化學特性。因此,對抗體生物物理與生物化學特性進行測試評估近年來迅速成為研究熱點。相關實驗方法主要有:差示掃描熒光實驗(TmDSF),反映抗體三維結構的穩定性;親和捕獲自相互作用納米顆粒光譜(AC-SINS)、克隆自相互作用生物膜干涉(CSI-BLI)、疏水相互作用色譜(HIC)、直立單層色譜(SMAC)、體積排除色譜(SEC),反映了抗體的粘度、聚集傾向、溶解度等;交叉作用色譜(CIC)、與常見抗原或桿狀病毒顆粒(BVP)的酶聯免疫吸附試驗、多特異性試劑結合試驗(PSR),反映了抗體結合特異性[9-10]。當前,采用多種實驗方法對抗體進行綜合測試已成為一種趨勢。例如,文獻[10]對FDA批準上市或已進入二期或三期臨床試驗的137個抗體進行了12種實驗測定。他們給每項實驗中表現最差的10%的抗體標記一項缺陷,匯總結果顯示,65%的已獲批抗體無缺陷,而二期臨床試驗中的抗體大多有一項或多項缺陷,提示大規模綜合實驗測試有助于篩選到可開發性更高的候選抗體。然而,實驗測試費力、費時、費錢。制藥巨頭默克公司的最新研究結果認為,要篩選到一個最佳先導抗體,至少要按此實驗流程測試100~1000個抗體分子[9]。因此,要降低抗體藥物研發成本,加快研發速度,就需要更多、更好、更全面的生物信息方法用于抗體可開發性評估。

2 抗體生物信息學研究進展

在生物信息學研究中,構建專業的數據庫和高質量的數據集是關鍵的基礎性工作。沒有相應的專業數據支持,后續研究工作很難開展,抗體生物信息學研究也不例外。1970年,免疫學家Kabat開風氣之先,構建了世界上第一個抗體數據庫。目前,全世界商業的、學術的抗體數據庫已有幾十個。根據抗體數據庫收錄范圍,可將其分為綜合數據庫與專業數據庫。前者如IMGT[11],既包括治療性抗體,又包括其他抗體,甚至還包括T細胞受體、HLA等其他免疫分子。后者如東南大學開發的iCAN,專注納米抗體[12];牛津大學的Thera-SAbDab,只收治療性抗體[13]??贵w數據庫研究的一個趨勢是更加專業化。根據抗體數據庫的主要內容,可分為3類[14]。第一類是以抗體基因或蛋白質序列為主的數據庫,如Kabat、iReceptor[15]等。第二類是以抗體結構為主的數據庫,如AbDb等[16]。第三類是以抗體實驗數據為主的數據庫,如ABBIND[17]等。當前,抗體數據庫研究存在的最大問題就是序列、結構、實驗數據之間脫節。因此,數據整合是抗體數據庫研究的另一發展趨勢。例如,ABCD數據庫嘗試整合抗原與抗體的信息[18],IMGT、abYsis[19]整合了序列與結構信息,SAbDab整合了結構與親和力實驗數據信息[20]。盡管如此,抗體領域數據整合的嘗試仍不充分,缺乏對序列、結構、實驗數據等3類數據的有機整合,特別是仍然只關注抗原抗體結合的實驗數據,而忽略了抗體可開發性相關實驗得到的抗體生物物理與生物化學特性的實驗數據。

有了數據支撐,抗體生物信息分析軟件紛紛問世,相關軟件或網絡服務已有近百種,廣泛用于抗體理化性質計算、翻譯后修飾位點及化學降解位點預測、序列比對分析、抗體三維空間結構建模、表位與對位預測、抗體設計、免疫原性預測、可開發性預測、抗體庫分析與設計等。最近,文獻[14]對此做了系統的總結與綜述,這里不再枚舉。值得指出的是,一些通用的生物信息預測分析軟件,如分子對接軟件、翻譯后修飾位點預測軟件等,也在抗體生物信息學研究中廣泛應用,我國不少研究組對此皆有貢獻。

3 抗體可開發性預測研究進展

抗體可開發性預測已經成為抗體生物信息學研究的重要組成部分。2000年,百時美施貴寶公司科學家Lipper等首次將可開發性這一術語用于化學藥物開發中的先導化合物選擇與優化。直到2012年,麻省理工學院的Trout課題組才將這一術語引入抗體藥物研發領域[21]。他們與諾華公司合作,花了兩年時間測定了12種抗體的長期穩定性數據??贵w的穩定性很大程度上取決于是否容易聚集,而這又主要取決于抗體的疏水相互作用及靜電相互作用。所以,他們根據全長抗體的結構,計算了抗體的凈電荷;又根據決定簇互補區的空間結構,計算了抗體的空間聚集屬性(spatial aggregation propensity,SAP);然后用這二者定義了可開發性指數(developability index,DI)?;谠撝笖?,通過回歸模型可定量預測抗體的聚集傾向與穩定性。該方法已集成到工業級藥物設計分子模擬計算平臺Discovery StudioTM中,成為業界進行可開發性評估的常用生物信息學方法。遺憾的是,這似乎進一步增加了抗體研發成本,因為購買該平臺大概需要100萬元人民幣左右。雖然如此昂貴,但該方法基于抗體晶體結構或同源建模形成的理論結構進行計算,其消耗計算資源、速度慢、準確率受理論預測模型精度的影響大,所以難以對篩選后的抗體文庫進行高通量評估。因此,抗體可開發性預測研究的一個發展趨勢是根據抗體序列而非空間結構來進行預測。

龍沙生物的Stallwood課題組采用了寡聚體檢測與高效液相凝膠色譜兩種實驗方法檢測了500多種抗體;經過主成分分析后選取了9種與親水性、疏水性、靜電、大小、氫鍵、側鏈表面積等相關的氨基酸屬性量表,采用了偏最小二乘、隨機森林、高斯過程、AdaBoost集成學習等方法建立模型將抗體分成高聚集或低聚集兩類;最終AdaBoost方法獲得了準確率84%的最佳預測模型[22]。該方法的優點是只需要抗體的氨基酸序列,速度快;缺點是不能定量,只能定性,且軟件歸屬龍沙公司,收費使用。2017年,Adimab公司在902個抗體晶體結構數據基礎上,采用隨機森林方法建立了根據抗體序列直接預測其可變區每個氨基酸殘基液相可及表面積(SASA)的模型;他們進一步研究了抗體疏水相互作用色譜滯留時間與SASA之間的關系,使用邏輯回歸實現了只根據抗體氨基酸序列就能預測與抗體可開發性緊密相關的疏水相互作用[23]。

本課題組將文獻[10]對137個抗體進行的12種實驗測定結果作為金標準,采用支持向量機訓練了僅根據抗體序列就能夠預測其是否存在交叉或自身相互作用缺陷的免費網絡服務CISI,五折交叉檢驗中準確率達到88.2%,可快速高通量地從一個方面反映抗體的可開發性[24]。文獻[25]進一步根據直立單層色譜(SMAC)、體積排除色譜(SEC)、疏水相互作用色譜(HIC)等反映抗體疏水相互作用傾向的實驗數據,構建了基于抗體序列預測其是否存在疏水相互作用缺陷的免費網絡服務SSH,余一法檢驗中準確率達到91.2%??贵w疏水相互作用與其溶解度、聚集傾向等可成藥性質密切相關,因此SSH可快速高通量地從另一個方面反映抗體的可開發性。牛津大學Deane課題組對比分析了242種臨床I期后抗體與大量二代測序人天然抗體的序列與結構,提出了治療性抗體可開發性評估的5項指導意見:1)決定簇互補區(CDR)的總長度不能太長或太短;2)CDR附近表面疏水區不能過大或過??;3) CDR附近正電區不能過大;4)CDR附近負電區不能過大;5) 重鏈和輕鏈的凈電荷要對稱。他們給出了相應閾值,開發了免費的網絡服務TAP[26]。使用該服務雖然只需要輸入待預測抗體重鏈與輕鏈的可變區序列,但TAP在后臺會進行分子建模與多種結構生物信息學的計算分析,需要花費較長的時間,不大適用于大規模的抗體可開發性評估。

最近,來自全球十余家制藥公司的近二十位學者共同總結了治療性抗體結構、異質性及可開發性評估的流程[6]。他們把抗體可開發性評估分為3大步驟。首先是序列分析,發現有各種問題的或不必要的氨基酸殘基或序列特征;其次是廣泛檢測抗體的熱穩定性、可溶性、粘度、疏水性等各種理化性質;最后是強制降解實驗[6]。

事實上,各種生物信息學方法已經主導了上述評估流程的第一步。其后兩個步驟,雖然目前仍然以實驗為主,但也提示抗體可開發性預測還有很多工作需要進一步開展與深入。目前,可開發性預測已經成為抗體生物信息學研究的前沿與熱點,但仍然存在不少問題。例如:1)較多依賴結構,影響計算速度,難以勝任二代測序時代抗體庫級可開發性篩選需求;2)集中在抗體個別的生物物理與生物化學屬性,如聚集屬性,缺乏對更多實驗方法、更多理化特性及其相互關系的研究;3)用于學習與訓練的數據有限,評價中較多使用交叉驗證或個案說明,獨立數據集或實驗驗證不足,真實應用場景中的性能與效果有待進一步驗證。

總之,在抗體可開發性評估領域,急需開展數據整合與專業數據庫構建,并在此基礎上進行機器學習輔助的可開發性預測研究并實驗驗證。這些工作的開展,不僅可能發現抗體可開發性背后從序列到結構到功能的科學規律,其專業數據庫及可開發性預測工具等平臺也將有助于降低研發成本,提高抗體藥物的研發效率,有助于包括新冠肺炎在內的各種重大新發傳染病抗體藥物的開發[27],具有重要的社會經濟意義。

猜你喜歡
開發性信息學抗體
科技型中小企業開發性金融融資戰略的相關研究
雞NRF1基因啟動子區生物信息學分析
初論博物館信息學的形成
開發性核電廠廠址保護工作探索與初步實踐
抗HPV18 E6多肽單克隆抗體的制備及鑒定
開發性金融支持現代農業示范區建設的實踐與探索
乙肝抗體從哪兒來
Galectin-7多克隆抗體的制備與鑒定
miRNA-148a在膀胱癌組織中的表達及生物信息學分析
開發性金融助推四川棚戶區改造
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合