?

計算機虛擬篩選技術在害蟲行為調節劑研究中的應用

2023-09-25 11:47付冠軍周亞楠劉萬學錢萬強萬方浩
生物安全學報 2023年3期
關鍵詞:調節劑嗅覺配體

付冠軍, 黃 聰, 周亞楠, 劉 博, 劉萬學, 錢萬強, 萬方浩*

1中國農業科學院農業基因組研究所,廣東 深圳 518120; 2青島農業大學植物醫學學院,山東 青島 266109; 3中國農業科學院植物保護研究所植物病蟲害生物學國家重點實驗室,北京 100193

自然環境中存在十分復雜的化學信息,昆蟲能夠利用其敏銳的嗅覺系統感受環境中的各種氣味信息,并對其做出相應的生理響應和行為反應,例如覓食、求偶、寄主定位、躲避天敵和定位產卵場所等(婁永根和程家安,2001; 王桂榮等,2004)。利用氣味信息干擾昆蟲正常的行為活動是害蟲綠色防控的手段之一,與化學農藥相比,以氣味化合物為活性物質的昆蟲行為調節劑具有環境友好及抗性發展緩慢等特點(楊斌等,2020)。目前,昆蟲行為調節劑活性物質的來源主要包括昆蟲自身通過腺體釋放的信息素以及寄主植物所釋放的化合物(閆鳳鳴等,2013)。明確對昆蟲具有行為調控活性的化合物是昆蟲行為調節劑開發的關鍵,過去實現這一目的主要借助于一系列生物測定的方法,例如:利用氣相色譜質譜聯用技術(gas chromatograph-mass spectrometer, GC-MS)進行昆蟲生境中化學信息的成分鑒定;氣相色譜觸角電位聯用(gas chromatography-electro antenna graphic detection, GC-EAD)、觸角電位反應(electro antenna graphy, EAG)等技術驗證昆蟲對特定化合物刺激是否產生電生理響應;Y型嗅覺儀等行為活性測試裝置驗證目標化合物對昆蟲行為的影響(尹海辰等, 2020);爪蟾卵母細胞、人類胚胎腎細胞以及果蠅空神經元等異源表達系統(Bengtssonetal.,2014; Grosse-Wildeetal.,2007; Liuetal.,2014; Sakuraietal.,2004)或RNAi、CRISPR/Cas9等基因編輯技術(Chenetal.,2020; Guoetal.,2020)來確定活性成分及其作用的分子靶標。然而,由于昆蟲生境中的化學信息種類繁多,加上生物測定方法工作流程繁瑣、耗時耗力,亟需發展一種新的方法并輔助傳統方法進行活性化合物的篩選,進而提高昆蟲行為調節劑先導化合物的篩選效率。

隨著計算機技術的迅速發展,基于計算機的藥物虛擬篩選為實現高通量篩選提供了可靠的解決方案,顯著提高了先導化合物的發現效率(劉軻等,2018; 劉潤哲等,2021)。近年來,昆蟲嗅覺分子機制研究的不斷深入、昆蟲嗅覺信息數據化程度的不斷提高,使得通過計算機進行昆蟲行為調節劑先導化合物篩選成為可能,極大地推動了昆蟲行為調節劑開發的進程。目前,基于計算機的昆蟲行為調節劑虛擬篩選主要有以下2種策略(劉潤哲等,2021):一是以理論計算為依據,基于配體的虛擬篩選,其設計思路是通過計算分析已知活性化合物的分子特征,采用數理統計方法揭示化合物分子特征與其活性之間的定量變化規律,即定量結構-活性關系(quantitative structure-activity relationship, QSAR);二是以分子對接為理論,基于結構的虛擬篩選,其設計思想是通過計算機模擬蛋白質與小分子的結合模式,根據蛋白質與配體結合特征和結合自由能判斷結合強度。

在昆蟲嗅覺識別過程中,氣味結合蛋白(odorant binding proteins, OBP)負責將進入嗅覺感器的氣味化合物分子運輸至嗅覺感受神經元表面的氣味受體(olfactory receptors, OR)和氣味共受體(odorant receptor coreceptors, Orco)組成的復合體中,從而實現對氣味分子的特異性識別(李慧等,2021; Zhaoetal.,2018)。因此,OBP與OR家族在昆蟲與化學信息相互作用的研究中被重點關注。OBP為水溶性蛋白,相比于跨膜蛋白OR更容易獲得晶體結構(Venthur &Zhou,2018),在先前的昆蟲行為調節劑虛擬篩選研究中,OBP的潛在配體的預測常采用基于結構的篩選方法(李敏等,2019),OR氣味反應譜的預測則多采用基于配體的虛擬篩選策略。

1 基于配體的昆蟲行為調節劑虛擬篩選

基于配體的虛擬篩選策略以一系列通過實驗確定的嗅覺數據為基礎,通過建立能夠正確擬合配體分子與受體蛋白結合活性關系的QSAR模型從化合物庫中高通量篩選潛在的活性化合物(劉軻等,2018)。其一般流程如圖1所示:第一步,數據獲取,研究人員需針對不同的任務從文獻或專業數據庫中收集相應的嗅覺數據信息(Sharmaetal.,2022),其數量和質量往往直接影響模型的預測性能(Affonsoetal., 2013),因此,收集的數據盡可能全面、準確;第二步,數據轉換,由于獲取的嗅覺信息一般是受體和其對應的配體,計算機無法直接處理這類數據,因此,需要將受體和配體的理化特性轉換為計算機可讀的數據形式,且盡可能完整、有效地代表固有信息;第三步,模型訓練與評估,對轉化后的數據劃分訓練集和測試集,利用機器學習算法對訓練集進行訓練構建受體和配體分子的定量構效關系,并利用測試集評估模型質量;第四步,化合物篩選,訓練獲得高質量的預測模型之后,即可利用模型預測未知受體與配體的結合能力(劉潤哲等,2021)。

圖1 基于配體的藥物篩選基本流程

1.1 數據獲取與處理

獲取嗅覺受體的反應譜數據是開發QSAR模型的關鍵,數據來源有以下2個方面:1)嗅覺信息數據庫,如DoOR (http:∥neuro.uni-konstanz.de/DoOR)數據庫系統收錄了黑腹果蠅Drosophilamelanogaster幾乎所有的氣味受體反應譜數據,涉及693種氣味化合物(Munch &Galizia,2016);2)大量未收錄在專業數據庫但已報道的嗅覺反應數據(Chenetal.,2020; Guoetal.,2021; Miuraetal.,2010)。

分子特征表示作為分子化學信息的數學表示使得計算機對化學信息的處理更為方便,常用分子特征表示方法主要有分子描述符、分子指紋、簡化分子線性輸入規范(simplified molecular input line entry system, SMILES),在QSAR研究中以分子描述符和分子指紋較為常見。Mordred (Moriwakietal.,2018)、PaDEL-Descriptor (Yap,2011)、CDK (Steinbecketal.,2003)、RDKit、Dragon和alvaDesc (Mauri,2020)等工具都可實現由分子化學信息向其數學表示的轉換,盡管在數量和表示類型上不盡相同,但其最終目標都是盡可能有效、全面地提供分子特征的數學表示,幾種常見計算工具及其提供的分子特征數量見表1。然而,上述工具中部分存在軟件配置困難或停止維護的情況,開源在線服務平臺ChemDes (http:∥www.scbdd.com/chemdes)集成了多個分子特征計算工具,例如Chemopy、CDK、RDKit等,用戶只需選擇對應的計算工具并提交SMILES信息或上傳分子結構文件即可得到分子特征,大大減少軟件配置等問題(Dongetal.,2015)。

表1 分子描述符計算工具

1.2 機器學習與虛擬篩選

機器學習是人工智能的重要分支,能夠通過特定算法擬合真實數據形成對人類經驗的模仿,算法作為機器學習的核心對于“經驗模仿”具有重要意義。Scikit-learn、PyTorch、TensorFlow (劉潤哲等,2021)等開源科學計算庫的發展,大大降低了編程難度,極大方便了科研人員對計算生物學的應用。根據算法處理數據機制的不同,機器學習算法分為傳統機器學習算法和深度學習算法,相比于傳統機器學習算法,深度學習算法通過模擬人腦的神經機制強調模型對數據更深入的理解。

人們通過異源表達系統研究明確了大量極具價值的嗅覺編碼信息,為利用機器學習方法研究嗅覺受體的化學感受譜提供基礎的數據支撐。例如,Kepchiaetal.(2019)將岡比亞按蚊AnophelesgambiaeGiles氣味共受體ORco的83個配體結合數據(58個拮抗劑和25個非拮抗劑)的拓展連接指紋(extended connectivity fingerprints, ECFP)作為分子特征輸入,并選擇樸素貝葉斯分類算法(naive bayesian)對輸入的數據集進行擬合,在對1280種氣味分子進行虛擬篩選中發現了一種具有全新結構的氣味分子2-tert-butyl-6-methylphenol (BMP)與ORco具有較好的結合活性,進一步利用電生理實驗驗證了BMP的生物學效應,為ORco拮抗劑的開發提供了新的方法。然而,受限于高度差異的昆蟲氣味受體以及嗅覺數據解析程度,基于配體的昆蟲行為調節劑篩選策略主要應用于雙翅目(Boyleetal.,2013,2016; Guptaetal.,2021; Oliferenkoetal.,2013; Tauxeetal.,2013),2020年,Caballero-Vidaletal.(2020)首次將這一策略擴展到鱗翅目昆蟲?;页嵋苟闟podopteralittoralis(Boisduval)的氣味受體功能研究中,應用支持向量機(support vector machine, SVM)算法對氣味受體SlitOR25的氣味反應數據(13個活性數據和39個非活性數據)的分子特征和標簽進行擬合,對3306282個分子進行虛擬篩選以發現其全新的配體,選擇32種具有潛在活性的化合物進行功能驗證,揭示了11種具有生物學活性的配體分子。

2 基于結構的昆蟲行為調節劑虛擬篩選

在結構生物學的推動下,研究人員通過特定的算法解析蛋白受體與配體分子在原子水平上的相互作用方式來推動先導化合物的發現及篩選效率(劉軻等,2018)?;诮Y構的虛擬篩選依賴于靶標蛋白和配體分子的三維結構,通過空間匹配和能量優化分析活性位點、預測受體和配體結合的優勢構象,從而確定與受體蛋白具有結合能力的潛在配體。因此,基于結構的篩選主要是通過分子對接技術的數據庫搜尋,即將數據庫中的分子依次對接到靶標蛋白的活性口袋,通過構象搜索算法不斷優化分子與受體氨基酸側鏈、骨架結合的構象,并結合打分函數評估結合親和性(圖2)。

圖2 基于結構的藥物篩選流程

2.1 受體和配體的三維結構

隨著后基因組時代的到來,結構生物學已成為當下的研究熱點,蛋白質作為生命過程發揮生物學功能的主要大分子物質被廣泛關注。核磁共振技術(nuclear magnetic resonance)、X 射線晶體衍射法(X ray crystalline diffraction)以及冷凍電鏡技術(cryo-electron microscopy)作為解析蛋白質三維結構的主要手段(徐顥溪和劉磊,2020),奠定了結構生物學研究的基礎,目前已有191565個蛋白質結構數據收納于PDB數據庫(https:∥www.rcsb.org)。盡管如此,隨著高通量測序技術的發展,蛋白質序列呈井噴式增加,通過實驗解析蛋白晶體結構已無法滿足當前科研發展的需求,科學家將目光逐漸移向基于序列信息的蛋白質結構預測(Dengetal. 2016),經過半個多世紀的發展,以Swiss-model、Modeller和I-Tasser為代表的同源建模和以AlphaFold2、Rosetta為代表的從頭建模策略均在蛋白質結構預測的準確性和精度方面取得了巨大成功。值得一提的是,AlphaFold2在2020年第14屆國際蛋白質結構預測評估大賽(Critical Assessment of Techniques for Protein Structure Prediction, CASP)中斬獲頭籌(劉子楠等,2020)。

受體蛋白與配體的結合能力決定了昆蟲對氣味配體的識別,是引起昆蟲行為變化的主要原因之一,因此,在分子對接研究中,獲得精確的受體蛋白和配體分子的三維結構同等重要。相較于受體蛋白的三維結構,配體小分子的三維結構更易獲得,如由美國國立衛生研究院(National Institutes of Health, NIH)開發的化學分子數據庫ChemBank (https:∥pubchemdocs.ncbi.nlm.nih.gov/)存儲了1607755個分子的結構信息以供用戶免費下載,由美國加州大學舊金山分校(University of California, San Francisco, UCSF)藥物化學系的Irwin和Shoichet實驗室提供和維護支持的ZINC (https:∥zinc15.docking.org/)包含2.3億個市場上可購買的化合物3D結構。

2.2 分子對接與虛擬篩選

自1894年Fischer提出蛋白和配體結合的“鎖-鑰模型”以來,分子對接技術發展迅速,目前,已有超過60種分子對接工具,例如:Dock、AutoDock、Gold、Glide、Moe Dock、AutoDock Vina等(Pagadalaetal.,2017)?;诮Y構虛擬篩選由于不受目的嗅覺蛋白化學感受范圍解析程度的影響,應用更為廣泛。例如:Thireouetal. (2018)在篩選岡比亞按蚊新型趨避劑的研究中,依據性狀相似和化學相似性對42755個合成分子進行篩選,確定了33個與已知驅蚊劑相似的分子,使用AutoDock軟件的拉馬克遺傳算法(Lamarckian genetic algorithm, LGA)將其與AgamOBP1晶體結構進行對接構象搜索,選擇對接結果較好的16個分子對其進行功能驗證,其中4個化合物能與AgamOBP1結合且具有趨避活性。Yietal. (2015)對斜紋夜蛾SpodopteralituraFabricius氣味結合蛋白OBP1進行同源建模,并在CHARMM力場下對其初始結構分別執行梯度下降(steepest descend)和共軛梯度(conjugate gradient)能量最小化程序檢查模型質量,在對接篩選中,先使用Ligandfit工具的蒙特卡羅法和能量網格對Available Chemicals Directory 數據庫中的1536550種化學物質進行首輪對接,隨后用Cdocker工具進行二次對接,并根據PLP1、Ligscore1 2種評分函數對復合物結合穩定性進行排序,選擇對接合理的2040個化合物中的21個具有不同結構和結合模式的化合物進行熒光競爭結合分析,其中15個化合物均與OBP1具有良好的結合活性。分子對接研究在昆蟲行為調節劑虛擬篩選研究中涉及雙翅目、膜翅目、半翅目、鱗翅目、鞘翅目等類群,如表2所示。

表2 分子對接在昆蟲行為調節劑研究中的應用

3 討論與展望

基于配體和基于結構的2種虛擬篩選都能促進先導化合物的發現進程,然而2種方法各有優劣,基于配體的虛擬篩選要求具備一定的編程基礎,研究門檻相對較高,且模型開發過程繁瑣,從模型設計到模型應用的時間較長,但運行速度較快,擬合好模型之后可短時間內完成對海量化合物的預測任務;基于結構的虛擬篩選往往借助于可視化的研究工具,研究門檻相對較低,能夠在短時間內快速上手應用,但運行速度遠低于基于配體的篩選方法。

在昆蟲的行為調節劑的先導化合物發現研究中,基于配體的虛擬篩選:1)側重于廣譜性嗅覺受體蛋白,且嚴重依賴于嗅覺編碼解析程度,無法對調諧范圍較窄以及功能不明確的嗅覺受體蛋白進行研究;2)現有的嗅覺反應數據僅涉及與昆蟲生境關系密切的氣味化合物分子,僅代表了自然界中龐大且復雜化學信息庫中的一小部分,且未經生物學功能測試的化合物無法對其是否具有活性做出定論,因此,在一定程度上限制了模型訓練數據的多樣性和模型泛化能力;3)僅有少數模式物種的嗅覺反應信息以高度集中的數據庫形式存在,因此,對于非模式物種的氣味反應數據,需要研究人員花費大量的時間和精力從海量文獻中收集獲得。ODORactor 數據庫提供了大量哺乳動物的OR反應譜信息,并以此開發了小分子配體預測功能(Liuetal.,2011),極大程度上促進了大數據的利用。隨著昆蟲化學生態領域數據化研究的不斷深入,構建嗅覺反應數據庫和利用計算生物學的方法預測嗅覺反應譜是未來研究受體與配體結合關系的趨勢,對掌握昆蟲的化學感受譜以及應用具有深遠意義。

基于結構的虛擬篩選:1)對接打分函數能夠直接影響研究人員對結果的分析判斷,然而現有的評分函數對蛋白受體與配體的結合能力評價準確性仍有待提高,在未來很長一段時間,需要依賴大量實驗數據對評分函數進行優化,進一步提高對接結果在正常生理狀態下的表現能力及其評估精度;2)分子對接的準確與否與蛋白三維結構的精度密切相關,蛋白建模雖然在一定程度上彌補了通過實驗方法解析蛋白晶體結構的短板,但仍有部分蛋白質的結構預測達不到應用的標準(劉子楠等,2020);3)計算機模擬無法完全體現生物大分子與小分子在正常生理狀態下的結合模式,因此,分子對接的準確性一直備受關注,完成分子對接后往往需要人們進一步基于先驗知識進行判斷,或利用微量熱涌動、熒光競爭結合等手段驗證其準確性(李敏等,2019; 劉航瑋等,2017),盡管如此,該技術仍然大大降低了篩選的盲目性。隨著實驗數據豐度的不斷上升和算法不斷優化,分子對接的準確性將會進一步提高,基于結構的昆蟲行為調節劑研究將會進一步發展。

猜你喜歡
調節劑嗅覺配體
超強嗅覺
植物生長調節劑在園藝作物上的應用
基于配體鄰菲啰啉和肉桂酸構筑的銅配合物的合成、電化學性質及與DNA的相互作用
讓你的嗅覺降降溫吧!
車禍撞沒了嗅覺 怎么賠?
新型三卟啉醚類配體的合成及其光學性能
哮喘治療中白三烯調節劑的應用觀察
基于Schiff Base配體及吡啶環的銅(Ⅱ)、鎳(Ⅱ)配合物構筑、表征與熱穩定性
系列含4,5-二氮雜-9,9′-螺二芴配體的釕配合物的合成及其性能研究
抗腫瘤藥及免疫調節劑的醫院用藥現狀
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合