?

多房棘球蚴葡萄糖轉運蛋白抗原表位生物信息學預測a

2022-06-22 02:30李潤樂
中國高原醫學與生物學雜志 2022年3期
關鍵詞:抗原氨基酸蛋白

王 蕾,魏 威,周 培,馮 琳,李潤樂,湯 鋒

(1.青海大學高原醫學研究中心,青海省高原醫學應用基礎重點實驗室,青海 西寧 810001;2.青海大學研究生院,青海 西寧 810001;3.青海大學基礎醫學部,青海 西寧 810016)

研制表位疫苗的關鍵是要找到優勢抗原表位,但如何尋找優勢抗原表位是一個難題。生物信息學工具的應用使篩選潛在優勢抗原表位成為可能,并且不必承擔培育相關病原體的風險。本課題擬通過多房棘球蚴葡萄糖轉運蛋白(glucose transporters,GLUT)抗原表位生物信息學預測優勢抗原表位。

GLUT的編碼基因是SLC2,屬于膜轉運蛋白中的易化載體超家族(the major facilitator superfamily,MFS)。已有明確的證據表明,不同的GLUT在調節代謝、基因表達、基因分化和腫瘤發生等方面發揮特定的作用。Cora Delling等[1]發現感染急性期宿主腸道上皮細胞對葡萄糖的吸收發生了適應性變化。Abdul Aziz Qureshi等[2]闡明了瘧原蟲GLUT影響糖攝入的分子機制。Takuya Kashiide等[3]成功克隆并鑒定了多房棘球蚴的GLUT同源物,獲得了2個推測的GLUT基因(EmGLUT1和EmGLUT2)的全長序列;同時發現EmGLUT1是一種簡單的易化葡萄糖轉運體,可能在多房棘球蚴整個生命周期的葡萄糖攝取過程中起重要作用。由此可以通過蛋白質序列鑒定多房棘球蚴GLUT的優勢抗原表位。

EmGLUT蛋白的二級結構特征通過在線預測軟件Self-Optimized Prediction Method with Alignment(SOPMA)得出結果。使用生物信息學軟件Immune Epitope Database(IEDB)和Syfpeithi預測EmGLUT潛在的T細胞優勢抗原表位,使用生物信息學軟件Bcepred和ABCpred預測EmGLUT潛在的B細胞優勢抗原表位。

1 材料與方法

1.1 獲取EmGLUT的氨基酸序列

從NCBI-Gen Bank中(http://www.ncbi.nlm.nih.gov/genbank/)[4]獲得多房棘球蚴GLUT氨基酸序列和核苷酸序列。

1.2 預測EmGLUT的二級結構特征

使用生物信息學軟件SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html)[5,6]分析二級結構特征。輸入從NCBI中獲取的EmGLUT蛋白的全部氨基酸序列,參數為默認值,分析其蛋白二級結構特征,包括α螺旋、β折疊、β轉角和無規則卷曲這四種構象。

1.3 預測EmGLUT的T細胞抗原表位

1.4 預測EmGLUT的B細胞抗原表位

使用生物信息學軟件Bcepred(http://www.imtech.res.in/raghava/bcepred/bcepred_submission.html)、ABCpred (http://www.imtech.res.in/raghava/abcpred/)[9]預測多房棘球蚴GLUT的B細胞抗原表位。輸入從NCBI中獲得的EmGLUT蛋白的全部氨基酸序列,參數為默認值,ABCpred的抗原表位長度分別設置為10、12、14、16;剩下的參數為默認值。

2 結果

2.1 EmGLUT的氨基酸序列

從NCBI-Gen Bank中獲得多房棘球蚴GLUT的全部氨基酸序列與核苷酸序列,多房棘球蚴GLUT由509個氨基酸組成(GenBank:BBE21055.1),由1530 bp的mRNA編碼組成(GenBank:LC385549.1)。氨基酸序列如表1所示。

2.2 EmGLUT蛋白質二級結構預測結果

采用SOPMA Server軟件對其二級結構進行預測,結果顯示二級結構中存在較大比例的β折疊和無規則卷曲區域,這兩個區域的數值越高,該蛋白質成為抗原表位的可能性越大。EmGLUT蛋白二級結構預測結果如圖1所示:α螺旋占比為51.08%,β折疊占比為17.88%,β轉角占比為3.73%,無規則卷曲占比為27.31%。

2.3 EmGLUT的T細胞抗原表位預測結果

為了研制抗原表位疫苗,必須確定抗原表位的精確位置。在本研究中,使用IEDB、Syfpeithi軟件對MHC I類HLA-A*0201限制性T細胞表位進行預測,這兩個軟件分別用不同的得分值代表不同區域形成T細胞表位的概率。IEDB軟件的預測結果如表2所示,排名前二十位的是G454-462、G499-506、G47-56、G498-508、G493-504、G498-506、G206-214、G493-503、G453-463、G454-463、G48-56、G213-220、G494-501、G494-505、G592-503、G499-508、G81-89、G496-506、G492-504、G286-293。使用SYFPEITHI軟件預測結果如表3所示,排名前十七位的是G162-170、G333-342、G89-98、G161-170、G300-309、G339-348、G21-29、G57-65、G332-340、G339-347、G435-443、G310-318、G343-351、G428-436、G97-106、G173-182、G435-444。結合蛋白質的二級結構特點與兩個預測軟件的分析結果顯示存在10個T細胞潛在優勢抗原表位,分別為G48-56、G81-89、G162-170、G213-220、G333-340、G339-347、G435-443、G454-462、G494-501、G499-506。

表1 多房棘球蚴GLUT的氨基酸序列Table 1 Amino acid sequence of the EmGLUT

A:EmGLUT氨基酸序列圖譜;B:SOPMA軟件預測數據結果 藍色:α螺旋;紅色:β折疊;綠色:β轉角;紫色:無規則卷曲

表2 多房棘球蚴EmGLUT的T細胞抗原表位IEBD預測結果Table 2 Analysis of the T-cell epitopes of EmGLUT using IEDB online prediction software

續表

表3 多房棘球蚴EmGLUT的T細胞抗原表位Syfpeithi預測結果Table 3 Analysis of the T-cell epitopes of EmGLUT using Syfpeithi online prediction software

2.4 EmGLUT的B細胞抗原表位預測結果

使用Bcepred軟件預測B細胞抗原表位(圖2),主要對氨基酸序列分四個方面做評價,包括親水性、彈性、抗原傾向和抗原暴露表面積[4]。預測結果如表4所示。親水性較強的位點區域有7個:G45-54(YKPDNTSGLD)、G210-221(LKKKDEEAARKA)、G226-232(NGSENVD)、G294-300(GANVSSD)、 G324-331(EKAGRRT)、G454-460(PETKNRT)、G487-509(FTKEDEEAATALRRTDDDSKVDA)。彈性較強的位點區域有9個:G43-50(GYYKPDNT)、G80-88(IADGLGRKR)、G120-126(RAISGLN)、G207-215(WLYLKKKDE)、G255-261(ELFRRRD)、G321-329(PLLEKAGR)、G451-458(LFMPETKN)、G485-491(PVFTKED)、G496-504(TALRRTDDD)??乖瓋A向性較明顯的位點區域有16個:G3-27(GISGPLVLSIFTTCFGSSFLLGYNL)、G39-47(RFLVGYYKP)、G61-69(QTTSVLVIC)、G93-109(NNVVGIVGSIISSVCLV)、G158-174(ITIGILISYVLTLTHLL)、G195-202(LVISFFTV)、G251-257(FKFVELF)、G262-268(LRMPVIL)、G270-278(VLIQVMQQL)、G301-319(MLEYFVVGLGLLNVICTIV)、G332-340(LLLWPTLVL)、G342-353(VTLLLLVIFVNI)、G362-377(KMPFVLVSAVLVFIYV)、G405-411(YSLSQSI)、G428-454(GLLKGYVYLPYLVVVVVCWVVFFLFMP)、G470-478(FGSIVVGKR)、G482-488(LQSPVFT)??乖┞侗砻娣e較強的位點區域有7個:G44-50(YYKPDNT)、G207-220(WLYLKKKDEEAARK)、G246-252(QNQPEFK)、G257-264(FRRRDLRM)、G453-463(MPETKNRTFDE)、G487-494(FTKEDEEA)、G499-506(RRTDDDSK)。

為了進一步驗證這些結果,使用ABCpred軟件預測潛在的B細胞抗原表位。預測結果如表5所示,長度為10的優勢抗原表位有G249-258、G220-229、G131-140、G88-97、G45-54、G182-191、G92-101、G54-63、G171-180、G58-67、G293-302、G126-135、G307-316、G153-162、G145-154、G24-33;抗原表位長度為12的優勢表位有G186-197、G152-163、G338-349、G104-115、G181-192、G29-40、G288-299、G25-36、G6-17、G265-276、G79-90、G361-372、G357-368、G33-44;抗原表位長度為14的優勢表位有G88-101、G128-141、G61-74、G193-206、G137-150、G344-357、G66-79、G404-417、G421-434、G42-55、G409-422、G428-441、G360-373、G229-242、G184-197、G3-16、G165-178、G48-61;抗原表位長度為16的優勢表位有G82-97、G99-114、G42-55、G139-154、G175-190、G431-446、G470-485、G491-506、G452-467、G321-336、G218-233、G161-176、G408-423、G391-406。結合GLUT的二級結構特征和Becpred、ABCpred預測結果,共篩選出18個B細胞優勢抗原表位:G6-16、G25-36、G45-55、G61-69、G131-140、G139-154、G158-174、G186-197、G210-220、G255-261、G256-276、G324-331、G362-373、G408-423、G428-441、G454-463、G487-491、G499-506。

黑色:親水性;藍色:彈性;黃色:抗原傾向性;棕色:抗原暴露表面積

表4 多房棘球絳蟲GLUT的B細胞抗原表位Becpred預測結果Table 4 Analysis of the B-cell epitopes of EmGLUT using Becpred online prediction software

表5 多房棘球蚴EmGLUT的B細胞抗原表位ABCpred 預測結果 Table 5 Analysis of the B cell epitopes of EmGLUT using ABCpred online prediction software

續表

3 討論

與傳統疫苗研制技術相比,本研究使用方法具有巨大的優勢,具有高效、省時和低成本的特點。識別抗原中的優勢表位具有重要的現實意義,因此它成為了生物和醫學科研人員的探索熱點。Xuelei Liu等[10]利用SOPMA軟件預測分析細粒棘球蚴鐵蛋白的二級結構,利用IEDB、LEPS軟件預測了7個B細胞抗原表位,利用SYFPEITHI、IEDB軟件預測了4個T細胞抗原表位。Vargab Baruah等[11]使用NetCTL1.2軟件識別新型冠狀病毒2019-nCoV表面糖蛋白序列中的5個CTL表位,使用BepiPred2.0、ABCPred軟件預測了3個連續B細胞表位和5個不連續B細胞表位,其中一些已確定的表位可能成為SARS-COV-2疫苗開發的潛在候選表位。Zhiwei Li等[12]使用生物信息學軟件(ProtParam,SWISS-MODEL,Rasmol,BepiPred,SYFPEITHI,IEDB)預測布魯氏菌外膜蛋白OMP2b、BCSP31表位,通過分析預測了OMP2b蛋白的3個Th細胞表位、7個CTL表位、8個B細胞表位和1個T-B聯合雙表位,還獲得了BCSP31蛋白的3個Th細胞表位、6個CTL表位、9個B細胞表位和1個T-B聯合雙表位。

蛋白質二級結構所具有的特征是其能成為表位的重要參考指標之一,表位很容易在β轉角和無規則卷曲中形成[13],在蛋白抗原表面很容易見到這兩個結構特征,它們起到積極識別抗原的作用。多房棘球蚴GLUT中β轉角占比為3.73%,無規則卷曲占比為27.31%,這些結果表明該結構位于抗原表位的分布區域內,具有明顯的免疫原性。α螺旋與β折疊都含有氫鍵,且屬于蛋白的內部結構,起到維持穩定蛋白質二級結構的作用。在多房棘球蚴GLUT中α螺旋占比為51.08%,β折疊占比為17.88%,故其蛋白質結構較穩定。

一種有效的候選表位不僅要具有合理的蛋白質結構,而且還應該能夠誘導T、B細胞產生免疫反應,產生抗體。預測T細胞表位的目的是識別抗原中能夠刺激CD4或CD8 T細胞的最短肽,這個過程最關鍵的是MHC分子與肽相結合。分析MHC分子自身結構特點發現,MHC Ⅰ類分子比MHCⅡ類分子高(預測T細胞表位的準確度)[14],MHC Ⅰ類分子表位預測精度估計在90%~95%。HLA的多態性賦予了機體應對各種病原體入侵的能力,不同類型的HLA可引起不同特異性和強度的免疫應答[15]。HLA等位基因的分布頻率因不同種族和不同地區而異。HLA-A0201型限制性表位在我國漢族人群中最為常見[16]。因此,本研究使用IEDB、SYFPEITHI軟件對GLUT的T細胞HLA-A0201限制性表位進行預測,結果預測出了10個EmGLUT的T細胞潛在優勢抗原表位。

B細胞的表位是由B細胞受體或抗體特異性識別的[17],線性B細胞表位由連續肽段組成,這種結構易于成為抗原并誘導機體產生抗體。對線性B細胞表位的預測雖有限,但受到了廣泛的關注。線性B細胞表位預測主要是根據氨基酸理化性質(如親水性、電荷、暴露表面積和二級結構等)完成的[18]。親水性參數反映了親水性殘基在整個抗原氨基酸序列中的具體位置[19]。親水殘基位于蛋白質表面,這種構象有利于親水性殘基與溶液中的極性分子結合;這種結合中和了蛋白質的電荷,使蛋白質保持其最低能量的狀態[19]。因此,親水性區域與表位高度相關。彈性參數表明該蛋白具有彎曲和折疊的能力[4];隨著彈性程度的增加,蛋白質的多肽骨架具有更好的折疊和彎曲能力,從而促進二級結構的形成[4,20]??乖瓋A向分析顯示抗原的免疫原性區域的具體位置[4],潛在的顯性表位可能位于抗原傾向高的區域[21]。暴露表面積分析反映了氨基酸殘基在蛋白質外層的分布情況[4],抗原暴露的表面積增加了與溶劑分子接觸的可能性[22]。據報道,ABCpred軟件服務器的預測精度為65.93%[23],而根據氨基酸性質設計而成的Becpred預測精度為52.92%~57.53%[24]。這兩個軟件綜合預測了18個EmGLUT的B細胞優勢抗原表位。

本研究旨在獲得EmGLUT抗原的生物信息學特征。本研究使用多房棘球蚴GLUT作為研究對象,因其在利什曼蟲[25]、惡性瘧原蟲、華支睪吸蟲[26]和血吸蟲[26]等多種寄生蟲的蟲體中廣泛存在,并都進行過功能鑒定。Takuya Kashiide[3]等首次從多房棘球蚴中分離出GLUT,并測出其氨基酸全長序列,在寄生蟲的每個發育階段都穩定表達?;谏鲜霭l現選擇預測GLUT,看它是否可以作為抗多房棘球蚴疫苗的候選表位。根據文中所述5個軟件預測結果表明EmGLUT分值較高的T細胞抗原表位有10個,B細胞抗原表位有18個。其中,5個同時具有T-B雙表位,分別為G48-55、G162-170、G213-220、G454-462、G499-506。

本研究已經完成了對EmGLUT蛋白優勢抗原表位的初步預測,下一步的工作主要是鑒定抗原表位和篩選優勢抗原表位,這些結果將為后續EmGLUT的免疫原性與免疫特異性研究提供幫助,在未來有可能成功研制出用于多房棘球蚴病免疫預防和免疫治療的多表位疫苗。

猜你喜歡
抗原氨基酸蛋白
RNA結合蛋白與惡性腫瘤發生發展關系的研究進展
蘇州市D抗原陽性無償獻血者C和e抗原陰性率及其篩血策略*
飼料氨基酸釋放動態對豬氮素利用影響的研究進展
新冠病毒抗原檢測知多少
鋅指蛋白與肝細胞癌的研究進展
細砂糖對法式蛋白糖的質量影響研究
科學解讀食物中的蛋白質如何分“優劣”
水通道蛋白的發現
補氨基酸不如吃雞蛋
前列腺特異抗原高就是癌嗎
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合