程 華 成 彬 羊紅光
(河北省科學(xué)院生物研究所,石家莊050081)
線性B細(xì)胞表位預(yù)測(cè)方法研究進(jìn)展①
程 華 成 彬②③羊紅光③
(河北省科學(xué)院生物研究所,石家莊050081)
在抗原抗體的結(jié)合反應(yīng)中,抗體參與結(jié)合的部位稱抗體的對(duì)位(Paratope),抗原參與結(jié)合的部位稱抗原的表位(Epitope)[1]。表位就是抗原中能被免疫細(xì)胞特異性識(shí)別的線性片段或空間構(gòu)象性結(jié)構(gòu),是引起免疫應(yīng)答和免疫反應(yīng)的基本單位。
表位是蛋白質(zhì)抗原性的基礎(chǔ),在蛋白的特異性抗體制備、疫苗的計(jì)算機(jī)輔助設(shè)計(jì),特別是近期具有很大潛力的腫瘤免疫療法中都具有非常重要的作用[2]。掌握了表位的規(guī)律將有助于繪制抗原表位圖譜、降低蛋白質(zhì)藥物的免疫原性以及設(shè)計(jì)無(wú)毒副作用的人工疫苗等。近幾年以來(lái),隨著免疫學(xué)理論、生物物理學(xué)及計(jì)算機(jī)技術(shù)的進(jìn)步和廣泛應(yīng)用,蛋白質(zhì)B細(xì)胞抗原表位的研究方法有了新的進(jìn)展,一些適應(yīng)于蛋白質(zhì)抗原表位研究的實(shí)驗(yàn)檢測(cè)和理論預(yù)測(cè)方法相繼被發(fā)現(xiàn)[3,4]。本文就線性B細(xì)胞表位預(yù)測(cè)方法及相關(guān)數(shù)據(jù)庫(kù)的最新進(jìn)展作一綜述,并指出當(dāng)前存在的問(wèn)題和未來(lái)發(fā)展的方向。
目前,抗原表位有兩種分類(lèi)方法[5]:一種是按與抗原受體細(xì)胞結(jié)合不同,分為B細(xì)胞抗原表位和T細(xì)胞抗原表位;另一種是按表位結(jié)構(gòu)不同分為連續(xù)性抗原表位和不連續(xù)性抗原表位。前者又稱線性表位,是由肽鏈上順序連續(xù)的氨基酸組成;后者又稱構(gòu)象抗原表位,是由那些空間鄰近但順序上不連續(xù)的氨基酸組成。線性表位可見(jiàn)于T細(xì)胞表位和部分B細(xì)胞表位,構(gòu)象抗原表位只見(jiàn)于B細(xì)胞抗原表位。
早期的線性B細(xì)胞表位預(yù)測(cè)基本上都是根據(jù)20種氨基酸的理化性質(zhì)、結(jié)構(gòu)特點(diǎn)及統(tǒng)計(jì)學(xué)等指標(biāo)來(lái)進(jìn)行的。人們通過(guò)觀察抗原表位與已知氨基酸序列的蛋白質(zhì)的某些關(guān)系,發(fā)現(xiàn)一些蛋白質(zhì)的序列或結(jié)構(gòu)特征與形成表位有關(guān),于是提出了單一參數(shù)預(yù)測(cè)及多參數(shù)復(fù)合預(yù)測(cè)等方法。
2.1單一經(jīng)典參數(shù)預(yù)測(cè)
2.1.1可及性(Accessibility) 指蛋白質(zhì)中氨基酸殘基被溶劑分子接觸的可能性,反映了蛋白質(zhì)內(nèi)、外各層殘基的分布情況。1979年Janin[6]統(tǒng)計(jì)了20種氨基酸在22個(gè)不同蛋白質(zhì)中的位置數(shù)據(jù),發(fā)現(xiàn)極性氨基酸更容易暴露在蛋白質(zhì)的外表,而非極性氨基酸則多位于蛋白質(zhì)的內(nèi)部。在結(jié)合自由能的基礎(chǔ)上,根據(jù)氨基酸在蛋白質(zhì)內(nèi)部和外表的位置頻率,作者得到了判斷某個(gè)氨基酸構(gòu)成表位的幾率數(shù)據(jù)。
2.1.2親水性(Hydrophilicity) 一般認(rèn)為蛋白質(zhì)抗原各氨基酸殘基可分為親水性殘基和疏水性殘基兩類(lèi),疏水性殘基多埋在蛋白內(nèi)部,而親水性殘基則位于蛋白表面,因此蛋白的親水部位與蛋白抗原表位有密切的聯(lián)系。常用的有Hopp-Woods參數(shù)和HPLC親水參數(shù)。1981年Hopp等[7]做了開(kāi)創(chuàng)性的工作,他們以6個(gè)多肽殘基為一個(gè)研究單元,以有機(jī)相環(huán)境轉(zhuǎn)移到水相環(huán)境的自由能為依據(jù),計(jì)算出各種氨基酸的親水性數(shù)據(jù)。利用這些數(shù)據(jù)能夠?qū)Φ鞍鬃龀鲇H水性曲線,連續(xù)的高峰區(qū)則是潛在的表位區(qū)域。5年后Parker等[8]利用高效液相色譜技術(shù)重新對(duì)20種氨基酸的親水性進(jìn)行了測(cè)定,他們檢測(cè)了每種氨基酸的保留時(shí)間,以此為依據(jù)計(jì)算出了不同氨基酸的親水性參數(shù)。
2.1.3抗原性(Antigenicity) 1985年Welling等[9]通過(guò)對(duì)20個(gè)已知表位的蛋白質(zhì)中氨基酸進(jìn)行統(tǒng)計(jì)分析,得到每種氨基酸出現(xiàn)在抗原區(qū)的頻率,將此頻率除以各氨基酸在所有蛋白質(zhì)中的頻率就可得到一個(gè)比值,即抗原性參數(shù)。該研究發(fā)現(xiàn)疏水性氨基酸殘基對(duì)抗原表位形成亦有貢獻(xiàn)。1990年Kolaskar等[10]統(tǒng)計(jì)了已知34個(gè)蛋白質(zhì)中的156個(gè)長(zhǎng)度不超過(guò)20個(gè)氨基酸的線性表位。以氨基酸的統(tǒng)計(jì)數(shù)據(jù)為基礎(chǔ),結(jié)合親水性、可及性及柔韌性,作者計(jì)算出了每種氨基酸位于蛋白質(zhì)表面的概率。每種氨基酸位于表位的概率除以位于蛋白質(zhì)表面的概率,即得到抗原特性值A(chǔ)p。
2.1.4可塑性(Flexibility) 蛋白質(zhì)多肽鏈骨架有一定程度的活動(dòng)性,抗原抗體相結(jié)合時(shí)常涉及構(gòu)象上的相互契合,活動(dòng)性強(qiáng)的氨基酸殘基即可塑性大的位點(diǎn),易形成抗原表位。Karplas等[11]根據(jù)31個(gè)已知結(jié)構(gòu)蛋白質(zhì)在不同溫度下多肽鏈骨架的變形程度,將氨基酸分為可塑性和不可塑性兩大類(lèi),在參考前后氨基酸碳鏈可塑性對(duì)中間氨基酸的影響后,發(fā)展出了一種預(yù)測(cè)蛋白質(zhì)片段活動(dòng)性的方法。
2.1.5二級(jí)結(jié)構(gòu)預(yù)測(cè) (Secondary structure) 蛋白質(zhì)的二級(jí)結(jié)構(gòu)α螺旋、β片層及β轉(zhuǎn)角等空間構(gòu)象也可用于表位預(yù)測(cè)。一般認(rèn)為β轉(zhuǎn)角多位于蛋白質(zhì)表面,利于與抗體結(jié)合,較可能成為表位。而α螺旋和β片層結(jié)構(gòu)位于內(nèi)部,較難嵌和抗體,不易形成表位。1993年P(guān)ellequer等[12]根據(jù)氨基酸在4種不同空間結(jié)構(gòu)中的頻率,得出β轉(zhuǎn)角參數(shù)。
2.2多個(gè)經(jīng)典參數(shù)復(fù)合預(yù)測(cè) 通過(guò)比較上述各種單參數(shù)的預(yù)測(cè),發(fā)現(xiàn)正確率均不是太高。隨后研究人員逐漸提出了各自不同的綜合分析方法,以期提高預(yù)測(cè)的準(zhǔn)確率。1988年Jameson和Worf[13]提出一種綜合預(yù)測(cè)方案。該方案選取了4種參數(shù),并且對(duì)各參數(shù)賦予了不同的權(quán)重,即二級(jí)結(jié)構(gòu)預(yù)測(cè)是40%,親水性參數(shù)是30%,可及性和柔韌性參數(shù)各占15%。作者利用該方案,對(duì)多個(gè)蛋白質(zhì)進(jìn)行了表位預(yù)測(cè),得到了較為理想的結(jié)果。1997年萬(wàn)濤等[14]綜合了5種參數(shù),即Hopp親水性、HPLC親水性、可及性、抗原性方案和二級(jí)結(jié)構(gòu)參數(shù)。作者利用含有169個(gè)已知抗原位點(diǎn)的34個(gè)蛋白質(zhì)對(duì)這5種參數(shù)進(jìn)行綜合測(cè)試,得出的結(jié)論是Hopp親水性參數(shù)和可及性參數(shù)在預(yù)測(cè)中占有重要位置,權(quán)重分別能夠達(dá)到0.36,而HPLC親水性也是比較重要的一個(gè)參數(shù),權(quán)重達(dá)到0.18。利用這個(gè)綜合預(yù)測(cè)模型,作者對(duì)5個(gè)蛋白進(jìn)行了預(yù)測(cè),準(zhǔn)確率接近50%。
2000年Alix[15]提出了抗原性指數(shù)Antigenic Index(AG),并且使用C+語(yǔ)言編寫(xiě)了一個(gè)基于DOS操作系統(tǒng)的預(yù)測(cè)軟件PEOPLE(Predictive estimationof protein linear epitopes)。他采用了與Jameson[13]相同的4個(gè)參數(shù)及權(quán)重。不同的是每種參數(shù)中,作者都選取了多個(gè)文獻(xiàn)中的數(shù)據(jù),所以他的結(jié)果要比Jameson的更加全面。2004年Saha等[16]使用7種單參數(shù)(親水性參數(shù)、可及性、柔韌性、表面特征、極性特征、β轉(zhuǎn)角參數(shù)和抗原性參數(shù))建立了多種不同的組合,結(jié)果發(fā)現(xiàn)以柔韌性為主輔以親水性及極性特征的組合,預(yù)測(cè)的準(zhǔn)確率最高,達(dá)到58.7%。同時(shí)作者編寫(xiě)了一個(gè)預(yù)測(cè)軟件BcePred供其他研究人員免費(fèi)使用。Blythe等[17]利用50個(gè)蛋白質(zhì)表位檢驗(yàn)了AAindex數(shù)據(jù)庫(kù)中484個(gè)氨基酸參數(shù),發(fā)現(xiàn)即使結(jié)合了最好的參數(shù),比隨機(jī)法也僅有少許提高。多參數(shù)綜合雖然比單個(gè)參數(shù)的預(yù)測(cè)準(zhǔn)確率提高了一些,但結(jié)果依然不能讓大家感到滿意。
2.3基于機(jī)器學(xué)習(xí)算法的預(yù)測(cè) 隨著21世紀(jì)初多種機(jī)器學(xué)習(xí)算法的出現(xiàn),研究人員將這些方法引入到表位預(yù)測(cè)的工作中,即機(jī)器學(xué)習(xí)方法嘗試從一套學(xué)習(xí)樣本中抽提出表位的共同特點(diǎn),概括為一個(gè)分類(lèi)算法。結(jié)果表明準(zhǔn)確率較傳統(tǒng)方法有一定的提高,將B細(xì)胞表位預(yù)測(cè)方法引入了一個(gè)新的方向。
2006年4月Larsen等[18]將兩種經(jīng)典參數(shù)HPLC親水性、二級(jí)結(jié)構(gòu)參數(shù)與一種機(jī)器學(xué)習(xí)算法--隱馬爾科夫模型(HMM,hidden Markov model)相結(jié)合,提出預(yù)測(cè)方法Bepipred。隱馬爾科夫模型是一種統(tǒng)計(jì)分析模型,能夠從可觀察的參數(shù)中確定該過(guò)程的隱含參數(shù),然后利用這些參數(shù)來(lái)作進(jìn)一步的分析。Larsen方法的AROC評(píng)分達(dá)到0.671,比隨機(jī)預(yù)測(cè)法和基于參數(shù)的方法有一定提高。4個(gè)月后Saha等[19]提出了基于人工神經(jīng)網(wǎng)絡(luò)模型的B細(xì)胞表位預(yù)測(cè)(Artificial neural network basedB-cell epitope prediction server,ABCpred)。人工神經(jīng)網(wǎng)絡(luò)模型是一種運(yùn)算模型,是由大量處理單元互聯(lián)組成的并行分布式、非線性、自適應(yīng)信息處理系統(tǒng)。Saha的系統(tǒng)利用了Bcipep數(shù)據(jù)庫(kù)中700個(gè)非冗余B細(xì)胞表位和Swiss-Prot數(shù)據(jù)庫(kù)的700個(gè)長(zhǎng)度為10~20個(gè)氨基酸殘基的隨機(jī)多肽為訓(xùn)練對(duì)象,在預(yù)測(cè)長(zhǎng)度為16個(gè)氨基酸的表位時(shí),其總體準(zhǔn)確率接近66%。
2007年Chen等[20]首次使用機(jī)器學(xué)習(xí)算法(Amino acid pair,AAP),他們利用Bcipep數(shù)據(jù)庫(kù)中872個(gè)已知B細(xì)胞表位和872個(gè)非表位隨機(jī)多肽進(jìn)行訓(xùn)練,結(jié)果表明單獨(dú)使用AAP時(shí),準(zhǔn)確率為71%。而在結(jié)合了傳統(tǒng)參數(shù)如親水性、可及性等參數(shù)后,其準(zhǔn)確率可以達(dá)到72.5%。2008年Leslie和Manzalawy等[21,22]將4種字符串函數(shù)引入到機(jī)器學(xué)習(xí)算法支持向量機(jī)(Support vector machine,SVM)中,這四種字符串函數(shù)分別是光譜函數(shù)、錯(cuò)配函數(shù)、局部對(duì)比函數(shù)和超序列函數(shù)。支持向量機(jī)是一種監(jiān)督學(xué)習(xí)模型,可以分析數(shù)據(jù),識(shí)別模式,用于分類(lèi)和回歸分析。Manzalawy利用Bcipep數(shù)據(jù)庫(kù)中701個(gè)已知B細(xì)胞表位和701個(gè)非表位隨機(jī)多肽進(jìn)行訓(xùn)練,結(jié)果表明當(dāng)超序列函數(shù)與SVM相結(jié)合時(shí),準(zhǔn)確率能達(dá)到75.8%。作者分別編寫(xiě)了2種不同的程序BCPred和FBCPred來(lái)進(jìn)行固定長(zhǎng)度表位(12、14、16、18和20個(gè)氨基酸)及可變長(zhǎng)度表位的預(yù)測(cè)。
2009年Sweredoski和Baldi[23]推出了COBE pro,一個(gè)分兩步來(lái)預(yù)測(cè)線性B細(xì)胞抗原表位的系統(tǒng)。第一步該系統(tǒng)對(duì)待測(cè)蛋白進(jìn)行表位分析,找出所有潛在的表位,第二步則對(duì)找到的所有表位逐一進(jìn)行分值運(yùn)算,按分值高低進(jìn)行排序。經(jīng)過(guò)與現(xiàn)有的幾種算法進(jìn)行比較后作者發(fā)現(xiàn)該系統(tǒng)具有一定的競(jìng)爭(zhēng)力。同時(shí)能夠?qū)λA(yù)測(cè)的表位按分值進(jìn)行排序的特點(diǎn)將非常有助于使用者進(jìn)行表位篩選工作。2011年Wang等[24]提出了一個(gè)新的預(yù)測(cè)體系Linear Epitope Prediction System (LEPS),該體系結(jié)合了SVM和其他相關(guān)數(shù)據(jù),使用了4個(gè)不同的數(shù)據(jù)庫(kù)(AntiJen,HIV,PC和AHP)來(lái)進(jìn)行訓(xùn)練。在與現(xiàn)有4種預(yù)測(cè)方法(BepiPred,ABCPred,BCPred和FBCPred)進(jìn)行比較后,作者發(fā)現(xiàn)LEPS預(yù)測(cè)特異性最高能達(dá)到88.33%,準(zhǔn)確率方面最高能達(dá)到73.81%,具有明顯的優(yōu)勢(shì)。
2013年Lin等[25]提出BEEPro,該方法將包括氨基酸比例參數(shù)、位置特異性得分矩陣(Position specific scoring matrix,PSSM)及14種氨基酸物理化學(xué)特性在內(nèi)的16種參數(shù)與Support Vector Machine (SVM)相結(jié)合。作者使用了6個(gè)不同的數(shù)據(jù)庫(kù)(Sollner、AntiJen-1、AntiJen-2、HIV、Pellequer和PC)來(lái)訓(xùn)練該體系。最終作者認(rèn)為多理化參數(shù)預(yù)測(cè)的結(jié)果明顯要好于單個(gè)參數(shù)的結(jié)果。同時(shí),在與現(xiàn)有5種已知預(yù)測(cè)方法(LEPS、BepiPred、ABCPred、BCPred和FBCPred)進(jìn)行比較后,作者發(fā)現(xiàn)BEEProS預(yù)測(cè)特異性是94.33%~99.46%,準(zhǔn)確率為93.73%~99.29%,具有非常明顯的優(yōu)勢(shì)。2個(gè)月后Singh等[26]首次使用全部經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證的49 694個(gè)表位序列和50 324個(gè)非表位多肽序列進(jìn)行數(shù)據(jù)的訓(xùn)練,并將這些數(shù)據(jù)分為了5個(gè)包括固定長(zhǎng)度和可變長(zhǎng)度不同的數(shù)據(jù)庫(kù)。作者認(rèn)為與以往使用隨機(jī)多肽作為非表位肽進(jìn)行訓(xùn)練的方法相比,他們使用經(jīng)實(shí)驗(yàn)確定的非表位多肽序列,將得到更為可信的預(yù)測(cè)結(jié)果。
2014年Lian等[27]提出了基于多元線性回歸的表位預(yù)測(cè)(Epitope prediction using the multiple linear regression,EP MLR),一種基于MLR的線性表位預(yù)測(cè)系統(tǒng)。作者從BEOracle中選取了300個(gè)線性表位和300個(gè)隨機(jī)多肽作為訓(xùn)練對(duì)象,在與現(xiàn)有3種預(yù)測(cè)方法(ABCPred、BCPred和LEPS)進(jìn)行比較后,作者發(fā)現(xiàn)EP MLR在預(yù)測(cè)特異性和準(zhǔn)確率方面與這些預(yù)測(cè)方法基本一致。2015年Shen等[28]提出了一種將a mino acid anchoring pair composition(APC)和SVM兩種機(jī)器學(xué)習(xí)相結(jié)合的預(yù)測(cè)系統(tǒng)APCpred。作者使用了6個(gè)表位數(shù)據(jù)庫(kù)對(duì)該系統(tǒng)進(jìn)行訓(xùn)練,分別是BC1727、Chen872、ABC16、Blind387、Lbtope-Confirm及FBC934。在與現(xiàn)有3種預(yù)測(cè)方法(ABCPred、BCPred和LEPS)進(jìn)行比較后,作者發(fā)現(xiàn)APCpred在預(yù)測(cè)特異性和準(zhǔn)確率方面與這些預(yù)測(cè)方法基本一致。
2.4各種預(yù)測(cè)方法比較 對(duì)目前各種預(yù)測(cè)方法進(jìn)行了比較,見(jiàn)表1。
目前多個(gè)研究小組在互聯(lián)網(wǎng)上發(fā)布了線性表位的預(yù)測(cè)網(wǎng)址,總結(jié)見(jiàn)表2。
表1各種預(yù)測(cè)方法比較
Tab.1Compareofdifferentpredictionmethods
PreditionMethodFeaturesUsedCharacteristicApplicationSingleclassicparame-terAccessibility,HydrophilicityAntigenicity,Flexi-bilitySecondarystructureSimplemethod,LowaccuracyBasicallynouseMulitpleclassicparam-eterssameasaboveTheintroductionoftheconceptofweight,me-diumaccuracyNarrowapplicationrangeSinglemachinelearn-ingapproachHiddenMarkovmodel,Artificialneuralnet-work,SupportVectorMachineBasedontheexistingdatabase,speedcompu-tingsystem,highaccuracyWideapplicationCombinationofmach-inelearningandclassicmethodAccessibility,HydrophilicityAntigenicity,Hid-denMarkovmodel,Artificialneuralnetwork,SupportVectorMacMultiplemethods,highaccuracyWideapplication
表2線性B細(xì)胞表位預(yù)測(cè)網(wǎng)址
Tab.2WebsiteoflinearB-cellepitopesprediction
TimeNameWebsiteReference2004BcePredhttp://www.imtech.res.in/raghava/bcepred/[16]2006BepiPredhttp://www.cbs.dtu.dk/services/BepiPred/[18]2006ABCpredhttp://www.imtech.res.in/raghava/abcpred/[19]2007VaxiJenhttp://www.jenner.ac.uk/VaxiJen[29]2008BCPREDShttp://ailab.ist.psu.edu/bcpred/pre-dict.html[21-22]2009COBEprohttp://scratch.proteomics.ics.uci.edu[23]2009Epitopiahttp://epitopia.tau.ac.il/[30]2011LEPShttp://leps.cs.ntou.edu.tw[24]2012IEDBhttp://tools.iedb.org/main/bcell/[31]2013LBtopehttp://crdd.osdd.net/raghava/lbtope/index.php[26]2014EPMLRhttp://www.bioinfo.tsinghua.edu.cn/epitope/EPMLR/[27]2015APCpredhttp://ccb.bmi.ac.cn/APCpred/pre-diction.php[28]
表位是蛋白質(zhì)抗原性的基礎(chǔ),也與生物機(jī)體免疫調(diào)節(jié)密切相關(guān),表位研究對(duì)疾病的診斷以及疫苗分子的設(shè)計(jì)等具有重要的意義。經(jīng)過(guò)多年的研究積累,特別是近10年來(lái)機(jī)器學(xué)習(xí)算法和高速計(jì)算機(jī)技術(shù)的幫助,表位預(yù)測(cè)研究有了突飛猛進(jìn)的發(fā)展,新預(yù)測(cè)方法和數(shù)據(jù)庫(kù)層出不窮。盡管如此,表位預(yù)測(cè)的總體表現(xiàn)尚不能令人十分滿意,多個(gè)方面仍需進(jìn)一步改進(jìn)和提高。相信隨著對(duì)蛋白質(zhì)功能和結(jié)構(gòu)研究的不斷深入,抗原表位及蛋白質(zhì)3D結(jié)構(gòu)數(shù)據(jù)庫(kù)的不斷豐富及生物信息學(xué)技術(shù)等學(xué)科的快速發(fā)展,表位預(yù)測(cè)的準(zhǔn)確性也將進(jìn)一步提升,人們對(duì)蛋白質(zhì)抗原表位的研究將更加透徹。
[1] Van Regenmortel MH.The concept and operational definition of protein epitopes[J].Philos Trans R Soc Lond B Biol Sci,1989,323(1217):451-466.
[2] Daga DA,Davila ML.CAR models:next-generation CAR modificationsfor enhanced T-cell function[J].Mol Ther Onco,2016,3:16014-16021.
[3] Correia BE,Bates JT,Loomis RJ,etal.Proof of principle for epitope-focused vaccine design[J].Nature,2014,507(7491):201-206.
[4] Uhlen M,Bandrowski A,Carr S,etal.A proposal for validation of antibodies[J].Nature Methods,2016,13(10):823-827.
[5] Barlow DJ,Edwards MS,Thornton JM.Continous and discontinuous protein antigenic determinants[J].Nature,1986,322(6081):747-748.
[6] Janin J.Surface and inside volumes in globular proteins[J].Nature,1979,277:491-492.
[7] Hopp TP,Woods KR.Prediction of protein antigenic determinants from a mino acid sequences[J].Proc Natl Acad Sci,1981,78(6):3824-3828.
[8] Parker JMR,Guo D,Hodges RS.New hydrophilicity scale derived from high-performance liquid chromatography peptide retention data:correlation of predicted surface residues with antigenicity and X-ray-derived accessible sites[J].Biochemistry,1986,25:5425-5432.
[9] Welling GW,Weijer WJ,Vander ZR,etal.Prediction of sequential antigenic regions in proteins[J].FEBS Lett,1985,188(2):215-218.
[10] Kolaskar AS,Tongaonkar PC.A semi-emperical method for prediction of antigenic determinants on protein antigens[J].FEBS Lett,1990,276(1):172-174.
[11] Karplus PA,Schultz GE.Prediction of chain flexibility in proteins:a tool for the selection of peptide antigen[J].Naturwissenschaften,1985,72(4):212-213.
[12] Pellequer JL,Westhof E,Van Regenmortel MH.Correlation between the location of antigenic sites and the prediction of turns in proteins[J].Immunol Lett,1993,36(1):83-99.
[13] Jameson BA,Wolf H.The antigenic index:a novel algorithm for predicting antigenic determinants[J].Bioinformatics,1988,4(1):181-186.
[14] 萬(wàn) 濤,孫 濤,吳加金.蛋白順序性抗原決定簇的多參數(shù)綜合預(yù)測(cè)[J].中國(guó)免疫學(xué)雜志,1997,13(6):329-333.
[15] Alix AJ.Predictive estimation of protein linear epitopes by using the program PEOPLE[J].Vaccine,1999,18(3-4):311-314.
[16] Saha S,Raghava G.BcePred:Prediction of continuous B-cell epitopes in antigenic sequences using physico-chemical properties[J].Int Conference on Artificial Immune System,2004,3239:197-204.
[17] Blythe MJ,Flower DR.Benchmarking B cell epitope prediction:underperformance of existing methods[J].Protein Sci,2005,14(1):246-248.
[18] Larsen JEP,Lund O,Nielsen M.Improved method for predicting linear B-cell epitopes[J].Immunome Res,2006,2(1):2-9.
[19] Saha S,Raghava G.Prediction of continuous B-cell epitopes in an antigen using recurrent neural network[J].Proteins,2006,65:40-48.
[20] Chen J,Liu H,Yang J,etal.Prediction of linear B-cell epitopes using a mino acid pair antigenicity scale[J].Amino Acids,2007,33:423-428.
[21] Manzalawy YEL,Dobbs D,Honavar V.Predicting linear B-cell epitopes using string kernels[J].Mol Recognit,2008,21:243-255.
[22] Leslie C,Eskin E,Cohen A,etal.Mismatch string kernels for discriminative protein classification[J].Bioinformatics,2004,20(4):467-476.
[23] Sweredoski MJ,Baldi P.COBEpro:a novel system for predicting continuous B-cell epitopes[J].Protein Eng Des Sel,2009,22(3):113-120.
[24] Wang HW,Lin YC,Pai TW,etal.Prediction of B-cell linear epitopes with a combination of support vector machine classification and a mino acid propensity identification[J].J Biomed Biotechnol,2011,447-451.
[25] Lin SYH,Cheng CW,Su ECY.Prediction of B-cell epitopes using evolutionary information and propensity scales[J].BMC Bioinformatics,2013,14( 2):10-19.
[26] Singh H,Ansari HR,Raghava GP.Improved method for linear B-cell epitope prediction using antigen′s primary sequence[J].PLoS One,2013,8(5):62216-62224.
[27] Lian Y,Ge M,Pan XM.EP MIR:sequence-based linear B-cell epitope prediction method using multiple linear regression[J].BMC Bioinformatics,2014,15:414-420.
[28] Shen KW,Cao Y,Cha L,etal.Predicting linear B-cell epitopes using a mino acid anchoring pair composition[J].BioData Mining,2015,8:14-26.
[29] Doytchinova IA,Flower DR.VaxiJen a server for prediction of protective antigens,tumour antigens and subunit vaccines[J].BMC Bioinformatics,2007,8:4-11.
[30] Rubinstein ND,Mayrose I,Martz E,etal.Epitopia:a web-server for predicting B-cell epitopes[J].BMC Bioinformatics,2009,10:287-292.
[31] Kim Y,Ponomarenko J,Zhu Z,etal.Immune epitope database analysis resource[J].Nucleic Acids Res,2012,40:525-530.
[收稿2016-12-27 修回2017-01-13]
(編輯 張曉舟)
10.3969/j.issn.1000-484X.2017.09.032
①本文受河北省科學(xué)院兩院合作項(xiàng)目(15005023)資助。
程 華(1977年-),男,碩士,副研究員,主要從事抗體工程研究。
R392.1
A
1000-484X(2017)09-1422-05
②共同第一作者。
③河北省科學(xué)院應(yīng)用數(shù)學(xué)研究所,石家莊050081。