国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機(jī)器學(xué)習(xí)的蛋白質(zhì)相互作用位點(diǎn)預(yù)測(cè)研究進(jìn)展

2013-09-05 07:20
宿州學(xué)院學(xué)報(bào) 2013年12期
關(guān)鍵詞:殘基位點(diǎn)蛋白質(zhì)

李 慧

1.金陵科技學(xué)院信息技術(shù)學(xué)院,江蘇南京,210001;2.江蘇省信息分析工程實(shí)驗(yàn)室,江蘇南京,210001;3.南京航空航天大學(xué)計(jì)算機(jī)學(xué)院,江蘇南京,210016

基于機(jī)器學(xué)習(xí)的蛋白質(zhì)相互作用位點(diǎn)預(yù)測(cè)研究進(jìn)展

李 慧1,2,3

1.金陵科技學(xué)院信息技術(shù)學(xué)院,江蘇南京,210001;
2.江蘇省信息分析工程實(shí)驗(yàn)室,江蘇南京,210001;
3.南京航空航天大學(xué)計(jì)算機(jī)學(xué)院,江蘇南京,210016

利用計(jì)算方法預(yù)測(cè)蛋白質(zhì)之間的相互作用,既省時(shí)又省力,彌補(bǔ)了采用原理不同和實(shí)驗(yàn)條件限制等因素導(dǎo)致的實(shí)驗(yàn)數(shù)據(jù)具有一定假陽(yáng)性和假陰性實(shí)驗(yàn)的缺陷。針對(duì)蛋白質(zhì)相互作用的功能位點(diǎn),列出了常用的蛋白質(zhì)相互作用數(shù)據(jù)庫(kù)。為了提高預(yù)測(cè)的精確度,分析了蛋白質(zhì)特征屬性信息選擇,以及常用的機(jī)器學(xué)習(xí)預(yù)測(cè)方法,總結(jié)了蛋白質(zhì)相互作用位點(diǎn)預(yù)測(cè)的常用機(jī)器學(xué)習(xí)智能算法模型,給出相應(yīng)的實(shí)驗(yàn)評(píng)價(jià)標(biāo)準(zhǔn)。

蛋白質(zhì)相互作用;作用位點(diǎn);預(yù)測(cè);機(jī)器學(xué)習(xí)

1 問(wèn)題的提出

隨著人類基因組計(jì)劃的完成,生命科學(xué)研究已經(jīng)進(jìn)入了一個(gè)以研究功能基因組為標(biāo)志的后基因組時(shí)代。蛋白質(zhì)是由基因表達(dá)的,因此蛋白質(zhì)組學(xué)的研究成為生物信息學(xué)研究的熱點(diǎn)之一。蛋白質(zhì)作為生命活動(dòng)最主要的體現(xiàn)者和執(zhí)行者,其間的相互作用不僅在細(xì)胞活動(dòng)中起著關(guān)鍵性作用,而且在各種疾病的治療方面也具有極大的推進(jìn)作用。目前,蛋白質(zhì)之間的相互作用主要從微觀層面和宏觀層面進(jìn)行作用研究。在微觀上側(cè)重于結(jié)合部位[1]的研究,著重研究蛋白質(zhì)相互作用中的功能位點(diǎn)(界面殘基),分析預(yù)測(cè)蛋白質(zhì)鏈上哪些表面殘基是界面殘基,即發(fā)生相互作用的殘基。在宏觀上側(cè)重于結(jié)合對(duì)象的研究,著重研究蛋白質(zhì)之間的相互作用對(duì)象及其形成的相互作用網(wǎng)絡(luò)。

對(duì)于蛋白質(zhì)相互作用的研究通常采用的是生化實(shí)驗(yàn)方法,主要包括雙雜交技術(shù)(two hybrid system)、免疫共沉淀、pull-down技術(shù)、交聯(lián)技術(shù)、串聯(lián)親和純化、生物發(fā)光共振能量轉(zhuǎn)移技術(shù)等方法。這些實(shí)驗(yàn)方法雖然能夠測(cè)定蛋白質(zhì)之間的相互作用,但由于所采用的原理不同,實(shí)驗(yàn)條件限制等因素,導(dǎo)致實(shí)驗(yàn)數(shù)據(jù)具有一定的假陽(yáng)性和假陰性。隨著計(jì)算機(jī)技術(shù)的發(fā)展,利用計(jì)算方法預(yù)測(cè)蛋白質(zhì)之間的相互作用,既省時(shí)又省力,彌補(bǔ)實(shí)驗(yàn)的缺陷。本文針對(duì)蛋白質(zhì)相互作用的功能位點(diǎn),列出了常用的蛋白質(zhì)相互作用數(shù)據(jù)庫(kù);為了提高預(yù)測(cè)的精確度,分析了蛋白質(zhì)特征屬性信息選擇,以及常用的機(jī)器學(xué)習(xí)預(yù)測(cè)方法,并給出相應(yīng)的總結(jié)思考;最后介紹了常用的實(shí)驗(yàn)評(píng)估方法,給出下一步的研究方向。

2 蛋白質(zhì)相互作用數(shù)據(jù)庫(kù)

隨著生物技術(shù)和信息技術(shù)的發(fā)展,出現(xiàn)了許多與蛋白質(zhì)相關(guān)的數(shù)據(jù)集。為了更好地對(duì)蛋白質(zhì)進(jìn)行生物實(shí)驗(yàn)技術(shù)或計(jì)算技術(shù)的研究,生物信息學(xué)研究者們對(duì)這些數(shù)據(jù)進(jìn)行分析、組織和整理,按照不同特點(diǎn)形成了不同的數(shù)據(jù)庫(kù)。大部分蛋白質(zhì)相互作用數(shù)據(jù)庫(kù)的數(shù)據(jù)是通過(guò)實(shí)驗(yàn)方法驗(yàn)證得到的,有些數(shù)據(jù)庫(kù)數(shù)據(jù)集是基于計(jì)算方法得到的,有些兩者兼有[2]。表1列出了大部分蛋白質(zhì)相互作用數(shù)據(jù)庫(kù)。以下重點(diǎn)介紹其中3個(gè)重要的蛋白質(zhì)相互作用數(shù)據(jù)庫(kù)。

2.1 DIP

DIP(Database of Interacting Proteins)數(shù)據(jù)庫(kù)由 UCLA的 David Elsenberg實(shí)驗(yàn)室于 1999年建立,其蛋白質(zhì)相互作用數(shù)據(jù)是通過(guò)各種各樣的實(shí)驗(yàn)獲得的。DIP數(shù)據(jù)庫(kù)包含內(nèi)容有蛋白質(zhì)相關(guān)信息、蛋白質(zhì)相互作用信息和采用的實(shí)驗(yàn)技術(shù)。截至2013年9月,DIP數(shù)據(jù)庫(kù)中收集了 76 270個(gè)蛋白質(zhì)相互作用數(shù)據(jù)對(duì),其中蛋白質(zhì)數(shù)量為26 071個(gè),涉及的物種數(shù)達(dá)到了 619個(gè)。

2.2 M INT

MIN T(Molecular Interaction Databased)數(shù)據(jù)庫(kù)是以結(jié)構(gòu)化形式存取,且是已經(jīng)發(fā)表的通過(guò)實(shí)驗(yàn)方法驗(yàn)證的蛋白質(zhì)分子相互作用信息,該數(shù)據(jù)庫(kù)不含有遺傳或計(jì)算方法推斷的蛋白質(zhì)相互作用數(shù)據(jù),主要是蛋白質(zhì)之間的物理相互作用。DIP數(shù)據(jù)庫(kù)的最新版本是2011年8月發(fā)布的,收集了241 458個(gè)蛋白質(zhì)相互作用數(shù)據(jù)對(duì),其中蛋白質(zhì)數(shù)量為35 553個(gè),pmids數(shù)達(dá)到了 5 554個(gè),該數(shù)據(jù)截至日期是 2013年9月。

表1 蛋白質(zhì)相互作用數(shù)據(jù)庫(kù)

2.3 BioGRID

BioGRID(Biological General Repository for Interaction Datasets)是一個(gè)通過(guò)實(shí)驗(yàn)方法收集蛋白質(zhì)遺傳和物理的相互作用數(shù)據(jù)庫(kù)。該數(shù)據(jù)庫(kù)的最新版本是 2013年9月發(fā)布的 BioGRID 3.2.104,總計(jì)有708 833個(gè)蛋白質(zhì)相互作用數(shù)據(jù)對(duì),其中蛋白質(zhì)數(shù)量為 52 855個(gè),遺傳的相互作用是 269 047個(gè),物理的相互作用是 439 786個(gè)。

3 特征屬性選擇

蛋白質(zhì)有很多不同的生化特征,為了提高蛋白質(zhì)相互作用預(yù)測(cè)的精確度,如何選擇合適的特征屬性是蛋白質(zhì)相互作用位點(diǎn)預(yù)測(cè)的關(guān)鍵。研究者們根據(jù)蛋白質(zhì)相互作用特點(diǎn),把這些特征大致分成三類:保守性特征、序列特征和結(jié)構(gòu)特征屬性[1]。

3.1 保守性特征

生物實(shí)驗(yàn)結(jié)果已表明,界面殘基的保守性比表面殘基大。Yan[3]等人采用計(jì)算方法對(duì)蛋白質(zhì)相互作用對(duì)數(shù)據(jù)集進(jìn)行計(jì)算,也得出同樣結(jié)果。保守性表現(xiàn)形式主要有序列譜和殘基保守性打分。

序列譜是根據(jù)同源序列的多序列比對(duì)得到的,可以很好地表達(dá)蛋白質(zhì)系統(tǒng)進(jìn)化關(guān)系。目前,用于蛋白質(zhì)作用預(yù)測(cè)的序列譜主要通過(guò) PSI-BLAST和HSSP程序提取出來(lái)。 PSI-BLAST進(jìn)行多序列比對(duì),用矩陣形式表示比對(duì)結(jié)果得到序列譜。HSSP直接從其hssp文件中提取出蛋白質(zhì)序列譜。殘基保守性打分值有效表達(dá)了每個(gè)殘基的進(jìn)化保守性。Liang等采用 PSI-BLAST得到序列譜計(jì)算保守性打分值[4]。 Landau等人建立ConSurf-HSSP程序計(jì)算打分值[5]。

3.2 序列特征

序列特征通過(guò)蛋白質(zhì)的序列信息即可得到,常用的表現(xiàn)形式有疏水性、界面組成及傾向性。通常根據(jù)能否與水發(fā)生相互作用,將化學(xué)物質(zhì)分為親水性和疏水性兩類。一般原子間僅以非極性共價(jià)鍵相連的分子具有疏水性,它是區(qū)分界面殘基和非界面殘基的一個(gè)重要特性。Gallet[6]和Glaser[7]等人研究發(fā)現(xiàn),蛋白質(zhì)表面中的作用位點(diǎn)殘基具有強(qiáng)的疏水性。界面組成及傾向性也是蛋白質(zhì)相互作用位點(diǎn)預(yù)測(cè)的一個(gè)重要序列特征,Liang等人證實(shí)殘基的界面傾向性對(duì)結(jié)果的影響很大[4]。

3.3 結(jié)構(gòu)特征

結(jié)構(gòu)特征通過(guò)蛋白質(zhì)的三維結(jié)構(gòu)信息得到,常用的表現(xiàn)形式有溶劑可及表面積、二級(jí)結(jié)構(gòu)。溶劑可及表面積是殘基暴露在溶劑中與溶劑相互接觸的面積。研究表明,在蛋白質(zhì)相互作用位點(diǎn)預(yù)測(cè)中,界面殘基比非界面殘基具有更大的溶劑可及表面積[8]。對(duì)蛋白質(zhì)的 PDB文件進(jìn)行 DSSP處理,可以得到該特征值。常用的蛋白質(zhì)二級(jí)結(jié)構(gòu)包括α-螺旋、β-折疊、β-轉(zhuǎn)角和無(wú)規(guī)則卷曲等結(jié)構(gòu)。研究表明,界面殘基中的β-折疊結(jié)構(gòu)比α-螺旋結(jié)構(gòu)更多,其他大致相同[9]。因此,二級(jí)結(jié)構(gòu)是蛋白質(zhì)相互作用位點(diǎn)預(yù)測(cè)的一個(gè)重要特征。

3.4 小結(jié)

在進(jìn)行蛋白質(zhì)相互作用位點(diǎn)預(yù)測(cè)時(shí),如何選擇合適的蛋白質(zhì)特征構(gòu)建特征向量是非常重要的。不同的特征向量使用相同的機(jī)器學(xué)習(xí)算法,產(chǎn)生不同的預(yù)測(cè)精確度。Lakes Ezkurdia等人使用SVM算法針對(duì)不同的特征向量進(jìn)行預(yù)測(cè),得到了不同的預(yù)測(cè)效果[10]。因此,為了提高蛋白質(zhì)作用位點(diǎn)預(yù)測(cè)的精確度,需要根據(jù)不同蛋白質(zhì)數(shù)據(jù)特點(diǎn),選擇合適的特征屬性。另外,還存在一些需要完善的方面。

(1)目前關(guān)于蛋白質(zhì)數(shù)據(jù)庫(kù)中的數(shù)據(jù)信息是有限的,產(chǎn)生足夠大和無(wú)偏見(jiàn)的數(shù)據(jù)集需要很長(zhǎng)時(shí)間。

(2)集成關(guān)鍵結(jié)構(gòu)屬性和序列特征屬性,形成組合特征。

(3)根據(jù)不同蛋白質(zhì)數(shù)據(jù)屬性特點(diǎn),對(duì)特征向量進(jìn)行加權(quán)處理。

4 作用位點(diǎn)預(yù)測(cè)智能方法

對(duì)蛋白質(zhì)相互作用位點(diǎn)進(jìn)行預(yù)測(cè)的計(jì)算方法主要是通過(guò)一些機(jī)器學(xué)習(xí)分類器來(lái)實(shí)現(xiàn)的。首先,對(duì)蛋白質(zhì)源數(shù)據(jù)進(jìn)行分析處理,提取出實(shí)驗(yàn)數(shù)據(jù);其次,選取特征屬性并向量化,作為模型的輸入?yún)?shù),構(gòu)建模型,進(jìn)行模型訓(xùn)練,不斷調(diào)整參數(shù)直至滿足要求;最后,使用該模型預(yù)測(cè)蛋白質(zhì)作用功能位點(diǎn)。具體過(guò)程如圖 1所示。常用的用于蛋白質(zhì)相互作用位點(diǎn)預(yù)測(cè)的機(jī)器學(xué)習(xí)方法有貝葉斯、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、隱馬爾科夫模型、線性回歸、得分函數(shù)、條件隨機(jī)域、隨機(jī)森林。下面主要介紹3種常用的方法。

圖1 機(jī)器學(xué)習(xí)方法預(yù)測(cè)蛋白質(zhì)作用位點(diǎn)過(guò)程

4.1 貝葉斯方法

貝葉斯方法是基于不確定性理論進(jìn)行推理分析的一種方法,能夠有效處理不完全或部分?jǐn)?shù)據(jù)丟失的數(shù)據(jù)集。它是一種將先驗(yàn)知識(shí)和從數(shù)據(jù)中收集的新證據(jù)相結(jié)合的表達(dá)模式,已經(jīng)被廣泛應(yīng)用于蛋白質(zhì)功能位點(diǎn)預(yù)測(cè)和相互作用對(duì)象預(yù)測(cè)等生物信息學(xué)的各個(gè)方面。

蛋白質(zhì)序列信息樣本數(shù)據(jù)用n維特征向量X={x1,x2,… ,xn}表示,C表示類別,其值Y表示界面殘基,值N表示非界面殘基。根據(jù)貝葉斯定理,分類器公式如下:

其中,P(CY)表示訓(xùn)練數(shù)據(jù)集中界面殘基的比例,P(XCY)表示屬性值為{x1,x2,… ,xn}的界面殘基概率值,P(X)表示{x1,x2,… ,xn}在整個(gè)數(shù)據(jù)集中的概率值。如果P(CYX)達(dá)到了一個(gè)閾值,則認(rèn)為該殘基是界面殘基。

樸素貝葉斯分類器要求各屬性變量之間相互獨(dú)立,由式(1)推出式(2)進(jìn)行分類預(yù)測(cè)。 Neuvirth[9]和王池社[11]等人使用該方法預(yù)測(cè)蛋白質(zhì)界面殘基,取得了較好的效果。Bradford等人[12]使用貝葉斯網(wǎng)絡(luò)分類器進(jìn)行預(yù)測(cè),取得了 82%的成功率。

4.2 神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)是一種模擬生物系統(tǒng)工作的一種方式,具有三層結(jié)構(gòu):輸入層、隱含層和輸出層。輸入層接受數(shù)據(jù)的輸入,隱含層對(duì)輸入數(shù)據(jù)進(jìn)行非線性變換并處理,最終輸出層輸出結(jié)果。神經(jīng)網(wǎng)絡(luò)具有承受噪聲數(shù)據(jù)和對(duì)未訓(xùn)練數(shù)據(jù)分類的能力,已被用于蛋白質(zhì)相互作用界面殘基的預(yù)測(cè)[13-14]。

蛋白質(zhì)序列信息樣本數(shù)據(jù)用n維特征向量X={x1,x2,…,xn}表示,被線性映射為一個(gè)輸入結(jié)點(diǎn),經(jīng)過(guò)中間層非線性變化、處理,輸出層輸出結(jié)果1(界面殘基)或 0(非界面殘基)。其變化公式為:

式(3)中,IX表示輸入,h為隱含層非線性變換函數(shù),f為輸出層函數(shù),w1表示輸入層和隱含層的連接權(quán)重,w2表示隱含層和輸出層的連接權(quán)重。

文獻(xiàn)[15]使用徑向神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)蛋白質(zhì)界面殘基,達(dá)到了 68.9%的精確度、66.6%的敏感度和67.6%的特異度。文獻(xiàn)[16][17]提出了基于PSO優(yōu)化的徑向神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,取得了較好的效果。

4.3 支持向量機(jī)

SVM算法使用一種非線性映射,把訓(xùn)練數(shù)據(jù)集映射到高維空間中,找出最佳超平面把原數(shù)據(jù)進(jìn)行歸類。SVM能很好地應(yīng)用于高維數(shù)據(jù),避免了維數(shù)災(zāi)難等問(wèn)題,現(xiàn)已被廣泛應(yīng)用于生物信息數(shù)據(jù)的分類問(wèn)題。

蛋白質(zhì)序列信息樣本數(shù)據(jù)用n維特征向量X={x1,x2,… ,xn}表示 ,設(shè)給定的數(shù)據(jù)集為 (Xi,Ci),其中Xi是訓(xùn)練元組,具有類標(biāo)號(hào)Ci,Ci∈ {+1,-1},分別對(duì)應(yīng)于 Ci=Yes(界面殘基)和Ci=No(非界面殘基)。輸入數(shù)據(jù)Xi經(jīng)過(guò)非線性變化,被映射到m維空間Z中。在新空間中,構(gòu)建非線性決策超平面為 d(Z)=(Z),該非線性超平面對(duì)應(yīng)于原空間中的非線性分類超曲面。文獻(xiàn) [10]給出了不同特征屬性組合情況下,使用 SVM分類器分別進(jìn)行界面殘基預(yù)測(cè),達(dá)到了不同的預(yù)測(cè)性能。

4.4 小結(jié)

到目前為止,大多數(shù)機(jī)器學(xué)習(xí)算法已被應(yīng)用于蛋白質(zhì)相互作用功能位點(diǎn)預(yù)測(cè)中,并取得了一定的可行性和可用性。但隨著PDB數(shù)據(jù)庫(kù)中蛋白質(zhì)結(jié)構(gòu)信息數(shù)據(jù)的豐富,改善和提高已有的機(jī)器學(xué)習(xí)算法性能以及開(kāi)發(fā)新的預(yù)測(cè)算法是新的發(fā)展趨勢(shì),同時(shí)也面臨著一個(gè)很大的挑戰(zhàn)。

(1)不同種類物種蛋白質(zhì)的信息數(shù)據(jù)特征不同,應(yīng)選擇合適的機(jī)器學(xué)習(xí)分類算法。如貝葉斯方法能夠有效地處理部分?jǐn)?shù)據(jù)丟失的數(shù)據(jù)集。

(2)采用集成機(jī)制,組合一些經(jīng)典算法,充分利用各自算法的優(yōu)點(diǎn),進(jìn)一步提高預(yù)測(cè)的精確度。

5 實(shí)驗(yàn)評(píng)估

衡量一個(gè)分類器預(yù)測(cè)性能的好壞,目前還沒(méi)有一個(gè)統(tǒng)一的測(cè)量標(biāo)準(zhǔn),但一般采用下面幾種指標(biāo)來(lái)評(píng)價(jià)其性能。

其中,TP表示正確的預(yù)測(cè)為界面殘基的個(gè)數(shù);TN表示正確的預(yù)測(cè)為非界面殘基的個(gè)數(shù);FP表示錯(cuò)誤的預(yù)測(cè)為界面殘基的個(gè)數(shù),其實(shí)原為非界面殘基;FN表示錯(cuò)誤的預(yù)測(cè)為非界面殘基個(gè)數(shù),其實(shí)原為界面殘基;CC為相關(guān)系數(shù)。

6 結(jié)束語(yǔ)

蛋白質(zhì)相互作用的界面殘基是生物分子相互作用的基礎(chǔ),也是目前研究的熱點(diǎn),廣泛應(yīng)用于藥物靶標(biāo)識(shí)別和新藥研制等方面。本文介紹了常用的蛋白質(zhì)相互作用數(shù)據(jù)庫(kù),綜述了蛋白質(zhì)相互作用特征屬性向量的選擇以及常用的機(jī)器學(xué)習(xí)預(yù)測(cè)算法,最后給出常用的評(píng)價(jià)方法。隨著PDB數(shù)據(jù)庫(kù)中蛋白質(zhì)數(shù)據(jù)的增加,特別是蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)的豐富,如何構(gòu)造特征向量作為輸入?yún)?shù)以及選擇合適機(jī)器分類器提高預(yù)測(cè)的精確度是一個(gè)值得研究的課題。

[1]Zhou H X,Qin S.Interaction-site prediction for protein complexes:a critical assessment[J].Bioinformatics,2007,23(17):2203-2209

[2]Tuncbag N,Kar G,Keskin O,et al.A survey of available tools and web servers for analysis of protein-protein interactions and interfaces [J]. Briefings in bioinformatics,2009,10(3):217-232

[3]Yan C.Identification of interface residues involved in protein-protein and protein-dna interactions from sequence using machine learning approaches[D].Iowa:Iowa State University,2005:1-120

[4]Liang S,Zhang C,Liu S,et al.Protein binding site prediction using an empirical scoring function[J].Nucleic acids research,2006,34(13):3698-3707

[5]Landau M,Mayrose I,Rosenberg Y,et al.ConSurf2005:the projection of evolutionary conservation scores of residues on protein structures [J].Nucleic acids research,2005,33(Suppl2):299-302

[6]Gallet X,Charloteaux B,Thomas A,et al.A fast method to predict protein interaction sites from sequences[J].Journal of molecular biology,2000,302(4):917-926

[7]Glaser F,Steinberg D M,Vakser I A,et al.Residue frequencies and pairing preferences at protein-protein interfaces [J]. Proteins: Structure, Function,and Bioinformatics,2001,43(2):89-102

[8]Chen H,Zhou H X.Prediction of interface residues in protein-protein complexes by a consensus neural network method:test against NM R data[J].Proteins:Structure,Function,and Bioinformatics,2005,61(1):21-35

[9]Neuvirth H,Raz R,Schreiber G.ProMate:a structure based prediction program to identify the location of protein-protein binding sites[J].Journal of molecular biology,2004,338(1):181-199

[10]Ezkurdia I,Bartoli L,Fariselli P,et al.Progress and challengesin predicting protein-protein interaction sites[J].Briefings in bioinformatics,2009,10(3):233-246

[11]Wang Chishe,Cheng Jiaxing,Su Shoubao,et al.Identification of Interface Residues Involved in Protein-protein Interactions Using Nave Bayes Classifier[J].JournalofFrontiers ofComputer Science and Technology,2009,3(3):293-302

[12]Bradford J R,Needham C J,Bulpitt A J,et al.Insights into protein-protein interfaces using a Bayesian network prediction method[J].Journal of molecular biology,2006,362(2):365-386

[13]Chen H,Zhou H X.Prediction of interface residues in protein-protein complexes by a consensus neural network method:test against NM R data[J].Proteins:Structure,Function,and Bioinformatics,2005,61(1):21-35

[14]Porollo A,Meller J.Prediction-based fingerprints of protein-protein interactions [J]. PROTEINS:Structure,Function,and Bioinformatics,2007,66(3):630-645

[15]Wang B,Chen P,Wang P,et al.Radial basis function neural network ensemble for predicting protein-protein interaction sites in heterocomplexes[J].Protein and Peptide Letters,2010,17(9):1111-1116

[16]Shen X L,Chen Y H.Predicting protein interaction sites based on a new integrated radial basis functional neural network[J].Advanced Materials Research,2011,183:387-391

[17]Chen Y,Xu J,YangB,et al.A novel method for prediction ofprotein interaction sites based on integrated RBF neural networks[J].Computers in Biology and Medicine,2012,42(4):402-407

Q811.4

A

1673-2006(2013)12-0072-04

10.3969/j.issn.1673-2006.2013.12.021

2013-10-22

江蘇省高校自然科學(xué)研究資助項(xiàng)目(13KJD520005)。

李慧(1981-),女,安徽蕪湖人,講師,博士研究生,主要研究方向:數(shù)據(jù)挖掘和生物信息。

(責(zé)任編輯:汪材印)

猜你喜歡
殘基位點(diǎn)蛋白質(zhì)
基于各向異性網(wǎng)絡(luò)模型研究δ阿片受體的動(dòng)力學(xué)與關(guān)鍵殘基*
蛋白質(zhì)自由
鎳基單晶高溫合金多組元置換的第一性原理研究
人工智能與蛋白質(zhì)結(jié)構(gòu)
CLOCK基因rs4580704多態(tài)性位點(diǎn)與2型糖尿病和睡眠質(zhì)量的相關(guān)性
“殘基片段和排列組合法”在書寫限制條件的同分異構(gòu)體中的應(yīng)用
二項(xiàng)式通項(xiàng)公式在遺傳學(xué)計(jì)算中的運(yùn)用*
蛋白質(zhì)二級(jí)結(jié)構(gòu)序列與殘基種類間關(guān)聯(lián)的分析
基于支持向量機(jī)的蛋白質(zhì)相互作用界面熱點(diǎn)殘基預(yù)測(cè)
含內(nèi)含子的核糖體蛋白基因轉(zhuǎn)錄起始位點(diǎn)情況分析
霸州市| 泾源县| 泸州市| 益阳市| 五莲县| 托里县| 武宣县| 江阴市| 色达县| 榆林市| 靖江市| 彝良县| 南投市| 合山市| 大荔县| 旬邑县| 巫溪县| 炎陵县| 嘉祥县| 宿州市| 宝应县| 缙云县| 阳曲县| 巴青县| 绩溪县| 玉树县| 驻马店市| 调兵山市| 民勤县| 临清市| 南涧| 枣阳市| 读书| 嫩江县| 四川省| 马龙县| 高尔夫| 夏津县| 怀远县| 石家庄市| 宁夏|