苗孟君,丁彥蕊
1.江南大學物聯(lián)網工程學院,江蘇無錫214122
2.江南大學數(shù)字媒體學院,江蘇無錫214122
PPI網絡比對用于植物乳桿菌的糖代謝研究
苗孟君1,丁彥蕊2
1.江南大學物聯(lián)網工程學院,江蘇無錫214122
2.江南大學數(shù)字媒體學院,江蘇無錫214122
CNKI網絡出版:2017-04-01,http://kns.cnki.net/kcms/detail/11.2127.TP.20170401.0853.034.html
植物乳桿菌有助于調節(jié)人和動物的機體微生物菌群的平衡,增強機體的免疫系統(tǒng),并且具有多種保健功能,其主要存在于人和動物胃、腸道以及肉類中。Kleerebezem[1]等人于2003年測序出植物乳桿菌WCFS1的完整基因序列,此后,其逐漸成為研究植物乳桿菌的模型菌株之一。而由Zhang[2]等人測序出的植物乳桿菌JDM1的基因序列與WCFS1高度相似(>90%),但由于JDM1長期生活在富營養(yǎng)的環(huán)境中,使得JDM1中缺失了一些糖轉移和代謝基因。針對這一現(xiàn)象,Zhang[2]等人從基因序列的角度說明JDM1較WCFS1缺失了一些糖轉移和代謝基因。然而,生物體內的細胞功能和生物過程是通過蛋白質之間的相互作用完成的,因此,只從WCFS1和JDM1的某段序列或者某個編碼的蛋白質分析闡明兩個菌株的糖代謝功能機制的差異是片面的。因此,構建WCFS1和JDM1的糖代謝功能模塊的PPI網絡[3],運用智能網絡比對算法研究兩種植物乳桿菌糖代謝功能模塊的差異具有重要的意義。
生物分子網絡比對是利用生物分子的相似性和生物分子網絡的拓撲信息并結合圖理論,對生物分子網絡進行比對,是理解不同生物系統(tǒng)之間的相似性和差異性的一種有效方法。陳璟[4]等人通過比對產甲烷的常溫古細菌和嗜熱古細菌的代謝網絡,發(fā)現(xiàn)了常溫古細菌和嗜熱古細菌的保守代謝途徑,推測嗜熱菌的耐熱性可能與胞內酪氨酸有關。蛋白質-蛋白質相互作用網絡的比對,可以有效地預測蛋白質-蛋白質相互作用、蛋白質功能,挖掘不同物種之間的保守區(qū)域,分析功能模塊的差異性。Seah[5]等人提出網絡比對算法DualAligner,通過區(qū)域到區(qū)域的蛋白質相互作用網絡比對,發(fā)現(xiàn)了人類和酵母之間的高度保守區(qū)域。
近年來,PPI網絡比對算法發(fā)展迅速,這促進了研究者們對蛋白質-蛋白質相互作用的探索,并且有利于蛋白質功能的預測和保守功能模塊挖掘的研究。網絡比對算法分為兩種類型:局部網絡比對和全局網絡比對。局部網絡比對是不明確的,因為一個網絡中的節(jié)點可以與另一個網絡中的多個節(jié)點相匹配。PathBLAST[6]是一種最早期的局部網絡比對算法之一,其通過尋找蛋白質相互作用途徑的高比對得分進行網絡比對,Network-BLAST[7]是此算法的改進形式。在全局網絡比對中,網絡中的每一個節(jié)點都與另一個網絡中的唯一一個節(jié)點相匹配。Berger[8]等人首次提出了PPI網絡的全局比對算法,IsoRank,并進一步改進此算法,形成IsoRankN[9]和PISwap[10]。Kuchaiev等人完全利用網絡的拓撲信息,提出算法:GRAAL[11]和MI-GRAAL[12],并且通過這些算法發(fā)現(xiàn)人類和酵母的網絡拓撲結構非常相似。Milenkovic等人發(fā)展了這些算法,提出H-GRAAL[13]。HGA-2N[14]改進匈牙利貪心算法(HGA),并實現(xiàn)了圖形處理單元的并行計算。MAGNA[15]基于遺傳算法尋求最大化精度的全局網絡比對。Evolutionary Graph Edit Distance Algorithm(GEDEVO)[16]則是一種利用圖編輯距離作為優(yōu)化模型以尋求最優(yōu)比對的進化算法。
由于植物乳桿菌WCFS1和JDM1在糖代謝模塊存在較大差異,為了更加精確地分析WCFS1和JDM1關于糖代謝模塊的差異,本文通過分別構建植物乳桿菌WCFS1和JDM1的糖酵解模塊,戊糖磷酸途徑模塊,檸檬酸循環(huán)模塊的蛋白質-蛋白質相互作用(PPI)網絡,采用網絡比對算法GEDEVO,對構建的PPI網絡進行比對,從系統(tǒng)水平上分析植物乳桿菌JDM1和WCFS1的糖代謝功能模塊之間的差異,挖掘糖代謝功能模塊的保守區(qū)域,尋找WCFS1和JDM1糖代謝功能模塊的差異路徑,預測蛋白質-蛋白質相互作用。
本文從KEGG數(shù)據(jù)庫獲得植物乳桿菌WCFS1(Lactobacillus plantarum WCFS1)和JDM1(Lactobacillus plantarum JDM1)的糖酵解模塊(Glycolysis),戊糖磷酸途徑模塊(Pentose phosphate pathway),檸檬酸循環(huán)模塊(Citrate cycle)的全部蛋白質數(shù)據(jù),并結合STRING數(shù)據(jù)庫,分別獲得這三個模塊的蛋白質-蛋白質相互作用數(shù)據(jù)。這三個模塊的全部蛋白質的相互作用是根據(jù)STRING數(shù)據(jù)庫中蛋白質-蛋白質相互作用數(shù)據(jù)可信度確定的[17-18],選擇標準為可信度大于0.7[19]。
根據(jù)從STRING數(shù)據(jù)庫獲得的蛋白質-蛋白質相互作用數(shù)據(jù),分別構建WCFS1和JDM1的糖酵解功能模塊,戊糖磷酸途徑功能模塊,檸檬酸循環(huán)功能模塊的PPI網絡。本文用圖G=(V,E)表示蛋白質-蛋白質相互作用網絡,其中,V代表蛋白質集合,E代表蛋白質-蛋白質之間的相互作用集合。具體信息如表1所示。
表1 WCFS1和JDM1的糖代謝模塊的PPI網絡數(shù)據(jù)
生物網絡比對結合圖理論和生物信息,通過一定規(guī)則,使得網絡中的節(jié)點相互對應。其中,PPI網絡比對,利用網絡比對算法,使得網絡中的蛋白質相互對應,預測蛋白質-蛋白質相互作用、蛋白質功能,挖掘保守功能模塊,分析功能模塊之間的差異。本文選取GEDEVO算法分別對植物乳桿菌JDM1和WCFS1的糖酵解模塊,戊糖磷酸途徑模塊,檸檬酸循環(huán)模塊的PPI網絡進行比對。GEDEVO是一種利用圖編輯距離作為優(yōu)化模型以尋求最優(yōu)比對的進化算法,其受自然靈感啟發(fā),模仿規(guī)則“適者生存”,廣泛用于解決許多NP難問題。GEDEVO基于進化算法思想,將一對PPI網絡模型作為兩個無向不加權圖G1=(V1,E1)和G2=(V2,E2),并利用圖編輯距離優(yōu)化映射f使V1和V2中的節(jié)點一對一映射。定義G1和G2之間的圖編輯距離為:
其中,GEDf()G1,G2表示圖G1和G2的圖編輯距離,(u,v)表示圖G1中的節(jié)點u和v之間的邊,E1為圖G1中的邊集;f()u和f(v)分別為節(jié)點u和v的映射節(jié)點,E2為圖G2中的邊集,(u′,v′)表示圖G2中的節(jié)點u′和v′之間的邊,f-1(u′)和f-1(v′)分別為節(jié)點u′和v′的映射節(jié)點。
GEDEVO算法主要分為3個步驟,分別為:
步驟1初始化種群和個體評價
初始化種群的個體是兩個PPI網絡的一個映射。
個體評價即評價一個映射的質量。設每對節(jié)點u∈V1和v∈V2之間的映射為v=f(u)。定義節(jié)點對得分pairScoref(u,v)表示節(jié)點u和v之間的映射質量,公式如下:
其中,PairGEDf(u,v)表示通過映射f,使節(jié)點u和v對應所要增加或刪除的邊的數(shù)量。grletsf(u,v)表示graphlet度標簽距離(GSD)[20],grletsf(u,v)被定義為兩個節(jié)點的鄰近拓撲結構差異。
其中,ui表示節(jié)點u的第i個特征向量[20],vi表示節(jié)點v的第i個特征向量[20],wi表示同構圖i的權重,grletsf(u,v)的值在0到1之間,grletsf(u,v)的值越大,說明節(jié)點u和v的鄰近區(qū)域的拓撲特征越相似[21-22]。
步驟2生成子代
為了產生新的映射f,并且保持種群多樣性避免局部最優(yōu),得到高且快速收斂的最佳方案,進行如下操作:
(1)將兩個PPI網絡中的蛋白質分別進行隨機排列,并隨機產生一個映射f。
(2)采取部分映射交叉(PMX)變異思想,把映射中所有蛋白質對得分的平均值作為閾值,把一個映射分成低得分組和高得分組。然后,隨機交換高得分組。為了避免局部最小,也交換概率較低的低得分對(PPI網絡的1%)。
(3)在一個映射f的交叉結果中,從父代中保護低得分對。
(4)對于定點變異,在一個映射f中,選擇低得分對進行交換,最終保留高得分對。
步驟3終止迭代
GEDEVO的收斂時間主要取決于種群的大小以及輸入的PPI網絡的拓撲性質。GEDEVO可以設定收斂條件:(1)迭代次數(shù);(2)運行時間;(3)個體的最佳映射沒有隨著迭代次數(shù)發(fā)生明顯改變時(迭代次數(shù)為30時)。
網絡比對結果的質量標準常常反映在拓撲方面和生物方面。本文采用節(jié)點正確性(Node Correctness,NC)[15]和邊正確性(Edge Correctness,EC)[16]評價網絡比對結果。EC被定義為輸入網絡邊的比對的百分比,用于衡量輸入網絡的拓撲結構的相似程度,EC值越高,輸入的網絡越相似。NC被定義為輸入的第一個網絡中的節(jié)點正確比對第二個網絡節(jié)點的百分比。EC和NC的計算公式如下表示:
其中,#sharedInteractions表示網絡G1和G2中對應的邊的數(shù)目,|E1|和|E2|分別表示網絡G1和G2中邊的數(shù)目。
其中,g是正確的節(jié)點映射,f(u)=g(u)表示節(jié)點的比對結果與正確的節(jié)點映射相同。顯然,正確比對節(jié)點的映射g要預先知道。這里,設置g為比對的兩個網絡中節(jié)點(蛋白質)的同源性。
植物乳桿菌WCFS1和JDM1的基因序列非常相似(>90%),由于JDM1長期生活在富營養(yǎng)環(huán)境中,使得JDM1缺失了一些糖代謝基因,這導致WCFS1和JDM1在糖代謝功能模塊存在一定差異。因此,本文利用網絡比對方法對WCFS1和JDM1的糖代謝(糖酵解、戊糖磷酸途徑、檸檬酸循環(huán))功能模塊的PPI網絡進行比對,挖掘兩者的糖代謝模塊的保守路徑,并分析兩者的差異。
本文選擇GEDEVO算法,對植物乳桿菌WCFS1和JDM1的糖酵解,戊糖磷酸途徑,檸檬酸循環(huán)模塊的PPI網絡進行比對。并利用邊正確性(公式(4))和節(jié)點正確性(公式(5))評價比對結果。其中,計算節(jié)點正確性時,以KEGG數(shù)據(jù)庫中蛋白質的同源性數(shù)據(jù)為標準。另外,本文將GEDEVO算法的比對結果與GRAAL、MAGNA算法進行了比較。表2表示了GEDEVO算法、GRAAL算法、MAGNA算法在糖酵解、戊糖磷酸途徑、檸檬酸循環(huán)模塊中的邊正確性結果。表3表示了GEDEVO算法、GRAAL算法、MAGNA算法在糖酵解、戊糖磷酸途徑、檸檬酸循環(huán)模塊中的節(jié)點正確性結果。
從表2的邊正確性來看,GEDEVO算法和MAGNA算法明顯優(yōu)于GRAAL算法,尤其在糖酵解和戊糖磷酸途徑的比對中優(yōu)勢明顯。從表3的節(jié)點正確性來說,GEDEVO算法在所有網絡的比對中都明顯高于GRALL和MAGNA。綜合邊正確性和節(jié)點正確性來看,GEDEVO算法更適合于WCFS1和JDM1的網絡比對。因此,本文采用GEDEVO算法進行網絡比對。
從表2可以看出,GEDEVO算法對于WCFS1和JDM1的糖酵解、戊糖磷酸途徑、檸檬酸循環(huán)模塊的比對結果的邊正確性都大于90%,分別是93.6%、96%、100%。這表明植物乳桿菌WCFS1和JDM1的這三個模塊的PPI網絡的拓撲結構非常相似。表3中,WCFS1和JDM1的糖酵解、戊糖磷酸途徑、檸檬酸循環(huán)模塊的比對結果的節(jié)點正確性都大于80%,分別是82.9%、88%、100%。WCFS1和JDM1的糖酵解、戊糖磷酸途徑、檸檬酸循環(huán)模塊中的蛋白質大部分互為同源蛋白質,但也存在一些差異。
此外,為了驗證實驗結果的可靠性,分別對三個功能模塊做了10組(共30組)比對實驗,分別計算每個功能模塊實驗結果的平均值和方差,具體數(shù)據(jù)如表4所示。
表2 GEDEVO、GRAAL、MAGNA算法對糖酵解、戊糖磷酸途徑、檸檬酸循環(huán)模塊的PPI網絡比對的EC值分布%
表3 GEDEVO、GRAAL、MAGNA算法對糖酵解、戊糖磷酸途徑、檸檬酸循環(huán)模塊的PPI網絡比對的DC值分布%
表4 對三個功能模塊進行比對的EC值和DC值的平均值和方差
從表4中可以看出,糖酵解模塊、戊糖磷酸途徑模塊和檸檬酸循環(huán)模塊的DC值的平均值都大于0.85,EC值的平均值都大于0.9,方差都小于0.002 5,這表明實驗結果非??煽坎⑶液芊€(wěn)定。
下面將根據(jù)比對結果,闡明WCFS1和JDM1的這三個功能模塊的差異。
圖1描述了植物乳桿菌WCFS1和JDM1的戊糖磷酸途徑模塊的PPI網絡比對結果。圖的左邊表示JDM1的PPI網絡,右邊是WCFS1的PPI網絡。從圖中可以看出,JDM1中的蛋白質ribose-phosphate pyrophosphokinase(prs1)、ribokinase(rbsK3)、transketolase(tkt4)、fructosebisphosphate aldolase(fba)、2-keto-3-deoxy-6-phosphogluconate aldolase(JDM1_0578)、glucose-6-phosphate isomerase(pgi)、glucose-6-phosphate 1-dehydrogenase(gpd)、ribulose-phosphate 3-epimerase(rpe)之間通過相互作用連接成一條蛋白質相互作用路徑prs1-rbsK3-tkt4-fba-JDM1_0578-pgi-gpd-rpe,與WCFS1中的蛋白質ribose-phosphate pyrophosphokinase(prs1)、Ribokinase(rbsK1)、transketolase(tkt4)、fructose-bisphosphate aldolase(fba)、glucose-6-phosphate isomerase(pgi)、glucose-6-phosphate 1-dehydrogenase(gpd)、ribulose-phosphate 3-epimerase(rpe)、2-keto-3-deoxygluconate kinase(kdgk)組成的路徑prs1-rbsK1-tkt4-fba-pgi-gpd-rpe-kdgk非常相似,如兩者的prs1-rbsK3(rbsK1)-tkt4-fba路徑是一致的。但是這兩條路徑又存在差異,如圖1右邊網絡中的蛋白質kdgk,JDM1中并沒有與之對應的蛋白質。WCFS1中的蛋白質kdgk是一種磷酸化的激酶,它可以生成蛋白質2-keto-3-deoxy-6-phospho-gluconate aldolase(JDM1_0578)[23],并且,其在原核生物中的葡萄糖分解代謝和糖酸降解中起著關鍵作用[24],JDM1_0578則通過雙功能KDPG醛縮酶裂解丙酮酸和甘油醛-3-磷酸(GAP)。此外,JDM1中沒有蛋白質與WCFS1中的蛋白質deoxyribose-phosphate aldolase(deoC)相對應,而蛋白質deoC是一種可以從死亡細胞中產生脫氧核苷的參與分解代謝的酶。這種酶經常出現(xiàn)在生活在營養(yǎng)缺失的環(huán)境中的生物體中[25]。因為WCFS1生活在營養(yǎng)缺失的環(huán)境中,它會用這種酶從死亡的細胞中獲得營養(yǎng)物質,使其生長。而JDM1則長期生活在富營養(yǎng)環(huán)境中,因此它不需要這種酶。
圖1 WCFS1和JDM1的戊糖磷酸途徑PPI網絡比對圖
圖2描述了植物乳桿菌WCFS1和JDM1的糖酵解模塊的PPI網絡比對結果。圖的左邊表示JDM1的糖酵解PPI網絡,右邊是WCFS1的糖酵解PPI網絡。從表2中可以看出,兩者的拓撲結構非常相似,EC值達到了93.6%。如,兩者中的蛋白質glucose-6-phosphate isomerase(pgi)都處于PPI網絡的中心位置,與上下兩邊的許多蛋白質都具有相互作用,可見,蛋白質glucose-6-phos-phate isomerase(pgi)在WCFS1和JDM1的糖酵解模塊中分別具有至關重要的作用。JDM1中的蛋白質glucokinase(glk)和WCFS1中的蛋白質bifunctional protein:transcription regulator和sugar kinase(lp_1573)都與醛糖異構酶(aldose 1-epimerase、galM1、galM2、galM3)相互作用,其中蛋白質glk和lp_1573互為同源蛋白質。但是,WCFS1和JDM1的糖酵解模塊也存在差異。JDM1中的蛋白質bifunctional acetaldehyde-CoA/alcohol dehydrogenase(adhE)與蛋白質pyruvate dehydrogenase complex,E2 component(pdhC)相互作用,與之對應的,WCFS1中的蛋白質bifunctional protein:alcohol dehydrogenase、acetaldehyde dehydrogenase(adhE)和蛋白質pyruvate dehydrogenase complex、E2 component(pdhC)和phosphoenolpyruvate carboxykinase(ATP)(pck)相互作用??梢酝茰y,JDM1中的adhE與蛋白質pck相互作用。JDM1中的蛋白質pdhC有4條邊,與其有相互作用的蛋白質分別是pck、pyruvate dehydrogenase complex(pdhA)、pyruvate dehydrogenase complex、E1 component,beta subunit(pdhB)、dihydrolipoamide dehydrogenase(pdhD)。而WCFS1中的pdhC除了與這四個蛋白質相互合作,還與蛋白質pyruvate kinase(pyk)相互作用??梢?,JDM1中的pdhC與蛋白質pyk具有相互作用[26]。通過網絡比對,發(fā)現(xiàn)了WCFS1和JDM1的糖酵解模塊中存在許多保守路徑,并且預測了JDM1中的一些蛋白質之間的相互作用。
圖2 WCFS1和JDM1的糖酵解PPI網絡比對圖
圖3描述了植物乳桿菌WCFS1和JDM1的檸檬酸循環(huán)模塊的PPI網絡比對結果。圖的左邊是JDM1的檸檬酸循環(huán)PPI網絡,右邊是WCFS1的檸檬酸循環(huán)PPI網絡。從圖中可以看出,WCFS1和JDM1的檸檬酸循環(huán)模塊中,對應蛋白質的鄰居節(jié)點個數(shù)相同,并且由表2可知,其EC值為100%,這表明兩者的拓撲結構非常相似。WCFS1和JDM1的檸檬酸循環(huán)模塊的PPI網絡都分為兩部分,圖中,上下兩部分的蛋白質之間并沒有相互作用。通常情況下,完成一個功能模塊,需要蛋白質之間的相互合作,因此,能推測,JDM1和WCFS1的檸檬酸循環(huán)模塊需要與檸檬酸循環(huán)模塊之外的蛋白質互相合作,完成檸檬酸循環(huán)功能。此外,JDM1的檸檬酸循環(huán)模塊中有11個蛋白質,WCFS1中有10個蛋白質,JDM1中的蛋白質fumarate reductase/succinate dehydrogenase(JDM1_0211)沒有與WCFS1中的蛋白質對應。
圖3 WCFS1和JDM1的檸檬酸循環(huán)PPI網絡比對圖
本文選擇GEDEVO算法分別比對植物乳酸桿菌JDM1和WCFS1的糖酵解,戊糖磷酸途徑,檸檬酸循環(huán)功能模塊的蛋白質-蛋白質相互作用網絡。發(fā)現(xiàn)JDM1和WCFS1的糖酵解、戊糖磷酸途徑、檸檬酸循環(huán)的PPI網絡的拓撲結構非常相似,并挖掘了許多保守路徑。如,戊糖磷酸途徑中,JDM1中的蛋白質glucokinase(glk)和WCFS1中的與其同源的蛋白質bifunctional protein:transcription regulator;sugar kinase(lp_1573)都與醛糖異構酶(aldose 1-epimerase,galM1,galM2,galM3)相互作用。但也存在差異,在糖酵解功能模塊中,JDM1中的蛋白質相互作用路徑prs1-rbsK3-tkt4-fba-JDM1_0578-pgi-gpd-rpe和WCFS1中的蛋白質相互作用路徑prs1-rbsK1-tkt4-fba-pgi-gpd-rpe-kdgk非常相似,但也存在差異。其中蛋白質2-keto-3-deoxygluconate kinase(kdgK)的產物是2-keto-3-deoxy-6-phosphogluconate aldolase(JDM1_0578)。在本文中,利用PPI網絡比對的方法,不僅挖掘了JDM1和WCFS1在糖代謝模塊的保守路徑,發(fā)現(xiàn)了糖代謝模塊的差異,還預測了蛋白質-蛋白質相互作用,如,戊糖磷酸途徑中,JDM1中的adhE與蛋白質pdhD發(fā)生相互作用。綜上所述,JDM1和WCFS1的糖代謝功能模塊的拓撲結構非常相似,但也存在差異。通過利用PPI網絡比對方法,對兩者的糖代謝功能模塊進行比對,挖掘兩者糖代謝功能模塊的保守路徑,以及存在差異的路徑,并預測了蛋白質-蛋白質相互作用。通過實驗進一步表明,PPI網絡比對對于預測蛋白質-蛋白質之間的相互作用,挖掘保守模塊,發(fā)現(xiàn)物種及功能模塊之間的差異具有重要意義。
[1] Kleerebezem M,Boekhorst J,van Kranenburg R,et al.Complete genome sequence of Lactobacillus plantarum WCFS1[J].Proceeding of the National Academy of Sciences of the United States of America,2003,100(4):1990-1995.
[2] Zhang Zhuoyang,Liu Chang,Zhu Yongzhang,et al.Complete genome sequence of Lactobacillus plantarum JDM1[J].Journal of Bacteriology,2009,191(15):5020-5021.
[3] Barabasi A L,Oltvai Z N.Network biology:understanding the cell's functional organization[J].Nature Reviews Genetics,2004,5(2):101-113.
[4] 陳璟,須文波.產甲烷的常溫古細菌和嗜熱古細菌的代謝網絡比對研究[J].小型微型計算機系統(tǒng),2015,36(8):1869-1873.
[5] Seah B S,Bhowmick S S,Dewey Jr C F.DualAligner:A dual alignment-based strategy to align protein interaction networks[J].Bioinformatics Advance Access,2014,30(18):2619-2626.
[6] Kelley B P,Yuan Bingbing,Lewitter F,et al.PathBLAST:A tool for alignment of protein interaction networks[J].Nucleic acids research,2004,32:83-88.
[7] Kalaev M,Smoot M,Ideker T,et al.NetworkBLAST:Comparative analysis of protein networks[J].Bioinformatics,2008,24:594-596.
[8] Singh R,Xu J,Berger B.Pairwise global alignment of protein interaction networks by matching neighborhood topology[C]//International Conference on Research in Computational Molecular Biology,2007,4453:16-31.
[9] Liao C S,Lu Kanghao,Baym M,et al.IsoRankN:Spectral methods for global alignment of multiple protein networks[J].Bioinformatics,2009,25(12):253-258.
[10] Chindelevitch L,Liao C S,Berger B,et al.Local optimization for global alignment of protein interaction networks[C]//Pacific Symposium on Biocomputing,Hawaii,USA,2010:123-132.
[11] Kuchaiev O,Milenkovi? T,Memi?evi? V,et al.Topological network alignment uncovers biological function and phylogeny[J].Journal of the Royal Society Interface,2010,50(7):1341-1354.
[12] Kuchaiev O,Przˇulj N.Integrative network alignment reveals large regions of global network similarity in yeast and human[J].Bioinformatics,2011,27:1390-1396.
[13] Milenkovic T,Ng W L,Hayes W,et al.Optimal network alignment with graphlet degree vectors[J].Cancer Inform,2010,9:121-137.
[14] Xie J,Zhou Z,Ma J et al.Graphics processing unitbased alignment of protein interaction networks[J].IET Systems Biology,2015,9(4):120.
[15] Saraph V,Milenkovic T.MAGNA:Maximizing accuracy in global network alignment[J].Bioinformatics,2014,30(20):2931-2940.
[16] Ibragimov R,Malek M,Guo Jiong,et al.GEDEVO:An evolutionary graph edit distance algorithm for biological network alignment[C]//German Conference on Bioinformatics,2013,34:68-79.
[17] Franceschini A,Szklarczyk D,F(xiàn)rankild S,et al.STRING v9.1:Protein-protein interaction networks,with increased coverage and integration[J].Nucleic Acids Research,2013,41(1):808-815.
[18] Von M C,Jensen L J,Snel B,et al.STRING:Known and predicted protein-protein associations,integrated and transferred across organisms[J].Nucleic Acids Research,2005,33:433-437.
[19] Melak T,Gakkhar S.Maximum flow approach to prioritize potential drug targets of Mycobacterium tuberculosis H37Rv from protein-protein interaction network[J].Clinical and Translational Medicine,2015,4(1):61.
[20] Milenkovi? T,Pr?ulj N.Uncovering biological network function via graphlet degree signatures[J].Cancer Informatics,2008,6(1):257.
[21] Przulj N.Biological network comparison using graphlet degree distribution[J].Bioinformatics,2007,23(2):177-183.
[22] Milenkovi? T,Ng W L,Hayes W,et al.Optimal network alignment with graphlet degree vectors.[J].Cancer Informatics,2010,9(9):121-137.
[23] Pickl A,Johnsen U,Archer R M,et al.Identification and characterization of 2-keto-3-deoxygluconatekinase and 2-keto-3-deoxygalactonate kinase in the haloarchaeon Haloferax volcanii[J].Fems Microbiology Letters,2014,361(1):76-83.
[24] Ahmed H,Ettema T J G,Tjaden B,et al.The semiphosphorylative Entner-Doudoroff pathway in hyperthermophilic archaea:A re-evaluation[J].Biochemical Journal,2005,390(2):529-540.
[25] Han T K,Zhu Zhiwen,Dao M L.Identification,molecular cloning,and sequence analysis of a deoxyribose aldolase in streptococcus mutans GS-5[J].Current Microbiology,2004,48(3):230-236.
[26] Matthews L R,Vaglio P,Reboul J,et al.Identification of potential interaction networks using sequence-based searches for conserved protein-protein interactions or“Interologs”[J].Genome Research,2001,11(12):2120-2126.
MIAO Mengjun,DING Yanrui.PPI network alignment for study on carbohydrate metabolism of Lactobacillus Plantarum.Computer Engineering andApplications,2018,54(6):49-54.
MIAO Mengjun1,DING Yanrui2
1.School of Internet of Things,Jiangnan University,Wuxi,Jiangsu 214122,China 2.School of Digital Media,Jiangnan University,Wuxi,Jiangsu 214122,China
Protein-Protein Interaction network(PPI network)alignment is an important method for predicting proteinprotein interaction,and analyzing functional differences between different species.In this paper,in order to study the differences of the functional modules of the carbohydrate metabolism in Lactobacillus plantarum WCFS1 and JDM1,the PPI network of Glycolysis module,Pentose phosphate pathway module,Citrate cycle module in WCFS1 and JDM1 are aligned,by Evolutionary Graph Edit Distance Algorithm.Experiment shows that the Edge Correctness of three modules in WCFS1 and JDM1 reaches 93.6%,96%,100%,respectively.It indicates that the topological structure of the carbohydrate metabolism module is very similar.And in pentose phosphate pathway of WCFS1 and JDM1,finding that WCFS1 has protein 2-keto-3-deoxygluconate kinase(kdgK)and JDM1 only has its product 2-keto-3-deoxy-6-phospho-gluconate aldolase(JDM1_0578)no kdgK.In addition,in Glycolysis module,inferring protein pyruvate dehydrogenase complex,E2 component(pdhC)and protein pyruvate kinase(pyk)have interaction.The experimental results show that PPI network alignment can clarify the differences of the carbohydrate metabolism module,topological similarity and can predict the interaction between proteins by aligning the PPI network.
PPI network alignment;Lactobacillus plantarum WCFS1 and JDM1;carbohydrate metabolism functional modules
蛋白質-蛋白質相互作用網絡(PPI網絡)比對是預測蛋白質相互作用,分析不同物種之間功能差異的重要手段。為研究植物乳桿菌WCFS1和JDM1糖代謝功能模塊差異,采用Evolutionary Graph Edit Distance Algorithm算法對兩者的糖酵解、戊糖磷酸途徑、檸檬酸循環(huán)三個模塊PPI網絡進行比對。實驗表明,兩者的三個模塊邊正確性分別達到93.6%、96%、100%,表明其拓撲結構極其相似,戊糖磷酸途徑中,WCFS1存在蛋白質2-keto-3-deoxygluconate kinase(kdgK),但JDM1中沒有kdgK,卻有其產物2-keto-3-deoxy-6-phospho-gluconate aldolase(JDM1_0578)。糖酵解模塊中,推測蛋白質pyruvate dehydrogenase complex,E2 component(pdhC)與pyruvate kinase(pyk)具有相互作用。實驗表明,PPI網絡比對可以闡明兩者糖代謝PPI網絡的拓撲相似性及模塊差異,預測蛋白質之間的相互作用。
PPI網絡比對;植物乳桿菌WCFS1和JDM1;糖代謝功能模塊
2016-11-15
2017-01-04
1002-8331(2018)06-0049-06
book=54,ebook=59
A
TP399
10.3778/j.issn.1002-8331.1611-0279
國家自然科學基金(No.21541006)。
苗孟君(1991—),女,碩士研究生,研究領域為生物信息,E-mail:15906197927@163.com;丁彥蕊(1976—),女,博士,教授,研究領域為生物信息。