張玉巖 聞 佳
(綏化學(xué)院 黑龍江綏化 152061)
當(dāng)i取值從1到N,這樣可以得到點(xi,yi),…(xN,yN),連接鄰接的這些點就可以得到對應(yīng)的蛋白質(zhì)圖形曲線。
表1 二十種氨基酸對應(yīng)的數(shù)值以及它們在二維直角坐標系中對應(yīng)的坐標
我們可以證明:我們的模型中的圖形曲線不會出現(xiàn)環(huán)等簡并現(xiàn)象出現(xiàn),證明過程如下:
假設(shè)N表示形成環(huán)中對應(yīng)的氨基酸的個數(shù),每種氨基酸的個數(shù)分別用g,a,t,s,p,v,l,i,m,f,y,w,d,e,n,q,k,r,h,和c表示,G,A,T,S,P,V,L,I,M,F,Y,W,D,E,N,Q,K,R,H和C表示每種氨基酸對應(yīng)的矢量坐標,于是我們可知gG,aA,tT,sS,pP,vV,lL,iI,mM,fF,yY,wW,dD,eE,nN,qQ,kK,rR,hH,和cC形成一個環(huán),因此,上面的環(huán)可以表示為:
由于x軸的坐標和可以表示為
于是我們可以解出g=a=t=s=p=v=l=i=m=f=y=w=d=e=n=q=k=r=h=c=0。
因為氨基酸的個數(shù)是非負的,所以我們可以確定我們所提出的二維圖形中沒有環(huán)的存在(N>0)。
圖1.二十種不用的矢量分別表示二十種不同的氨基酸
因為蛋白質(zhì)的圖形曲線和蛋白質(zhì)序列是一一對應(yīng)的,所以序列比對可以轉(zhuǎn)化為對應(yīng)圖形曲線的比較。此外,蛋白質(zhì)序列可以由它所對應(yīng)的圖形進行數(shù)值刻畫,而且不會丟失任何信息。下面我們通過兩條短的蛋白質(zhì)序列的圖形表示來進一步解釋我們所提出的方法的有效性。圖形2[a(1)]和2[a(2)]是利用我們的所提出方法得到的兩條短的蛋白質(zhì)序列圖形曲線。這兩條蛋白質(zhì)序列分別是
通過對比Yu[3]的兩個相同的蛋白質(zhì)序列的圖形曲線(圖形2[b(1)]和圖形2[b(2)]),可以發(fā)現(xiàn),我們的蛋白質(zhì)圖形曲線更直觀明顯,更容易進行分析和比較。又因為Yu的蛋白質(zhì)曲線會因為圖形曲線的簡并現(xiàn)象的存在而更加冗雜,而且對于長的序列是很難進行視覺檢測的。
仔細查看圖形2,我們還可以發(fā)現(xiàn)兩條蛋白質(zhì)序列從整體上看是相似的,這就暗示著它們有幾個局部匹配的部分。為了進一步量化兩個蛋白質(zhì)序列的不同,我們把兩個蛋白質(zhì)序列投影在同一個模板中(圖形3(a))。因為每一個氨基酸可以用一個獨特的矢量來進行數(shù)值刻畫,所以相同的矢量暗示著相同的氨基酸。在圖形3(a)中,我們很容易找到兩個蛋白質(zhì)序列的不相似片段僅出現(xiàn)在位點2,11,14,和27。在圖形3(b)中,我們通過考慮對應(yīng)氨基酸的相對距離用來刻畫蛋白質(zhì)序列比對。在位點2,11,14,和27的相對距離分別是3.5217,4.3484,0.3401,和1.1180。比對對應(yīng)于氨基酸側(cè)鏈的酸離解常數(shù)的蛋白質(zhì)序列的圖形,我們可以很明顯地發(fā)現(xiàn)這些不匹配并不都是一樣的。比如在位點14,蛋白質(zhì)I中的Valine被替換為蛋白質(zhì)II中的Isoleucine,這里的不匹配伴隨著一個小的相對距離。通過比較我們還會發(fā)現(xiàn),兩個屬于相同類別的氨基酸相對于屬于不同類別的氨基酸更很容易發(fā)生替換。在這兩個蛋白質(zhì)之間一共有四個不匹配,其中對應(yīng)于小振幅的相對距離更不容易改變蛋白質(zhì)的內(nèi)在屬性。
圖2.蛋白質(zhì)I和蛋白質(zhì)II的二維圖形表示
圖3.蛋白質(zhì)序列I和蛋白質(zhì)序列II的圖形比對
圖4.八種ND6蛋白質(zhì)序列的二維圖形表示
在圖形4中,我們給出了八種ND6蛋白質(zhì)序列所對應(yīng)的二維圖形曲線表示。通過比較這些圖形曲線,我們會能夠發(fā)現(xiàn)人、大猩猩和黑猩猩(human,gorilla,common chimpanzee)在整體上是更為相似的,同時麻斑海豹和灰海豹(harbor seal-gray seal),大鼠和小鼠(rat-mouse)也是很相似的。此外,大袋鼠(wallaroo)明顯地區(qū)別于其他物種。這些結(jié)論和已知的生物進化結(jié)論和其他已出版文獻的結(jié)論是完全一樣的[4-6]。
[1]Yao,Y.H.;Dai,Q.;Li,L.;Nan,X..Y.;He,P.A.;Zhang,Y.Z.JComput Chem 2010,31,1045-1452.
[2]Wen,J.;Zhang,Y.Y.Chem Phys Lett 2009,476,281-286.
[3]Yu,J.F.;Sun,X.;Wang,J.H.J Inter J Quan Chem 2011,111,2835-2843.
[4]Li,M.;Badger,J.H.;Chen,X.;Kwong,S.;Kearney,P.;Zhang,H.Bioinformatics 2001,17,149-154.
[5]Out,H.H.;Sayood,K.Bioinformatics 2003,19,2122-2130.
[6]Makarenkov,V.;Lapointe,F.Bioinformatics 2004,20,2113-2121.