汪康,高潔
(江南大學(xué) 理學(xué)院,江蘇 無錫 214122)
基于甲流病毒突變度的疫情早期預(yù)警模型
汪康,高潔*
(江南大學(xué) 理學(xué)院,江蘇 無錫 214122)
通過比較每年與其上一年報道的甲流病毒HA蛋白質(zhì)序列之間的差異,構(gòu)建了突變度的算法。對所選的1916~2014年HA蛋白質(zhì)序列利用此算法計算出每年的突變度,觀察到這4次大型流感爆發(fā)年份的突變度值都比相鄰的年份要高,并且突變度值越大,流感的范圍和影響就越大。結(jié)果表明這種方法建立的比較合理,效果不錯。這對流感爆發(fā)的研究、預(yù)警和防御有著重要的意義。
甲型流感;HA蛋白質(zhì);氨基酸序列;突變度
人類最常見的流行性感冒病毒是甲型流感病毒,因為甲流具有多變性,病毒突變能夠感染人類,并且能夠人傳人[1-2]。血凝素(HA)是甲型流感病毒蛋白質(zhì)最重要的一種,在甲型流感病毒感染的過程中它起著極其重要的作用,同時它刺激機體產(chǎn)生的體液免疫應(yīng)答對清除已感染的流感病毒起到了極其重要的作用[3-5]。目前,人們從各個方面對甲型流感病毒進行了研究。He等[5]是對禽流感病毒HA蛋白質(zhì)抗原表位的識別進行深入的研究;Chang等[6]對流感疫苗進行深入研究,從而達到預(yù)防流感的效果;Banerjee等[7]對H1N1中的所有HA基因序列的結(jié)構(gòu)特征和全球氨基酸的組成進行全面的比較,進行描繪出將來H1N1流感進一步發(fā)展的可能性。
本文作者選取了1916年至2014年之間的流感病毒(HA)蛋白質(zhì)氨基酸序列,除極個別年份丟失外,通過比較每年與其上一年報道的甲流病毒HA蛋白質(zhì)序列之間的差異,計算出每年中每一個甲流病毒HA蛋白質(zhì)的標(biāo)準(zhǔn)差,再通過突變度的算法計算出每年的突變度??梢杂^察到標(biāo)準(zhǔn)差越小,則HA蛋白質(zhì)的突變度越大,人類就更容易感染,因此要尤為注意此流感病毒,加強預(yù)防措施,從而達到早期預(yù)警作用。這樣將會大大降低甲型流感病毒的傳播速度,并能有效的抑制病情的傳播,從而有效的阻止甲型流感在人群中爆發(fā)。
蛋白質(zhì)是由20種不同的氨基酸鏈接形成的多聚體。假設(shè)甲流病毒HA中的某個蛋白質(zhì)y是由t個氨基酸依次鏈接形成,它的氨基酸序列表示為y= x1x2…xt,其中xi∈{A,R,N,D,C,E,Q,G,H,I,L,K,M,F(xiàn),P,S,T,W,Y,V};i=1,2…,t。設(shè)s-1年全世界各地報道了m個甲流病毒HA蛋白質(zhì),它們的氨基酸序列分別是ys-1,1,ys-1,2,…,ys-1,m;s年報道了n個甲流病毒HA蛋白質(zhì),它們的序列分別是ys,1,ys,2,…,ys,n;yi,j的氨基酸個數(shù)為ci,j,其中s-1,s;j=1,2…,q;q=max{m, n}。依次取出ys-1,1,ys-1,2,…,ys-1,m中的第i個氨基酸,重新組成一個新的氨基酸序列Zs-1,i,其中i=1,2,…, k;k=max{cs-1,1,cs-1,2,…,cs-1,m}。
計算Zs-1,i中每個氨基酸的出現(xiàn)次數(shù),如果出現(xiàn)次數(shù)最多的氨基酸有2個或則2個以上,不失一般性我們?nèi)∷鼈冎械牡谝粋€氨基酸記為xi,反之,取出現(xiàn)次數(shù)最多的即可,其中1≤i≤k。把xi依次鏈接得到1個新的氨基酸序列US-1=x1x2…xk。ys,1,ys,2,…,ys,n分別與US-1對應(yīng)的氨基酸進行一一比較:如果對應(yīng)氨基酸種類不同就賦值為1,反之為0。因此s年得到n個只有1和0的序列,記為Es,1,Es,2,…,Es,n。例如:2013年中有 4個氨基酸序列:y2013,1=LMQGSTL PRRSG;y2013,2=MEARLLCLLC;y2013,3=EEARLLCLLCA AATNAD;y2013,4=NTVSSFQNLLCSG;因此U2013=LEA RLLCLLCSGATNAD。2014年有3個氨基酸序列,分別是:y2014,1=LEARLUCLBG;y2014,2=MLLRGLCS;y2014,3= LMEALRLCULGSAQGSTLPRRS;因此 E2014,1=0,0,0, 0,0,1,0,0,1,1;E2014,2=1,1,1,0,1,0,0,1;E2014,3=0,1,1,1,0,1,1, 1,1,1,1,1,0,1,1,1,1;分別計算出Es,1,Es,2,…,Es,n的標(biāo)準(zhǔn)差σ(s,1),σ(s,2),…,σ(s,n)。由此定義突變度f(s)為:
其中σ(s,i)表示s年第i個甲流病毒HA蛋白質(zhì)標(biāo)準(zhǔn)差。
2.1 數(shù)據(jù)分析
2.2 結(jié)果
1918年爆發(fā)了西班牙流感,在1918~1919年期間全世界約有10億人感染了流行性感冒,其中大概有4 000萬人死亡[1,6,8]。如圖1所示,1917、1918年和1919年的突變度分別是0.757 266、0.824 252、0.764 706,可以看出1918年的突變度比1917年和1919年的都要高很多,這說明1918年的甲流病毒HA蛋白質(zhì)序列相對于上一年的突變率比1919年和1917年相對上年的要高,因此人類在1918年更容易感染此甲流病毒。
1957年在中國爆發(fā)了大型的流行性感冒俗稱亞洲流感,該病毒在當(dāng)年迅速傳遍了全世界,并且持續(xù)到1958年,最終導(dǎo)致至少100萬人死亡[9]。如圖2所示,1954年突變度是0.679 744,1955年是0.723 869,1956年是 0.777 408,1957年是 0.700 903,1958年是0.717 463,1959年0.582 661,1960年是0.572 100。可以看出1954年和1955年的突變度比較高,說明病毒HA蛋白質(zhì)在這兩年已經(jīng)開始突變,但是沒有產(chǎn)生大范圍的感染,說明病毒已經(jīng)處在潛伏期。然而1956年和1957年的突變度也比較高,表明這兩年甲流病毒HA蛋白質(zhì)繼續(xù)處在高突變率下,最終導(dǎo)致流感大爆發(fā)。
表1 1917~2014年突變度值Table 1 M utation values from 1917~2014
圖1 1917~1919年甲流HA蛋白質(zhì)突變度趨勢圖Fig.1 Trend chart of pandem ic influenza HA protein mutation degree from 1917~1919
圖2 1954~1960年甲流HA蛋白質(zhì)突變度趨勢圖Fig.2 Trend chart of pandem ic influenza HA protein mutation degree from 1954~1960
1968年爆發(fā)了香港流感,其中有75萬人死亡,相對20世紀(jì)是較不致命的大型流感[1]。如圖3所示,1965年突變度是0.578 476,1966年是0.588 730,1967年是0.581 692,1968年是0.610 796,1969年是0.579518,1970年是0.573542,1971年是0.586072??梢杂^察到突變度在1968年急劇上升達到最高點,說明在1968年甲流病毒HA蛋白質(zhì)突變的相當(dāng)厲害,人類很容易感染此病毒。
圖3 1965~1971年甲流HA蛋白質(zhì)突變度趨勢圖Fig.3 Trend chart of pandem ic influenza HA protein mutation degree from 1965~1971
2009年由一次新型變體甲型H1N1流感病毒所引發(fā)的全球性流感,全世界大約有20%的人感染,大約有30萬人死亡,因此致死率不高[7,10]。2013年冬季,墨西哥爆發(fā)了大型性流感,共有14 236住院和1 163人死亡的[10]。如圖4所示,2006年標(biāo)準(zhǔn)差是0.620 501,2007年是0.648 464,2008年是0.614 772,2009 年 是 0.722 447,2010 年 是 0.586 937,2011 年 是 0.622 589,2012 年 是 0.660 562,2013年是 0.705 504,2014年是 0.596 943。2009年和2013年的突變度比相鄰兩年都要高,說明2009年和2013年甲流病毒HA蛋白質(zhì)突變率比較高,因此人類容易感染。
這 5次流感中,其中 1918、1957、1968年和2009年是全球性大型流感。在這4次全球性大型流感中,屬西班牙流感的范圍最廣、影響力最大、突變度最高;香港流感范圍最小、影響力最低、突變度最低。因此,流感爆發(fā)的強弱跟它的突變度值是有一定的關(guān)系的,突變度越大往往流感爆發(fā)的范圍越廣,影響力越大。所以,如果這一年的突變度急劇偏高,這就預(yù)警我們這一年爆發(fā)甲型流感的可能性非常大,因此要尤為注意此流感病毒,加強預(yù)防措施,防止病情擴散,有效的抑制甲型流感的傳播。
圖4 2006~2014年甲流HA蛋白質(zhì)突變度趨勢圖Fig.4 Trend chart of pandem ic influenza HA protein mutation degree from 2006~2014
通過對每年和其上一年報道的甲流HA蛋白質(zhì)序列進行對比,計算出每年HA蛋白質(zhì)序列的突變度。根據(jù)這種方法,選取了1916~2014年甲流病毒HA蛋白質(zhì)氨基酸序列除極個別年份丟失外,分別計算出每年的突變度。從圖1、圖2、圖3和圖4中可以觀察到,1918、1957、1968年和2009年的突變度分別是0.824 252、0.700 903、0.610 796和0.722 447,發(fā)現(xiàn)這4次全球性大型流感爆發(fā)年份的HA蛋白質(zhì)序列的突變度都比較高,并且發(fā)現(xiàn)大型流感的范圍和影響力越大,它們HA蛋白質(zhì)序列的突變度往往就越大。這充分的說明每年甲流病毒HA蛋白質(zhì)氨基酸序列的突變度值與爆發(fā)每年甲型流感病毒可能性有著很大的關(guān)系,這對甲流病毒的研究和預(yù)警有著重要的意義。同時,也表明此方法建立的比較合理,預(yù)警效果很好。
[1]SUN L,DEPUY G W,EVANC GW.Multi-objective optim ization models for patient allocation during a pandem ic influenza outbreak[J].Com puters&Operations Research,2014,51:350-359.
[2]REN D,GAO J.Early-warning signals for an outbreak of the influenza pandemic[J].Chinese Physical Society and IOP Publishing Ltd,2011,20:1287011-1287014.
[3]LUCCHESEG,CAPONEG,KANDUC D.H1N1 versus H5N1 hemagglutinins:A possible differential immunologic impacton neurodevelopment[J].Neurology,Psychiatry and Brain Research,2015,21(1):39-50.
[4]TSE L V,WHITTAKERG R.Modification of the hemagglutinin cleavage site allows indirectactivation of avian influenza virus H9N2 by bacterialstaphylokinase[J].Virology,2015,482:1-8.
[5]HE J L,HSIEH M S,JUANG R H,et al.A monoclonal antibody recognizes a highly conserved neutralizing epitope on hemagglutinin of H6N1 avian influenza virus[J].Veterinary M icrobiology,2014,174(3-4):333-341.
[6]CHANG L Y,SHIH SR,SHAO PL,etal.Novel sw ine-origin influenza virus A (H1N1):the firstpandemic of the 21st century [J].Journal of the Formosan M edical Association,2009,108(7):526-532.
[7]BANERJEER,ROY A,DASS,etal.Sim ilarity of currently circulating H1N1 virusw ith the 2009 pandem ic clone:Viability of an imminentpandem ic[J].Infection,Genetics and Evolution,2015,32:107-112.
[8]BASLER C F,AGUILAR PV.Progress in identifying virulence determ inants of the 1918 H1N1 and the Southeast Asian H5N1 influenza A viruses[J].Antiviral Research,2008,79(3):166-178.
[9]GIRARD M P,TAM JS,ASSOSSOU OM,etal.The 2009 A(H1N1)influenza virus pandemic:A review[J].Vaccine,2010,28(31):4895-4902.
[10]JAVIER D T,CHOWELL G,VICTOR H B A,et al.Intense seasonal A/H1N1 influenza in Mexico,winter 2013-2014[J]. Archives of Medical Research,2015,46(1):63-70.
Early W arning of Influenza Virus HA Protein Sequences
WANG Kang, GAO Jie*
(School of Science,Jiangnan University,Wuxi 214122,China)
This article constructed the algorithm ofmutation degree by comparing the difference of two consecutive year's reports on HA protein sequences of pandem ic influenza virus.Based on 1916~2014 HA protein sequences,themutations of every year were calculated by the algorithm,and thus itwas observed that themutation values of fourmajor flu outbreak yearswere higher than those of the adjacentyears,and the higher of themutation value,the greater the scope and impactof pandemic influenza.Thisapproach was rationaland would benefit the study of influenza outbreak as wellas theearlywarning and defense.
influenza,HA protein,am ino acid sequences,mutation degree
TS 101.4;C 81
A
1673—1689(2017)05—0542—05
2015-06-07
國家自然科學(xué)基金項目(11271163)。
*通信作者:高 潔(1972—),女,江蘇無錫人,理學(xué)博士,副教授,碩士研究生導(dǎo)師,主要從事生物信息學(xué)方面的研究。
E-mail:ezhun6669@sina.com
汪康,高潔.基于甲流病毒突變度的疫情早期預(yù)警模型[J].食品與生物技術(shù)學(xué)報,2017,36(05):542-546.