藍(lán)青萍,馮凱,王曉丹,潘玥,陳俊英,孫強(qiáng)明
中國(guó)醫(yī)學(xué)科學(xué)院北京協(xié)和醫(yī)學(xué)院醫(yī)學(xué)生物學(xué)研究所云南省重大傳染病疫苗研發(fā)重點(diǎn)實(shí)驗(yàn)室,云南昆明650118
西尼羅河病毒(West Nile virus,WNV)是一種單鏈正義RNA 病毒,屬于黃病毒科黃病毒屬,于1937年首次從西尼羅河烏干達(dá)省一名發(fā)熱婦女的血液中分離出來(lái),在隨后的幾十年里,WNV 席卷了亞洲、歐洲、非洲、北美等地區(qū)[1-3]。
WNV 是病毒性腦炎的主要病原體,在自然界中,以鳥(niǎo)-蚊-鳥(niǎo)的傳播周期維持循環(huán),主要通過(guò)蚊蟲(chóng)尤其是庫(kù)蚊媒介進(jìn)行傳播[4-5]。人類感染W(wǎng)NV 可引起西尼羅熱和WNV 性腦炎,臨床癥狀包括無(wú)癥狀感染或輕度急性發(fā)熱性疾病及神經(jīng)系統(tǒng)疾病,包括腦膜炎、腦炎、急性弛緩性麻痹[6-7]。WNV 具有生物多樣性,基于遺傳差異,目前提出了9 個(gè)WNV譜系[3,8],見(jiàn)表 1。由于目前對(duì) WNV 感染尚無(wú)明確的治療方法,因此開(kāi)發(fā)安全有效的人用疫苗對(duì)預(yù)防WNV 感染至關(guān)重要[9-10]。不同地理位置的WNV 遺傳變異可能與病毒的毒力、擴(kuò)增和遺傳等有關(guān),研究發(fā)現(xiàn),WNV 的 E 蛋白第 154 ~ 156 位點(diǎn)是糖基化位點(diǎn),被認(rèn)為是毒力因子,該位點(diǎn)的刪除可降低病毒的復(fù)制[11],因此推測(cè)該位點(diǎn)可作為WNV 疫苗研究的潛在靶點(diǎn)。
本研究分析了亞洲區(qū)來(lái)自中國(guó)、馬來(lái)西亞、印度、以色列、巴基斯坦、伊朗和土耳其等WNV 流行株的進(jìn)化特征、流行趨勢(shì)及WNV 結(jié)構(gòu)蛋白E 的核苷酸和氨基酸突變特征等,旨在為后續(xù)研究WNV的傳播和感染機(jī)制及疫苗的研發(fā)提供依據(jù)。
表1 WNV 譜系概述Tab.1 Overview of WNV lineages
1.1 亞洲區(qū)WNV 流行株核酸序列獲取 以“West Nile virus”為檢索詞在 NCBI-Pubmed 查詢 WNV 的流行情況,發(fā)現(xiàn)在亞洲地區(qū),WNV 于1951 在以色列首次暴發(fā),20 世紀(jì)70 年代土耳其和伊朗也有WNV的報(bào)告[1-3],20 世紀(jì)50 年代從印度西部和南部的蚊蟲(chóng)中分離出WNV 毒株,2013 年中國(guó)新疆省首次確診WNV 的人類病例[4]。分別以“West Nile virus”、“West Nile virus China”、“West Nile virus India”、“West Nile virus Israel”、“West Nile virus Pakistan”、“West Nile virus Iran”、“West Nile virus Malaysia”、“West Nile virus Turkey”等為關(guān)鍵詞和主題詞,在NCBI 的Pubmed(https://www.ncbi.nlm.nih.gov /pubmed /)和 GenBank(https:/ / www.ncbi.nlm.nih.gov / nuccore /)上進(jìn)行檢索,并獲取亞洲區(qū)WNV流行株核苷酸序列。
1.2 亞洲區(qū)WNV 流行株的序列進(jìn)化分析 選取在GenBank 中登錄的 WNV 亞洲地區(qū)病毒株China(AY490240、JX442278、JX442279、JX442280、JX442-281、JX442282)、India(JQ303102、GQ851605、KU97-8770、GQ851604、KC601756、JX041632、EU249803)、Israel(HM152776、HM051416、AY688948、HM152775、HM152773、AF481864)、Pakistan(MH545365、MH54-5363、MH545364、JX070655)、Iran(MF462262、KJ48-6150)、Malaysia(MK327792、MK327802、MK327788、MK327789)、Turkey(JN828806、KJ433826、KJ958922、KP400657、KC290932、MK327808) 以及參考病毒株New York(AF196835)、Australia(D00246)、India(DQ-256376)、Uganda(AY532665)、Czech Republic(AY7-65264)、Russia(277251)、Austria(KJ831223)、Senegal(EU082200)、Senegal(KJ131502),應(yīng)用 BIOEDIT 軟件對(duì)上述WNV 亞洲地區(qū)病毒株核酸序列進(jìn)行多重比對(duì)。利用 MEGA 6.0 軟件構(gòu)建病毒全長(zhǎng)序列和部分E 蛋白序列的系統(tǒng)發(fā)育進(jìn)化樹(shù),進(jìn)化樹(shù)構(gòu)建參數(shù)為:最大似然法,Bootstrap 設(shè)為1 000。
1.3 E 蛋白突變分析 將亞洲地區(qū)病毒株的E 蛋白核苷酸序列進(jìn)行譜系1 和譜系2 比對(duì),分析核酸突變情況,再通過(guò)在線翻譯(http:/ / www.bio-soft.net /sms / index.html)將堿基序列翻譯成氨基酸序列,分析氨基酸突變替代情況。
2.1 亞洲區(qū)WNV 流行株核苷酸序列的獲取 經(jīng)檢索,獲取亞洲區(qū)WNV 流行株核苷酸序列見(jiàn)表2。
2.2 亞洲區(qū)WNV 流行株的序列進(jìn)化分析 通過(guò)GenBank 獲取亞洲區(qū)WNV 流行地區(qū)中國(guó)、馬來(lái)西亞、印度、以色列、巴基斯坦、伊朗和土耳其的WNV全基因組序列和部分E 蛋白基因組序列,將獲取的WNV 全基因組序列與不同譜系的代表株進(jìn)行系統(tǒng)進(jìn)化樹(shù)分析,見(jiàn)圖1,可以看出,WNV 以色列株(HM152773、AF481864)在親緣關(guān)系上與譜系 1a 株最為接近,而以色列株(AY688948)在親緣關(guān)系上與譜系2 株較為接近,印度株(KU978770)的親緣關(guān)系與譜系1c 接近,且分布在不同的小支上。將獲取的不同譜系代表株的E 蛋白序列進(jìn)行系統(tǒng)進(jìn)化分析,發(fā)現(xiàn) WNV 中國(guó)株(JX442278,JX42280-JX44-2282)在親緣關(guān)系上與譜系1a 株最為接近,馬來(lái)西亞株在親緣關(guān)系上與伊朗株(KJ486150)接近,巴基斯坦株與印度株(JQ303102)接近,而馬來(lái)西亞株和巴基斯坦株與其他譜系的WNV 株親緣關(guān)系較遠(yuǎn),分布在不同的兩大分支上,見(jiàn)圖2。上述亞洲區(qū)WNV流行株的序列進(jìn)化分析表明,亞洲區(qū)流行的WNV 可能來(lái)源于譜系1 株與譜系2 株,且病毒可能存在位點(diǎn)突變。
表2 亞洲區(qū)WNV 流行株核苷酸序列Tab.2 Nucleotide sequences of WNV endemic strains in Asia
圖1 根據(jù)WNV 全基因組序列構(gòu)建的系統(tǒng)進(jìn)化樹(shù)Fig.1 Phylogenetic tree constructed based on complete nucleotide sequence of WNV
圖2 根據(jù)WNV E 蛋白部分序列構(gòu)建的系統(tǒng)進(jìn)化樹(shù)Fig.2 Phylogenetic tree constructed based on partial sequence of WNV E protein
2.3 WNV E 蛋白突變分析 將中國(guó)、巴基斯坦、印度、以色列和土耳其共5 株WNV 的E 蛋白與譜系1 和譜系2 WNV 代表株的E 蛋白進(jìn)行核酸序列和氨基酸序列比對(duì),發(fā)現(xiàn)與譜系2 株相比,WNV E 蛋白堿基突變率和氨基酸突變率整體比譜系1 高。與譜系1 相比,除印度株(KU978770)外,所有其他株 E 蛋白的堿基突變率和氨基酸突變率與譜系1a 相比最低,表明WNV 譜系1a 在亞洲區(qū)較為流行;而印度株(KU978770)與譜系 1c 株相比,其 E 蛋白堿基突變率與氨基酸突變率最低,分別為0.8%和0.4%,這與前面進(jìn)化分析的結(jié)果一致,即印度株(KU978770)與譜系1c 株在親緣關(guān)系上最為接近,見(jiàn)表3 和表4。將亞洲區(qū)流行的WNV 株E 蛋白與譜系1a 比對(duì)發(fā)現(xiàn),印度株(GQ851605、JX041632、GQ851604 和 KU-978770)的第154 和156 位氨基酸分別由天冬酰胺突變?yōu)樘於彼岷徒z氨酸(N154D、N154S),絲氨酸突變?yōu)楦彼岷捅彼幔⊿156P、S156A),而中國(guó)株(AY490240)、巴基斯坦株(JX070655)及以色列株(HM051416)的第156 位氨基酸分別由絲氨酸突變?yōu)楦彼?、苯丙氨酸和脯氨酸(S156P、S156F、S156P),見(jiàn)表5,推測(cè)這些位點(diǎn)的改變可能與病毒的毒力、致病性、神經(jīng)侵襲性、流行等有關(guān)。
表3 WNV E 蛋白堿基突變率(%)Tab.3 Base mutation rate of WNV E protein(%)
表4 WNV E 蛋白氨基酸突變率(%)Tab.4 Amino acid mutation rate of WNV E protein(%)
表5 WNV E 蛋白氨基酸突變位點(diǎn)分析Tab 5.Analysis of amino acid mutation sites of WNV E protein
E 蛋白是病毒包膜的主要成分,位于病毒顆粒的最外層,主要參與細(xì)胞表面受體識(shí)別與結(jié)合,與病毒進(jìn)入細(xì)胞以及與宿主膜融合相關(guān)。E 蛋白是WNV的主要毒力因子,一些報(bào)道認(rèn)為,E 蛋白糖基化位點(diǎn)的突變是影響WNV 毒力改變的重要因素[11-12]。本研究將亞洲地區(qū)不同國(guó)家不同WNV 株的E 蛋白氨基酸序列與譜系1 和譜系2 相比,發(fā)現(xiàn)與譜系2 相比,E蛋白的堿基和氨基酸的突變率較高,表明譜系1 的病毒株在亞洲區(qū)流行廣泛。E 蛋白的第154 ~156 位是WNV 譜系 1(1a 和 1b)和譜系 2 的糖基化位點(diǎn),該位點(diǎn)被認(rèn)為與病毒毒力相關(guān),分析發(fā)現(xiàn),E 蛋白的第154 和156 位氨基酸存在變異,推測(cè)可能與亞洲區(qū)流行株的毒力、致病性、神經(jīng)侵襲性、流行等有關(guān)。
自1937 年在烏干達(dá)分離出WNV 以來(lái),該病毒已在全球傳播,分別分布于非洲、亞洲、歐洲和澳大利亞[2]。自 1999 年以來(lái),WNV 的流行出現(xiàn)在美洲,具有較高的發(fā)病率和死亡率。2014 年,美國(guó)疾病控制與預(yù)防中心(CDC)的監(jiān)測(cè)數(shù)據(jù)表明,WNV 是美國(guó)神經(jīng)侵染性蟲(chóng)媒病毒疾病的最常見(jiàn)病原[13]。有文獻(xiàn)表明,近幾年WNV 在世界范圍內(nèi)不斷擴(kuò)散傳播,并發(fā)現(xiàn)基因型為WNV02 的毒株在全球范圍內(nèi)的擴(kuò)散效率比NY99 毒株更高,表明病毒的傳播和暴發(fā)與其基因的進(jìn)化顯著相關(guān)[14],因此,分析WNV 的系統(tǒng)發(fā)育和分子進(jìn)化特征,對(duì)研究WNV 的傳播流行和感染機(jī)制具有重要意義。基于系統(tǒng)發(fā)生的分類,目前可將WNV 分為9 個(gè)譜系,能引起人類感染的WNV主要來(lái)自譜系 1 和譜系2[15-16],譜系 1 通常分布在非洲、歐洲、澳大利亞、亞洲、北美和中美洲及中東,譜系1a 在美國(guó)(NY99 毒株)、非洲、歐洲和中東地區(qū)分布最廣,可能是引起這些地區(qū)大暴發(fā)的原因[3];而譜系2 的WNV 早期主要在非洲大陸局部流行,后來(lái)傳到了俄羅斯、匈牙利、意大利和希臘[17]。本研究將亞洲區(qū)流行株與不同譜系的代表株進(jìn)行系統(tǒng)進(jìn)化分析,發(fā)現(xiàn)亞洲區(qū)流行的WNV 可能來(lái)源于譜系1株和譜系2 株,且病毒可能存在進(jìn)化突變。
綜上所述,本研究通過(guò)對(duì)亞洲流行地區(qū)WNV的核苷酸序列和E 蛋白序列進(jìn)行分析比對(duì),構(gòu)建分子進(jìn)化樹(shù),比較其親緣關(guān)系,并進(jìn)一步闡述了這些病毒株間E 蛋白核苷酸和氨基酸突變情況,為后續(xù)研究WNV 的暴發(fā)流行機(jī)制提供了理論依據(jù)。