常凱,劉晨霞,朱紫衣,許宏宣,王艷艷,熊杰,曲遠(yuǎn)青,江忠勇*
1解放軍西部戰(zhàn)區(qū)總醫(yī)院檢驗(yàn)科,成都 610083;2四川省簡(jiǎn)陽(yáng)市人民醫(yī)院檢驗(yàn)科,四川簡(jiǎn)陽(yáng) 611730;3成都市實(shí)驗(yàn)外國(guó)語(yǔ)學(xué)校生物教研組,成都 611130
冠狀病毒是屬于冠狀病毒科的一種有包膜的單股正鏈RNA病毒[1],分為α、β、γ和δ屬。其中α、β冠狀病毒僅感染哺乳動(dòng)物,目前已知的冠狀病毒堿基數(shù)約為30 kb[2]。當(dāng)前有6種冠狀病毒可感染人類致病,主要引起呼吸道感染,其中兩種高致病性冠狀病毒為嚴(yán)重急性呼吸綜合征(SARS)冠狀病毒(SARS-CoV)和中東呼吸綜合征(MERS)冠狀病毒(MERS-CoV),其他4種低致病性冠狀病毒(229E、HKU1、OC43、NL63)引起的輕度呼吸道疾病占呼吸道感染性疾病的10%~30%[3]。研究發(fā)現(xiàn),引起新型冠狀病毒肺炎(COVID-19)疫情的新型冠狀病毒(SARS-CoV-2)與MERS-CoV、SARS-CoV具有較高的同源性[4],臨床癥狀以發(fā)熱、乏力、干咳為主,少數(shù)伴有鼻塞、流涕、咽痛和腹痛等癥狀。治療多在對(duì)癥的基礎(chǔ)上防治并發(fā)癥等,暫無(wú)特異性藥物[5-6]。 盡管多國(guó)采取了嚴(yán)格的防控措施,但疫情仍然急速發(fā)展且造成了全球大流行[7],針對(duì)這一公共衛(wèi)生安全事件,各國(guó)對(duì)疫苗研發(fā)與診斷試劑的精度提出了更高的要求。SARS-CoV-2的基因組由6個(gè)主要的功能性開(kāi)放閱讀框(ORF)組成,包括ORF 1ab、S、E、M、N和其他輔助基因,其中ORF 1ab、刺突蛋白(S蛋白)和膜蛋白(M蛋白)在病毒感染與致病中發(fā)揮著重要作用[8-10]。本研究基于SARS-CoV-2病毒遺傳特征與全球公共數(shù)據(jù)庫(kù)資源,應(yīng)用生物信息學(xué)方法快速篩選有效抗原表位序列,以期為mRNA疫苗、血清學(xué)診斷性試劑的研發(fā)與優(yōu)化提供參考。
1.1 數(shù)據(jù)收集 檢索NCBI、EMBL、DDBJ數(shù)據(jù)庫(kù)收集全球SARS-CoV-2全基因組序列,應(yīng)用Vector NTI及DNA star軟件分析全基因組ORF,基于已有的SARS-CoV功能研究,剪切提取SARS-CoV-2的ORF 1ab、S蛋白和M蛋白的ORF。將3種ORF分別翻譯為氨基酸序列并儲(chǔ)存于物理庫(kù)備用。
1.2 SARS-CoV-2 ORF 1ab/S/M蛋白遺傳分析 應(yīng)用Clustal X軟件將ORF 1ab、S蛋白和M蛋白的核酸序列進(jìn)行Clustal W對(duì)位分析,應(yīng)用MEGA 7.0軟件基于鄰位相連法(Neighbor-Joining)構(gòu)建進(jìn)化樹(shù)[11]。 構(gòu)建參數(shù)為發(fā)展史檢測(cè)(無(wú))、分布方式(泊松分布)、Gap處理(完全刪除)?;诓煌瑖?guó)家檢出的序列的遺傳距離繪制全球SARS-CoV-2遺傳變異分布圖。
1.3 SARS-CoV參考抗原及其與SARS-CoV-2的相似性分析 應(yīng)用IEDB數(shù)據(jù)庫(kù)檢索SARS-CoV抗原及抗原決定簇,對(duì)比分析SARS-CoV-2與SARS-CoV的ORF 1ab、S、M序列的同源性和相似性,篩選共有的抗原決定簇。
1.4 SARS-CoV-2抗原表位預(yù)測(cè)分析 應(yīng)用IEDB數(shù)據(jù)庫(kù)在線預(yù)測(cè)工具檢索SARS-CoV-2的B細(xì)胞抗原決定簇,檢索條件為抗原表位(線性表位)、免疫細(xì)胞(所有免疫細(xì)胞)、宿主(人)、疾病(病毒性感染性疾病);檢索SARS-CoV-2的T細(xì)胞抗原決定簇,檢索條件為HLA等位基因、免疫細(xì)胞(所有免疫細(xì)胞)、宿主(人)、IC50<500 nmol/L、匹配度等級(jí)<0.1、抗原表位長(zhǎng)度為默認(rèn)值,結(jié)合SARS-CoV序列及全球SARS-CoV-2保守序列分析,篩選mRNA疫苗候選抗原表位。
2.1 ORF 1ab編碼蛋白遺傳分析 應(yīng)用NCBI_PDB數(shù)據(jù)庫(kù)收集全球重點(diǎn)COVID-19暴發(fā)地區(qū)SARSCoV-2核酸序列610條,氨基酸序列74條。應(yīng)用Vector NTI、Clustal X及MEGA 7.0對(duì)ORF 1ab蛋白的核酸與氨基酸序列構(gòu)建進(jìn)化樹(shù),結(jié)果顯示,核酸序列相似性為100.0%,同源性為99.3%,其中巴基斯坦地區(qū)(MT262993.1)在5749-5769位存在缺失,美國(guó)威斯康星州(MT039887.1)在6532-6534位存在缺失;變異氨基酸主要集中在序列中末端。由于核酸變異多發(fā)生在密碼子的二、三位中,因而氨基酸水平的變異程度低于核酸水平。ORF 1ab蛋白遺傳變異全球分布顯示,美洲地區(qū)與亞歐地區(qū)存在明顯差異(圖1A)。
2.2 S蛋白遺傳分析 應(yīng)用Vector NTI、Clustal X及MEGA 7.0軟件對(duì)S蛋白的核酸與氨基酸序列構(gòu)建進(jìn)化樹(shù),結(jié)果顯示,核酸序列相似性為100.0%,同源性為97.5%,其中印度(MT012098.1)在459-461位存在堿基突變;SARS-CoV-2 S蛋白相對(duì)保守,哥倫比亞地區(qū)所在的美洲與歐亞地區(qū)遺傳差異明顯(圖1B)。
2.3 M蛋白遺傳分析 應(yīng)用Vector NTI、Clustal X及MEGA 7.0對(duì)M蛋白的核酸與氨基酸序列構(gòu)建進(jìn)化樹(shù),結(jié)果顯示,核酸序列相似性為100.0%,同源性為99.9%,其中僅美國(guó)伊利諾伊州(MN988713.1、MT044257.1)和加利福尼亞州(MT994467.1)在第207位存在堿基突變;SARS-CoV-2 M蛋白相對(duì)保守,可分為美國(guó)部分州與全球其他暴發(fā)地區(qū)兩大類 (圖1C)。
圖1 SARS-CoV-2 ORF 1ab/S/M蛋白進(jìn)化樹(shù)分析Fig.1 The ORF 1ab/S/M protein neighbor-joining tree of SARS-CoV-2
2.4 SARS-CoV參考抗原及其與SARS-CoV-2的相似性分析 應(yīng)用IEDB數(shù)據(jù)庫(kù)檢索到SARS-CoV抗原決定簇377個(gè),抗原11個(gè)。其中S蛋白含抗原決定簇210個(gè),M蛋白含21個(gè),ORF 1ab蛋白含3個(gè)。本研究中用于與SARS-CoV-2進(jìn)行比對(duì)的抗原均為有文獻(xiàn)表明可產(chǎn)生中和抗體的抗原,參與比對(duì)的抗原決定簇源于上述檢索的11個(gè)抗原。對(duì)SARS-CoV與SARS-CoV-2的ORF 1ab、S、M蛋白進(jìn)行相似性與同源性分析,結(jié)果顯示,ORF 1ab蛋白氨基酸序列相似性96.7%,同源性94.5%;S蛋白氨基酸序列相似性84.1%,同源性75.6%;M蛋白氨基酸序列相似性100.0%,同源性100.0%(圖2)。
2.5 SARS-CoV-2 ORF 1ab/S/M蛋白序列線性表位預(yù)測(cè)分析 應(yīng)用IEDB數(shù)據(jù)庫(kù)預(yù)測(cè)分析ORF 1ab蛋白氨基酸序列的B細(xì)胞響應(yīng)表位顯示,共110條肽段存在B細(xì)胞響應(yīng)區(qū)域。將長(zhǎng)度>10的肽段結(jié)合上述全球各地區(qū)ORF 1ab蛋白保守區(qū)域和SARS-CoV ORF 1ab蛋白保守區(qū)域進(jìn)行分析發(fā)現(xiàn),共15條滿足要求,其中11條對(duì)應(yīng)的mRNA序列高度保守,可作為mRNA疫苗候選目標(biāo)序列(表1)。預(yù)測(cè)分析ORF 1ab蛋白氨基酸序列的T細(xì)胞響應(yīng)表位,按過(guò)濾條件檢索MHC Ⅰ和MHC Ⅱ數(shù)據(jù)庫(kù)中SARS-CoV-2含有的抗原表位發(fā)現(xiàn),共15條滿足要求,其中13條對(duì)應(yīng)的mRNA序列高度保守,可作為mRNA疫苗候選目標(biāo)序列 (表2、圖3A)。
圖2 SARS病毒ORF 1ab/S/M蛋白序列參考抗原及相似性分析Fig.2 ORF 1ab/S/M protein sequence reference antigen of SARS-CoV and similarity analysis between SARS-CoV and SARSCoV-2
表1 SARS-CoV-2 ORF 1ab蛋白B細(xì)胞響應(yīng)mRNA疫苗候選序列Tab.1 The mRNA vaccine candidate sequence in B cell of SARS-CoV-2 ORF 1ab protein
表2 SARS-CoV-2 ORF 1ab蛋白T細(xì)胞響應(yīng)mRNA疫苗候選序列Tab.2 The mRNA vaccine candidate sequence in T cell of SARS-CoV-2 ORF 1ab protein
應(yīng)用IEDB數(shù)據(jù)庫(kù)預(yù)測(cè)分析S蛋白氨基酸序列的B細(xì)胞響應(yīng)表位顯示,共68條肽段存在B細(xì)胞響應(yīng)區(qū)域。將長(zhǎng)度>10的肽段結(jié)合上述全球各地區(qū)S蛋白保守區(qū)域和SARS-CoV S蛋白保守區(qū)域進(jìn)行分析發(fā)現(xiàn),共15條滿足要求,其中6條對(duì)應(yīng)的mRNA序列高度保守,可作為mRNA疫苗候選目標(biāo)序列(表3)。預(yù)測(cè)分析S蛋白氨基酸序列的T細(xì)胞響應(yīng)表位顯示,共15條滿足要求,其中4條對(duì)應(yīng)的mRNA序列高度保守,可作為mRNA疫苗的候選目標(biāo)序列(表4、 圖3B)。
應(yīng)用IEDB數(shù)據(jù)庫(kù)預(yù)測(cè)分析M蛋白氨基酸序列的B細(xì)胞響應(yīng)表位顯示,共6條肽段存在B細(xì)胞響應(yīng)區(qū)域,將長(zhǎng)度>10的肽段結(jié)合上述全球各地區(qū)M蛋白保守區(qū)域和SARS-CoV病毒M蛋白保守區(qū)域進(jìn)行分析發(fā)現(xiàn),共3條對(duì)應(yīng)的mRNA序列高度保守,可作為mRNA疫苗候選目標(biāo)序列(表5)。預(yù)測(cè)分析M蛋白氨基酸序列的T細(xì)胞響應(yīng)表位顯示,共8條滿足要求,其中7條對(duì)應(yīng)的mRNA序列高度保守,可作為mRNA疫苗候選目標(biāo)序列(表6、圖3C)。
近年來(lái)全球經(jīng)歷了多次高致病性冠狀病毒大暴發(fā):2002年的SARS-CoV、2012年的MERS-CoV和2019年的SARS-CoV-2[12]。當(dāng)前臨床治療COVID-19的方法主要分為抗病毒、抗菌和針對(duì)危重患者的特殊治療,并無(wú)特異性藥物,其對(duì)全球公共衛(wèi)生系統(tǒng)帶來(lái)了嚴(yán)峻的挑戰(zhàn)。采用疫苗防控SARS-CoV-2是最為可行的方法之一?,F(xiàn)有的疫苗研發(fā)路徑包括滅活疫苗、核酸疫苗、重組蛋白疫苗、病毒載體疫苗等[13]。mRNA疫苗作為一種新型疫苗,具有安全性高、有效性高和生產(chǎn)便捷等優(yōu)點(diǎn)[14]。本研究通過(guò)分析SARS-CoV-2具有免疫原性的ORF 1ab/S/M蛋白及mRNA序列特征,結(jié)合已有的SARS-CoV研究基礎(chǔ),篩選可用于mRNA疫苗研發(fā)的抗原決定簇候選靶序列[15]?;谏镄畔W(xué)分析結(jié)果的有效解讀和應(yīng)用,可縮短探索制備有效mRNA疫苗的時(shí)間,提高篩選效率,為mRNA疫苗的穩(wěn)定性修飾提供參考。
表3 SARS-CoV-2 S蛋白B細(xì)胞響應(yīng)mRNA疫苗候選序列Tab.3 The mRNA vaccine candidate sequence in B cell of SARS-CoV-2 S protein
表4 SARS-CoV-2 S蛋白T細(xì)胞響應(yīng)mRNA疫苗候選序列Tab.4 The mRNA vaccine candidate sequence in T cell of SARS-CoV-2 S protein
表5 SARS-CoV-2 M蛋白B細(xì)胞響應(yīng)mRNA疫苗候選序列Tab.5 The mRNA vaccine candidate sequence in B cell of SARS-CoV-2 M protein
表6 SARS-CoV-2 M蛋白T細(xì)胞響應(yīng)mRNA疫苗候選序列Tab.6 The mRNA vaccine candidate sequence in T cell of SARS-CoV-2 M protein
圖3 SARS-CoV-2 ORF 1ab/S/M蛋白序列線性表位預(yù)測(cè)分析Fig.3 Forecast analysis of linear epitopes from ORF 1ab/S/M protein sequence of SARS-CoV-2
隨著疫情的發(fā)展,針對(duì)SARS-CoV-2感染的多款檢測(cè)試劑盒相繼通過(guò)國(guó)家應(yīng)急審批進(jìn)入市場(chǎng)。RTPCR法可直接檢測(cè)病毒RNA,但檢測(cè)結(jié)果易受多種環(huán)境因素干擾,且存在檢測(cè)周期長(zhǎng)等弊端[16]??贵w檢測(cè)(如膠體金法、化學(xué)發(fā)光法等)具有標(biāo)本采集流程標(biāo)準(zhǔn)化、特異性高、檢測(cè)周期短、成本低、便攜等優(yōu)點(diǎn),有利于對(duì)SARS-CoV-2感染人群進(jìn)行常規(guī)篩查[17]。本研究結(jié)果也為SARS-CoV-2血清學(xué)診斷試劑的研發(fā)及免疫機(jī)制研究提供了參考,有助于獲得更為優(yōu)化與穩(wěn)定的抗體。
SARS-CoV-2與SARS-CoV在臨床表現(xiàn)、傳播途徑等方面高度相似,全基因序列具有75%的相似性。而其ORF 1ab、S和M蛋白核酸序列相似性較高,使兩種病毒的傳播效力及致病力高度相似,但兩者仍存在差異。結(jié)合ORF 1ab、S和M三種蛋白序列的位點(diǎn)突變及遺傳進(jìn)化分析發(fā)現(xiàn),美洲地區(qū)與亞歐大陸的SARS-CoV-2病毒具有明顯差異。
通過(guò)結(jié)合已有的SARS-CoV研究基礎(chǔ)和全球熱點(diǎn)區(qū)域全基因組比對(duì)分析,預(yù)測(cè)ORF 1ab、S和M蛋白的B細(xì)胞線性抗原表位mRNA序列分別為11條、6條和3條,T細(xì)胞線性抗原表位mRNA序列分別為13條、4條和7條。B細(xì)胞在抗原刺激下可分化為漿細(xì)胞,漿細(xì)胞可合成和分泌抗體,主要執(zhí)行機(jī)體的體液免疫功能。而T細(xì)胞在抗體傳遞,產(chǎn)生、儲(chǔ)存記憶細(xì)胞和殺傷細(xì)胞等方面起著重要作用,主要執(zhí)行機(jī)體的細(xì)胞免疫功能。因此篩選SARS-CoV-2中能夠激活免疫細(xì)胞的抗原決定簇對(duì)抗病毒免疫機(jī)制研究具有重要意義,可為人工構(gòu)建mRNA疫苗(串聯(lián)抗原表位)和制備診斷抗體提供參考。