龍冬玲,黃輝濤,魏泉德,黃文燕
2019年12月,新型冠狀病毒(SARS-CoV-2)在武漢被首次報(bào)道,目前該病毒在全球范圍內(nèi)已造成大流行[1]。截至北京時(shí)間2021年5月6日6時(shí)30分,全球累計(jì)確診新冠肺炎病例155 790 320例,累計(jì)死亡3 254 439例,全球單日新增確診病例857 854例[2]。新型冠狀病毒屬于β屬冠狀病毒,是迄今為止被發(fā)現(xiàn)的冠狀病毒中第7種可以使人類(lèi)致病的冠狀病毒,其全基因組包含近30 000個(gè)核苷酸堿基,由14個(gè)蛋白編碼區(qū)域構(gòu)成。目前研究顯示,新型冠狀病毒與蝙蝠類(lèi)SARS樣冠狀病毒基因組相似性最高,與導(dǎo)致人類(lèi)感染的其他冠狀病毒差異較大。新型冠狀病毒全基因組測(cè)序可提示病毒的變異情況和揭示傳染病的傳播途徑,對(duì)疾病防控策略的制定具有重要意義。珠海市于2020年1月19日檢出首例新型冠狀病毒肺炎病例,截止至2021年5月5日24時(shí),全市累計(jì)確證病例113例,其中15例為境外輸入病例[3]。為了解珠海市新型冠狀病毒的變異和溯源情況,為后期及時(shí)準(zhǔn)確追蹤溯源病毒,我們選取了4份不同時(shí)期確診為新型冠狀肺炎病例的呼吸道標(biāo)本進(jìn)行測(cè)序分析,現(xiàn)將結(jié)果分析如下。
1.1 樣本來(lái)源 4份上呼吸道樣本均采集于珠海市2020年1月至12月確診為SARS-CoV-2病例患者標(biāo)本,其中咽拭子樣本3份,鼻咽拭子1份。采用中山達(dá)安基因股份有限公司的新型冠狀病毒2019-nCoV核酸檢測(cè)試劑盒檢測(cè),確診病例疾病分型參照新型冠狀病毒肺炎診療方案(試行第七版)[4],具體樣本信息見(jiàn)表1。
表1 標(biāo)本信息Tab.1 Sample information
1.2 全基因組文庫(kù)構(gòu)建和測(cè)定 采用病毒核酸提取試劑盒(Qiagen RNeasy Mini Kit,貨號(hào):74104)提取200 μL樣本的總RNA;應(yīng)用隨機(jī)引物逆轉(zhuǎn)錄方法,采用逆轉(zhuǎn)錄試劑盒(LunaScriptTMRT SuperMix Kit,貨號(hào):E3010L)生成cDNA。根據(jù)ARTIC Network公布的實(shí)驗(yàn)方案合成擴(kuò)增引物(COVID-19 primers V3版)。采用多重PCR擴(kuò)增試劑盒(Q5○RHot Start High-Fidelity 2X Master Mix,貨號(hào):M0494S)獲得多重?cái)U(kuò)增產(chǎn)物。反應(yīng)條件:98 ℃ 30 s(1 cycle);98 ℃ 15 s,65 ℃ 5 min(35 cycle);65 ℃ 5 min(1 cycle)。擴(kuò)增產(chǎn)物回收采用核酸磁珠純化試劑盒(AMPure XP beads,貨號(hào):A63880)等比例純化回收。使用核酸定量試劑(Qubit dsDNA HS ASSAY kit,貨號(hào):1646715)對(duì)純化核酸進(jìn)行定量。采用產(chǎn)物末端修復(fù)試劑盒(NEB Next End repair/dA-tailing Module,貨號(hào):E7546S)對(duì)擴(kuò)增產(chǎn)物末端修復(fù),接頭連接采用試劑盒(NEB Next Quick Ligation Module,貨號(hào)E6056S;Native Barcoding Kit,EXP-NBD104/EXP-NBD114)對(duì)樣本進(jìn)行無(wú)擴(kuò)增條形碼標(biāo)記與接頭連接。上機(jī)測(cè)序采用試劑盒(Flow Cell Primming Kit,貨號(hào):EXP-FLP002)進(jìn)行高通量測(cè)序。
1.3 數(shù)據(jù)分析處理 使用RAMPART軟件對(duì)下機(jī)數(shù)據(jù)進(jìn)行序列修剪和質(zhì)量評(píng)估,使用minimap2和medaka組裝軟件生成一致性序列。參考基因組為早期公布的2019-nCoV病毒株Wuhan-Hu-1的基因組(GenBank Accession No.NC045512.2)。采用IQ-TREE軟件構(gòu)建序列分子進(jìn)化樹(shù),進(jìn)化樹(shù)構(gòu)建所納入的參考序列以在GISAID數(shù)據(jù)庫(kù)中篩選出來(lái)與所測(cè)序列相似性最高、同時(shí)期的國(guó)際上公布的序列作為同源性分析的參考基因組,每條目標(biāo)序列選取250條相似序列進(jìn)行分析,相同的參考基因組只選擇一次,相似性序列查找完成后使用mega7.0軟件線下分析,最大似然法構(gòu)建系統(tǒng)進(jìn)化樹(shù),步長(zhǎng)值選擇1 000,納入線下分析的參考基因組分別為hCoV-19/Wuhan/WH01/2019、hCoV-19/Colombia/AMA-INS-VG-1193/2021、 hCoV-19/England/20134017404/2020、 hCoV-19/England/CAMC-137AA76/2021、hCoV-19/England/QEUH-C5B84E/2020、 hCoV-19/Guangdong/20SF028/2020、hCoV-19/Guangdong/20SF040/2020、hCoV-19/HongKong/HKPU-01524/2020、 hCoV-19/HongKong/HKPU-01574/2020、hCoV-19/HongKong/HKPU-02039/2020、hCoV-19/HongKong/HKPU-02290/2020、hCoV-19/HongKong/HKPU-06284/2020、hCoV-19/HongKong/HKPU-07782/2020、hCoV-19/HongKong/HKPU-08506/2020、hCoV-19/HongKong/HKPU-5161/2020、 hCoV-19/HongKong/HKPU-04778/2020、hCoV-19/HongKong/HKPU-5183/2020、hCoV-19/HongKong/HKU-201216-036/2020、hCoV-19/HongKong/HKU-201216-037/2020、hCoV-19/HongKong/HKU-201216-060/2020、hCoV-19/HongKong/HKU-201216-172/2020、hCoV-19/HongKong/HKU-201216-232/2020、hCoV-19/HongKong/HKU-201216-260/2020、hCoV-19/HongKong/HKU-201216-346/2020、hCoV-19/HongKong/HKU-201216-367/2020、hCoV-19/HongKong/HKU-201216-372/2020、hCoV-19/HongKong/VM20040795/2020、hCoV-19/Spain/NC-IBV-001418/2020、hCoV-19/Thailand/Chon-buri-SQ-NP0073/2020、hCoV-19/USA/NC-CDC-STM-000022772/2021。
2.1 基因組測(cè)序基本情況 4份樣本經(jīng)nanopore三代基因組測(cè)序結(jié)果見(jiàn)表2,基因組平均測(cè)序深度3 468×,基因組覆蓋度在94.6%~99.7%。
表2 基因組測(cè)序結(jié)果Tab.2 Results of the genome sequencing
2.2 核苷酸及氨基酸變異情況 以SARS-CoV-2 Wuhan-Hu-1株作為參考基因組,測(cè)序結(jié)果顯示4份樣本共檢測(cè)到46個(gè)堿基位點(diǎn)突變,其中涉及氨基酸性質(zhì)改變的非同義突變有27個(gè),涉及5個(gè)編碼區(qū)域,其中導(dǎo)致ORF1編碼區(qū)氨基酸變異有12個(gè)、N基因編碼區(qū)6個(gè)、S基因編碼區(qū)6個(gè)、ORF3基因編碼區(qū)2個(gè)和ORF9b基因編碼區(qū)1個(gè)。除早期武漢居住史的病例ZQ202001,其余樣本在S基因編碼區(qū)均出現(xiàn)D614G的變異。位點(diǎn)變異情況詳見(jiàn)表3。
表3 位點(diǎn)變異情況Tab.3 Mutations of nucleotide and amino acid
2.3 系統(tǒng)進(jìn)化樹(shù)分析 全基因組測(cè)序分析結(jié)果顯示,珠海市4份不同時(shí)期SARS-CoV-2病例來(lái)源于不同的進(jìn)化分支,早期武漢輸入病例ZQ202001分屬于B,其核苷酸突變只與參考基因組SARS-CoV-2 Wuhan-Hu-1株相差1個(gè)堿基數(shù),而2020年7、8月鑒定的來(lái)自菲律賓的境外輸入病例ZHG9671與香港輸入病例Po717001同屬于B.1.1.63分支,與同時(shí)期香港公布的序列核苷酸相似性較高,遺傳距離相近。2020年12月鑒定的香港輸入病例YZQ202011分屬于B.1.36分支。見(jiàn)圖1。
圖1 珠海市不同時(shí)期SARS-CoV-2全基因組系統(tǒng)發(fā)育進(jìn)化圖Fig.1 Phylogenetic tree based on SARS-CoV-2 complete genomes in different decades in Zhuhai city
2020年1月底,SARS-CoV-2病毒刺突蛋白出現(xiàn)D614G突變,使得突變株陸續(xù)成為了后期的全球流行株[5]。目前,SARS-CoV-2經(jīng)過(guò)在全球不同人群間突變進(jìn)化與新冠疫苗選擇壓力的雙重選擇下,已演變成800多種不同的亞型或分支[6],一些突變株如501Y.V2南非突變株、B.1.617印度流行變異株的出現(xiàn)導(dǎo)致了新一輪疫情的暴發(fā)。本次研究選取的主要為2020年不同時(shí)期COVID-19病例的標(biāo)本,基因組測(cè)序結(jié)果顯示珠海市檢測(cè)的疫情早期樣本ZQ2020014與參考株SARS-CoV-2 Wuhan-Hu-1株的基因組高度相近,提示COVID-19大流行早期基因組保持著較低的進(jìn)化水平,多數(shù)堿基突變導(dǎo)致氨基酸保守置換,對(duì)病毒的表型并未發(fā)生潛在的影響,與相關(guān)文獻(xiàn)報(bào)道結(jié)論一致[7]。其余3份樣本為全球疫情大流行期間檢出的境外輸入病例,共檢測(cè)到45個(gè)堿基位點(diǎn)突變,其中導(dǎo)致氨基酸性質(zhì)改變的突變有26個(gè),以O(shè)RF1編碼區(qū)氨基酸突變頻率最高,不同于已報(bào)道的基因組變異均勻分布于各編碼區(qū)[8-9],推測(cè)可能是選取例數(shù)太少所導(dǎo)致的偏差。
2020年5月以后,國(guó)內(nèi)疫情逐漸趨于穩(wěn)定,珠海市的COVID-19病例以境外輸入為主,基因組測(cè)序分結(jié)果顯示,來(lái)自菲律賓的境外輸入病例ZHG9671與香港輸入病例Po717001同屬于B.1.1.63分支,2020年12月鑒定的香港輸入病例YZQ202011分屬于B.1.36分支,3份輸入病例標(biāo)本均與同時(shí)期香港公布的序列核苷酸相似性較高,遺傳距離相近。從全基因組系統(tǒng)發(fā)育分析中可發(fā)現(xiàn),各個(gè)國(guó)家上傳的病毒基因組不僅在本國(guó)有聚集性的出現(xiàn),并且在多個(gè)分支中可發(fā)現(xiàn)有許多不同國(guó)家的散發(fā)株,這說(shuō)明SARS-CoV-2在全球范圍內(nèi)穩(wěn)定持續(xù)傳播著,世界范圍內(nèi)的高密度人口流動(dòng)可使病毒在短時(shí)間內(nèi)擴(kuò)散,此外目前研究已報(bào)道世界范圍內(nèi)有大量的新冠感染者癥狀輕微或無(wú)癥狀[10],無(wú)癥狀感染者在COVID-19流行期間是潛在的強(qiáng)傳染源,具有隱匿性,臨床上不易被發(fā)現(xiàn)。亟需在目前篩查密切接觸者、高風(fēng)險(xiǎn)地區(qū)人員篩查以及感染源調(diào)查的基礎(chǔ)加強(qiáng)大數(shù)據(jù)的追蹤管理,加入定期核酸監(jiān)測(cè)來(lái)管控。
目前,對(duì)COVID-19臨床樣本的基因組測(cè)序多采用二代測(cè)序、三代測(cè)序平臺(tái)完成。第三代Nanopore納米孔測(cè)序技術(shù)屬于單分子測(cè)序,它根據(jù)將一個(gè)納米孔蛋白固定在電阻膜上,通過(guò)物理手段使DNA雙鏈解鏈成單鏈,利用馬達(dá)蛋白牽引DNA單鏈傳過(guò)納米孔,因不同堿基攜帶不同電荷在通過(guò)納米孔時(shí)引起電阻膜上電流的變化識(shí)別堿基,實(shí)現(xiàn)高通量測(cè)序。三代測(cè)序具有測(cè)序讀長(zhǎng)長(zhǎng)(超過(guò)150 kb)、速度快、測(cè)序數(shù)據(jù)實(shí)時(shí)監(jiān)控、機(jī)器方便攜帶等特點(diǎn)。Lu等[11]曾采用不同測(cè)序平臺(tái)對(duì)廣東省疫情早期的臨床病例樣本進(jìn)行測(cè)序,結(jié)果顯示Nanopore混樣建庫(kù)PCR測(cè)序表現(xiàn)良好,尤其適用于病毒載量低的樣本。本次研究所選取的4份樣本均可獲得27 493~29 810 bp長(zhǎng)度的基因組序列數(shù),基因組覆蓋度94.6%~99.7%不等,但樣本ZQ2020001和YZQ202011基因組序列缺失較多,測(cè)序質(zhì)量與病毒載量、文庫(kù)構(gòu)建情況、原始標(biāo)本核酸完整性密切相關(guān),CT<30的臨床標(biāo)本均能獲得較好的測(cè)序結(jié)果,本研究中的ZQ2020001和YZQ202011初次檢測(cè)CT值雖均在30以下,但基因組缺失較多,可能是在檢測(cè)過(guò)程中操作不當(dāng)導(dǎo)致的核酸降解。對(duì)于COVID-19臨床標(biāo)本,應(yīng)在檢測(cè)陽(yáng)性時(shí)及時(shí)提取全基因組進(jìn)行疫源追蹤,核酸反復(fù)凍融對(duì)核酸的穩(wěn)定性及完整性均有較大影響,不利于后續(xù)基因組測(cè)序。
綜上所述,本次研究對(duì)本市COVID-19部分臨床標(biāo)本進(jìn)行全基因組測(cè)序,溯源分析顯示基因組之間核苷酸突變具有多態(tài)性,4份臨床標(biāo)本均具有外地旅行史,均為輸入病例,未出現(xiàn)本地感染。三代測(cè)序技術(shù)可有效用于原始樣本中新型冠狀病毒基因組序列的溯源分析,在地市級(jí)疾控應(yīng)用前景較好。
利益沖突:無(wú)
引用本文格式:龍冬玲,黃輝濤,魏泉德,等.珠海市不同時(shí)期新型冠狀病毒基因組測(cè)序及溯源分析[J].中國(guó)人獸共患病學(xué)報(bào),2021,37(11):1003-1007. DOI:10.3969/j.issn.1002-2694.2021.00.138