林彥鋒,李鵬,劉雪林,宋宏彬
1.軍事科學院軍事醫(yī)學研究院,北京100850;2.中國人民解放軍疾病預防控制中心,北京100071
近年來,新發(fā)突發(fā)傳染病成為威脅人類健康與公共衛(wèi)生的重要因素,埃博拉、寨卡等疫情的不斷暴發(fā)給人們敲響了警鐘,這些病原體的快速檢測對于傳染病疫情的防控至關重要。新一代測序(next-generation sequencing,NGS)技術可以獲得病原體基因組序列信息,解決傳統(tǒng)分子生物學方法難以應對未知或變異病原檢測的瓶頸問題[1-4],提高病原體識別確認能力,并通過基因組序列分析實現(xiàn)病原體的快速鑒定、精準分型、傳染源追溯及傳播演化規(guī)律分析,有效降低新發(fā)突發(fā)傳染病造成的公共衛(wèi)生影響[5-6]。比如,利用高通量測序預測H1N1 的傳播流行規(guī)律,與傳統(tǒng)的流行病學預測結果一致,為流感防控提供了重要參考[7]。在埃博拉疫情中應用高通量測序研究埃博拉病毒的演化規(guī)律,為深入的流行病學調(diào)查提供了關鍵信息[8]。
然而,現(xiàn)有的NGS 技術平臺體積大不易搬運,測序周期長,且依賴于大量實驗室輔助設備和專業(yè)人員操作,在面臨疫情暴發(fā)或嚴重感染性疾病的處置中難以實現(xiàn)快速實時檢測,無法應對致病病原識別時效性的需求[9]。且受限于短讀長,NGS 測序難以獲得具有重復序列的復雜基因組結構的病原體序列全長,不利于后續(xù)變異和溯源分析[10-11]。納米孔測序技術利用堿基穿過納米孔時電信號的改變實現(xiàn)實時測序[12],Oxford Nanopore Technology(ONT)公司基于該技術研發(fā)了掌上測序儀MinION,僅有U 盤大小,可通過筆記本電腦USB 接口實現(xiàn)供電和數(shù)據(jù)生成讀取,不受外界環(huán)境和輔助設備限制,實時獲得數(shù)據(jù),按需終止測序[13]。MinION 測序也無須對核酸進行片段化,最快可在10 min 內(nèi)完成樣本建庫,并可獲得更長讀長,目前單條序列讀長已達到882 kb[14]。引起感染的病原體種類極其復雜,使用宏基因組測序可以同時檢測樣本中的病毒、細菌、寄生蟲等病原體[15],MinION 在超長讀長、實時測序和高便攜性等方面的優(yōu)勢,使其在病原體檢測和疾病暴發(fā)監(jiān)測方面的應用日益廣泛。
Greninger 等[16]首次利用MinION 對4 例患者血液樣本進行實時宏基因組病原檢測,病毒含量為107~108拷貝/mL 時,4~10 min 即可完成對埃博拉病毒和基孔肯雅病毒的檢測;病毒含量為105拷貝/mL 時,40 min 內(nèi)檢測到丙型肝炎病毒,且與二代測序儀MiSeq 的結果一致。該方法可將“樣本~檢測”的整個周轉(zhuǎn)時間縮短至6 h 以內(nèi),有效縮短了對傳染性疾病的早期診斷的時間。
引起肝膿腫的病原體種類繁多,目前的診斷主要依賴于病原體培養(yǎng),周期長且常導致培養(yǎng)結果的偏倚。Gong 等[17]對非培養(yǎng)肝膿腫樣本進行納米孔測序以鑒定引起感染的病原體,通過差速離心去除人源完整細胞,借助DNA 酶消化去除人源線性DNA,對處理后的樣本進行MinION 測序,并用ONT 公司的What′s In My Pot(WIMP)生物信息分析流程進行實時病原體鑒定,在4 h 內(nèi)識別出樣本中的肺炎克雷伯菌2 個亞型,并進一步發(fā)現(xiàn)了emrB、macB 等7 個耐藥基因,極大地縮短了病原體鑒定的時間,為臨床感染實時診斷與抗生素用藥提供了重要參考。
蚊子是病原體的重要傳播媒介,但其攜帶的病原含量極其有限,為病原監(jiān)測帶來極大的困難。Batovska 等[18]從一例感染羅斯河病毒的白紋伊蚊中直接提取RNA,采用MinION 和MiSeq 對反轉(zhuǎn)錄產(chǎn)物進行測序,前者成功測定病毒基因組全長,且2 個平臺測序準確率均達到98%以上。美國佛羅里達州研究者采用相似方法,對收集的20例庫蚊樣本混樣后進行現(xiàn)場測序,檢測到委內(nèi)瑞拉馬腦炎病毒,并基于序列分析確定為大沼澤地病毒亞型[9]。該研究僅需手持式qPCR 儀、MinION測序儀及筆記本電腦,即可在現(xiàn)場完成對環(huán)境樣本的測序和生物體的種屬鑒定,對儀器設備的要求低,且無需額外PCR 擴增步驟,為現(xiàn)場快速生物監(jiān)測提供了可借鑒的方法。
瘧疾作為一種重要的蚊媒傳播的寄生蟲傳染病,現(xiàn)有實驗室診斷方法仍難以滿足現(xiàn)場快速準確的檢測需求。Imai 等[19]針對5 種可引起人類瘧疾的瘧原蟲的18S rRNA 序列設計特異性引物,對環(huán)介導等溫擴增后的產(chǎn)物進行MinION 測序,對瘧原蟲最低檢測限達到每個反應體系10~100 拷貝,與巢式PCR 法對瘧原蟲種屬鑒定結果一致,但該方法對實驗設備要求低,適于在實驗室條件匱乏的地區(qū)開展檢測。
病毒遺傳信息多以RNA 為載體,現(xiàn)有測序技術須將RNA 反轉(zhuǎn)錄為cDNA,易引入堿基匹配錯誤或反轉(zhuǎn)錄偏倚,也難以了解RNA 原始狀態(tài)[20]。ONT 公司研發(fā)團隊[21]用MinION 首次完成了對酵母中poly(A)+RNA 的直接測序,無須進行反轉(zhuǎn)錄或擴增就可直接獲得酵母全長鏈特異性的RNA序列。研究者進一步對該樣本RNA 反轉(zhuǎn)錄后的cDNA 分別進行MinION 和MiSeq 測序,3 次測序結果與酵母轉(zhuǎn)錄組數(shù)據(jù)的匹配均在79%以上,且RNA 直接測序與反轉(zhuǎn)錄后測序具有較高的相關性。Keller 等[22]針對甲型H1N1 病毒基因組3′端高度保守區(qū)設計探針,用MinION 對捕獲的病毒原始RNA 直接測序,獲得influenza rA/Puerto Rico/8/1934 毒株完整的編碼序列,隨后又用該方法對甲型流感病毒H1N1、H3N2、H5N1 和H7N9 進行RNA直接測序,與反轉(zhuǎn)錄后PCR 和MiSeq 測序結果的一致性達98%,且超過96%的序列可以匹配到對應病毒基因組,表明MinION 在病毒RNA 直接測序方面的巨大潛力,為進一步直接研究病毒RNA進化變異和堿基修飾提供了重要參考。
長讀長測序為病原體鑒定提供更高的分辨率。Peritz 等[23]對大腸桿菌7 個血清型的混合DNA 文庫進行納米孔測序,以測試MinION 測序?qū)Υ竽c桿菌的分型與鑒別能力。測序結果顯示共獲得63 297 條有效序列,平均讀長為5.9 kb,過濾掉小于4.0 kb 的序列后剩余44 245 條序列。將這些序列與大腸桿菌O 抗原基因簇數(shù)據(jù)庫比對,其中58 條序列特異性匹配到7 種血清型的O 抗原,且每一個O 抗原簇至少匹配4 條序列。通過與大腸桿菌全基因組數(shù)據(jù)庫比對,顯示5096 條(11.5%)序列為特異性匹配序列,這其中99.6%的序列與該7 種血清型匹配,僅0.4%的序列與其他血清型匹配。該方法表明MinION 測序?qū)τ趶碗s混合樣本的病原體分型依然具有較高的分辨率,在病原體快速分型中具有明顯優(yōu)勢。
16S rRNA 基因(~1500 bp)與rrn 操縱子(16S-ITS-23S)是進行微生物種屬鑒定的重要標志,二代測序由于讀長短難以對細菌進行更精細的分型,采用納米孔測序獲得16S rRNA 和rrn 的全長序列,也有助于更全面和更快地檢測復雜生態(tài)系統(tǒng)中的微生物物種多樣性。Cuzco 等[24]利用MinION 分別對葡萄球菌樣本的16S rRNA 和rrn進行測序,發(fā)現(xiàn)兩者的擴增子比對到正確物種的比例分別達~68%和~98%。為了研究微生物多樣性,研究者設計新的多位點方法并利用MinION 平臺對模擬樣本進行16S 擴增子測序,在單次測序中獲得約380 萬條序列,完成了對模擬樣本中超過90%的16S rRNA 基因序列的重建,檢測到20個不同物種,并計算出所有物種的相對豐度[25]。該課題組進一步結合多位點與長擴增子測序方法,使用引物對樣本中的rrn 區(qū)域進行PCR 擴增后用納米孔測序,最終分析和提取67 000 多個細菌基因組中的rrn 序列,完全重建了模擬群落中的微生物多樣性,且其分型準確率優(yōu)于單獨基于16S、ITS 或23S 的分型結果[26]。
2014~2016 年西非埃博拉疫情導致11 299 人死亡,引起了全世界的關注。快速獲得基因組信息有助于闡明埃博拉病毒的傳播規(guī)律,然而疫區(qū)地處偏遠,缺乏良好的實驗室和樣本運輸?shù)臈l件。Loman 團隊[27]首次將MinION 帶到幾內(nèi)亞疫情現(xiàn)場,建立基因組實時監(jiān)測系統(tǒng),收集并完成142例埃博拉患者樣本測序,最快可在24 h 內(nèi)獲得測序結果?;跍y序數(shù)據(jù),研究者發(fā)現(xiàn)幾內(nèi)亞流行的病毒主要屬于GN1 和SL3 種系,且這2 個種系也出現(xiàn)于塞拉利昂,提示病毒在2 個國家之間發(fā)生傳播。Hoenen 等[28]則在利比里亞開展埃博拉病毒現(xiàn)場測序,獲得8 份樣本的埃博拉基因組序列,發(fā)現(xiàn)該地區(qū)的病毒序列與塞拉利昂或幾內(nèi)亞的病毒序列存在明顯差異,但與利比里亞其他地區(qū)序列屬于同一簇,進化分析結果顯示該地區(qū)的埃博拉病毒可能由同一個或親緣關系較近的祖先進化而來,為疫情防控提供了重要的科學依據(jù)。
2015 年巴西暴發(fā)寨卡疫情,隨后超過45 個國家報道了寨卡病毒在本國的傳播。為獲得寨卡病毒的基因組序列及傳播規(guī)律,針對寨卡感染樣本中病原含量低、背景復雜、直接測序難以獲得病毒序列全長的問題,研究者基于寨卡病毒特定編碼序列設計了引物池,通過多重PCR 進行富集擴增,建立基于MinION 的現(xiàn)場測序方法,從而在1~2 d 內(nèi)獲得病毒的一致性序列,該方法在病毒拷貝數(shù)低至50 時仍能有效檢測到病毒[29]?;谏鲜龇椒?,F(xiàn)aria 等[30]進一步發(fā)起“巴西寨卡病毒實時分析計劃”,利用MinION 部署移動實驗室,直接對臨床樣本進行現(xiàn)場測序,獲得了54 株寨卡病毒基因組序列,發(fā)現(xiàn)疫情毒株與來自東南亞及太平洋地區(qū)的寨卡病毒亞洲基因型親緣關系較近,推測寨卡病毒從巴西東北部向中美洲、加勒比海及南美洲其他地區(qū)傳播。后續(xù)的地理學分析結果和前述基礎病毒增殖數(shù)量預測結果一致,為研究病原體的傳播軌跡和進化規(guī)律提供了更為及時和精確的信息[31]。
2018 年尼日利亞拉沙熱疫情暴發(fā),拉沙病毒高變異性為基于PCR 的擴增測序帶來極大困難。為了明確毒株變異特征以及疫情暴發(fā)的分子流行病學機制,研究者們[32]通過隨機反轉(zhuǎn)錄和單引物擴增法對36 例臨床樣本中提取的病毒RNA 進行擴增,并采用MinION 進行現(xiàn)場實時測序與分析,發(fā)現(xiàn)疫情毒株主要為拉沙病毒Ⅱ型和Ⅲ型,系統(tǒng)發(fā)育學分析顯示這2 種病毒亞型主要存在于嚙齒動物中,推測此次疫情為散發(fā)的人畜共患病傳播事件,排除了拉沙病毒在人際間大規(guī)模傳播的可能,指導衛(wèi)生部門將工作重點從切斷人間傳播轉(zhuǎn)向嚙齒動物控制、環(huán)境衛(wèi)生和食品安全等方面,為疫情防控指明了正確的方向。
醫(yī)院中病原體感染傳播可能導致重癥患者死亡,造成社區(qū)范圍內(nèi)的大規(guī)模播散,病原體的快速檢測與分型是院內(nèi)感染防控的首要環(huán)節(jié)。2015 年英國伯明翰一家醫(yī)院暴發(fā)了沙門菌疫情,超過30 人感染,感染來源難以確定。Loman 等[33]用MinION 測序儀分別對腹瀉患者糞便樣本和環(huán)境拭子樣本分離的菌株進行測序,在20 min 內(nèi)確定感染病原體為腸炎沙門菌,在2 h 內(nèi)完成沙門菌與感染暴發(fā)間的關聯(lián)分析,發(fā)現(xiàn)其中一例測序菌株與其他疫情菌株歸屬于同一進化分支,而另一例非疫情相關菌株歸屬其他分支,綜合后續(xù)Illumina 測序結果,37 例疫情菌株中,8 例來自醫(yī)院工作人員,3 例來自病房內(nèi)的無癥狀攜帶者,提示這是一起沙門菌的院內(nèi)感染暴發(fā)。進一步研究發(fā)現(xiàn),最終暴發(fā)菌株確定為PT 14b 型,MLVA 分型為2-11-9-7-4-3-2-8-9,且暴發(fā)菌株的MLVA分型與先前的法國、奧地利、德國暴發(fā)的腸炎沙門氏菌PT 14b 僅有1 個位點的差異,最終確定源頭來自德國的一家雞蛋生產(chǎn)商,提示可能存在著歐洲不同國家間腸炎沙門菌的傳播,為及早采取措施控制疫情傳播爭取了寶貴的時間。
基孔肯雅病毒自2013 年在加勒比地區(qū)首次檢測到后,已經(jīng)傳播到51 個美洲地區(qū)國家,然而關于其基因多態(tài)性與動態(tài)性變化的流行規(guī)律缺乏系統(tǒng)研究。Naveca 等[34]針對2014~2018 年在巴西亞馬孫地區(qū)暴發(fā)的基孔肯雅病毒疫情,使用MinION 測序獲得了20 例基孔肯雅ECSA 基因型(CHIKV-ECSA)病毒株的基因組,分析發(fā)現(xiàn)亞洲基因型雖然在2015 年傳入巴西地區(qū),但此次疫情是由起源于巴西東北部的ECSA 基因型引起的,且ECSA 基因型正在取代亞洲基因型成為優(yōu)勢亞型。進一步的流行病學分析表明,病毒基本再生數(shù)為1.66,據(jù)此估計該地區(qū)約39%的人口感染基孔肯雅ECSA 基因型。另外,研究者發(fā)現(xiàn)Google搜索的活躍度與當?shù)貙嶒炇掖_認的基孔肯雅病毒感染病例之間存在密切聯(lián)系。這一研究顯示出將傳統(tǒng)監(jiān)測與便攜式納米孔基因組測序技術和數(shù)字流行病學相結合的潛力,為探索病原體的流行規(guī)律提供重要信息。
黃熱病毒自然情況下在原始森林中循環(huán)與傳播,巴西的黃熱病毒感染病例近年來明顯上升,然而黃熱病毒在人群間的傳播規(guī)律仍不明確。研究者們[35]使用納米孔測序?qū)Ω腥救祟惡头侨遂`長類動物的黃熱病毒株進行全基因組測序,結合流行病學、地理學和基因組學數(shù)據(jù),發(fā)現(xiàn)病毒的傳播與人類病例的年齡和性別分布密切相關,且黃熱病毒在自然界傳播的地域范圍不斷擴大,引起疫情的病毒株在感染人之前便已在非人靈長類動物中循環(huán)傳播,最終導致2016 年人群中疫情的暴發(fā)?;诩{米孔測序技術的黃熱病毒傳播實時監(jiān)測體系,有助于制定消除未來黃熱病毒流行的全球戰(zhàn)略。
多重耐藥編碼質(zhì)粒是細菌間抗生素耐藥基因傳播的重要介質(zhì),而大量重復序列的存在導致難以通過二代測序獲得質(zhì)粒完整序列,給解析病原菌耐藥的流行傳播規(guī)律帶來極大困難。為研究攜帶NDM-1 基因的細菌在醫(yī)院內(nèi)和醫(yī)院間的傳播規(guī)律,Phan 等[36]收集了羅馬尼亞2 家醫(yī)院的粘質(zhì)沙雷菌、肺炎克雷伯菌和陰溝腸桿菌菌株,結合MinION 和Illumina HiSeq 測序結果,獲得了9例樣本的完整質(zhì)粒序列,發(fā)現(xiàn)其結構均與質(zhì)粒pKOX_NDM1 類似,為研究耐藥質(zhì)粒在不同物種間傳播的分子流行病學機制提供了重要參考。
納米孔測序為病原體快速檢測尤其是疫情現(xiàn)場判別提供了新的思路,但其測序數(shù)據(jù)信噪比低,導致測序錯誤率高,須通過提高測序深度或與二代測序平臺聯(lián)用提高準確率[37-38]。此外,測序需要較高的核酸質(zhì)量,探索適于不同類型臨床樣本的現(xiàn)場處理和測序方案,減少對實驗室設備的依賴,進一步優(yōu)化完善樣本處理與文庫制備操作流程,有助于提高快速檢測的時效性和準確性。我們課題組采用樣本混合富集的方法,對腺病毒感染非培養(yǎng)樣本進行了直接測序,在3 h 內(nèi)即獲得了腺病毒完整基因組,為疫情實時檢測提供了寶貴經(jīng)驗[39]。ONT 公司近期推出的VolTRAX實現(xiàn)了測序文庫構建的自動化,進一步縮短了樣品文庫制備時間,但目前還在試用階段[40]。英國倫敦大學學院(UCL)啟動了PATHSEEK 項目,研究如何對臨床樣本中的特定病原體進行自動化靶向富集和測序分析,并對流感病毒、人巨細胞病毒、結核分枝桿菌等病原體的臨床檢測進行了應用評估,為復雜樣本處理提供了重要參考[41]。
MinION 作為一種新型的測序技術,具有便攜性、實時性等諸多優(yōu)勢,且無須對樣本進行PCR擴增,因此降低了樣本起始量和測序錯誤率,實現(xiàn)了真正的單分子測序。不僅可以實時測序,也可以“剔除”不感興趣的序列,對感興趣的序列持續(xù)進行測序,以便于從樣本宿主背景中獲取更多的病原序列信息[42]。基于EPI2ME 平臺開發(fā)的生物分類工作流WIMP[24]可以對測序數(shù)據(jù)中細菌、病毒、真菌、古細菌等進行識別,也為臨床病原體檢測提供了可定量化實時分析工具。隨著平臺及分析工具的不斷發(fā)展與完善,納米孔測序技術將在現(xiàn)場病原體檢測、臨床微生物診斷以及實時病原監(jiān)測等領域中具有日益廣闊的應用前景。