莊子, 孟雨桐, 劉潤旸, 焦馨怡, 蘆娟, 尹軍, 張文, 楊世興, 沈權
(1. 江蘇大學醫(yī)學院, 江蘇 鎮(zhèn)江 212013; 2. 南京海關衛(wèi)生檢疫處, 江蘇 南京 210001)
基因測序技術起始于20世紀70年代,至今經(jīng)歷了幾代的技術變革。第一代是1977年Sanger等[1]發(fā)明的基于雙脫氧法為核心技術的Sanger測序,該方法具有測序精度高的特點,人類基因組計劃即是以此方法為基礎完成的[2],目前仍在廣泛使用。在后基因組時代,一代測序通量低、平均測序成本高,已經(jīng)無法滿足生命科學對于基因序列獲取的需求。2005年,羅氏公司推出第一臺二代測序儀羅氏454,隨后Illumina公司推出的Solexa技術和ABI公司推出的SOLID技術等較為成熟的測序技術相繼出現(xiàn)[3]。二代測序技術是對傳統(tǒng)測序技術的根本性變革,采用邊合成邊測序的原理,一次運行即可得到幾百萬條核酸分子序列。雖然二代測序技術相比于傳統(tǒng)測序方法在測序通量和測序成本上有巨大的進步,但是其讀長長度短,序列組裝復雜,無法檢測基因拷貝數(shù)變化和基因組結構性變異等缺點同樣很明顯[4]。近年來,基于單分子讀取原理的不需要PCR擴增的第三代測序(third-generation sequencing,TGS)技術逐漸興起。2014年,由牛津納米孔科技(Oxford Nanopore Technologies,ONT)公司所研發(fā)的納米孔測序儀得到了測序領域的廣泛關注[5]。與其他傳統(tǒng)測序技術相比,納米孔測序不需要酶和熒光基團等標記,無需PCR擴增避免了擴增引入的錯誤,操作簡單穩(wěn)定,測序成本也更低,真正意義上實現(xiàn)了實時快速測序。此外,納米孔測序也用于蛋白質一級結構的分析,相較于質譜技術大幅度提高了蛋白質測序的靈敏度,已經(jīng)在疫情防控、病毒快速檢測、疾病早期診斷等領域發(fā)揮越來越重要的作用[6]。
DNA測序的本質就是識別A、G、C、T這4種堿基,傳統(tǒng)測序技術所選用的方法主要是將4種不同的堿基轉化為溶液pH值或者熒光信號,然后通過轉化放大后的信號對堿基進行區(qū)分。而納米孔測序技術則是將4種堿基轉換為電信號,然后對電信號進行收集、整理、轉化與數(shù)據(jù)輸出。主要測序流程:將人工合成的多聚物膜浸沒在離子溶液中,膜上布滿了由解旋酶和蛋白孔兩部分組成的跨膜通道蛋白-納米孔,在膜兩側施加不同電壓形成電壓差,驅動待測鏈在馬達蛋白的牽引下經(jīng)解螺旋后以單鏈形式穿過納米孔。堿基在通過納米孔的恒定的電場時會引起電流的變化,使用計算機軟件識別并推斷出堿基類型,從而完成了DNA或RNA的測序[7](圖1)。
圖1 納米孔測序原理示意圖
為了能夠使體積極小的堿基順利精確地通過納米孔完成測序,納米孔材料的選擇就變得尤為重要。當下納米孔材料主要分為兩類:生物納米孔和固態(tài)納米孔。
生物納米孔是由某種蛋白質分子鑲嵌在磷脂膜上組成的天然納米孔材料,可以進行靈活的生物化學修飾,目前以下3種生物納米孔比較常見:
2.1.1 α-溶血素納米孔 α-溶血素是由金黃色葡萄球菌所分泌的一種致病因子,可以插入純凈的雙分子層脂膜中形成蘑菇狀七聚體,組裝成跨膜蛋白。α-溶血素納米孔永久開通不關閉,耐強酸、強堿,高溫和高電壓下也比較穩(wěn)定,是目前應用最為廣泛的生物納米孔材料[8]。
2.1.2 恥垢分枝桿菌孔蛋白A(Mycobacterium smegmatis porin A, MspA)納米孔 MspA是恥垢分枝桿菌外膜的一種主要組成成分,能夠同時從4~6個核苷酸中讀取信息。相較于α-溶血素納米孔,MspA納米孔可以減緩DNA穿過納米孔的速度,提高DNA單堿基的檢測靈敏度,更有利于對單堿基的測定[9]。另外,MspA在極端的實驗條件下(pH值0~14,100 ℃保持30 min)仍然能維持通道活性,顯示其具有高度穩(wěn)定、耐用的特性[10]。
2.1.3 噬菌體phi29納米孔 噬菌體phi29納米孔通道孔徑為3.6 nm[11],可以允許雙鏈DNA通過,同時較大的孔徑也可以使其更容易通過插入或結合化學基團進行通道修飾來增強傳感效應,以及實現(xiàn)大生物分子的檢測[12]。
固態(tài)納米孔主要是在氧化硅、石墨烯等固態(tài)材質上通過離子束刻蝕等技術制備出的納米孔,因其尺寸可調、可靠性高、易修改等優(yōu)點而越來越受到人們的關注,被廣泛應用于DNA測序、蛋白質檢測和能量轉換等研究領域[13],其中比較常見用于DNA檢測的固態(tài)納米孔是氮化硅納米孔和石墨烯納米孔。雖然固態(tài)納米孔非常穩(wěn)定且具有良好的導電性[14],但是由于其厚度以及疏水作用等問題,所以在檢測精度和準確度方面仍有一定缺陷。
雖然固態(tài)納米孔材料仍尚未完善,但是相較于生物納米孔準確率不高以及測序成本居高不下等缺點,固態(tài)納米孔憑借其優(yōu)良的物理性能以及價格低廉的常規(guī)半導體材料,在提高準確性的同時也極大地降低了測序成本;另外,固態(tài)納米孔可以重復使用,通過大規(guī)模加工的方式可進一步降低單次測序的成本[15]。美國國立衛(wèi)生研究院估計,在未來完成個人基因組測序的成本將不超過1 000美元,正在發(fā)展中的固態(tài)納米孔測序技術給人們帶來了希望[16]。
截至目前所研發(fā)出的納米孔測序儀種類眾多,但都是基于納米孔芯片來搭建的平臺,不同的測序儀平臺適用于不同需求,選擇合適的測序儀能夠有效提高實驗效率。常見的納米孔測序儀大致可以分為以下幾類:
便攜性與實用性是MinION設備的主要特色,結合耗時僅為10 min的建庫試劑盒,該設備可以在實驗室、野外甚至太空環(huán)境進行實時測序(圖2)。該設備可以容納一個測序芯片,每個芯片理論上最大產(chǎn)出可達到50 Gb,是由ONT公司推出的第一款測序產(chǎn)品,也是目前測序平臺中最成熟、使用最為廣泛的一款[17]。
圖2 MinION測序儀
MinION的建庫方式大致可分為3種,分別是建庫便捷、耗時較短的1D庫,讀長更長的2D庫,以及可以對模板鏈和互補鏈同時進行測序的1D2庫,其中以1D2庫使用較為廣泛[18]。MinION憑借其便攜實用的特點以及低廉的價格(1 000美元),在新型冠狀病毒檢測與溯源、猴痘病毒基因組檢測等新發(fā)傳染病檢測領域得到了廣泛應用[19-20]。
通量較高的中型測序設備GridION可并行運行5張MinION芯片,理論最大產(chǎn)出可達到250 Gb,另外芯片之間獨立運行,實時數(shù)據(jù)流傳輸,并可進行機載實時分析,可視為MinION的擴展版本。該測序儀對場地和實驗條件要求較低,一般適用于中小型實驗室。
最多可以容納48張可獨立尋址的高容量PromethION測序芯片,單張測序芯片內(nèi)部最高通量達290 Gb,最新推出的PromethION 48可用于測序的通道數(shù)量多達144 000個,最大數(shù)據(jù)量可達14 Tb。該平臺主要用于開展較大基因組或超群體規(guī)模測序項目。目前已經(jīng)有多項使用PromethION開展的大型項目,例如人類X染色體、10萬人的結構變異分析等項目[21-22]。
擁有MinION和GridION的轉換器,可在一次性使用的測序芯片上進行快速、小型的測試,目前多用于微生物測序等數(shù)據(jù)量較小的檢測或實驗。
于2020年1月最新上市的MinION MK1C(圖2)重量僅為420 g,將MinION和Flongle實時、快速、便攜式測序的優(yōu)點與強大的GPU計算和高分辨率顯示屏相結合,無論是短讀長還是超長讀長(最長>2 Mb)都可以進行讀取,可以直接插入USB插口,通過一臺配置簡單的電腦即可完成測序[23],適用于全基因組測序、靶向測序、全轉錄組測序,在保證高產(chǎn)出的同時也維持了較低的成本。
相比于其他測序平臺,納米孔測序作為一種新型測序技術在成本、速度、讀長和準確率等諸多方面有著不同的特點,其優(yōu)勢十分顯著,主要可以概括為以下幾點(表1)。
表1 不同測序平臺原理及優(yōu)缺點比較
相比較于一代測序(適用于少量樣本小規(guī)模檢測)和二代測序(羅氏454測序平臺讀長為230~400個堿基,Illumina測序平臺大約讀長為300個堿基,SOLiD測序平臺讀長為25~35個堿基)[24],納米孔測序在讀長方面有著巨大優(yōu)勢,能夠直接測定2 Mb以上的讀長。在納米孔測序中,理論上讀長長度可以等于輸入片段長度,讀長長度僅僅受限于所測單鏈DNA的長度限制[25]。長讀長可以提供更完整、更連續(xù)的基因組組裝,在具有大型結構變異和高水平重復區(qū)域的基因組中優(yōu)勢顯著,例如長序列可以很容易地將甲基化分為不同的等位基因,從而通過靶向測序探索特異性的表觀遺傳變化[26];檢測和分析細菌、病毒等病原體基因重組等結構變異,為分析病原體變異導致的耐藥性等提供依據(jù)。同時相比于其他測序方法,納米孔測序的超長讀長可以推動采用液體活檢的分子核型發(fā)展,不僅可以作為臨床環(huán)境中癌癥監(jiān)測的工具,而且可以擴展到其他基于液體活檢的領域,如無創(chuàng)產(chǎn)前診斷[27]。
納米孔測序可以直接測序原始DNA和RNA,這不僅節(jié)省了時間和成本,還意味著堿基修飾的信息(例如5mC,m6A)會被完整地保留并且包含在測序運行產(chǎn)生的原始信號信息中隨時進行分析[28]。此外納米孔測序技術的文庫制備工作流程也更簡單,通常僅需要10 min甚至更快。因為存在表觀修飾的堿基激發(fā)的電流強度是不同的,所以在納米孔測序中,DNA序列和修飾均可使用原始信號信息進行檢測,能夠直接讀取出甲基化的胞嘧啶,檢測的準確率更是高達92%~98%[29]。
MinION的尺寸只有一支筆的長度,重量大約100 g,長度僅10 cm,可使用高速USB 3.0插入電腦,以其極小的體積徹底顛覆了人們對測序儀的印象,被稱為“U盤測序儀”[30]。MinION的應用可以不局限于實驗室環(huán)境,是首次用于外太空的DNA測序設備,尤其是在非洲等不發(fā)達地區(qū)使用更便攜。
相比于其他傳統(tǒng)測序,納米孔測序真正意義上做到了動態(tài)實時測序,支持在幾分鐘內(nèi)就獲得病原體鑒定等時間關鍵型應用的檢測結果。用戶可以在測序早期了解樣本的質量和狀態(tài),也可以在獲得足夠的數(shù)據(jù)后停止測序。同時納米孔測序技術所需的時長也是遠遠短于其他測序方法,在設備齊全的情況下,從樣本和文庫的制備到最終的測序分析總用時不超過40 min,這個優(yōu)點在實驗條件惡劣的情況下同樣適用。在2019年爆發(fā)的非洲口蹄疫病毒(foot-and-mouth disease virus,FMDV)疫情中,德國科學家首次在移動手提箱實驗室中利用納米孔測序法建立了FMDV血清分型的快速測序方案,整個程序大致包括RNA提取、逆轉錄、第二鏈合成、測序和數(shù)據(jù)分析,可在5 h內(nèi)完成,并且不依賴生物信息學家的參與[31]。
納米孔測序技術的低費用體現(xiàn)在三個方面:首先是啟動費用低,1990年完成的人類基因組計劃耗資數(shù)十億美元,后續(xù)的其他測序技術的啟動費用也需要數(shù)十萬人民幣,而納米孔測序技術的啟動費用僅為1萬元左右,使人類千元基因組計劃的實施真正成為了可能[32];其次是可以按需測序,根據(jù)不同的實驗條件選擇相應的納米孔測序儀以及所需的芯片數(shù)量;最后是對工作環(huán)境要求低,例如體積極小的MinION等設備可以在各種實驗條件下測序,對潔凈度、溫度、濕度等條件沒有特別要求。
除了能夠進行核酸測序外,納米孔測序儀也被用于蛋白質的氨基酸序列測定。該方法的原理與核酸測序類似,解旋酶拖動連接了多肽的DNA分子使其緩慢通過納米孔,從而通過讀取電信號表征得出多肽的氨基酸序列。相較于質譜分析等方法,基于納米孔的蛋白質測序技術顯著提升了測序的靈敏度,隨著技術的不斷發(fā)展,磷脂膜納米孔測序、基于表面增強拉曼光譜效應的納米孔測序等方法的出現(xiàn)為蛋白質測序提供了新思路[33],將在以重要蛋白質為標志物的醫(yī)學診斷中發(fā)揮重要作用。
隨著納米孔測序技術的不斷發(fā)展與成熟,納米孔測序在病原學的實驗室以及臨床研究中,如疫情監(jiān)測、宏基因組學研究、病原體檢測等方面開始扮演重要的角色。
自2019年12月新型冠狀病毒(SARS-CoV-2)疫情暴發(fā)以來,如何充分快速地了解SARS-CoV-2的基因組序列以及如何完成對于疫情的監(jiān)控成為了首要難題。在接下來的解決過程中,基因測序技術有著舉足輕重的地位。英國《柳葉刀》雜志更是在社論中指出,疫情之下,基因測序水平是衛(wèi)生系統(tǒng)的核心能力。而在眾多測序技術中,納米孔測序技術更是以其直接實時測序、超長讀長、快捷方便等優(yōu)點成為眾多研究人員的首選[34]。
SARS-CoV-2的診斷通常依賴于PCR核酸檢測,但是該方法顯示出較高的假陰性率和低敏感性(陽性檢出率僅為30%~50%),從而導致臨床高度疑似SARS-CoV-2感染患者或低病毒潛伏的“假陰性”現(xiàn)象頻發(fā),此外,PCR核酸檢測無法同時檢測其他秋冬季高發(fā)、癥狀與SARS-CoV-2感染相似的呼吸道病毒,給疫情防控和患者分流管理帶來了挑戰(zhàn)[35]。武漢大學劉天罡團隊開發(fā)了納米孔靶向測序(nanopore targeted sequencing,NTS)檢測方法,該方法結合了病毒靶向擴增和納米孔測序長讀長、實時數(shù)據(jù)輸出的優(yōu)勢,首次實現(xiàn)測序后4 h內(nèi)高敏感性、高準確性同時檢測SARS-CoV-2和其他10大類、40余種呼吸道病毒,其最低檢測限高于目前廣泛使用的qPCR方法的100倍。同時該方法不僅能夠對SARS-CoV-2基因組變異情況進行檢測以及監(jiān)控,而且還可以檢測其他10類呼吸道病毒,包括乙型流感病毒和丙型流感病毒等[19]。另外納米孔測序平臺對實驗室的場地、設施要求不高,對實驗場所的潔凈度、溫度、濕度等條件沒有特別要求,因此NTS也適合不同級別的醫(yī)院使用。
此外,中國科學家基于納米孔測序技術對臨床樣本中的SARS-CoV-2基因組序列進行測序,通過測序、同步繪制參考基因組序列和實時分析輸出數(shù)據(jù),可在數(shù)分鐘內(nèi)在基因組水平確認SARS-CoV-2感染[36],再一次彰顯了納米孔測序技術快速便捷的優(yōu)勢。
除了最近的新型冠狀病毒疫情之外,在2015年于非洲幾內(nèi)亞爆發(fā)的埃博拉病毒疫情中納米孔測序技術同樣得到應用。歐洲移動實驗室項目的團隊就將納米孔測序儀應用到了西非埃博拉疫情防控的第一線,該團隊利用MinION測序儀在48 h內(nèi)獲得了14名患者的埃博拉病毒基因組[37]。在2020年于內(nèi)蒙古地區(qū)突發(fā)的一起飼養(yǎng)野豬疫情中,實驗人員采用納米孔測序技術在4 min內(nèi)實時檢測出了非洲豬瘟病毒的特異性序列[38],這些信息能夠幫助醫(yī)生診斷疾病并快速繪制系統(tǒng)發(fā)育樹,從而確定感染的源頭,進而有效控制疫情。
在最近爆發(fā)的猴痘病毒(monkeypox virus,MPXV)疫情中,納米孔測序技術同樣起到了關鍵作用,得益于納米孔測序技術快速、便攜等優(yōu)點,第一條MPXV基因組的測序和組裝即是采用納米孔測序平臺完成的。到目前為止,大多數(shù)的MPXV基因組的測序均是采用該測序平臺完成[20,39]。
對于臨床樣品的病原體檢測來說,快速而又準確地得到鑒定結果尤為重要。然而在常見的感染性疾病的樣品中病原體(特別是病毒)的載量通常很低,并且可能存在基因突變,常規(guī)檢測方法容易產(chǎn)生假陰性。納米孔測序技術憑借其諸多優(yōu)點已經(jīng)成為病原微生物快速檢測最有前景的高通量測序技術[40]。
有報道稱MinION能夠在15 h內(nèi)從咽拭子樣本中同時檢出人呼吸道腺病毒7型和甲型流感病毒H3N2型的多種基因序列,表明MinION具備快速檢測多種病原體并進行分型的可行性[41]。在2019年2月于河北省發(fā)生的一起腺病毒疫情中,MinION測序分別在14 min和22 min內(nèi)檢測到混合樣本和單個樣本中的7型腺病毒序列,通過系統(tǒng)發(fā)育分析發(fā)現(xiàn)該毒株與北京一株毒株具有共同遺傳來源[17]。
宏基因組學是在微生物基因組學上發(fā)展起來的一種研究微生物多樣性、獲取新基因的一種新方法,自1998年由Handelsman提出宏基因組的概念之后,至今已有20多年的歷史,其研究方法也逐漸成熟。宏基因組學的研究目的主要是進行流行病學診斷、發(fā)現(xiàn)新物種、篩選重要微生物菌種以及溯源病原菌等,但是目前成本較高,耗時較長,生物信息學分析難度較大[42]。
宏基因組學研究對于測序平臺的讀長要求很高,傳統(tǒng)的測序技術很難滿足它的讀長需求,這個問題通過納米孔測序技術可以得到很好的解決[43]。目前,在宏基因組研究中取得進展最快的是16S rRNA測序,存在于原核生物基因組中的16S rRNA被廣泛應用于原核生物的分類研究[44],16S rRNA基因中不同的高變區(qū)在一定程度上代表著不同微生物間的進化差異。MinION技術具有超長的讀長且允許設計的引物覆蓋整個16S基因,對病原體的鑒定具有更高的分類分辨率。除此之外,納米孔測序技術還可以對環(huán)境水樣中的DNA和RNA病毒進行測序,用于快速現(xiàn)場分析以及檢測環(huán)境病毒[45]。
納米孔測序技術近年來發(fā)展迅猛,相比于其他測序技術,其憑借著超長讀長、實時監(jiān)測、簡單便攜等特點開始被廣泛應用于各個領域。但是目前納米孔測序技術也不盡完美,諸如分子運動時產(chǎn)生的波動對結果準確性的影響,脂質雙分子層的不穩(wěn)定性,DNA穿越速度過快等問題依然存在。不過納米孔測序技術真正的魅力在于其巨大的潛力以及廣泛的應用前景,隨著超精度堿基識別模式軟件等分析工具的出現(xiàn)以及化學試劑的更新,其測序的準確度和通量也在逐步提升,其中在原始讀長、共有序列、變異識別、堿基修飾等方面的準確率可達99%以上[46]。不難預見,納米孔測序技術將成為下一代常規(guī)測序儀器,并在各個領域的應用更加廣泛,為生命科學的發(fā)展提供更大的推進力。