周瑩黃華藝,2★
單細(xì)胞測(cè)序技術(shù)及其在腫瘤研究和臨床診斷中的應(yīng)用
周瑩1黃華藝1,2★
腫瘤組織的異質(zhì)性是腫瘤的一個(gè)重要特征。腫瘤細(xì)胞均一性的缺乏使得腫瘤靶向治療的難度加大。因此,鑒別腫瘤細(xì)胞的異質(zhì)性是一個(gè)重要工作。單細(xì)胞測(cè)序技術(shù)(single-cell sequencing,SCS)是通過(guò)下一代測(cè)序手段觀察單個(gè)細(xì)胞的基因組序列信息,從而獲得細(xì)胞間遺傳物質(zhì)和蛋白質(zhì)信息的差異,因此能夠更好地理解單個(gè)細(xì)胞在其微環(huán)境中的功能。通過(guò)對(duì)單個(gè)腫瘤細(xì)胞全基因組、轉(zhuǎn)錄組以及細(xì)胞表觀遺傳基因進(jìn)行測(cè)序,瘤內(nèi)異質(zhì)性的復(fù)雜機(jī)制可被揭示,從而改善腫瘤診斷、轉(zhuǎn)歸預(yù)測(cè)和治療效果的監(jiān)測(cè)。本文對(duì)單細(xì)胞測(cè)序技術(shù)的發(fā)展、檢測(cè)原理和檢測(cè)流程、存在的問(wèn)題及其在腫瘤研究中的應(yīng)用以及該技術(shù)在臨床上的潛在價(jià)值進(jìn)行了概述。
單細(xì)胞測(cè)序;下一代測(cè)序;基因組;腫瘤;異質(zhì)性
腫瘤是機(jī)體在各種致癌因素作用下,遺傳物質(zhì)受損導(dǎo)致對(duì)特定細(xì)胞失去正常生長(zhǎng)調(diào)控,繼而引起其克隆性異常增生。惡性腫瘤細(xì)胞通過(guò)對(duì)自身不斷“改良”,可以產(chǎn)生許多基因突變和致病性表型,以適應(yīng)宿主體內(nèi)復(fù)雜的腫瘤微環(huán)境,甚至腫瘤內(nèi)的單個(gè)細(xì)胞組織表現(xiàn)出獨(dú)特的表型,即瘤內(nèi)異質(zhì)性(intratumoral heterogeneity)[1]。這代表著不同的腫瘤細(xì)胞之間致病潛力存在差異,其中某些細(xì)胞可能造成更大的威脅,具有更強(qiáng)的轉(zhuǎn)移或侵襲能力或者更容易產(chǎn)生耐藥性。然而,對(duì)于腫瘤細(xì)胞亞群分子層面的數(shù)據(jù),尤其是對(duì)細(xì)胞異質(zhì)性的信息挖掘和認(rèn)識(shí)仍然非常有限。
細(xì)胞異質(zhì)性是腫瘤研究和診斷治療中亟待解決的關(guān)鍵問(wèn)題,單細(xì)胞測(cè)序技術(shù)(single cell sequencing,SCS)是一種理想的研究腫瘤復(fù)雜性的方法。通過(guò)獲取特定階段的單個(gè)腫瘤細(xì)胞的動(dòng)態(tài)基因組(deoxyribonucleic acid,DNA)、轉(zhuǎn)錄組(ribonucleic acid,RNA)數(shù)據(jù)以及細(xì)胞表觀遺傳信息,可用于構(gòu)建與腫瘤發(fā)生、發(fā)展和轉(zhuǎn)移以及產(chǎn)生耐藥性等機(jī)制相關(guān)的遺傳圖譜,為臨床探索有價(jià)值的診斷或預(yù)后生物標(biāo)志物以及分子治療靶標(biāo)[2]。在這篇文章中,我們將對(duì)SCS技術(shù)進(jìn)行介紹,并對(duì)其在單個(gè)細(xì)胞的腫瘤活檢以及液體活檢中的應(yīng)用進(jìn)行總結(jié)。
測(cè)序技術(shù)經(jīng)歷了低通量到高通量的時(shí)代變革,能夠?qū)资f(wàn)到幾百萬(wàn)條DNA分子同時(shí)測(cè)序,每個(gè)運(yùn)行可精確讀出數(shù)以千億計(jì)的堿基,從而實(shí)現(xiàn)快速、高效、低成本的基因組測(cè)序。受益于測(cè)序技術(shù)的發(fā)展,對(duì)細(xì)胞的分子研究逐漸由混合細(xì)胞群樣本發(fā)展到單個(gè)細(xì)胞樣本。下一代測(cè)序(next generation sequencing,NGS)技術(shù)的發(fā)展為實(shí)現(xiàn)全基因組單細(xì)胞測(cè)序(genome-wide single-cell sequencing)提供了新的可能[3]。2009年研究人員采用mRNA全轉(zhuǎn)錄組測(cè)序方法(mRNA-Seq wholetranscriptome analysis)對(duì)小鼠單個(gè)四細(xì)胞期胚胎的卵裂球轉(zhuǎn)錄組進(jìn)行單細(xì)胞水平分析,其技術(shù)革新使全長(zhǎng)互補(bǔ)DNA序列(complementary DNA,cDNA)的捕獲率提高到64%,同時(shí)在cDNA擴(kuò)增時(shí)放寬對(duì)片段長(zhǎng)度的限制[4]。2011年由Cold Spring Harbor實(shí)驗(yàn)室和MD Anderson癌癥中心開(kāi)發(fā)并報(bào)道的一種腫瘤研究新方法SCS技術(shù),能夠?qū)σ粋€(gè)單細(xì)胞核中基因拷貝數(shù)目進(jìn)行準(zhǔn)確定量[5]。腫瘤細(xì)胞基因組部分被刪除或者擴(kuò)增,可以引起關(guān)鍵基因的缺失或者表達(dá)過(guò)量,繼而干擾正常細(xì)胞生長(zhǎng)。利用SCS技術(shù)能分析基因拷貝數(shù)目,從而進(jìn)一步了解惡性腫瘤的細(xì)胞生物學(xué)機(jī)制。同時(shí)該方法解決了傳統(tǒng)癌癥基因組研究的一系列問(wèn)題,如混合樣品測(cè)序無(wú)法判斷具體突變的來(lái)源及發(fā)生頻率;無(wú)法解釋腫瘤發(fā)生、發(fā)展以及演化過(guò)程中的細(xì)節(jié);難以辨別主動(dòng)突變或被動(dòng)突變;目的細(xì)胞系測(cè)序時(shí)無(wú)法排除體外培養(yǎng)所導(dǎo)致的新突變干擾等[5]。2013年,研究人員首次利用腫瘤病人單個(gè)外周血循環(huán)腫瘤細(xì)胞(circulation tumor cell,CTC)進(jìn)行全基因組、外顯子組測(cè)序,為無(wú)創(chuàng)腫瘤診斷和監(jiān)測(cè)提供了一種新的技術(shù)手段[6]。
單細(xì)胞測(cè)序主要包括單細(xì)胞基因組測(cè)序、轉(zhuǎn)錄組測(cè)序和表觀遺傳測(cè)序,這3種測(cè)序類(lèi)型各具特點(diǎn)和優(yōu)勢(shì),可以從不同角度揭示細(xì)胞各個(gè)階段的功能和特性。全基因組測(cè)序是對(duì)目的細(xì)胞的全部基因組序列進(jìn)行非選擇性、均勻擴(kuò)增,隨后利用外顯子捕獲技術(shù)進(jìn)而使用高通量測(cè)序的過(guò)程。轉(zhuǎn)錄組測(cè)序則是獲取特定器官或組織在某一狀態(tài)下的幾乎所有轉(zhuǎn)錄本,尤其適用于具有高度異質(zhì)性的干細(xì)胞及胚胎發(fā)育早期的細(xì)胞群體的研究。以NGS為基礎(chǔ)的各種表觀遺傳學(xué)測(cè)序可揭示基因調(diào)控的不同方面,包括DNA甲基化、組蛋白修飾、染色質(zhì)結(jié)合結(jié)構(gòu)和調(diào)節(jié)蛋白、染色體的空間結(jié)構(gòu)與空間相互作用形成轉(zhuǎn)錄復(fù)合物的組分[7-9]。表觀遺傳改變是可逆的,并決定基因表達(dá)和負(fù)責(zé)細(xì)胞的異質(zhì)性。
細(xì)胞測(cè)序主要涉及4大步驟,包括單細(xì)胞分離、核苷酸序列(DNA或RNA)擴(kuò)增、基因測(cè)序和數(shù)據(jù)分析。
3.1 單細(xì)胞分離
進(jìn)行單個(gè)細(xì)胞研究,首先要將目的細(xì)胞從生長(zhǎng)環(huán)境中完整分離。第一類(lèi)是基于細(xì)胞培養(yǎng)的分離法,此類(lèi)方法無(wú)需特殊設(shè)備、成本低廉,屬于非直觀下分離細(xì)胞。但存在操作耗時(shí)、低通量,易造成分離錯(cuò)誤或細(xì)胞丟失、不能靶向篩選細(xì)胞等弊端。第二類(lèi)則是基于儀器的分離法,儀器方法可到達(dá)更高的精確度和細(xì)胞獲取率,目前在科研和實(shí)際工作中普遍采用此類(lèi)方法進(jìn)行細(xì)胞分選。
我們對(duì)一些比較成熟的和新發(fā)展的儀器分離技術(shù)進(jìn)行介紹,并概述其優(yōu)點(diǎn)和局限性,實(shí)際工作中可根據(jù)具體的需求來(lái)選擇適合的方法進(jìn)行單細(xì)胞分離。顯微操作法是應(yīng)用較普遍的直視分選細(xì)胞技術(shù),成本較低。但受通量低、人力投入大、容易對(duì)目的細(xì)胞造成機(jī)械性損傷等因素的制約,不利于大規(guī)模應(yīng)用和商品化。另一個(gè)直視分離技術(shù)是激光捕獲顯微切割術(shù)(laser capture microdissec-tion,LCM)通過(guò)利用激光束使覆蓋于組織切片上的透明膜熔化,冷卻后目的細(xì)胞被固定于黏附膜上,從而實(shí)現(xiàn)細(xì)胞分離。該方法的優(yōu)勢(shì)在于能夠在顯微鏡下準(zhǔn)確而快速地獲取單一細(xì)胞亞群或者單個(gè)細(xì)胞,解決了組織中細(xì)胞異質(zhì)性的問(wèn)題。但是存在成本較高、通量低、不能自動(dòng)化的缺點(diǎn)。此外,LCM的技術(shù)缺陷還包括操作過(guò)程中細(xì)胞核容易被刨切而導(dǎo)致染色體片段丟失;精確度有限,切割過(guò)程中可能會(huì)摻入相鄰細(xì)胞的原生質(zhì)組分或損傷細(xì)胞核,而且其RNA多已降解,因此不適用于轉(zhuǎn)錄組學(xué)分析[10]。
目前單個(gè)腫瘤細(xì)胞分離通常是通過(guò)磁珠激活細(xì)胞分選(magnetic-activated cell sorting,MACS)或熒光激活細(xì)胞分選(fluorescence-activated cell sorting,F(xiàn)ACS)技術(shù)進(jìn)行。這兩種分離方法的成本較高,但是能滿(mǎn)足高通量、自動(dòng)化的要求。免疫磁珠分離法(immunomagnetic separation,IMS)屬于MACS技術(shù),即利用細(xì)胞表面抗原能與連接有磁珠的特異性單抗相結(jié)合。在外加磁場(chǎng)中,與磁珠相連的帶有表面抗原的細(xì)胞被吸附而滯留在磁場(chǎng)中,不能與磁珠連接的細(xì)胞不在磁場(chǎng)中停留,從而使目的細(xì)胞得以快速分離[11],但操作方法相對(duì)復(fù)雜。
熒光激活細(xì)胞分選技術(shù)是目前應(yīng)用最多的單細(xì)胞分離方法,可對(duì)單個(gè)細(xì)胞進(jìn)行高效和快速分離。FACS平臺(tái)通過(guò)依靠熒光標(biāo)記信號(hào)結(jié)合光散射分析參數(shù),對(duì)具有異質(zhì)性的腫瘤組織的單個(gè)細(xì)胞進(jìn)行挑選和分析。該法不僅具備高通量的優(yōu)勢(shì),而且可對(duì)具有不同表征(如大小、粒度、特異性抗原標(biāo)記、同位素標(biāo)記等)的靶細(xì)胞進(jìn)行識(shí)別和分離[12]。其最大的缺陷是分選時(shí)需要大量的細(xì)胞,因此在制備大量細(xì)胞懸液的過(guò)程中可能降低低豐度細(xì)胞的獲取率;同時(shí)FACS所檢測(cè)的熒光信號(hào)相對(duì)較低,部分低表達(dá)的標(biāo)記可能檢測(cè)困難,存在特定細(xì)胞類(lèi)型丟失的風(fēng)險(xiǎn);此外,細(xì)胞的高速流動(dòng)可能造成機(jī)械性損傷。
另一個(gè)新發(fā)展的微流控技術(shù)(microfluidics)則是通過(guò)人為控制流體流動(dòng)來(lái)實(shí)現(xiàn)在微尺度上對(duì)目的細(xì)胞進(jìn)行分離,主要利用流控通道具備的多種功能對(duì)細(xì)胞進(jìn)行分選,如通道本身具有可調(diào)節(jié)的直徑(10~100 μm)和多種功能性修飾(如捕獲分子、抗體、電極等)。同時(shí)微流控裝置的細(xì)胞污染率低,對(duì)樣本和試劑損耗少,并且在降低單細(xì)胞測(cè)序的噪聲以及提高基因組擴(kuò)增一致性方面具有優(yōu)勢(shì),已有相應(yīng)的商業(yè)化平臺(tái)在推廣應(yīng)用[13]。
3.2 核苷酸序列(DNA或RNA)擴(kuò)增
一個(gè)正常的二倍體人體細(xì)胞的DNA和RNA含量為匹克(picogram,pg)水平[14],因此SCS技術(shù)面臨的主要技術(shù)挑戰(zhàn)是單個(gè)細(xì)胞的DNA或RNA含量遠(yuǎn)遠(yuǎn)低于目前任一可用測(cè)序平臺(tái)的檢測(cè)閾值。為了克服這種局限性,必須對(duì)要檢測(cè)的單細(xì)胞中分離的核酸進(jìn)行放大。同時(shí)在建庫(kù)時(shí)的文庫(kù)分子僅有少量可在Floecell表面生成簇,并被測(cè)序檢測(cè)到,因此至少要有上萬(wàn)倍到幾十萬(wàn)倍的擴(kuò)增效率,才能保證大部分的片段可被檢測(cè)到,并且滿(mǎn)足覆蓋度高和低偏倚的要求。因此在測(cè)序之前,需要進(jìn)行全基因組核苷酸擴(kuò)增(genome-wide nucleotide amplification),包括全基因組擴(kuò)增(wholegenome amplification,WGA)和全轉(zhuǎn)錄組擴(kuò)增(whole-transcriptome amplification,WTA)。
3.2.1 全基因組擴(kuò)增(WGA)
其目標(biāo)是在沒(méi)有序列偏向性的前提下大幅增加DNA的總量。一些基于PCR的方法可用于WGA,主要包括:基于熱循環(huán)以PCR為基礎(chǔ)的擴(kuò)增技術(shù),如退行性寡核苷酸PCR(degenerative-oligonucleotide PCR,DOP-PCR);基于等溫反應(yīng)不以PCR為基礎(chǔ)的擴(kuò)增技術(shù),如多重置換擴(kuò)增法(multiple-displacement-amplification,MDA)以及基于多重退火環(huán)狀循環(huán)擴(kuò)增法(multiple annealing-and looping-based amplification cycles,MLBAC)。
DOP-PCR是SCS最初常用的技術(shù),由于會(huì)產(chǎn)生非特異擴(kuò)增且擴(kuò)增效率不高(15%),因而應(yīng)用受限[15]。MDA作為最常用的技術(shù)一直沿用至今,能對(duì)全基因組進(jìn)行高保真的均勻擴(kuò)增,擴(kuò)增出10~100 kb大小的片段,能提供大量均一完整的全基因組序列。主要依賴(lài)于兩種類(lèi)型的DNA聚合酶,包括phi29 DNA聚合酶和Bst大片段DNA聚合酶。不僅可以結(jié)合由單引物啟動(dòng)的滾環(huán)擴(kuò)增反應(yīng)所產(chǎn)生的串聯(lián)產(chǎn)物,也可以使新合成DNA片段位移替換之前的DNA片段,形成一種反復(fù)分支結(jié)構(gòu),進(jìn)而引起鏈位移擴(kuò)增出大段的DNA。MDA與基于PCR的傳統(tǒng)WGA方法相比,其優(yōu)勢(shì)包括Phi29DNA聚合酶具有在較低和恒定的溫度條件下催化DNA延伸反應(yīng)、可加工較長(zhǎng)擴(kuò)增產(chǎn)物和高效率擴(kuò)增的能力。MDA采用的是指數(shù)擴(kuò)增法,可以實(shí)現(xiàn)從單個(gè)細(xì)胞基因組或外顯子組中獲得較高的覆蓋度(>90%)。但是MDA也存在一些缺點(diǎn),特別是顯著的非特異性擴(kuò)增。另外就是全基因組覆蓋度不均勻;等位基因丟失率高(可高達(dá)65%);污染或干擾;隨機(jī)引物與模板結(jié)合能力差異導(dǎo)致的擴(kuò)增偏倚[16-17]。針對(duì)MDA潛在的污染問(wèn)題(包括外源性或交叉污染),目前主要采取的改進(jìn)措施是將熒光標(biāo)記(例如SYBR Green)摻入反應(yīng)體系中,以便對(duì)擴(kuò)增過(guò)程進(jìn)行可視化的熒光監(jiān)測(cè)。該技術(shù)已成功應(yīng)用于腫瘤單細(xì)胞測(cè)序[16-18];另一項(xiàng)極具創(chuàng)新性的技術(shù)MALBAC是由哈佛大學(xué)謝曉亮團(tuán)隊(duì)研發(fā)[3,19]。與以前的技術(shù)相比,MALBAC的最大優(yōu)勢(shì)是采用線性擴(kuò)增方式。其核心技術(shù)在于通過(guò)五輪MDA預(yù)擴(kuò)增得到完整擴(kuò)增產(chǎn)物;增加退火步驟達(dá)到鏈內(nèi)雜交自我鎖定,形成閉合的環(huán)狀分子,避免指數(shù)擴(kuò)增;再通過(guò)常規(guī)PCR進(jìn)行擴(kuò)增。由于此時(shí)的模板更加均一,則可達(dá)到低偏倚的目的。MALBAC技術(shù)將單細(xì)胞全基因組測(cè)序的精確度大幅度提高,以至于能夠發(fā)現(xiàn)個(gè)別細(xì)胞之間的遺傳差異。在25×測(cè)序深度下,MALBAC的覆蓋度可達(dá)93%,而MDA覆蓋度為73%,因此其在WGA中顯示出擴(kuò)增一致性好、偏倚少、效率高的特點(diǎn)。另外,MALBAC對(duì)單核苷酸多態(tài)性(single nucleotide polymorphisms,SNPs)等位基因檢出率高(可達(dá)70%),能精確地檢測(cè)拷貝數(shù)變異(copy number variations,CNVs)、單核苷酸變異(single nucleotide variations,SNVs)、插入/缺失(insertions and deletions,INDELs)變異等。其缺點(diǎn)則是可能出現(xiàn)較高的假陽(yáng)性率[20]。MDA和MALBAC技術(shù)各有特點(diǎn),MDA擴(kuò)增效率更高,實(shí)驗(yàn)方法簡(jiǎn)單,而MALBAC則擴(kuò)增均一性更好,但擴(kuò)增DNA的量相對(duì)較少,即擴(kuò)增效率相對(duì)較低。
3.2.2 全轉(zhuǎn)錄組擴(kuò)增(WTA)
多聚腺苷酸化mRNA在WTA初始階段反轉(zhuǎn)錄,以O(shè)ligo-dT引物連接到一個(gè)接頭序列去進(jìn)行選擇性擴(kuò)增。通過(guò)Oligo-dT錨定法和模板轉(zhuǎn)換法產(chǎn)生cDNA為下一步測(cè)序做準(zhǔn)備。目前采用的WTA主要基于傳統(tǒng)PCR、改良PCR(modified PCR)、體外轉(zhuǎn)錄(in vitro transcription,IVT)以及Phi29 DNA聚合酶介導(dǎo)的RNA擴(kuò)增方法[21-22]。
3.3 基因測(cè)序數(shù)據(jù)的生物信息分析
對(duì)高通量數(shù)據(jù)的精準(zhǔn)解讀是基因測(cè)序和精準(zhǔn)醫(yī)療的關(guān)鍵。單細(xì)胞數(shù)據(jù)分析的基本流程與傳統(tǒng)序列分析相似,數(shù)據(jù)分析前首先要移除接頭序列(adapter)、連接序列(linker)、標(biāo)簽序列(barcodes)、低質(zhì)量堿基和污染DNA。然而兩者間具有顯著差異,傳統(tǒng)拼接方法是建立在一定的假設(shè)之上,如嵌合序列比例較少,讀取深度隨基因組呈泊松分布等。而單細(xì)胞數(shù)據(jù)由于表現(xiàn)出不均勻的覆蓋度和高比例的嵌合序列,則需要采用不同的分析方法進(jìn)行數(shù)據(jù)預(yù)處理。一種方法是通過(guò)實(shí)驗(yàn)方法或計(jì)算機(jī)算法將核酸文庫(kù)“標(biāo)準(zhǔn)化”,以降低擴(kuò)增偏倚性;另外一種方法是將親緣關(guān)系很近的單細(xì)胞測(cè)序數(shù)據(jù)進(jìn)行混合分析。從偏倚性的角度來(lái)看,混合分析可以顯著地提高樣品的平均覆蓋度。同時(shí)生物信息學(xué)分析軟件也為數(shù)據(jù)分析提供了極大的便利,如SmashCell、Velvet-SC和SPAdes軟件等都能在一定程度上克服單細(xì)胞數(shù)據(jù)覆蓋度不均的問(wèn)題,高效地完成序列拼接與測(cè)序數(shù)據(jù)分析[23]。
迄今為止使用的測(cè)序材料無(wú)一例外都是數(shù)百萬(wàn)甚至更多細(xì)胞的混合DNA樣本。因此測(cè)序結(jié)果通常表現(xiàn)出這些細(xì)胞“整體”表征,是一群細(xì)胞中信號(hào)的平均值,或者只代表其中占優(yōu)勢(shì)數(shù)量的細(xì)胞信息。然而,由于細(xì)胞異質(zhì)性的存在,表型相同的細(xì)胞遺傳信息可能存在顯著差異。很多低豐度的信息,如只存在于少數(shù)細(xì)胞(如早期癌細(xì)胞)中的突變,將會(huì)在“整體”表征的平均化過(guò)程中稀釋或丟失[24]。與傳統(tǒng)的全基因組測(cè)序相比,SCS不僅測(cè)量基因表達(dá)水平更加精確,而且還能檢測(cè)到微量的基因表達(dá)或罕見(jiàn)非編碼RNA,其優(yōu)勢(shì)是全方位和多層次的。因此利用SCS技術(shù)深入地研究惡性腫瘤,可發(fā)現(xiàn)導(dǎo)致惡性腫瘤發(fā)生和演變的各種基因變異、腫瘤異質(zhì)性、耐藥性等,從而幫助我們?cè)趥€(gè)體水平上認(rèn)識(shí)惡性腫瘤的發(fā)生、發(fā)展及進(jìn)化。
5.1 SCS技術(shù)與腫瘤相關(guān)基因變異的檢測(cè)
腫瘤的發(fā)生是一個(gè)多基因異常表現(xiàn)的疾病過(guò)程,最終導(dǎo)致一個(gè)正常的細(xì)胞表型轉(zhuǎn)變?yōu)橐环N異常的細(xì)胞表型,即腫瘤細(xì)胞。識(shí)別具有不同遺傳變異性的腫瘤類(lèi)型和不同的腫瘤分期(即腫瘤發(fā)生、轉(zhuǎn)移、化療抵抗),有助于我們更好地理解腫瘤的發(fā)展和演化的機(jī)制以及為腫瘤的預(yù)防與治療提供新策略和分子靶點(diǎn)[25]。
轉(zhuǎn)錄組和表觀基因組測(cè)序數(shù)據(jù)對(duì)于腫瘤相關(guān)畸變的發(fā)現(xiàn)也很重要,例如,結(jié)直腸癌CTCs的轉(zhuǎn)錄組分析表明,由于腫瘤相關(guān)的轉(zhuǎn)錄下調(diào)與發(fā)揮“stemness”作用的基因(如CD166和CD26)具有相關(guān)性,CTCs可能代表一種休眠狀態(tài)。此外,結(jié)直腸癌CTCs的基因組分析發(fā)現(xiàn),一些在腫瘤細(xì)胞中低表達(dá)的基因往往在調(diào)控細(xì)胞間接觸(cellcell contact)和動(dòng)力方面起作用,而高表達(dá)的基因如CD47可協(xié)助腫瘤細(xì)胞逃避免疫殺傷[26]。一些基因組分析還發(fā)現(xiàn)在正常細(xì)胞功能中發(fā)揮重要作用的基因,如Septin 9(SEPT9)、POU4F1和核仁蛋白4(nucleolar protein 4,NOL4)等存在腫瘤表觀遺傳修飾成分,如CpG島甲基化譜的改變[27-28]。
5.2 SCS技術(shù)與腫瘤細(xì)胞譜系樹(shù)的重建
腫瘤的演化通常涉及遺傳變異的積累,可以擾亂正常細(xì)胞的功能并促進(jìn)正常表型向腫瘤表型轉(zhuǎn)化[29]。獲取這些遺傳變異信息,包括時(shí)間和空間表達(dá)方面的數(shù)據(jù),將可以重建腫瘤細(xì)胞譜系樹(shù)。以此用于分析腫瘤演化的過(guò)程并且為疾病的診斷和治療提供新的見(jiàn)解。目前通過(guò)利用SCS平臺(tái)以及其他測(cè)序數(shù)據(jù),已經(jīng)開(kāi)發(fā)了各種模型來(lái)構(gòu)建腫瘤細(xì)胞譜系樹(shù)。但是,這種生物信息學(xué)方法受到現(xiàn)有的SCS技術(shù)精確度的局限,包括現(xiàn)用的測(cè)序數(shù)據(jù)運(yùn)算方法以及測(cè)序過(guò)程中產(chǎn)生的高錯(cuò)誤率[30]。
5.3 SCS技術(shù)與腫瘤的診斷和治療
在腫瘤發(fā)生發(fā)展過(guò)程中積累的遺傳變異也可以影響腫瘤細(xì)胞對(duì)治療的反應(yīng)。SCS技術(shù)可以識(shí)別腫瘤診斷和個(gè)性化治療相關(guān)的標(biāo)志物[31-32]。各種腫瘤相關(guān)的基因突變已在臨床應(yīng)用,并作為特定類(lèi)型腫瘤診斷的生物標(biāo)志物,包括黑色素瘤BRAF基因突變、結(jié)腸癌的KRAS基因突變、非小細(xì)胞肺癌的EGFR基因突變[32]。但是,這些生物標(biāo)志物僅僅用于提示存在發(fā)生相關(guān)腫瘤的風(fēng)險(xiǎn),對(duì)于明確診斷則需要建立更詳細(xì)和全面的分析。因?yàn)槠駷橹股袥](méi)有發(fā)現(xiàn)某個(gè)單一突變與某個(gè)特定的腫瘤類(lèi)型、發(fā)展階段或者預(yù)后存在絕對(duì)的關(guān)聯(lián)。例如,已在許多宮頸癌患者中觀察到NOL4基因和脂肪瘤HMGIC融合伴侶蛋白4(lipoma HMGIC fusion partner-like protein 4,LHFPL4)基因存在高頻甲基化[33],但是仍有少數(shù)患者是沒(méi)有檢測(cè)到甲基化修飾的,如果僅依靠這些標(biāo)記做為診斷依據(jù)就會(huì)導(dǎo)致漏診。
此外,我們除了關(guān)注SCS技術(shù)為精確診斷帶來(lái)的益處,還關(guān)注它在精準(zhǔn)治療中的重要作用。SCS技術(shù)可以為靶向藥物的選擇提供參考。從理論上說(shuō),修復(fù)腫瘤相關(guān)的遺傳變異可以使腫瘤表型重新恢復(fù)成正常表型。多數(shù)靶向藥物可以抑制異?;虻墓δ?,因此可能給個(gè)體化腫瘤治療帶來(lái)益處。如,治療惡性血液病的組蛋白去乙酰化酶抑制劑、治療黑色素瘤的BRAF抑制劑以及治療乳腺癌的PARP抑制劑等[32]。但由于腫瘤異質(zhì)性的問(wèn)題,不同靶向藥物針對(duì)的腫瘤類(lèi)型不同,甚至相同的腫瘤類(lèi)型的靶向藥物也不盡相同。而且在治療中可能產(chǎn)生原靶向位點(diǎn)產(chǎn)生耐藥性或出現(xiàn)新變異的問(wèn)題。因此,基于精準(zhǔn)檢測(cè)下的靶向藥物選擇可以為患者帶來(lái)最大益處,體現(xiàn)個(gè)性化治療的價(jià)值[34]。
通過(guò)SCS技術(shù)可以揭開(kāi)不同的腫瘤類(lèi)型和階段的遺傳變異的差異,有助于制定個(gè)性化治療方案和及時(shí)調(diào)整治療策略。NUC-Seq是一種可以基本實(shí)現(xiàn)對(duì)單個(gè)細(xì)胞完整基因組進(jìn)行完全測(cè)序的新的測(cè)序方法[35]。當(dāng)細(xì)胞準(zhǔn)備分裂時(shí),細(xì)胞核內(nèi)DNA會(huì)進(jìn)行復(fù)制。通過(guò)篩選從而僅僅對(duì)新生的“雙”核進(jìn)行測(cè)序。NUC-Seq可以利用此類(lèi)復(fù)制,獲得比之前大部分的測(cè)序技術(shù)更低的測(cè)序錯(cuò)誤率,可以將腫瘤的基因組異質(zhì)性檢測(cè)出來(lái)。研究人員運(yùn)用NUC-Seq技術(shù)對(duì)乳腺癌患者進(jìn)行單細(xì)胞基因組測(cè)序時(shí)發(fā)現(xiàn),不同亞型的乳腺癌存在遺傳變異的差異。在腫瘤進(jìn)化中,三陰乳腺癌患者的腫瘤細(xì)胞變異率較高,而雌激素受體(ER)陽(yáng)性患者的變異則相對(duì)穩(wěn)定,因此ER陽(yáng)性患者的治療效果相對(duì)較好[36]。研究還發(fā)現(xiàn)基因重組等結(jié)構(gòu)改變主要出現(xiàn)在乳腺癌早期且保持相對(duì)穩(wěn)定的狀態(tài),而點(diǎn)突變則伴隨整個(gè)腫瘤進(jìn)化過(guò)程并導(dǎo)致大量基因多樣性出現(xiàn)[35,36]。
5.4 SCS技術(shù)與外周血單個(gè)CTC在預(yù)測(cè)腫瘤轉(zhuǎn)移和進(jìn)展中的應(yīng)用
SCS技術(shù)除了在腫瘤組織的檢測(cè)上具有優(yōu)勢(shì),還在CTCs研究方面顯示出重要作用。CTCs是指由實(shí)體瘤病灶(原發(fā)灶或轉(zhuǎn)移灶)釋放進(jìn)入外周血循環(huán)的腫瘤細(xì)胞,在外周血中檢測(cè)到腫瘤細(xì)胞提示腫瘤遠(yuǎn)處轉(zhuǎn)移的可能性[36]。但腫瘤患者血液中腫瘤細(xì)胞數(shù)量很少,傳統(tǒng)研究往往需要建立在大量細(xì)胞的基礎(chǔ)上才能進(jìn)行。CTCs的全基因組測(cè)序可作為腫瘤診斷和評(píng)估預(yù)后的一種非侵入性的方法[37];WGA及全基因組測(cè)序技術(shù)可對(duì)原發(fā)性腫瘤、CTCs、轉(zhuǎn)移性腫瘤細(xì)胞進(jìn)行分離,并揭示細(xì)胞之間基因組的聯(lián)系。與腫瘤組織相比,血液樣本易于獲取、創(chuàng)傷性小、可反復(fù)采集,因此可作為腫瘤“液體活檢”樣本。
全基因組轉(zhuǎn)錄水平的單細(xì)胞RNA測(cè)序方法(single-cell RNA sequencing,Smart Seq)已應(yīng)用于單個(gè)黑色素瘤細(xì)胞的不同的基因表達(dá)方式的分析,促進(jìn)CTCs基因生物標(biāo)志物的鑒定[38]。采用靶DNA測(cè)序(targeted DNA sequencing)方法觀察到結(jié)腸癌的原發(fā)性腫瘤細(xì)胞和CTCs中存在不少類(lèi)似的驅(qū)動(dòng)突變,這表明CTCs的基因組分析可以代表腫瘤進(jìn)化的突變方式[39]。而運(yùn)用MABLC技術(shù)對(duì)肺腺癌和小細(xì)胞肺癌患者的單個(gè)CTC進(jìn)行WGA和深度測(cè)序,檢出特征性的與腫瘤相關(guān)的SNVs和INDELs等變異[6]。同一患者的不同CTCs的全基因組CNV具有高度一致性,且與其轉(zhuǎn)移瘤的CNV一致,提示CNV與腫瘤的轉(zhuǎn)移密切相關(guān);在不同的肺腺癌患者中CTCs的CNV具有高度的相似性,說(shuō)明特定的CNV與腫瘤的形成與轉(zhuǎn)移有關(guān)。此外,小細(xì)胞肺癌患者與肺腺癌患者之間的CNV明顯不同,提示不同的腫瘤來(lái)源是不同的變異造成的。另外,在肺腺癌患者的肝臟轉(zhuǎn)移灶中觀察到腫瘤表型轉(zhuǎn)變?yōu)樾〖?xì)胞肺癌,以此為依據(jù)采用標(biāo)準(zhǔn)化的小細(xì)胞肺癌方案療效顯著,這提示治療方案可基于CTCs中CNV的改變而調(diào)整。在治療過(guò)程中,還觀察到CTCs中的SNVs/INDELs會(huì)改變,而CNV模式保持相對(duì)穩(wěn)定[6]。因此,SCS技術(shù)可以為腫瘤診斷和治療以及預(yù)后觀察提供分子層面相對(duì)明確的數(shù)據(jù)信息。
單細(xì)胞測(cè)序技術(shù)提供了一個(gè)前所未有的腫瘤研究方法,允許對(duì)存在異質(zhì)性的腫瘤細(xì)胞群之間的進(jìn)行單細(xì)胞水平分析。單細(xì)胞測(cè)序數(shù)據(jù)將提高我們對(duì)腫瘤發(fā)病機(jī)制的認(rèn)識(shí),并改進(jìn)診斷和治療的方法。此外,單細(xì)胞測(cè)序所需試劑、設(shè)備和生物信息學(xué)算法等,均在不斷完善,使得SCS平臺(tái)的力量和功能逐漸增強(qiáng)。改進(jìn)的SCS技術(shù)將減少甚至消除這些挑戰(zhàn)從而獲得更精確的測(cè)序數(shù)據(jù),測(cè)序數(shù)據(jù)與病理特征之間的關(guān)系將更加明確。
目前單細(xì)胞測(cè)序技術(shù)還在發(fā)展階段,而且因?yàn)槠渖婕暗絅GS技術(shù),故有些技術(shù)問(wèn)題仍需解決:①目標(biāo)細(xì)胞的提取問(wèn)題:要能夠準(zhǔn)確篩選目標(biāo)細(xì)胞,如正常細(xì)胞或腫瘤細(xì)胞不被周?chē)?xì)胞污染;②擴(kuò)增失敗和等位基因脫扣;③PCR產(chǎn)生的非特異產(chǎn)物問(wèn)題;④NGS的重復(fù)性問(wèn)題等。此外,雖然基因組測(cè)序的成本一直在不斷下降,但是單個(gè)細(xì)胞基因組測(cè)序以及由此對(duì)復(fù)雜生物信息進(jìn)行分析的成本依然是驚人的。同時(shí),對(duì)個(gè)體細(xì)胞進(jìn)行分析的新技術(shù)不斷涌現(xiàn),但技術(shù)缺陷仍然存在。例如,MALBAC等所得到的檢測(cè)結(jié)果的可信度有多高(假陽(yáng)性率高)。例如,由于染色體數(shù)目異常導(dǎo)致很多腫瘤細(xì)胞是非整倍體細(xì)胞,而NUC-Seq技術(shù)可能只局限用于檢測(cè)不含非整倍體細(xì)胞的腫瘤。
在研究腫瘤發(fā)生發(fā)展的道路上,單個(gè)細(xì)胞測(cè)序技術(shù)的出現(xiàn)無(wú)疑是一個(gè)里程碑。借助這一技術(shù),我們可以對(duì)不同患者的腫瘤細(xì)胞基因組進(jìn)行比較,或者對(duì)同一患者在解剖學(xué)上相互獨(dú)立的器官、組織的腫瘤細(xì)胞進(jìn)行比較,甚至可以比較同一腫瘤組織內(nèi)的個(gè)體細(xì)胞間的差異,不斷揭示腫瘤發(fā)展過(guò)程中的基因變異及其變異率、追溯關(guān)鍵基因的克隆起源、腫瘤各亞型之間的基因序列差異、不同級(jí)別或不同類(lèi)別的腫瘤細(xì)胞之間的差異、某種基因在不同腫瘤中的不同地位、對(duì)表觀遺傳學(xué)的影響以及長(zhǎng)期難以攻破的腫瘤異質(zhì)性和出現(xiàn)藥物抗性等問(wèn)題。隨著測(cè)序技術(shù)的不斷發(fā)展,測(cè)序技術(shù)成本的降低,測(cè)序人群數(shù)量的不斷上升,我們可逐步從“單個(gè)細(xì)胞”全面認(rèn)識(shí)腫瘤“整體”,以完善腫瘤診療體系,進(jìn)而從個(gè)體水平實(shí)現(xiàn)有效的靶向治療。
[1] Lipinski KA,Barber LJ,Davies MN,et al.Cancer evolution and the limits of predictability in precision cancer medicine[J].Trends Cancer,2016,2(1):49-63.
[2] Eberwine J,Sul JY,Bartfai T,et al.The promise of single-cell sequencing[J].Nat Methods,2014,11 (1):25-27.
[3] Zong C,Lu S,Chapman AR,et al.Genome-wide detection of single-nucleotide and copy-number variations of a single human cell[J].Science,2012,338 (6114):1622-1626.
[4] Tang F,Barbacioru C,Wang Y,et al.mRNA-Seq whole-transcriptome analysis of a single cell[J].Nat Methods,2009,6(5):377-382.
[5] NavinN,Kendall J,Troge J,et al.Tumour evolution inferred by single-cell sequencing[J].Nature,2011,472(7341):90-94.
[6] Ni X,Zhuo M,Su Z,et al.Reproducible copy number variation patterns among single circulating tumor cells of lung cancer patients[J].Proc Natl AcadSci USA,2013,110(52):21083-21088.
[7] Zhang X,Marjani SL,Hu Z,et al.Single-cell sequencing for precise cancer research:progress and prospects[J].Cancer Res,2016,76(6):1305-1312.
[8] Guo H,Zhu P,Guo F,et al.Profiling DNA methylome landscapes of mammalian cells with single-cell reduced-representation bisulfite sequencing[J].Nat Protoc,2015,10(5):645-659.
[9] Buenrostro JD,Wu B,Litzenburger UM,et al.Singlecell chromatin accessibility reveals principles of regulatory variation[J].Nature,2015,523(7561):486-490.
[10] Shapiro E,Biezuner T,Linnarsson S.Single-cell sequencing-based technologies will revolutionize wholeorganism science[J].Nat Rev Genet,2013,14(9):618-630.
[11] Sethsmith HM,Harris SR,Scott P,et al.Generating whole bacterial genome sequences of low-abundance species from complex samples with IMS-MDA[J]. Nat Protoc,2013,8(12):2404-2412.
[12] Galler K,Br?utigam K,Gro?e C,et al.Making a big thing of a small cell-recent advances in single cell analysis[J].Analyst,2014,139(6):1237-1273.
[13] Bose S,Wan Z,Carr A,et al.Scalable microfluidics for single-cell RNA printing and sequencing[J].Genome Biol,2015,16:120.
[14] Yong W,Navin NE.Advances and applications of single-cell sequencing technologies[J].Mol Cell,2015,58(4):598-609.
[15] Huang L,Ma F,Chapman A,et al.Single-cell wholegenome amplification and sequencing:methodology and applications[J].Annu Rev Genomics Hum Genet,2015,16:79-102.
[16] Hou Y,Song L,Zhu P,et al.Single-cell exome sequencing and monoclonal evolution of a JAK2-Negative myeloproliferative neoplasm[J].Cell,2012,148 (5):873-885.
[17] Xu X,Hou Y,Yin X,et al.Single-cell exome sequencing reveals single-nucleotide mutation characteristics of a kidney tumor[J].Cell,2012,148(5):886-895.
[18] Yu C,Yu J,Yao X,et al.Discovery of biclonal origin and a novel oncogene SLC12A5 in colon cancer by single-cell sequencing[J].Cell Res,2014,24(6):701-712.
[19] Chen M,Song P,Zou D,et al.Comparison of multiple displacement amplification(MDA)and multiple annealing and looping-based amplification cycles (MALBAC)in single-cell sequencing[J].PloS One,2014,9(12):e114520.
[20] Lovett M.The applications of single-cell genomics [J].Hum Mol Genet,2013,22(1):22-26.
[21] Macaulay IC,Voet T.Single Cell genomics:advances and future perspectives[J].PLoS Genet,2014,10 (1):e1004126.
[22] Kolodziejczyk A,Kim JK,Svensson V,et al.The technology and biology of single-cell RNA sequencing [J].Mol Cell,2015,58(4):610-620.
[23] Olson ND,Lund SP,Colman RE,et al.Best practices for evaluating single nucleotide variant calling methods for microbial genomics[J].Front Genet,2015,6:235.
[24] Shirai M,Taniguchi T,Kambara H.Emerging applications of single-cell diagnostics[J].Top CurrChem,2014,336:99-116.
[25] Wang K,Kan J,Yuen ST,et al.Exome sequencing identifies frequent mutation of ARID1A in molecular subtypes of gastric cancer[J].Nat Genet,2011,43 (12):1219-1223.
[26] Steinert G,Sch?lch S,Niemietz T,et al.Immune escape and survival mechanisms in circulating tumor cells of colorectal cancer[J].Cancer Res,2014,74 (6):1694-1704.
[27] Gao F,Ji G,Gao Z,et al.Direct ChIP-bisulfite sequencing reveals a role of H3K27me3 mediating aberrant hypermethylation of promoter CpG islands in cancer cells[J].Genomics,2014,103(2-3):204-210.
[28] Wasserkort R,Kalmar A,Valcz G,et al.Aberrant septin 9 DNA methylation in colorectal cancer is restricted to a single CpG island[J].BMC Cancer,2013,13(1):1-11.
[29] Newburger DE,Kashefhaghighi D,Weng Z,et al. Genome evolution during progression to breast cancer [J].Genome Res,2013,23(7):1097-1108.
[30] Kim KI,Simon R.Using single cell sequencing data to model the evolutionary history of a tumor[J].BMC Bioinformatics,2014,15(1):1-13.
[31] M?bert K,Cojoc M,Peitzsch C,et al.Cancer biomarker discovery:current status and future perspectives[J].Int J RadiatBiol,2014,90(8):659-677.
[32] Normanno N,Rachiglio AM,Roma C,et al.Molecular diagnostics and personalized medicine in oncology:challenges and opportunities[J].J Cell Biochem,2013,114(3):514-524.
[33] Murphy PJ,Cipriany BR,Wallin CB,et al.Singlemolecule analysis of combinatorial epigenomic states in normal and tumor cells[J].Proc Natl AcadSci USA,2013,110(19):7772-7777.
[34] Prahallad A,Sun C,Huang S,et al.Unresponsiveness of colon cancer to BRAF(V600E)inhibition through feedback activation of EGFR[J].Nature,2012,483(7387):100-103.
[35] Wang Y,Waters J,Leung ML,et al.Clonal evolution in breast cancer revealed by single nucleus genome sequencing[J].Nature,2014,512(7513):155-160.
[36] Massagué J,Obenauf AC.Metastatic colonization by circulating tumour cells[J].Nature,2016,529(7586):298-306.
[37] Morimoto A,Mogami T,Watanabe M,et al.Highdensity dielectrophoretic microwell array for detection,capture,and single-cell analysis of rare tumor cells in peripheral blood[J].PloS One,2014,10(6):e0130418.
[38] Ramsk?ld D,Luo S,Wang YC,et al.Full-length mRNA-Seq from single-cell levels of RNA and individual circulating tumor cells[J].Nat Biotechnol,2012,30(8):777-782.
[39] Heitzer E,Auer M,Gasch C,et al.Complex tumor genomes inferred from single circulating tumor cells by array-CGH and next-generation sequencing[J].Cancer Res,2013,73(10):2965-2975.
Single-cell sequencing technology and its application in cancer research and clinical diagnosis
ZHOU Ying1,HUANG Huayi1,2★
(1.Department of Laboratory Medicine,The People's Hospital of Guangxi Autonomous Region,Nanning,Guangxi Autonomous Region,China,530021;2.Department of Surgical Oncology,Roswell Park Cancer Institute,Buffalo,New York,USA,14263)
The heterogeneity of tumors is an important feature of cancer.Tumor cells that lack homogeneity increase the difficulty of targeting therapeutics.Therefore,identifying tumor heterogeneity is an important task.The single-cell sequencing(SCS)technology utilizes next generation sequencing methodology to examine the genomic sequence of a single cell,and obtain the variability of genetic and protein information among tumor cells,allowing for a better understanding of the cellular function and the surrounding microenvironment.By sequencing the whole genome,transcriptome,and epigenetic genes of a single cell,the complex mechanisms of heterogeneity in tumors can be uncovered,thus improving cancer diagnosis and prognosis prediction,as well as monitoring of therapeutic response.Here,we have summarized the advancement of SCS technology,the principle and procedures of its analysis,the shortcomings of the technology,and its usage in cancer research and potential application value in clinical diagnosis.
Single-cell sequencing;Next generation sequencing;Genome;Tumor;Heterogeneity
1.廣西壯族自治區(qū)人民醫(yī)院檢驗(yàn)科,廣西,南寧530021
2.美國(guó)羅斯威爾帕克癌癥研究所腫瘤外科,美國(guó),紐約,布法羅14263
★通訊作者:黃華藝,E-mail:Huayi.Huang@Roswellpark.org