朱琳,林穎,朱玉青,黃明濤,梁棟,胡平,許爭(zhēng)峰,張軍(.南京醫(yī)科大學(xué)生殖醫(yī)學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室,南京 66;.南京醫(yī)科大學(xué)附屬婦產(chǎn)醫(yī)院&南京市婦幼保健院產(chǎn)前診斷中心,南京 0004)
線粒體攜帶一套母系遺傳的且獨(dú)立于核基因組的線粒體基因組(mtDNA)。由于mtDNA相較于核基因組更易突變[1],且以多拷貝的形式存在于線粒體基因組中,因此其突變往往具有異質(zhì)性,即突變型和野生型mtDNA共存[2]。針對(duì)異質(zhì)性變異,突變型mtDNA占mtDNA總量的比例被稱為異質(zhì)度,致病性變異的不同異質(zhì)度水平往往與線粒體疾病的臨床表型相關(guān)[3],因此高靈敏度、高特異性地檢測(cè)mtDNA變異,尤其是異質(zhì)性變異,在臨床和實(shí)驗(yàn)研究中極為重要。在前期研究中,本課題組開發(fā)了一套基于線粒體分離純化的新型mtDNA深度測(cè)序方法,可實(shí)現(xiàn)PCR非依賴性的全線粒體基因組深度測(cè)序。然而,該方法針對(duì)人類外周血樣本的檢測(cè)性能尚未與目前主流的基于長(zhǎng)片段PCR(lrPCR)的mtDNA深度測(cè)序方法相比較。為此,本研究旨在對(duì)10例孕婦外周血樣本采用兩種方法進(jìn)行平行試驗(yàn),通過分析比較所得測(cè)序結(jié)果,評(píng)估新方法的可靠性。
1.1研究對(duì)象 選取2022年1月至8月于南京市婦幼保健院產(chǎn)前診斷中心進(jìn)行無(wú)創(chuàng)產(chǎn)前篩查的10例孕婦,孕周16~18周,年齡26~37歲,中位年齡32歲。本研究經(jīng)南京市婦幼保健院醫(yī)學(xué)倫理委員會(huì)批準(zhǔn)(倫理審批號(hào)2021KY-130),所有研究對(duì)象均簽署知情同意書。
1.2儀器及試劑 Lymphoprep淋巴細(xì)胞分離液、SepMate離心管(加拿大Stemcell公司),RSB裂解液[500 μL 10 mmol/L Tris-HCl(pH調(diào)至7.4),150 μL 3 mmol/L MgCl2,100 μL 10 mmol/L NaCl,加水定容至50 mL],NP40及RSB裂解液(美國(guó)Sigma-Aldrich公司),ExoV核酸外切酶(英國(guó)NEB公司),2×TD 緩沖液[2 mL 20 mmol/L Tris-HCl(pH調(diào)至7.6),20 mL 20%DMF(二甲基甲酰胺),1 mL 10 mmol/L MgCl2,加水定容至100 mL],DNA純化試劑盒(美國(guó)Zymo公司),PCR高保真酶試劑盒、DNA回收試劑盒、Tn5轉(zhuǎn)座酶試劑盒、TruePrep文庫(kù)構(gòu)建試劑盒(南京諾唯贊公司)。AMPure XP磁珠(德國(guó)Beckman公司),Qubit 3.0熒光計(jì)(美國(guó)Invitrogen公司),核酸自動(dòng)提取儀、核酸提取純化試劑(廈門芮寶生物醫(yī)藥公司), Illumina NovaSeq 6000測(cè)序儀(美國(guó)Illumina公司)。
1.3基于線粒體分離純化的mtDNA深度測(cè)序 采集孕婦新鮮靜脈血1 mL(無(wú)須空腹),室溫保存于EDTA抗凝采血管中,按照Lymphoprep淋巴細(xì)胞分離液和SepMate離心管說明書操作分離外周血單個(gè)核細(xì)胞,加入15 μL含1% NP40的RSB裂解液輕輕吹打混勻,冰上裂解3 min,4 ℃、12 000×g離心5 min,吸取9.5 μL上清,加入1 μL ExoⅤ去除殘留核基因,37 ℃反應(yīng)30 min, 70 ℃反應(yīng)30 min滅活ExoⅤ,得到純化的mtDNA。向其中加入12.4 μL 2×TD 緩沖液和0.5 μL TTE Mix V50混勻,37 ℃溫育30 min并純化,獲得片段化的mtDNA。根據(jù)TruePrep文庫(kù)構(gòu)建試劑盒說明書進(jìn)行PCR反應(yīng)加接頭引物構(gòu)建測(cè)序文庫(kù),PCR體系為20 μL,包括純化后的mtDNA 6 μL,上、下游接頭引物各2 μL,5×TAB 5 μL,TAE 0.5 μL,加ddH2O補(bǔ)足至20 μL。PCR循環(huán)參數(shù):98 ℃預(yù)變性30 s;98 ℃變性10 s,63 ℃退火30 s,72 ℃延伸1 min,循環(huán)18次;4 ℃保存。對(duì)所得文庫(kù)進(jìn)行0.5×/0.3×雙輪磁珠分選。Qubit 3.0熒光計(jì)定量檢測(cè)文庫(kù)濃度,文庫(kù)濃度大于1 ng/μL為合格,合格文庫(kù)在Illumina NovaSeq 6000測(cè)序儀上進(jìn)行高通量測(cè)序。
1.4基于長(zhǎng)片段PCR的mtDNA深度測(cè)序 根據(jù)核酸提取純化試劑盒說明書提取全血DNA,以50 ng全基因組DNA為模板,使用兩對(duì)引物將mtDNA全長(zhǎng)序列分為2個(gè)約為8 500 bp 的片段分別擴(kuò)增,引物序列見表1,引物序列參考相關(guān)文獻(xiàn)[4],由上海生工公司合成。反應(yīng)參數(shù):95 ℃預(yù)變性30 s;95 ℃變性15 s,60 ℃退火15 s,72 ℃延伸8 min,循環(huán)25次;72 ℃延伸5 min;4 ℃保存。PCR產(chǎn)物于20 g/L瓊脂糖凝膠中進(jìn)行凝膠電泳并切膠回收,采用Qubit 3.0熒光計(jì)對(duì)其濃度進(jìn)行定量,將2個(gè)片段各吸取5 ng進(jìn)行等摩爾量混合,向其中加入2 μL 5×TTBL和1 μL TTE Mix V50,55 ℃反應(yīng)10 min進(jìn)行片段化,并進(jìn)行第一輪1×磁珠回收。根據(jù)TruePrep文庫(kù)構(gòu)建試劑盒說明書進(jìn)行PCR反應(yīng)構(gòu)建測(cè)序文庫(kù),PCR體系為20 μL,包括回收產(chǎn)物8 μL,上、下游接頭引物各2 μL,5×TAB 4 μL,TAE 0.4 μL,加入ddH2O補(bǔ)足至20 μL。PCR循環(huán)參數(shù):98 ℃預(yù)變性30 s;98 ℃變性15 s,63 ℃退火30 s,72 ℃延伸1 min,循環(huán)6次;4 ℃保存。對(duì)所得文庫(kù)進(jìn)行第二輪0.5×/0.3×雙輪磁珠分選。采用Qubit 3.0熒光計(jì)定量檢測(cè)文庫(kù)濃度,文庫(kù)濃度大于1 ng/μL為合格,合格文庫(kù)在Illumina NovaSeq 6000測(cè)序儀上進(jìn)行高通量測(cè)序。
1.5高通量測(cè)序 將以上合格文庫(kù)進(jìn)行等摩爾量混合,混合后的文庫(kù)在Illumina NovaSeq 6000測(cè)序儀上進(jìn)行測(cè)序,測(cè)序模式為150 bp雙端測(cè)序法,數(shù)據(jù)量為每個(gè)樣本1 G左右。使用FastQC (v0.11.9)軟件對(duì)測(cè)序下機(jī)數(shù)據(jù)進(jìn)行質(zhì)量控制。再使用Trim Galore (v0.6.6)軟件設(shè)置以下參數(shù):“--paired -q 20 --phred33 --stringency 4 --length 20 --trim-n”對(duì)讀序進(jìn)行修剪。然后使用Bowtie2 (v2.4.4)軟件將所有修剪過的讀序與參考基因組(GRCh38人類參考基因組和NC_012920.1劍橋修正版人類線粒體全基因組)對(duì)齊,生成BAM文件,并通過Samtools (v1.7.0)軟件提取線粒體基因組reads和核基因組reads。最后通過GATK標(biāo)準(zhǔn)化線粒體基因組SNP/Indel變異檢測(cè)流程(GitHub-gatk-workflows/gatk4-mitochondria-pipeline)分析變異。
2.110例樣本通過兩種測(cè)序方法所得的一致結(jié)果 對(duì)10例樣本采用兩種mtDNA深度測(cè)序方法進(jìn)行平行試驗(yàn),結(jié)果顯示兩種方法每例樣本的堿基質(zhì)量值(Q30)均超過85,測(cè)序深度均超過3 000×,見表2。10例樣本中共有351個(gè)變異被兩種方法一致檢出,包括338個(gè)同質(zhì)性變異以及13個(gè)異質(zhì)性變異,其中有11個(gè)異質(zhì)度超過5%,見圖1。
注:10例樣本經(jīng)兩種方法進(jìn)行mtDNA測(cè)序,共有338個(gè)同質(zhì)性變異以及13個(gè)異質(zhì)性變異被兩種方法共同檢出。橫縱坐標(biāo)軸的數(shù)字為兩種方法檢出的變異異質(zhì)度,具體計(jì)算公式:該位點(diǎn)在高通量測(cè)序結(jié)果中的突變序列讀數(shù)÷該位點(diǎn)序列總讀數(shù)。圖1 在10例樣本中兩種方法一致檢出的變異及其對(duì)應(yīng)的異質(zhì)度
表2 10例樣本經(jīng)兩種方法測(cè)序的質(zhì)控參數(shù)
2.210例樣本兩種測(cè)序方法所得的不一致結(jié)果 10例樣本中有29個(gè)變異僅被一種方法檢出(稱為不一致變異)。對(duì)這29個(gè)不一致變異分析發(fā)現(xiàn),有8個(gè)變異在多例樣本中反復(fù)出現(xiàn)。其中,m.16192C>T在10例樣本中有2例均在新方法中檢出而傳統(tǒng)方法未檢出,而該變異在MitoMap和mtDB數(shù)據(jù)庫(kù)中均有記錄,其基因型頻率分別為4.393%和2.2%,類似的還有m.16223C>T(表3)。相反地,共有6種變異為僅傳統(tǒng)方法多次檢出,但這些變異在MitoMap和mtDB數(shù)據(jù)庫(kù)中均未見記錄(表4)。
表3 新方法多次檢出而傳統(tǒng)方法未檢出的變異
表4 傳統(tǒng)方法多次檢出而新方法未檢出的變異
線粒體DNA測(cè)序在線粒體疾病的臨床診斷和治療以及科研中發(fā)揮著不可或缺的作用,而線粒體基因組的多態(tài)性和復(fù)雜性給mtDNA測(cè)序帶來(lái)了挑戰(zhàn)。筆者在前期研究中開發(fā)出一種新型mtDNA測(cè)序方法,該方法通過線粒體分離純化來(lái)富集mtDNA,在Tn5轉(zhuǎn)座酶片段化建庫(kù)之前無(wú)須對(duì)初始DNA進(jìn)行PCR擴(kuò)增,在前期研究中也證明了該方法可以獲得高度純化的mtDNA,且不易受核基因組同源(NUMTs)序列干擾,可以實(shí)現(xiàn)全線粒體基因組深度測(cè)序。在此基礎(chǔ)上,本研究進(jìn)一步評(píng)估了該方法針對(duì)人類外周血樣本進(jìn)行mtDNA測(cè)序的準(zhǔn)確性。結(jié)果表明,與傳統(tǒng)基于lrPCR的測(cè)序方法相比,新方法在同質(zhì)性變異以及高異質(zhì)性變異檢測(cè)時(shí)的能力相當(dāng),而針對(duì)低異質(zhì)度變異檢測(cè)時(shí)的準(zhǔn)確性更高。本研究針對(duì)10例樣本進(jìn)行平行試驗(yàn)比較分析,該樣本量規(guī)模較小,后續(xù)研究中需進(jìn)一步擴(kuò)大樣本量規(guī)模,應(yīng)用新方法以獲得更多有價(jià)值的發(fā)現(xiàn)。
目前可以用于mtDNA測(cè)序的方法中,一代Sanger測(cè)序是單個(gè)同質(zhì)性變異檢測(cè)的金標(biāo)準(zhǔn),但不能用于全線粒體基因組測(cè)序,且靈敏度低,通常不能準(zhǔn)確地檢測(cè)到異質(zhì)度低于15%的變異[5],目前針對(duì)低質(zhì)性變異檢測(cè)尚無(wú)公認(rèn)的金標(biāo)準(zhǔn)。隨著NGS技術(shù)的發(fā)展,目前常用于全線粒體基因組深度測(cè)序的方法為基于lrPCR靶向富集mtDNA,但是該策略無(wú)法避免由聚合酶錯(cuò)誤引入的額外突變和擴(kuò)增偏好性以及NUMTs序列的干擾,影響異質(zhì)度檢測(cè)的準(zhǔn)確性[6]。新方法通過線粒體分離純化來(lái)富集mtDNA,無(wú)須PCR擴(kuò)增,可有效避免NUMTs序列干擾,理論上可以縮短建庫(kù)所需時(shí)間,且在低異質(zhì)度變異檢測(cè)方面存在優(yōu)勢(shì)。
為了證明這一觀點(diǎn),筆者對(duì)10例樣本通過新方法與基于長(zhǎng)片段PCR的方法進(jìn)行平行試驗(yàn)。發(fā)現(xiàn)與傳統(tǒng)方法相比,本方法中平均1例樣本所需的文庫(kù)構(gòu)建時(shí)間為5 h,而傳統(tǒng)方法需要10 h,因此本方法很大程度上節(jié)約了時(shí)間成本,在臨床應(yīng)用或大規(guī)模檢測(cè)時(shí)極具優(yōu)勢(shì)。對(duì)兩種方法所得測(cè)序結(jié)果分析發(fā)現(xiàn),10例樣本所有的同質(zhì)性變異及高異質(zhì)度變異的檢出結(jié)果高度一致,證明了新方法在這方面的檢出能力與傳統(tǒng)方法相當(dāng)。但是兩種方法在低異質(zhì)度變異檢測(cè)結(jié)果上存在較大差異,主要體現(xiàn)在單方法且重復(fù)檢出。由于目前尚無(wú)一種金標(biāo)準(zhǔn)方法對(duì)其進(jìn)行驗(yàn)證,于是本研究將這些重復(fù)檢出的不一致變異與2個(gè)目前廣泛使用的人群數(shù)據(jù)庫(kù)[MitoMap和Human Mitochondrial Genome Database(mtDB)數(shù)據(jù)庫(kù)]進(jìn)行對(duì)比,發(fā)現(xiàn)新方法重復(fù)檢出的兩種變異在2個(gè)數(shù)據(jù)庫(kù)中都存在同樣基因型的記錄,由此推斷該類型變異在人群中是真實(shí)存在的;而相反地,傳統(tǒng)方法重復(fù)檢出的變異在2個(gè)數(shù)據(jù)庫(kù)中均未見記錄,由此推斷該類型變異在人群中不是真實(shí)存在,可能是長(zhǎng)片段PCR建庫(kù)導(dǎo)致的假陽(yáng)性。由此得出結(jié)論,新方法針對(duì)低異質(zhì)度變異檢測(cè)更為準(zhǔn)確。而出現(xiàn)這種假陽(yáng)性可能是由于NUMTs序列的干擾,也可能是PCR偏好性導(dǎo)致擴(kuò)增子中低比例變異的丟失,亦或者是這些變異所在區(qū)域的GC含量異常干擾PCR擴(kuò)增過程導(dǎo)致。
多數(shù)mtDNA變異都存在組織特異性,通常骨骼肌和神經(jīng)組織中異質(zhì)度較高,外周血中異質(zhì)度最低[7],因此外周血中的低異質(zhì)度變異也要引起重視。研究表明,即使異質(zhì)性水平遠(yuǎn)低于誘發(fā)線粒體疾病的臨床閾值(通常約為60%~80%),該變異也會(huì)產(chǎn)生生物學(xué)效應(yīng)[8],并且低異質(zhì)度變異也可以遺傳[9]。由于卵母細(xì)胞發(fā)育過程中的線粒體遺傳瓶頸[10],子代的mtDNA異質(zhì)度會(huì)出現(xiàn)隨機(jī)增加或減少,當(dāng)變異水平達(dá)到臨床閾值時(shí)就可能會(huì)引起線粒體疾病。因此,準(zhǔn)確了解mtDNA的異質(zhì)性變異,包括外周血中異質(zhì)度較低的變異,對(duì)于線粒體疾病的防控具有重要的作用。
綜上所述,本研究通過使用新方法和傳統(tǒng)基于lrPCR的mtDNA深度測(cè)序兩種方法對(duì)10例樣本進(jìn)行平行試驗(yàn),證明了相較于傳統(tǒng)方法,新方法在同質(zhì)性變異及高異質(zhì)性變異檢測(cè)時(shí)的能力相當(dāng),而在低異質(zhì)度變異檢測(cè)時(shí)的準(zhǔn)確性更高,可以為臨床和科研提供更為可靠的mtDNA序列信息。