呂康琪,陳大洋,闞麗娟,熊 丹 綜述,張秀明△ 審校
1.新鄉(xiāng)醫(yī)學(xué)院,河南新鄉(xiāng) 453000;2.深圳市羅湖醫(yī)院集團醫(yī)學(xué)檢驗實驗室/深圳大學(xué)第三附屬醫(yī)院檢驗科,廣東深圳 518001
我國是出生缺陷高發(fā)國家之一,出生缺陷發(fā)生率高達5.6%,每年新增出生缺陷患兒約900 000例,出生時臨床可見缺陷患兒數(shù)高達250 000例,這一嚴重現(xiàn)象給家庭和社會都帶來了巨大壓力[1]。其中80%以上的出生缺陷由染色體畸變引起,在染色體結(jié)構(gòu)變異中最主要的變異類型是拷貝數(shù)變異(CNV)[2]。CNV是指染色體上DNA片段大小范圍從1 kb到幾個Mb的亞顯微水平的基因組變異,包括缺失和重復(fù)兩種類型[3]。由CNV導(dǎo)致的疾病目前沒有有效的治療方法,及時進行產(chǎn)前診斷是防治出生缺陷的重要手段。傳統(tǒng)的產(chǎn)前診斷方法,如染色體核型分析、超聲檢查等因通量低、分辨率低、檢測周期長等原因無法滿足臨床需求[4]。近幾年,基于下一代測序(NGS)技術(shù)的CNV-seq為CNV的檢測提供了新手段,美國婦產(chǎn)科醫(yī)師學(xué)會(ACOG)已推薦CNV-seq作為胎兒結(jié)構(gòu)異常時診斷評估的一線檢測方法[5]。
CNV-seq采用NGS技術(shù)對標本DNA進行低深度全基因組測序,再通過生物信息分析受檢標本中是否存在CNV[6]。目前,序列深度法檢測CNV是臨床上廣泛使用的檢測手段,該方法根據(jù)CNV重復(fù)或缺失變異產(chǎn)生的測序深度信號來進行統(tǒng)計分析,若拷貝數(shù)發(fā)生重復(fù)變異,會顯示較高的讀取深度,若發(fā)生缺失,則出現(xiàn)較低的讀取深度[7],見圖1。序列深度法的檢測流程主要有5步,(1)數(shù)據(jù)比對:將質(zhì)量合格的下機序列映射到人類參考基因組上進行比對;(2)窗口劃分:為基因組測序統(tǒng)計檢驗設(shè)定統(tǒng)計單位[8];(3)GC含量矯正:在DNA雙鏈結(jié)構(gòu)中,GC堿基對含3個氫鍵,高GC區(qū)域結(jié)構(gòu)更加穩(wěn)定,DNA不容易被打斷,此穩(wěn)定結(jié)構(gòu)會影響測序片段深度變化而造成結(jié)果假陽性,為了使窗口深度更均一,需要對GC含量進行矯正[8];(4)斷點分割:通過統(tǒng)計學(xué)方法分析序列深度,發(fā)現(xiàn)異常序列深度的窗口,對變異斷點進行合并,找出變異區(qū)域;(5)可視化:通過展示條帶分布與染色體核型標準圖對全基因組的序列分布進行可視化。
圖1 序列深度法檢測CNV時缺失和重復(fù)的深度信號
由于CNV-seq技術(shù)局限、基因組自身特征、遺傳復(fù)雜性等因素可能會造成CNV測序結(jié)果的假陽性,因此需要對檢測出的CNV片段進行過濾[9]。過濾的具體原因包括以下幾點,(1)染色體N區(qū):技術(shù)局限導(dǎo)致染色體N區(qū)遺傳信息無法檢測,造成序列深度較低,可能引起假陽性;(2)染色體著絲粒附近:染色體著絲粒由高度重復(fù)DNA序列組成,影響序列深度異常變化,可能引起假陽性[10];(3)低于檢測閾值數(shù)據(jù):CNV-seq主要針對100 kb以上CNV造成的疾病,而對于<100 kb的CNV需要過濾。基于低深度測序技術(shù)原理,CNV-seq檢測不能排除多倍體、單親二倍體、染色體平衡易位、倒位、環(huán)狀、低比例嵌合體等原因造成的疾病,但其具有通量高,成本低,DNA需求量低,操作簡便,可檢測低至5%的染色體非整倍體嵌合等優(yōu)點,提高了變異檢出率和臨床適用性[2]。
需要注意的是檢出的CNV并不都意味著異?;蛴信R床意義。目前臨床基因組資源中心(ClinGen)數(shù)據(jù)庫收錄的具有明確致病性的CNV共有2 817個,僅占據(jù)全基因組CNV的一小部分。應(yīng)用CNV-seq技術(shù)可以檢測到大量變異,但真正具有致病性的十分罕見,大部分變異因解讀信息有限,只能被定義為臨床意義未明,因此需要更多的研究確定其臨床意義。為了明確實驗室對CNV結(jié)果的評價分類并促進解讀結(jié)果的一致性,國際上2019年美國醫(yī)學(xué)遺傳學(xué)與基因組學(xué)學(xué)會(ACMG)和ClinGin聯(lián)合發(fā)表了CNV解讀和報告指南[11],國內(nèi)專家在2020年發(fā)表了《產(chǎn)前遺傳學(xué)診斷拷貝數(shù)變異和純合區(qū)域的數(shù)據(jù)分析解讀及報告規(guī)范化共識》[12]。ACMG指南實現(xiàn)了CNV致病性的量化分類,將CNV分為5類:致病性、可能致病、臨床意義未明、可能良性、良性。《產(chǎn)前遺傳學(xué)診斷拷貝數(shù)變異和純合區(qū)域的數(shù)據(jù)分析解讀及報告規(guī)范化共識》對CNV的數(shù)據(jù)分析流程、報告標準和報告內(nèi)容進行了規(guī)范[12]。盡管國內(nèi)外都出臺了相關(guān)指南和專家共識,但具體細節(jié)仍存在差異,特別是在解讀報告的透明性、一致性上,各個臨床實驗室間差別較大。因此,對CNV的解讀需考慮以下幾個因素。
2.1CNV包含的基因 分析CNV涉及區(qū)域內(nèi)的基因是解讀CNV最常考慮的因素。首先應(yīng)對CNV涉及的基因組構(gòu)成進行討論??紤]CNV中是否包含獨特的、富含基因的序列或重復(fù)元件,分析CNV的重復(fù)或缺失片段是否包含蛋白質(zhì)編碼基因或其他已知功能的重要元件,若包含則CNV會對蛋白編碼產(chǎn)生影響,造成臨床表型異常,引起致病性[13];若僅涉及部分基因的拷貝數(shù)增加或缺失,則會造成基因斷裂或編碼序列改變,而涉及內(nèi)含子序列的變異會對基因功能產(chǎn)生影響,使致病風(fēng)險增加[14]。然而,若檢測到的CNV未包含明確致病性基因而無法判斷其臨床意義時,應(yīng)查詢數(shù)據(jù)庫或檢索PubMed對基因進行評估。其次,應(yīng)對CNV涉及的基因數(shù)量進行討論,若包含的基因數(shù)量過多,則致病風(fēng)險增加,如當(dāng)拷貝數(shù)缺失區(qū)域包含35個及以上蛋白編碼基因時,該CNV定義為可能致病;若包含基因數(shù)量少,則致病風(fēng)險降低;需要明確的是,如果該變異區(qū)域包含的基因數(shù)量很少,但含有明確致病性基因,此CNV則被定義為致病性[15]。
2.2數(shù)據(jù)庫 可用于解讀CNV的數(shù)據(jù)庫主要分為3大類:第1類為疾病人群變異數(shù)據(jù)庫,主要收集臨床表型、明確致病性基因等,包括ClinGen、DECIPHER、在線人類孟德爾遺傳(OMIM)、HGMD數(shù)據(jù)庫等;第2類為健康人群變異數(shù)據(jù)庫,主要收集變異在自然人群中的分布頻率、族群信息等,包括基因組變異體數(shù)據(jù)庫(DGV)、gnomAD數(shù)據(jù)庫等;第3類主要收集基因組學(xué)注釋信息,包括基因內(nèi)含子、外顯子、5′端或3′端重要元件等,主要是UCSC、GeneBank數(shù)據(jù)庫。
2.3文獻查詢 可以通過檢索是否有相似CNV或變異區(qū)域所涉及基因的文獻報道,幫助臨床分析,為CNV解讀提供新思路。常用的檢索平臺是PubMed、Web of Science、中國知網(wǎng)、萬方數(shù)據(jù)知識服務(wù)平臺等。
2.4家族遺傳 在許多情況下,若檢測到臨床意義未明的CNV時,對父母進行基因組測序是十分必要的。當(dāng)變異來自表型健康父母時,該變異致病性可能較低,若變異為新發(fā),則致病性可能較高。在特殊情況時,可能還需要其他的家族標本(如兄弟姐妹)來確定特定的CNV是否與家族中的染色體變異相關(guān)。遺傳異質(zhì)性和遺傳外顯率也是影響基因型和表型關(guān)系的重要因素。低外顯率是指外顯率為5%~10%,這種基因組變異的臨床表現(xiàn)很難被精準預(yù)測,且外顯率會受到多種因素的影響,如種族、家族史、額外的CNV等[16]。
3.1CNV-seq與染色體核型分析的聯(lián)合應(yīng)用 20世紀70年代以來,傳統(tǒng)的染色體核型分析是評估高危孕婦胎兒染色體異常的“金標準”。此技術(shù)可以檢測胎兒染色體數(shù)目異常、染色體非整倍體、倒位、平衡或非平衡易位等結(jié)構(gòu)異常[17]。染色體核型分析技術(shù)的分辨率為5~10 Mb,<5 Mb的異常很難被準確檢出,而CNV-seq不能檢出平衡易位、羅氏易位等結(jié)構(gòu)異常,因此染色體核型分析與CNV-seq聯(lián)合檢測可以克服兩種技術(shù)中存在的缺陷,為產(chǎn)前提供更可靠更全面的遺傳診斷[18]。魏友華等[19]采用以上兩種方法對905例羊水標本進行檢測,均發(fā)現(xiàn)70例染色體數(shù)目異常、9例染色體嵌合體異常、7例染色體非平衡性結(jié)構(gòu)異常,染色體核型分析額外檢測到由羅氏異位引起的染色體數(shù)目異常,CNV-seq額外檢測到10例明確致病性的染色體微缺失/微重復(fù),兩者聯(lián)合應(yīng)用將染色體異常陽性率從11.27%提升至12.38%。彭亞琴等[20]對164例孕婦進行檢測,核型分析檢出24例染色體核型異常,CNV-seq檢出29例已知致病性和可疑致病性CNV,使致病性CNV檢出率提高了3.05%,但CNV-seq未能檢出3例染色體核型分析診斷為平衡易位、羅氏異位的異常。上述研究表明,核型分析和CNV-seq聯(lián)合應(yīng)用可以顯著提高染色體異常檢出率,有利于臨床產(chǎn)前咨詢評估,可為孕婦是否繼續(xù)妊娠提供更加全面客觀的依據(jù)。
3.2CNV-seq與染色體微陣列分析技術(shù)(CMA)的對比應(yīng)用 CMA是一種已成熟運用于臨床的高分辨率全基因組CNV分析技術(shù),ACMG推薦CMA作為胎兒染色體異常時診斷評估的輔助手段[21],但該技術(shù)存在培養(yǎng)周期長、成本高、通量低、探針更新停滯等問題[22]。MA等[23]對67例嵌合體孕婦進行CNV-seq和CMA檢測,CNV-seq的檢出率為6%~92%,CMA的檢出率為20%~72%。WANG等[24]對1 023例孕婦進行檢測,CMA檢出121例染色體異常(11.8%),CNV-seq不僅檢測到了上述所有異常,并且額外檢出了17例染色體異常。以上研究證明,CNV-seq較CMA對嵌合體有更高的分辨率和靈敏度。據(jù)上述研究分析原因發(fā)現(xiàn),CMA未檢出異常的原因是平臺靶區(qū)探針覆蓋不足或探針覆蓋不到。
3.3CNV-seq在不同臨床指征中的應(yīng)用
3.3.1CNV-seq在超聲結(jié)果異常中的應(yīng)用 超聲診斷是臨床應(yīng)用最廣泛、最常見、公認無損傷性、可反復(fù)進行的醫(yī)學(xué)成像技術(shù),也是胎兒生長發(fā)育情況的重要判定指標之一[25]。對超聲結(jié)果異常的病例進行CNV-seq檢測,不僅可以幫助產(chǎn)前確定變異類型,而且有利于分析遺傳原因。張秀群等[26]對137例超聲檢查提示胎兒結(jié)構(gòu)異常的孕婦進行CNV-seq檢測,發(fā)現(xiàn)有15例異常,其中8例為已知致病性CNV,超聲結(jié)果分別是6例提示頸項透明層(NT)增厚或側(cè)腦室增寬,1例提示胎兒尺骨缺如、左腎缺如、心室內(nèi)多發(fā)強光斑,1例提示胎兒生長發(fā)育受限。CNV-seq不僅可以在超聲結(jié)構(gòu)異常病例中分析遺傳變異,還可以在超聲發(fā)現(xiàn)軟指標的病例中探索病因,幫助臨床深入分析病例特征,提升診斷價值。胎兒超聲軟指標多見于NT增厚,針對NT增厚,已有研究對臨床病例進行了CNV-seq檢測,發(fā)現(xiàn)在NT增厚的139例病例中檢出45例CNV,除了33例是>5 Mb的染色體異常,余下的12例均是染色體微缺失/微重復(fù)[27]。
3.3.2CNV-seq在高齡孕婦中的應(yīng)用 隨著三孩政策放開,高齡(≥35歲)孕產(chǎn)婦的數(shù)量明顯增加,研究表明胎兒染色體異常的發(fā)生率與孕婦年齡密切相關(guān),因此為高齡孕婦提供產(chǎn)前診斷是減少出生缺陷兒的有效手段[28]。王游聲等[29]對孕婦年齡和染色體異常的相關(guān)性進行了研究,發(fā)現(xiàn)在35歲以上的7個年齡組中,從38歲起隨著孕婦年齡增長,染色體異常率逐漸升高。一項研究發(fā)現(xiàn),31例引產(chǎn)孕婦中單純因高齡而發(fā)現(xiàn)胎兒異常導(dǎo)致引產(chǎn)的病例有10例,占32.26%,因此相對而言,高齡孕婦更容易生育異常胎兒[30]。以上研究證明,高齡與染色體異常密切相關(guān),可以通過CNV-seq技術(shù)檢測染色體異常,從而降低出生缺陷的發(fā)生率,有助于我國出生缺陷的防治。
3.3.3CNV-seq在無創(chuàng)產(chǎn)前檢測(NIPT)高風(fēng)險中的應(yīng)用 NIPT指通過檢測母體血漿中游離DNA片段而判斷胎兒是否存在染色體非整倍體異?;蚱渌z傳性疾病,主要用于篩查21、18、13三體綜合征[31]。有研究對563例NIPT篩查為三體綜合征的孕婦進行CNV-seq檢測,發(fā)現(xiàn)489例孕婦羊水檢出CNV,分析74例出現(xiàn)假陽性結(jié)果的原因是由于母體CNV的干擾,因此若NIPT提示高風(fēng)險時,仍需要進行CNV-seq檢測確認,排除母體干擾[32]。另有研究對45 773例孕婦進行NIPT篩查,314例檢出性染色體非整倍體,經(jīng)羊膜穿刺術(shù)驗證,58例病例檢出CNV,結(jié)果仍有很高的假陽性率[33]。以上研究說明,對于NIPT高風(fēng)險的孕婦,可以進行CNV-seq檢測驗證。NIPT只是一種篩查測試,因此可能出現(xiàn)假陽性或假陰性的情況。2016年我國國家衛(wèi)生健康委員會發(fā)布了《孕婦外周血胎兒游離DNA產(chǎn)前篩查與診斷技術(shù)規(guī)范》,明確指出對于NIPT高風(fēng)險人群,應(yīng)轉(zhuǎn)診至產(chǎn)前遺傳咨詢醫(yī)師處進行檢測和咨詢[34]。
在過去的幾年,我國有效防治出生缺陷的方法是進行產(chǎn)前診斷,而CNV-seq為產(chǎn)前診斷提供了新途徑。在CNV-seq的檢測原理方面,序列深度法已獲得臨床認同;在臨床應(yīng)用方面,該技術(shù)不僅實現(xiàn)了與其他傳統(tǒng)技術(shù)的聯(lián)合運用,而且也被應(yīng)用到不同指征病例中,實現(xiàn)了優(yōu)勢互補,提升了我國產(chǎn)前診斷領(lǐng)域的檢測能力,提高了檢測效率;在解讀方面,從包含的基因、數(shù)據(jù)庫、文獻查詢和家族遺傳這4個方面進行總結(jié),然而由于明確致病性的基因或區(qū)域數(shù)量有限,很多檢測結(jié)果無法給出具有臨床意義的解釋,且CNV結(jié)果解讀流程復(fù)雜、專業(yè)性強,盡管國內(nèi)外已出臺了相關(guān)指南和專家共識,但具體細節(jié)仍存在差異,特別是在解讀報告的透明性、一致性和標準化方面,各個臨床實驗室之間差別較大。因此,CNV-seq結(jié)果解讀仍存在很多問題,需要進一步探索CNV致病性評估,推動CNV-seq在產(chǎn)前診斷領(lǐng)域的發(fā)展。