吳蕭男 關(guān)靜 蘭蘭 王洪陽 王大勇 王秋菊
解放軍總醫(yī)院耳鼻咽喉頭頸外科醫(yī)學部耳鼻咽喉內(nèi)科,解放軍醫(yī)學院,國家耳鼻咽喉疾病臨床醫(yī)學研究中心,聾病教育部重點實驗室,解放軍耳鼻咽喉研究所(北京 100853)
Y連鎖遺傳性耳聾(DFNY1)家系的發(fā)現(xiàn),補全了遺傳性耳聾關(guān)于孟德爾遺傳的所有遺傳方式[1]。DFNY1家系中所有直系男性均患有雙側(cè)遲發(fā)性感音神經(jīng)性耳聾,聽力曲線為高頻緩降型或平坦型,發(fā)病年齡在5-27歲[2]。通過寡核苷酸微陣列比較基因組雜交分析、熒光原位雜交及交錯式熱不對稱PCR,發(fā)現(xiàn)該家系男性的Y染色體9,520,205處存在一段復雜的重組結(jié)構(gòu)[3],該結(jié)構(gòu)位于Y染色體的擴增區(qū),主要由1號染色體片段及Y染色體片段構(gòu)成,通過復制叉停滯與模板轉(zhuǎn)換(Fork Stalling and Template Switching,FoSTeS)機制形成[4]。
FosTes機制導致結(jié)構(gòu)變異是遺傳性耳聾一種全新的致病機制,而由于Y染色體本身存在高度的重復序列,且大部分片段為無功能片段,準確測序出該復雜重組結(jié)構(gòu)中各片段的插入位置難度較大[5]。近年來,第三代測序技術(shù)(Third Generation Sequencing,TGS)發(fā)展迅速,并憑借自身讀長長、無GC偏好性的特點,對拷貝數(shù)重復區(qū)域的測序較第二代測序技術(shù)優(yōu)勢明顯[6]。本研究旨在應用第三代測序技術(shù)中的納米孔(Nanopore)測序技術(shù),對DFNY1家系基因組中的復雜重組結(jié)構(gòu)進行檢測,以期準確測得該復雜重組結(jié)構(gòu)中各片段的插入位置,進一步明確FosTes機制產(chǎn)生的原因,豐富耳聾遺傳學及基因組結(jié)構(gòu)變異研究的理論內(nèi)容。
先證者為DFNY1家系中的一名44歲男性,9歲時逐漸開始出現(xiàn)雙耳感音神經(jīng)性耳聾,圖1a為DFNY1的家系圖,截選自王秋菊教授課題組2013年的研究[3]。該家系中的所有直系男性均患有雙耳遲發(fā)性感音神經(jīng)性耳聾。截止到2013年的研究[3],Ⅷ代、Ⅸ代的聽力表現(xiàn)正常的直系男性,由于年齡較小,尚未出現(xiàn)耳聾癥狀,V代、VI代的聽力表現(xiàn)正常的直系男性,由于缺少資料,因此標為正常。IX代的女性患者,有明確的氨基糖苷類藥物的使用史,發(fā)病原因考慮與應用氨基糖苷類藥物有關(guān)[2]。
對先證者進行聽力學檢測,純音測聽結(jié)果見圖1b。先證者的聽性腦干反應潛伏期顯示雙耳僅見V波,畸變產(chǎn)物耳聲發(fā)射顯示雙耳各頻率均未引出有意義的耳聲發(fā)射。為求進一步明確其基因組中的突變位點信息,采集先證者的外周靜脈血,進行第三代測序技術(shù)中的納米孔(Nanopore)測序。同時隨機抽取101名家系外正常男性進行Nanopore測序作為對照。所有人員均已簽署知情同意書,本研究已通過中國人民解放軍總醫(yī)院倫理委員會的批準。
圖1 DFNY1家系圖及先證者聽力圖。a DFNY1家系的家系圖,截選自王秋菊教授課題組2013年的研究[3]。○正常女性;□正常男性;■男性患者;●女性患者;先證者,已故。b先證者18年的聽力隨訪結(jié)果。虛線為先證者首診(23歲)時的聽力結(jié)果,實線為先證者復診(41歲)時的聽力結(jié)果。雙耳表現(xiàn)為穩(wěn)定的感音神經(jīng)性耳聾。建庫完成后將一定濃度和體積的DNA文庫加入到1個Flow cell中,并將Flow cell轉(zhuǎn)移到Nano-pore GridION X5/PromethION(Oxford Nanopore Technologies,UK)進行實時單分子測序。Fig.1 The genogram and proband audiogram of DFNY1 pedigree.a is the pedigree genogram of DFNY1 pedigree,which was selected from the research of professor Wang in 2013[3].○Normal female;□normal male;■male patients;●female patients;the proband,deceased.b is the 18 years hearing follow-up of the proband.The dashed line is the hearing situation of the first visit(age 23),and the solid line is the hearing situation of the subsequent visit(age 41).Both ears showed stable sensorineural deafness.
對采集到的先證者外周靜脈血樣本,采用QIA-GEN?Genomic DNA提取試劑盒(Cat#13323,Qiagen),根據(jù)生產(chǎn)廠商提供的標準操作流程進行基因組DNA抽提。對所得DNA使用NanoDrop?One UV-Vis spectrophotometer(Thermo Fisher Scientific,USA)檢測DNA純度(OD260/280在1.8-2.0之間;OD 260/230在2.0-2.2之間)并使用Qubit? 3.0 Flu-orometer(Invitrogen,USA)對DNA進行精確定量。
樣本質(zhì)檢合格后,使用BluePippin全自動核酸回收儀(Sage Science,USA)將大片段進行切膠回收,在純化后的DNA片段兩端進行末端修復并進行加A反應;純化后,使用LSK109連接試劑盒(Cat#SQK-LSK109,Oxford)中的接頭進行連接反應,最后用 Qubit? 3.0 Fluorometer(Invitrogen,USA)精確地對建好的DNA文庫進行定量檢測。
對Nanopore測序下機數(shù)據(jù)進行統(tǒng)計并按照reads平均qScore值≥7為標準進行過濾,使用NGMLR-Sniffles流程進行結(jié)構(gòu)變異檢測,分析基因組存在的結(jié)構(gòu)變異。采用ANNOVAR進行結(jié)構(gòu)變異的基因、轉(zhuǎn)錄因子結(jié)合位點、基因組大片的重復、CpG島、MicroRNA結(jié)合位點等注釋。按照結(jié)構(gòu)變異與公共數(shù)據(jù)庫結(jié)構(gòu)變異的相互重疊度大于或等于50%進行結(jié)構(gòu)變異注釋。
根據(jù)先證者Y染色體上插入序列斷點位置的信息,對101例聽力正常男性對照樣本進行目標區(qū)域分析。利用Nanopore分析測得的數(shù)據(jù),對比分析復雜重組結(jié)構(gòu)中較大的插入片段在先證者及正常樣本中拷貝數(shù)分布情況,計算102個樣本(先證者+101個正常男性樣本)在該區(qū)域的拷貝數(shù)。
重點關(guān)注Y染色體上的插入變異、Y染色體和1號染色體上的易位變異。下機數(shù)據(jù)經(jīng)質(zhì)量控制后,Y染色體上共檢測到2個1號染色體的易位斷點,該易位有4條reads支持,經(jīng)數(shù)據(jù)核對后認為該易位變異的可信度較高,由此可以確定1號染色體拷貝數(shù)擴增片段插入到Y(jié)染色體的具體位置,即在Y染色體Yp11.2區(qū)9,520,205位點處插入了一段1號染色體,1號染色體兩端的插入位點斷點分別為160,159,483及160,318,972。
在Y染色體9,520,205斷點上下游,發(fā)現(xiàn)一段長的片段重復序列(segmental duplication,Seg Dup區(qū)域),位置為9,466,034-9,640,281,這一Seg Dup區(qū)域相似性高于90%且橫跨斷點,容易引起序列比對的錯誤,致使拷貝數(shù)重復片段比對到Y(jié)染色體的多處位置,且每處位置的read數(shù)差異較大。因此我們結(jié)合2013年的文獻信息[3],對該結(jié)構(gòu)變異進行梳理,發(fā)現(xiàn)在先證者中的Y染色體上共有9個拷貝數(shù)增加的片段,分別命名為INS1-INS9,各片段的連接處具有相同的微同源序列,詳細信息見表1。其中INS1、INS2、INS3及INS5來自1號染色體的不相連位置,INS4、INS6、INS7、INS8及INS9來自Y染色體的不相連位置。由于測序方法的限制,INS7-INS9的斷點為估計值。整理第三代測序技術(shù)所得的測序結(jié)果,并將最終結(jié)果繪制示意圖(圖2)。
圖2 Y染色體復雜重組結(jié)構(gòu)示意圖。先證者Y染色體Yp11.2區(qū)9,520,205位點插入一段復雜重組結(jié)構(gòu),長度為793,298bp,含9段不相連的片段,以不同的顏色表示。片段1、2、3、5來自1號染色體,片段4、6、7、8、9來自Y染色體。Fig.2 Schematic diagram of Y chromosome complex recombination structure.A complex recombinant structure was inserted into the site 9,520,205 of the Yp11.2 region of the proband's Y chromosome,and the length is 793,298bp,consisting of nine unconnected fragments,which is repre-sented by different colors.Segments 1,2,3 and 5 are from 1 chromosome and segments 4,6,7,8 and 9 are from Y chromosome.
表1 Nanopore測序發(fā)現(xiàn)的Y染色體上9個拷貝數(shù)增加片段詳細信息Table 1 Details of the 9 copy number increasing fragments on Y chromosome discovered by Nanopore sequencing
將測序結(jié)果中的較大插入片段與聽力正常男性對照樣本進行對比分析,結(jié)果表明101例聽力正常男性樣本Y染色體上并未發(fā)現(xiàn)上述大片段的插入。先證者在Y染色體插入片段INS1(chr1:160,159,484-160,318,972)、INS8(chrY:9,760,000-9,910,000)、INS9(chrY:9,200,000-9,520,205)區(qū)域的拷貝數(shù)100%高于正常樣本,在Y染色體插入片段INS7(chrY:9,930,000-10,092,864)的拷貝數(shù)高于大部分(84個,83%)正常樣本(圖3a)。
圖3 Y染色體插入片段的拷貝數(shù)及攜帶基因情況。a為INS1、INS7、INS8、INS9在先證者及聽力正常男性對照樣本中的拷貝數(shù)情況。橫坐標為插入的片段,縱坐標為該片段區(qū)域的拷貝數(shù)。紅色虛線代表先證者的拷貝數(shù)情況。b為Y染色體插入片段及Seg Dup區(qū)包含的拷貝數(shù)增多的基因。INS1中攜帶的基因為9個;INS7中攜帶的基因為2個;INS9中攜帶的基因為7個;Seg Dup區(qū)域上攜帶的基因為7個。Fig.3 Copy number of insertions and gene carrying situations in Y chromosome.a is the copy number of INS1,INS7,INS8,INS9 in the proband and male control samples with normal hearing.The abscissa is the inserted segment,and the ordinate is the copy number in the segment area.The red dotted line represents the copy number of the proband.b is the gene with increased copy number in Y chromosome inserted segments and Seg Dup region.INS1 carried 9 genes;INS7 carried2 genes;INS9 carried 7 genes.Seg Dup region carried 7 genes.
進一步用UCSC基因組瀏覽器(hg19)查看片段重復區(qū)域的基因分布情況,發(fā)現(xiàn)拷貝數(shù)增加的片段中,INS1、INS7、INS8及INS9片段中攜帶功能基因。其中 INS1中攜帶的基因為:CASQ1、AK093299、PEA15、DCAF8、PEX19、COPA、SUMO1P3、Y_RNA、NCSTN;INS7中攜帶的基因為:JA668106、JB175072;INS9 中 攜 帶 的 基因 為 :TSPY1、TSPY3、TSPY4、FAM197Y2、FAM197Y5、CYorf16、RBMY3AP。另外在插入斷點9,520,205附近的長Seg Dup區(qū)域上攜帶的 基 因 為 :TSPY4、FAM197Y5、TSPY3、CYorf16、FAM197Y2、TSPY1、RBMY3AP。詳細情況見圖3b。由于部分基因(如DCAF8)不只增加了1個拷貝,因此圖3b中存在基因重復出現(xiàn)的情況。
除外復雜重組結(jié)構(gòu)涉及到的結(jié)構(gòu)變異,進一步使用Nanopore測序篩選出1號染色體及Y染色體攜帶的其他結(jié)構(gòu)變異,其中長度大于1kb結(jié)構(gòu)變異共12個,在1號染色體6個,Y染色體6個;長度小于等于1kb結(jié)構(gòu)變異共2個,均位于1號染色體上。上述發(fā)生在1號染色體上的8個結(jié)構(gòu)變異經(jīng)IGV(Integrative Genomics Viewer)查看(上下游1kb)發(fā)現(xiàn)其中5個結(jié)構(gòu)變異具有較高可信度;發(fā)生在Y號染色體上的6個結(jié)構(gòu)變異經(jīng)IGV查看(上下游1kb)發(fā)現(xiàn)其中1個結(jié)構(gòu)變異具有較高可信度,篩選出的結(jié)構(gòu)變異具體結(jié)果見表2。
表2 Nanopore測序發(fā)現(xiàn)的1號染色體及Y染色體其他結(jié)構(gòu)變異Table 2 Other structural variations of 1 chromosome and Y chromosome detected by Nanopore sequencing
作為男性性別決定的染色體,人類的Y染色體從至少1.8億年前的普通常染色體進化而來[7]。原Y染色體在獲得性別決定基因后,其本身發(fā)生的一系列倒置反應阻礙了原X染色體與原Y染色體之間的重組。在這個過程中,女性的X染色體保留了一個交換對象,而男性的Y染色體的交換機會變得越來越有限,致使原Y染色體受到遺傳衰退的影響,基因不斷缺失,最終只保留了祖先常染色體上3%的基因[8,9]。由于Y染色體的大部分序列不受染色體配對要求的限制,從而使這些序列避開了交叉互換的洗牌效應,這使得Y染色體上的重復序列得以不斷的積累。這些重復序列反過來通過染色體內(nèi)重組引發(fā)頻繁的染色體重排,從而形成高度復雜的結(jié)構(gòu)變異[10]。這種現(xiàn)象對Y染色體的結(jié)構(gòu)、突變過程以及種群內(nèi)和種群間的多樣性都有顯著的影響。
Y染色體的重復序列主要位于Y染色體的擴增區(qū),擴增區(qū)長約10.2Mb,約含60個基因,具有高度的重復序列和回文序列[11]。重復序列的存在可能為染色體促進基因轉(zhuǎn)換的方式,從而克服了Y染色體由于缺乏重組而導致的遺傳衰敗[12,13]。然而,由于這些重復序列彼此之間的相似性>99%,并且在不同人群中擴增區(qū)內(nèi)的基因拷貝數(shù)有很高的變異性,這給Y染色體的精準測序帶來了巨大的挑戰(zhàn)[14]。
第三代測序技術(shù)中的Nanopore測序技術(shù)讀長可達數(shù)百kb[15],由于讀長較第二代測序技術(shù)明顯延長,從而可以憑借其超長的讀長來跨域測序片段中的重復序列,避免由于重復序列過高的相似性而產(chǎn)生的染色體比對組裝錯誤[16]。且第三代測序技術(shù)可以避免第二代測序技術(shù)產(chǎn)生的GC偏好性[17],能夠較為準確的測序出重復序列及長拷貝數(shù)變異[18]。
本研究通過使用第三代測序技術(shù)中的Nano-pore測序?qū)FNY1家系中的一名先證者進行檢測,發(fā)現(xiàn)其Y染色體Yp11.2區(qū)9,520,205位點處插入了一段長約793kb的復雜重組結(jié)構(gòu),屬于基因組結(jié)構(gòu)變異的特殊情況。這段復雜重組結(jié)構(gòu)由9段不相連的、1號染色體及Y染色體的片段序列,憑借片段間的微同源序列,通過FosTes機制形成[4,19],并且在INS1、INS7及INS9中均發(fā)現(xiàn)拷貝數(shù)增加的基因。除此之外,進一步將檢測結(jié)果與101例聽力正常男性對照樣本進行對比分析,未發(fā)現(xiàn)正常男性的Y染色體上存在該復雜重組結(jié)構(gòu)。其中,INS7區(qū)域先證者拷貝數(shù)較84個聽力正常男性對照樣本高,但仍有17個對照樣本的拷貝數(shù)高于先證者。推測原因可能為由于該復雜重組結(jié)構(gòu)的拷貝數(shù)重復片段比對到Y(jié)染色體的多處位置,使得關(guān)于Y染色體長拷貝變異片段的組裝結(jié)果存在誤差。而在INS1、INS8及INS9區(qū)域的先證者拷貝數(shù)均高于101個正常男性對照,進一步證明了正常男性的Y染色體上不存在該復雜重組結(jié)構(gòu),以及通過Nanopore技術(shù)檢測的該段復雜重組結(jié)構(gòu)的可靠性、利用第三代測序技術(shù)對基因組內(nèi)復雜重組區(qū)檢測的優(yōu)勢。
通過Nanpore測序,我們得到的最長read讀長為306kb,N50讀長為24kb,而先證者復雜重組結(jié)構(gòu)的長度約為793kb,最長片段約為320kb。因此,Nanopore測序技術(shù)未能完全跨越Y(jié)染色體的全段復雜重組結(jié)構(gòu)。下一步,計劃通過改進Nanopore測序技術(shù)來增加測序讀長,爭取跨越Y(jié)染色體的全段復雜重組結(jié)構(gòu),進一步明確拷貝數(shù)變異的前后插入斷點,并使用第三代測技術(shù)中的PacBio技術(shù),通過循環(huán)一致性測序來增加單堿基的正確率[20],對Nanopore的測序結(jié)果進行修正。
本研究通過第三代測序技術(shù)中的Nanopore全基因組測序分析,在Y連鎖遺傳性耳聾(DFNY1)家系中的男性Y染色體Yp11.2區(qū)檢測到1段復雜重組結(jié)構(gòu),由9段1號染色體及Y染色體不相連片段組成,且其中的插入片段區(qū)域的拷貝數(shù)顯著高于聽力正常男性樣本。