楊言軍 霍艷蓓 把玉佩 周立 史典 王瑞娟 任曉宇 甘婷 程寧
先天性心臟病是一種常見的出生缺陷,在世界范圍內(nèi)約占出生缺陷的三分之一[1],而在中國, 先天性心臟病的發(fā)病率逐年上升且已位居出生缺陷的首位,也是導(dǎo)致圍產(chǎn)兒和嬰兒死亡的主要原因之一[2]。導(dǎo)致先天性心臟病發(fā)病的病因除了孕婦在孕產(chǎn)期所接觸到的一些環(huán)境致畸物、孕期服藥、宮內(nèi)感染或者孕婦所患一些疾病外,遺傳因素也在其中發(fā)揮著重要作用[3-4]。研究發(fā)現(xiàn),大量位于NKX2.5、GATA4和TBX5這三種基因的突變是導(dǎo)致先天性心臟病的原因[5],但是這些研究大多數(shù)是針對家族性和綜合征型的先天性心臟病,而現(xiàn)實中,這些非綜合征型的散發(fā)先天性心臟病卻占大多數(shù)病例,這些病人的遺傳病理機制仍不清楚。測序研究發(fā)現(xiàn),一些散發(fā)性畸形和疾病是由新生基因突變引起的,這些新生突變比遺傳變異危害更大[6-7]。近年來,基因測序技術(shù)發(fā)展為先天性心臟病遺傳因素研究提供了有力的手段,尤其是全外顯子組測序技術(shù),一次性可以覆蓋整個蛋白質(zhì)編碼的外顯子區(qū)域,通過對患兒和父母全外顯子測序來發(fā)現(xiàn)新生基因突變,逐漸成為發(fā)現(xiàn)散發(fā)先天性心臟病候選基因的有效方法。但是目前,國內(nèi)外針對散發(fā)先天性心臟病新生基因突變的研究較少,本研究通過全外顯子組測序技術(shù)嘗試捕獲6例室缺伴房缺的嚴(yán)重先天性心臟病兒及其父母血DNA外顯子突變,并通過基因庫進(jìn)行注釋和篩選先天性心臟病患兒有害的新生突變,為散發(fā)先天性心臟病患兒遺傳病理機制研究提供依據(jù)。
于2014年1月—2018年 4月,從蘭州市婦幼保健院經(jīng)新生兒科明確診斷為以室缺伴房缺的嚴(yán)重先天性心臟病患兒中選取6例為研究對象,而其父母均未有心臟結(jié)構(gòu)缺陷。在獲取患兒家長知情同意并簽署知情同意書后,收集患兒及父母外周血樣,并置于-70℃保存?zhèn)溆谩?/p>
提取基因組DNA,并通過熒光定量和瓊脂糖凝膠電泳對DNA濃度進(jìn)行精確定量和質(zhì)量檢測。質(zhì)量合格的基因組DNA打斷成主峰是250~300 bp左右的片段,在DNA片段的3′端加上“A”堿基,兩端加上文庫接頭,然后進(jìn)行線性擴(kuò)增(LM- PCR)制備成雜交文庫。取適量的雜交文庫與外顯子芯片進(jìn)行捕獲富集,洗脫掉未富集的片段后進(jìn)行擴(kuò)增。
擴(kuò)增產(chǎn)物經(jīng)Agilent 2100 bioanalyzer儀器(Agilent DNA 1000 Reagents)和QPCR質(zhì)控,質(zhì)控合格使用Illumina HiSeq系列平臺,進(jìn)行高通量測序,經(jīng)Illumina堿基識別軟件(Base Calling)轉(zhuǎn)化為原始序列數(shù)據(jù)(raw reads)。對原始數(shù)據(jù)過濾得到高質(zhì)量的數(shù)據(jù)(clean data或clean reads)。
使用比對BWA(Burrows-Wheeler Aligner)和SOAPaligner,與人的參考基因組(GRCh37/hg19)比對,用SOAPsnp、GATK、SAMtools和Platypus進(jìn)行變異檢測(SNP和InDel)。最后,將獲得的變異用VEP和BGI內(nèi)部數(shù)據(jù)庫進(jìn)行注釋(以上所有步驟均由深圳華大基因科技有限公司進(jìn)行)。
該研究中,約有 58.97 Mb 長的目標(biāo)區(qū)域被芯片捕獲,平均 99.82% 的 reads 比對上參考基因組。目標(biāo)區(qū)域的平均測序深度約為 159.09 X,平均每個樣本有 99.79% 的目標(biāo)區(qū)域被至少1條reads覆蓋,有98.26%的目標(biāo)區(qū)域被至少10條reads覆蓋。在整個分析流程中,對過濾后的測序數(shù)據(jù)、比對數(shù)據(jù)和變異結(jié)果均做了嚴(yán)格的質(zhì)控(QC),如果某些質(zhì)控項標(biāo)準(zhǔn)不滿足,則重新測或者其他有效方式來改善數(shù)據(jù)質(zhì)量,保證高質(zhì)量的數(shù)據(jù)。
1. 家系分析:按照AD模式即假設(shè)在常染色體顯性遺傳方式進(jìn)行分析,即表示家系成員中的患者都攜帶致病基因型,正常人都不攜帶致病基因型。篩選時,先篩出該遺傳模式下共分離的記錄,即AD:YY:1:2:0,再根據(jù)隨機森林模型預(yù)測的結(jié)果找出真陽性的新生突變(De novo)。
2. 等位基因頻率:選擇公共數(shù)據(jù)庫(如KG、ESP、EXAC、CG、HapMap、Wellderly)等位基因頻率均小于等于0.005的位點。
3. 芯片閾值:針對不同的芯片選擇閾值進(jìn)行篩選,留下符合條件的記錄,此次本研究選擇華大推薦閾值20,即留下小于等于20的記錄,去除系統(tǒng)假陽性變異。
4. 質(zhì)控信息(filter):擇質(zhì)量較高位點即在目標(biāo)區(qū)域(TR)且通過GATK過濾條件(PASS)。
5. 轉(zhuǎn)錄本影響程度(IMPACT):選擇IMPACT選項中HIGH和MEDIUM。
6. 突變所在區(qū)域:篩選出功能影響比較大的位點,比如在蛋白質(zhì)編碼區(qū)和剪切位點。
如圖1所示,僅當(dāng)以上條件均滿足時才作為候選的基因突變。
圖1 有害的新生突變的篩選流程圖Figure 1 Screening flow chart for deleterious de novo mutations
通過Sanger測序?qū)Y選出的新生突變基因進(jìn)行家系驗證,PCR產(chǎn)物用ABI3730XL測序儀進(jìn)行序列分析(由深圳華大基因科技有限公司進(jìn)行)。測序結(jié)果用chromas軟件進(jìn)行查看。
此次測序平均每個樣本有65 899 918 bp的靶向區(qū)域被捕獲,捕獲效率平均為79.05%,SNP為121 825,indel為32 375,具體各個樣本詳細(xì)信息見表1。
如表2所示,按照篩選方法本研究發(fā)現(xiàn)4個符合篩選條件的新生突變,涉及到基因和位點分別為FHDC1(c.1977G>C;p.Gln659His)、BRD4(c.3797A>C;p.Glu1266Ala)和HK3(c.397C>G;p.Leu133Val),SPRED2(c.373+1G>T),其中FHDC1、BRD4、HK3為錯義突變,而SPRED2突變位置在剪切位點其有可能改變外顯子剪切方式從而影響基因功能,另外FHDC1與BRD4基因突變在dbsnp庫中無對應(yīng)記錄。通過多種預(yù)測軟件對這些變異的功能和保守性進(jìn)行預(yù)測,雖相應(yīng)預(yù)測軟件并未發(fā)現(xiàn)FHDC1(c.1977G>C)為有害突變,但SPRED2(c.373+1G>T)有三個功能預(yù)測軟件分別為GERP-plus、PhyloP與PhastCons預(yù)測為有害突變,而GERP-plus功能預(yù)測軟件同樣發(fā)現(xiàn)BRD4(c.3797A>C)位點的變異是有害的,而FATHMM、GERP_plus與PhastCons預(yù)測出HK3為有害突變。對篩選出的新生突變進(jìn)行用Sanger測序驗證,結(jié)果顯示患兒存在突變,其父母不存在該突變,表明本研究發(fā)現(xiàn)的FHDC1(c.1977G>C)、BRD4(c.3797A>C)、HK3(c.397C>G)、SPRED2(c.373+1G>T)為新發(fā)突變,如圖2所示。
表1 全外顯子組測序捕獲結(jié)果Table 1 Whole exome sequencing capture results
表2 基因突變的篩選定位結(jié)果Table 2 Screening and mapping results of gene mutations
圖2 患兒及其父母突變基因Sanger測序Figure 2 Sanger sequencing analysis of the mutated gene in patients and their parents
心臟的發(fā)育是一個連續(xù)動態(tài)的過程,而心臟轉(zhuǎn)錄因子對調(diào)控心臟發(fā)育起著關(guān)鍵作用,研究發(fā)現(xiàn)心臟轉(zhuǎn)錄因子ZIC3、NKX2.5、TBX5、GATA4、TFAP2B、TBX1和FOG2與 先天性心臟病發(fā)病有密切關(guān)系[8],這些轉(zhuǎn)錄因子發(fā)生突變可能影響其蛋白質(zhì)功能從而導(dǎo)致先天性心臟病發(fā)生,尤其是NKX2.5、GTAT4、TBX5這幾個核心的轉(zhuǎn)錄因子[9],NKX2.5、GATA4的雜合突變是家族性ASD的致病原因之一[10],TBX5突變與Holt-Oram綜合征有關(guān)[11],但本研究并未發(fā)現(xiàn)心臟轉(zhuǎn)錄因子的新生突變。而國內(nèi)的一項病例對照研究發(fā)現(xiàn)在224名先天性心臟病兒童中有13.40%患兒有GATA4的突變,且病例與對照差異有意義,而NKX2.5的變異與對照比差異無統(tǒng)計學(xué)意義[12],也有研究認(rèn)為心臟轉(zhuǎn)錄因子NKX2.5與GATA4的突變在散發(fā)性先天性心臟病的作用有限[13]。而一項Meta研究表明,NKX2.5(63A>G與606G>C)的多態(tài)性與散發(fā)性先天性心臟病關(guān)系不大[14]。這些心臟轉(zhuǎn)錄因子與家族性先天性心臟病關(guān)系密切,但對于散發(fā)性先天性心臟病,這些變異具體作用仍存在爭議。
除了心臟轉(zhuǎn)錄因子外,研究發(fā)現(xiàn)eNOS(rs7830)、BMP4(rs762642)多態(tài)性會增加中國人群先天性心臟病發(fā)病風(fēng)險[15-16],病例對照研究發(fā)現(xiàn)DLC 1(Met360Lys、Glu418Lys和Asp554Val)這些預(yù)測軟件為有害的變異是與先天性心臟病有關(guān)的基因突變[17],Watkins等[18]通過對患兒與父母一家三口人群的全外顯子測序分析發(fā)現(xiàn)纖毛相關(guān)的基因突變在 先天性心臟病患兒中明顯富集。而本研究發(fā)現(xiàn)有四個與先天性心臟病有關(guān)的新發(fā)突變FHDC1(c.1977G>C;p.Gln659His)、SPRED2(c.373+1G>T)、BRD4(c.3797A>C;p.Glu1266Ala)、HK3(c.397C>G;p.Leu133Val),其中FHDC1與肌動蛋白絲形成有關(guān),另外它還是細(xì)胞骨架調(diào)節(jié)蛋白[19],這些蛋白通過協(xié)調(diào)細(xì)胞骨架動力學(xué)來影響纖毛的裝配過程,而細(xì)胞表面的纖毛起著傳遞信號的作用,其過度表達(dá)會導(dǎo)致纖毛長度增加從而影響細(xì)胞之間信號轉(zhuǎn)導(dǎo)[20]。Li 等[21]對先天性心臟病小鼠全外顯子測序發(fā)現(xiàn)有34個纖毛相關(guān)基因,16個纖毛有關(guān)的基因突變與 先天性心臟病有關(guān)。SPRED2可抑制MAPK信號通路來發(fā)揮膜相關(guān)的酪氨酸受體激酶的調(diào)節(jié)劑的作用[22]。而Ras-MAPK通路是細(xì)胞生長和分化的重要信號通路。Wright和Kerr綜述了Ras-MAPK通路中可能導(dǎo)致家族性綜合征型 先天性心臟病的基因突變[23]。有研究發(fā)現(xiàn)SPRED2是一種心臟自噬調(diào)節(jié)因子,其異常會導(dǎo)致心功能不全、心率失常[24]。因此,本研究猜測SPRED2可的突變可能通過MAPK通路來影響心臟發(fā)育導(dǎo)致先天性心臟病。BRD4是心肌細(xì)胞肥大過程中病理基因轉(zhuǎn)活化的關(guān)鍵共激活因子,在心房壓力上升的內(nèi)皮細(xì)胞中過表達(dá)[25],但該基因與先天性心臟病的關(guān)系并沒有相關(guān)報道。HK3基因編碼己糖激酶3,是糖代謝途徑一種重要的酶,是本研究第一次發(fā)現(xiàn)該基因突變與先天性心臟病有關(guān)。
本研究局限性在于納入的家系比較少,后續(xù)可能還需要進(jìn)一步加大樣本量來進(jìn)行研究。此外,通過全外顯子測序發(fā)現(xiàn)的可能與先天性心臟病發(fā)育有關(guān)的基因突變,需要今后通過相應(yīng)的實驗研究來進(jìn)一步驗證與深入探討相應(yīng)的致病機制。