劉鳳姣,郭麗文
(知識(shí)產(chǎn)權(quán)出版社有限責(zé)任公司,北京 100081)
精準(zhǔn)醫(yī)療是以個(gè)體化醫(yī)療為基礎(chǔ)并伴隨基因組測(cè)序技術(shù)以及生物信息與大數(shù)據(jù)科學(xué)的交叉應(yīng)用而發(fā)展起來的一種新型醫(yī)療模式?;驕y(cè)序是精準(zhǔn)醫(yī)療的基礎(chǔ),它為遺傳性疾病的診斷和治療帶來了新的機(jī)遇,為保障全民健康,降低出生缺陷和遺傳咨詢提供了良好依據(jù),同時(shí)也能產(chǎn)生一定的經(jīng)濟(jì)和社會(huì)效益。
從冗雜的測(cè)序數(shù)據(jù)中建立基因變異、疾病與臨床表型的聯(lián)系,是當(dāng)今的研究熱點(diǎn)。圍繞美國醫(yī)學(xué)遺傳學(xué)與基因組學(xué)學(xué)會(huì)制定的《遺傳變異分類標(biāo)準(zhǔn)與指南》(ACMG指南)[1]、遺傳相關(guān)數(shù)據(jù)庫、生物信息學(xué)軟件和具體案例探討判斷一個(gè)基因變異位點(diǎn)致病風(fēng)險(xiǎn)的方法,為疾病尤其是遺傳疾病的診療提供參考依據(jù)。
ACMG指南將基因變異利用28條證據(jù)進(jìn)行5級(jí)分類,即致病的、可能致病的、意義不明確的、可能良性的和良性的。其中可能致病的和可能良性的是具有大于90%可能致病或者良性的變異,盡管90%是人為界定的,但是它給實(shí)驗(yàn)室提供了一種共同的定義。致病性變異證據(jù)分為非常強(qiáng)(PVS1)、強(qiáng)(PS1~PS4)、中等(PM1~PM6)和輔助證據(jù)(PP1~PP5);良性變異證據(jù)分為獨(dú)立(BA1)、強(qiáng)(BS1~BS4)和輔助證據(jù)(BP1~BP7)。其中數(shù)字只作為分類標(biāo)注,不具有任何意義。根據(jù)5級(jí)分類規(guī)則可判斷基因變異導(dǎo)致疾病發(fā)生的可能性。例如,一個(gè)變異基因存在(1個(gè)PVS1+≥1個(gè)PS)證據(jù),或(1個(gè)PVS1+≥2個(gè)PM)證據(jù),則該變異屬于致病性變異,具體的規(guī)則可參照ACMG指南。
目前,人類基因組中發(fā)現(xiàn)了大量的變異和新的基因,并且被收錄到各大數(shù)據(jù)庫中,為基因測(cè)序與疾病分析提供了重要參考信息。常用的人群數(shù)據(jù)庫有 ExAC、dbSNP、1000 Genomes、ESP6500、dbVar和COSMIC等;疾病數(shù)據(jù)庫有OMIM、HGMD、ClinVar和DECIPHER等;序列數(shù)據(jù)庫有NCBI、RefSeqGene、LRG等[2-4]。人群數(shù)據(jù)庫可以用于分析某個(gè)變異在大規(guī)模人群中發(fā)生的頻率,如果某一等位基因頻率>5%,則其存在良性變異的獨(dú)立證據(jù)(BA1)。疾病數(shù)據(jù)庫主要包括人類疾病相關(guān)基因的突變信息,其中可能包括一些分類錯(cuò)誤的變異,在用于臨床時(shí),需要謹(jǐn)慎并追溯突變來源,確認(rèn)數(shù)據(jù)中的基因變異是否為患病原因。序列數(shù)據(jù)庫用于生物信息注釋,如基因位置、核苷酸、參考序列,使用參考序列時(shí),應(yīng)該參照同一基因組版本,目前較常使用的基因組版本為GRCh37/hg19。
生物信息學(xué)以基因組DNA序列為分析源頭,利用信息學(xué)、應(yīng)用數(shù)學(xué)、統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)等從大量的數(shù)據(jù)中提取有用的生物學(xué)信息,進(jìn)行序列比對(duì)、基因識(shí)別與表達(dá)、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)和表達(dá)以及建立進(jìn)化模型等。基于生物信息學(xué)開發(fā)的各類預(yù)測(cè)軟件從核苷酸或氨基酸水平判斷一個(gè)變異可能產(chǎn)生的有害或無害影響,其主要預(yù)測(cè)錯(cuò)義突變對(duì)蛋白功能或結(jié)構(gòu)產(chǎn)生的影響,剪接突變對(duì)內(nèi)含子和外顯子剪接產(chǎn)生的影響。常用的錯(cuò)義突變預(yù)測(cè)軟件有 SIFT、PolyPhen-2、REVEL和 MutationTaster;剪接突變預(yù)測(cè)軟件有HSF、MaxEntScan、NetGene2和GeneSplicer[2,4-5]。各類預(yù)測(cè)軟件采用的算法不一樣,所以在基因變異數(shù)據(jù)分析過程中,應(yīng)該采用多種軟件組合分析,并且慎重應(yīng)用到臨床上。
結(jié)合具體基因變異位點(diǎn)分析如何得到一個(gè)有參考價(jià)值的基因檢測(cè)結(jié)果。以SCN1A基因錯(cuò)義突變?yōu)槔?,chr2_166903480、NM_001165963、exon12、c.1177C>T(編碼區(qū)第1 177位核酸的胞嘧啶變異為胸腺嘧啶,會(huì)導(dǎo)致第393號(hào)氨基酸由精氨酸變異為半胱氨酸),父母均沒有檢測(cè)到此變異,屬于自發(fā)突變。
運(yùn)用數(shù)據(jù)庫資源和生物信息預(yù)測(cè)軟件結(jié)合ACMG指南分析該SCN1A變異的致病性。根據(jù)表1得到PS1、PM2、PP3和PP5證據(jù),且該SCN1A變異屬于自發(fā)突變,存在PS2證據(jù),所以PS1+PS2+PM2+PP3+PP5≥2個(gè)PS證據(jù),此SCN1A變異為致病性變異,會(huì)產(chǎn)生癲癇相關(guān)的病癥。如果該變異位點(diǎn)沒有進(jìn)行家系驗(yàn)證或者不是自發(fā)突變,即不存在PS2證據(jù),則該SCN1A變異為可能致病的變異。
臨床基因測(cè)序一般是為了確認(rèn)疾病原因,進(jìn)行腫瘤和遺傳性疾病的風(fēng)險(xiǎn)評(píng)估、指導(dǎo)科學(xué)用藥以及輔助制定個(gè)性化治療方案等。鑒于一些遺傳疾病的復(fù)雜性,如果根據(jù)ACMG指南得到的結(jié)論是致病性的,但是當(dāng)基因變異產(chǎn)生的表型與患者的真實(shí)臨床表型不相符,此時(shí)就需重新分析,是否遺漏患者臨床信息或者患者對(duì)自身病癥有錯(cuò)誤描述、測(cè)序數(shù)據(jù)是否可信、是否存在其他基因的共同作用等,不能只根據(jù)ACMG指南的致病性判斷而產(chǎn)生基因變異與疾病/臨床表型不匹配的結(jié)果。
基因檢測(cè)報(bào)告可以輔助臨床診斷,但其不能作為一個(gè)診斷報(bào)告,僅僅是一個(gè)參考數(shù)據(jù)?;驒z測(cè)報(bào)告中一般涵蓋主要的基因變異信息,繁多的變異位點(diǎn)容易給患者帶來恐慌,建議將臨床意義未明的變異進(jìn)行備注,清楚寫明這些變異可能造成的影響,那些與臨床不相關(guān)的重要基因,可以不放入被檢者報(bào)告中而作為原始數(shù)據(jù)發(fā)送給醫(yī)生或患者作為參考。對(duì)于健康體檢人群則要提前告知被檢者,檢測(cè)可能會(huì)發(fā)現(xiàn)與疾病相關(guān)的一些變異,但不代表一定會(huì)患病,其只僅僅反映了罹患某疾病的風(fēng)險(xiǎn),以便于早采取干預(yù)措施,預(yù)防疾病的發(fā)生。
表1 SCN1A基因變異分析結(jié)果
現(xiàn)階段基因檢測(cè)行業(yè)普遍采用的是第二代測(cè)序技術(shù),靶點(diǎn)多、通量高、數(shù)據(jù)量大、質(zhì)控參數(shù)多,所以送檢樣本的測(cè)序深度和數(shù)據(jù)質(zhì)量是把控重點(diǎn)。質(zhì)量合格的樣本、熟練的技術(shù)操作人員和每個(gè)操作流程規(guī)范化顯得尤為重要。隨著檢測(cè)樣本的增多,可以建立行業(yè)內(nèi)的我國人口的基因變異與疾病共享數(shù)據(jù)庫,積累基因變異信息,為后續(xù)的數(shù)據(jù)分析和疾病預(yù)防、診斷、用藥指導(dǎo)、康復(fù)等提供便利。