管翠萍 石晶 周學(xué)章
摘要:G蛋白偶聯(lián)受體(GPCR)參與調(diào)節(jié)人體各種生理過(guò)程,它的突變及基因多態(tài)性與多種人類(lèi)遺傳性疾病相關(guān),其中50%以上的疾病突變是由功能性單核苷酸多態(tài)性構(gòu)成的。因此,建立基因多態(tài)性與疾病的相關(guān)性研究成為主要熱點(diǎn)之一。隨著生物信息技術(shù)的發(fā)展,各種機(jī)器學(xué)習(xí)方法、特征提取和數(shù)據(jù)庫(kù)資源的綜合利用,極大地方便了GPCR的突變研究。介紹了GPCR上以功能性單核苷酸多態(tài)性突變?yōu)橹鞯纳镄畔W(xué)研究方法和數(shù)據(jù)資源。
關(guān)鍵詞:G蛋白偶聯(lián)受體(GPCR);突變;功能性單核苷酸多態(tài)性;生物信息
中圖分類(lèi)號(hào):Q51;Q-332 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):0439-8114(2014)22-5342-04
G蛋白偶聯(lián)受體(GPCR)是人體內(nèi)最大的膜受體蛋白家族,參與調(diào)節(jié)各種生理過(guò)程,在信號(hào)識(shí)別和轉(zhuǎn)導(dǎo)中起著重要作用,同時(shí)它也是藥物開(kāi)發(fā)史上最有價(jià)值的藥物靶標(biāo)。GPCR的突變及其基因多態(tài)性將會(huì)引起功能失調(diào)導(dǎo)致各種疾病的產(chǎn)生, 例如視紫紅質(zhì)受體突變會(huì)引發(fā)夜盲癥和色素性視網(wǎng)膜炎[1];鈣敏感受體突變會(huì)引發(fā)遺傳性鈣代謝紊亂,導(dǎo)致家族性低鈣血癥和低鈣尿高血鈣癥的產(chǎn)生[2];GPR56受體N末端突變會(huì)導(dǎo)致大腦皮質(zhì)畸形(BFPP)[3]等。在GPCRs突變體與疾病的相關(guān)性研究中,值得一提的是,大多數(shù)與疾病相關(guān)的突變只發(fā)生在少數(shù)的幾類(lèi)GPCRs中,例如加壓素類(lèi)受體、鈣敏感受體、視紫紅質(zhì)類(lèi)受體、促黃體生成素受體、促甲狀腺素受體和黑皮素受體MC2和MC4,在這幾類(lèi)受體上包含了大多數(shù)的疾病突變位點(diǎn)[4]。另外,與GPCR相互偶聯(lián)的G蛋白發(fā)生突變后,同樣會(huì)引起信號(hào)通路異常,導(dǎo)致疾病的產(chǎn)生,例如低甲狀旁腺激素癥和青春期早熟等遺傳性疾病都與G蛋白α亞基的突變有關(guān),β、γ亞基暫無(wú)疾病相關(guān)性報(bào)道。
1 GPCR突變及多態(tài)性研究
1.1 GPCR突變類(lèi)型
編碼GPCR與G蛋白的基因發(fā)生突變后都有可能影響蛋白質(zhì)的功能,導(dǎo)致功能的失活或是激活,據(jù)此,相應(yīng)的突變也分為功能失活性突變和功能激活性突變兩種類(lèi)型。GPCR的失活性突變主要包括各種錯(cuò)義、無(wú)義、移碼突變等,它們使得正常的受體蛋白結(jié)構(gòu)發(fā)生改變(截短),阻止了激動(dòng)劑綁定后所應(yīng)發(fā)生的信號(hào)反應(yīng);與失活性突變不同,大多數(shù)激活性突變都是錯(cuò)義突變,它使得維持受體處于非活化狀態(tài)的正常約束力受到破壞,在沒(méi)有激動(dòng)劑的情況下受體仍然保持著與激動(dòng)劑綁定的狀態(tài),改變平衡向著受體激活狀態(tài)發(fā)展,最終導(dǎo)致不依賴(lài)于激動(dòng)劑的信號(hào)反應(yīng)的產(chǎn)生[4,5]。與疾病相關(guān)的突變往往發(fā)生在蛋白質(zhì)結(jié)構(gòu)的保守區(qū)域或是功能位點(diǎn)上,在GPCR結(jié)構(gòu)中,跨膜螺旋區(qū)控制著受體激活狀態(tài)與非激活狀態(tài)之間的平衡,是相對(duì)保守的區(qū)域,因此突變位點(diǎn)也以跨膜螺旋區(qū)較為常見(jiàn)[6-8]。
1.2 GPCR與功能性單核苷酸多態(tài)性
單核苷酸多態(tài)性是基因組中存在的一種數(shù)量非常豐富的變異形式,占人類(lèi)基因組中遺傳多態(tài)性的90%以上,其中的非同義單核苷酸多態(tài)性(Non-synonymous SNPs,nsSNPs),也稱(chēng)為錯(cuò)義SNP,會(huì)引起氨基酸序列的改變,有些改變直接影響到了蛋白質(zhì)的結(jié)構(gòu)或功能,從而增加了疾病的易感性[9]。這些nsSNPs往往都與蛋白質(zhì)結(jié)構(gòu)形成中的重要?dú)埢凸δ芪稽c(diǎn)緊密相關(guān)[10,11],因此也被稱(chēng)為功能性SNP,或者是有害nsSNP。據(jù)報(bào)道,每個(gè)人身上大約存在24 000~40 000個(gè)nsSNPs位點(diǎn)[12],其中引起人類(lèi)遺傳性疾病的突變中, 50%以上都是由nsSNPs構(gòu)成的[13]。例如,β2-AR腎上腺素基因發(fā)現(xiàn)有17個(gè)SNPs位點(diǎn),其中的一些功能性SNPs分別與心臟病、心血管疾病以及哮喘的發(fā)生有關(guān)[14,15];GPR10受體啟動(dòng)子區(qū)域的多態(tài)性與肥胖和糖尿病有關(guān)[16];GPCR40基因多態(tài)性與胰島素分泌和β細(xì)胞功能下降有關(guān)[17,18]。所以,在GPCRs的突變位點(diǎn)研究中,又以具有功能作用的nsSNPs備受藥物設(shè)計(jì)者的關(guān)注。這些SNPs可能是人類(lèi)基因組中疾病易感基因的遺傳標(biāo)記,甚至是直接影響癌癥、心臟病、糖尿病與其他常見(jiàn)病的易感性基因位點(diǎn)。
1.3 生物信息學(xué)方法預(yù)測(cè)功能性SNPs
目前,利用生物信息學(xué)方法對(duì)GPCR進(jìn)行的突變分析還是以其中的功能性SNPs預(yù)測(cè)為主,由于已知的GPCRs的三維結(jié)構(gòu)特征有限,所以一些根據(jù)氨基酸變異影響蛋白質(zhì)結(jié)構(gòu)來(lái)預(yù)測(cè)nsSNP致病性的方法是不適用于GPCRs研究的,因此,各種基于序列的分類(lèi)特征逐漸被應(yīng)用到GPCRs上致病性SNPs的預(yù)測(cè)。Miller等[19]指出,疾病相關(guān)的SNP與中性SNP相比,在保守性、替換類(lèi)型及頻率、化學(xué)性質(zhì)變化等存在顯著差異。Balasubramanian等[6]結(jié)合氨基酸的理化性質(zhì)、進(jìn)化信息和替代矩陣值3個(gè)方面的序列特征,建立logistic回歸模型對(duì)GPCR上的SNPs與疾病潛在的相關(guān)性進(jìn)行分析,預(yù)測(cè)準(zhǔn)確率為89%,最后得到了115個(gè)可能與疾病相關(guān)的SNPs位點(diǎn)。Xue等[20]在此基礎(chǔ)上,進(jìn)一步考慮了GPCRs序列和結(jié)構(gòu)的特征,并優(yōu)化特征屬性集,確定了6個(gè)特征:保守性、BLoSUM62矩陣值、疏水性變化、突變位置、相對(duì)溶劑可及性和掩埋電荷,利用決策樹(shù)方法對(duì)功能性SNPs進(jìn)行預(yù)測(cè),準(zhǔn)確率為91%,并總結(jié)出30條規(guī)則來(lái)區(qū)分功能性突變和非功能性突變。
現(xiàn)已報(bào)道的關(guān)于GPCRs上功能性SNPs的預(yù)測(cè)研究還很有限,而研究比較多的關(guān)于功能性與非功能性SNPs的區(qū)分方法其實(shí)也可以借鑒到GPCRs的研究上,例如張青青[21]通過(guò)隨機(jī)森林的方法結(jié)合變異位點(diǎn)的保守性、野生型氨基酸與突變后氨基酸理化性質(zhì)的差異、氨基酸替換頻率在致病組與中性組之間的差異、 突變位點(diǎn)周?chē)臍埢M成和突變位點(diǎn)之間的協(xié)同作用來(lái)預(yù)測(cè)nsSNPs的致病性。 Jiang等[22]在3個(gè)理化性質(zhì)(分子量、PI值、疏水性)的基礎(chǔ)上提取了26組特征,利用MSRV(Multiple selection rule voting)方法預(yù)測(cè)nsSNPs的有害性等。此外,也有根據(jù)不同算法開(kāi)發(fā)的分析軟件用來(lái)預(yù)測(cè)SNPs與疾病的相關(guān)性,例如SIFT[23]、PolyPhen[24]、SNAP[25]、MSRV[22]、LRT[26]、PolyPhen-2[27]、MutationTaster[28]、KGGSeq[29]、SInBaD[30]、GERP[31]、 PhyloP[32]和SNPranker 2.0[33]等。這些軟件基本都具備友好的使用界面,使用者一般需要提交蛋白質(zhì)序列或是蛋白質(zhì)ID號(hào),替換的氨基酸、替換位置、染色體或者序列比對(duì)信息等,按正確格式提交后,軟件就可自行運(yùn)行然后顯示預(yù)測(cè)結(jié)果,一般都會(huì)以分值形式給出,分值范圍基本在0~1之間,分值越接近1的,表明該SNP與疾病的相關(guān)性越大,反之越小。
2 GPCR突變及多態(tài)性研究的數(shù)據(jù)庫(kù)資源
隨著GPCR研究的發(fā)展,相應(yīng)的數(shù)據(jù)資源也在不斷地補(bǔ)充和完善中,從最早的GPCRDB,到后來(lái)各種專(zhuān)業(yè)數(shù)據(jù)庫(kù)的出現(xiàn),例如gpDB、tGRAP、GPCRNaVa等,為GPCR各個(gè)方面的研究提供了數(shù)據(jù)資源,有關(guān)GPCR突變及多態(tài)性研究的相關(guān)數(shù)據(jù)資源,如表1所示。
2.1 GPCRDB
GPCRDB(G Protein-Coupled Receptors Database)仍是目前最被廣泛使用的G蛋白偶聯(lián)受體數(shù)據(jù)庫(kù),它包含了多個(gè)物種的GPCR序列、配體結(jié)合、結(jié)構(gòu)和突變信息,以及一些通過(guò)多序列比對(duì)或是同源建模等計(jì)算方法得到的結(jié)果。其中還整合了tinyGRAP、GPCR-OKB和GPCRNaVa中的數(shù)據(jù)資源。目前最新版本2012.03.26包括來(lái)自2 098個(gè)物種的40 185條GPCR序列信息和8 235個(gè)突變信息,另外還提供了在線(xiàn)分析工具M(jìn)utationPredicter來(lái)預(yù)測(cè)點(diǎn)突變的影響效果。
2.2 tGRAP
tGRAP(G Protein-Coupled Receptors Mutant Database)早期叫tinyGRAP,是專(zhuān)門(mén)關(guān)于GPCR突變信息的數(shù)據(jù)庫(kù)。里面所有的數(shù)據(jù)均取自于研究文獻(xiàn)并進(jìn)行人工注釋?zhuān)?最新版本包含來(lái)自26個(gè)物種的1 940條蛋白序列的突變信息,每條序列上都含有多個(gè)突變位點(diǎn),并有相關(guān)的文獻(xiàn)注釋。可以通過(guò)物種、突變位置或突變類(lèi)型(插入、替換、刪除)等信息進(jìn)行搜索,同時(shí)也可以查找一些關(guān)于試驗(yàn)方面的信息(例如受體修飾位點(diǎn)、第二信使、G蛋白、質(zhì)粒等)和相應(yīng)的文獻(xiàn)報(bào)道。
2.3 GPCRNaVaDB
GPCRNaVa(Natural Variants in Human G Protein-Coupled Receptors)是關(guān)于人類(lèi)GPCR自然多變體信息的數(shù)據(jù)庫(kù),這些多變體包括罕見(jiàn)的突變和常見(jiàn)的多態(tài)性,它們對(duì)人類(lèi)表型有不同的影響,從中性到與疾病相關(guān)。GPCRNaVa整合了UniProt/SwissProt、IUPHAR、GPCRDB、dbSNP、OMIM、HGMD、tGRAP等一些在線(xiàn)數(shù)據(jù)庫(kù)、研究文獻(xiàn)以及病人信息來(lái)注釋人類(lèi)GPCRs上的自然多變體,每一條多變體信息包括其在DNA和蛋白質(zhì)序列上的定位,涉及到的核苷酸和相應(yīng)的氨基酸、等位基因頻率,與疾病的關(guān)聯(lián)性以及相關(guān)公共數(shù)據(jù)庫(kù)和研究文獻(xiàn)的鏈接。
2.4 SNPdb
單核苷酸多態(tài)性數(shù)據(jù)庫(kù)(Database of Single Nuleotide Polymorphisms)收集的遺傳多態(tài)性數(shù)據(jù)包括單核苷酸多態(tài)性(SNPs)、刪除/插入多態(tài)性(DIPs)、短串聯(lián)重復(fù)序列(STRs)和后移的元素插入4種類(lèi)型的數(shù)據(jù)信息。每條記錄都包括有突變點(diǎn)附近的DNA序列信息、檢測(cè)該突變點(diǎn)的試驗(yàn)條件、出現(xiàn)該突變?nèi)后w的特征描述, 以及群體或個(gè)人基因分型得到的頻率信息。該數(shù)據(jù)最新版本(2012年6月)里面收錄了人類(lèi)GPCR上的snp數(shù)據(jù)共5 313個(gè),其中nsSNP有508個(gè)。
2.5 SNPdbe
SNPdbe(SNP Database of Effects)數(shù)據(jù)庫(kù)是以預(yù)測(cè)為主的關(guān)于錯(cuò)義SNP(nsSNP)功能注釋的數(shù)據(jù)庫(kù)。目前, 大多數(shù)的多態(tài)性都缺少關(guān)于功能方面影響的試驗(yàn)注釋。SNPdbe數(shù)據(jù)庫(kù)包含了dbSNP和
1 000個(gè)基因組當(dāng)中的nsSNP信息以及Uniprot和PMD中的多變體信息,利用SNAP和SIFT算法進(jìn)一步整合PMD,OMIM和UniProt數(shù)據(jù)庫(kù)中關(guān)于功能、結(jié)構(gòu)以及與疾病關(guān)聯(lián)性的信息來(lái)預(yù)測(cè)nsSNP,即單氨基酸替換(SAAS)對(duì)蛋白質(zhì)功能的影響。該數(shù)據(jù)庫(kù)包括130多萬(wàn)個(gè)可引起單氨基酸替換的非同義SNP信息。研究人員可以通過(guò)組織名稱(chēng)、序列以及突變ID號(hào)來(lái)進(jìn)行搜索,根據(jù)預(yù)測(cè)結(jié)果來(lái)進(jìn)一步設(shè)計(jì)和優(yōu)化試驗(yàn)方案。
3 展望
G蛋白偶聯(lián)受體作為近幾年的“明星分子”一直是國(guó)內(nèi)外研究的熱點(diǎn),利用生物信息學(xué)技術(shù)進(jìn)行的相關(guān)研究主要集中在對(duì)受體的識(shí)別、分類(lèi)、結(jié)構(gòu)預(yù)測(cè)、 功能域分析、配體結(jié)合、與G蛋白的特異性偶聯(lián)等方面,在GPCR的突變研究中,仍以試驗(yàn)為主,通過(guò)點(diǎn)突變或是SNP檢測(cè)技術(shù)進(jìn)行疾病相關(guān)性分析。目前,隨著各類(lèi)突變信息數(shù)據(jù)庫(kù)的出現(xiàn)以及分析軟件的開(kāi)發(fā)應(yīng)用,借助生物信息學(xué)手段進(jìn)行GPCR上功能性SNPs的研究可以為GPCR突變與疾病易感性研究開(kāi)拓新的思路,同時(shí)也可有效地提高試驗(yàn)效率。另外,隨著結(jié)構(gòu)測(cè)定技術(shù)的發(fā)展,GPCR結(jié)構(gòu)信息的加入,可以更好地提高預(yù)測(cè)準(zhǔn)確率。通過(guò)預(yù)測(cè)與試驗(yàn)相結(jié)合的方法才能有效深入地了解GPCR突變的致病機(jī)理。
參考文獻(xiàn):
[1] NEIDHARDT J, BARTHELMES D, FARAHMAND F, et al. Different amino acid substitutions at the same position in rhodopsin lead to distinct phenotypes[J]. Invest Ophthaimol Vis Sci, 2006, 47(4):1630-1635.
[2] EGBUNA O I, BROWN E M. Hypercalcaemic and hypocalcaemic conditions due to calcium-sensing receptor mutations[J]. Best Pract Res Clin Rheumatol, 2008, 22(1):129-148.
[3] LUO R, JIN Z H, DENG Y Y, et al. Disease-associated mutations prevent GPR56-collagen III interaction[J]. Plos One, 2012, 7(1):e29818.
[4] SPIEGEL A M, WEINSTEIN L S. Inherited diseases involving G proteins and G protein-coupled receptors[J]. Annu Rev Med, 2004, 55:27-39.
[5] WAHLESTEDT C, BROOKES A J, MOTTAGUI-TABAR S. Lower rate of genomic variation identified in the trans-membrane domain of monoamine sub-class of Human G-protein coupled receptors: the Human GPCR-DB database[J]. Bmc Genomics, 2004, 5:91.
[6] BALASUBRAMANIAN S, XIA Y, FREINKMAN E, et al. Sequence variation in G-protein-coupled receptors: analysis of single nucleotide polymorphisms[J]. Nucleic Acids Res,2005,33:1710-1721.
[7] TAO Y X. Inactivating mutations of G protein-coupled receptors and diseases: structure-function insights and therapeutic implications[J]. Pharmacol Ther, 2006,111:949-973.
[8] LEE A, RANA B K, SCHIFFER H H, et al. Distribution analysis of non-synonymous polymorphisms within the G - protein-coupled receptor gene family[J]. Genomics, 2003,81:245-248.
[9] SCHAEFER C, BROMBERG Y, ACHTEN D, et al. Disease-related mutations predicted to impact protein function[J]. Bmc Genomics,2012,13(S4):S11.
[10] GONG S, BLUNDELL T L. Structural and functional restraints on the occurrence of single amino acid variations in human proteins[J]. Plos One,2010, 5(2):e9186.
[11] SUNYAEV S, RAMENSKY V, BORK P. Towards a structural basis of human non- synonymous single nucleotide polymorphisms[J].Trends Genet, 2000,16(5):198-200.
[12] KRAWCZAK M, BALL E, FENTON I, et al. Human gene mutation database-a biomedical information and research resource[J]. Human Mutation, 2000,15(1): 45-51.
[13] NG P C, HENIKOFF S. Predicting the effects of amino acid substitutions on protein function[J]. Annual Revew of Genomicxs and Human Genetics, 2006, 7:61-80.
[14] FORLEO C, RESTA N, SORRENTINO S, et al. Association of beta-adrenergic receptor polymorphisms and progression to heart failure in patients with idiopathic dilated cardiomyopathy[J]. Am J Med, 2004,117(7):451-458.
[15] RHONDALYN C M, GLENN A H, LEWIS C B, et al. Polymorphisms of the beta adrenergic receptor predict left ventricular remodeling following acute myocardial infarction[J]. Cardiovascular Drugs and Therapy, 2011, 25(3):251-258.
[16] 鄭 升,駱天紅,趙 萸,等.G-蛋白偶聯(lián)受體10多態(tài)性與肥胖和2型糖尿病相關(guān)性的研究[A].全國(guó)首屆代謝綜合征的基礎(chǔ)與臨床專(zhuān)題學(xué)術(shù)會(huì)議.全國(guó)首屆代謝綜合征的基礎(chǔ)與臨床專(zhuān)題學(xué)術(shù)會(huì)議論文匯編[C].北京:中華醫(yī)學(xué)會(huì)內(nèi)分泌學(xué)會(huì),2004.
[17] OGAWA T, HIROSE H, MIYASHITA K, et al. GPR40 gene Arg211His polymorphism may contribute to the variation of insulin secretory capacity in Japanese men[J]. Metabolism, 2005,54(3):296-299.
[18] WALKER C G, GOFF L, BLUCK L J, et al. Variation in the FFAR1 gene modifies BMI body composition and beta-cell function in overweight subjects: an exploratory analysis[J]. Plos One, 2011, 6(4):e19146.
[19] MILLER M P, KUMAR S. Understanding human disease mutations through the use of interspecific genetic variation[J]. Hum Mol Genet, 2001,10(21):2319-2328.
[20] XUE D, YIN J, TAN M, et al. Prediction of functional nonsynonymous single nucleotide polymorphisms in human G-protein-coupled receptors[J].J Hum Genet,2008,53(5):379-389.
[21] 張青青.nsSNP位點(diǎn)表型預(yù)測(cè)的生物信息學(xué)研究[D]. 南京:東南大學(xué),2008.
[22] JIANG R, YANG H, ZHOU L, et al. Sequence-based prioritization of nonsynonymous single nucleotide polymorphisms for the study of disease mutations[J]. American Journal of Human Genetics, 2007,81(2):346-360.
[23] NG P C, HENIKOFF S. SIFT: Predicting amino acid changes that affect protein function[J]. Nucleic Acids Res, 2003,31(13):3812-3814.
[24] RAMENSKY V, BORK P, SUNYAEV S. Human non-synonymous SNPs: server and survey[J]. Nucleic Acids Res, 2002, 30(17):3894-3900.
[25] BROMBERG Y, ROST B. SNAP: predict effect of non-synonymous polymorphisms on function[J]. Nucleic Acids Research, 2007,35(11):3823-3835.
[26] CHUN S, FAY J C. Identification of deleterious mutations within three human genomes[J]. Genome Research, 2009, 19(9):1553-1561.
[27] ADZHUBEI I A, SCHMIDT S, PESHKIN L, et al. A method and server for predicting damaging missense mutations[J]. Nature Methods, 2010,7(4):248-249.
[28] SCHWARZ J M, R?魻DELSPERGER C, SCHUELKE M, et al. Mutation taster evaluates disease-causing potential of sequence alterations[J]. Nature Methods, 2010, 7(8):575-576.
[29] LI M X, GUI H S, KWAN J S H, et al. A comprehensive frame work for prioritizing variants in exome sequencing studies of Mendelian diseases[J]. Nucleic Acids Research, 2012, 40(7):e53.
[30] KJONG-VAN L, TING C. Exploring functional variant discovery in non-coding regions with SInBaD[J]. Nucleic Acids Research, 2013, 41(1):e7.
[31] COOPER G M, GOODE D L, NG S B, et al. Single-nucleotide evolutionary constraint scores highlight disease-causing mutations[J]. Nature Methods, 2010, 7(4):250-251.
[32] SIEPEL A, POLLARD K, HAUSSLER D. New methods for detecting lineage-specific selection[A]. Proceedings of the 10th International Conference on Research in Computational Molecular Biology[C]. 2006, 190-205.
[33] MERELLI I, CALABRIA A, COZZI P, et al. SNPranker 2.0: a gene-centric data mining tool for diseases associated SNP prioritization in GWAS[J]. BMC Bioinformatics, 2013, 14(1):S9.
[34] HORN F, BETTLER E, OLIVEIRA L, et al. GPCRDB: an information system for G-protein coupled receptors[J]. Nucleic Acids Res, 2003, 31(1): 294-297.
[35] BEUKERS M W,KRISTIANSEN I,IJZERMAN A P, et al. TinyGRAP database: a bioinformatics tool to mine G protein-coupled receptor mutant data[J]. Trends Pharmacol Sci, 1999, 20(12):475-477.
[36] KAZIUS J, WURDINGER K, ITERSON M V, et al. GPCR NaVa database: natural variants in human g protein-coupled receptors[J]. Human Mutation, 2008, 29(1):39-44.
[37] HARMAR A J,HILLS R A,ROSSER E M, et al. IUPHAR-DB: the IUPHAR database of G protein-coupled receptors and ion channels[J].Nucleic Acids Res,2009,1(37):680-685.
[38] SHERRY S T, WARD M H, KHOLODOV M,et al. DbSNP: the NCBI database of genetic variation[J]. Nucleic Acids Research, 2001, 29(1):308-311.
[39] SCHAEFER C, MEIER A, ROST B, et al. SNPdbe: constructing an nsSNP functional impacts database[J]. Bioinformatics, 2012, 28(4):601-602.
[40] LIU X, JIAN X, BOERWINKLE E. dbNSFP: a lightweight database of human nonsynonymous SNPs and their functional predictions[J]. Human Mutation, 2011, 32(8):894-899.
[41] HAMOSH A, SCOTT A F, AMBERGER J S, et al. Online mendelian inheritance in man (OMIM), a knowledgebase of human genes and genetic disorders[J]. Nucleic Acids Research, 2005, 33:514-517.
[42] STENSON P D, BALL E V, MORT M, et al. Human gene mutation database (HGMD): 2003 update[J]. Human Mutation, 2003, 21(6):577-581.
[43] FREDMAN D, SIEGFRIED M, YUAN Y P, et al. HGVbase:a human sequence variation database emphasizing data quality and a broad spectrum of data sources[J]. Nucleic Acids Research, 2002, 30(1):387-391.
[44] CLARKE L,ZHENG-BRADLEY X,SMITH R,et al.1000 Genomes project consortium. The 1000 genomes project: data management and community access[J]. Nat Methods,2012,9(5):459-462.