張立男 ,宋雨桐 ,姜磊 ,朱如心 ,李莉
(1.司法鑒定科學(xué)研究院 上海市法醫(yī)學(xué)重點(diǎn)實(shí)驗(yàn)室 上海市司法鑒定專業(yè)技術(shù)服務(wù)平臺,上海 200063;2.華東政法大學(xué),上海 200063)
單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)是指在基因組水平上由單個(gè)核苷酸變異引起的DNA序列多態(tài)性,是人類可遺傳變異中最常見的一種,占所有已知多態(tài)性的90%以上。SNP具有突變率低、可穩(wěn)定遺傳、部分位點(diǎn)與個(gè)體外觀表現(xiàn)有關(guān)[1]、有利于降解檢材分析[2]、便于高通量自動(dòng)化分型檢測等優(yōu)點(diǎn)[3]。
Y染色體為男性特有的性染色體,除非發(fā)生突變,否則同一父系的男性后代均具有相同的單倍型,故可以用來揭示不同人群的起源、遷徙及親緣關(guān)系等。Y染色體上SNP位點(diǎn)(Y-SNP)分型檢測方法的建立,可以輔助現(xiàn)有的Y-STR檢測體系,協(xié)助進(jìn)行疑難案件的鑒定。本研究采用多重PCR聯(lián)合基質(zhì)輔助激光解吸/電離-飛行時(shí)間質(zhì)譜(matrix-assisted laser desorption/ionization time-of-flight mass spectrometry,MALDI-TOF-MS)技術(shù)對西北漢族人群71個(gè)Y-SNP位點(diǎn)進(jìn)行多態(tài)性調(diào)查,并結(jié)合前期研究所得,篩選同時(shí)適用于西北、華南和華東漢族群體的位點(diǎn),旨在為法醫(yī)學(xué)應(yīng)用提供基礎(chǔ)數(shù)據(jù)。
在知情同意原則下,收集西北新疆地區(qū)漢族男性無關(guān)個(gè)體血樣202份,每份樣本取200μL。
DNA抽提試劑盒QIAamp DNA Blood Mini試劑盒(德國Qiagen公司),基因分型系統(tǒng)Complete iPLEX?Gold Genotyping Reagent Sets(96 Format,美國 Agena公司),9700型PCR儀(美國AB公司),MassARRAY?飛行時(shí)間質(zhì)譜儀、MassARRAY?納升點(diǎn)樣儀RS1000(美國Agena公司),MassARRAY Typer 4.0軟件(美國Agena公司)。
通過Y染色體系統(tǒng)樹、Hapmap數(shù)據(jù)庫[4]、美國國立生物技術(shù)信息中心(National Center for Biotechnology Information,NCBI)數(shù)據(jù)庫[5]進(jìn)行檢索,結(jié)合《法醫(yī)SNP分型與應(yīng)用規(guī)范》(SF/Z JD0105003—2015)的要求,從Y染色體上篩選出在東亞人群中具有多態(tài)性的71個(gè)SNP位點(diǎn),用Agena Bioscience公司的在線工具[6]設(shè)計(jì)用于PCR擴(kuò)增的引物和單堿基延伸反應(yīng)的引物。
依據(jù)各個(gè)位點(diǎn)之間的距離并避免引物之間的相互干擾,將71個(gè)位點(diǎn)分成W1、W2、W3復(fù)合體系(表1)進(jìn)行檢測,PCR擴(kuò)增子的大小為80~120bp,單堿基延伸產(chǎn)物的相對分子質(zhì)量為4429~8710。
表1 3個(gè)復(fù)合擴(kuò)增體系所包含的Y-SNP位點(diǎn)
用QIAamp DNA Blood Mini試劑盒進(jìn)行DNA抽提。擴(kuò)增體系為5 μL,含10×PCR緩沖液0.5 μL、25 mmol/L MgCl20.4 μL、PCR 引物混合液 0.5 μL、25mmol/L dNTP混合液0.1μL、5U/μL PCR酶0.1μL、純水 1.4 μL、模板DNA 溶液 2 μL。PCR 循環(huán)參數(shù):95℃ 2 min;95℃ 30 s,56℃ 30 s,72℃ 60 s,45個(gè)循環(huán);72℃ 5 min。PCR擴(kuò)增結(jié)束后,加入1.7 U/μL蝦堿性磷酸酶(shrimp alkaline phosphatase,SAP)0.30 μL、SAP 緩沖液0.17 μL 和超純水 1.53 μL,按下述條件進(jìn)行酶切反應(yīng):37℃ 40min,85℃ 5min。
在純化后的產(chǎn)物中加入10×iPLEX?緩沖液0.20μL、單堿基延伸引物混合液0.94μL、10×iPLEX?終止 混合物 0.20 μL、iPLEX?酶 0.04 μL、超純水0.62μL,按下列條件進(jìn)行單堿基延伸反應(yīng):94℃ 5s;52℃ 5s,80℃ 5s,5次小循環(huán);40次大循環(huán)。
按參考文獻(xiàn)[7]中的方法對產(chǎn)物脫鹽后,使用Mass-ARRAY?納升點(diǎn)樣儀RS1000將反應(yīng)產(chǎn)物點(diǎn)樣至芯片上(點(diǎn)樣量控制在8~12nL),將點(diǎn)樣完畢的芯片放入MassARRAY?飛行時(shí)間質(zhì)譜儀進(jìn)行質(zhì)譜檢測,用Mass-ARRAY Typer 4.0軟件查看分型結(jié)果。
用直接計(jì)數(shù)法計(jì)算各Y-SNP位點(diǎn)在西北漢族無關(guān)男性人群中的等位基因頻率,基因多樣性(gene di-versity,GD)計(jì)算公式:
式中,n為樣本數(shù),fi為第i個(gè)等位基因的分布頻率。單倍型多樣性(haplotype diversity,HD)[8]計(jì)算公式:
式中,n為單倍型數(shù),Pi為第i個(gè)單倍型的頻率。用Arlequin v3.5軟件[9]計(jì)算單倍型頻率、Fst值和P值,并進(jìn)行群體遺傳學(xué)比較。Fst是種群分化和遺傳距離的一種衡量方法,WRIGHT[10]建議:Fst為 0~0.05,群體間遺傳分化可以不考慮;Fst為0.05~0.15,群體間存在中等程度的遺傳分化;Fst為0.15~0.25,群體間遺傳分化較大;Fst>0.25,則群體間有很大的遺傳分化。
經(jīng)過實(shí)驗(yàn)和統(tǒng)計(jì),得到西北地區(qū)漢族無關(guān)男性人群71個(gè)Y-SNP位點(diǎn)的等位基因頻率數(shù)據(jù)和GD值,有67個(gè)位點(diǎn)在西北漢族人群中呈多態(tài)性分布,詳見表2。
表2 西北漢族無關(guān)男性人群71個(gè)Y-SNP位點(diǎn)的等位基因頻率和GD值 (n=202)
表2顯示,在所選擇的位點(diǎn)中除M148、rs2032645、rs9306841、SRY8299外,其余67個(gè)位點(diǎn)都具有多態(tài)性,GD值在0.0100(rs11575897和rs9341278)~0.5022(rs17276358)。中度信息量(0.2≤GD<0.3)的位點(diǎn)有22個(gè)(M117、M119、rs2032631、rs2032652、rs2032678、rs2075181、 rs35284970、 rs16980391、 rs16980396、rs3900、rs4589047、rs52812045、rs7067458、rs17174528、rs17250121、rs9306845、rs9306848、rs9785908、rs17276777、rs9786502、rs9786707、rs17842387),高度信息量(GD≥0.3)的位點(diǎn)有25個(gè)(M122、M134、rs2032674、rs11096432、rs2196155、rs13447361、rs2267801、rs16980363、rs3853054、rs16980426、rs16980601、rs16980610、rs16980641、rs16981290、rs917759、rs17269396、rs17269816、rs17269928、rs17286338、rs17276358、rs9786394、rs17316007、rs17316543、rs17316592、rs17323322)。
使用Arlequin v3.5統(tǒng)計(jì)軟件分析71個(gè)Y-SNP位點(diǎn)的單倍型發(fā)現(xiàn),本群體共有170種單倍型,其中頻率最高的為0.034 8(7/202),頻率最低的只有0.005 0(1/202)。經(jīng)計(jì)算,HD為0.9930。
結(jié)合前期的實(shí)驗(yàn)結(jié)果[7,11],用 Arlequin v3.5 軟件計(jì)算Fst值和P值,對華東、華南和西北漢族無關(guān)男性人群的等位基因分布進(jìn)行比對分析(表3)。
表3 71個(gè)Y-SNP位點(diǎn)在華東、華南和西北漢族無關(guān)男性人群的等位基因分布差異
續(xù)表3
表3數(shù)據(jù)顯示:華東與西北漢族無關(guān)男性群體之間有7個(gè)位點(diǎn)存在中等程度以上的分化,華東與華南之間只有4個(gè)位點(diǎn)存在中等程度以上的分化,西北與華南之間有15個(gè)位點(diǎn)存在中等程度以上的分化。
71個(gè)位點(diǎn)中,分別有11個(gè)位點(diǎn)在華東與西北漢族群體的差異具有統(tǒng)計(jì)學(xué)意義(P<0.05)、8個(gè)位點(diǎn)在華東與華南漢族群體的差異具有統(tǒng)計(jì)學(xué)意義(P<0.05)、36個(gè)位點(diǎn)在華南與西北漢族群體的差異具有統(tǒng)計(jì)學(xué)意義(P<0.05)。
結(jié)合本實(shí)驗(yàn)結(jié)果與前期研究取得的華南、華東漢族群體的遺傳學(xué)數(shù)據(jù)[7,11],通過評價(jià)GD值,篩選出在西北、華南和華東群體具有較高信息量的Y-SNP位點(diǎn)。統(tǒng)計(jì)結(jié)果表明,在西北、華東和華南3個(gè)地域群體均具有應(yīng)用價(jià)值的Y-SNP位點(diǎn)共有26個(gè)(表4)。
表4 在西北、華東和華南漢族群體中具有中、高度信息量的位點(diǎn)
續(xù)表4
觀察本實(shí)驗(yàn)結(jié)果,分析檢測的71個(gè)Y-SNP位點(diǎn)在西北漢族無關(guān)男性人群的多態(tài)性及等位基因分布頻率,可知有67個(gè)Y-SNP在西北漢族男性人群中呈多態(tài)性分布,GD值在0.010 0~0.502 2,中度信息量(0.2≤GD<0.3)的位點(diǎn)有22個(gè),高度信息量(GD≥0.3)的位點(diǎn)有25個(gè)。本課題組前期研究結(jié)果[7,11]顯示,華南和華東漢族人群中分別有66、67個(gè)位點(diǎn)存在遺傳多樣性,中度信息量的分別有18、31個(gè),高度信息量的分別有13、18個(gè),整合本研究結(jié)果可知,同時(shí)適用于西北、華南和華東群體的中高度信息量的位點(diǎn)有26個(gè)。他們在親權(quán)鑒定和個(gè)體識別中具有一定的應(yīng)用價(jià)值,可以作為STR、Y-STR檢測的補(bǔ)充。
經(jīng)比較分析P值,發(fā)現(xiàn)華南和西北漢族群體之間的差異最大,華東與西北漢族群體之間的差異次之,華東與華南漢族群體之間的差異最小。分析比較Fst值發(fā)現(xiàn),西北與華南之間分化的程度最高,華東與西北漢族無關(guān)男性群體之間分化程度居中,華東與華南之間分化程度最低。由此可見,Y染色體上SNP標(biāo)記的等位基因分布具有一定的地域差異,用于法醫(yī)學(xué)鑒定時(shí),需要使用相應(yīng)區(qū)域的群體遺傳學(xué)數(shù)據(jù)。
目前,SNP在法醫(yī)學(xué)中的研究主要有兩個(gè)方面:(1)對SNP位點(diǎn)進(jìn)行篩選,獲得不同人群的分布頻率,建立數(shù)據(jù)庫,用于個(gè)體識別和親權(quán)鑒定;(2)對SNP位點(diǎn)的功能進(jìn)行分析,通過對現(xiàn)場遺留的生物檢材的部分位點(diǎn)進(jìn)行分型,提供嫌疑人的一些特征,如毛發(fā)顏色、眼睛顏色等[12]。
本研究對西北漢族男性無關(guān)個(gè)體的71個(gè)Y-SNP位點(diǎn)進(jìn)行分析,共檢測出170種單倍型,其中頻率最高的為0.034 8(7/202),頻率最低的只有0.005 0(1/202)。HD為0.993 0,得到了較大的群體遺傳信息,可應(yīng)用于涉及男性的個(gè)體識別和親權(quán)鑒定的案例中。例如,在進(jìn)行父系關(guān)系檢驗(yàn)的時(shí)候,某些情況下僅僅憑借Y-STR分型的結(jié)果難以出具鑒定意見,不能因?yàn)閹讉€(gè)STR的分型結(jié)果不同而否定父系關(guān)系[13],針對這種案例,對高信息量的Y-SNP位點(diǎn)進(jìn)行分型檢測可以視為一種補(bǔ)充鑒定的手段。
同時(shí),本實(shí)驗(yàn)也比對了華南、華東地區(qū)漢族男性Y-SNP位點(diǎn)的分布特點(diǎn),篩選出26個(gè)在西北、華南和華東漢族具有普適性的位點(diǎn),這將有助于完善法醫(yī)DNA檢驗(yàn)手段。