(貴州醫(yī)科大學(xué)法醫(yī)學(xué)院,貴州 貴陽 550004)
人類Y染色體為男性特有的性染色體,其在減數(shù)分裂中不發(fā)生重組,以單倍體形式呈父系遺傳[1]。單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)是指單個(gè)核苷酸變異引起的DNA序列多態(tài)性,其突變率較STR低,具有較高的遺傳穩(wěn)定性[2]。Y染色體SNP(Y-SNP)單倍群譜系在世界人群中的分布具有很強(qiáng)的地理特異性,是研究人類父系遷移的理想遺傳標(biāo)記[3-5]。其中單倍群O、C、D、N約占東亞男性的93%[6],O單倍群下游O1a-M199、O2a1-M95在中國(guó)南方集中分布,是南方壯侗語族人群的主要單倍型[7-8]。在法醫(yī)學(xué)領(lǐng)域,Y-SNP單倍群可用于推斷生物學(xué)檢材的族群地域來源[9-10],在陳舊性檢材的身份鑒定中亦得到成功應(yīng)用,如曹操叔祖父[11]、中國(guó)赴緬遠(yuǎn)征軍[12]、淮海戰(zhàn)役[13]等的遺骸鑒定。
水族是貴州省18個(gè)世居民族之一,主要聚居于黔桂交界的龍江、都柳江上游地帶,貴州省黔南的三都水族自治縣、荔波、獨(dú)山、都勻等縣市為其主要居住區(qū)。2003年何燕等[14]采用聚合酶鏈?zhǔn)椒磻?yīng)-限制性片段長(zhǎng)度多態(tài)性(polymerase chain reaction-restriction fragment length polymorphism,PCR-RFLP)技術(shù)研究,發(fā)現(xiàn)貴州三都水族的Y染色體單倍群主要為南方人群主要的單倍型O2a1-M95與O1a-M119,頻率高達(dá)90%。本研究對(duì)貴州180份水族男性無關(guān)個(gè)體Y染色體上的11個(gè)Y-SNP位點(diǎn)進(jìn)行分型檢測(cè),進(jìn)一步分析其單倍群分布情況,探索其與其他民族的親緣關(guān)系,以期為法醫(yī)學(xué)族群地域推斷應(yīng)用和群體遺傳學(xué)研究提供基礎(chǔ)數(shù)據(jù)。
本研究使用的所有血痕濾紙片由貴州醫(yī)科大學(xué)法醫(yī)學(xué)院法醫(yī)司法鑒定中心提供。收集來自貴州省荔波縣、獨(dú)山縣、三都縣、都勻市地區(qū)三代均為水族的無血緣關(guān)系男性樣本180例,記錄為貴州水族。在簽署知情同意書的前提下,采集指尖血制成血痕濾紙片,自然陰干,常溫保存。采用Chelex-100法[2]提取DNA,-20℃保存?zhèn)溆?。本研究已通過貴州醫(yī)科大學(xué)倫理委員會(huì)審查批準(zhǔn)。
單倍群O-M175、C-M130、D-M174和N-M231是東亞4個(gè)主要的Y染色體單倍群,其中O-M175是東亞最大的單倍群,約占75%[7-8]。依據(jù)2018版Y染色體譜系樹(https://isogg.org/tree/2018/index18.html)和文獻(xiàn)[15]調(diào)研,本研究選擇了O-M175、C-M130、D-M174和N-M231位點(diǎn)及O單倍群下游的O1-F265、O2-M122、O1a-M119、O1b-M268、O2a-M324、O2b-F742、O2a2-IMS-JST021354共11個(gè)Y-SNP位點(diǎn)對(duì)貴州水族180份男性樣本進(jìn)行研究。
采用微測(cè)序技術(shù)對(duì)貴州水族男性樣本11個(gè)YSNP位點(diǎn)的分型進(jìn)行檢測(cè)[16],擴(kuò)增引物及延伸引物見表1。使用9700型PCR儀(美國(guó)Applied Biosystems公司)進(jìn)行PCR擴(kuò)增,用3500遺傳分析儀(美國(guó)Applied Biosystems公司)進(jìn)行毛細(xì)管電泳檢測(cè)。利用Gene-MapperTMID-X v1.4軟件(美國(guó)Thermo Scientific公司)進(jìn)行等位基因分型。
表1 11個(gè)Y-SNP位點(diǎn)的擴(kuò)增引物和延伸引物信息Tab.1 Information of the amplification primers and extension primers for the 11 Y-SNP loci
續(xù)表1Continued Tab.1
根據(jù)每個(gè)樣本11個(gè)Y-SNP位點(diǎn)的分型判斷其所屬單倍群類別,用直接計(jì)數(shù)法統(tǒng)計(jì)180例貴州水族無關(guān)男性樣本的Y-SNP單倍群頻數(shù)及頻率?;谒芯康馁F州水族及文獻(xiàn)[17-21]報(bào)道的22個(gè)民族群體的YSNP單倍群頻率數(shù)據(jù),采用統(tǒng)計(jì)軟件包Multi-variate statistical package(MVSP)對(duì)包括研究目標(biāo)在內(nèi)的23個(gè)群體進(jìn)行主成分分析(principal component analysis,PCA)。采用Arlequin v3.5軟件計(jì)算貴州水族與其他群體的Fst遺傳距離,使用MEGA 4.0軟件根據(jù)Fst值繪制系統(tǒng)發(fā)生樹。
11個(gè)Y-SNP位點(diǎn)所構(gòu)成的單倍群譜系樹如圖1所示。180例貴州水族男性樣本中,共觀察到6種Y染色體單倍群:C-M130、D-M174、O1a-M199、O1b-M268、O2a-M324和 O2a2-IMS-JST021354。O 單倍群的分布頻率最高,為71.11%,其次是C單倍群,為25.00%,之后是D單倍群,為3.89%,未觀察到N-M231單倍群。其中分布頻率較高的是O1b-M268、O2a2-IMS-JST021354、C-M130單倍群,分別為31.11%、28.33%、25.00%。分布頻數(shù)和頻率如表2所示。
圖1 11個(gè)Y-SNP位點(diǎn)構(gòu)成的單倍群譜系樹Fig.1 Haplogroup pedigree tree of the 11 Y-SNP loci
表2 貴州水族單倍群頻數(shù)及頻率Tab.2 Numbers and frequencies of haplogroups in Guizhou Shui ethnic group
基于單倍群頻率進(jìn)行PCA,結(jié)果如圖2所示。PC1和PC2的貢獻(xiàn)率分別為41.90%和26.74%,兩者的累計(jì)貢獻(xiàn)率為68.64。從圖2可以看出,除貴州毛南族與畬族外,其余民族的分布較為集中。本研究中貴州水族與貴州仡佬族和漢族的遺傳距離較近,與貴州毛南族、畬族及羌族關(guān)系較遠(yuǎn)。從語系角度來看,除毛南族與布依族外,大部分壯侗語族(壯族、侗族、水族、仡佬族、仫佬族)距離較近;阿爾泰語系(蒙古族、滿族)均在第二象限,距離也較近;漢語語族(漢族、回族)分布較為離散,不在同一象限;大部分的藏緬語族(納西族、彝族、土家族、白族)距離較近,而景頗族及羌族距離較遠(yuǎn);苗瑤語族除畬族外,瑤族與苗族均在第一象限,距離較近。
圖2 貴州水族與其他22個(gè)民族的PCA圖Fig.2 Principal component analysis of Guizhou Shui ethnic group and other 22 ethnic groups
貴州水族與其他22個(gè)民族的系統(tǒng)發(fā)生樹如圖3所示。系統(tǒng)發(fā)生樹顯示本研究對(duì)象貴州水族單為一類,與貴州同語族的仡佬族、侗族父系的親緣關(guān)系最近。系統(tǒng)發(fā)生樹中顯示畬族與其他22個(gè)民族分為兩支。按語言分類來看,各族群以小范圍相同語系族群聚集在一起:壯侗語族中,仡佬族、水族、侗族親緣關(guān)系較近,壯族、仫佬族、三都水族親緣關(guān)系較為接近,而布依族及毛南族則與他們親緣關(guān)系較遠(yuǎn);藏緬語族的彝族、白族、納西族親緣關(guān)系最近,與土家族、羌族、景頗族親緣關(guān)系較遠(yuǎn);苗瑤語族的苗族與瑤族親緣關(guān)系較近;阿爾泰語系的滿族與蒙古族親緣關(guān)系較遠(yuǎn),同時(shí)漢語語族的漢族與回族親緣關(guān)系也較遠(yuǎn)。PCA圖與系統(tǒng)發(fā)生樹結(jié)果相一致,均提示貴州水族與貴州仡佬族父系的遺傳關(guān)系較近。
圖3 貴州水族與其他22個(gè)民族的系統(tǒng)發(fā)生樹Fig.3 Phylogenetic tree of Guizhou Shui ethnic group and other 22 ethnic groups
本研究對(duì)貴州水族男性無關(guān)個(gè)體11個(gè)Y-SNP位點(diǎn)進(jìn)行分型,共觀察到6種單倍群,頻率最高的為OM175單倍群(71.11%),這與我國(guó)Y染色體單倍群的分布頻率一致,約75%的中國(guó)人可歸到這一類[5]。OM175是東亞人群的特征性單倍群,為O單倍群下游分支,O2-M122是漢藏族群的主要單倍群,而O1a-M119是壯侗語族群的高頻率單倍群,O1b-M268和O2a2-IMS-JST021354 常見于 南 方少數(shù)民族[7-8,22]。2003 年 ,何燕等[14]對(duì)92例貴州三都水族Y染色體單倍群進(jìn)行分析,主要單倍群為O2a1-M95(58.70%)和O1a-M119(31.50%),但是樣本量較少,Y染色體單倍群數(shù)據(jù)存在一定的偏差。而在本研究中O1b-M268(31.11%)和 O2a2-IMS-JST021354(28.33%)均比 O1a-M119(10.56%)所占比例高,三者所占比例之和為70.00%,表明貴州水族是典型的南方少數(shù)民族。C-M130單倍群的頻率為25.00%,相較于以往的文獻(xiàn)報(bào)道存在一定差異。2003年,文波[23]檢測(cè)的50例貴州三都水族人群中未觀察到C-M130單倍群。2019年,張秀秀[17]在研究貴州17個(gè)世居少數(shù)民族人群時(shí),也未檢出C-M130單倍群。這可能與樣本的采集地域和樣本數(shù)量有關(guān),同時(shí)也為貴州水族人群提供了新的參考數(shù)據(jù)。M130是C單倍群的特征位點(diǎn),起源于第一批從非洲遷出的現(xiàn)代人類,在歐亞大陸的東部、東亞、東南亞地區(qū)人群可見,且C-M130下游的分支都有著區(qū)域特異性分布[24],提示對(duì)貴州水族人群的族群來源或者對(duì)與之有基因交流的人群進(jìn)行研究時(shí),還應(yīng)對(duì)C單倍群下游的分支進(jìn)行分型。
對(duì)貴州水族與其他22個(gè)民族Y-SNP主要單倍群頻率進(jìn)行比較,可以看出,不同語系之間存在差異,除苗瑤語族的畬族以及漢語語族的貴州漢族、回族較為離散外,各語系以小范圍的族群相互聚集在一起。而對(duì)于畬族及回族的語言歸屬存在過爭(zhēng)議,根據(jù)其使用語言分別定為苗瑤語族及漢語語族[25-26]。從各語系聚類結(jié)果來看,聚類效果并不明顯,這可能是由于所選擇參考人群大部分為貴州族群,地理位置較為接近、各族群基因交流頻繁所致。從PCA圖可以初步看出,本研究的貴州水族與貴州仡佬族遺傳距離最近。余躍生等[27]研究貴州水族線粒體DNA時(shí)發(fā)現(xiàn),貴州水族與壯族存在較多的單倍型共享,與其具有同源性。本課題組前期對(duì)該貴州水族男性人群Y-STR進(jìn)行研究時(shí)發(fā)現(xiàn),貴州水族也與壯族遺傳關(guān)系較近[28],但是對(duì)貴州水族X-STR研究時(shí)發(fā)現(xiàn),貴州水族與仡佬族、漢族親緣關(guān)系較近[29],本研究結(jié)果與其基本一致,這與樣本量及采集樣本的隨機(jī)性有一定關(guān)系。水族與仡佬族均屬壯侗語族,兩者由古代“百越”族群發(fā)展而來[30],這提示貴州水族可能是生活在中國(guó)西南地區(qū)的土著人口。本研究中貴州水族群體與張秀秀[17]研究的三都水族群體遺傳距離較遠(yuǎn),可以考慮對(duì)貴州地區(qū)各地域的水族樣本更加細(xì)分、增加樣本量來減少樣本選擇上所帶來的誤差。
本研究從Y-SNP單倍群角度,通過對(duì)180份貴州水族男性無關(guān)個(gè)體11個(gè)Y-SNP位點(diǎn)的檢測(cè)與分析,獲得單倍群頻率數(shù)據(jù),結(jié)果表明,貴州水族Y-SNP單倍群分布具有一定特異性,可為貴州地區(qū)法醫(yī)學(xué)生物檢材族群地域推斷奠定基礎(chǔ),豐富貴州地區(qū)少數(shù)民族的遺傳學(xué)基礎(chǔ)數(shù)據(jù)。