朱信,金鑫,劉俊,楊瀾,鄒麗馨,李彩霞,黃江,江麗
研究報(bào)告
基于Y-SNP和Y-STR揭示漢族人群父系遺傳關(guān)系
朱信1,2,金鑫3,劉俊2,4,楊瀾2,4,鄒麗馨2,5,李彩霞1,2,黃江1,江麗2
1. 貴州醫(yī)科大學(xué)法醫(yī)學(xué)院,貴陽(yáng) 550004 2. 公安部鑒定中心,北京市現(xiàn)場(chǎng)物證檢驗(yàn)工程技術(shù)研究中心,現(xiàn)場(chǎng)物證溯源技術(shù)國(guó)家工程實(shí)驗(yàn)室,北京 100038 3. 海南省公安廳,???570203 4. 山西醫(yī)科大學(xué),太原 030001 5. 江蘇師范大學(xué),徐州 221116
漢族是中國(guó)人口最多的民族,現(xiàn)有研究多集中于漢族人群的起源、遷徙、融合等遺傳歷史,以及局部地區(qū)漢族人群的父系遺傳關(guān)系,鮮有全局視角下的漢族人群父系遺傳結(jié)構(gòu)研究。本研究檢測(cè)了362份青海、四川和遼寧的漢族無(wú)關(guān)男性樣本,整合已發(fā)表文獻(xiàn)相關(guān)數(shù)據(jù),最終獲得了國(guó)內(nèi)15個(gè)省份16個(gè)漢族人群1830人份樣本,覆蓋89個(gè)Y-SNP、16個(gè)Y-STR的數(shù)據(jù)。通過(guò)統(tǒng)計(jì)Y-SNP單倍群頻率、Y-STR單倍型多樣性,使用主成分分析(principal component analysis, PCA)、系統(tǒng)發(fā)育樹(shù)、單倍型網(wǎng)絡(luò)等分析,綜合Y-SNP和Y-STR兩個(gè)反映不同時(shí)間尺度的遺傳標(biāo)記,研究不同地區(qū)漢族人群之間的遺傳分化、漢族人群與其周邊少數(shù)民族的遺傳關(guān)系。單倍群頻率統(tǒng)計(jì)結(jié)果顯示單倍群O-M175是漢族人群主體單倍群(青海漢族60.53%~廣東漢族92.7%),其下游亞單倍群呈現(xiàn)地域差異化分布。單倍群O2-M122高頻分布于各地漢族,總體分布趨勢(shì)北高南低;單倍群O1b-M268分布頻率由南向北遞減,尤其在嶺南地區(qū)漢族人群中分布顯著;單倍群O1a-M119在中部漢族人群中分布頻率較高。漢族人群遺傳結(jié)構(gòu)研究表明,其主要分為北部、中部及南部三個(gè)聚類(lèi)簇,其中青海漢族與其他地區(qū)漢族存在一定的遺傳分化。在合并少數(shù)民族的遺傳關(guān)系研究中,漢族人群彼此之間遺傳關(guān)系更緊密,但北部漢族與回族遺傳關(guān)系更近,而南部漢族則與仡佬族、黎族遺傳關(guān)系更近??傊疚幕?9個(gè)Y-SNP和16個(gè)Y-STR,系統(tǒng)地研究了中國(guó)不同地域的漢族人群的單倍群分布、遺傳亞結(jié)構(gòu)及其與周邊少數(shù)民族的遺傳關(guān)系,為群體遺傳學(xué)、法醫(yī)遺傳學(xué)補(bǔ)充理論依據(jù),為Y染色體的法醫(yī)學(xué)應(yīng)用提供數(shù)據(jù)支撐。Y-SNP單倍群結(jié)合Y-STR單倍型對(duì)于分析漢族人群遺傳亞結(jié)構(gòu)以及法醫(yī)學(xué)應(yīng)用具有重要作用。
群體遺傳學(xué);法醫(yī)遺傳學(xué);Y-SNP;Y-STR
男性特異的Y染色體非重組區(qū)域(non- recombining Y,NRY)遵循嚴(yán)格的父系遺傳[1],被廣泛應(yīng)用于進(jìn)化人類(lèi)學(xué)[2]、遺傳系譜學(xué)[1,3]、醫(yī)學(xué)遺傳學(xué)[1,4]和法醫(yī)遺傳學(xué)[5,6]等研究領(lǐng)域。Y染色體上常用的遺傳標(biāo)記是短串聯(lián)重復(fù)序列(Y-chromosome short tandem repeat,Y-STR)和單核苷酸多態(tài)性(Y-chromosome single nucleotide polymorphism,Y-SNP)。具有高突變率的Y-STR (3.78×10–4~7.44× 10–2次突變/代)隨父系世代傳遞過(guò)程中累積突變產(chǎn)生了獨(dú)特的單倍型[6~9]。然而,在實(shí)際應(yīng)用中由于標(biāo)記集的大小有限,來(lái)自不同父系的個(gè)體可能巧合地表現(xiàn)出相同的單倍型[10~13],Y-STR單倍型匹配有時(shí)并無(wú)法代表個(gè)體父系祖源的一致性。而突變速度相對(duì)緩慢的Y-SNP(1.0×10?9突變/代)能夠通過(guò)突變發(fā)生時(shí)期建立系統(tǒng)發(fā)育樹(shù)并定義Y-SNP單倍群類(lèi)型[14,15],Y-SNP單倍群的分布具有一定地理及族群相關(guān)性。因此,Y-STR結(jié)合Y-SNP對(duì)分析人群父系遺傳關(guān)系具有重要的意義[16,17],目前,在法醫(yī)學(xué)實(shí)踐中利用Y-STR推測(cè)男性犯罪嫌疑人的家系和來(lái)源群體,尚缺應(yīng)用于法醫(yī)學(xué)領(lǐng)域的Y-SNP單倍群人群分布作為參考數(shù)據(jù),為彌補(bǔ)缺少適用于物證鑒定的Y-SNP復(fù)合擴(kuò)增體系等問(wèn)題,國(guó)內(nèi)外不少研究嘗試基于Y-STR推斷Y-SNP單倍群[18~20],但其推斷準(zhǔn)確性有待進(jìn)一步驗(yàn)證,因此開(kāi)展Y-SNP單倍群人群驗(yàn)證研究十分必要。以往研究已開(kāi)發(fā)了覆蓋數(shù)十至數(shù)百個(gè)Y-SNP位點(diǎn)的檢測(cè)體系[21~29],但隨著測(cè)序技術(shù)的發(fā)展許多新發(fā)現(xiàn)及不斷被更正的Y-SNP位點(diǎn)仍有待進(jìn)一步人群數(shù)據(jù)驗(yàn)證。
漢族是世界上人數(shù)最多的民族,其母語(yǔ)——漢語(yǔ),屬于漢藏語(yǔ)系兩大語(yǔ)族之一。據(jù)全國(guó)第七次人口普查數(shù)據(jù),漢族人口約占中國(guó)總?cè)丝诘?1.11%[30],占全球人口的近18%。我國(guó)人口歷史悠久、起源復(fù)雜,漢族主要集中在東部和中部地區(qū),少數(shù)民族多分布在西南、西北及東北等地區(qū),各民族間呈現(xiàn)“大雜居、小聚居”的分布格局。漢族在歷史遷徙過(guò)程中與周邊其他民族相互交流融合[31],受地理、經(jīng)濟(jì)和文化因素影響,不同地區(qū)的漢族人群產(chǎn)生了一定程度的遺傳分化[32~34]。我國(guó)總體地勢(shì)呈現(xiàn)西高東低,居住在東部平原、丘陵上以種植業(yè)為主的民族多形成大而集中或長(zhǎng)條形的聚落,彼此交流更頻繁;生活在西部高原山區(qū)的民族多呈小而分散的聚落,聚落間彼此交流相對(duì)較少[35]?;谌蚪M的漢族人群遺傳關(guān)系研究已有不少,如PGGHan、WBBC (Westlake BioBank for Chinese)、ChinaMap等[36~38],基于線(xiàn)粒體研究中漢族人群的覆蓋也十分廣泛[32],其都表現(xiàn)出漢族人群明顯的地理分化。而漢族父系遺傳結(jié)構(gòu)的研究還存在采樣的局限性,主要集中在中國(guó)東部,其表現(xiàn)出明顯的南北分化[33,39~41],但對(duì)與少數(shù)民族混居的西部地區(qū)漢族研究仍較少,總體地域覆蓋度不夠。因此,本研究檢測(cè)了362份漢族樣本,并與收集的已發(fā)表文獻(xiàn)中不同地域漢族Y染色體數(shù)據(jù)進(jìn)行整合,得到15個(gè)省份16個(gè)漢族人群1830份樣本的89Y-SNP、16Y-STR數(shù)據(jù)集[33,42],并與文獻(xiàn)中收集的少數(shù)民族Y-SNP、Y-STR數(shù)據(jù)合并。擬通過(guò)不同地域的漢族人群Y-SNP單倍群分布、遺傳分化,漢族人群與周邊少數(shù)民族遺傳關(guān)系等研究,對(duì)中國(guó)不同地區(qū)漢族父系遺傳關(guān)系及漢族人群與周邊少數(shù)民族的遺傳交流進(jìn)行綜合解析。
本研究采集了362份漢族無(wú)關(guān)男性個(gè)體靜脈血樣本,其中遼寧鐵嶺漢族80份,青海漢族114份,四川阿壩漢族76份,四川甘孜漢族91份。本研究已通過(guò)公安部鑒定中心倫理委員會(huì)審查(倫理批號(hào):2023-021),所有參與志愿者均簽署知情同意書(shū)。根據(jù)試劑盒說(shuō)明書(shū),采用QIAamp?DNABloodMidiKit(德國(guó)QIAGEN公司)進(jìn)行DNA提取。使用Nano Drop 2000c (美國(guó)ThermoFisherScientific公司)進(jìn)行DNA定量并稀釋至5 ng/μL待檢。
使用AIYSNP89試劑盒(北京刑技技術(shù)有限責(zé)任公司)對(duì)上述樣本在89個(gè)Y-SNP位點(diǎn)上的分型進(jìn)行檢測(cè),操作步驟、體系配比及參數(shù)設(shè)置等均按照試劑盒說(shuō)明書(shū)進(jìn)行。應(yīng)用GeneAmp PCR Systerm 9700熱循環(huán)儀(德國(guó)Eppendorf公司)進(jìn)行復(fù)合擴(kuò)增,使用ABI 3500xL遺傳分析儀(美國(guó)Thermo Fisher Scientific公司)對(duì)擴(kuò)增產(chǎn)物進(jìn)行毛細(xì)管電泳檢測(cè),利用GeneMapper ID v3.2軟件分析Y-SNP分型。
使用PowerPlex?Y23試劑盒(美國(guó)Promega公司)檢測(cè)76份四川阿壩漢族、91份四川甘孜漢族、80份遼寧鐵嶺漢族及90份青海漢族樣本;使用DNATyper Y26試劑盒(北京刑技技術(shù)有限責(zé)任公司)檢測(cè)另外25份青海漢族樣本。應(yīng)用GeneAmp PCR Systerm 9700熱循環(huán)儀(德國(guó)Eppendorf公司)進(jìn)行擴(kuò)增,擴(kuò)增產(chǎn)物用ABI 3500xL遺傳分析儀(美國(guó)Thermo Fisher Scientific公司)進(jìn)行毛細(xì)管電泳檢測(cè),使用GeneMapper ID-X 軟件分析Y-STR分型。
本研究使用的人群信息列表如表1所示。
表1 中國(guó)人群信息列表
續(xù)表
主體研究人群用加粗字體表示,其他人群用斜體表示。人群尾綴1、2表示引自不同文獻(xiàn)的人群。
從文獻(xiàn)中收集了1468份漢族Y-SNP、Y-STR數(shù)據(jù)[33,42],與上述檢測(cè)數(shù)據(jù)進(jìn)行整合,得到覆蓋16個(gè)漢族人群89個(gè)Y-SNP、16個(gè)Y-STR的研究人群數(shù)據(jù)集。
同時(shí),為了了解不同地區(qū)漢族群體與周邊少數(shù)民族之間的遺傳關(guān)系,本研究還收集了文獻(xiàn)中Y-SNP位點(diǎn)數(shù)相近的國(guó)內(nèi)人群數(shù)據(jù)[22,33,39,40,42~49]與本研究人群進(jìn)行合并后得到包含60個(gè)Y-SNP位點(diǎn)的38個(gè)中國(guó)人群數(shù)據(jù)集,下文簡(jiǎn)稱(chēng)為60Y-SNP數(shù)據(jù)集;收集了文獻(xiàn)中的中國(guó)人群Y-STR數(shù)據(jù)[33,39,40,42~48,50,51]與本研究人群進(jìn)行合并后得到包含16個(gè)Y-STR的46個(gè)中國(guó)人群數(shù)據(jù)集,下文簡(jiǎn)稱(chēng)為16Y-STR數(shù)據(jù)集。
1.5.1 Y-SNP單倍群劃分及在不同地區(qū)漢族中分布
基于研究人群數(shù)據(jù)集,根據(jù)國(guó)際Y染色體協(xié)會(huì)(Y chromosome consortium,YCC)的單倍群命名原則,依據(jù)Y染色體譜系樹(shù)(ISOGG網(wǎng)站版本號(hào)14.177,更新日期2019年10月8日)進(jìn)行Y染色體單倍群劃分[53]。使用Excel直接計(jì)數(shù)統(tǒng)計(jì)16個(gè)漢族人群基于89個(gè)Y-SNP單倍群頻率數(shù)據(jù)。
1.5.2 Y-STR的基因多樣性與單倍型多樣性
基于16個(gè)Y-STR基因座(DYS19、DYS389I、DYS389II、DYS390、DYS391、DYS392、DYS393、DYS437、DYS438、DYS439、DYS448、DYS456、DYS458、DYS533、DYS635和GATA-H4),使用Excel直接計(jì)數(shù)計(jì)算16個(gè)研究人群的等位基因頻率和單倍型頻率、單倍型多樣性(haplotype diversity,HD)、單倍型多樣性與基因多樣性(genetic diversity,GD)、匹配概率(haplotype match probability,HMP)和鑒別能力(discrimination capacity,DC)[54~55]等法醫(yī)學(xué)參數(shù)。
1.5.3 中國(guó)不同地區(qū)漢族人群父系遺傳關(guān)系分析
基于研究人群數(shù)據(jù)集的Y-SNP單倍群頻率,使用R v4.1.2軟件prcomp函數(shù)進(jìn)行PCA分析及ggplot2[56]包進(jìn)行可視化?;谘芯咳巳簲?shù)據(jù)集的16個(gè)Y-STR數(shù)據(jù),刪除單倍型中單拷貝基因座二等位變異和空等位變異的樣本。使用Arlequin v3.5.2.2[57]軟件中的AMOVA參數(shù),通過(guò)分子方差分析(analysis of molecular variance,AMOVA)[58]計(jì)算群體之間成對(duì)遺傳距離R值分析遺傳分化情況,用MEGA v11軟件構(gòu)建鄰接樹(shù)[59]?;?個(gè)Y-STR基因座(DYS19、DYS392、DYS393、DYS437、DYS438、DYS448、YGATAH4)使用NETWORK v10.2軟件[60]構(gòu)建不同地域漢族人群的單倍型中位連接(median joining,MJ)網(wǎng)絡(luò)圖[11],為了更明顯觀察人群間個(gè)體的聚類(lèi)關(guān)系,網(wǎng)絡(luò)圖使用最大簡(jiǎn)約樹(shù)進(jìn)行展示。
1.5.4 中國(guó)不同人群父系遺傳關(guān)系分析
基于60Y-SNP數(shù)據(jù)集,用R v4.1.2軟件prcomp函數(shù)進(jìn)行PCA分析及ggplot2[56]包進(jìn)行可視化?;谌?6Y-STR數(shù)據(jù)集,刪除單倍型中單拷貝基因座二等位變異和空等位變異的樣本。使用Arlequin v3.5.2.2[57]軟件計(jì)算中國(guó)各人群間的R值,并基于人群R矩陣用R v4.1.2軟件繪制熱圖展示人群聚類(lèi)關(guān)系,分析漢族與周邊少數(shù)民族遺傳關(guān)系?;谕瑫r(shí)覆蓋60Y-SNP、16Y-STR的人群,對(duì)其7個(gè)Y-STR基因座(DYS19、DYS392、DYS393、DYS437、DYS438、DYS448、YGATA-H4)用NETWORK v10.2軟件[60]進(jìn)行周邊少數(shù)民族特征單倍群的中位連接網(wǎng)絡(luò)分析,觀察特定單倍群下不同語(yǔ)系人群的單倍型共享情況[11],網(wǎng)絡(luò)圖使用最大簡(jiǎn)約樹(shù)進(jìn)行展示。
本研究將實(shí)驗(yàn)室檢測(cè)的362份漢族與文獻(xiàn)收集的1468份漢族樣本Y-SNP、Y-STR數(shù)據(jù)進(jìn)行整合得到16個(gè)漢族人群1830份樣本的研究人群數(shù)據(jù)集,位點(diǎn)覆蓋89個(gè)Y-SNP、16個(gè)Y-STR[33,42]。通過(guò)Y-SNP單倍群頻率統(tǒng)計(jì)、Y-STR單倍型多樣性計(jì)算、PCA、R值系統(tǒng)發(fā)育樹(shù)、單倍型網(wǎng)絡(luò)分析等方法研究不同地區(qū)漢族之間的遺傳關(guān)系。此外,我們還將漢族研究人群數(shù)據(jù)集分別與文獻(xiàn)報(bào)道的國(guó)內(nèi)人群數(shù)據(jù)進(jìn)行合并,分別得到了60Y-SNP數(shù)據(jù)集[22,33,39,40,42~49]和16Y-STR數(shù)據(jù)集[33,39,40,42~48,50,51](表1),從不同角度觀察漢族人群與其周邊人群的遺傳交流。
基于89個(gè)Y-SNP,16個(gè)漢族人群共觀察到63個(gè)不同的末端單倍群。主干單倍群在不同地區(qū)漢族的分布頻率如圖1所示,東亞地區(qū)高頻分布的單倍群O-M175、C2-M217、N-M231、D1-M174占漢族人群父系單倍群的88%以上。O-M175單倍群為漢族人群的主體單倍群(青海漢族60.53%~廣東漢族92.7%),其中,青海漢族O-M175單倍群分布(60.53%)較其他漢族(67%~92.7%)低。O-M175下游的亞單倍群分布呈現(xiàn)出一定的地域差異性,O2-M122單倍群在各個(gè)地區(qū)漢族人群中分布最高(青海漢族46.49%-山西漢族65.5%),但廣西漢族例外(35.7%),總體分布趨勢(shì)呈現(xiàn)北高南低,但西北的青海漢族O2-M122分布較除廣西漢族以外的其他漢族都低。O2-M122單倍群下游的三個(gè)大分支分別為O2a2b1*-M134+, M117-及其下游分支(廣西漢族4.5%~黑龍江漢族17%)、O2a2b1a1-M117及其下游分支(青海漢族10.53%~山西漢族24.2%)和O2a1b-IMS-JST002611及其下游分支(廣西漢族8%~黑龍江漢族22.2%)。單倍群O1b-M268在嶺南地區(qū)漢族人群中分布明顯高于其他地區(qū)(廣西漢族38%、海南漢族21.5%),呈現(xiàn)由南向北遞減趨勢(shì);單倍群O1a-M119在中部地區(qū)的漢族人群中分布頻率明顯較高(江西漢族30.6%、浙江漢族26.7%、湖南漢族23.6%、福建漢族16.9%)。單倍群C2-M217是漢族人群的第二大單倍群(福建漢族3.2%~河南漢族15.5%),在北部及西北部漢族人群中分布頻率較高(河南漢族15.5%、青海漢族12.15%、黑龍江漢族12.8%、山西漢族12.1%、遼寧鐵嶺漢族11.25%),在南部漢族人群中分布頻率均低于6%。單倍群N-M231的分布也呈現(xiàn)出一定由北向南遞減的趨勢(shì)(黑龍江漢族10.7%、青海漢族10.53%、山東漢族12.5%,南部漢族人群中均低于10%)。單倍群D1-M174在青藏高原周邊地區(qū)及北部地區(qū)低頻分布(甘孜漢族5.49%、廣西漢族4.4%、遼寧鐵嶺漢族3.75%、北京漢族2.7%),在南部平原地區(qū)幾乎不分布。其他零散分布的單倍群還有Q-M242 (0%~7.1%)、R-M207(0%~4.39%)、J-M304(0%~1.75%),分布趨勢(shì)呈現(xiàn)北高南低。
在16個(gè)單拷貝Y-STR基因座組成的單倍型中,1830份漢族樣本共檢測(cè)到1737個(gè)單倍型,其中1個(gè)單倍型重復(fù)了7次、1個(gè)單倍型重復(fù)了6次、1個(gè)單倍型重復(fù)了4次、8個(gè)單倍型重復(fù)了3次、63個(gè)單倍型重復(fù)了2次。16個(gè)單拷貝Y-STR基因座中漢族群體的單倍型多樣性(HD)均高于0.99,HD及DC為1的漢族人群均分布于中國(guó)北部(分別為黑龍江漢族、遼寧鐵嶺漢族、山西漢族),且北部漢族HD值普遍高于其他地區(qū)(表2)。在1830份漢族樣本中共檢測(cè)到60個(gè)中間等位基因、2個(gè)空等位基因和9個(gè)拷貝數(shù)變異,16個(gè)Y-STR基因座在漢族人群中的GD值介于0.292(DYS391)到0.84(DYS458)之間(圖2),其中DYS458、DYS635、DYS389II、DYS392、DYS19、DYS448、DYS390等基因座在各地漢族人群中基因多樣性普遍較高,GD值均高于0.6。在部分基因座上不同地區(qū)漢族GD值表現(xiàn)出較大的差異。北部地區(qū)(遼寧鐵嶺、山東、山西、河南)漢族人群在DYS19、DYS389II、DYS437、DYS392等基因座上GD值較高,其中北京和黑龍江漢族在DYS389I、DYS390、DYS437、DYS438等基因座上變異較大,GD值較其他北部漢族低。中部(浙江、江西、福建、湖南)漢族人群在DYS389、DYS533、YGATA-H4等基因座上GD值較低。而南部地區(qū)(廣東、廣西、海南)漢族在不同基因座的GD值差異較大,在DYS389I、DYS393、DYS533、YGATA-H4基因座上廣西漢族明顯高于廣東、海南漢族。
圖1 中國(guó)16個(gè)漢族人群?jiǎn)伪度侯l率分布
紅色字體代表其下游單倍群頻率的加和。
2.3.1 不同地區(qū)漢族人群Y-SNP遺傳關(guān)系及遺傳分化
基于不同地區(qū)漢族人群的Y-SNP單倍群頻率的主成分分析(PCA)結(jié)果見(jiàn)圖3A。在第一個(gè)主成分上顯示了北部漢族(黑龍江、遼寧鐵嶺、山東、山西、北京和河南)、中部漢族(浙江、湖南、福建、江西)和南部漢族(廣東、廣西和海南)三個(gè)明顯的遺傳聚類(lèi)簇,這與地理分布關(guān)系一致。北部漢族聚類(lèi)緊密,而南部漢族聚類(lèi)相對(duì)松散,表明南部漢族彼此之間的遺傳分化程度比北部漢族大。西部漢族呈現(xiàn)明顯的遺傳差異,西南地區(qū)(四川阿壩、四川甘孜)的漢族人群與中部地區(qū)(湖南、福建、江西、浙江)漢族聚集在一起,西北地區(qū)的青海漢族與其他漢族人群顯示出明顯的遺傳分化。
表2 基于16個(gè)Y-STR基因座的漢族人群法醫(yī)學(xué)參數(shù)
圖2 16個(gè)Y-STR基因座在16個(gè)漢族人群中的基因多樣性
2.3.2 不同地區(qū)漢族人群Y-STR遺傳關(guān)系及遺傳分化
為了進(jìn)一步觀察群體間的遺傳分化關(guān)系,基于16個(gè)Y-STR的16個(gè)漢族人群遺傳距離R值構(gòu)建系統(tǒng)發(fā)育樹(shù)見(jiàn)圖3B,各地區(qū)漢族人群主要分成了三支,來(lái)自西北地區(qū)的青海漢族與北部地區(qū)(山東、山西、河南和遼寧鐵嶺)的漢族人群聚類(lèi)成一簇形成北部漢族支系;中部地區(qū)(浙江、福建、江西和湖南)的漢族人群聚類(lèi)在一起,同時(shí)西南地區(qū)的阿壩漢族與它們聚類(lèi)較近形成中部漢族支系,表明它們的遺傳關(guān)系更近;而甘孜漢族與受南部少數(shù)民族影響較深的華南地區(qū)漢族聚類(lèi)較近形成南部漢族支系。黑龍江漢族和北京漢族在北部漢族和中部漢族之間。總之,不同地區(qū)的漢族人群遺傳關(guān)系主要呈現(xiàn)出明顯的北部、中部、南部漢族人群的遺傳分化現(xiàn)象,遺傳親緣及分化關(guān)系與地理分布相關(guān)性強(qiáng),其結(jié)果與圖3A中PCA聚類(lèi)結(jié)果相印證。
2.3.3 不同地區(qū)漢族人群?jiǎn)伪缎途W(wǎng)絡(luò)分析
為了觀察同一單倍群下Y-STR單倍型的個(gè)體關(guān)聯(lián),本研究選取了漢族人群主要分布的O2-M122單倍群的兩大亞支及O1a-M119單倍群下的Y-STR進(jìn)行了網(wǎng)絡(luò)分析見(jiàn)圖4。在網(wǎng)絡(luò)圖中觀察到特定區(qū)域漢族的聚集分布,顯示群體間單倍型共享的節(jié)點(diǎn)。在單倍群O2a2b1a1-M117、O2al-L127.1 (主要為O2a1b- IMS-JST002611)下的Y-STR單倍型網(wǎng)絡(luò)圖中,不同地區(qū)漢族個(gè)體隨機(jī)分布在整個(gè)網(wǎng)絡(luò)圖中,且不同地區(qū)漢族人群共享中心單倍型,但南部(廣東、廣西、海南)漢族聚類(lèi)在中心單倍型周?chē)辈?黑龍江、遼寧鐵嶺、山東、山西、北京和河南)、中部(浙江、湖南、福建、江西)漢族分散在末端單倍型的分布表明,北部(黑龍江、遼寧鐵嶺、山東、山西、北京和河南)、中部(浙江、湖南、福建、江西)漢族較南部(廣東、廣西、海南)漢族遺傳分化程度高。
在單倍群O1a-M119下Y-STR單倍型主要以中部(浙江、湖南、福建、江西)及南部(廣東、廣西、海南)漢族人群共享單倍型為主,而北部漢族及西部漢族共享單倍型較少。此外在單倍群O1a-M119下Y-STR單倍型北部(黑龍江、遼寧鐵嶺、山東、山西、北京和河南)漢族聚類(lèi)在中心單倍型周?chē)?,南?廣東、廣西、海南)漢族及中部(浙江、湖南、福建、江西)漢族分散在末端單倍型的分布也表明,南部(廣東、廣西、海南)、中部(浙江、湖南、福建、江西)漢族較北部(黑龍江、遼寧鐵嶺、山東、山西、北京和河南)漢族遺傳分化程度高。
圖3 漢族人群遺傳聚類(lèi)及遺傳分化
A:不同地區(qū)漢族人群Y-SNP單倍群頻率PCA圖;B:不同地區(qū)漢族人群Y-STR系統(tǒng)發(fā)育關(guān)系圖。
北部漢族:黑龍江漢族、遼寧鐵嶺漢族、北京漢族、山東漢族、山西漢族、河南漢族;中部漢族:湖南漢族、江西漢族、福建漢族、浙江漢族;西部漢族:四川甘孜漢族、四川阿壩漢族、青海漢族;南部漢族:廣西漢族、海南漢族、廣東漢族。
基于60Y-SNP數(shù)據(jù)集中38個(gè)中國(guó)人群的Y-SNP單倍群頻率進(jìn)行PCA分析,結(jié)果如圖5A所示,中國(guó)人群分別形成了漢族人群聚類(lèi)簇、藏緬語(yǔ)族(Tibeto-Burman)聚類(lèi)簇、蒙古族聚類(lèi)簇、回族及突厥語(yǔ)族(Turkic)聚類(lèi)簇。遺傳聚類(lèi)與語(yǔ)系語(yǔ)族分類(lèi)一致,同一語(yǔ)族人群聚類(lèi)受地理因素影響呈現(xiàn)一定的遺傳分化,如海南黎族和遵義仡佬族分別與地理關(guān)系相近的漢族聚集在一起,阿壩藏族與涼山彝族聚類(lèi)較近,而與其他藏族聚類(lèi)較遠(yuǎn)等。漢族人群彼此緊密聚集在一起,表明漢族人群彼此之間的遺傳關(guān)系更近,另外觀察到漢族表現(xiàn)出南部、中部、北部的遺傳分化,與圖3A的結(jié)果一致,南部漢族與侗臺(tái)語(yǔ)系(Tai-Kadai)人群遺傳交流更多,而北部漢族則與回族有一定的遺傳交流,如南方漢族與黎族和仡佬族聚集在一起、四川回族及山東回族與北部漢族聚集在一起?;谠摂?shù)據(jù)集中包含16Y-STR數(shù)據(jù)的樣本網(wǎng)絡(luò)分析結(jié)果顯示:?jiǎn)伪度篊2-M217下的北部漢族和西部的青海漢族與蒙古族人群共享單倍型,而南部漢族未觀察到與蒙古族人群?jiǎn)为?dú)共享的單倍型支,其主要和各地區(qū)漢族人群共享(圖5C),表明北部漢族C2-M217單倍群的分布受蒙古族人群影響,而南部漢族人群C2-M217單倍群的分布幾乎不受其影響;單倍群O1b-M268下的漢族人群主要受侗臺(tái)語(yǔ)人群影響,其中華南地區(qū)漢族影響最大,而北部漢族受影響較少(圖5D)。
基于16Y-STR數(shù)據(jù)集的45個(gè)中國(guó)人群的群體間R值繪制熱圖,如圖5B所示,各個(gè)人群遺傳關(guān)系與語(yǔ)系語(yǔ)族分類(lèi)有較強(qiáng)的相關(guān)性,同一語(yǔ)族人群傾向于聚類(lèi)在一起,其結(jié)果與圖3A和B中PCA和發(fā)育樹(shù)聚類(lèi)結(jié)果相印證。不同人群遺傳關(guān)系還受地理分布影響,如廣西漢族與廣西壯族聚在一起,而北部漢族則與山東、河南、四川等地的回族聚集在一起,西北地區(qū)回族傾向于與阿爾泰語(yǔ)系人群聚在一支??傊?,不同人群遺傳關(guān)系同時(shí)受語(yǔ)系語(yǔ)族分類(lèi)及地理隔離因素影響。
中國(guó)是東亞地區(qū)最大的國(guó)家,擁有豐富多樣的語(yǔ)言體系,包括漢藏語(yǔ)系(Sino-Tibetan)、阿爾泰語(yǔ)系(Altaic)、侗臺(tái)語(yǔ)系、苗瑤語(yǔ)系(Hmong-Mien)、南亞語(yǔ)系(Austro-Asiatic)、南島語(yǔ)系(Austronesian)及印歐語(yǔ)系(Indo-European)[61]。這里有全世界人口最多的民族——漢族,漢族屬于漢藏語(yǔ)系的漢語(yǔ)族人群,主要分布在中國(guó)東部,在西部主要與其他語(yǔ)系人群雜居在一起。大量的遺傳學(xué)研究報(bào)道漢族人群起源于黃河流域的仰韶文化,并隨著農(nóng)業(yè)的馴化,仰韶文化由中原地區(qū)逐漸向西向南及向北遷移、定居,并與各地少數(shù)民族交流融合[31,62~64]。對(duì)現(xiàn)代不同地區(qū)漢族人群的遺傳學(xué)研究也表現(xiàn)出漢族明顯的遺傳分化,如基于全基因組WBBC中將漢族分為北部、中部、南部及嶺南四個(gè)地理亞群,ChinaMap中根據(jù)地理分區(qū)將中國(guó)漢族分了西北、北部、東部、中部、東南、南部和嶺南七個(gè)地理亞群,基于線(xiàn)粒體的遺傳研究中漢族人群依據(jù)水系劃分了黃河流域、長(zhǎng)江流域和珠江流域三個(gè)明顯的亞群,Y染色體視角的研究也表明漢族人群存在明顯的南北分化[34,36~38]?;谇叭藦牡乩斫嵌燃罢Z(yǔ)系語(yǔ)族分類(lèi)角度對(duì)漢族人群起源、遷移與演化的研究[31,65],本研究整合了1830份漢族人群的89Y-SNP、16Y-STR數(shù)據(jù)。結(jié)果顯示89Y-SNP、16Y-STR位點(diǎn)在不同地區(qū)漢族人群中具有顯著的遺傳多態(tài)性。群體遺傳學(xué)研究中表明不同地域漢族人群主要表現(xiàn)為北部、中部及南部三個(gè)聚類(lèi),其中青海漢族與其他地區(qū)漢族存在一定的遺傳分化。合并中國(guó)其他人群的遺傳關(guān)系研究顯示,中國(guó)人群父系遺傳關(guān)系受語(yǔ)系語(yǔ)族分類(lèi)及地理因素影響,漢族人群彼此之間遺傳關(guān)系更緊密,但北部漢族與回族遺傳關(guān)系更近,而南部漢族則與仡佬族、黎族等南方少數(shù)民族的遺傳關(guān)系更近。
A:漢族人群與其他中國(guó)人群?jiǎn)伪度侯l率PCA圖;B:漢族人群與中國(guó)其他人群遺傳距離熱圖;C:基于7個(gè)Y-STR基因座分型的不同地區(qū)漢族及蒙古族中單倍群C2-M217下Y-STR單倍型網(wǎng)絡(luò)圖;D:基于7個(gè)Y-STR基因座分型的不同地區(qū)漢族及蒙古族單倍群O1b-M268下Y-STR單倍型網(wǎng)絡(luò)圖。北部漢族:黑龍江漢族、遼寧鐵嶺漢族、北京漢族、山東漢族、山西漢族、河南漢族;中部漢族:湖南漢族、江西漢族、福建漢族、浙江漢族;西部漢族:四川甘孜漢族、四川阿壩漢族、青海漢族;南部漢族:廣西漢族、海南漢族、廣東漢族。
本研究檢測(cè)的89個(gè)Y-SNP,包含了CT-M168、D-M174、C-M130、J-M304、G-M201、N-M231、O-M175、Q-M242和R-M207等單倍群,在1830份樣本中共觀察到63個(gè)不同的末端單倍群(圖1)。單倍群O2-M122是東亞地區(qū)最常見(jiàn)的父系單倍群[62,66,67],在本次研究的各個(gè)漢族人群(廣西漢族除外)分布中占比最高(青海漢族46.9%-山西漢族65.5%)。單倍群O2-M122有三個(gè)主要的亞分支,分別為O2a1b- IMS-JST002611、O2a2b1-M134和O2a2b1a1-M117,分別占漢族人群的12%-17%[15,62,68,69],在本研究中這三個(gè)分支也是漢族人群的主要分支,其中O2a2b1a1-M117、O2a1b-IMS-JST002611在各地漢族人群中都分布較高,它們的網(wǎng)絡(luò)分析顯示Y-STR單倍型多樣性普遍呈北部、中部向南下降(圖4),這與O2-M122譜系在歷史時(shí)期隨農(nóng)業(yè)的馴化由北向南遷移一致[67,69]。單倍群O2a2a-P201、O1a-M119是苗瑤語(yǔ)、侗臺(tái)語(yǔ)及南島語(yǔ)系人群的特征單倍群[70,71],本研究中中部地區(qū)漢族單倍群O1a-M119占比高于其他地區(qū)漢族,可能是受到周邊少數(shù)民族的影響,如瑤族、畬族、侗族等,四川地區(qū)漢族人群?jiǎn)伪度篛1a-M119分布頻率也較高,這可能是受良渚文化攜帶O1a-M119西遷影響[31]。單倍群O1b-M268主要分布在東亞南部及東南亞地區(qū),其中在東亞南部主要分布在侗臺(tái)語(yǔ)系及南亞語(yǔ)系人群[72,73],本研究的漢族人群中單倍群O1b-M268分布也呈現(xiàn)由南向北遞減趨勢(shì),尤其在嶺南地區(qū)(廣西漢族38%、海南漢族21.5%)漢族人群中分布頻率較高,這可能是受當(dāng)?shù)囟迸_(tái)語(yǔ)系人群的影響,如黎族等,這與在單倍群O1b-M268的網(wǎng)絡(luò)圖中觀察到的結(jié)果一致(圖5D)。單倍群C2-M217是阿爾泰語(yǔ)系人群的主體單倍群,尤其在蒙古語(yǔ)族及通古斯語(yǔ)族人群中[74~76],單倍群C2-M217也是本研究中漢族人群的第二大單倍群(福建漢族3.2%~河南漢族15.5%),且其在北部及西北部漢族人群中分布較高(河南漢族15.5%、青海漢族12.15%、黑龍江漢族12.8%、山西漢族12.1%、遼寧鐵嶺漢族11.25%),可能是受北部和西北部地區(qū)的阿爾泰語(yǔ)系人群影響,這與在C2-M217單倍群構(gòu)建的網(wǎng)絡(luò)圖中觀察到的結(jié)果一致(圖5C)。單倍群N-M231主要分布于北亞地區(qū)[77],在東亞地區(qū)分布也呈現(xiàn)出一定的由北向南遞減的趨勢(shì)(黑龍江漢族10.7%、青海漢族10.53%、山東漢族12.5%,在南部漢族人群中均低于10%)。單倍群D1-M174主要分布在藏緬語(yǔ)族人群[48,78,79],在本次研究中單倍群D1-M174在青藏高原周邊地區(qū)及北部地區(qū)低頻分布(甘孜漢族5.49%、廣西漢族4.4%、遼寧鐵嶺漢族3.75%),在東南部平原地區(qū)幾乎不分布,這可能是青藏高原周邊地區(qū)的漢族與當(dāng)?shù)夭鼐捳Z(yǔ)族人群遺傳交流造成的。源于歐亞西部的單倍群R-M207(0%~ 4.39%)、J-M304(0%~1.75%),在東亞地區(qū)主要是阿爾泰語(yǔ)系人群攜帶,本研究中零散分布于北部漢族,南部漢族極少,這可能是因?yàn)楸辈繚h族受阿爾泰語(yǔ)系人群影響造成[66]。
16個(gè)單拷貝 Y-STR 基因座在1830個(gè)漢族個(gè)體中檢測(cè)到1737個(gè)單倍型。北部漢族人群?jiǎn)伪缎投鄻有?HD)普遍高于其他地區(qū),總體呈現(xiàn)由北向南遞減的趨勢(shì),這可能與漢族人群的北部起源而后向西向南遷徙有關(guān)[31]。在本研究中攜帶DYS448del的個(gè)體均歸屬到C2-M217單倍群,這與之前的研究一致[74]。DYS448位于無(wú)精子癥基因c (Azoospermia factor c,AZFc)區(qū)域的近端,AZFc區(qū)域的缺失可能導(dǎo)致DYS448[80]處存在空等位基因,引物結(jié)合區(qū)單個(gè)堿基的變化也可能導(dǎo)致DYS448del。此外在DYS19基因座上,有75%存在二等位基因變異的個(gè)體屬于C2a1a2-M48單倍群,這與之前的研究[81]一致。微變異可能是由單倍群特異性的祖先Y染色體突變引起的,一般來(lái)說(shuō),在某些Y-STR位點(diǎn)上發(fā)生的不同微變異通常與特定的單倍群相關(guān),這可以為利用Y-STR單倍型[82,83]預(yù)測(cè)單倍群提供理論基礎(chǔ),同時(shí)這些Y-STR基因座的多樣性也是形成單倍型多樣性的基礎(chǔ),為推斷個(gè)體家系來(lái)源提供數(shù)據(jù)支撐。然而本研究中涉及的Y-STR基因座數(shù)量較少且均為單拷貝基因座,而多拷貝和快速突變Y-STR基因座的多樣性通常更高,增加Y-STR基因座數(shù)目及類(lèi)型以觀察到更高的單倍型多樣性。
在漢族人群間遺傳關(guān)系的研究中,基于Y-SNP單倍群的PCA分析及基于Y-STR單倍型分析結(jié)果都表現(xiàn)出北部漢族、中部漢族和南部漢族三個(gè)明顯的遺傳聚類(lèi)。同時(shí),北部漢族人群聚類(lèi)緊密,而南部漢族人群中形成了一個(gè)相對(duì)松散的聚類(lèi),這表明南部漢族間的遺傳分化程度比北部漢族間大(圖3)。例如:觀察到處于秦嶺淮河以南的湖南、江西、福建、浙江及四川的漢族與嶺南地區(qū)的廣西、海南等漢族呈現(xiàn)明顯遺傳分化,這種差異與長(zhǎng)期的歷史和地理因素以及東亞南部民族多樣性更高、各人群間混居交流更多有關(guān)[15,23,64,65]。本研究發(fā)現(xiàn)西北、西南地區(qū)漢族人群間有一定的遺傳分化,其中,西北地區(qū)的青海漢族與其他漢族表現(xiàn)出明顯的遺傳分化(圖3,A和B),這可能由于仰韶文化一支早期西遷并在青海地區(qū)定居,與當(dāng)?shù)氐纳贁?shù)民族混合,另外,仰韶文化及紅山文化南遷沿東部不同緯度定居,在不同時(shí)期分別與大汶口文化、大溪文化、良渚文化混合[31],長(zhǎng)時(shí)間的遺傳交流使得青海漢族與其他漢族,北部、中部及南部漢族之間有著不同程度的遺傳分化關(guān)系,這在全基因組研究中也得到了證實(shí)[36];而西南地區(qū)(四川阿壩、四川甘孜)的漢族表現(xiàn)出與中部(浙江、湖南、福建、江西)漢族更近的遺傳關(guān)系,這可能受距今5300~4000年前后環(huán)錢(qián)塘江分布的良渚文化(O1a-M119)西遷的影響[31]。總之,不同地區(qū)的漢族人群遺傳關(guān)系主要呈現(xiàn)出明顯的北部、中部、南部的遺傳分化現(xiàn)象,遺傳親緣及分化關(guān)系與地理分布相關(guān)性強(qiáng)。另外在基于單倍群頻率的PCA分析中發(fā)現(xiàn)青海漢族與東部其他漢族人群呈現(xiàn)出一定的遺傳分化,但本研究中西部地區(qū)漢族人群采樣量有限,未來(lái)仍需更多的西部漢族人群樣本進(jìn)一步研究東西部漢族人群遺傳分化關(guān)系。
基于中國(guó)人群Y-STR和Y-SNP數(shù)據(jù)集獲得的遺傳關(guān)系表明,Y染色體視角可以很好地揭示語(yǔ)系語(yǔ)族分類(lèi)/地理上不同群體之間的遺傳關(guān)系??傮w來(lái)說(shuō),中國(guó)人群父系遺傳關(guān)系與語(yǔ)系語(yǔ)族分類(lèi)聯(lián)系緊密,各人群按照語(yǔ)系語(yǔ)族分類(lèi)及地理分區(qū)很好的聚類(lèi),同一語(yǔ)族的各亞人群受地理分布影響表現(xiàn)出一定的遺傳分化現(xiàn)象,這也與以往研究一致[42]。基于中國(guó)人群的遺傳研究表明不同地區(qū)漢族人群受地理因素及與當(dāng)?shù)厣贁?shù)民族基因交流影響呈現(xiàn)出一定的遺傳分化,南部漢族與侗臺(tái)語(yǔ)系人群遺傳關(guān)系更近,例如:PCA及O1b-M268的單倍型網(wǎng)絡(luò)分析結(jié)果表明南部漢族受仡佬族、黎族遺傳影響較多(圖5,A和D),單倍群O1b-M268在起源于南部百越氏族的侗臺(tái)語(yǔ)系人群占主體,南部漢族與南部少數(shù)民族的遺傳交流是導(dǎo)致南北部漢族遺傳分化的原因之一[27,42,47,73];而北部漢族與回族人群有一定的遺傳交流,例如:山東回族和四川回族都表現(xiàn)出與北部漢族較近的遺傳關(guān)系(圖5,A和B),這可能是由于回族人群長(zhǎng)期與漢族人群混居并不斷發(fā)生遺傳交流所致[84],這一點(diǎn)在全基因組相關(guān)研究中更為明顯[85]。單倍群C2-M217下的Y-STR網(wǎng)絡(luò)分析中北部漢族和西部的青海漢族和蒙古語(yǔ)族人群共享單倍型,而南部漢族未觀察到單獨(dú)與蒙古語(yǔ)族人群共享的單倍型,主要和其他漢族人群共享(圖5C),這表明漢族人群?jiǎn)伪度篊2-M217的分布起源不同,北部漢族C2-M217的分布受蒙古語(yǔ)族人群影響,而南部漢族C2-M217的分布則受蒙古語(yǔ)族影響較少,可能是C2-M217史前由南向北遷徙后未向南折返至中國(guó)南部[15,86]。在基于群體間R值的研究中還觀察到藏緬語(yǔ)族的涼山彝族及北川羌族與北部漢族聚在一起,這可能與漢藏語(yǔ)系的共同起源有關(guān)[31]??傊?,中國(guó)人群父系遺傳關(guān)系受語(yǔ)系語(yǔ)族分類(lèi)和地理因素影響。
綜上所述,本研究檢測(cè)了362個(gè)漢族樣本89個(gè)Y-SNP、16個(gè)Y-STR數(shù)據(jù),并與從文獻(xiàn)中收集的1468名漢族樣本89個(gè)Y-SNP和16個(gè)Y-STR數(shù)據(jù)進(jìn)行整合,單倍群分類(lèi)結(jié)果顯示,漢族人群主要分布的單倍群包括O2-M122、O1a-M119、O1b-M268 、C2-M217、N-M231,低頻分布的單倍群包括D1-M174、G-M201、I-M170、J-M304、Q-M242,各個(gè)漢族人群Y-SNP單倍群分布呈現(xiàn)出一定的地域差異性。同時(shí)檢測(cè)到一些Y-STR基因座上的空等位變異及微變異與特定的Y-SNP單倍群相關(guān),為通過(guò)Y-STR單倍型推斷Y-SNP單倍群提供了理論依據(jù)?;跐h族人群Y-SNP單倍群頻率的PCA及Y-STR的系統(tǒng)發(fā)育樹(shù)結(jié)果顯示漢族人群主要包括北部、中部及南部三個(gè)聚類(lèi)簇,為漢族群體的父系遺傳結(jié)構(gòu)提供了遺傳證據(jù),另外發(fā)現(xiàn)來(lái)自青海的漢族與其他漢族在單倍群頻率PCA上有明顯的遺傳分化。對(duì)漢族與中國(guó)其他人群父系遺傳關(guān)系的研究表明,中國(guó)群體父系遺傳結(jié)構(gòu)與語(yǔ)系語(yǔ)族分類(lèi)和地理劃分高度一致,不同地區(qū)漢族人群與蒙古語(yǔ)族、突厥語(yǔ)族、藏緬語(yǔ)族、侗臺(tái)語(yǔ)系人群和回族等少數(shù)民族人群相比,漢族人群之間遺傳親緣性更強(qiáng),且可以觀察到南部漢族與南部少數(shù)民族之間遺傳交流更頻繁。綜上,中國(guó)族群的Y-SNP系統(tǒng)發(fā)育樹(shù)結(jié)合Y-STR單倍型、地理來(lái)源不同的漢族群體遺傳證據(jù),對(duì)研究漢族群體的人群亞結(jié)構(gòu)是必不可少的。未來(lái)可納入更多地理區(qū)域的樣本和更多的遺傳標(biāo)記集,進(jìn)一步探索精細(xì)人群遺傳結(jié)構(gòu)并提高Y染色體遺傳標(biāo)記在法醫(yī)學(xué)領(lǐng)域的應(yīng)用價(jià)值。
[1] Jobling MA, Tyler-Smith C. Human Y-chromosome variation in the genome-sequencing era., 2017, 18(8): 485–497.
[2] Batini C, Jobling MA. Detecting past male-mediated expansions using the Y chromosome., 2017, 136(5): 547–557.
[3] King TE, Jobling MA. Founders, drift, and infidelity: the relationship between Y chromosome diversity and patrilineal surnames., 2009, 26(5): 1093–1102.
[4] Charchar FJ, Bloomer LD, Barnes TA, Cowley MJ, Nelson CP, Wang Y, Denniff M, Debiec R, Christofidou P, Nankervis S, Dominiczak AF, Bani-Mustafa A, Balmforth AJ, Hall AS, Erdmann J, Cambien F, Deloukas P, Hengstenberg C, Packard C, Schunkert H, Ouwehand WH, Ford I, Goodall AH, Jobling MA, Samani NJ, Tomaszewski M. Inheritance of coronary artery disease in men: an analysis of the role of the Y chromosome., 2012, 379(9819): 915–922.
[5] Khan K, Siddiqi MH, Abbas M, Almas M, Idrees M. Forensic applications of Y chromosomal properties., 2017, (26): 86–91.
[6] Kayser M. Forensic use of Y-chromosome DNA: a general overview., 2017, 136(5): 621–635.
[7] Santos FR, Epplen JT, Pena SD. Testing deficiency paternity cases with a Y-linked tetranucleotide repeat polymorphism., 1993, (67): 261–265.
[8] Corach D, Filgueira Risso L, Marino M, Penacino G, Sala A. Routine Y-STR typing in forensic casework., 2001, 118(2–3): 131–135.
[9] Pinto N, Gusm?o L, Amorim A. Mutation and mutation rates at Y chromosome specific Short Tandem Repeat Polymorphisms (STRs): a reappraisal., 2014, (9): 20–24.
[10] Laouina A, Nadifi S, Boulouiz R, El Arji M , Talbi J , El Houate B , Yahia H , Chbel F. Mutation rate at 17 Y-STR loci in "Father/Son" pairs from moroccan population., 2013, 15(5): 269–271.
[11] Ballantyne KN, Goedbloed M, Fang RX, Schaap O, Lao O, Wollstein A, Choi Y, van Duijn K, Vermeulen M, Brauer S, Decorte R, Poetsch M, von Wurmb-Schwark N, de Knijff P, Labuda D, Vézina H, Knoblauch H, Lessig R, Roewer L, Ploski R, Dobosz T, Henke L, Henke J, Furtado MR, Kayser M. Mutability of Y-chromosomal microsatellites: rates, characteristics, molecular bases, and forensic implications., 2010, 87(3): 341–353.
[12] Claerhout S, Vandenbosch M, Nivelle K, Gruyters L, Peeters A, Larmuseau MHD, Decorte R. Determining Y-STR mutation rates in deep-routing genealogies: Identification of haplogroup differences., 2018, 34: 1–10.
[13] Wickenheiser RA. Expanding DNA database effectiveness., 2022, 4: 100226.
[14] Xue YL, Wang QJ, Long Q, Ng BL, Swerdlow H, Burton J, Skuce C, Taylor R, Abdellah Z, Zhao YL, Asan, MacArthur DG, Quail MA, Carter NP, Yang HM, Tyler-Smith C. Human Y chromosome base-substitution mutation rate measured by direct sequencing in a deep-rooting pedigree., 2009, 19(17): 1453– 1457.
[15] Wang CC, Li H. Inferring human history in East Asia from Y chromosomes., 2013, 4(1): 11.
[16] Yoshida Y, Kubo S. Y-SNP and Y-STR analysis in a Japanese population., 2008, 10(5): 243–252.
[17] Cortellini V, Verzeletti A, Cerri N, Marino A, De Ferrari F. Y-chromosome polymorphisms and ethnic group—a combined STR and SNP approach in a population sample from northern Italy., 2013, 54(3): 279–285.
[18] Song MY, Song F, Zhao CX, Hou YP. YHP: Y-chromosome Haplogroup Predictor for predicting male lineages based on Y-STRs., 2021.
[19] Yin CY, Sun H, Zhou HG, Jin L, Li SL. EA-YPredictor: one new software developed to predict pedigree haplogroup based on Y-STR haplotypes., 2020, 45(2): 117–124.殷才湧, 孫輝, 周懷谷, 金立, 李士林. EA-YPredictor:基于Y-STR數(shù)據(jù)的家系特異性單倍群歸屬判別分析軟件. 刑事技術(shù), 2020, 45(2): 117–124.
[20] Dogan S, Babic N, Gurkan C, Goksu A, Marjanovic D, Hadziavdic V. Y-chromosomal haplogroup distribution in the Tuzla Canton of Bosnia and Herzegovina: a concordance study using four different in silico assignment algorithms based on Y-STR data., 2016, 67(6): 471–483.
[21] Ralf A, Van Oven M, Zhong KY, Kayser M. Simultaneous analysis of hundreds of Y-chromosomal SNPs for high-resolution paternal lineage classification using targeted semiconductor sequencing., 2015, 36(1): 151–159.
[22] Xie MK, Song F, Li JN, Lang M, Luo HB, Wang Z, Wu J, Li CZ, Tian CC, Wang WZ, Ma H, Song Z, Fan YJ, Hou YP. Genetic substructure and forensic characteristics of Chinese Hui populations using 157 Y-SNPs and 27 Y-STRs., 2019, 41: 11–18.
[23] Wang MG, Wang Z, He GL, Liu J, Wang SY, Qian XQ, Lang M, Li JN, Xie MK, Li CT, Hou YP. Developmental validation of a custom panel including 165 Y-SNPs for Chinese Y-chromosomal haplogroups dissection using the ion S5 XL system., 2019, 38: 70–76.
[24] Yin CY, Ren YJ, Adnan A, Tian JZ, Guo KJ, Xia MY, He ZW, Zhai D, Chen XY, Wang L, Li X, Qin XJ, Li SL, Jin L. Title: developmental validation of Y-SNP pedigree tagging system: a panel via quick ARMS PCR., 2020, 46: 102271.
[25] Zhou ZH, Zhou YX, Yao YN, Qian JL, Liu BN, Yang QR, Shao CC, Li H, Sun K, Tang QQ, Xie JH. A 16-plex Y-SNP typing system based on allele-specific PCR for the genotyping of Chinese Y-chromosomal haplogroups., 2020, 46: 101720.
[26] Claerhout S, Verstraete P, Warnez L, Vanpaemel S, Larmuseau M, Decorte R. CSYseq: the first Y-chromosome sequencing tool typing a large number of Y-SNPs and Y-STRs to unravel worldwide human population genetics., 2021, 17(9): e1009758.
[27] Tao RY, Li M, Chai SY, Xia RC, Qu YL, Yuan CL, Yang GY, Dong XY, Bian YN, Zhang SH, Li CT. Developmental validation of a 381 Y-chromosome SNP panel for haplogroup analysis in the Chinese populations., 2023, 62: 102803.
[28] He GL, Wang MG, Miao L, Chen J, Zhao J, Sun QX, Duan SH, Wang ZY, Xu XF, Sun YT, Liu Y, Liu J, Wang Z, Wei LH, Liu C, Ye J, Wang L. Multiple founding paternal lineages inferred from the newly-developed 639-plex Y-SNP panel suggested the complex admixture and migration history of Chinese people., 2023, 17(1): 29.
[29] Liu J, Jiang LR, Zhao MY, Du WA, Wen YF, Li SY, Zhang SY, Fang FF, Shen J, He GL, Wang MG, Dai H, Hou YP, Wang Z. Development and validation of a custom panel including 256 Y-SNPs for Chinese Y-chromosomal haplogroups dissection., 2022, 61: 102786.
[30] 中華人民共和國(guó)國(guó)家統(tǒng)計(jì)局. 國(guó)家數(shù)據(jù)-2021年度第七次人口普查. (2021-11-26)[2023-10-11]. http://www. stats.gov.cn/sj/pcsj/rkpc/d7c/.
[31] Yu XE, Li H. Origin of ethnic groups, linguistic families, and civilizations in China viewed from the Y chromosome., 2021, 296(4): 783–797.
[32] Li YC, Ye WJ, Jiang CG, Zeng Z, Tian JY, Yang LQ, Liu KJ, Kong QP. River valleys shaped the maternal genetic landscape of Han Chinese., 2019, 36(8): 1643–1652.
[33] Lang M, Liu H, Song F, Qiao XH, Ye Y, Ren H, Li JN, Huang J, Xie MK, Chen SJ, Song MY, Zhang YF, Qian XQ, Yuan TX, Wang Z, Liu YM, Wang MG, Liu YC, Liu J, Hou YP. Forensic characteristics and genetic analysis of both 27 Y-STRs and 143 Y-SNPs in Eastern Han Chinese population., 2019, 42: e13–e20.
[34] Gu JQ, Jiang L, Xu JY, Wang H, Wei YL, Li CX. Genetic structure of East Asians based on high-density SNP data., 2023, 50(11): 1–14.顧佳琪, 江麗, 徐景怡, 王寒, 魏以梁, 李彩霞. 基于高密度SNP數(shù)據(jù)的東亞人群遺傳結(jié)構(gòu)研究. 生物化學(xué)與生物物理進(jìn)展, 2023, 50(11): 1–14.
[35] Zhang XY, Lu L, Yu H, Zhang X, Deng HB. Research on the distribution characteristics and formation mechanisms of Chinese traditional villages., 2023, 32(4): 132–143.張曉瑤, 陸林, 虞虎, 張瀟, 鄧洪波. 中國(guó)傳統(tǒng)村落分布特征與成因機(jī)制研究. 世界地理研究, 2023, 32(4): 132–143.
[36] Chiang CWK, Mangul S, Robles C, Sankararaman S. A comprehensive map of genetic variation in the world's largest ethnic group-Han Chinese., 2018, 35(11): 2736–2750.
[37] Xu SH, Yin XY, Li SL, Jin WF, Lou HY, Yang L, Gong XH, Wang HY, Shen YP, Pan XD, He YG, Yang YJ, Wang Y, Fu WQ, An Y, Wang JC, Tan JZ, Qian J, Chen XL, Zhang X, Sun YF, Zhang XJ, Wu BL, Jin L. Genomic dissection of population substructure of Han Chinese and its implication in association studies., 2009, 85(6): 762–774.
[38] Cao YN, Li L, Xu M, Feng ZM, Sun XH, Lu JL, Xu Y, Du PN, Wang TG, Hu RY, Ye Z, Shi LX, Tang XL, Yan L, Gao ZN, Chen G, Zhang YF, Chen LL, Ning G, Bi YF, Wang WQ, ChinaMAP Consortium. The ChinaMAP analytics of deep whole genome sequences in 10,588 individuals., 2020, 30(9): 717–731.
[39] Yin CY, Su KY, He ZW, Zhai D, Guo KJ, Chen XY, Jin L, Li SL. Genetic reconstruction and forensic analysis of Chinese Shandong and Yunnan Han Populations by co-analyzing Y Chromosomal STRs and SNPs., 2020, 11(7): 743.
[40] Zhang X, Tang Z, Wang B, Zhou XD, Zhou LM, Zhang GY, Tian JZ, Zhao YQ, Yao ZQ, Tian L, Zhang SH, Xia H, Jin L, Li CT, Li SL. Forensic analysis and genetic structure construction of Chinese Chongming Island Han based on Y Chromosome STRs and SNPs., 2022, 13(8): 1363.
[41] Zhang YL, Zhang R, Li M, Luo L, Zhang JY, Ding JD, Zhang SH, Li CT, Bian YN, Zhou CJ. Genetic polymorphism of both 29 Y-STRs and 213 Y-SNPs in Han populations from Shandong Province, China., 2020, 47:101738.
[42] Song MY, Wang Z, Zhang YQ, Zhao CX, Lang M, Xie MK, Qian XQ, Wang MG, Hou YP. Forensic characteristics and phylogenetic analysis of both Y-STR and Y-SNP in the Li and Han ethnic groups from Hainan Island of China., 2019, 39: e14–e20.
[43] Song F, Song MY, Luo HB, Xie MK, Wang XD, Dai H, Hou YP. Paternal genetic structure of Kyrgyz ethnic group in China revealed by high-resolution Y-chromosome STRs and SNPs., 2021, 42(19): 1892–1899.
[44] Wang MG, He GL, Zou X, Liu J, Ye ZW, Ming TY, Du WA, Wang Z, Hou YP. Genetic insights into the paternal admixture history of Chinese Mongolians via high- resolution customized Y-SNP SNaPshot panels., 2021, 54: 102565.
[45] Song MY, Wang ZF, Lyu Q, Ying J, Wu Q, Jiang LR, Wang F, Zhou YX, Song F, Luo HB, Hou YP, Song XB, Ying BW. Paternal genetic structure of the Qiang ethnic group in China revealed by high-resolution Y-chromosome STRs and SNPs., 2022, 61: 102774.
[46] Wang F, Song F, Song MY, Li JN, Xie MK, Hou YP. Genetic reconstruction and phylogenetic analysis by 193 Y-SNPs and 27 Y-STRs in a Chinese Yi ethnic group., 2021, 42(14–15): 1480–1487.
[47] Wang F, Song F, Song MY, Luo HB, Hou YP. Genetic structure and paternal admixture of the modern Chinese Zhuang population based on 37 Y-STRs and 233 Y-SNPs., 2022, 58: 102681.
[48] Wang XJ, Qian EF, Li Y, Song ZY, Zhao H, Xie HX, Li CX, Huang J, Jiang L. A genetic sub-structure study of the Tibetan population in Southwest China., 2020, 42(6): 565–576.王小娟, 錢(qián)恩芳, 李?lèi)? 宋正陽(yáng), 趙慧, 謝何鑫, 李彩霞, 黃江, 江麗. 中國(guó)西南地區(qū)藏族人群遺傳亞結(jié)構(gòu)研究. 遺傳, 2020, 42(6): 565–576.
[49] Wang XJ, Jiang L, Qian EF, Long F, Cui W, Ji AQ, Zhang FS, Zou K, Huang J, Li CX. Genetic polymorphisms and haplotypic structure analysis of the Guizhou Gelao ethnic group based on 35 Y-STR loci., 2020, 43: 101666.
[50] Trejaut JA, Poloni ES, Yen JC, Lai YH, Loo JH, Lee CL, He CL, Lin M. Taiwan Y-chromosomal DNA variation and its relationship with Island Southeast Asia., 2014, 15: 77.
[51] Wang H, Mao J, Xia Y, Bai XG, Zhu WQ, Peng D, Liang WB. Genetic polymorphisms of 17 Y-chromosomal STRs in the Chengdu Han population of China., 2017, 131(4): 967–968.
[52] Zhu BF, Wu YM, Shen CM, Yang TH, Deng YJ, Xun X, Tian YF, Yan JC, Li T. Genetic analysis of 17 Y-chromosomal STRs haplotypes of Chinese Tibetan ethnic group residing in Qinghai province of China., 2008, 175(2–3): 238–243.
[53] ISOGG.Y-DNA haplogroup tree. (2019-10-08)[2022- 11-22]. https://isogg.org/tree/index.html.
[54] Nei M. Analysis of gene diversity in subdivided populations., 1973, 70(12): 3321–3323.
[55] Nei M, Tajima F. DNA polymorphism detectable by restriction endonucleases., 1981, 97(1): 145–163.
[56] Ito K, Murphy D. Application of ggplot2 to pharma-cometric graphics., 2013, 2(10): e79.
[57] Excoffier L, Lischer HE. Arlequin suite ver 3.5: a new series of programs to perform population genetics analyses under Linux and Windows., 2010, 10(3): 564–567.
[58] Excoffier L, Smouse PE, Quattro JM. Analysis of molecular variance inferred from metric distances among DNA haplotypes: application to human mitochondrial DNA restriction data., 1992, 131(2): 479–491.
[59] Kumar S, Stecher G, Li M, Knyaz C, Tamura K. MEGA X: molecular evolutionary genetics analysis across computing platforms., 2018, 35(6): 1547–1549.
[60] Bandelt HJ, Forster P, R?hl A. Median-joining networks for inferring intraspecific phylogenies., 1999, 16(1): 37–48.
[61] 蔡曉云. Y染色體揭示的早期人類(lèi)進(jìn)入東亞和東亞人群特征形成過(guò)程[學(xué)位論文]. 復(fù)旦大學(xué), 2009.
[62] Yan S, Wang CC, Zheng HX, Wang W, Qin ZD, Wei LH, Wang Y, Pan XD, Fu WQ, He YG, Xiong LJ, Jin WF, Li SL, An Y, Li H, Jin L. Y chromosomes of 40% Chinese descend from three Neolithic super-grandfathers., 2014, 9(8): e105691.
[63] Sagart L, Jacques G, Lai YF, Ryder RJ, Thouzeau V, Greenhill SJ, List JM. Dated language phylogenies shed light on the ancestry of Sino-Tibetan., 2019, 116(21): 10317–10322.
[64] Wang LX, Lu Y, Zhang C, Wei LH, Yan S, Huang YZ, Wang CC, Mallick S, Wen SQ, Jin L, Xu SH, Li H. Reconstruction of Y-chromosome phylogeny reveals two neolithic expansions of Tibeto-Burman populations., 2018, 293(5): 1293–1300.
[65] Wang CC, Yeh HY, Popov AN, Zhang HQ, Matsumura H, Sirak K, Cheronet O, Kovalev A, Rohland N, Kim AM, Mallick S, Bernardos R, Tumen D, Zhao J, Liu YC, Liu JY, Mah M, Wang K, Zhang Z, Adamski N, Broomandkhoshbacht N, Callan K, Candilio F, Carlson KSD, Culleton BJ, Eccles L, Freilich S, Keating D, Lawson AM, Mandl K, Michel M, Oppenheimer J, ?zdo?an KT, Stewardson K, Wen SQ, Yan S, Zalzala F, Chuang R, Huang CJ, Looh H, Shiung CC, Nikitin YG, Tabarev AV, Tishkin AA, Lin S, Sun ZY, Wu XM, Yang TL, Hu X, Chen L, Du H, Bayarsaikhan J, Mijiddorj E, Erdenebaatar D, Iderkhangai TO, Myagmar E, Kanzawa-Kiriyama H, Nishino M, Shinoda KI, Shubina OA, Guo JX, Cai WW, Deng QY, Kang LL, Li DW, Li DN, Lin R, Nini, Shrestha R, Wang LX, Wei LH, Xie GM, Yao HB, Zhang MF, He GL, Yang XM, Hu R, Robbeets M, Schiffels S, Kennett DJ, Jin L, Li H, Krause J, Pinhasi R, Reich D. Genomic insights into the formation of human populations in East Asia., 2021, 591(7850): 413–419.
[66] Zhong H, Shi H, Qi XB, Duan ZY, Tan PP, Jin L, Su B, Ma RZ. Extended Y chromosome investigation suggests postglacial migrations of modern humans into East Asia via the northern route., 2011, 28(1): 717–727.
[67] Shi H, Dong YL, Wen B, Xiao CJ, Underhill PA, Shen PD, Chakraborty R, Jin L, Su B. Y-chromosome evidence of southern origin of the East Asian-specific haplogroup O3-M122., 2005, 77(3): 408–419.
[68] Ning C, Yan S, Hu K, Cui YQ, Jin L. Refined phylogenetic structure of an abundant East Asian Y-chromosomal haplogroup O*-M134., 2016, 24(2): 307–309.
[69] Kang LL, Lu Y, Wang CC, Hu K, Chen F, Liu K, Li SL, Jin L, Li H, Genographic Consortium. Y-chromosome O3 haplogroup diversity in Sino-Tibetan populations reveals two migration routes into the eastern Himalayas.2012, 76(1): 92–99.
[70] Zhang XM, Kampuansai J, Qi XB, Yan S, Yang ZH, Serey B, Sovannary T, Bunnath L, Aun HS, Samnom H, Kutanan W, Luo X, Liao SY, Kangwanpong D, Jin L, Shi H, Su B. An updated phylogeny of the human Y-chromosome lineage O2a-M95 with novel SNPs., 2014, 9(6): e101020.
[71] Sun J, Li YX, Ma PC, Yan S, Cheng HZ, Fan ZQ, Deng XH, Ru K, Wang CC, Wang CC, Chen G, Wei LH. Shared paternal ancestry of Han, Tai-Kadai-speaking, and Austronesian-speaking populations as revealed by the high resolution phylogeny of O1a-M119 and distribution of its sub-lineages within China., 2021, 174(4): 686–700.
[72] Yan S, Wang CC, Li H, Li SL, Jin L, Genographic Consortium. An updated tree of Y-chromosome Haplogroup O and revised phylogenetic positions of mutations P164 and PK4., 2011, 19(9): 1013–1015.
[73] Chen H, Lin R, Lu Y, Zhang R, Gao Y, He YG, Xu SH. Tracing Bai-Yue ancestry in aboriginal Li People on Hainan Island., 2022, 39(10): msac210.
[74] Wei LH, Huang YZ, Yan S, Wen SQ, Wang LX, Du PX, Yao DL, Li SL, Yang YJ, Jin L, Li H. Phylogeny of Y-chromosome haplogroup C3b-F1756, an important paternal lineage in Altaic-speaking populations., 2017, 62(10): 915–918.
[75] Zhabagin M, Sabitov Z, Tazhigulova I, Alborova I, Agdzhoyan A, Wei LH, Urasin V, Koshel S, Mustafin K, Akilzhanova A, Li H, Balanovsky O, Balanovska E. Medieval super-grandfather founder of Western Kazakh Clans from Haplogroup C2a1a2-M48., 2021, 66(7): 707–716.
[76] Dulik MC, Osipova LP, Schurr TG. Y-chromosome variation in Altaian Kazakhs reveals a common paternal gene pool for Kazakhs and the influence of Mongolian expansions., 2011, 6(3): e17548.
[77] Chiaroni J, Underhill PA, Cavalli-Sforza LL. Y chromo-some diversity, human expansion, drift, and cultural evolution., 2009, 106(48): 20174–20179.
[78] Qian EF, Deng P, Huang MS, Ma Q, Zhao H, Li CX, Huang J, Jiang L. Genetic polymorphism of Y chromosome haplogroup D-M174 in East Asian populations., 2019, 35(3): 308–313.錢(qián)恩芳, 鄧盼, 黃美莎, 馬泉, 趙慧, 李彩霞, 黃江, 江麗. 東亞族群中Y染色體D-M174單倍群的遺傳多態(tài)性. 法醫(yī)學(xué)雜志, 2019, 35(3): 308–313.
[79] Shi H, Zhong H, Peng Y, Dong YL, Qi XB, Zhang F, Liu LF, Tan SJ, Ma RZ, Xiao CJ, Wells RS, Jin L, Su B. Y chromosome evidence of earliest modern human settlement in East Asia and multiple origins of Tibetan and Japanese populations. BMC biology, 2008, 6: 45.
[80] Balaresque P, Bowden GR, Parkin EJ, Omran GA, Heyer E, Quintana-Murci L, Roewer L, Stoneking M, Nasidze I, Carvalho-Silva DR, Tyler-Smith C, de Knijff P, Jobling MA. Dynamic nature of the proximal AZFc region of the human Y chromosome: multiple independent deletion and duplication events revealed by microsatellite analysis., 2008, 29(10): 1171–1180.
[81] Malyarchuk B, Derenko M, Denisova G, Wozniak M, Grzybowski T, Dambueva I, Zakharov I. Phylogeography of the Y-chromosome haplogroup C in northern Eurasia., 2010, 74(6): 539–546.
[82] Tofanelli S, Ferri G, Bulayeva K, Caciagli L, Onofri V, Taglioli L, Bulayev O, Boschi I, Alù M, Berti A, Rapone C, Beduschi G, Luiselli D, Cadenas AM, Awadelkarim KD, Mariani-Costantini R, Elwali NE, Verginelli F, Pilli E, Herrera RJ, Gusm?o L, Paoli G, Capelli C. J1-M267 Y lineage marks climate-driven pre-historical human displacements., 2009, 17(11): 1520– 1524.
[83] Myres NM, Ekins JE, Lin AA, Cavalli-Sforza LL, Woodward SR, Underhill PA. Y-chromosome short tandem repeat DYS458.2 non-consensus alleles occur independently in both binary haplogroups J1-M267 and R1b3-M405., 2007, 48(4): 450–459.
[84] Wang CC, Lu Y, Kang LL, Ding HQ, Yan S, Guo JX, Zhang Q, Wen SQ, Wang LX, Zhang MF, Tong XZ, Huang XF, Nie SJ, Deng QY, Zhu BF, Jin L, Li H. The massive assimilation of indigenous East Asian populations in the origin of Muslim Hui people inferred from paternal Y chromosome., 2019, 169(2): 341– 347.
[85] Wang QY, Zhao J, Ren Z, Sun J, He GL, Guo JX, Zhang HL, Ji JY, Liu YB, Yang MQ, Yang XM, Chen JW, Zhu KY, Wang R, Li YX, Chen G, Huang J, Wang CC. Male-dominated migration and massive mssimilation of indigenous East Asians in the formation of muslim Hui People in Southwest China., 2020, 11: 618614.
[86] Zhong H, Shi H, Qi XB, Xiao CJ, Jin L, Ma RZ, Su B. Global distribution of Y-chromosome haplogroup C reveals the prehistoric migration routes of African exodus and early settlement in East Asia., 2010, 55(7): 428–435.
Paternal genetic structure analysis of the modern Han populations based on Y-SNP and Y-STR
Xin Zhu1,2,Xin Jin3,Jun Liu2,4, Lan Yang2,4, Lixin Zou2,5,Caixia Li1,2, Jiang Huang1, Li Jiang2
The Han populations represent the largest ethnic group in China. Previous studies have primarily focused on investigating their genetic origins, migration and integration, as well as paternal genetic relationships within specific regional Han populations. However, a comprehensive analysis of the global paternal genetic structure of Han populations is lacking. In this study, we performed Y-chromosome sequencing on 362 unrelated male samples from Chinese Han individuals collected from Qinghai, Sichuan and Liaoning provinces. We then integrated relevant data from reported studies. Our final dataset comprised 1830 samples from 16 Han populations across 15 provinces in China, encompassing information on 89 Y-SNPs and 16 Y-STRs. Statistical analyses were conducted to assess Y-STR haplotype diversity (HD) and Y-SNP haplogroup frequencies. Additionally, we employed principal component analysis (PCA), phylogenetic tree and haplotype network to explore genetic differentiation within Han populations and the genetic relationships between Han populations and ethnic minorities surrounding them. Our results demonstrated that the O-M175 haplogroup represents the predominant paternal lineage in Han populations, with frequencies ranging from 60.53% (Qinghai Han) to 92.7% (Guangdong Han). Moreover, the subclades downstream of O-M175 showed distinct regional variations in their distribution patterns. The O2-M122 haplogroup was prevalent in all Han populations and demonstrated a gradual decline in frequency from north to south. Conversely, the distribution frequency of the O1b-M268 haplogroup decreased from south to north, particularly showed significant presence among Han populations in the Lingnan region. Haplogroup O1a-M119 distributed more frequently in the central Han populations. Our findings revealed that Chinese Han populations can be categorized into three subgroups: northern, central, and southern. Notably, there were significant differences among Han in Qinghai and other regions. Regarding the genetic relationships between Han populations and surrounding ethnic minorities, we observed a closer genetic affinity between different Han populations, but northern Han demonstrated a stronger relationship with the Hui ethnic group, while southern Han exhibited a closer connection with the Gelao and Li ethnic groups. In summary, this study presented a systematic analysis of haplogroup distribution, genetic substructure of Han populations and genetic relationships between Han populations and surrounding ethnic minorities based on 89 Y-SNPs and 16 Y-STRs systematically. Our research supplemented valuable insights into population genetics and forensic genetics, and provided data support for the forensic application of Y chromosome. The integration of Y-SNP haplogroups with Y-STR haplotypes offers enhanced understanding of the genetic substructure within Han populations, which holds significance for both population genetics research and forensic science applications.
population genetics; forensic genetics; Y-SNP; Y-STR
2023-12-11;
2024-01-24;
2024-01-26
國(guó)家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(編號(hào):2022YFC3341004),國(guó)家自然科學(xué)基金項(xiàng)目(編號(hào):82171870),公安部鑒定中心基本科研業(yè)務(wù)費(fèi)專(zhuān)項(xiàng)資金項(xiàng)目(編號(hào):2022JB020)和現(xiàn)場(chǎng)物證溯源技術(shù)國(guó)家工程實(shí)驗(yàn)室開(kāi)放課題(編號(hào):2021FGKFKT01)資助 [Supported by the National Key R&D Program of China (No. 2022YFC3341004), the National Natural Science Foundation of China (No. 82171870), the Fundamental Research Funds for Institute of Forensic Science (No. 2022JB020), and the Open Project of the National Engineering Laboratory for Forensic Science (No. 2021FGKFKT01)
朱信,碩士研究生,專(zhuān)業(yè)方向:法醫(yī)物證學(xué)。E-mail: 1987538437@qq.com
黃江,博士,教授,研究方向:法醫(yī)物證學(xué)。E-mail: mmm_hj@gmc.edu.cn
江麗,博士,副主任法醫(yī)師,研究方向:法醫(yī)遺傳學(xué)。E-mail: jl@mail.bnu.edu.cn
10.16288/j.yczz.23-260
(責(zé)任編委: 朱波峰)