孫亞男 程寶文 綜述 崔 文 審校
(1濟寧醫(yī)學院法檢學院,山東濟寧272067;2云南省公安廳,云南昆明650228)
在中國兩千多年的封建統(tǒng)治中,形成了一種“男性才能擔當家族傳宗接代重任”的封建思想。但是,現(xiàn)代文明社會已經逐漸摒棄這種“重男輕女”的封建思想,男女平等才是當今世界的主流。然而,從遺傳學角度看Y染色體遵循嚴格的父系遺傳方式,使得父系親緣關系傳遞存在一定的“傳宗接代”意義。
姓氏大部分都從父傳遞,Y染色體則更嚴格地遵循父系遺傳,因此姓氏與Y染色體之間有很好的平行對應關系。研究姓氏與Y染色體之間的關聯(lián)性對基因家譜學研究具有重要意義,并且在法醫(yī)學領域中也有一定的應用價值,因為它意味著當給定一個姓氏與Y染色體特征的聯(lián)合規(guī)律數據庫時,僅根據DNA就可進行姓氏的推測,為案件偵查提供幫助。
姓氏的起源發(fā)展狀況在世界各地不盡相同。在日本,姓氏于公元5世紀晚期產生,但直到1875年才被普通平民使用[1];在冰島,子女是以父親的名字為姓氏,所以其姓氏是世代變化的;在中國,姓氏的起源歷史可追溯到5000年前,主要來源于遠古時代的各種圖騰和地名。秦漢以后,數量大增[2]。據最新統(tǒng)計,擁有13億人口的中國目前有4100個姓氏[3]。盡管姓氏的起源時間(中國大約5000年前而土耳其僅約為80年前)和發(fā)展演變在世界各地不盡相同,但大多數情況下,姓氏從父遺傳的現(xiàn)象卻是相同的。
中國的姓氏分布主要存在兩個特點[4-5]:一是在歷史上的傳遞是連續(xù)和穩(wěn)定的。漫長的歷史進程中,中國姓氏表現(xiàn)出血緣文化的痕跡與生命遺傳物質的特點,尤其與Y染色體的進化具有基本相同和平行的表現(xiàn)。中國歷來有同姓聚居和聯(lián)宗修譜的習俗,且婚姻半徑較小,婚娶地域相對固定,這樣易形成同姓人群的分布,因此,中國姓氏的分布實際上主要反映了同姓人群的分布規(guī)律。另一個特點是存在大姓和小姓兩種姓氏狀態(tài),或稱為常見姓氏和罕見姓氏。僅占總姓氏量不足5%的100個常見姓氏集中了85%以上的人口,而占總姓氏量95%以上的罕見姓氏僅代表不足15%的人口。反映各地人群遺傳組成的主要因素是常見姓氏的分布,決定了中國歷史上人群遷移和地域親緣關系的程度;而罕見姓氏人群則表現(xiàn)了其地域特色和相對隔離的現(xiàn)象。因此,中國人群姓氏的分布規(guī)律及其與Y染色體之間的關聯(lián)性研究將為探索其在法醫(yī)學中的應用有重要價值。
人類Y染色體的95%為非重組區(qū)域(nonrecombinating portion of Y chromosome,NRY),不與任何染色體發(fā)生重組。因此,Y染色體的該特性保證了子代能完整地繼承父代的NRY,保證了其嚴格的父系遺傳。在代代父子相承的傳遞過程中,Y染色體也在不斷地積累著變化。遺傳突變的積累,使得人類父系遺傳體系中Y染色體存在一定的差異。NRY上的單核苷酸多態(tài)(SNP)和短串聯(lián)重復(STR)是突變形成的主要的兩大類差異。
Y-SNP的多態(tài)主要是堿基轉換、缺失或者插入(也包括長片段的插入,如Alu),其突變率相當低(約2×10-8次/代),所以每次突變都具備很好的代表性;另外,其發(fā)生DNA回復突變(recurrent mutation)的概率更低,幾乎忽略不計,且更不會有向多種狀態(tài)發(fā)生突變的情況。因此,在NRY上產生的一系列突變能夠準確地反映其漫長歷史中的演化過程。
單倍群(haplogroup)是一組相關聯(lián)的Y-SNPs位點的組成。定義單倍群的Y-SNPs在進化過程中的出現(xiàn)有時間順序。因此,可以用單倍群來構建Y染色體系統(tǒng)發(fā)育樹。通過高效液相色譜技術,Underhill等[6-7]發(fā)現(xiàn)了大量的Y-SNPs,大大地推動了其在人類學研究中的應用。隨著更多的YSNPs被發(fā)現(xiàn)和研究,目前已經構建了較為詳細的世界人群Y染色體系統(tǒng)發(fā)育樹[8],并在不斷更新中(http://www.isogg.org/tree/index.html)。各單倍群及其分支在世界人群中的分布顯示了很強的地理特異性。研究發(fā)現(xiàn),主要有D-M174、CM130、N-M231、O-M175單倍群分布于東亞[9],其中O-M175單倍群主要有O1-M119、O2-M95和O3-M122[8]3個亞群,O3-M122單倍群為東亞和東南亞的主要單倍群[10]。
Y-STR的多態(tài)主要是每個STR位點上重復單位的拷貝數變化,其突變率較高(約6.9×10-4/代),有利于估算不同Y染色體之間的分化時間,因此STR位點成了Y染色體上的“時鐘”。同YSNP相似,不同位置上的數個Y-STR可以構成單倍型[11]。通過分析Y染色體單倍型的多樣性程度可以計算群體的共祖時間。假設某個一步(singlestep)突變模型,且群體的有效群體大小穩(wěn)定,就可由公式t=-Ne ln(1-V/Neμ)推算出某個YSNP位點的發(fā)生大致時間。公式中,Ne為有效群體大小,μ是突變率,ln是自然對數,V為群體中某STR被觀察到的數值的方差,計算得到的t是經歷的世代數,乘以每一世代的年數即可得到發(fā)生時間[12]。
姓氏傳遞的連續(xù)和穩(wěn)定才能保證姓氏與Y染色體的基本相同和平行的傳遞關系。通過分析和比較宋朝、明朝和當代中國姓氏的分布曲線、同姓率和地域人群間的親緣關系,袁義達等[4-5,13-14]發(fā)現(xiàn)1000多年前的姓氏分布和當代基本一致。比較法國19世紀末和1975年的若干姓氏的分布情況,Legay等[15]也發(fā)現(xiàn)了姓氏傳遞的穩(wěn)定性。這些研究證實各國的姓氏傳承是相對穩(wěn)定的,為姓氏和Y染色體的關聯(lián)分析提供了理論依據。
同姓氏會提高出現(xiàn)相同Y染色體單倍型的機率,并且Y染色體單倍型相同的概率隨著姓氏在人群中分布頻率的減少而增加[16]。Balanovska等[17]提出了一種新的同姓人群Y染色體單倍群頻率的統(tǒng)計計算方法,并認為研究同一姓氏人群的關聯(lián)性需聯(lián)合分析Y-SNP與Y-STR兩種遺傳標記。Melissa Gymrek等也報道了可以通過Y-STRs檢測或基因家譜學數據庫查詢推斷姓氏[18]。通過分析南歐姓氏與Y染色體之間的關聯(lián)性,采用17個Y-STR基因座進行統(tǒng)計分析表明哥倫布并非生于意大利的熱那亞,而是來自西班牙的加泰羅尼亞[19]。Begona Martinez-Cruz等[20]聯(lián)合Y-SNP和Y-STR分析了羅馬尼亞瓦拉吉亞王朝時期的貴族姓氏巴薩拉布,表明在歷史長流中存在大量的外姓人群改姓巴薩拉布。Y染色體分析還可提供某一姓氏家譜中未記錄的基因混合事件信息,且在深入的系譜遺傳學研究中,姓氏的選擇對于真正土著群體的選擇發(fā)揮著重要的作用[21]。意大利學者Alessio Boattini等,通過一系列的研究,包括采用一種親緣關系矩陣和特征映射的遺傳統(tǒng)計方法來表明以姓氏為基礎的抽樣程序可以擴展應用到非隔離群體[22];以創(chuàng)建者姓氏作為判斷樣本祖先來源的標準,利用Y-SNPs與Y-STRs遺傳標記研究,支持基于姓氏選擇的Arbereshe人樣本可以作為阿爾巴尼亞創(chuàng)建者群體的Y染色體遺傳多態(tài)性的代表[23];并通過對意大利的姓氏數據研究確定了一種通過姓氏構建祖先人群結構的方法[24]。
吳東穎等[25]應用Y染色體的DYS19、DYS390、DYS391和YCAII4個STR基因座,分析了50例中國漢族王姓男性DNA樣本,結果與隨機樣本的單倍型的頻率分布無顯著差異。鄧志輝等[26]對深圳地區(qū)李姓、王姓和張姓的無關男性個體Y-STR單倍型遺傳多態(tài)性分析表明,該地區(qū)此三姓氏無關男性個體Y-STR單倍型的遺傳多態(tài)性豐富,與以往的漢族無關男性群體遺傳資料比較差異不顯著。侯偉光[27]對山東地區(qū)張、王、李、趙、劉、陳、孔、孟、佀、么10家姓氏17個Y-STRs進行了多態(tài)性檢測,分析10家姓氏譜系淵源關系表明,10家姓氏17個Y-STR基因座的等位基因頻率分布與山東人群分布總體上相似,且遺傳關系主要分3支,佀姓、趙姓為第1支,李姓、孟姓為第2支,其余為第3支。
在同一姓氏內研究Y染色體單倍型差異,表明姓氏的傳遞受到多種因素(包括姓氏多起源,非父傳遞,基因漂流)的影響[28]。遺傳學中姓氏和Y染色體的聯(lián)合分析,使其在法醫(yī)學方面也具有潛在的應用價值,由此形成的“基因家譜學”也迅速引起了公眾的關注。由于Y染色體的突變是一步步發(fā)生的,父系親緣關系越近的個體之間的Y染色體單倍型越相似,一個純粹由父系傳遞的姓氏應有相近的Y-STR單倍型。理論上講,足夠數量的YSNP和Y-STR信息,通過調查一個姓氏宗族內的Y染色團體信息,就能夠很清楚的構建其家族Y染色體的譜系樹,乃至編寫一部清晰的基因家譜。
[1]Yasuda N.Studies of isonymy and inbreeding in Japan[J].Hum Biol,1983,55(2):263-276.
[2]范又琪.百家姓姓氏起源[M].武漢:長江文藝出版社,1999:3-4.
[3]袁義達,邱家儒,張瑞,等.中國姓氏三百大姓:群體遺傳和人口分布(上)[M].上海:華東師范大學出版社,2007:5-6.
[4]袁義達,張誠,馬秋云,等.中國人姓氏群體遺傳-I.姓氏頻率分布與人群遺傳分化[J].遺傳學報,2000,27(6):471-476.
[5]袁義達,張誠,楊煥明.中國人姓氏群體遺傳-Ⅱ.姓氏傳遞的穩(wěn)定性與地域人群的親緣關系[J].遺傳學報,2000,27(7):565-572.
[6]Underhill PA,Shen P,Lin AA,et al.Y chromosome sequence variation and the history of human populations[J].Nat Genet,2000,26(3):358-361.
[7]Underhill PA,Passarino G,Linet AA,et al.The phylogeography of Y chromosome binary haplotypes and the origins of modern human populations[J].Ann Hum Genet,2001,65(Pt 1):43-62.
[8]Karafet TM,Mendez FL,Meilerman MB,et al.New binary polymorphisms reshape and increase resolution of the human Y chromosomal haplogroup tree[J].Genome Res,2008,18(5):830-838.
[9]鐘華.東亞現(xiàn)代人Y染色體群體結構和史前遷移[D].北京:中國科學院研究生院,2010:52-56.
[10]Shi H,Dong YL,Wen B.Y-chromosome evidence of southern origin of the East Asian-specific haplogroup O3-M122[J].Am J Hum Genet,2005,77(3):408-419.
[11]Kayser M,Caglia A,Corach D,et al.Evalution of Y-chromosomal STRs:a multicenter study[J].Int J Legal Med,1997,110(3):1029-1033.
[12]Su B,Xiao J,Underhillet P,et al.Y-chromosome evidence for a northward migration of modern humans into Eastern Asia during the last Ice Age[J].Am J Hum Genet,1999,65(6):1718-1724.
[13]袁義達,金鋒,張誠,等.宋朝中國人的姓氏分布與群體結構分化[J].遺傳學報,1999,26(3):187-197.
[14]袁義達,張誠.中國姓氏:群體遺傳與人口分布[M].上海:華東師范大學出版社,2002:32-36.
[15]Legay JM,Vernay M.The distribution and geographical origin of some French surnames[J].Ann Hum Biol,2000,27(6):587-605.
[16]King TE,Ballereau SJ,Schurer KE,et al.Genetic signatures of coancestry within surnames[J].Curr Biol,2006,16(4):384-388.
[17]Balanovska EV,Romanov AG,Balanovsky OP.Namesakes or Relatives?Approaches to Investigating the Relationship between Y Chromosome Haplogroups and Surnames[J].Molecular Biology,2011,45(3):473-485.
[18]Gymrek M,McGuire AL,Golan D,et al.Identifying personal genomes by surname inference[J].Science,2013,339(6117):321-324.
[19]Martinez-Gonzalez LJ,Martinez-Espin E,Alvarez JC,et al.Surname and Y chromosome in Southern Europe:a case study with Colom/Colombo[J].Eur J Hum Genet,2012,20(2):211-6.
[20]Martinez-Cruz B,Ioana M,Calafell F,et al.Y-Chromosome Analysis in Individuals Bearing the Basarab Name of the First Dynasty of Wallachian Kings[J].PLoS ONE,2012,7(7):e41803.
[21]Larmuseau MH,Vanoverbeke J,Gielis G,et al.In the name of the migrant father-Analysis of surname origins identifies genetic admixture events undetectable from genealogical records[J].Heredity,2012,109(2):90-95.
[22]Boattini A,Pedrosi ME,Luiselli D,et al.Dissecting a human isolate:Novel sampling criteria for analysis of the genetic structure of the Val di Scalve(Italian Pre-Alps)[J].Annals of Human Biology,2010,37(4):604-609.
[23]Boattini A,Luiselli D,Sazzini M,et al.Linking Italy and the Balkans.A Y-chromosome perspective from the Arbereshe of Calabria[J].Annals of Human Biology,2011,38(1):59-68.
[24]Boattini A,Lisa A,F(xiàn)iorani O,et al.General Method to Unravel Ancient Population Structures through Surnames,F(xiàn)inal Validation on Italian Data[J].Human Biology,2012,84(3):235-270.
[25]吳東穎,馬素參,劉明,等.應用Y染色體多態(tài)標記對漢族王姓親緣關系的研究[J].人類學學報,2000,19(2):132-137.
[26]鄧志輝,李茜,王大明,等.深圳無償獻血人群中李姓、王姓和張姓無關男性個體Y-STR單倍型遺傳多態(tài)性[J].遺傳,2007,29(11):1336-1344.
[27]侯偉光.山東漢族17個Y染色體STR遺傳多態(tài)性調查及姓氏淵源研究[D].遼寧:遼寧醫(yī)學院,2011,53-58.
[28]King TE,Jobling MA.Founders,drift,and infidelity:the relationship between Y chromosome diversity and patrilineal surnames[J].Mol Biol Evol,2009,26(5):1093-1102.