孫佳勝 ,田慶花 ,趙 霖 ,王俊方 ,畢 潔 ,石美森
(1.長沙市公安局刑事偵查支隊(duì)技術(shù)大隊(duì),湖南 長沙 410000;2.中國政法大學(xué) 證據(jù)科學(xué)教育部重點(diǎn)實(shí)驗(yàn)室,北京 100088;3.北京明正司法鑒定中心,北京 100191)
短串聯(lián)重復(fù)(short tandem repeat,STR)序列,由于具有豐富的多態(tài)性,被廣泛地用于連鎖分析、個(gè)體識別、群體遺傳學(xué)分析以及人類進(jìn)化史的研究[1-3]。本研究應(yīng)用Goldeneye?DNA身份鑒定系統(tǒng)BASIC對2004份長沙漢族個(gè)體共18個(gè)常染色體STR基因座進(jìn)行遺傳多態(tài)性調(diào)查,旨在為長沙地區(qū)的親權(quán)鑒定和個(gè)體識別提供更為準(zhǔn)確的概率計(jì)算依據(jù),同時(shí)運(yùn)用該數(shù)據(jù)和有關(guān)文獻(xiàn)探討長沙漢族和其他群體的遺傳關(guān)系,現(xiàn)報(bào)道如下。
根據(jù)“知情同意”原則,通過湖南省長沙市公安局DNA數(shù)據(jù)庫,選取長沙市各類案件中的涉案人員中無親緣關(guān)系個(gè)體2 004名(其中男性997名,女性1007名)。取血樣置于FTA采血卡上(武漢驥騰生物科技有限公司),干燥后常溫保存。
用打孔器打取直徑為1.2 mm的血樣,利用Goldeneye?DNA身份鑒定系統(tǒng)BASIC[基點(diǎn)認(rèn)知技術(shù)(北京)有限公司]10μL體系進(jìn)行直接擴(kuò)增:PCR反應(yīng)緩沖液4μL,引物混合液2μL,Taq聚合酶 0.16μL,補(bǔ)水至10μL。采用9700型PCR儀(美國AB公司)進(jìn)行擴(kuò)增,擴(kuò)增條件:95℃ 5min;94℃ 30s,60℃ 1min,70℃ 1 min;28~30個(gè)循環(huán);60℃ 60 min。 3130xl基因分析儀(美國AB公司)進(jìn)行毛細(xì)管電泳,用Gene-Mapper?ID v3.2軟件(美國Thermo Fisher Scientific公司)進(jìn)行基因分型。檢測使用標(biāo)準(zhǔn)物質(zhì)9947(女性)的基因組DNA作為擴(kuò)增陽性對照,超純水作為陰性對照進(jìn)行質(zhì)量控制。
運(yùn)用Modified-Powerstats軟件[4]獲得各STR基因座的等位基因頻率及群體遺傳學(xué)參數(shù),如觀察雜合度(observed heterozygosity,Ho)、期望雜合度(expected heterozygosity,He)、個(gè)體識別率(discrimination power,DP)、多態(tài)信息含量(polymorphic information content,PIC)。 采用 Cervus 3.0(http://www.fieldgenetics.com/pages/Home.jsp)計(jì)算累積個(gè)體識別率(total probability of discrimination power,TDP)、三聯(lián)體非父排除率(probability of exclusion in trio cases,PEtrio)和二聯(lián)體非父排除率(probability of exclusion in duo cases,PEduo)。 采用 Arlequin v3.5 軟件(http://cmpg.unibe.ch/software/arlequin3.5)進(jìn)行各基因座Hardy-Weinberg平衡及連鎖不平衡檢驗(yàn)。Bonferroni法[5]進(jìn)行修正。檢驗(yàn)水準(zhǔn)α=0.05。
通過文獻(xiàn)檢索獲得12個(gè)漢族地區(qū)[甘肅(272份)[6]、黑龍江大慶(221 份)[7]、貴州(1 104 份)[8]、廣東(1500 份)[9]、河北石家莊(323 份)[10]、四川(226 份)[11]、浙江(5000 份)[12]、江蘇(3097 份)[13]、重慶(180 份)[14]、山西(1 233 份)[15]、湖南(1 218 份)[16]、吉林長春(1775 份)[17]]和 7 個(gè)少數(shù)民族地區(qū)[廣西瑤族(70 份)[18]、廣西苗族(68 份)[18]、廣西壯族(223 份)[19]、云南傣族(100 份)[20]、廣西侗族(70 份)[20]、新疆維吾爾族(1 381 份)[21]、新疆哈薩克族(81 份)[21]]人群的 18 個(gè)STR基因座等位基因頻率作為群體遺傳關(guān)系比較的數(shù)據(jù)。應(yīng)用DISPAN軟件(http://www.personal.psu.edu/nxm2/software.htm)計(jì)算Nei的DA遺傳距離,Mega 7.0軟件(http://www.megasoftware.net/)構(gòu)建20個(gè)群體鄰接法(neighbor-joining,NJ)系統(tǒng)發(fā)育樹。
在2 004份湖南長沙漢族無關(guān)個(gè)體的血樣中,Goldeneye?DNA身份鑒定系統(tǒng)BASIC中的18個(gè)STR基因座都得到了有效擴(kuò)增,且各基因座間擴(kuò)增產(chǎn)物平衡,擴(kuò)增產(chǎn)物片段長度在85~428bp,純合子只顯現(xiàn)1個(gè)等位基因峰,雜合子則有2個(gè)等位基因峰且峰高比例>70%。有效擴(kuò)增的18個(gè)STR基因座的等位基因及其頻率見表1。
采用 Bonferroni法修正,將 P值設(shè)為 0.002 8(0.05/18),18個(gè)STR基因座的基因型頻率分布在長沙漢族人群中均達(dá)到 Hardy-Weinberg平衡(P>0.0028)。18個(gè)STR基因座兩兩之間共進(jìn)行153次連鎖不平衡檢驗(yàn),其中有5次比較的結(jié)果P<0.05,為 0.000 4~0.041 8,且位于不同的染色體上,采用Bonferroni法修正,將P值設(shè)為0.000 327(0.05/153),各位點(diǎn)間均不存在連鎖不平衡現(xiàn)象(P>0.000 327)。群體遺傳學(xué)參數(shù)(表2)表明,18個(gè)STR基因座的基因型頻率分布在長沙漢族群體中達(dá)到Hardy-Weinberg遺傳平衡。長沙漢族各基因座 DP為0.783 6~0.987 9,PIC為 0.5494~0.9145。 18 個(gè) STR 基因座 TDP、CPEtrio和CPEduo分別為 0.999 999 999 999 999 999 999 865 2、0.999999979和 0.999988325。
根據(jù)本文獲得的長沙漢族人群18個(gè)STR基因座基因頻率數(shù)據(jù),應(yīng)用DISPAN軟件計(jì)算與國內(nèi)目前公開發(fā)表的19個(gè)人群Nei的DA遺傳距離,并得到各群體間遺傳距離矩陣,見表3,應(yīng)用鄰接法所構(gòu)建的NJ系統(tǒng)發(fā)育樹見圖1。
表1 長沙漢族18個(gè)STR基因座等位基因及等位基因頻率 (n=2004)
續(xù)表1
表2 長沙漢族18個(gè)STR基因座的Hardy-Weinberg平衡檢驗(yàn)及群體遺傳學(xué)參數(shù) (n=2004)
圖1 20個(gè)人群NJ系統(tǒng)發(fā)育樹
從表3和圖1可以看出,在12個(gè)漢族比較人群中,湖南長沙漢族與湖南漢族的遺傳距離最近(0.0141),其次是與浙江漢族(0.0148)、廣東漢族(0.0158)的距離較近,與黑龍江大慶漢族的遺傳距離最遠(yuǎn)(0.0345)。在7個(gè)少數(shù)民族人群中,湖南長沙漢族與廣西壯族的遺傳距離相對較近(0.0265),與新疆哈薩克族的遺傳距離相對最遠(yuǎn)(0.0418)。
STR基因座的遺傳多態(tài)性為人類遺傳學(xué)、群體遺傳學(xué)研究提供了可靠依據(jù)。目前,已經(jīng)有學(xué)者對我國不同民族或漢族亞群進(jìn)行了不同程度的研究,但研究對象多為單一民族,且選擇的遺傳標(biāo)記數(shù)量少、不統(tǒng)一[22-25]。本研究選擇收集包括本實(shí)驗(yàn)室及其他研究者所調(diào)查的Goldeneye?DNA身份鑒定系統(tǒng)BASIC中的18個(gè)STR基因座的等位基因頻率,探討長沙漢族人群的遺傳多態(tài)性及其與19個(gè)群體之間的遺傳關(guān)系,保證所分析數(shù)據(jù)量豐富、遺傳標(biāo)記選擇及分析方法科學(xué)合理。
表3 20 個(gè)群體Nei 的DA遺傳距離矩陣
本研究表明,該18個(gè)STR基因座在長沙漢族人群中具有高度的遺傳多態(tài)性,可以滿足該地區(qū)法醫(yī)學(xué)中的親子鑒定和個(gè)體識別問題。
遺傳距離是評價(jià)群體間或物種間遺傳差異或遺傳分化的重要參數(shù),根據(jù)所計(jì)算的遺傳距離繪制NJ系統(tǒng)發(fā)育樹,漢族基本上聚為南北兩大類,與許麗娜等[3,26]的研究報(bào)道一致。長沙漢族大致位于南北漢族的中間位置,來自南方的漢族人群(浙江漢族、四川漢族、廣東漢族、湖南漢族、重慶漢族、貴州漢族)彼此分散聚在同一支;北方漢族人群(江蘇漢族、山西漢族、吉林長春漢族、河北石家莊漢族、甘肅漢族、黑龍江大慶漢族)彼此聚在一起,基本上與史料記載[27]相吻合。標(biāo)本來源和標(biāo)本均一性會(huì)對人群的聚類造成一定影響,江蘇漢族主要是針對蘇北地區(qū)人群的調(diào)查[13],這也就解釋了江蘇漢族與北方人群聚類的原因。
在7個(gè)少數(shù)民族人群中,長沙漢族與廣西壯族的遺傳距離相對較近。廣西壯族與相鄰的漢族和少數(shù)民族關(guān)系較近的原因可能在于壯族是我國南方最大的少數(shù)民族,人口多,分布廣,與漢族及其他少數(shù)民族的基因交流要多于廣西其他少數(shù)民族。本研究結(jié)果顯示,廣西壯族和云南傣族十分靠近,聚為一支。廣西苗族、瑤族、侗族相聚在一起,說明他們遺傳結(jié)構(gòu)十分相似。新疆哈薩克族、新疆維吾爾族彼此間比較相近,與漢族和其他少數(shù)民族遺傳關(guān)系最遠(yuǎn),可能與這兩個(gè)民族信仰伊斯蘭教,與漢族文化交融較少,甚少與其他民族通婚,因此積累著自己的祖系基因,與其他民族存在較大的遺傳差異所致。總體來看,根據(jù)Goldeneye?DNA身份鑒定系統(tǒng)BASIC中的18個(gè)STR基因座計(jì)算的遺傳距離與各民族群體的形成歷史較一致,說明常染色體STR遺傳標(biāo)記在民族間遺傳距離和基因漂流的評價(jià)中起到一定作用,但要確定某一群體與其他群體的關(guān)系,還有待于對Y染色體DNA、線粒體DNA等其他遺傳標(biāo)記以及考古學(xué)、人類學(xué)等的分析研究。
綜上,本研究獲得了長沙漢族人群18個(gè)STR基因座的等位基因頻率及基因型分布數(shù)據(jù),為建立長沙地區(qū)漢族人群STR數(shù)據(jù)庫、群體遺傳關(guān)系的分析及法醫(yī)學(xué)應(yīng)用提供了良好的遺傳背景數(shù)據(jù)。