国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

采用ForenSeqTM DNA Signature Prep試劑盒進行祖先推斷

2019-12-27 03:04
法醫(yī)學雜志 2019年5期
關鍵詞:祖先東亞蒙古族

(中山大學中山醫(yī)學院法醫(yī)學系,廣東 廣州 510089)

祖先信息標記(ancestry informative marker,AIM)是人類基因組中在族群之間顯示出分布模式差異的遺傳標記,其等位基因頻率與基因型頻率在不同地域或民族群體間差異明顯,因而可用作祖先信息推斷。單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)[1]、插入/缺失(insertion/deletion,InDel)多態(tài)性[2]、Y染色體短串聯(lián)重復(Y chromosomal short tandem repeat,Y-STR)[3]、線粒體 DNA(mitochondrial DNA,mtDNA)[4]、微單倍型(microhaplotype)[5]等均可作為AIM,其中SNP因為在人類基因組中數(shù)量豐富且有國際人類基因組單體型圖計劃、千人基因組計劃等相應的數(shù)據(jù)庫支持,成為近年來篩選AIM的主要對象,這類SNP被稱為祖先信息SNP(ancestry informative SNP,aiSNP)[6]。在法醫(yī)學應用中,對aiSNP分析可以在重大災害事件或案件調查中縮小調查范圍,加快失蹤人員或災害受害者的識別進程,在缺乏目擊證人證詞或數(shù)據(jù)庫無法比對時提供調查線索,因此被法醫(yī)學界關注和重視[7-8]。目前已陸續(xù)報道了一些基于毛細管電泳(capillary electrophoresis,CE)平臺的aiSNP分型體系用于預測個體祖先和進行族群推斷[7,9]。

二代測序(second generation sequencing,SGS)技術革新了傳統(tǒng)的Sanger測序方法,其基本原理是邊合成邊測序,能夠同步對多樣本、多遺傳標記進行較高覆蓋度的分析,近年來在法醫(yī)學領域的應用逐漸增多[10-11]。其中,MiSeq FGx法醫(yī)基因組學系統(tǒng)(美國Illumina公司)是目前在法醫(yī)學領域常用的二代測序技術平臺之一,基于此平臺的ForenSeqTMDNA Signature Prep試劑盒系統(tǒng)能夠同時擴增231個法醫(yī)學檢驗相關的DNA遺傳標記,包括58個STR、Amelogenin、94個個體識別 SNP(individual identification SNP,iiSNP)、56個aiSNP和24個表型信息SNP(phenotype informative SNP,piSNP)(aiSNP和piSNP有兩個位點重疊)[12-13]。

我國是一個多民族國家,根據(jù)第六次全國人口普查數(shù)據(jù)顯示,除了漢族人口占多數(shù)以外,蒙古族、藏族、維吾爾族3個少數(shù)民族的人口均超過500萬,有比較集中的居住地,語言、服飾和習俗標識明顯[14]。此外,作為對外開放程度高、經濟較發(fā)達的城市,廣州近年居住有數(shù)十萬非洲人,其中尼日利亞裔約占1/3[15]。因此,本研究基于MiSeq FGx法醫(yī)基因組學系統(tǒng)二代測序平臺,采用ForenSeqTMDNA Signature Prep試劑盒的aiSNP標記,以尼日利亞群體和中國的4個群體(漢族、蒙古族、藏族和維吾爾族)作為研究對象,評估其推斷祖先來源的效果。

1 材料與方法

1.1 樣本收集

根據(jù)知情同意原則采集志愿者外周血,置于濾紙片或FTA卡上制備為血痕。5個群體共計85個樣本,其中包括:河北漢族個體23個,編號為H1~H23;內蒙古自治區(qū)蒙古族個體13個,編號為M1~M13;西藏自治區(qū)藏族個體12個,編號為Z1~Z12;新疆維吾爾自治區(qū)維吾爾族個體15個,編號為W1~W15;尼日利亞個體22個,編號為N1~N22。本研究經中山大學中山醫(yī)學院倫理委員會批準。

1.2 文庫構建

使用1.2 mm直徑打孔器取血痕2片,使用ForenSeqTMDNA Signature Prep試劑盒(美國Illumina公司)的B系列引物(DNA Primer Mix B,DPMB)進行文庫構建。PCR組分包括DPMB 5.0μL,PCR反應混合液1 4.7 μL,酶混合物0.3 μL。熱循環(huán)條件為:98℃變性3 min;96℃ 45 s,54℃ 2 min,68℃ 2 min,共8個循環(huán);68℃末次延伸3min,10℃保存。對以上擴增產物添加樣本特異標簽(i5和i7)并實現(xiàn)靶點富集,熱循環(huán)參數(shù)為:98℃ 30 s;98℃ 20 s,66℃ 30 s,68℃ 90s,共循環(huán)15次;68℃ 10min,10℃保存。利用樣品純化微珠(sample purification beads,SPB)和標準化文庫珠(library normalization beads,LNB)對文庫進行純化和標準化。最后將每個樣品的文庫5μL混合到一個微量離心管中。

1.3 DNA測序

將7 μL混合后的文庫、951 μL雜交緩沖液(hybridization buffer,HT1)、2μL稀釋后的人類測序對照(human sequencing control,HSC)混合,使用 MiSeq FGxTMReagent試劑盒在MiSeq FGxTM測序儀上進行測序。每批檢測均設置2800M為陽性對照DNA(美國Promega公司),無菌水為陰性對照。

1.4 數(shù)據(jù)分析

測序原始數(shù)據(jù)自動導入ForenSeqTM通用分析軟件(universal analysis software,UAS)v1.2.16173(美國Illumina公司)進行分析,按照默認分析閾值和解釋閾值進行56個aiSNP位點的等位基因判讀。選擇UAS的“Phenotype Estimation”分析頁面進行個體表型和生物地理祖先推斷。UAS祖先分析模塊主要利用千人基因組計劃的四大群體(歐洲、東亞、非洲和混合美洲)作為訓練樣本集,包括歐洲個體321個、東亞個體251個、非洲個體209個、混合美洲個體156個。根據(jù)56個aiSNP基因型數(shù)據(jù)與每個待檢樣本進行主成分分析(principle component analysis,PCA)。此外,本研究以三個非混合人群(歐洲、東亞和非洲人群)作為參考群體,基于56個aiSNP等位基因頻率數(shù)據(jù)(http://spsmart.cesga.es/),對本研究中每個個體分別計算在三個參考群體的群體匹配概率(assignment match probability,AMP)和似然比(likelihood ratio,LR),根據(jù)最大群體匹配概率和似然比確定其祖先分配區(qū)域[16-17],按照江麗等[16]設定的判斷方法:LR>100時,AMP值排第一位的人群為未知個體的來源人群;當LR≤100時,AMP值的前兩位人群均不排除。參考千人基因組數(shù)據(jù)庫(http://www.internationalgenome.org/)中歐洲、東亞和非洲人群的56個aiSNPs的分型,采用PAST v3.10進行PCA[18]。利用Structure 2.3.4軟件(http://pritchardlab.stanford.edu/structure.html)分析本研究5個群體的祖先組成成分,設置0.70作為歸屬到某種人群的標準。設置運行長度為10 000,迭代次數(shù)為10 000,選擇相關等位基因頻率模型[19],通過Structure Harvester(http://taylor0.biology.ucla.edu/struct_harvest/)確定最佳K值[20],采用 Distruct 1.1(https://web.stanford.edu/group/rosenberglab/distruct.html)生成最終圖形[21]。

2 結 果

2.1 測序質量

本次研究按照群體類別共進行了5批測序,每批實驗的2800M陽性對照DNA的分型均與試劑盒標準分型結果一致,顯示該體系的準確性和穩(wěn)定性。85個樣本的測序深度(depth)見圖1A,從圖中可以看出最低的兩個位點是rs310644和rs3811801,但都大于UAS中默認的分析閾值(10×)和解釋閾值(30×),所有位點的平均測序深度為566×。圖1B為雜合子等位基因覆蓋比(allele coverage ratio,ACR),從該圖中可以看出除位點rs1426654低于默認閾值(0.5)外,其他位點均較高,均值為0.86,整體測序質量良好。

圖1 本研究85個樣本56個aiSNP的測序質量

2.2 ForenSeqTMUAS分析

經MiSeq FGx法醫(yī)基因組學系統(tǒng)配套的UAS生物地理祖先分析模塊,獲得每個樣本基于非洲、東亞、歐洲、混合美洲4個參考人群的PCA位置圖以及每個樣本與最近的群體聚集中心(centroid)的距離、千人基因組中與待測樣本距離最近的群體樣本列表、離檢測樣本最近的聚集中心的參考樣本列表。85個樣本通過UAS分析的PCA疊加圖見圖2,可以看到:河北漢族、西藏自治區(qū)藏族個體通常落入東亞群體內,也有個體處于東亞和混合美洲群體的邊緣;內蒙古自治區(qū)蒙古族個體主要聚集在東亞群體內,但也有少數(shù)樣本處于東亞和混合美洲群體之間;新疆維吾爾自治區(qū)維吾爾族則主要聚集到東亞群體和混合美洲群體之間的位置;而尼日利亞個體則全部聚集在非洲群體內。

圖2 UAS分析獲得的本研究5個群體樣本與祖先預測PCA疊加圖

2.3 PCA

如圖3所示,主成分1(PC1)、主成分2(PC2)分別占總變化的49.53%和7.38%?;谇皟蓚€因素,河北漢族、西藏自治區(qū)藏族和內蒙古自治區(qū)蒙古族聚為一簇,新疆維吾爾自治區(qū)維吾爾族單獨為一簇,并且4個群體都處于同一側,而尼日利亞群體處于另外一側,與中國的4個群體相距較遠。該分析結果與UAS祖先分析結果一致。

2.4 AMP和LR

以歐洲、東亞和非洲三個非混合種群作為參考群體,根據(jù)最大群體匹配概率和似然比確定本研究每個個體的祖先分配區(qū)域,結果如表1所示,河北漢族、西藏自治區(qū)藏族、內蒙古自治區(qū)蒙古族中的所有個體均被分配到東亞種群(100%),來自尼日利亞的群體被分配到非洲種群(100%)。新疆維吾爾自治區(qū)維吾爾族與其他4個研究群體的祖先地理分配比例有明顯的差異,主要預測來源于東亞和歐洲群體,其分配比例分別為60%和40%。

圖3 本研究5個群體樣本的PCA圖

表1 根據(jù)AMP和LR推斷生物地理祖先 [n(%)]

2.5 祖先成分分析

由圖4A可見,在本研究中獲得最佳K值為3的Structure分析圖,歐洲、東亞和非洲群體可以顯現(xiàn)和區(qū)分。圖4B顯示,本研究5個群體最佳K值為3,主要分為三個聚類,其中河北漢族、新疆維吾爾自治區(qū)維吾爾族和尼日利亞群體各自的祖先成分相對比較集中,內蒙古自治區(qū)蒙古族和西藏自治區(qū)藏族的少數(shù)個體含有極少比例的混合成分。結合表2可見:本研究中河北漢族、西藏自治區(qū)藏族群體的東亞成分比例分別為0.987和0.960;內蒙古自治區(qū)蒙古族主要含有東亞成分(88.4%),含有較少比例的歐洲成分(10.0%);尼日利亞群體的非洲群體成分比例為99.7%;而新疆維吾爾自治區(qū)維吾爾族則明顯表現(xiàn)出東亞和歐洲的混合成分,其比例分別為53.3%和45.7%。

圖4 本研究的5個群體與3個參考群體56個aiSNP分型的Structure分析圖

表2 本研究的5個群體的祖先成分比例

表3顯示了本研究每個個體的祖先成分分析結果,設定0.70作為判定混合人群的標準,結果顯示尼日利亞個體中非洲群體成分全部大于0.980,100%的個體顯示出非洲群體來源(22/22);河北漢族、內蒙古自治區(qū)蒙古族、西藏自治區(qū)藏族個體中東亞人群成分全部大于0.700,100%被歸入東亞群體來源。而新疆維吾爾自治區(qū)維吾爾族個體中僅有2個樣本(W4和W14)的東亞成分比例大于0.700,即只有13.3%(2/15)的樣本被歸入東亞群體來源,其余樣本同時具有相對較高比例的歐洲來源(0.294~0.649),顯示出明顯的混合遺傳的特點。

表3 本研究85個樣本的祖先成分分析

續(xù)表3

3 討 論

本研究用于祖先推斷的56個aiSNP位點最早由KIDD等[17]所報道,被美國Illumina公司整合入ForenSeqTMDNA Signature Prep試劑盒?;诙鷾y序平臺能在檢測STR、SNP分型進行個體識別時同步進行族群推斷,提高了單一檢測體系獲得的遺傳信息。

本研究基于MiSeq FGx法醫(yī)基因組學系統(tǒng)檢測平臺,對中國河北漢族、內蒙古自治區(qū)蒙古族、西藏自治區(qū)藏族和新疆維吾爾自治區(qū)維吾爾族以及居住在廣州的尼日利亞個體進行56個aiSNP位點測序和基因分型,并采用了該體系配套的UAS及其他公共軟件通過PCA、AMP、LR計算,Structure分析對各個樣本的生物地理祖先進行推斷。其中PCA分析顯示:河北漢族和西藏自治區(qū)藏族人群與東亞參考群體聚集在一起;尼日利亞人群與非洲參考群體聚集在一起;內蒙古自治區(qū)蒙古族主要聚集在東亞參考群體,少數(shù)個體位于東亞和混合美洲參考種群之間;新疆維吾爾自治區(qū)維吾爾族人群則與混合美洲聚集在一起并處于東亞和歐洲群體之間。在UAS軟件中混合美洲群體作為一種特殊的混合人群,主要包括洛杉磯的墨西哥人、波多黎各的波多黎各人、麥德林的哥倫比亞人和秘魯利馬的秘魯人等混合群體。有文獻[19]報道,該混合種群的祖先成分包括東亞和歐洲的混合組成,通過Structure分析具有與南亞和中亞相似的遺傳成分[22]。為了獲得較明確的預測,本研究選擇東亞、歐洲、非洲3個非混合人群作為洲際參考群體,根據(jù)群體匹配概率和似然比推斷祖先來源的結果,顯示河北漢族、內蒙古自治區(qū)蒙古族、西藏自治區(qū)藏族個體100%被歸入東亞祖先來源,100%的尼日利亞個體被歸入非洲來源。通過Structure分析獲得每個樣本的祖先成分比例,若參考RAMANI等[23]的報道,設定0.75作為判定歸屬到某種人群的標準,河北漢族、西藏自治區(qū)藏族個體也將100%被歸入東亞祖先來源,但內蒙古自治區(qū)蒙古族中只有76.9%(10/13)的個體被歸入東亞人群,與通過AMP和LR的預測結果存在差異。結合本研究UAS和LR法的分析結果,嘗試以0.70作為標準,則可將內蒙古自治區(qū)蒙古族個體100%劃分到東亞來源。而在上述幾種方法中,新疆維吾爾自治區(qū)維吾爾族均明顯地表現(xiàn)出東亞和歐洲的混合來源特點,與已有文獻報道[22,24]新疆維吾爾自治區(qū)維吾爾族祖先組成成分是東亞和歐洲的混合相一致。文獻[24]指出,預測祖先來源分析時,特別是對于混合群體的祖先來源推斷及祖先成分分析,如果只考慮似然比的值,對地理位置相近的種群,由于持續(xù)的人口遷移和通婚就會導致分類錯誤。在這種情況下,Structure分析祖先成分可以較明確地體現(xiàn)其混合來源構成,更客觀地判斷個體的祖先起源。因此,在進行祖先來源預測中可結合兩種方法進行分析。

本研究采用上述方法對5個群體的分析結果一致,即:尼日利亞群體與中國的4個民族群體之間具有明顯的遺傳差異,通過該檢測體系全部歸屬到非洲種群;河北漢族、西藏自治區(qū)藏族和內蒙古自治區(qū)蒙古族的祖先預測顯示主要來源于東亞;新疆維吾爾自治區(qū)維吾爾族預測為東亞和歐洲的混合成分。通過該體系可將新疆維吾爾自治區(qū)維吾爾族與我國其他3個民族(河北漢族、西藏自治區(qū)藏族、內蒙古自治區(qū)蒙古族)進行區(qū)分,但尚不能更進一步具體地明確河北漢族、西藏自治區(qū)藏族、內蒙古自治區(qū)蒙古族之間的遺傳差異。

綜上所述,F(xiàn)orenSeqTMDNA Signature Prep試劑盒中的aiSNP體系從洲際群體水平對本研究的5個群體之間的遺傳關系和祖先預測的效能是可靠的,但尚不能區(qū)分種群中的亞群體之間的遺傳關系和祖先來源,需要開發(fā)驗證更多的參考種群數(shù)據(jù)和更高差異的東亞特定aiSNP標記,以便在法醫(yī)祖先推斷中提供更高的族群分辨率,進行更精細的祖先推斷[22]。

猜你喜歡
祖先東亞蒙古族
烏龜:想不到祖先最早是“宅男”
黑龍江蒙古族古籍考錄
蒙古族“男兒三藝”傳承研究
始祖鳥不是鳥祖先
我們的祖先是條魚
我校東亞研究院一行應邀訪問韓國東亞大學
第7 屆東亞焊接技術論壇(7th EAST- WJ)在杭州落幕
學霸“三小只”
中國共產黨內蒙古自治區(qū)第十屆委員會委員當選名單
未定的東亞多邊體制與能動的中國東亞政策
南平市| 闻喜县| 云林县| 上栗县| 松阳县| 彰化县| 苍梧县| 万宁市| 广灵县| 河源市| 会宁县| 微博| 汤阴县| 镇原县| 屯留县| 台东县| 黄大仙区| 盐边县| 镇安县| 富民县| 昆明市| 宁都县| 天镇县| 沙雅县| 米林县| 双柏县| 团风县| 太湖县| 陇川县| 克什克腾旗| 新绛县| 许昌市| 昂仁县| 濮阳县| 普宁市| 阿克| 岱山县| 璧山县| 砚山县| 衡山县| 夏津县|