李 玲,李業(yè)芳,梁奔?jí)簦瑢O玉江,馬月輝,馬 青,蔣 琳*,劉書琴
(1.青島農(nóng)業(yè)大學(xué)動(dòng)物科技學(xué)院,青島 266109; 2.中國(guó)農(nóng)業(yè)科學(xué)院北京畜牧獸醫(yī)研究所,北京 100193; 3.寧夏農(nóng)林科學(xué)院動(dòng)物科學(xué)研究所,銀川 750002; 4.東營(yíng)職業(yè)學(xué)院,東營(yíng) 257091)
灘羊是我國(guó)優(yōu)良的地方綿羊種質(zhì)資源之一,原屬蒙古羊,具有個(gè)體大、增重快、耐干旱、耐熱、耐低營(yíng)養(yǎng)水平、抗逆性強(qiáng)、抗病力強(qiáng)、適應(yīng)性強(qiáng)等優(yōu)良特性,其肉質(zhì)鮮美,裘皮更是中外聞名。然而,由于存在飼養(yǎng)規(guī)模小且分散等問題,灘羊的生存空間不斷減少。另外,養(yǎng)殖戶對(duì)灘羊的資源保護(hù)意識(shí)非常薄弱,甚至受到某些利益驅(qū)使,對(duì)灘羊進(jìn)行盲目雜交,致使純種受到威脅。因此,亟待進(jìn)行準(zhǔn)確遺傳評(píng)估和科學(xué)化管理,以提高灘羊的總體生產(chǎn)水平。系譜對(duì)動(dòng)物遺傳及育種研究至關(guān)重要,但在散戶甚至場(chǎng)區(qū)的養(yǎng)殖過程中,難免會(huì)出現(xiàn)不可避免的失誤,導(dǎo)致系譜記錄不全或錯(cuò)誤。家畜育種工作中,親子鑒定能夠補(bǔ)全一部分缺失的親子代關(guān)系,對(duì)優(yōu)良種畜的保護(hù)和繁衍具有重要意義。
近年來(lái),在動(dòng)物領(lǐng)域中,分子標(biāo)記已然成為親子鑒定的首選遺傳標(biāo)記,其由來(lái)已久。此前出現(xiàn)的傳統(tǒng)標(biāo)記方法,如形態(tài)標(biāo)記、細(xì)胞標(biāo)記和生化標(biāo)記,由于極易受到外界環(huán)境的干擾,準(zhǔn)確率低,無(wú)法成功判斷,因此在實(shí)際應(yīng)用中受到了諸多限制。而利用DNA多態(tài)性進(jìn)行親子鑒定技術(shù)具有更靈敏、穩(wěn)定、準(zhǔn)確可靠等優(yōu)點(diǎn),以DNA多態(tài)性為代表的新型分子標(biāo)記有限制性片段長(zhǎng)度多態(tài)性(restriction fragment length polymorphism,RFLP)、隨機(jī)擴(kuò)增多態(tài)性DNA(random amplified polymorphic DNA,RAPD)、擴(kuò)增片段長(zhǎng)度多態(tài)性(amplified fragment length polymorphism,AFLP)、簡(jiǎn)單重復(fù)序列(simple sequence repeat,SSR)和單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)等。SNP具有二態(tài)性,它包括堿基的替換、顛倒、插入和缺失4種情況,在生物體中數(shù)量龐大,一些常見的哺乳動(dòng)物全基因組中,SNP的頻率約為每500~1 000個(gè)堿基出現(xiàn)一次,在基因組中數(shù)量多、分布廣,具有檢測(cè)簡(jiǎn)單,變異率低且遺傳穩(wěn)定性高等眾多優(yōu)點(diǎn)。迄今為止,在親緣鑒定領(lǐng)域,盡管基于微衛(wèi)星的研究依然占據(jù)絕大多數(shù),但是隨著下一代測(cè)序技術(shù)的興起,微衛(wèi)星標(biāo)記的使用量急劇下降,特別是在群體遺傳學(xué)和局部適應(yīng)的研究中。SNP作為典型的下一代測(cè)序標(biāo)記,目前在親緣分析中仍未得到充分利用,但正在獲得動(dòng)力,是最具發(fā)展?jié)摿Φ姆肿訕?biāo)記。許多研究比較了SNP和微衛(wèi)星在親子關(guān)系中的效力。早在21世紀(jì)初,Hauser等就證明了SNP比STR更加敏捷,之后周磊等模擬了10 000對(duì)含微衛(wèi)星或SNP標(biāo)記信息的非親子關(guān)系的個(gè)體,發(fā)現(xiàn)當(dāng)SNP和微衛(wèi)星標(biāo)記的平均雜合度分別為0.363和0.566時(shí),需要的SNP標(biāo)記數(shù)約是微衛(wèi)星標(biāo)記的2倍。余國(guó)春在豬親子鑒定中發(fā)現(xiàn),30個(gè)SNPs就能達(dá)到12個(gè)微衛(wèi)星同樣的鑒定效力,并且隨著SNP數(shù)目的增加,親緣概率逐漸達(dá)到了1。由于SNP標(biāo)記在不同品種和群體中具有很高的差異性,因此大量研究在不同動(dòng)物中開展,例如牛、羊、水產(chǎn)動(dòng)物等,但對(duì)灘羊的研究尚未見報(bào)道。鑒于此,本研究特異性針對(duì)我國(guó)寧夏地區(qū)灘羊進(jìn)行親子鑒定,補(bǔ)充場(chǎng)內(nèi)現(xiàn)有的系譜,尋找適合的部分SNP組合,為親子鑒定提供了便利,對(duì)鹽池地區(qū)灘羊的保種與利用具有重要意義。
本研究試驗(yàn)材料為我國(guó)寧夏灘羊場(chǎng)的159只灘羊,包括106個(gè)子代個(gè)體,以及有系譜記錄的4個(gè)父本個(gè)體和49個(gè)疑似父本個(gè)體。頸靜脈采集它們的血液并置于EDTA抗凝管中,過程中為防止凝固,邊采血邊搖勻,最后置于-80 ℃冰箱中長(zhǎng)期保存。
對(duì)所有血樣均采用Promega試劑盒提取基因組DNA,Nanodrop1000(Thermo Fisher Scientific, DE)進(jìn)行基因組DNA的質(zhì)量和濃度檢測(cè),檢測(cè)結(jié)果合格后交由北京康普森生物技術(shù)有限公司采用600K綿羊芯片進(jìn)行SNP基因分型。
根據(jù)全基因重測(cè)序數(shù)據(jù),利用PLINK(V1.90)軟件對(duì)所獲得的159個(gè)灘羊個(gè)體的SNPs進(jìn)行嚴(yán)格的質(zhì)量控制,標(biāo)準(zhǔn)為:個(gè)體檢出率大于0.9、位點(diǎn)檢出率大于0.9、最小等位基因頻率(MAF)大于 0.05、位點(diǎn)要符合哈代-溫伯格平衡(HWE)。
SNP經(jīng)Prune后(-indep-pairwise 1 000 5 0.5),使用Rstudio(V4.1.2)軟件進(jìn)行主成分分析(principal component analysis,PCA)。PCA是一種降維的分析方法,它把多個(gè)變量通過線性變換選出較少個(gè)數(shù)重要變量,以得到樣本的聚類情況,從而揭示灘羊樣本的遺傳背景,輔助后續(xù)的分析。
系統(tǒng)進(jìn)化樹是以類似樹狀分支的圖形分析各種(類)生物之間的親緣關(guān)系,基于SNP頻率構(gòu)建遺傳距離矩陣,利用MEGA(V7.0.26)軟件,采用鄰接法(Neighbour Joining,NJ)繪制,依據(jù)樣本的聚類數(shù)目劃分各個(gè)家系。
對(duì)質(zhì)控后的SNP及個(gè)體信息導(dǎo)入Cervus(V3.0.7)軟件進(jìn)行分析,用于親子鑒定研究的SNP篩選標(biāo)準(zhǔn)為:個(gè)體檢出率大于0.95、位點(diǎn)檢出率大于0.9、MAF大于 0.48、位點(diǎn)符合哈代-溫伯格平衡、每條染色體上相鄰SNP間距大于10 Mb。
親子鑒定常用的方法有兩種,分別是排除法和似然法。排除法是根據(jù)孟德爾的基因分離和自由組合定律,子代的等位基因須分別來(lái)自父本和母本同一位點(diǎn)的基因型,確定子代與候選親本是否存在親子關(guān)系,適用于位點(diǎn)較多的分析,本研究選用似然法進(jìn)行親子關(guān)系推斷。Cervus(V3.0.7)軟件首先通過Allele Frequency Analysis模塊計(jì)算各位點(diǎn)的基因頻率、雜合度、多態(tài)信息含量和排除概率,之后在Simulation模擬分析中估計(jì)各置信水平下候選親本的LOD與對(duì)應(yīng)的Delta臨界值,依據(jù)此值進(jìn)行正式親子鑒定分析,最終找到真實(shí)親本。其中,LOD值大于0表示候選親本比無(wú)關(guān)親本更可能成為子代的真實(shí)親本,且LOD值越大可靠性越高。當(dāng)出現(xiàn)多個(gè)LOD>0的候選親本時(shí),再通過Delta值(Δ,候選父母親權(quán)可靠性的統(tǒng)計(jì)值)分配最可能的親本(n≥2,Δ=LOD1-LOD2;n=1,Δ=LOD;n=0,Δ無(wú)意義)。
2.1.1 154個(gè)個(gè)體遺傳結(jié)構(gòu)分析 基因型文件經(jīng)質(zhì)控后,剔除5個(gè)子代個(gè)體,因此剩余154只灘羊和234 337個(gè)獨(dú)立的SNPs位點(diǎn)用于后續(xù)分析。PCA散點(diǎn)圖(圖1a)中綠色圓點(diǎn)代表父本,紅色圓點(diǎn)代表子代,可以看出,樣本整體分成3部分,在PC1的正值方向,最右邊的家系很明顯的與其他兩個(gè)區(qū)分開;除圖上標(biāo)注的系譜記錄的4個(gè)父本外,其余疑似父本都集中在左下角部位,表明他們之間的遺傳背景非常接近。NJ樹顯示(圖1b),灘羊群體聚集成3個(gè)獨(dú)立的大分支,圖中用紅色、藍(lán)色和黃色加以區(qū)分,這與PCA結(jié)果一致;加粗樹枝的個(gè)體代表父本,多數(shù)聚集在紅色大分支上,遺傳距離相近,少數(shù)分布在另外幾個(gè)分支上,遺傳距離較遠(yuǎn)。
a.綠色圓點(diǎn)代表父本,紅色圓點(diǎn)代表子代,150141、160015、130067、140195為系譜記錄的父本;b.加粗黑色分支為候選父本,加粗紅色分支為系譜記錄的父本a.The green dots represent the male parent, the red dots represent the offspring, and 150141, 160015, 130067, 140195 are the male parents recorded in the pedigree; b. The bold black branch is the candidate male parent, and the bold red branch is the male parent recorded in the pedigree圖1 154個(gè)個(gè)體PCA與NJ樹Fig.1 154 individuals PCA and NJ tree
2.1.2 100個(gè)個(gè)體遺傳結(jié)構(gòu)分析 為進(jìn)一步觀察黃色大分支(圖1b)內(nèi)個(gè)體的聚類情況,本研究提取了這100個(gè)樣本進(jìn)行分析,PCA(圖2a)和NJ樹(圖2b)將它們劃分成3個(gè)分支。因此,綜合上述研究結(jié)果,154只灘羊可分為5個(gè)大家系。
a. 綠色圓點(diǎn)代表父本,紅色圓點(diǎn)代表子代,150141、160015、140195為系譜記錄的父本;b.加粗黑色分支為候選父本,加粗紅色分支為系譜記錄的父本a. The green dots represent the male parent, the red dots represent the offspring, and 150141, 160015, 140195 are the male parents recorded in the pedigree; b. The bold black branch is the candidate male parent, and the bold red branch is the male parent recorded in the pedigree圖2 100個(gè)個(gè)體PCA與NJ樹Fig.2 100 individuals PCA and NJ tree
2.2.1 SNP標(biāo)記分布情況 在PLINK的嚴(yán)格質(zhì)控下,篩選得到211個(gè)可用于親子鑒定的高質(zhì)量SNPs,在染色體上的具體的分布情況如圖3所示,它們分布于26條染色上,平均間距為10.81 Mb,其中,1號(hào)染色體上的標(biāo)記數(shù)最多,有26個(gè),平均間隔是10.75 Mb。Allele Frequency Analysis計(jì)算結(jié)果可知(表1),該標(biāo)記組合的平均期望雜合度()是0.502;平均多態(tài)信息含量()為0.375,屬于中度多態(tài)性位點(diǎn);母本未知時(shí),單親累積父權(quán)排除概率高于99.99%,具有很高的親子鑒定準(zhǔn)確性和可靠性。
圖3 SNPs標(biāo)記在26條染色體上的分布情況Fig.3 Distribution of SNPs markers on 26 chromosomes
表1 SNP標(biāo)記信息Table 1 SNP markers information
2.2.2 父權(quán)鑒定結(jié)果 Simulation模擬分析10 000個(gè)子代,結(jié)果見表2。在80%的置信水平下,模擬LOD臨界值為-39,72%的子代被分配了親子關(guān)系,2 779個(gè)子代未找到真實(shí)親本;95%置信度下,分配率為63%。在此模擬環(huán)境下,導(dǎo)入質(zhì)控后剩余的101個(gè)子代個(gè)體做父權(quán)鑒定分析,結(jié)果發(fā)現(xiàn)(表3),80%置信度下,有88個(gè)子代被分配了親子關(guān)系,13個(gè)未找到真實(shí)父本;95%置信水平下,觀測(cè)鑒定率為79%;與原有系譜對(duì)照得知,僅12個(gè)子代的父本與系譜記錄一致,其余在疑似父本中找到。
表2 父權(quán)鑒定模擬-LODTable 2 Paternity identification simulation-LOD
表3 父權(quán)鑒定參數(shù)Table 3 Paternity authentication parameters
SNP攜帶著大量的遺傳信息,已經(jīng)應(yīng)用于人類和動(dòng)物的親子鑒定中,而在灘羊中的研究尚未見報(bào)道。Strucken等對(duì)3個(gè)牛群和2個(gè)羊群研究后,發(fā)現(xiàn)僅已知一個(gè)親本基因型且基因分型誤差為1%的情況下,至少需要200個(gè)SNPs標(biāo)記進(jìn)行親本檢驗(yàn)。王悅等在新疆綿羊SNP親子鑒定的研究中,發(fā)現(xiàn)不同MAF梯度和不同數(shù)目的SNP對(duì)親子鑒定準(zhǔn)確性的影響不同,MAF越大,累積排除概率(CPE)增長(zhǎng)速度越快。郭剛等在對(duì)北京地區(qū)荷斯坦牛進(jìn)行親子鑒定研究時(shí),采用了最小等位基因頻率(MAF)大于0.45、同一染色體上的標(biāo)記之間大于10 Mb的篩選標(biāo)準(zhǔn),本研究在郭剛等篩選的基礎(chǔ)上,又縮小MAF范圍為大于0.48,故該標(biāo)記組合具有很高的鑒定可靠性。
除以上影響因素外,殷彬在奶牛的系譜分析中發(fā)現(xiàn),親子鑒定的排除概率還與位點(diǎn)的期望雜合度和多態(tài)信息含量呈顯著正相關(guān),根據(jù)Botstein等提出的當(dāng)0.25<<0.5時(shí),標(biāo)記為中度多態(tài)位點(diǎn),>0.5時(shí)為高度多態(tài)位點(diǎn),<0.25為低多態(tài)位點(diǎn),本研究篩選出的標(biāo)記平均多態(tài)信息含量為0.375,屬于中度多態(tài)性。郭立平的試驗(yàn)證明了45個(gè)左右平均期望雜合度為0.5的SNP能夠抵消75個(gè)平均期望雜合度為0.3的SNP位點(diǎn)。Zhang等在中國(guó)西門塔爾牛的SNP開發(fā)中,選出了50個(gè)高信息含量的SNP標(biāo)記,它們的平均期望雜合度、平均多態(tài)信息含量分別為0.499 8和0.374 8,MAF在0.440 4~0.496 0之間,累積排除概率為99.89%,而本研究篩選到的SNP數(shù)量遠(yuǎn)高于50個(gè),且標(biāo)記的平均期望雜合度為0.502,累積排除概率超過了99.99%,綜合所有參數(shù),理論上,這211個(gè)SNPs標(biāo)記具有很高的親子鑒定準(zhǔn)確效力,能夠滿足灘羊親緣關(guān)系推斷的條件。
經(jīng)推斷,被分配親子關(guān)系的個(gè)體中,補(bǔ)充了一部分缺失的親子關(guān)系,同時(shí)一部分子代的真實(shí)親本也得到了糾正。劉峻宇等研究凡納濱對(duì)蝦SNP的親緣關(guān)系驗(yàn)證分析得到,雙親鑒定,實(shí)際鑒定率很高,這可能是由于本試驗(yàn)采樣的親本均為父本,缺少母本材料,雙親較單親檢測(cè)親子鑒定效果更好。此外,PCA和NJ樹表明,采集的疑似父本間遺傳距離很接近,Cervus(V3.0.7)軟件很難判斷親子關(guān)系,所以導(dǎo)致本研究的鑒定率較低。在父權(quán)鑒定模擬中,需要確定抽樣父本所占比例,一般設(shè)置小于1,除非真實(shí)親本全部在采樣個(gè)體中,本研究設(shè)置為0.6,再加上系譜記錄不完全,這種情況下應(yīng)該增加SNP的數(shù)量,以期達(dá)到更高的鑒定率。但本研究篩選出的標(biāo)記質(zhì)量極高,信息含量豐富,211個(gè)完全滿足親子鑒定的要求。另外,在有結(jié)果的子代中,很大部分真實(shí)親本在疑似父本中被找到,說(shuō)明系譜記錄有一定的錯(cuò)誤,在實(shí)際生產(chǎn)中養(yǎng)殖場(chǎng)還應(yīng)該加強(qiáng)對(duì)系譜的管理,預(yù)防錯(cuò)誤的發(fā)生。
本研究將寧夏灘羊場(chǎng)采集的樣本劃分為5個(gè)家系,并在灘羊中篩選出可用于親子鑒定的211個(gè)高質(zhì)量SNPs,該組合的平均期望雜合度為0.502,平均多態(tài)信息含量為0.375,屬于中度多態(tài)性位點(diǎn),單親累積排除概率大于99.99%,具有很高的準(zhǔn)確性和可靠性,為灘羊的保護(hù)和繁育提供寶貴的參考價(jià)值。