宋玉樸,孫永峰*,馮自強(qiáng),周宇軒,張 磊,李晟毅,閆曉敏,許云鵬
(1.吉林農(nóng)業(yè)大學(xué)動(dòng)物科學(xué)技術(shù)學(xué)院,吉林長(zhǎng)春 130118;2.江西省畜牧技術(shù)推廣站,江西南昌 330000)
單核苷酸多態(tài)性(Single Νucleotide Polymorphism,>SΝP)是一類重要的遺傳標(biāo)記,具有數(shù)量大、二態(tài)性、穩(wěn)定遺傳和易于自動(dòng)化檢測(cè)等特點(diǎn)[1]。伴隨著人類基因組計(jì)劃的開展和完成,世界各地的科研人員陸續(xù)開展了囊括大量物種的基因組測(cè)序工作,公布了大量的基因組DΝA 序列,同時(shí)構(gòu)建了包含基因組序列、基因標(biāo)簽、突變位點(diǎn)等生物信息的數(shù)據(jù)庫(kù)?;蚪M學(xué)的研究成果極大促進(jìn)了SΝP 的發(fā)掘和檢測(cè)技術(shù)的發(fā)展。SΝP 檢測(cè)與分型技術(shù)已廣泛應(yīng)用于畜禽遺傳學(xué)研究、品種選育、種質(zhì)資源保護(hù)等領(lǐng)域,促進(jìn)了畜禽產(chǎn)業(yè)的發(fā)展。本文對(duì)SΝP 的形成、分類、檢測(cè)方法以及SΝP 檢測(cè)技術(shù)的發(fā)展和在畜禽中的研究與應(yīng)用進(jìn)行綜述,分析各類SΝP檢測(cè)方法的優(yōu)缺點(diǎn),以拓展其應(yīng)用領(lǐng)域。
SΝP 即單核苷酸多態(tài)性,是基因組水平上單個(gè)核苷酸變異所導(dǎo)致的DΝA 堿基序列的改變,屬于第3 代遺傳標(biāo)記,于1996 年由人類基因組中心科學(xué)家Lander等第1 次提出此概念[2]。SΝP 主要來(lái)源是DΝA 復(fù)制過程中的錯(cuò)誤匹配、遺傳物質(zhì)的化學(xué)損傷和腺嘌呤、鳥嘌呤的自發(fā)脫氨基,主要呈現(xiàn)為堿基的轉(zhuǎn)換、顛換、插入和缺失4 種形式[3-6]。
根據(jù)堿基變異所發(fā)生的位置,可分為編碼區(qū)SΝP和非編碼區(qū)SΝP,其中非編碼區(qū)SΝP 又可細(xì)分為基因間SΝP(iSΝP)和基因內(nèi)SΝP[7-9]。根據(jù)是否造成編碼氨基酸或功能性RΝA 堿基的改變,又可分為同義SΝP和非同義SΝP。同義SΝP 的形成并不影響蛋白質(zhì)的翻譯過程;非同義突變包括錯(cuò)義突變和無(wú)義突變,錯(cuò)義突變是指點(diǎn)突變后使編碼氨基酸改變[10];無(wú)義突變則使編碼氨基酸突變成終止密碼子(圖1)。SΝP 作為一種核苷酸水平變異造成的遺傳標(biāo)記,編碼區(qū)非同義SΝP成為研究人員的廣泛關(guān)注的研究對(duì)象[11]。
SΝP 檢測(cè)樣本一般為基因組DΝA[12],檢測(cè)SΝP的方法有很多,根據(jù)不同的檢測(cè)原理可分為以下八大類(表1)。
表1 SΝP 檢測(cè)方法及其優(yōu)缺點(diǎn)
2.1 測(cè)序法 測(cè)序法是最便捷的SΝP 檢測(cè)方法,其基本原理是通過對(duì)目的DΝA 序列進(jìn)行測(cè)序,將結(jié)果與參考DΝA 序列進(jìn)行對(duì)比,以判斷目的DΝA 是否發(fā)生堿基突變[13]。測(cè)序法具有檢出率極高的特點(diǎn),應(yīng)用測(cè)序法可獲知核苷酸突變的類型和突變位點(diǎn),為后續(xù)的SΝP 分型提供重要基礎(chǔ)。
第1 代測(cè)序包括由Sanger 等[14]首創(chuàng)的鏈終止法和Maxam 等[15]提出的化學(xué)法,Sanger 是DΝA 測(cè)序金標(biāo)準(zhǔn)[16]。Sanger 法雖然堿基讀取率接近100%,但當(dāng)2 個(gè)或多個(gè)位點(diǎn)為雜合子時(shí),它不能從基因組DΝA 中確定單個(gè)SΝP 的等位基因之間的順反式關(guān)系[17],且測(cè)序通量不高、檢測(cè)速度較慢、實(shí)驗(yàn)花費(fèi)高。經(jīng)改進(jìn)的測(cè)序技術(shù)降低了測(cè)序成本,大幅提高了測(cè)序效率[18]。二代測(cè)序基于邊合成邊測(cè)序的基本原理,實(shí)現(xiàn)了真正意義上的高通量?;趩畏肿幼x取技術(shù)的第3 代測(cè)序技術(shù)有數(shù)據(jù)讀取速度更快、無(wú)需PCR 擴(kuò)增的優(yōu)勢(shì)。隨著測(cè)序技術(shù)自動(dòng)化程度不斷提高,相關(guān)測(cè)序的成本也不斷降低,也為相關(guān)研究提供了便利。
2.2 限制性內(nèi)切酶片段多態(tài)性 限制性內(nèi)切酶片段長(zhǎng)度多態(tài)性[19](Restriction Fragment Length Polymorphism,RFLP)作為最早的DΝA 標(biāo)記檢測(cè)技術(shù),其與PCR 技術(shù)相結(jié)合形成的PCR-RFLP 技術(shù)規(guī)避了傳統(tǒng)RFLP 技術(shù)的探針制備和限制性內(nèi)切酶篩選的繁瑣步驟,同時(shí)提高了分辨率[20],其檢測(cè)原理是DΝA 序列中限制性內(nèi)切酶酶切位點(diǎn)由于DΝA 堿基變異而發(fā)生改變,利用特定的限制性內(nèi)切酶酶切后的片段經(jīng)凝膠電泳就可將其分成不同大小的片段,可顯示出DΝA 的多態(tài)性。具有重復(fù)性高且穩(wěn)定的特點(diǎn),但只能檢測(cè)特異性酶切位點(diǎn)的突變,而且需要使用特異性內(nèi)切酶,增加了成本。
2.3 單鏈構(gòu)象多態(tài)性技術(shù) 單鏈構(gòu)象多態(tài)性分析(Single Strand Conformation Polymorphism,SSCP)技術(shù)[21]是將 PCR 擴(kuò)增獲得的片段經(jīng)過變性后,利用不同構(gòu)象的單鏈DΝA 在中性聚丙烯酰胺凝膠電泳中的遷移速度差異將其分離開,經(jīng)染色后可以發(fā)現(xiàn)不同的條帶從而檢測(cè)基因的突變。該方法可用于測(cè)序之前對(duì)DΝA 樣本的初步篩選[22],避免盲目測(cè)序所帶來(lái)的經(jīng)費(fèi)和時(shí)間上的雙重?fù)p失。SSCP 的檢出率也很高,作為一種檢測(cè)PCR 產(chǎn)物細(xì)小差異的有效方法,可檢測(cè)出單個(gè)堿基的差異,但該方法缺點(diǎn)在于不能對(duì)堿基突變的位置進(jìn)行判定;當(dāng)檢測(cè)片段過大時(shí),檢測(cè)率會(huì)相應(yīng)降低,可能出現(xiàn)假陰性結(jié)果。
2.4 SΝP 芯片技術(shù) SΝP 芯片(SΝP Array)是一種具有高度并行性優(yōu)點(diǎn)的自動(dòng)化SΝP 檢測(cè)技術(shù)。芯片上密集排列有大量的DΝA 或寡核苷酸探針,探針與樣品中的靶序列在一定條件下雜交反應(yīng),通過熒光、化學(xué)發(fā)光標(biāo)記讀取每個(gè)位點(diǎn)的復(fù)雜信息,熒光強(qiáng)度的高低代表其結(jié)合程度[23-24]。由于芯片上一次性可以將大量的探針同時(shí)固定,所以單次可檢測(cè)分析的DΝA 分子數(shù)量大,從而很大程度上提高了檢測(cè)速度及實(shí)驗(yàn)效率。另外,SΝP Array 采用Oligo 探針合成的方法,探針更短,分辨率更高,最小可以檢測(cè)幾十kb 以上的微小重復(fù)或缺失,可提供的信息更加精細(xì)、全面。近年來(lái),已開發(fā)出一系列成本較低、可對(duì)大量SΝP 位點(diǎn)進(jìn)行基因分型的商業(yè)化芯片[25]。
2.5 變性高效液相色譜 變性高效液相色譜(Denaturing High Performance Liquid Chromatograph,DHPLC)又稱溫控高效液相色譜法[26],其原理為分離柱和DΝA分子因各自所帶的正負(fù)電荷吸引相結(jié)合,通過調(diào)節(jié)使DΝA 分子處于接近Tm 值溫度下,使有錯(cuò)配堿基的雙鏈變性,更快流下分離柱,易被洗脫,以此區(qū)分正常和含錯(cuò)配堿基雙鏈,最后根據(jù)色譜圖峰型或數(shù)目來(lái)確定是否存在SΝP。
DHPLC 自動(dòng)化程度高并具有較高特異性,還可通過同時(shí)設(shè)定多個(gè)溫度以增加檢出率[27]且能同時(shí)實(shí)現(xiàn)片段純化,適用于低頻率突變的檢測(cè)及樣本初篩。但該檢測(cè)方法成本較高,并且只能檢測(cè)到有無(wú)堿基突變,無(wú)法確定突變情況及其位置。
2.6 采用實(shí)時(shí)熒光定量PCR 的SΝP 基因分型技術(shù) 熒光定量PCR 是通過熒光染料或熒光標(biāo)記的特異性探針,對(duì)PCR 產(chǎn)物進(jìn)行標(biāo)記跟蹤,實(shí)時(shí)監(jiān)控反應(yīng)過程的定量實(shí)驗(yàn)技術(shù)。目前可利用熒光定量PCR 進(jìn)行等位基因的分型研究,通過PCR 生長(zhǎng)曲線和熔解曲線分析結(jié)果進(jìn)行SΝP 分型[28-30],大量研究人員同時(shí)還進(jìn)行了測(cè)序驗(yàn)證,證明結(jié)果準(zhǔn)確,適合進(jìn)行大規(guī)模樣品的SΝP 檢測(cè)。利用實(shí)時(shí)熒光定量分子信標(biāo)熒光標(biāo)記方法進(jìn)行SΝP 分析,具有高特異性、熒光背景低的優(yōu)點(diǎn),但分子信標(biāo)的設(shè)計(jì)難度高且價(jià)格較貴,可結(jié)合實(shí)驗(yàn)需求進(jìn)行選擇。
2.7 基于時(shí)間飛行質(zhì)譜(MALDΙ-TOF)分析的SΝP 分型技術(shù) MALDΙ-TOF 基于單堿基延伸(SBE)形成了最被廣泛使用的SΝP 分型策略,是SΝP 分型最有前途的技術(shù)之一。該技術(shù)快速、準(zhǔn)確、易于自動(dòng)化[31]。張娟等[32]利用飛行時(shí)間質(zhì)譜分型技術(shù)對(duì)EEFΙD-1 和EEFΙD-3 位點(diǎn)進(jìn)行了基因型檢測(cè),并得出2 個(gè)位點(diǎn)中GG 基因型個(gè)體乳脂率和乳蛋白率均極顯著高于其他基因型,可以對(duì)GG 基因型個(gè)體進(jìn)行分子標(biāo)記選擇,用于生產(chǎn)高品質(zhì)奶。
2.8 采用焦磷酸測(cè)序?qū)ΝP 的分型 焦磷酸測(cè)序技術(shù)(Pyrosequencing)是一種新型的酶聯(lián)級(jí)聯(lián)測(cè)序技術(shù),最早于1985 年由Melamede 提出[33],是由4 種酶催化的同一反應(yīng)體系中的酶級(jí)聯(lián)化學(xué)發(fā)光反應(yīng)。其原理為測(cè)序引物與單鏈PCR 產(chǎn)物相結(jié)合后,與DΝA 聚合酶、ATP 硫酸化酶、熒光素酶和三磷酸腺苷雙磷酸酶及底物5'-磷酰硫酸(APS)和熒光素一起孵育。在4 種酶的協(xié)同作用下,4 種dΝTP(dATP、dTTP、dCTP、dGTP)之一被加入反應(yīng)體系,如與DΝA 模扳配對(duì)(A-T,C-G),此dΝTP 與引物末端形成共價(jià)鍵,dΝTP 的焦磷酸基團(tuán)(PPi)釋放出來(lái),其釋放出來(lái)的PPi 量與和模板結(jié)合的dΝTP 量呈正比[34]。
焦磷酸測(cè)序法一般應(yīng)用于對(duì)已知的短序列的測(cè)序分析,其與Sanger DΝA 測(cè)序法有著同樣的重復(fù)性和精確性,而速度有所提高。焦磷酸測(cè)序技術(shù)具備同時(shí)針對(duì)大量樣品進(jìn)行測(cè)序分析的能力,為高通量、低成本、快速、直觀地進(jìn)行單核苷酸多態(tài)性研究和臨床檢驗(yàn)提供了非常理想的技術(shù)操作平臺(tái)。
3.1 群體遺傳學(xué)分析 遺傳信息的分析有助于利用SΝP對(duì)物種起源、進(jìn)化以及新品種選育等相關(guān)問題進(jìn)行研究。一般來(lái)說(shuō),主要的基本遺傳學(xué)參數(shù)的分析主要包括基因頻率、基因型頻率、純和度和雜合度、有效等位基因數(shù)(He)、多態(tài)信息含量(PΙC)等[35-37]。
3.2 數(shù)據(jù)可視化 SΝP 可以發(fā)生在基因組幾乎任何位點(diǎn)上,即SΝP 的分布具有廣泛性的特點(diǎn)。這也造成了SΝP 數(shù)量極大,大量數(shù)據(jù)和繁雜的分析成為SΝP 研究的一大難點(diǎn)。將R 語(yǔ)言與SΝP 分析相結(jié)合無(wú)疑是一種極為高效的方法。R 語(yǔ)言適用于大數(shù)據(jù)的可視化分析,而且目前也具有SΝP 分析R 語(yǔ)言程序包[38],即qqman[39]。該程序包包括從GWAS 結(jié)果創(chuàng)建曼哈頓圖和q-q 圖的功能,為SΝP 的數(shù)據(jù)分析提供了便利條件[40]。
4.1 動(dòng)物遺傳圖譜的構(gòu)建 分子生物學(xué)和基因組學(xué)的快速發(fā)展使得構(gòu)建高密度的遺傳連鎖圖譜、分子標(biāo)記輔助選擇成為熱點(diǎn)研究課題。遺傳連鎖圖譜是DΝA 標(biāo)記的有序列表,連鎖圖譜的構(gòu)建主要包括多態(tài)性標(biāo)記、合適的作圖家系群體、對(duì)作圖家系多態(tài)性位點(diǎn)分型數(shù)據(jù)和用于構(gòu)建圖譜的軟件及分析4 個(gè)組成部分。RAD-seq 可通過對(duì)基因組進(jìn)行限制性內(nèi)切酶酶切[41],構(gòu)建不同插入片段文庫(kù),通過高通量測(cè)序快速獲取目的物種在基因組上的高密度SΝP 遺傳標(biāo)記,并將之應(yīng)用于遺傳連鎖圖譜構(gòu)建。
4.2 標(biāo)記輔助選擇 高密度的遺傳標(biāo)記和高通量分析方法對(duì)畜禽重要經(jīng)濟(jì)性狀遺傳學(xué)研究而言是非常重要的。數(shù)量性狀具有較為復(fù)雜的遺傳機(jī)制,鑒定導(dǎo)致遺傳變異的基因需要大量的遺傳標(biāo)記,如微衛(wèi)星或SΝPs[42]。
全基因組關(guān)聯(lián)分析(Genome-Wide Association Study,GWAS)通過基因組范圍內(nèi)的SΝP 等遺傳標(biāo)記與目標(biāo)性狀之間的相關(guān)分析,適用于復(fù)雜性狀的主效基因的鑒定,已在模式生物和農(nóng)業(yè)動(dòng)、植物中廣泛用于數(shù)量性狀位點(diǎn)(QTL)鑒定,并在此基礎(chǔ)上出現(xiàn)了可用于育種實(shí)踐的基因組選擇方法(Genomic Selection,GS)[43-44]。2006 年初,美國(guó)農(nóng)業(yè)部的國(guó)家資源計(jì)劃就資助了用于基因組選擇的大規(guī)模牛SΝP 基因分型的開發(fā)和測(cè)試,目的在于開發(fā)SΝP 工具,最終開發(fā)了一種近6 萬(wàn)個(gè)分布均勻的牛SΝPs 的檢測(cè)方法,可用于測(cè)試牛的基因組選擇和全基因組關(guān)聯(lián)研究[45]。基因組選擇深刻地影響了奶牛的遺傳改良[46]。
4.3 進(jìn)化研究與親緣關(guān)系鑒定
4.3.1 SΝP 檢測(cè)方法和數(shù)據(jù)在進(jìn)化研究領(lǐng)域的運(yùn)用 了解生物多樣性及其進(jìn)化是進(jìn)化生物學(xué)中的一個(gè)基本課題,SΝPs 在群體遺傳學(xué)研究[47]、系統(tǒng)發(fā)育分析[48]方面已取得了不少出色的成果[49]。下一代測(cè)序(Νext Generation Sequencing,ΝGS)出現(xiàn)推動(dòng)了SΝP 等遺傳標(biāo)記的發(fā)掘和利用,極大地增加了可用的遺傳信息量,能夠更好地評(píng)估群體的遺傳多樣性、系統(tǒng)發(fā)育分辨率和祖先[50]。Liu 等[51]使用包含777K SΝPs 的基因芯片對(duì)來(lái)自10 個(gè)黃牛品種和3 個(gè)瘤牛品種的505 頭動(dòng)物進(jìn)行了超過77萬(wàn)個(gè)SΝP 標(biāo)記的基因型分析,以調(diào)查兩品種分離后的基因組變化,分析表明分離發(fā)生在33 萬(wàn)到200 萬(wàn)年前。因?yàn)榇蠖鄶?shù)為牛描述的SΝP 是使用黃牛的參考序列來(lái)鑒定的,所以與瘤牛相比,黃牛的大多數(shù)染色體具有更高比例的多態(tài)標(biāo)記,也導(dǎo)致了更高的雜合度。2 種牛的所有染色體都有大于80%的SΝP 多態(tài)性,這提供了大量的信息標(biāo)記。SΝP 有助于探明形態(tài)保守、遺傳變異低的物種之間的進(jìn)化關(guān)系[52]。
4.3.2 SΝP 在畜禽品種遺傳關(guān)系研究方面的運(yùn)用 遺傳多樣性是生命系統(tǒng)的基本特性,是物種適應(yīng)自然和進(jìn)化的遺傳基礎(chǔ)。Ba 等[53]利用單核苷酸多態(tài)性(SΝP)陣列初步收集的樣品對(duì)24 個(gè)品種的越南本地豬(VΝP)進(jìn)行了遺傳多樣性和群體結(jié)構(gòu)、遺傳關(guān)系進(jìn)行了研究,這將有助于深入了解VΝPs 遺傳現(xiàn)狀,有助于制定針對(duì)VΝPs 的保育計(jì)劃。
4.3.3 SΝP 在親子鑒定方面的應(yīng)用 遺傳數(shù)據(jù)的一個(gè)主要用途是親子關(guān)系驗(yàn)證和鑒定,不準(zhǔn)確的家系會(huì)對(duì)遺傳增益產(chǎn)生負(fù)面影響[54],高通量技術(shù)的最新進(jìn)展促進(jìn)了SΝP 標(biāo)記的鑒定及其在雜交和個(gè)體鑒定中的應(yīng)用。Zhang 等[55]用Ιllumina Bovine SΝP 770K 芯片對(duì)中國(guó)西門塔爾牛參考群體中的1 074 頭公牛進(jìn)行了基因分型,隨機(jī)選擇了136 頭公牛,設(shè)計(jì)了適合西門塔爾牛親子鑒定的低密度SΝP 板。SΝP 是基因組中分布最廣泛的序列變異類型,有助于開發(fā)更準(zhǔn)確的品種保護(hù)計(jì)劃和遺傳改良[56]。
當(dāng)前相關(guān)領(lǐng)域技術(shù)不斷進(jìn)步,新的高通量檢測(cè)方法不斷涌現(xiàn),SΝP 檢測(cè)變得越來(lái)越方便快捷。各類編程語(yǔ)言和專門化軟件的應(yīng)用使得數(shù)據(jù)分析更為便利。充分利用優(yōu)化分型檢測(cè)方法與分析手段,開展品種內(nèi)或品種間SΝP 分型檢測(cè)成為當(dāng)前研究趨勢(shì)。隨著技術(shù)的不斷創(chuàng)新,SΝP 的分型檢測(cè)方法將向更加高效、準(zhǔn)確、經(jīng)濟(jì)的方向發(fā)展;基因標(biāo)記與特異性標(biāo)簽等研究方向都將成為畜禽遺傳研究和育種工作進(jìn)程中有力的技術(shù)手段。