孫亞莉,張 晉,張 潔,張海明
(山西農(nóng)業(yè)大學(xué) 信息學(xué)院,山西 太谷 030800)
棉花(GossypiumL)作為最重要的纖維和油料作物,在我國乃至全世界經(jīng)濟中都占有舉足輕重的地位,棉花的大規(guī)模生產(chǎn)和與其有關(guān)的理論、應(yīng)用研究一直是各產(chǎn)棉國關(guān)注的熱點。為適應(yīng)棉花的大田生產(chǎn),優(yōu)良品種是不可或缺的基礎(chǔ)資源,棉花新品種選育的中心環(huán)節(jié)是對產(chǎn)量、品質(zhì)等相關(guān)目標(biāo)性狀的篩選。傳統(tǒng)的選擇育種或雜種優(yōu)勢育種方法易受材料以及環(huán)境的影響,會導(dǎo)致育種周期長、工作量大、育種家的主觀因素使選擇效率降低等問題。隨著分子遺傳學(xué)尤其是分子標(biāo)記技術(shù)的發(fā)展,為解決這一問題提供了新途徑,也使作物遺傳育種進入了分子育種新階段[1]。
分子標(biāo)記是20世紀(jì)80年代初快速發(fā)展起來的一種新型遺傳標(biāo)記,它主要以核酸、蛋白質(zhì)等控制遺傳及性狀的生物大分子突變?yōu)榛A(chǔ),以檢測生物體遺傳結(jié)構(gòu)及變異為目的,從DNA、蛋白質(zhì)甚至堿基水平上直接準(zhǔn)確反應(yīng)遺傳標(biāo)記位點,從而揭示生物的遺傳變異。DNA分子標(biāo)記檢測的對象大到不同發(fā)育時期的個體、小到器官、細(xì)胞甚至染色體,可供開發(fā)的標(biāo)記數(shù)量極多,分布于整個基因組,具有多態(tài)性高,遺傳穩(wěn)定性好的特點,受環(huán)境的影響小,亦不受基因表達與否的限制。因而,伴隨生物技術(shù)尤其是測序技術(shù)的快速發(fā)展,不同類型的分子標(biāo)記在諸多相關(guān)領(lǐng)域均得到廣泛應(yīng)用[2]。
其中,SSR是在各物種中應(yīng)用較多的一種分子標(biāo)記,SSR即簡單序列重復(fù),又稱微衛(wèi)星DNA,指的是幾個(一般1~6)核苷酸為重復(fù)單位串聯(lián)組成的簡短序列,在外顯子、內(nèi)含子及染色體上的任一區(qū)域均存在[3]。研究發(fā)現(xiàn),組成上,真核生物染色體中每隔大約10~50 Kb的距離就存在1個微衛(wèi)星[4],以2個核苷酸的重復(fù)單位居多,也有一些重復(fù)單位為3個核苷酸,4個核苷酸或更多的微衛(wèi)星極少。結(jié)構(gòu)上,人和動物基因組中的重復(fù)單位主要為(TG)[5],植物中(AT)重復(fù)較為普遍。生物進化程度越高,其DNA序列中微衛(wèi)星重復(fù)單位所占的比重就越大[6]。
SSR分子標(biāo)記的應(yīng)用始于動物基因組[7],目前,在多種農(nóng)作物中也均有不同程度的開展,雖然隨著高通量測序技術(shù)的發(fā)展,SSR標(biāo)記逐漸被SNP標(biāo)記所取代,但其依然在遺傳育種中發(fā)揮了巨大的作用,鑒此,文章就SSR分子標(biāo)記技術(shù)的基本內(nèi)容、引物開發(fā)以及在棉花遺傳育種中的應(yīng)用進行綜述,以期為棉花分子育種提供理論參考依據(jù)。
SSR標(biāo)記的發(fā)展起源于VNTR(數(shù)目可變串聯(lián)重復(fù)序列),對VNTR的保守側(cè)翼序列開發(fā)引物,再用PCR方法實現(xiàn)整個VNTR位點的特異性擴增,并于1989年將該法應(yīng)用于另一種重復(fù)DNA序列,即形成SSR標(biāo)記。
SSR是簡單序列重復(fù)的英文表達首字母縮寫,亦指簡單串聯(lián)重復(fù)序列,簡單體現(xiàn)在此序列長度一般較短,由1~6個單核苷酸組成,重復(fù)次數(shù)一般10~50次。重復(fù)單位也稱SSR座位,根據(jù)其兩側(cè)的單拷貝序列相對保守的特性,可設(shè)計一對特異性SSR引物。以基因組DNA為模板用特異的引物進行PCR擴增,若該擴增區(qū)域DNA片段存在變異,則擴增產(chǎn)物因重復(fù)率不同而不同,通過聚丙烯凝膠電泳技術(shù)可以比較擴增條帶的大小,從而對表型存在個體差異進而表現(xiàn)在某個SSR座位上得到的多態(tài)性進行檢測,此多態(tài)性主要依賴于基本單元的重復(fù)次數(shù),若在擴增區(qū)域有DNA插入片段、堿基的缺失或突變,也會產(chǎn)生多態(tài)性[8]。
SSR標(biāo)記具有如下優(yōu)點: ①SSR引物序列在植物基因組中具有均勻、隨機、廣泛的特點,可提供全面的基因組遺傳信息;②SSR引物的變異主要體現(xiàn)為重復(fù)次數(shù)不同,而且是共顯性,因而可通過電泳條帶區(qū)別基因的雜合型和顯性純合型;③重復(fù)性好,若引物特異性好,SSR標(biāo)記使用簡單,結(jié)果穩(wěn)定;④多數(shù)SSR序列無基因功能作用,增加或減少幾個小片段保守重復(fù)序列的頻率高,在品種間位點變異廣泛,多態(tài)性高;⑤保守性,SSR引物兩端側(cè)翼序列保守性強,利用該特性可以將一個物種的微衛(wèi)星研究結(jié)果應(yīng)用于另一物種,從而實現(xiàn)對新物種或者無相關(guān)信息的物種,更快更準(zhǔn)地找到其更多的SSR位點;(6)SSR引物應(yīng)用階段實驗操作簡單,只需要將SSR引物進行PCR擴增,然后凝膠電泳(瓊脂糖凝膠電泳或者聚丙烯酰胺凝膠電泳)顯色(EB染色或銀染)即可。根據(jù)SSR標(biāo)記側(cè)翼序列來源的不同,SSR標(biāo)記主要分為基因組SSR (Genomic SSR, G-SSR)和表達序列標(biāo)簽SSR ( Expressed sequence tag SSR, EST - SSR)兩種。EST-SSR標(biāo)記來自轉(zhuǎn)錄組數(shù)據(jù),可以用于功能基因組的研究,也可以鑒定控制重要性狀的等位基因,同G-SSR標(biāo)記相比更有應(yīng)用價值。EST-SSR標(biāo)記在棉花中已被鑒定[9,10]。
SSR標(biāo)記需要根據(jù)所研究物種中重復(fù)序列兩側(cè)的序列信息設(shè)計引物,然后才能被用于PCR,所以,SSR標(biāo)記引物的開發(fā)是其應(yīng)用的首要目標(biāo)。新SSR標(biāo)記的創(chuàng)建需要清楚重復(fù)序列兩翼的序列信息,在測序費用較高的情況下,引物開發(fā)有一定的難度,但一旦開發(fā)成功,便可以商品化,并通過PCR擴增獲得DNA多態(tài)性。
SSR標(biāo)記引物開發(fā)的傳統(tǒng)方法較耗時費力,具體做法是:構(gòu)建DNA文庫,篩選鑒定微衛(wèi)星克隆,通過測序或者借助DNA序列數(shù)據(jù)庫信息獲得這些DNA克隆的側(cè)翼序列,利用SSR側(cè)翼序列在同一物種有高度保守的特性,設(shè)計一對特異性引物來擴增基因組序列,根據(jù)插入片段分為大插入片段基因組文庫[11]和小插入片段基因組文庫[12]兩種方法。
此外,人們也在不斷挖掘能夠簡化技術(shù)環(huán)節(jié)、提高效率、降低成本的方法,比如微衛(wèi)星富集法、利用比較遺傳學(xué)和SSR標(biāo)記的可轉(zhuǎn)移性[13]從相近物種獲得引物等。
近來,各個物種相應(yīng)序列數(shù)據(jù)庫迅猛發(fā)展,生物信息軟件也不斷涌現(xiàn),這為從數(shù)以千計的DNA序列中發(fā)掘新的微衛(wèi)星標(biāo)記提供了便利,基于序列資源的SSRs標(biāo)記開發(fā)也因此更加方便快捷。比如簡單序列重復(fù)鑒定工具(SSRIT,http://www.gramene.org/gremene/searehes/ssrtool)可以用于挖掘SSRs。王長彪等[14]開發(fā)的軟件工具——AutoSSR,可用FASTA格式的序列快速發(fā)掘和鑒定大量微衛(wèi)星SSRs,同時可對SSRs類型進行區(qū)分,并指明可以借助方便而且有效的軟件工具來開發(fā)引物,最有效的開發(fā)微衛(wèi)星引物序列的程序是SPU TNIK ( http :/ / abajian. net/sp ut nik/ ) SSRIT[15]和TROLL[16]。
SSR標(biāo)記的兩種類型中,EST-SSR標(biāo)記的開發(fā),可以不經(jīng)過構(gòu)建基因組文庫、識別篩選重復(fù)序列克隆以及測序等程序,比基因組SSR標(biāo)記更快速高效、降低成本。
QTL作圖是指通過性狀調(diào)查獲得數(shù)量性狀表型數(shù)據(jù),并結(jié)合分子標(biāo)記所做的的基因分型,通過作圖軟件,對基因組染色體中DNA標(biāo)記所代表的基因型數(shù)據(jù)與數(shù)量性狀獲得的表型值進行相關(guān)性分析,從而將控制數(shù)量性狀的QTL位點逐一定位到遺傳連鎖圖譜或者染色體上的相應(yīng)位置,同時可以評估該QTL位點所代表的性狀的遺傳效應(yīng)[17]。棉花基因組中同樣具有大量的、隨機均勻分布的微衛(wèi)星序列位點,QTL作圖方法同樣適用,一般都是先構(gòu)建作圖群體,調(diào)查獲得表型數(shù)據(jù),結(jié)合分子標(biāo)記,利用性狀和標(biāo)記存在的連鎖關(guān)系,即QTL位點和SSR標(biāo)記位點之間的關(guān)聯(lián),可將一些控制重要產(chǎn)量、品質(zhì)等數(shù)量性狀的功能基因或QTLs進行定位。
關(guān)于棉花重要數(shù)量性狀QTL定位的研究,一直都有學(xué)者報道: 杜威世等[18]以海島棉品種“Ⅱ15-3493” 和陸地棉品種“石河子875” 作為雜交親本,前者為高抗黃萎病材料,后者高感黃萎病材料,海陸雜交后獲得175個F2代單株,將其作為作圖群體,結(jié)合BSA法篩選獲得的多態(tài)性SSR引物,構(gòu)建了由SSR標(biāo)記組成的遺傳連鎖群,并在該連鎖群上定位到了一個與SSR標(biāo)記之一相距13.1 cm的黃萎病抗性QTL主效基因位點。Yuksel Bolek等[19]通過對高抗黃萎病的海島棉Pima S-7和易感的陸地棉Acala44雜交后的F2群體進行SSR分析,構(gòu)建了包含35個標(biāo)記的11個連鎖群的遺傳圖譜,其中有15個標(biāo)記與重要性狀有連鎖關(guān)聯(lián),并檢測到11號染色體上3個與黃萎病的抗性有很大效應(yīng)的基因座。Shen[20]等通過對來自于陸地棉7235和TM-1雜交組合的RIL群體進行SSR分析,通過標(biāo)記構(gòu)建了全長1 024.4 cm的遺傳連鎖圖譜,以LOD≥ 3.0為標(biāo)準(zhǔn),篩選出與重要性狀有關(guān)的一系列QTLs,其中與纖維品質(zhì)和產(chǎn)量有關(guān)有25個。
遺傳圖譜也稱連鎖圖譜、染色體圖譜,是依據(jù)標(biāo)記與基因的連鎖關(guān)系,計算基因與標(biāo)記之間的重組率,借助分子標(biāo)記將基因線性排列在某一物種染色體的相對位置上,與基因在每條染色體上特殊的物理位置有一定的區(qū)別[17]。
建立遺傳圖譜,需要選擇合適的親本進行雜交,構(gòu)建后代分離群體,這決定了遺傳圖譜建立的難易程度、準(zhǔn)確性以及適用范圍[21]。遺傳圖譜的構(gòu)建不僅是遺傳研究的重要內(nèi)容,它提供了基因在染色體上的坐標(biāo),為目標(biāo)基因定位、基因克隆、重疊群的定位提供了較為精確的位置,而且為鑒定作物種質(zhì)資源、確定分子育種方法等提供了理論依據(jù)[22]。
Ma等[23]以兩個二倍體亞州棉材料為親本進行雜交,用獲得的189個F2植株結(jié)合6029對SSR引物成功構(gòu)建了第一個亞洲棉A基因組的種內(nèi)遺傳圖譜,該圖譜全長2 508.71 cm,覆蓋了13個連鎖群,并指出A基因組與At、Dt亞基因組的染色體是共線的。楊鑫雷等[24]以兩個遺傳背景差異很大的陸地棉與海島棉材料進行種間雜交,以F2群體為作圖群體,用ll0個SSR標(biāo)記和65個AFLP標(biāo)記構(gòu)建了由175個標(biāo)記構(gòu)成的遺傳連鎖圖譜,該圖譜全長2 030 cm,覆蓋了棉花全基因組的40.6%,包括42個連鎖群,連鎖群長度介于4.5~147.3 cm之間,單個連鎖群包含2~22個分子標(biāo)記,標(biāo)記平均間距為11.6 cm。秦鴻德[25]用4個陸地棉栽培品種種內(nèi)雜交,形成的四交后代作為作圖群體,結(jié)合SSR分子標(biāo)記構(gòu)建了陸地棉種內(nèi)遺傳圖譜,該圖譜全長2 113.3 cm,包含56個連鎖群,共含有286個SSR標(biāo)記多態(tài)性位點, 覆蓋了棉花全基因組的42.3%;單個連鎖群含標(biāo)記2~24個,平均5.2個;連鎖群長度介于0.37~125 cm之間,平均38.4 cm;標(biāo)記平均間距為7.4 cm。此圖譜是所報道的棉花遺傳圖譜中,第1張覆蓋率高達40%的陸地棉種內(nèi)、不同栽培品種間的分子標(biāo)記遺傳圖譜。
傳統(tǒng)的育種方法如引種、選擇育種、雜交育種、雜種優(yōu)勢育種、倍性育種等方法,都是從表型性狀著手,通過優(yōu)異性狀的篩選與累積達到對優(yōu)異基因聚合的目的,具有一定的盲目性,育種效率較低。近來,隨著各類分子標(biāo)記的開發(fā)、遺傳圖譜的構(gòu)建以及大量QTLs作圖軟件的應(yīng)用,為各種作物的育種方法打開了新的思路,以分子標(biāo)記輔助選擇(Master Assisted Selection , MAS)為最主要的育種輔助選擇手段[26]。
MAS將現(xiàn)代分子生物學(xué)手段應(yīng)用于傳統(tǒng)的遺傳育種中,應(yīng)用分子標(biāo)記與目標(biāo)基因的緊密連鎖或共分離關(guān)系,同時借助表型數(shù)據(jù)直接從DNA水平對育種材料中具有優(yōu)異基因型的個體進行篩選,避免了僅僅依賴于表型性狀來間接推斷基因型的情況。另外,MAS方法可以直接用F2群體進行標(biāo)記與基因的關(guān)聯(lián),縮短了育種年限,大大加速了改良進程,并可以極大的提高育種效率。另外,在傳統(tǒng)育種過程中,育種工作者主要根據(jù)自身多年育種經(jīng)驗對性狀加以選擇,受主觀因素影響較大,而且最終導(dǎo)致棉花品種遺傳基礎(chǔ)變窄,若在此決選過程中輔以分子標(biāo)記手段,可以減輕這一不良影響。
MAS方法對多基因控制的數(shù)量性狀如許多產(chǎn)量、品質(zhì)性狀的準(zhǔn)確選擇也同樣適用,可有效地減少或避免連鎖累贅[27]。對棉花而言,其主要的農(nóng)藝性狀大多為數(shù)量性狀,易受環(huán)境影響,材料個體間差異大,傳統(tǒng)育種方式僅僅借助表型選擇,不同育種工作者受到的干擾也大,選擇效果不理想。金駿培等[28]經(jīng)過研究發(fā)現(xiàn),將分子標(biāo)記應(yīng)用于群體的混合選擇,僅一次便可提高表型選擇甚至是兩輪選擇的效果。因此,MAS在棉花這一作物的育種領(lǐng)域也將大有前途。
選擇合適的分子標(biāo)記對于MAS的應(yīng)用非常關(guān)鍵,如理想的分子標(biāo)記要建立在PCR基礎(chǔ)上,要有很高的重復(fù)性,在不同的材料中有廣泛的應(yīng)用性,跟目標(biāo)基因關(guān)聯(lián)性強, 這些要求SSR標(biāo)記都符合,是很好的標(biāo)記。SSR標(biāo)記的MAS在棉花上也取得了很大進展,Abdurakhmonov等[29]通過SSR標(biāo)記對大量來自烏茲別克斯坦的野生棉花種質(zhì)資源進行了分析,以期挖掘與棉花纖維品質(zhì)性狀有關(guān)的新的遺傳變異,并初步揭示了連鎖不平衡在標(biāo)記輔助選擇育種中應(yīng)用的重要性。王芙蓉等[30]用綜合性狀優(yōu)良、抗黃萎病的魯棉研22號和漸滲了海島棉優(yōu)異纖維基因的魯原343作為親本,獲得雜交后代F2:3家系,對這些材料在不同發(fā)病時期進行黃萎病鑒定,發(fā)現(xiàn)與黃萎病抗性緊密連鎖的兩個SSR標(biāo)記NAU751和BNL1395,含這兩個標(biāo)記的基因型均可以顯著增加黃萎病抗性,有加性效應(yīng),兩個標(biāo)記的基因型聚合后,能極顯著提高后代抗性水平。
狹義的遺傳多樣性是指不同種群之間或種內(nèi)不同個體之間的遺傳差異程度或基因的變化。對遺傳多樣性的研究可以揭示物種或種群的進化歷史,了解物種起源的時間、地點、方式,了解物種的群體結(jié)構(gòu)和多樣性水平,為進一步分析品種類型、親本選配、多樣性保護等提供依據(jù),是種質(zhì)資源發(fā)掘、開發(fā)和利用的前提,也可為植物育種和遺傳改良奠定基礎(chǔ)。
中國培育和種植的大多數(shù)棉花栽培種有遺傳背景狹窄,多樣性差的問題,原因是這些品種是從岱字棉、福字棉、斯字棉等少數(shù)基礎(chǔ)種質(zhì)衍變而來,而這些基礎(chǔ)種質(zhì)又都幾乎來自美國[31],這為棉花的遺傳多樣性鑒定增加了一定的難度,而分子標(biāo)記技術(shù)可以直接從DNA分子水平上揭示個體之間的微小差異以及物種間的區(qū)別與聯(lián)系,對研究背景相對狹窄的棉花種質(zhì)資源的遺傳多樣性、創(chuàng)新與鑒定非常重要。
目前,我國國家種質(zhì)資源長期庫中已搜集保存棉花種質(zhì)資源約8 000多份[32],成為繼玉米、水稻、小麥、大豆之后的第5類保護數(shù)量最多的農(nóng)作物,對收集到的數(shù)量較多的棉花種質(zhì)資源的整理、保護、篩選、鑒定及合理利用如新品種的選育、生產(chǎn)和貿(mào)易中變得尤為重要[33]。
陳光等[34]用篩選出的24對多態(tài)性好的SSR引物對53份海島棉材料進行遺傳多樣性分析,檢測出多態(tài)性基因位點共97個,占總位點數(shù)的91.5%,并用標(biāo)記對53份材料進行聚類分析,發(fā)現(xiàn)材料可被分為與系譜來源一致的兩大類,證明SSR標(biāo)記在品種鑒定和遺傳多樣性研究中有重要的應(yīng)用價值。Zhang 等用SSR標(biāo)記對投放超過75年的Acala1517栽培品種(系) 進行了遺傳多樣性分析,包括的性狀有產(chǎn)量、鈴形、衣分、纖維長度、纖維強度和纖維細(xì)度,結(jié)果表明SSR分子標(biāo)記在品種不同性狀的遺傳多樣性研究中也有重要作用。Stella等將SSR引物應(yīng)用到亞洲棉核心種質(zhì)材料的遺傳多樣性研究中,共篩選了1500多對SSR引物,其中25個SSR標(biāo)記可用于分析亞洲棉地域多樣性。
種子的生產(chǎn)和貿(mào)易是以合格的種子質(zhì)量為前提的,種子的純度和真實性檢測非常必要。SSR標(biāo)記與其它技術(shù)相比有很大的優(yōu)越性,在棉花種子純度檢測上有很大的應(yīng)用價值。秦利等對50對SSR引物進行篩選,最后獲得10對多態(tài)性好的引物用于新疆近50 a來的50個陸地棉種質(zhì)資源的基因組DNA進行擴增,進一步從中篩選3對多態(tài)性好的引物對新疆主栽品種構(gòu)建了指紋圖譜,并進行了雜交種純度鑒定的實踐驗證。劉勤紅等用異源四倍體棉花材料篩選出了217對SSR引物,獲得了十幾個標(biāo)記位點可用以區(qū)分“魯棉研15號”父母本及其F1群體材料,可準(zhǔn)確、穩(wěn)定和快捷的鑒定 “魯棉研15號”雜交種的純度,非常實用。
自SSR標(biāo)記技術(shù)創(chuàng)立以來,由于其相對于其他分子標(biāo)記而言具有很大的優(yōu)越性,所以,逐漸成為實現(xiàn)現(xiàn)代植物尤其是作物學(xué)研究的一個重要技術(shù)手段,在棉花方面,不論從品種、種質(zhì)資源鑒定,遺傳圖譜的構(gòu)建,還是功能基因及重要農(nóng)藝性狀的QTLs定位,甚至新品種培育等方面都取得了很大進展。SSR分子標(biāo)記在物種間有不同程度的通用性被相繼證實,為棉花SSR標(biāo)記的開發(fā)提供了新的方向。如,鄭麗珊等用111對棉花SSR引物在24個香蕉材料上擴增,也有很高的多態(tài)性,獲得797個等位基因位點,并對24個香蕉材料進行了聚類分析,結(jié)果較好地反映了香蕉品種的遺傳組成。
雖然SSR標(biāo)記與之前的其他DNA分子標(biāo)記相比開發(fā)費用相對較貴,但是SSR位點兩側(cè)的序列高度保守的特性,使得SSR引物在不同物種中有不同程度的通用性,我們可以利用這個特點將一個物種的SSR引物用于另一物種,從而更快更準(zhǔn)確地開發(fā)出該物種更多的SSR引物,而且SSR引物對檢測和分析等位基因是比較簡單的,尤其是共顯性基因。因此SSR標(biāo)記更適合于材料的聚類分析,遺傳多樣性分析以及遺傳圖譜的構(gòu)建,雖然隨著測序技術(shù)的發(fā)展,SNP標(biāo)記被大量開發(fā)和應(yīng)用,逐漸替代了SSR標(biāo)記,但是SSR標(biāo)記對棉花遺傳育種的作用依然是巨大的,毋庸置疑的。
(余參考文獻略)