劉新雨,田 潔,2,*
(1.青海大學 農(nóng)林科學院/青海省蔬菜遺傳與生理重點實驗室, 青海 西寧 810016; 2.青海大學 省部共建三江源生態(tài)與高原農(nóng)牧業(yè)國家重點實驗室,青海 西寧 810016)
大蒜(AlliumsativumL.)別名蒜頭、胡蒜、葫,為百合科(Liliaceae)蔥屬(Allium)的栽培種,1~2年生草本植物[1-2]。大蒜栽培歷史悠久且種植面積廣,主要分布在山東、江蘇、河南、廣西、云南、四川等地區(qū)[3],在不同的生態(tài)環(huán)境下,所栽培的品種具有明顯的區(qū)域性,形成了豐富的種質資源。豐富的種質資源是大蒜育種的基礎,但因大蒜長期無性繁殖,受不同地區(qū)間引種和方言的影響,大蒜品種名和生產(chǎn)上用種混雜,導致大蒜品種更新慢、品種退化,使得大蒜栽培、育種工作難度增加,限制了大蒜產(chǎn)量和品質的提高[2,4]。因此,對大蒜資源進行評價與鑒定是首要工作。但是僅從形態(tài)學和解剖學等方面難以對所有的大蒜種質資源進行評價和有效鑒定[5-6]。
分子標記具有開發(fā)成本低、重復性好、信息量大等優(yōu)點,被廣泛應用于遺傳圖譜構建[7-8]、輔助育種[9-10]、物種親緣關系鑒別和遺傳多樣性分析[11-12]等方面。目前應用于大蒜的分子標記主要有簡單重復序列區(qū)間(inter simple sequence repeat, ISSR)標記、隨機擴增多態(tài)性DNA(random amplified polymorphic dna, RAPD)標記、簡單重復序列(simple sequence repeats, SSR)標記、擴增片段長度多態(tài)性(amplified fragment length polymorphism, AFLP)標記等[13]。陳昕等[5]利用RAPD和ISSR標記技術,對中國10個不同地區(qū)的大蒜品種進行了種質資源遺傳多樣性研究。周靜[14]利用SRAP和SSR標記方法對40份中國大蒜品種進行了親緣關系分析。孫亞麗等[15]利用已篩選出來的7對引物對55份大蒜資源進行UPGMA聚類分析認為,同一地域來源的種質大都被聚在一起。Ipek等[16]使用AFLP技術構建了大蒜低密度遺傳圖譜。韓曙等[17]利用RAPD標記對18個大蒜品種進行遺傳多樣性和親緣關系分析,利用6個多態(tài)性明顯的引物將18個品種分為2大類群。
SSR標記具有開發(fā)成本低、位點特異性高、通用性好等優(yōu)點[18-19],已應用于花椰菜[20]、云錦杜鵑[21]、大麥[22]、大豆[23]、三角梅[24]等多種植物。相對而言,大蒜轉錄組SSR分子標記的開發(fā)較晚,Ma等[25]開發(fā)出8個多態(tài)性SSR引物,Cunha等[26]開發(fā)了10個新的SSR引物,陳書霞等[27]利用已開發(fā)的6對SSR引物對40份大蒜資源進行聚類分析和遺傳多樣性評價。目前基于轉錄組數(shù)據(jù)開發(fā)的SSR標記相對較少,限制了大蒜分子標記的研究,不利于大蒜分子標記輔助育種和遺傳圖譜的構建。本研究在大蒜轉錄組測序的基礎上,對大蒜的SSR位點進行鑒別,并對其分布和組成特征等進行分析,以青海省農(nóng)林科學院園藝所搜集到的35份大蒜種質資源為研究材料,對設計的部分SSR引物進行有效性與多態(tài)性鑒定,為后期種質資源評價、遺傳多樣性分析、遺傳圖譜的構建,以及分子標記輔助育種奠定基礎。
大蒜轉錄組數(shù)據(jù)來源于青海省農(nóng)林科學院園藝所對樂都紫皮大蒜的高通量轉錄組深度測序。待大蒜幼苗苗高達10 cm后進行干旱脅迫處理,分別在處理0、3、6、9、12、15 d后進行取樣,設置3次生物學重復,每個重復取長勢一致的5株大蒜葉片做混樣。取得后送至北京諾禾致源科技股份有限公司進行Illumina HiSeqTM測序,獲得444 865條unigene,作為分析背景數(shù)據(jù)。
本試驗以青海省農(nóng)林科學院園藝所搜集的35份大蒜種質資源(表1)為基礎進行SSR引物篩選、多態(tài)性鑒定與遺傳多樣性研究,其中獨頭蒜8份、多瓣蒜27份。每份樣品取鱗莖100 mg左右,利用天根生化科技有限公司的DNAsecure新型植物基因組DNA提取試劑盒提取DNA,并檢測所提DNA的濃度和純度。DNA樣品保存在-80 ℃?zhèn)溆谩?/p>
表1 三十五份大蒜種質資源信息Table 1 Information of 35 garlic germplasm resources
采用軟件MISA(1.0版,默認參數(shù))對大蒜轉錄組序列的基因進行SSR檢測,對應的各個unit size的最少重復次數(shù)分別為1-10、2-6、3-5、4-5、5-5、6-5(1-10表示以單核苷酸為重復單位時,其重復數(shù)至少為10才可被檢測到;2-6表示以雙核苷酸為重復單位時,其最少重復數(shù)為6。其他依此類推)。
用Primer 3.0進行SSR引物設計,并針對預測到的每一個SSR位點分別設計3組引物。引物設計的主要參數(shù)為:引物序列長度18~27 bp,預期擴增的片段長度120~300 bp,退火溫度55~65 ℃。引物設計過程中避免出現(xiàn)引物二聚體、發(fā)卡結構與錯配等引物二級結構。
為了驗證引物的有效性和多態(tài)性,選擇2個引物之間不發(fā)生互補,特別是在引物3′端,即使無法避免,其3′端互補堿基也應不大于2個堿基的14對SSR引物,送生工生物工程(上海)股份有限公司合成。
利用PCR反應體系對選擇的14對引物進行篩選。具體過程如下:首先,用3個大蒜品種的DNA混樣篩選出條帶清晰且重復性好的引物;然后,用35種大蒜資源對具有通用性的引物進行多態(tài)性驗證。
PCR反應體系為10 μL:DNA模板1 μL,上下游引物各1 μL,2×TaqPCR Master Mix 4.5 μL,用ddH2O補充至10 μL。PCR擴增條件為:94 ℃預變性5 min;94 ℃變性30 s,54~58 ℃(因不同引物而異)退火30 s,72 ℃延伸30 s,30個循環(huán);72 ℃延伸10 min。擴增產(chǎn)物4 ℃保存,用3%瓊脂糖凝膠電泳檢測,在90 V電壓下電泳。
采用人工讀帶的方法進行數(shù)據(jù)統(tǒng)計,穩(wěn)定清晰可重復的條帶記做1,相同位置不清楚或者無條帶則記為0,構建矩陣,再用NTSYS 2.10軟件采用UPGMA法繪制聚類圖[28]。
SSR出現(xiàn)頻率fc(%)=c/n×100,c為搜索到的SSR數(shù)量,n為無冗余轉錄本數(shù)量;SSR發(fā)生頻率fC(%)=C/n×100,C為搜索到含SSR的無冗余轉錄本數(shù)量;SSR平均分布距離fN=N/c,N為無冗余轉錄本序列的總堿基數(shù)[29]。
大蒜轉錄組測序獲得444 865條unigene基因序列,總長度486 687 980 bp,利用Misa軟件對這些序列進行SSR位點鑒定。結果表明,全部unigenes中有102 421條序列包含SSR位點,發(fā)生頻率(含SSR的基因數(shù)與總基因數(shù)之比)為23.02%,包含 1個以上SSR位點的序列有27 606條,共鑒定出141 132個SSR位點,出現(xiàn)頻率(檢出SSR數(shù)目與總基因數(shù)之比)為31.72%,其中16 593個復合SSR位點,平均每3.45 kb出現(xiàn)1個SSR位點。
由表2可知,在篩選出來的6種SSR基序中,以單核苷酸數(shù)量最多,為96 001個,占總SSR的68.02%;其次為二核苷酸,有34 051個,占總SSR的24.12%;三核苷酸、四核苷酸、五核苷酸、六核苷酸的數(shù)量相對較少,總共有11 080個,僅占總SSR的7.86%。不同類型的SSR位點出現(xiàn)頻率與其比例相一致,以單核苷酸的出現(xiàn)頻率最高,達21.58%;其次為二核苷酸,為7.65%;三、四、五、六核苷酸的出現(xiàn)頻率相對較低。大蒜轉錄組中不同重復類型SSR位點的平均長度存在差異,單核苷酸重復平均長度為16.51 bp,二、三、四、五、六核苷酸類型SSR位點的平均長度分別為26.38、18.53、22.57、26.86、36.35 bp。
表2 大蒜轉錄組中SSR基序分布特征Table 2 Distribution characterisitics of SSR motifs in transcriptome of garlic
由表3可知,大蒜轉錄組中SSR位點共有82種基序類型,以單核苷酸重復基序最多,有A/T和C/G兩種類型,其中以A/T數(shù)量最多,有91 765個,占總SSR位點的65.02%;二核苷酸中以AT/AT數(shù)量最多,有17 460個,占總SSR位點的12.37%,其次分別為AC/GT、AG/CT、CG/CG,分別占總SSR位點的8.83%、2.63%、0.29%;三核苷酸中以AAT/ATT、AAG/CTT較多,分別有2 696個和2 386個,占總SSR位點的1.91%、1.69%;四核苷酸以ACAT/ATGT為主,有1 080個,占總SSR位點的0.77%;五核苷酸和六核苷酸重復基序類型所占比例均很少,其中五核苷酸重復類型共有15種,占總SSR位點的0.09%,以AAAAT/ATTTT為主;六核苷酸重復類型共有29種,占總SSR位點的0.1%,其中以AAGAGG/CCTCTT居多。
表3 大蒜轉錄組中SSR基序類型分布Table 3 Distribution of SSR motifs type in transcriptome of garlic
大蒜轉錄組SSR基序重復次數(shù)隨基序類型的不同而異。由圖1可知,單核苷酸基序的重復次數(shù)主要集中在9~12次,其他核苷酸基序的重復次數(shù)主要集中在5~8次??傮w來說,大蒜轉錄組SSR基序重復類型較多,其中重復5~30次的SSR位點均在1 000以上,以重復次數(shù)為10次的最多,共有30 407個,其次為11次,有15 399個。
已有研究表明,基序長度越長,其多態(tài)性越高[30],大于20 bp的重復序列有較高的多態(tài)性,重復序列長度在12~20 bp時表現(xiàn)出中等多態(tài)性,重復序列小于12 bp時表現(xiàn)為極低的多態(tài)性[19]。大蒜轉錄組SSR基序長度主要集中在10~325 bp,其中基序長度在10~20 bp的有80 915條,占總基序數(shù)的64.97%;基序長度在21~30 bp的有17 927條,占總基序數(shù)的14.39%;基序長度在31~40 bp的有8 345條,占總基序數(shù)的6.70%;基序長度在41~50 bp的有6 241條,占總基序數(shù)的5.01%;基序長度在51~60 bp的有4 089條,占總基序數(shù)的3.28%;基序長度大于60 bp的有7 022條,占總基序數(shù)的5.64%(表4)。由此可見,大蒜轉錄組SSR位點基序主要集中在10~20 bp,屬于中度多態(tài)性。
數(shù)字5~30代表核苷酸基序的重復次數(shù)。The numbers 5-30 referred to repeat counts of nucleotide motifs.圖1 大蒜轉錄組中SSR不同基序重復次數(shù)分布Fig.1 Distribution of various SSR motifs with different numbers in transcriptome of garlic
表4 大蒜轉錄組SSR位點重復序列的長度分布Table 4 Distribution of length of repeat sequences of SSR loci in transcriptome of garlic
根據(jù)大蒜轉錄組SSR位點,本研究共設計出125 616對引物,為了驗證其有效性,隨機選擇了14對引物對金鄉(xiāng)大蒜、大理珍珠蒜、大理三瓣蒜3個大蒜品種的DNA混樣進行PCR擴增,其中12對引物能夠擴增出清晰的條帶,引物有效率為85.71%。利用35份大蒜資源對篩選出的12對有效引物進行多態(tài)性鑒定,結果表明,其中6對引物具有多態(tài)性差異(表5),占有效引物的50%;每對引物的擴增條帶為1~9條,共37條;擴增得到的多態(tài)性條帶共26條,每對多態(tài)性引物平均產(chǎn)生4.33條條帶;其中引物11多態(tài)性為66.67%。圖2所示是引物11在35份大蒜資源中的擴增情況。
表5 大蒜6對SSR多態(tài)性引物信息Table 5 Information of 6 pairs of pleomorphic primers developed from garlic
用6對具有多態(tài)性差異的引物對35份大蒜資源進行聚類分析,結果表明,35份大蒜資源遺傳相似系數(shù)介于0.67~0.97,在遺傳相似系數(shù)0.756 9處,35份大蒜資源可被分成5大類群(圖3)。聚類結果表明,大部分來自同一地理區(qū)域或相近地理區(qū)域的品種聚在一起,比如第Ⅰ類的8份資源主要來源于西南地區(qū),第Ⅱ類的7份資源主要來自西北地區(qū);但也有少部分地理距離相距較遠的被聚在一起,如來自安徽的阜陽大蒜(26號)與來自東北地區(qū)的資源均被聚到了第Ⅴ類,這可能是由于地區(qū)間的引種所造成的。UPGMA聚類結果表明,大蒜區(qū)域間存在著基因交流,并且SSR標記能夠有效地對不同地區(qū)來源的大蒜資源進行區(qū)分,并進行親緣關系的鑒定。
M,DNA marker;1~35,表1 中35份大蒜資源的序號。下同。M, DNA marker; 1-35, Number of 35 garlic germplasm resources in Table 1. The same as below.圖2 引物11在35份大蒜種質資源中的多態(tài)性Fig.2 Polymorphisms of primer 11 in 35 garlic germplasm resources
圖3 三十五份大蒜種質資源的聚類分析Fig.3 Clustering analysis of 35 garlic germplasm resources
近年來,隨著高通量測序技術的快速發(fā)展,轉錄組測序成本大大降低。SSR分子標記以其成本低、通用性好等優(yōu)點已應用于多種植物。大蒜的栽培面積廣,種質資源豐富,但由于大蒜地區(qū)間品種交流頻繁使大蒜種質來源混雜,這就極大地增加了大蒜種質資源分類和育種的難度。相對于形態(tài)標記,分子標記可以不受環(huán)境的影響,且SSR分子標記對大蒜基因組檢測多態(tài)性水平高,能夠有效進行遺傳多樣性分析和親緣鑒定等,從而提高大蒜育種的效率。本研究以大蒜轉錄組測序獲得的444 865條unigenes為基礎,其中有102 421條序列包含SSR位點,SSR位點發(fā)生頻率為23.02%,較韭菜(20.72%)[29]、款冬(20.30%)[31]、山茶(19.52%)[32]、棉花(3.05%)[33]的發(fā)生頻率高,但低于牡丹(29.19%)[34]、蓮霧(38.36%)[35]、藍靛果忍冬(32.51%)[36]。不同研究中SSR位點發(fā)生頻率不同,可能是轉錄組測序方法、SSR位點篩選條件、開發(fā)軟件和物種間差異等造成的。
本研究中大蒜轉錄組SSR位點的重復類型存在著嚴重的偏倚現(xiàn)象。以單核苷酸、二核苷酸和三核苷酸重復基序為主,占總SSR總數(shù)的98.47%,四、五和六核苷酸重復基序所占比例很小,僅為1.53%。這與賀丹等[34]的研究結果相一致。已有研究表明,三核苷酸是大多數(shù)植物的主導重復基序[28,37],但本研究中以單核苷酸(68.02%)重復基序最多,其次是二核苷酸(24.12%)和三核苷酸(6.33%)重復,這與前人在蓮霧[35]、連翹[38]中的研究相一致,這可能與轉錄組unigenes中包含更多的非編碼區(qū)(UTR)信息有關[35],或者是不同植物基因組在進化過程中經(jīng)歷的時間不同[34]。單核苷酸重復基序中以A/T數(shù)量最多,這與前人對蓮霧[35]、芙蓉李[39]等的研究得出的結論相一致。二核苷酸中以AT/AT數(shù)量最多,這與前人研究的二核苷酸主要重復類型為AG/CT不一致[35,28,40],這可能與樂都紫皮大蒜栽培品種葉的SSR特性對大蒜轉錄組中SSR位點的影響有關。
本研究選擇的14對引物中有12對引物能進行有效擴增,其中有6對具有良好的多態(tài)性,多態(tài)率達50%,平均每對多態(tài)性引物可擴增得到4.33條條帶,表明本研究開發(fā)的SSR引物擴增效率較高,具有較高的可用性;6對引物的多態(tài)率高于油梨的10.79%[41],低于花椰菜的60.71%[20],說明不同品種間SSR分子標記結果存在著差異。本研究利用6對多態(tài)性引物將35份大蒜資源分成了5大類群,且來自同一地區(qū)的品種大多被聚集到同一類群中,表明本研究開發(fā)的SSR引物在一定程度上能夠有效地區(qū)分不同來源的大蒜資源,具有較高的應用價值;但不同地區(qū)來源的資源也可能被聚集到一起,如來自江蘇的蘇州獨頭蒜(13號)與來自云南的云南紫皮大蒜(14號)等均被聚集到第Ⅰ類群,這可能是由于大蒜區(qū)域的相互引種所造成的,這也說明了大蒜種質來源復雜;大理三瓣蒜(17號)與大理紫皮大蒜(15號)和大理珍珠蒜(16號)雖然均來自云南且地理位置較近,但卻被分到2大類群中,表明大蒜本身具有復雜的遺傳多樣性。本研究發(fā)現(xiàn)大蒜SSR標記基本可以用于親緣關系鑒定和判斷品種間是否存在基因交流等。