廖卓毅 馬秋月 戴曉港 張得芳 李淑嫻
(林木遺傳與生物技術省部共建教育部重點實驗室(南京林業(yè)大學),南京,210037)
微衛(wèi)星序列(microsatellite or simple sequence repeats,SSR)是指以1~6個核苷酸為基本重復單位的串聯(lián)重復序列[1]。微衛(wèi)星廣泛分布于各種生物的基因組中,尤其是真核生物基因組中。在群體間和不同個體間,微衛(wèi)星序列均表現(xiàn)出很高的變異性,其在基因組中的位置決定了它的功能,能夠影響包括基因調控、發(fā)展和進化等各個方面。目前,SSR分子標記技術廣泛應用于植物遺傳多樣性分析、連鎖圖譜制作、疾病連鎖分析和品種鑒定等方面[2-4]。
目前,微衛(wèi)星在遺傳學領域得到了廣泛應用,隨著大規(guī)模物種基因組測序工作的開展,已經在脊椎和無脊椎動物(人類、蚊子、雞、斑馬魚和中國對蝦等)、植物(擬南芥、水稻和小麥等)以及一些原核生物等30個以上的物種進行了基因組微衛(wèi)星分布特征分析[5-9]。這些研究結果表明,不同物種微衛(wèi)星的分布特征存在著較大差異,微衛(wèi)星的突變率也不相同[10-11],并且物種本身堿基組成也是選擇的結果。所以基于物種間基因組水平上微衛(wèi)星分布特征的比較分析,有助于從進化學的角度了解各重復類型分布特點及其功能。
核桃(Juglans regia L.)又名胡桃、合桃,屬于胡桃科核桃屬[12],果實富含碳水化合物、油脂、維生素和礦物質,享有“長壽之果”的美譽,是理想的滋補食品。不同學者對核桃微衛(wèi)星已有了一定的研究,Woeste等[13]最早通過構建微衛(wèi)星文庫,從黑核桃中開發(fā)出30對SSR引物用于品種的鑒別;齊建勛等[14]通過檢索核桃EST序列,開發(fā)了40對EST-SSR引物。Dangl等[15]應用SSR標記對主要來自歐美的48份資源進行了遺傳多樣性分析和品種的SSR鑒定。Wang等[16]用8個SSR標記研究了核桃和鐵核桃天然居群的遺傳結構。劉秀麗等[17]用7個SSR標記對3個核桃群體的遺傳結構進行了分析,但從基因組水平上對核桃微衛(wèi)星進行分析還沒有報道。本研究利用Roche—454GSFLX高通量測序平臺,對核桃進行低覆蓋度的基因組測序,并分析其微衛(wèi)星序列組成及特征、微衛(wèi)星分布頻率和豐度,旨在為從基因組水平上了解核桃微衛(wèi)星進化和功能以及微衛(wèi)星標記的開發(fā)、品種的真實性鑒定研究等工作提供一定的理論基礎。
試驗材料取自南京林業(yè)大學校園內。2012年春天采集剛萌發(fā)的嫩葉,采集后立即置于便攜式冰盒中帶回實驗室,置于冰箱中-80℃?zhèn)溆谩?/p>
基因組DNA的提取和提純采用植物DNA提取試劑盒DP305(上海玉博生物科技有限公司)。利用Roche-454GS FLX測序儀對核桃DNA樣品進行測序。
測序后所得數(shù)據(jù)利用454自帶軟件Roche Newbler 2.7進行序列拼接。采用 Misa(www.pgrc.ipkgatersleben.de/misa)程序進行所有重復單元長度微衛(wèi)星的查找,其中參數(shù)設置為:單堿基重復最短為10個重復、二堿基重復最短為6個重復、三堿基重復最短為4個重復、四堿基重復最短為3個重復、五堿基重復最短為3個重復、六堿基重復最短為2個重復。不同重復單元微衛(wèi)星密度的計算:D=N/L。其中,D為不同重復微衛(wèi)星密度(個/Mb);N為各重復單元微衛(wèi)星數(shù)量(個);L為核桃基因組重疊群總長(Mb)。
本研究利用Roche-454 FLX高通量測序后,共測得104.5 Mb的核桃基因組序列,序列總數(shù)為541176條,堿基總數(shù)為194024314 bp,平均讀長為358.5 bp。在所測得的序列中,CG堿基數(shù)為72563561 bp,CG堿基比例為37.41%。此外 Q20占總堿基百分比為85.5%。在高通量測序中,每測一個堿基就會給出一個相應的質量值,用以衡量測序的準確度,堿基的質量值為20,表示測序的錯誤率為1%,所以Q20含量是評價測序準確率的有效指標。本試驗中Q20所占總堿基百分比為85.5%,表明測序具有較高的準確度。
通過Roche Newbler 2.7軟件進行序列拼接和組裝,產生了143078個完全組裝序列,68799個部分組裝序列,320318個單一序列以及1622個重復序列。其中大于500 bp的重疊群有9707個,重疊群的最大長度為47928 bp,部分拼接數(shù)據(jù)見表1。
表1 有效讀長序列拼接結果
對核桃基因組進行測序查找,共獲得SSR序列9787條,核桃基因組部分微衛(wèi)星重復序列的信息見表2。
通過對核桃基因組進行隨機測序,從總長為9483541 bp的有效讀長中找到9787個微衛(wèi)星,平均每969 bp出現(xiàn)一個。對獲得的SSR進行密度分析,因各重復類型的長度不一,所得密度也存在較大差異。進一步分析發(fā)現(xiàn),在9787個核桃微衛(wèi)星中,六堿基重復為最多重復類型,共5883個,占總數(shù)的60.11%;其次是單堿基重復,1289個,占總數(shù)的13.17%;再次分別是四堿基重復、二堿基重復、三堿基重復和五堿基重復(表3)。
在單堿基重復中,A/T堿基為優(yōu)勢重復單元,共1268個,占單堿基重復序列總數(shù)的98.37%,C/G堿基重復占1.63%;二堿基中,重復單元最多的為AT/TA,共399個,占二堿基重復序列總數(shù)的51.95%,其次是AG/CT和AC/GT,分別為278個(36.20%)和88 個(11.46%),最少的 CG/GC,僅3 個,占總數(shù)的0.39%;在三堿基重復中,共發(fā)現(xiàn)9種重復單元,共計549個,其中AAT/ATT重復為181個,AAG/CTT重復151個,ATC/ATG重復72個,分別占三堿基重復序列總數(shù)的32.97%、27.50%和13.11%,三者共占總數(shù)的73.58%,其次是AGG/CCT重復為37個(6.74%)、ACC/GGT 重復 34 個(6.19%)、AAC/GTT重復 33個(6.01%)、ACT/AGT重復 21個(3.83%)、AGC/CTG 重復 16 個(2.91%),最少的為ACG/CGT重復,僅4個,占0.73%;在889個四堿基重復中,AAAT/ATTT最多,共293個,占四堿基重復總數(shù)的32.96%,其次是AAAG/CTTT,共106個,占總數(shù)的11.92%,另外AATG/ATTC重復57個(6.41%),AATT/AATT 重復 49 個 (5.51%),AAAC/GTTT重復 47個(5.28%),ACAT/ATGT 重復、ATGC/ATGC重復和AGCT/AGCT重復均為41個(4.61%),AGGG/CCCT 重復、AAGG/CCTT 重復和AATC/ATTG重復分別為26個(2.92%)、25個(2.81%)和24 個(2.70%);在五堿基重復中,總共25種重復類型,其中 AGATG/ATCTC重復和AAAAT/ATTTT重復為最多重復單元,分別為79個(19.31%)和 77 個(18.82%),其次是 AAAAG/CTTTT,為37 個(9.05%),另外,AAATG/ATTTC 重復18個(4.16%)、AAAAC/GTTTT重復17個(4.16%)、AATAT/ATATT 重復17個(4.16%)、ACCGG/CCGGT重復17個(4.16%)、ATATC/ATATG
重復14個(3.42%)、AACTC/AGTTG重復13個(3.41%)、AACAT/ATGTT 重復和 ACCCG/CGGGT重復均為11個(2.69%),剩余其他重復單元較少;在5883個六堿基重復微衛(wèi)星中,重復單元類型多達118種,各重復單元所占總數(shù)的比例都很小,其中以AAAAAT/ATTTTT重復和AAAAAG/CTTTTT重復最多,分別為390個和299個,占總數(shù)的6.63%和5.08%,其它幾種含量較多的六堿基重復拷貝類型中,AAAAAC/GTTTTT重復(145個)、AAAATT/AATTTT重復(129個)、AAAATC/ATTTTG重復(114個)、AAATAT/ATATTT重復(114個)、AAAGAG/CTCTTT重復(101個)、AAGAGG/CCTCTT重復(94個)、AAATTG/AATTTC重復(93個)、AAAAGG/CCTTTT重復(80個)依次減小。
總體而言,在核桃基因組微衛(wèi)星序列中,六堿基重復是最豐富的微衛(wèi)星類型,其次是單堿基重復。對這6種微衛(wèi)星重復類型進行統(tǒng)計分析,我們還發(fā)現(xiàn),五堿基重復微衛(wèi)星中AGATG和AAAAT是最多的兩類,而單堿基重復微衛(wèi)星中,A/T占總數(shù)的98.37%;同樣,二、三、四和六堿基重復微衛(wèi)星中,含量最多的分別是AN、AAN、AAAN和AAAAAN(N表示除A堿基外的其他任何堿基)??偟膩碚f,核桃微衛(wèi)星中富含A和T堿基。
表2 核桃微衛(wèi)星數(shù)據(jù)庫的部分結果
表3 不同長度重復單元微衛(wèi)星所占比例及分布密度
本研究中核桃基因組微衛(wèi)星的平均長度為21.86 bp,最長578 bp,最短10 bp,這些微衛(wèi)星以10 ~20 bp 為主,長度≥20 bp的微衛(wèi)星僅占17.22%(圖1)。
圖1 核桃微衛(wèi)星長度分布及不同長度微衛(wèi)星頻率
進一步對SSR相對豐度與重復次數(shù)的關系進行分析,結果表明,核桃中SSR相對豐度隨著重復次數(shù)的增加而迅速下降,但不同基因序列長度類型的下降速度不同??傮w看,單堿基重復次數(shù)超過17、二堿基超過19、三堿基超過8、四堿基和五堿基超過6、六堿基超過4之后,相對豐度就接近于零了。從柱狀數(shù)量變化還可以看出,二堿基重復微衛(wèi)星長度的變化次數(shù)明顯多于其它重復類型。在這些重復類型中,六堿基重復微衛(wèi)星長度的變化次數(shù)最少,這表明二堿基重復微衛(wèi)星的變異程度最高,六堿基重復的變異程度最低(表4)。
表4 6種重復類型中長度變異情況
在核桃總長為948354 bp的有效讀長中有9787個微衛(wèi)星,平均每969 bp出現(xiàn)1個微衛(wèi)星,分布密度為1032個/Mb。在已見報道的一些植物微衛(wèi)星密度中,油茶微衛(wèi)星密度為539.5個/Mb,楊樹基因組序列平均1883 bp出現(xiàn)1個微衛(wèi)星,分布密度為531.1個/Mb,均低于核桃微衛(wèi)星的分布密度。鄭燕[18]等對水稻、玉米、高粱和二穗短柄草4種禾本科植物SSR的對比研究發(fā)現(xiàn),不同植物的基因組中,SSR的積累速度及進化速度可能會有所不同,基因組中SSR數(shù)量與物種基因組大小有關,通過與其他植物已測定基因組序列的對比,可以為核桃基因組的測序工作提供有益幫助。
目前大多數(shù)木本植物微衛(wèi)星的分析研究主要局限于少數(shù)微衛(wèi)星位點的實驗分析[19],而大量微衛(wèi)星的生物信息學分析卻僅限于極少數(shù)幾個樹種,已完成整個基因組SSR測序的楊樹是為數(shù)不多的物種之一[20]。通過與楊樹微衛(wèi)星密度的對比,可以為核桃整個基因組微衛(wèi)星測序工作提供參考。本試驗對核桃基因組微衛(wèi)星進行了低覆蓋度的測序,結果表明,在核桃基因組微衛(wèi)星序列中,六核苷酸重復的比例在所有重復類型中最多,占60.11%。目前已完成測序的微衛(wèi)星生物信息學分析表明,玉米[16]、高粱[6]和楊樹[20]主要以三核苷酸重復為優(yōu)勢重復類型;有的生物,如人、擬南芥和秀麗隱桿線蟲則以單核苷酸重復為最優(yōu)[6,21];有些生物,如果蠅、家蠶等以二核苷酸重復為主[6-8],而六核苷酸重復占優(yōu)的現(xiàn)象則極為罕見。筆者認為可能是由于本試驗只對核桃基因組微衛(wèi)星序列進行了低覆蓋度的測序,獲得的結果不夠全面所致,但確切的原因還有待進一步研究。已發(fā)表物種微衛(wèi)星序列特征的報道中,對于六核苷酸重復在生物中作用的研究還比較少,所以六核苷酸重復占優(yōu)勢對核桃遺傳學上的影響將是一個新的研究領域。
對核桃基因組微衛(wèi)星進行分析發(fā)現(xiàn)核桃基因組微衛(wèi)星中富含A和T堿基,而C和G的含量很少,但隨著重復單元長度的增加,C和G的含量也在增加。在單堿基重復中,A/T含量高達98.37%,二核苷酸重復中,A/T含量占51.95%,這與人、有胚植物、酵母和真菌類生物基因組微衛(wèi)星的分析結果類似[18]。隨著堿基長度的增加,C和G堿基可以增加堿基重復的穩(wěn)定性[22],而微衛(wèi)星中富含A和T堿基,使得Tm值大大降低,DNA鏈容易解開,通過DNA復制滑動機制和重組機制,產生富含AT重復類型的機率更高。
本次還對核桃基因組不同單元類型微衛(wèi)星的長度變異情況進行了分析,發(fā)現(xiàn)這些微衛(wèi)星的長度變異與所含重復單元的長度成反比,除單核苷酸重復微衛(wèi)星外,這些微衛(wèi)星的長度變異程度隨著重復單元長度的增加而降低。Samadi等[23]的模擬分析研究認為重復單位長度越長,經受的選擇壓力越大,因此它們的拷貝數(shù)就越少,長度變異越低。由于序列長度的分化情況反映了不同類型微衛(wèi)星序列獲得或失去重復單元的速率,所以這一特征與微衛(wèi)星位點的多態(tài)性關系密切,這反映了由短重復單元構成的微衛(wèi)星失去或獲得重復單元的速率比長重復單元構成的微衛(wèi)星要快。閻毛毛等[24]在對楊樹、桉樹和松樹這3個樹種的SSR對比之后,得出了同樣的結果。這是否是林木表達序列所含微衛(wèi)星的共同的變化規(guī)律?這一假設還需要在更多的樹種中展開分析加以驗證。Temnykh等[25]將按長度將微衛(wèi)星分為兩大類:長度大于等于20 bp的SSR為第一類,長度大于12 bp但小于20 bp的為第二類。本試驗對9787個微衛(wèi)星的長度進行統(tǒng)計分析,發(fā)現(xiàn)微衛(wèi)星長度從10 bp到578 bp不等,微衛(wèi)星的平均長度為21.86 bp,不同長度的微衛(wèi)星的數(shù)量差異極顯著,且不符合正態(tài)分布,微衛(wèi)星主要第一類為主,第二類僅為17.22%。與第二類SSR相比,第一類SSR具有更高的多態(tài)性。這一規(guī)律是 Weber[26]最早于人類的微衛(wèi)星實驗數(shù)據(jù)中發(fā)現(xiàn),并已在很多生物體中得到證實。第二類SSR由于片段長度較短,在滑鏈錯配時可產生的錯配位點就會相對較少,故多態(tài)性不如第一類,由于較長的微衛(wèi)星具有更高的變異頻率,因此會受到更強烈選擇的影響,這對于研究核桃基因組的起源時間具有重要的意義,其多態(tài)性也為核桃微衛(wèi)星位點的標記提供了可行性。
[1]Hayden M J,Sharp P J.Sequence-tagged microsatellite profiling(STMP):a rapid technique for developing SSR markers[J].Nucleic Acids Research,2001,29(8):1-8.
[2]李汝玉,李群,張文蘭,等.利用SSR標記進行小麥品種鑒定和新品種保護研究[J].山東農業(yè)科學,2007(6):14-17.
[3]馮錦霞,張川紅,鄭勇奇,等.利用熒光SSR標記鑒別楊樹品種[J].林業(yè)科學,2011,47(6):167-174.
[4]張亞東,胡興宜,宋叢文.利用新型分子標記EST-SSR鑒定湖北省內的主栽黑楊品種[J].分子植物育種,2009,7(1):105-109.
[5]郭文久.微衛(wèi)星在基因組上的分布與功能及其計算方法初步研究[D].雅安:四川農業(yè)大學,2004.
[6]Toth G,Gaspari Z,Jurka J.Microsatellites in different eukaryotic genomes:Survey and analysis[J].Genome Research,2000,10(7):967-981.
[7]Gao H,Kong J.The microsatellite and minisatellites in the genome of Fenneropenaeus chinensis[J].DNA Sequence,2005,16(6):426-436.
[8]Katti M V,Ranjekar P K,Gupta V S.Differential distribution of simple sequence repeats in eukaryotic genome sequences[J].Molecular Biology and Evolution,2001,18(7):1161-1167.
[9]Cruz F,Prez M,Presa P.Distribution and abundance of microsatellites in the genome of bivalves[J].Gene,2005,346:241-247.
[10]Oliveira E J,Pdua J G,Zucchi M I,et al.Origin,evolution and genome distribution of microsatellites[J].Genetics and Molecular Biology,2006,29(2):294-307.
[11]Ross C L,Dyer K A,Erez T,et al.Rapid divergence of microsatellite abundance among species of Drosophila[J].Molecular Biology and Evolution,2003,20(7):1143-1157.
[12]郗榮庭.中國核桃(Juglans regia L.)起源考證[J].河北農業(yè)大學學報,1990,13(1):90-94.
[13]Weoste K,Rhodes R B O,Michler C.Thirty polymorphic nuclear microsatellite loci from black walnut[J].The Journal of Heredity,2002,93(1):58-60.
[14]Qi J X,Wang K J,Wu C H L,et al.Development of EST-SSR markers in Juglans regia L.[J].Journal of Agricultural Biotechnology,2009,17(5):872-876.
[15]Dangl G S,Woeste K,Aradhya M K,et al.Characterization of 14 microsatellite markers for genetic analysis and cultivar identification of walnut[J].Journal of American Society for Horticultural Science,2005,130(3):348-354.
[16]Wang H,Hao J M,Wang B Q,et al.SSR analysis of genetic diversity of eight natural populations in China[J].Scientia Silvae Sinice,2007,43(7):120-124.
[17]Liu X L,Chen X S,Zhang M Y,et al.Population genetic structure analysis of Juglans regia L.using SSR markers[J].Journal of Fruit Science,2008,25(4):526-530.
[18]鄭燕,張耿,吳為人.禾本科植物微衛(wèi)星序列的特征分析和比較[J].基因組學與應用生物學,2011,30(5):513-520.
[19]Wyman J,Bruneau A,Tremblay M F.Microsatellite analysis of genetic diversity in four populations of Populus tremuloides in Quebec[J].Canadian Journal of Botany,2003,81(4):360-367.
[20]Tuskan G A,Gunter L E,Yang Z K,et al.Characterization of microsatellites revealed by genomic sequencing of Populus Trichocarpa[J].Canadian Journal of Forest Research,2004,34(1):85-93.
[21]Richard G F,Paques F.Mini and microsatellite expansions:the recombination connection[J].EMBO Reports,2000,1(2):122-126.
[22]Prasad M D,Muthulakshmi M,Madhu M,et al.Survey and analysis of microsatellites in the silkworm,bombyxmori:frequency,distribution,mutations,marker potential and their conservation in heterologous species[J].Genetics,2005,169(1):197-214.
[23]Samadi S,Artiguebielle E,Estoup A,et al.Density and variability of dinucleotide microsatellites in the part henogenetic polyploid snail Melanoides tuberculata[J].Molecular Ecology,1998,7(9):1233-1236.
[24]閻毛毛,戴曉港,李淑嫻,等.松樹、楊樹及桉樹表達基因序列微衛(wèi)星比對分析[J].基因組學與應用生物學,2011,30(1):103-109.
[25]Temnykh S,Declerck G,Lukashova A,et al.Computational and experimental analysis of microsatellites in rice(Oryza sativa L.):frequency,length variation,transposon associations,and genetic marker potential[J].Genome Research,2001,11(8):1441-1452.
[26]Weber J L.Informativeness of human(dC-dA)n(dG-dT)n polymorphisms[J].Genomics,1990,7(4):524-530.