馬秋月,王玉虓,李倩中*,李淑順,聞 婧,朱 璐,顏坤元,杜一鳴,解志軍,李淑嫻,歐陽芳群,魯成代
(1.江蘇省農(nóng)業(yè)科學(xué)院休閑農(nóng)業(yè)研究所,江蘇 南京 210014;2.南京林業(yè)大學(xué)林學(xué)院,南方現(xiàn)代林業(yè)協(xié)同創(chuàng)新中心,江蘇 南京 210037;3.襄陽市林業(yè)科學(xué)技術(shù)推廣站,湖北 襄陽 441000;4.北京市植物園,北京 100093;5.天水市五小葉植物保護(hù)研究所,甘肅 天水 741000)
槭屬(Acer)隸屬于無患子目(Sapindales)槭樹科(Aceraceae),全世界約有200多種,我國就有151種,是槭樹分布種類最多的國家[1]。槭屬植物樹姿優(yōu)美,葉形秀麗,不同季節(jié)葉色變異豐富,是園林綠化及景觀營建中極具代表性的重要觀賞樹種,亦是優(yōu)良的盆景樹種。此外,部分槭屬植物除具有觀賞價值外,還具有油用、藥用、材用、化工用等多種用途,如元寶楓(Acertruncatum)[2]、青楷槭(A.tegmentosum)[3]等。因此,該屬植物在未來的食品、醫(yī)療及化工等領(lǐng)域開發(fā)應(yīng)用前景廣闊。
以往研究者們主要對槭屬植物的栽培與育種領(lǐng)域進(jìn)行相關(guān)研究[4-7],近年來該屬植物的分子生物學(xué)特性如分子標(biāo)記開發(fā)、葉色變異及代謝產(chǎn)物合成機制相關(guān)研究也逐漸受到關(guān)注[2,8-9]?;蚪M特征研究是植物基因資源開發(fā)和分子機制研究的前提,其中基因組大小測定是進(jìn)行物種全基因組測序、遺傳資源開發(fā)與利用等的基礎(chǔ)[10-12]。關(guān)于不同種槭樹基因組大小及特征研究的報道較少,嚴(yán)重阻礙了該屬植物分子生物學(xué)研究。
植物基因組大小(又稱DNAC值)是指一個物種單倍體核的DNA含量,一般用質(zhì)量(pg)或核苷酸堿基對數(shù)目(Mb)來表示(1pg約978 Mb)[10-12]?;蚪M大小測定方法主要包括基于K-mer分析的基因組測序法[13]、流式細(xì)胞術(shù)[14]以及孚爾根微顯影法[15],前兩者是測定基因組大小的常用方法,其中基于K-mer分析的基因組測定法具有高通量測序、速度快、數(shù)據(jù)量大等優(yōu)點[2],流式細(xì)胞術(shù)法具有操作簡單、分辨率高、準(zhǔn)確率高等優(yōu)點[10,14,16-17]。
已知的槭屬植物多為二倍體(2n=2x=26)[18],但不同種間具有不同大小的基因組。近年來,隨著高通量測序技術(shù)的快速發(fā)展,測序成本大幅度降低,使得大量的非模式樹種如銀杏(Ginkgobiloba)[16]、簸箕柳(Salixsuchowensis)[19]、鵝掌楸(Liriodendronchinense)[20]等的全基因組測序工作得以開展。目前僅19種槭樹科植物的基因組大小被收錄于植物DNAC值數(shù)據(jù)庫(https://cvalues.science.kew.org),平均大小為0.90 pg,其中最大的DNA 1C值為1.70 pg,最小的為0.4 pg。本研究采用流式細(xì)胞術(shù)和基于K-mer 分析的基因組Survey測序?qū)﹂蕦僦参镏械慕ㄊ奸?A.henryi)、秀麗槭(A.elegantulum)、五小葉槭(A.pentaphyllum)、青楷槭、血皮槭(A.griseum)、三角楓(A.buergerianum)進(jìn)行基因組大小測定,以期為該屬植物的倍性研究、功能基因組學(xué)分析以及遺傳改良等研究奠定基礎(chǔ)。
供試材料三角楓、秀麗槭、建始槭的嫩葉采自江蘇省南京市溧水區(qū)江蘇省農(nóng)業(yè)科學(xué)院槭樹良種基地(119°02′E,31°65′N),青楷槭嫩葉采自吉林省白山市二道區(qū)(128°08′E,42°27′N),五小葉槭嫩葉采自甘肅省天水市(104°10′E,34°55′N),血皮槭嫩葉采自中國林業(yè)科學(xué)研究院(116°24′E,40°00′N)。用于流式測定內(nèi)標(biāo)植物的玉米(Zeamays‘CE-777’)和大豆(Glycinemax‘Polanka’)由南京林業(yè)大學(xué)林木遺傳與生物技術(shù)重點實驗室提供。
1.2.1 解離液的篩選與熒光染料的制備
以6種槭樹和內(nèi)標(biāo)植物嫩葉為試材,分別將6種解離液WPB、GPB、Tris-MgCl2、LB01、Galbraith’s、Otto進(jìn)行逐一測試。其中所用熒光染料碘化丙啶(PI)配制后(50 μg/mL)避光保存于4 ℃冰箱。
1.2.2 細(xì)胞核懸液制備與DNA特異性染色
細(xì)胞核懸液制備參照馬秋月等[7]的方法:將待測樣品植株分別稱取新鮮幼嫩的葉片3份(每份約1 g)放置于培養(yǎng)皿,加入4 ℃預(yù)冷的1.5 mL 解離液,用刀片迅速切碎,將解離液經(jīng)37 μm濾膜過濾至1.5 mL EP管中,冰上孵育5 min,1 000 r/min離心5 min后棄上清,再將150 μL預(yù)冷的解離液加入收集的沉淀細(xì)胞中,吸取250 μL渦旋混勻后的混合液,并加入0.5 μL預(yù)冷的PI熒光染料,混勻后置于4 ℃冰箱避光染色15 min后上機檢測。對照樣品玉米和大豆的細(xì)胞核懸液的制備方法同上。將對照樣品與待測樣品的細(xì)胞核懸液等體積混合。
1.2.3 流式細(xì)胞儀測定與基因組大小計算
測定前,將流式細(xì)胞儀(BD InfluxTM,USA)預(yù)熱30 min,采用488 nm藍(lán)光激發(fā),收集670/30 FL2 通道的熒光;依據(jù)碘化丙啶(PI)嵌入量與細(xì)胞核DNA成正比關(guān)系,通過測定的熒光強度,進(jìn)而計算DNA的相對含量。采用FACSTMSortware 1.0.0.650軟件進(jìn)行相關(guān)樣品的統(tǒng)計分析與圖像繪制。其中測試樣品低速收集8 000~10 000個顆粒[每個樣品進(jìn)行3次平行實驗,變異系數(shù)(CV)均控制在5%以內(nèi)[21]],本試驗所有的待測樣品峰為P4,內(nèi)標(biāo)峰均為P5峰。核DNA含量的計算方法為:待測樣核DNA含量(pg)=對照樣本細(xì)胞核DNA含量×(待測樣本G0與G1期峰熒光強度之比/對照樣本G0與G1期峰熒光強度之比);其中,G0為分裂停止期,G1為細(xì)胞DNA復(fù)制未開始期。已知內(nèi)標(biāo)物種玉米和大豆的2C基因組大小為 5.43 pg和2.50 pg。
1.3.1 基因組DNA提取與序列測序
采用北京艾萊德植物基因組DNA提取試劑盒(DN14)提取DNA[22],利用Nanodrop 2000 分光光度計(德國,Eppendrof)和1%(質(zhì)量分?jǐn)?shù))瓊脂糖凝膠電泳進(jìn)行DNA濃度和質(zhì)量檢測。合格的DNA樣品經(jīng)過隨機打斷后(長度為350 bp)構(gòu)建文庫,并利用Illumina HiSeqTMXten測序平臺進(jìn)行高通量測序。獲得的原始數(shù)據(jù)經(jīng)過質(zhì)控過濾后(去除接頭、污染和低質(zhì)量reads)進(jìn)行K-mer分析。
1.3.2 基因組大小計算與雜合度分析
利用SOAPdenovo軟件 (https://github.com/aquaskyline/SOAPdenovo 2)進(jìn)行數(shù)據(jù)拼接與組裝,采用K-mer分析法[15]估算6種槭屬植物基因組的大小、雜合度、重復(fù)比例。根據(jù)基因組大小等于K-mer總數(shù)與K-mer期望深度的比值,即可估測出待測樹種的基因組大小。此外,分別根據(jù)K-mer曲線的分布情況以及標(biāo)準(zhǔn)泊松分布與實際數(shù)據(jù)曲線峰值后的面積差值,計算獲得雜合率(雜合峰值與純合峰值的比值)及重復(fù)序列比例。本試驗基于K值為17進(jìn)行預(yù)測,并利用Jellyfish 2.1.4軟件[23]進(jìn)行統(tǒng)計分析。
細(xì)胞解離液促使植物細(xì)胞破碎后分散細(xì)胞器,從而解離出細(xì)胞核,但不同植物在不同解離液作用下,其解離效果差異較大[14,17,24]。本研究以6種槭樹嫩葉為實驗材料,比較6種解離液(LB01、WPB、GPB、Gal、Otto、Tris-MgCl2)的解離效果后發(fā)現(xiàn),WPB的解離效果最好(圖1和圖2),待測樣品和內(nèi)標(biāo)的粒子清晰集中,基本無重疊峰和雜峰,且區(qū)分度良好,能夠?qū)⒋郎y和內(nèi)參實驗樣品區(qū)分開;因此,WPB是本研究中流式測定體系的最佳解離液。
圖1 6種槭樹與內(nèi)標(biāo)混合樣品散點圖Fig.1 The scatter plots of the mixed cell nucleus suspensions of six Acer species
A—E的內(nèi)標(biāo)為大豆,F(xiàn)的為玉米。The internal standard of A-E is Glycine max ‘Polanka’,and that of the F is Zea mays CE-77.圖2 6種槭樹與內(nèi)標(biāo)混合樣品流式細(xì)胞儀檢測結(jié)果Fig.2 The result of mixed samples of six Acer species and internal standard
通過內(nèi)標(biāo)法對6種槭樹的混合細(xì)胞核懸液樣品PI發(fā)射的熒光強度進(jìn)行流式測定分析。由圖2可知,待測樣品與內(nèi)標(biāo)間區(qū)分度良好,且DNA含量CV均在5.0%以內(nèi),試驗結(jié)果可靠穩(wěn)定[17,24-25]。已知大豆1C基因組大小為1.25 pg,根據(jù)待測樣品與大豆峰值的倍數(shù)關(guān)系,以大豆為內(nèi)標(biāo)能成功檢測出待測樣品基因組大小。通過3次平行重復(fù)檢測后,5種槭樹樣品平均基因組大小分別為建始槭(691.12±8.69) Mb、三角楓(863.90±8.69) Mb、秀麗槭(896.50±4.35) Mb、血皮槭(893.24±8.69) Mb、五小葉槭(766.10±8.69) Mb。然而以大豆為內(nèi)標(biāo)顯示其與青楷槭會出現(xiàn)主峰相近或部分重疊,但以玉米(1C基因組大小為2.72 pg)為內(nèi)標(biāo),成功測出青楷槭的基因組大小為(1 154.04±13.04) Mb(表1)。由表1可以看出,6種槭樹科植物的基因組大小存在一定的差異。
表1 6種槭屬植物基因組大小Table 1 Genome size survey for six Acer species
表1 (續(xù))
基于高通量測序平臺Illumina HiSeqTMXten 分別對6種槭樹進(jìn)行測序,經(jīng)過過濾及質(zhì)控評估后,文庫Q20(錯誤率為1%)均在96%以上,Q30(錯誤率為0.1%)在92%以上,錯誤率均不高于0.04%,表明序列質(zhì)量較好(表2)。
表2 測序數(shù)據(jù)統(tǒng)計及質(zhì)量評估Table 2 Sequencing data statistics and quality assessment
利用Jellyfishv 2.1.4軟件對上述6種高質(zhì)量測序數(shù)據(jù)進(jìn)行K-mer分析(K值為17)。從圖3可以看出,K-mer分布曲線成峰較好,除五小葉槭和青楷槭外,其他均呈雙峰分布。其中建始槭的17-mer期望深度(圖中主峰)分別在21和44附近,三角楓和秀麗槭在15和32附近,血皮槭在17和35附近;而五小葉槭和青楷槭為單峰分別在35和22附近。依據(jù)公式,基因組大小等于K-mer總數(shù)與K-mer期望深度的比值,本研究估測及修正后6種槭樹的基因組大小分別為建始槭(561.72 Mb)、三角楓(743.0 Mb)、秀麗槭(777.87 Mb)、血皮槭(771.51 Mb)、五小葉槭(650.64 Mb)、青楷槭(1 103.46 Mb)。如圖3所示,前四者的主峰1/2位置處均有明顯的雜合峰,說明均存在雜合現(xiàn)象,而后兩者雜合峰不明顯;通過預(yù)估建始槭、三角楓、秀麗槭、血皮槭、五小葉槭、青楷槭的雜合率分別為1.00%、1.24%、1.31%、1.08%、0.28%、0.81%。此外,還發(fā)現(xiàn)主峰后均存在拖尾現(xiàn)象,分析發(fā)現(xiàn)其重復(fù)率分別為58.10%、63.83%、66.44%、67.44%%、63.73%、76.82%,研究發(fā)現(xiàn)6種槭樹基因組的確存在較復(fù)雜的基因組重復(fù)序列(表3)。
圖3 6種槭樹基因組的17-mer曲線分布Fig.3 Distribution of 17-mer in the genomes of six Acer species
表3 基于17-mer的6種槭樹基因組分析Table 3 The 17-mer analysis of six Acer species
本研究首次通過對6種常用解離液的篩選和比較,建立和篩選建始槭、三角楓、秀麗槭、血皮槭、五小葉槭、青楷槭的最適解離液,結(jié)果發(fā)現(xiàn)以WPB為細(xì)胞核解離液時沒有重疊峰,且區(qū)分度良好,所獲得的粒子清晰集中,CV值均可控制在5%以內(nèi),保證了該研究的準(zhǔn)確性和可靠性。不同植物材料其最適解離液具有較大差異,如已報道的銀縷梅屬中的銀縷梅(Parrotiasubaequalis)和波斯鐵木(P.persica)以WPB作為細(xì)胞解離液效果較好,而解離液Galbraith’s對蘭屬植物中的對蓮瓣蘭(Cymbidiumtortisepalum)和墨蘭(C.sinense)解離效果最好[27];然而同屬植物間也存在一定差異,以往研究中發(fā)現(xiàn)槭屬植物中的雞爪槭(A.palmatum)和元寶楓(A.truncatum)以LB01為解離液時效果最好[14]。這樣的結(jié)果表明不同解離液對不同植物材料的解離效果存在很大差異[24-25],不同解離液中化學(xué)成分的差異性以及植物組織表現(xiàn)出的不同細(xì)胞特異性等是其解離效果差異的主要原因。
用于檢測基因組大小的方法主要包括流式細(xì)胞術(shù)、孚爾根光密度測量法、實時熒光定量PCR、基于基因組測序的K-mer分析法等[14,25-26]。目前因高通量測序平臺結(jié)合K-mer分析也已成熟地應(yīng)用于不同植物基因組大小的估測[17,25],如鐵皮石斛(Dendrobiumofficinale)[28]、黃瓜(Cucumissativus)[29]、人參(Panaxginseng)[30]等。
本研究基于Illumina HiSeqTMXten平臺分別對6種槭樹植物的基因組大小進(jìn)行K-mer分析,結(jié)果顯示,6種槭樹的基因組大小分別為建始槭(561.72 Mb)、三角楓(743.00 Mb)、秀麗槭(777.87 Mb)、血皮槭(771.51 Mb)、五小葉槭(650.64 Mb)、青楷槭(1 103.46 Mb)?;诹魇郊?xì)胞儀測定的結(jié)果分別為:建始槭[(691.12±8.69) Mb]、三角楓[(863.90±8.69) Mb]、秀麗槭[(896.50±4.35) Mb]、血皮槭[(893.24±8.69) Mb]、五小葉槭[(766.10±8.69) Mb]、青楷槭[(1 154.04±13.04) Mb]。兩種方法預(yù)測后6種槭樹均為二倍體,K-mer分析結(jié)果均略小于流式細(xì)胞術(shù)預(yù)測結(jié)果,與以往報道中對波斯鐵木(Parrotiapersica)[25]、繡球 (hydrangeamacrophylla)[17]、黃瓜[29]和人參[30]等植物的基因組大小研究結(jié)果類似。但不同植物間也存在一定差異,如在鐵皮石斛[28]、新疆沙冬青 (Ammopiptanthusmongolicus)[26]中K-mer的分析結(jié)果略大于流式細(xì)胞測定的基因組大小,其主要原因是流式細(xì)胞測定會受到植物細(xì)胞結(jié)構(gòu)及其次生代謝產(chǎn)物的影響,而基于K-mer的分析可克服植物內(nèi)源性物質(zhì)的干擾[29-30],但在未來開展植物全基因組的測定工作中,二者的比較和分析具有重要的參考價值。
一般體細(xì)胞DNA的含量用2C代表[31]。植物基因組大小作為生物多樣性的主要特征參數(shù)之一,在比較基因組學(xué)、進(jìn)化分析、生態(tài)學(xué)等研究領(lǐng)域中都具有重要意義[10-12]。Soltis等[32]將被子植物基因組大小劃分為DNA 1C值≤1.4 pg 為極小基因組,1C值≥1.4~3.5 pg的為小基因組。鵝耳櫟葉槭 (A.carpinifolium)為首次被報道基因組大小的槭屬植物,其基因組大小為0.38 pg[33],此后陸續(xù)有研究者對不同槭樹基因組大小進(jìn)行測定與評估,發(fā)現(xiàn)不同品種的基因組大小差異較大。盡管槭樹種類超過200多種,但目前僅19種槭樹科植物的基因組大小數(shù)據(jù)被植物DNAC值數(shù)據(jù)庫(https://cvalues.science.kew.org)所收錄。除美國紅楓(A.rubrum)DNA 1C值為1.70 pg外,其余品種均小于1.4 pg,屬于極小基因組[32],最小的樟葉槭(A.coriaceifolium)僅0.4 pg。
槭屬植物的種類繁多,已有研究表明該屬植物基因組大小存在一定差異,說明經(jīng)過長期的自然選擇,其遺傳變異較為豐富。盡管本研究中6種槭樹均為二倍體,不同槭樹的基因組大小也存在一定差異,如青楷槭的基因組大小約為建始槭的2倍。以往研究報道基因組內(nèi)大量的非編碼DNA,基因組多倍化和轉(zhuǎn)座子的積累是基因組增大的內(nèi)在主要動力[33-34],是導(dǎo)致不同植物基因組大小產(chǎn)生差異的主要原因。已有研究表明,植物的多樣性及物種滅絕的風(fēng)險性與植物基因組的大小有一定的關(guān)系[35]。該現(xiàn)象在其他物種中也極為普遍,例如棗屬(Ziziphus)[36]、草莓屬(Fragaria)[37]等。
本研究篩選出適合6種槭樹流式測定的最佳細(xì)胞核解離液為WPB,且以玉米和大豆為內(nèi)標(biāo),基于流式細(xì)胞術(shù)成功區(qū)分并估測6種槭樹的基因組大小,同時利用K-mer分析法成功分析6種槭樹的基因組特征。以往將K-mer分析預(yù)測的雜合度大小一般分為兩種,分別為微雜合(0.5%≤雜合率<0.8%)和高雜合(雜合率≥0.8%)[38]。本研究中五小葉槭的雜合度最低為0.28,屬于低雜合;青楷槭為0.81近于微雜合,其余為高雜合基因組植物。此外,基因組重復(fù)序列比例≥50%被認(rèn)為是高重復(fù)基因組,研究結(jié)果表明6種槭樹重復(fù)序列均在58%以上,這為后續(xù)基于第3代全基因組測序工作的開展增加了難度[25,28,39]。本研究首次成功測得6種槭樹植物的基因組大小,補充和豐富了槭樹科植物的DNAC值數(shù)據(jù)庫,為槭屬植物的細(xì)胞學(xué)、基因組學(xué)以及系統(tǒng)進(jìn)化等研究奠定了理論基礎(chǔ)。