王藝儒,索玉靜,傅建敏
(中國林業(yè)科學(xué)研究院 經(jīng)濟林研究所,經(jīng)濟林種質(zhì)創(chuàng)新與利用國家林業(yè)局重點實驗室, 河南 鄭州450003)
柿(DiospyroskakiThunb.)為柿科(Ebenaceae)柿屬(Diospyros)植物,有“木本糧食”之稱[1]。中國甜柿是我國原產(chǎn)完全甜柿(PCNA)的統(tǒng)稱,在果實硬食期即可自然脫澀,其自然脫澀機理以單寧的凝固效應(yīng)為主。中國甜柿與日本甜柿各自獨立起源,日本甜柿自然脫澀性狀受隱性單基因控制,而中國甜柿自然脫澀性狀呈顯性遺傳的特點,該特點使其在雜交育種中較日本甜柿更具潛力[2]。開展雜交育種是獲得甜柿新種質(zhì)的重要手段,但對于柿育種而言,較長的童期增加了育種成本,因此有必要開發(fā)有效的分子標記,在育苗階段將完全甜柿篩選出來,以節(jié)約時間和成本,提高種質(zhì)創(chuàng)新與育種效率。目前柿屬植物中僅有針對二倍體柿近緣種油柿和君遷子基因組的報道[3-5],而對六倍體柿基因組的研究缺乏,這在一定程度上限制了柿重要性狀的分子輔助育種進程。
DNA分子標記的開發(fā)對植物分子遺傳育種具有重要意義,因為分子標記具有穩(wěn)定遺傳、不受取材部位限制和不受環(huán)境影響等優(yōu)點[6]。目前,分子標記廣泛應(yīng)用于親緣關(guān)系及遺傳多樣性分析[7-8]、遺傳圖譜構(gòu)建[9]、基因定位[10]、分子標記輔助育種[11]和品種純度鑒定[12]等研究中。在柿屬植物中報道過利用核酸數(shù)據(jù)庫中的氨基酸序列信息[13]、富集CT/AG的基因組文庫[14]和NCBI上的柿屬EST序列[15]開發(fā)簡單重復(fù)序列(simple sequence repeat,SSR)引物,但SSR引物數(shù)目較少。隨著轉(zhuǎn)錄組的發(fā)展,杜改改等[16]、張曉娜等[17]分別以‘禪寺丸’柿雌雄花芽和君遷子不同單株葉片的轉(zhuǎn)錄組數(shù)據(jù)對其SSR和單核苷酸多態(tài)性(single nucleotide polymorphisms,SNP)位點進行分析,一定程度上豐富了柿屬植物SSR和SNP的引物來源。
目前柿屬植物SSR分子標記可用于品種鑒定的位點仍然偏少,而SNP和插入/缺失多態(tài)性(insenion-deletion,InDel)分子標記尚未應(yīng)用于柿屬植物研究中,可用于鑒別中國甜柿的引物則更為缺乏。轉(zhuǎn)錄組測序方法為尚無基因組的非模式物種基因功能及分子標記的開發(fā)提供了便利[18]。本研究對中國甜柿品種小果甜柿5個發(fā)育期的果實轉(zhuǎn)錄組數(shù)據(jù)進行SSR、SNP和InDel位點分析,以豐富中國甜柿的SSR、SNP及InDel數(shù)據(jù),為開發(fā)中國甜柿特異性分子標記、品種早期鑒定和遺傳多樣性分析提供理論基礎(chǔ)。
試驗材料為種植于中國林業(yè)科學(xué)研究院經(jīng)濟林研究所原陽基地(34°55′18″ N~34°56′27″ N,113°46′14″ E~113°47′35″ E)的中國甜柿傳統(tǒng)小果類型種質(zhì)(文中統(tǒng)稱為小果甜柿)。由于中國甜柿自然脫澀時間較晚,根據(jù)Guan等[19]建立的柿不同發(fā)育期描述規(guī)范,分別于果實生長到最終大小的40%階段(07-24,花后70 d)、50%階段(08-24,花后100 d)和70%階段(09-14,花后120 d)及果實成熟期著色階段(10-04,花后140 d)、果實開始成熟階段(10-24,花后160 d)采樣,共采樣5次,最后一次采樣時已完全脫澀。采集大小一致、無機械損傷及病蟲害的柿果,迅速取3個果的赤道部果肉液氮速凍,作為1次生物學(xué)重復(fù),共3次重復(fù)。
使用UNlQ-10柱式Trizol總RNA抽提試劑盒(B511321,上海生工)對小果甜柿各時期果實的總RNA進行提取,用Merinton SMA4000紫外可見微量分光光度計和1.5%瓊脂糖凝膠電泳檢測RNA的質(zhì)量和完整性。
總RNA質(zhì)量檢測合格后,委托北京諾禾致源構(gòu)建cDNA文庫并進行轉(zhuǎn)錄組測序。cDNA文庫質(zhì)檢合格后進行Illumina測序,采用Trinity拼接獲得transcripts,在此基礎(chǔ)上進行Corset層次聚類,挑選其中最長的一條參考序列unigene作為后續(xù)分析用。
采用MISA軟件的默認參數(shù)(https://webblast.ipk-gatersleben.de/misa/)對SSR位點進行搜索,過濾掉單堿基類型SSR重復(fù)數(shù)<10、雙堿基類型重復(fù)數(shù)<6和三、四、五、六堿基類型重復(fù)數(shù)<5的SSR,分析各類型SSR重復(fù)基元的位點數(shù)、出現(xiàn)頻率、平均分布距離及其優(yōu)勢重復(fù)基元、重復(fù)次數(shù)、序列長度的分布特征。用軟件GATK3進行SNP Calling和InDel Calling,過濾掉質(zhì)量值<40和距離<2的SNP及InDel,分析其位點類型、數(shù)量、發(fā)生頻率及位點數(shù)目分布特征。
小果甜柿果實5個發(fā)育時期總RNA在1.5%瓊脂糖凝膠中的電泳結(jié)果如圖1所示,28S及18S條帶明亮且亮度比為2∶1,說明RNA完整性合格;A260/A280均大于1.8(表1),即RNA純度較高;表明RNA完整性、純度及質(zhì)量濃度均滿足轉(zhuǎn)錄組測序要求,可用于后續(xù)試驗。
1-1表示果實第1個發(fā)育期的第1個重復(fù),其他依此類推
表1 小果甜柿果實的RNA純度及質(zhì)量濃度
對小果甜柿果實轉(zhuǎn)錄組測序,將 Trinity 拼接得到的轉(zhuǎn)錄本進行Corset層次聚類,以得到最長的Cluster序列,結(jié)果共獲得85 432條unigenes,含93 435 470個核苷酸,序列長度介于301~16 015 bp,unigenes平均長度為1 094 bp,將拼接轉(zhuǎn)錄本從長到短排序,N50(累計轉(zhuǎn)錄本長度不小于總長50%時的長度)為1 704 bp。運用MISA軟件對全部unigenes進行搜索,發(fā)現(xiàn)有42 427個SSR位點分布于26 928條unigenes上,發(fā)生頻率為31.52%,SSR位點的平均分布密度為0.45個/kb。其中有9 273條unigenes序列中含1個以上SSR位點,1 726條unigenes序列中含有復(fù)合型SSR位點。據(jù)此認為小果甜柿轉(zhuǎn)錄組中的SSR位點分布廣泛、位點豐富。
對小果甜柿轉(zhuǎn)錄組中SSR 位點各堿基重復(fù)基元類型的數(shù)量及比例等進行統(tǒng)計分析,結(jié)果(表2)顯示,SSR重復(fù)基元類型豐富,從單堿基到六堿基重復(fù)均有分布,但不同重復(fù)基元類型的SSR位點數(shù)目有較大差異,表現(xiàn)出隨重復(fù)基元類型的堿基數(shù)增多SSR序列數(shù)量減少的趨勢;以單堿基重復(fù)的SSR位點數(shù)量最多,含18 805個SSR位點;六堿基重復(fù)的SSR位點數(shù)最少,為130個;單堿基和六堿基重復(fù)SSR位點數(shù)分別占轉(zhuǎn)錄組總SSR位點數(shù)的44.32%和0.31%,2種類型在轉(zhuǎn)錄組unigenes中的出現(xiàn)頻率分別為22.01%和0.15%。單堿基重復(fù)的SSR平均分布距離最小,為4.54 bp;而六堿基重復(fù)的SSR平均分布距離最大,高達 657.17 bp。
表2 小果甜柿轉(zhuǎn)錄組中SSR重復(fù)基元類型及其基本統(tǒng)計信息
對小果甜柿轉(zhuǎn)錄組SSR位點基元數(shù)目進行統(tǒng)計,發(fā)現(xiàn)出現(xiàn)頻率最高的5類基元分別為A/T(17 356,占總SSR的比例為40.91%)、AG/CT(10 224,占比24.10%)、AT/AT(4 874,占比11.49%)、AC/GT(2 247,占比5.30%)和AAG/CTT(1 980,占比4.67%)(圖2)。分析不同SSR基序重復(fù)基元類型優(yōu)勢堿基的出現(xiàn)頻數(shù)表明,小果甜柿全部SSR位點共包含159種重復(fù)基元,單堿基重復(fù)至六堿基重復(fù)分別包含2,4,10,28,38和77類基元。其中,單堿基重復(fù)以A/T基元類型占絕對優(yōu)勢;雙堿基重復(fù)的優(yōu)勢基元類型為AG/CT;三堿基重復(fù)的優(yōu)勢基元類型為AAG/CTT;四堿基重復(fù)的優(yōu)勢基元類型為AAAG/CTTT(共123個,占比0.29%);五堿基重復(fù)和六堿基重復(fù)的基元類型較多但數(shù)量少,優(yōu)勢基元類型分別為AAAAG/CTTTT(共27個,占比0.06%)和AAAAAG/CTTTTT(共16個,占比0.04%)。此外,在SSR位點中發(fā)現(xiàn)了101個高等植物中少見的CG/CG重復(fù)基元和331個在雙子葉植物中不常見的CCG/CGG重復(fù)基元,分別占比0.24%和0.78%。
圖2 小果甜柿轉(zhuǎn)錄組中不同重復(fù)基元類型的SSR位點分布
對小果甜柿轉(zhuǎn)錄組不同基元類型的重復(fù)次數(shù)進行分析,結(jié)果如表3所示。由表3可知,從單堿基至六堿基重復(fù)基元的重復(fù)次數(shù)主要集中于5~20次,占總SSR位點總數(shù)的97.82%。單堿基和雙堿基重復(fù)SSR在10次及以上的重復(fù)次數(shù)均有分布,三堿基重復(fù)的SSR主要為5~16次重復(fù),四堿基到六堿基重復(fù)的SSR主要分布在5~8次,并且6種重復(fù)基元類型的SSR數(shù)量均隨著堿基重復(fù)次數(shù)的增大而減小。
表3 小果甜柿轉(zhuǎn)錄組不同重復(fù)基元類型的SSR數(shù)量分布
小果甜柿轉(zhuǎn)錄組中不同SSR 重復(fù)基元類型的序列長度差異較大,介于10~74 bp,平均長度為16.02 bp。SSR序列長度差異最大的為單堿基重復(fù)(10~74 bp),最小的為六堿基重復(fù)(30~54 bp)。如圖3所示,隨著SSR序列長度的增加,SSR數(shù)量呈下降趨勢。以長度為12 bp的SSR數(shù)目最多,為6 007個,占總SSR數(shù)的14.16%;長度為29 bp的SSR數(shù)目最少,為24個,占比0.06%;序列長度<12 bp的SSR位點數(shù)目為8 284個,占比19.52%;序列長度為≥12~<20 bp的SSR位點數(shù)目為24 596個,占比57.97%;序列長度≥20 bp的SSR位點數(shù)目為9 547個,占比22.50%。
圖3 小果甜柿轉(zhuǎn)錄組的SSR長度分布
從小果甜柿轉(zhuǎn)錄組中共獲取了1 070 614個SNP位點,發(fā)生頻率為11.46 kb-1(表4);其中轉(zhuǎn)換類型SNP位點包括C/T(335 486個)和A/G(337 266個),發(fā)生頻率分別為3.59和3.61 kb-1;顛換類型SNP位點包括A/T(114 228個)、A/C(94 711個)、T/G(95 758個)和C/G(93 165個),發(fā)生頻率分別為1.22,1.01,1.02和1.00 kb-1。轉(zhuǎn)換類型SNP的發(fā)生頻率遠高于顛換類型SNP,比值為1.69,其中以C/T最高。共有6 570個unigenes(7.6%)僅包含1個 SNP位點,含有更多SNP位點的unigenes數(shù)量表現(xiàn)出下降趨勢(圖4)。
表4 小果甜柿轉(zhuǎn)錄組中SNP位點的統(tǒng)計分析
在轉(zhuǎn)錄組46 175個unigenes中獲取了167 924個InDel位點,平均0.556 kb即出現(xiàn)1個InDel位點。InDel位點分布與SNP表現(xiàn)出相似的趨勢,即含有1個InDel位點的unigenes數(shù)目最多,為14 139個,占總unigenes數(shù)的16.55%,含有更多InDel位點的unigenes數(shù)量呈下降趨勢(圖4)。
圖4 小果甜柿轉(zhuǎn)錄組中的SNP和InDel位點分布
小果甜柿不同發(fā)育時期的果實轉(zhuǎn)錄組SSR數(shù)目較為豐富,共有42 427個SSR位點分布在26 928條unigenes上,出現(xiàn)頻率為31.52%,高于柿屬植物君遷子(10.41%)[17]。SSR的平均分布距離為0.45個/kb,即平均2.22 kb出現(xiàn)1個SSR位點,分布密度接近柿品種禪寺丸雌雄花芽(0.43個/kb),遠大于君遷子的0.20 個/kb[17]。這可能與分析方法、物種間差異、測序深度、拼接質(zhì)量和MISA軟件參數(shù)設(shè)置等相關(guān)[20]。小果甜柿轉(zhuǎn)錄組中豐富的SSR位點對柿屬植物親緣關(guān)系和遺傳背景的探索具有重要意義。
SSR序列可反映物種進化水平,并對基因功能產(chǎn)生重要的影響[16,21]。本研究中小果甜柿果實轉(zhuǎn)錄組SSR種類豐富,以單堿基至三堿基為主。單堿基重復(fù)為小果甜柿的優(yōu)勢重復(fù)基元,其數(shù)量占總SSR位點的44.32%,與已報道的禪寺丸柿[16]、黑果枸杞[22]和紅松[23]等一致。SSR重復(fù)基元的種類及數(shù)量多,可在一定程度上反映該物種進化水平較高[24-25]。小果甜柿的SSR位點中單堿基至三堿基中優(yōu)勢堿基重復(fù)基元出現(xiàn)頻率最高的分別為A/T、AG/CT和AAG/CTT,與君遷子和禪寺丸柿一致,與其他植物如冬瓜[26]也一致,但與苦楝[27]和大花序桉[28]分別在二和三堿基重復(fù)的優(yōu)勢堿基不一致,這可能與物種特異性或搜索條件有關(guān)[16,29]。此外,在小果甜柿SSR位點中發(fā)現(xiàn)了101個高等植物中少見的 CG/CG 重復(fù)基元,其數(shù)量遠高于黑果枸杞[22](5個)、杜仲[29](1個)和短絲木犀[30](13個)。還發(fā)現(xiàn)了331個單子葉植物常見而雙子葉植物中不常見的 CCG/CGG 重復(fù)基元,這些重復(fù)基元的出現(xiàn)可能具有代謝調(diào)控、抗逆性和信號轉(zhuǎn)導(dǎo)等生理功能。
多態(tài)性是SSR的一個重要考察指標[31]。SSR基元重復(fù)次數(shù)與序列長度影響SSR位點的多態(tài)性,長度≥20 bp時,多態(tài)性較高[32]。本研究中,小果甜柿SSR序列長度介于10~74 bp,其中序列長度為12~20 bp的SSR數(shù)量最多,占比57.97%。單堿基和雙堿基類型基元的重復(fù)次數(shù)最多,可能具有更高的多態(tài)性。序列長度≥20 bp的SSR位點有9 547個,占比22.50%,高于禪寺丸柿[16],這類SSR位點具有潛在較高的多態(tài)性,在后續(xù)鑒別中國甜柿的SSR分子標記開發(fā)中具有較大的應(yīng)用潛力。
SNP和Indel位點在基因組中分布廣泛[33]。本研究從小果甜柿轉(zhuǎn)錄組中共檢測到1 070 614個SNP位點,平均每kb出現(xiàn)11.46個SNP位點;還檢測到了167 924個InDel位點,平均0.556 kb出現(xiàn)1個InDel位點。轉(zhuǎn)換和顛換的SNP位點比例理論上應(yīng)為0.5,而本研究中轉(zhuǎn)換類型與顛換類型SNP比值為1.69,這種現(xiàn)象叫做轉(zhuǎn)換偏差,最先在水稻[34]中有相關(guān)報道。出現(xiàn)這一現(xiàn)象可能與進化過程中的選擇相關(guān),表明轉(zhuǎn)換可能并非隨機出現(xiàn)的[35]。
柿樹童期較長,水肥條件適宜的條件下,最快3年才能夠開花結(jié)實,本研究利用不同發(fā)育時期小果甜柿果實轉(zhuǎn)錄組數(shù)據(jù)分析了SSR、SNP和InDel位點及其特征,為后續(xù)中國甜柿特異性分子標記的開發(fā)提供了數(shù)據(jù)及理論基礎(chǔ),對中國甜柿及其雜交后代的早期鑒別具有重要意義。