国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

文冠果果實(shí)轉(zhuǎn)錄組測序及分析

2019-07-26 09:10趙陽陽郭雨瀟張凌云
生物技術(shù)通報(bào) 2019年6期
關(guān)鍵詞:文冠果堿基核苷酸

趙陽陽 郭雨瀟 張凌云

(北京林業(yè)大學(xué) 森林培育與保護(hù)教育部重點(diǎn)實(shí)驗(yàn)室,北京 100083)

文冠果(Xanthoceras sorbifoliaBunge)又名文冠花、文光花、僧燈毛道,隸屬無患子科(Sapindaceae)文冠果屬(XanthocerasBunge),單屬單種。一般為亞喬木或大灌木,遍布華北、華東及西北地區(qū)[1-2]。文冠果具有較強(qiáng)的適應(yīng)性和抗逆能力,種子營養(yǎng)豐富、種仁含油率高,是一種珍貴的木本油料植物,有北方油茶之稱,具有巨大的發(fā)展?jié)摿Γ?]。目前對(duì)于文冠果的研究多集中在生長發(fā)育[4-6]、栽培管理[7-8]、油脂組成及提?。?,5,9-11]、生物柴油制備[12-13]和常規(guī)育種[14]等方面,也有一些基因克隆和功能分析[15-19],關(guān)于果實(shí)生長發(fā)育過程中的分子機(jī)理研究很少。

轉(zhuǎn)錄組測序研究能夠從整體水平研究基因功能與基因結(jié)構(gòu)并揭示特定生物學(xué)過程的分子機(jī)理,廣泛應(yīng)用于分析生物和醫(yī)學(xué)研究等領(lǐng)域[20]。近年來,隨著高通量測序技術(shù)發(fā)展,測序時(shí)間和成本顯著降低,很多模式和非模式植物完成了轉(zhuǎn)錄組測序,文冠果的轉(zhuǎn)錄組測序也取得了很大進(jìn)展。Liu 等[21]對(duì)文冠果芽、花、葉和種子的混合樣進(jìn)行高通量轉(zhuǎn)錄組測序,構(gòu)建了文冠果參考轉(zhuǎn)錄組。敖妍等[22]應(yīng)用Illumina Hi-seqTM2000高通量測序技術(shù)對(duì)文冠果花芽進(jìn)行了轉(zhuǎn)錄組分析來解析文冠果花芽形態(tài)分化的分子調(diào)控模式與機(jī)制。劉玉林等[23]在對(duì)7個(gè)省份16份文冠果葉片進(jìn)行轉(zhuǎn)錄組測序的基礎(chǔ)上分析和篩選了轉(zhuǎn)錄組序列中的SSR標(biāo)記,并設(shè)計(jì)開發(fā)ESTSSR標(biāo)記,為文冠果的遺傳多樣性分析提供標(biāo)記資源。申展等[24]運(yùn)用SSR標(biāo)記的方法,研究了全國14個(gè)地區(qū)具有代表性的138份文冠果種質(zhì)資源的遺傳多樣性,并逐步構(gòu)建出25份文冠果核心種質(zhì)。文冠果果實(shí)為主要收獲部位,果實(shí)發(fā)育和營養(yǎng)物質(zhì)積累決定了產(chǎn)量和經(jīng)濟(jì)效益,是文冠果研究的重點(diǎn),而文冠果果實(shí)發(fā)育過程分子機(jī)理尚不清楚。

本研究利用Illumina Hi-seqTM2000高通量測序平臺(tái)對(duì)兩個(gè)發(fā)育時(shí)期的文冠果果實(shí)進(jìn)行轉(zhuǎn)錄組測序,可以全面了解文冠果果實(shí)基因表達(dá)情況,獲得大量基因序列,同時(shí)可以開發(fā)SSR分子標(biāo)記,為后期文冠果品種鑒定和分子育種提供依據(jù)。

1 材料與方法

1.1 材料

文冠果果實(shí)采集于北京市圓明園內(nèi)長勢良好,無病蟲害的20年生實(shí)生樹。通過物候觀察,樣品采集時(shí)間分別為2017年盛花后20 d(1號(hào)樣)和60 d(2號(hào)樣),分別在樹體東南西北不同方位各采集3個(gè)果實(shí),混勻,然后立即放入液氮中帶回實(shí)驗(yàn)室,-80℃保存?zhèn)溆谩?/p>

1.2 方法

1.2.1 RNA提取與文庫構(gòu)建 兩個(gè)時(shí)期樣品均混合12個(gè)果實(shí)提取RNA來建庫測序,以消除個(gè)體誤差。總RNA提取采用植物總RNA提取試劑盒(Omega,美國),NanoDropTM2000 分光光度計(jì)(Thermo Fisher,美國)和瓊脂糖凝膠電泳檢測RNA的純度、濃度和完整性。檢驗(yàn)合格的文冠果果實(shí)總RNA,用帶有Oligo(dT)的磁珠富集mRNA,加入Fragmentation Buffer 使其成為短片段,用六堿基隨機(jī)引物(random hexamers)合成cDNA第1鏈,然后加入緩沖液、dNTAs、RNase H和DNA polymerase I合成cDNA第二鏈;再經(jīng)過QiuQuick PCR試劑盒(QIAGEN,德國)純化并加 EB 緩沖液洗脫之后做末端修復(fù)、加poly(A)并加測序接頭,再經(jīng)瓊脂糖凝膠電泳回收目的片段,最后進(jìn)行PCR擴(kuò)增構(gòu)建測序文庫。

1.2.2 轉(zhuǎn)錄組測序與組裝 利用Illumina HiseqTM2000對(duì)文冠果果實(shí)測序文庫進(jìn)行高通量測序。測序儀產(chǎn)生的原始圖像數(shù)據(jù)經(jīng) base calling 轉(zhuǎn)化為序列數(shù)據(jù)raw reads,經(jīng)過平臺(tái)過濾除雜和冗余去除后得到高質(zhì)量的clean reads,然后使用短reads 組裝軟件Trinity做轉(zhuǎn)錄組de novo組裝獲得Unigene。

1.2.3 Unigene功能注釋 使用BLAST 軟件將Unigene序列與NR(非冗余蛋白數(shù)據(jù)庫)、Swiss-Prot(蛋白質(zhì)序列數(shù)據(jù)庫)、GO(基因本體論數(shù)據(jù)庫)、COG/KOG(蛋白質(zhì)原核/真核同源數(shù)據(jù)庫)、eggNOG(直系同源蛋白數(shù)據(jù)庫)、KEGG(京都基因與基因組百科全書)數(shù)據(jù)庫對(duì)比,使用KOBAS2.0得到Unigene在KEGG中的KEGG Orthology結(jié)果,預(yù)測完Unigene的氨基酸序列之后使用HMMER軟件與Pfam(蛋白質(zhì)家族域數(shù)據(jù)庫)數(shù)據(jù)庫對(duì)比,獲得Unigene的注釋信息。

1.2.4 SSRs(Simple Sequence Repeats) 檢 索 與 分析 利用MISA軟件檢測文冠果果實(shí)轉(zhuǎn)錄組Unigene,搜索其中的SSRs并進(jìn)行統(tǒng)計(jì)分析。

2 結(jié)果

2.1 測序結(jié)果及從頭組裝

堿基質(zhì)量值(Quality score)是堿基識(shí)別(Base calling)出錯(cuò)的概率的整體映射。堿基質(zhì)量值越高表面堿基識(shí)別越可靠。文冠果果實(shí)發(fā)育早期樣本測得的Q30堿為89.51%,測得序列的GC含量占44.62%;發(fā)育后期樣本測得的Q30堿基百分比為89.60%,測得序列的GC含量占44.61%。經(jīng)過測序質(zhì)量控制,共得到42 545 764個(gè)序列讀取片段(Reads):其中包含了12.74 Gb核苷酸序列信息,各樣品Q30堿基百分比均不小于89.51%,說明轉(zhuǎn)錄組測序質(zhì)量較高,可以進(jìn)行下一步的數(shù)據(jù)組裝。

測序數(shù)據(jù)組裝共獲得157 244個(gè)轉(zhuǎn)錄本,序列信息達(dá)261 799 238 bp,N50為2 693 bp,平均長度為1 664.92 bp。所得轉(zhuǎn)錄本序列進(jìn)一步組裝得到68 298個(gè)單基因簇(Unigene),序列信息總長度為59 281 489 bp,N50為 1 589 bp, 平 均 長 度 為867.98 bp。其中長度在300-500 bp的Unigene占比最高,為21.15%,長度在1 kb以上的Unigene占比24.49%(表1)。組裝完整性較高,可用于后續(xù)的注釋分析。

表1 文冠果果實(shí)轉(zhuǎn)錄組數(shù)據(jù)組裝結(jié)果

2.2 功能基因注釋

利用BLAST軟件將獲得的Unigene數(shù)據(jù)信息分別在 Nr、Swiss-Prot、Pfam、GO、KOG和 KEGG數(shù)據(jù)庫比對(duì),對(duì)所有注釋上的Unigene數(shù)目進(jìn)行分析統(tǒng)計(jì)。結(jié)果(表2)表明文冠果果實(shí)兩個(gè)樣本共包含68 298個(gè)Unigene,其中24 691個(gè)Unigene得到注釋,43 607個(gè)Unigene未得到注釋,獲得注釋的Unigene占總Unigene的36.15%。在注釋的Unigene中,Nr數(shù)據(jù)庫注釋的Unigene最多,達(dá)到24 059個(gè);COG數(shù)據(jù)庫注釋的Unigene最少,僅有7 483個(gè)。注釋到長度300≤ 長度< 1 000 Unigene數(shù)為7 724個(gè),其中注釋到Nr數(shù)據(jù)庫300≤長度< 1 000的最多,達(dá)到7 425個(gè);注釋到COG數(shù)據(jù)庫300≤長度< 1 000 Unigene數(shù)最少,有1 544個(gè)。注釋到長度≥ 1 000個(gè)堿基的Unigene數(shù)為13 924個(gè),其中注釋到Nr數(shù)據(jù)庫長度≥ 1 000 Unigene數(shù)最多,達(dá)到13 892個(gè)。

表2 文冠果果實(shí)基因的BLAST比對(duì)結(jié)果

根據(jù)Nr數(shù)據(jù)庫注釋顯示,Unigene注釋同源基因的物種分布圖如圖1所示,甜橙Citrus sinensis的同源序列最多,達(dá)7 131條,占注釋序列總數(shù)的29.65%,其次是克萊門柚Citrus clementina,匹配同源序列4 950條,占總注釋序列的20.58%,兩個(gè)物種所匹配的同源序列占總注釋序列的一半。其次匹配較高的分別是可可Theobroma cacao(1 916條,7.97%)、 葡 萄Vitis vinifera(1 539條,6.40%)、稻Oryza sativa(700條,2.91%)、毛果楊Populus trichocarpa(686,2.85%)、麻風(fēng)樹Jatropha curcas(662,2.75%)、蓖麻Ricinus communis(595,2.47%)、胡楊Populus euphratica(457,1.90%)、桃Prunus persica(377,1.57%)和其他物種(5 039,20.95%)。

圖1 文冠果果實(shí)轉(zhuǎn)錄組Unigene與Nr數(shù)據(jù)庫匹配物種分布

為了進(jìn)一步揭示文冠果果實(shí)轉(zhuǎn)錄組Unigene的功能分類,根據(jù)Nr數(shù)據(jù)庫注釋得到的信息,通過GO數(shù)據(jù)庫,對(duì)文冠果果實(shí)轉(zhuǎn)錄組Unigene進(jìn)行基因生物學(xué)特征功能分類。結(jié)果(圖2)顯示,GO數(shù)據(jù)庫注釋的14 766個(gè)文冠果果實(shí)轉(zhuǎn)錄組Unigene可分為細(xì)胞組分(Cellular component)、分子功能(Molecular function)和生物過程(Biological process)等3個(gè)GO類別的54個(gè)小組。細(xì)胞組分涉及28 681個(gè)GO條目,分為17個(gè)功能組,其中細(xì)胞(6 588個(gè))、細(xì)胞部分(6 588個(gè))和細(xì)胞器(5 044個(gè))涉及的Unigene較多;分子功能涉及18 283個(gè)GO條目,分為17個(gè)功能組,其中催化活性(7 790個(gè))和結(jié)合活性(7 637個(gè))含Unigene較多;41 373個(gè)GO條目歸屬于生物過程,分為20個(gè)功能組,其中代謝過程(10 120個(gè))、細(xì)胞進(jìn)程(8 512個(gè))和單一生物體過程(7 194個(gè))涉及的Unigene較多。

圖2 文冠果果實(shí)轉(zhuǎn)錄組Unigene的GO功能分類圖

為了進(jìn)一步分析文冠果果實(shí)轉(zhuǎn)錄組Unigene的功能,進(jìn)行了KOG功能分類分析,結(jié)果如圖3所示,共獲得25個(gè)不同的功能分類,比較全面,包含了大多數(shù)的生命活動(dòng)。其中,一般功能預(yù)測(General function prediction only)的基因數(shù)量最多3 998條(25.32%),是最大的功能類群,其次是翻譯后修飾、蛋白質(zhì)翻轉(zhuǎn)和分子伴侶(Posttranslational modification,protein turnover,chaperones)1 387條(8.62%),信號(hào)轉(zhuǎn)導(dǎo)類機(jī)制(Signal transduction mechanisms) 次 之, 由 1 254條(8.17%), 碳 水化合物轉(zhuǎn)運(yùn)與代謝(Carbohydrate transport and metabolism)也有870條(5.41%),另外劃分到脂類轉(zhuǎn)運(yùn)與代謝(Lipid transport and metabolism)這一功能類別的有560條(3.61%),其他功能分類的基因數(shù)量不盡相同。

以KEGG數(shù)據(jù)庫為依據(jù),將8 284個(gè)文冠果果實(shí)轉(zhuǎn)錄組Unigene分為127個(gè)代謝通路(表3)。核糖體(445個(gè))、碳代謝(320個(gè))、氨基酸的生物合成(288個(gè))、內(nèi)質(zhì)網(wǎng)上蛋白質(zhì)處理(240個(gè))和植物激素信號(hào)轉(zhuǎn)導(dǎo)(221個(gè))等代謝通路涉及的Unigene較多。此外,淀粉和糖代謝通路涉及200個(gè)Unigene,脂肪酸代謝通路有81個(gè),脂肪酸生物合成、不飽和脂肪酸的生物合成和脂肪酸延長分別涉及40、40和30個(gè)Unigene。

圖3 文冠果果實(shí)轉(zhuǎn)錄組Unigene的KOG注釋分析

2.3 轉(zhuǎn)錄組SSRs特征分布

利用MISA軟件對(duì)篩選得到的1 kb以上的Unigene做SSR分析,結(jié)果如表4所示:共發(fā)現(xiàn)SSR位點(diǎn)11 732個(gè)。其中,單核苷酸SSR最豐富,有7 139個(gè),遠(yuǎn)遠(yuǎn)超過其他種類SSR,占全部SSR的60.85%,平均長度最短,為12.46 bp;二核苷酸SSR(2 655個(gè))和三核苷酸SSR(1 854個(gè))分別占總SSR的22.63%和15.8%,平均長度分別為15.47 bp和16.53 bp;四核苷酸SSR(63)、五核苷酸SSR(11)和六核苷酸SSR(10)很少,三者之和不到總SSR的1%,其平均長度較長,六核苷酸SSR的平均長度達(dá)到43.2 bp。

3 討論

文冠果適應(yīng)性廣,抗逆性強(qiáng),含油率高,是我國重點(diǎn)發(fā)展的木本油料樹種,具有巨大的發(fā)展?jié)摿Γ?5-27]。目前關(guān)于文冠果的研究主要集中在生長發(fā)育[4-6]、栽培管理[7-8]、油脂組成及提取[3,5,9-11]、生物柴油制備[12-13]和常規(guī)育種[14]等方面,分子生物學(xué)方面的研究較少,果實(shí)發(fā)育過程中的基因表達(dá)情況尚不清楚。第二代高通量測序技術(shù)因測序時(shí)間短、成本低和數(shù)據(jù)量大的優(yōu)點(diǎn)近年來被廣泛應(yīng)用于組學(xué)研究中。本研究利用高通量測序技術(shù)得到了文冠果果實(shí)的轉(zhuǎn)錄組數(shù)據(jù),共獲得12.74Gb Clean Data,各樣品Clean Data均達(dá)到6.31Gb,Q30堿基百分比在89.51%及以上,測序質(zhì)量較高。組裝后獲得了68 298個(gè)Unigene序列,其中長度在1 kb以上的Unigene有16 724條,組裝完整性良好。

Nr數(shù)據(jù)庫注釋結(jié)果顯示,由于缺少文冠果基因組和轉(zhuǎn)錄組,大量Unigene未獲得注釋,其中僅有24 691個(gè)Unigene得到注釋,占36.15%。這與松蘿鳳梨[28]、白鮮根[29]等已報(bào)道物種轉(zhuǎn)錄組測序注釋結(jié)果相似,說明文冠果果實(shí)轉(zhuǎn)錄組有大量序列需要深入挖掘。與甜橙Citrus sinensis的同源序列最多,達(dá)7 131條,占注釋序列總數(shù)的29.65%,其次是克萊門柚Citrus clementina,匹配同源序列4950條,占總注釋序列的20.58%,兩個(gè)物種所匹配的同源序列占總注釋序列的一半。

表3 文冠果果實(shí)轉(zhuǎn)錄組Unigene的KEGG注釋

通過GO數(shù)據(jù)庫對(duì)文冠果果實(shí)轉(zhuǎn)錄組Unigene進(jìn)行基因生物學(xué)特征功能分類,代謝過程(10 120個(gè))、細(xì)胞進(jìn)程(8 512個(gè))、催化活性(7 790個(gè))和結(jié)合活性(7 637個(gè))等含Unigene較多,總體來說,文冠果果實(shí)在細(xì)胞活動(dòng)、代謝活動(dòng)的基因表達(dá)豐度較高,表明文冠果果實(shí)自身具有較強(qiáng)的代謝能力。

續(xù)表

表4 文冠果果實(shí)轉(zhuǎn)錄組SSR分布特征

通過KOG數(shù)據(jù)庫注釋共獲得25個(gè)不同的功能分類,比較全面,包含了大多數(shù)的生命活動(dòng),文冠果果實(shí)轉(zhuǎn)錄組中Unigene主要涉及基因表達(dá)、蛋白質(zhì)合成和物質(zhì)代謝等功能分類,符合文冠果果實(shí)作為強(qiáng)“庫”器官積累營養(yǎng)物質(zhì)這一基本功能。

以KEGG數(shù)據(jù)庫為依據(jù),將8 284個(gè)文冠果果實(shí)轉(zhuǎn)錄組Unigene分為127個(gè)代謝通路,與Liu等[21]和敖妍等[22]研究結(jié)果不同,推測可能是由于取材不同造成的。本研究樣品為文冠果果實(shí),而Liu等測序樣品為文冠果芽、花、葉和種子的混合樣,敖妍等以文冠果花芽為材料。本研究分離了大量涉及淀粉和糖代謝、脂肪酸代謝、脂肪酸生物合成、不飽和脂肪酸的生物合成和脂肪酸延長等通路相關(guān)基因,為后期研究文冠果果實(shí)生長發(fā)育和營養(yǎng)物質(zhì)積累奠定基礎(chǔ)。

目前限制文冠果產(chǎn)業(yè)發(fā)展的一大因素就是種質(zhì)資源混亂,缺少優(yōu)良品種,僅利用外部形態(tài)學(xué)特征很難做到精細(xì)區(qū)分。轉(zhuǎn)錄組數(shù)據(jù)除了用于基因挖掘及表達(dá)調(diào)控研究外,可以開發(fā)大量EST-SSR分子標(biāo)記。SSR標(biāo)記是近年來發(fā)展起來的一種以特異引物PCR為基礎(chǔ)的分子標(biāo)記技術(shù),廣泛用于遺傳圖譜的構(gòu)建、目標(biāo)基因的標(biāo)定、指紋圖譜的繪制等研究中[20]。利用MISA軟件對(duì)篩選得到的1kb以上的Unigene做SSR分析,共發(fā)現(xiàn)SSR位點(diǎn)11 732個(gè),遠(yuǎn)遠(yuǎn)高于劉玉林等[23]和申展等[24]研究結(jié)果中的SSR位點(diǎn),分析是取材不同造成的結(jié)果差異。后期會(huì)將實(shí)驗(yàn)結(jié)果與之進(jìn)行比對(duì),篩選驗(yàn)證開發(fā)出更可靠的SSR位點(diǎn),用于文冠果種質(zhì)資源分類和優(yōu)良品種培育。

4 結(jié)論

本研究利用Illumina Hi-seqTM2000高通量測序平臺(tái)對(duì)兩個(gè)發(fā)育時(shí)期的文冠果果實(shí)進(jìn)行轉(zhuǎn)錄組測序,共獲得68 298個(gè)Unigene序列,共有24 691個(gè)Unigene得到注釋,占36.15%;GO數(shù)據(jù)庫注釋顯示14 766條Unigene分為細(xì)胞組分、分子功能及生物學(xué)過程3大類54個(gè)功能組;KOG數(shù)據(jù)庫中注釋到的13 994條Unigene功能系統(tǒng)分為25類;以KEGG代謝途徑數(shù)據(jù)庫為依據(jù),可將8 284個(gè)文冠果果實(shí)轉(zhuǎn)錄組Unigene分為127個(gè)代謝通路,可以全面了解文冠果果實(shí)的代謝途徑信息;在文冠果果實(shí)轉(zhuǎn)錄組中發(fā)現(xiàn)11 732個(gè)SSR位點(diǎn),最多的為單核苷酸SSR,占60.85%。

猜你喜歡
文冠果堿基核苷酸
單核苷酸多態(tài)性與中醫(yī)證候相關(guān)性研究進(jìn)展
徐長風(fēng):核苷酸類似物的副作用
應(yīng)用思維進(jìn)階構(gòu)建模型 例談培養(yǎng)學(xué)生創(chuàng)造性思維
基于層積的文冠果種子破除休眠研究
中國科學(xué)家創(chuàng)建出新型糖基化酶堿基編輯器
Acknowledgment to reviewers—November 2018 to September 2019
冷、熱榨文冠果油品質(zhì)比較分析
生命“字母表”迎來新成員
生命“字母表”迎來4名新成員
日糧核苷酸對(duì)動(dòng)物腸道健康和免疫功能的影響及其在養(yǎng)豬生產(chǎn)中的應(yīng)用