袁衛(wèi)東,陸 娜,陳 青,宋吉玲,王偉科
(1.杭州市農(nóng)業(yè)科學(xué)研究院,杭州 310024;2.浙江省農(nóng)業(yè)技術(shù)推廣中心,杭州 310020)
灰樹花(Grifola frondosa,maitake)是一種食、藥兼用的珍稀蕈菌[1],野生灰樹花常生長于栗樹周邊,俗稱“栗蘑”.子實體香氣宜人,口感嫩脆鮮美;同時藥用價值極高,主要用于消化道、乳腺及前列腺等癌癥的治療,此外也用于血管硬化、血壓增高及心臟等疾病的治療,因此具有良好的開發(fā)前景[2].
選育出優(yōu)質(zhì)、高產(chǎn)、抗逆性強的灰樹花品種,提高其經(jīng)濟效益,一直是灰樹花遺傳育種工作研究的重點[3].轉(zhuǎn)錄組學(xué)研究作為一種快速、高通量、全面解讀食用真菌的全新技術(shù)手段,已經(jīng)被越來越廣泛地應(yīng)用于食用菌的遺傳育種工作中[4].食用菌轉(zhuǎn)錄組的研究,可從整體水平上發(fā)掘食用菌藥用成分生物合成途徑中的關(guān)鍵基因,確定有效藥用活性成分的合成途徑及其調(diào)控機制,為食用菌功能基因的挖掘、品種鑒定、資源保護和種質(zhì)繁育提供新的思路和方法[5].
我們通過對灰樹花子實體轉(zhuǎn)錄組的測序研究,篩選出灰樹花子實體成熟期特異表達(dá)基因,并對這些表達(dá)的基因進(jìn)行生物信息學(xué)分析,旨在發(fā)現(xiàn)灰樹花子實體生長過程中的相關(guān)基因,為通過基因工程培育優(yōu)質(zhì)、高產(chǎn)的灰樹花新品種提供理論基礎(chǔ).
供試菌株為灰樹花小黑汀,引自山東泰安.菌絲長滿菌包后移入出菇大棚培養(yǎng)7~10d,待菌絲扭結(jié)形成原基后25d左右形成成熟的灰樹花子實體,收集成熟的子實體樣品.
1.2.1 灰樹花子實體總RNA 提取及測序
用TRIzol法提取灰樹花子實體總RNA,并用RNAeasy plant mini kit對提取的總RNA進(jìn)行純化,70℃變性2min后,NanoDrop ND-2000檢測其濃度、瓊脂糖凝膠電泳分析RNA 的完整性[6].檢測合格的RNA 用于mRNA的富集及cDNA的合成.用Ultra RNA Library Prep Kit for Illumina進(jìn)行文庫構(gòu)建,純化后Agilent High Sensitivity DNA Kit檢測文庫插入片段大小,定量后Illumina HiSeqTM2000對建好的測序文庫進(jìn)行測序[7].
1.2.2 測序數(shù)據(jù)分析
使用Trinity(版本r20131110,默認(rèn)參數(shù))對RNA-seq的原始reads數(shù)據(jù)進(jìn)行拼接,最短contig長度為200.對Trinity拼接結(jié)果使用Cap3進(jìn)行進(jìn)一步拼接獲得Unigene[8].
1.2.3 Unigene的NR 數(shù)據(jù)庫比對分析
利用Blast進(jìn)行Unigene的NR 數(shù)據(jù)庫物種分布比對分析[9],統(tǒng)計Blast結(jié)果中每個能比對上的物種所對應(yīng)的Unigene數(shù)目,按該數(shù)目從高到低進(jìn)行排序,選取數(shù)目較高的前10個物種,其他比對上的物種對應(yīng)的Unigene數(shù)目相加作為others,沒有比對上的物種的Unigene數(shù)目相加則是unmatched.
1.2.4 Unigene的GO 分類
根據(jù)NR 注釋信息,對Unigene進(jìn)行GO 注釋[10](Blast2GO),得到每個Unigene的GO 注釋.并對所有Unigene做GO 功能分類統(tǒng)計(WEGO),從細(xì)胞組成、分子功能及生物過程(biological process)三方面認(rèn)識灰樹花的基因功能分布特征.
1.2.5 Unigene的COG 功能注釋
將Unigene和COG 數(shù)據(jù)庫(http:∥www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi)比對分析,預(yù)測Unigene功能并對其分類統(tǒng)計,這有利于我們進(jìn)一步了解灰樹花各Unigene的生物學(xué)功能.
1.2.6 Unigene的代謝通路分析
使用http:∥www.genome.jp/tools/kaas/對Unigene進(jìn)行KEGG 注釋,以便于進(jìn)一步研究灰樹花基因在生物學(xué)上的復(fù)雜行為,系統(tǒng)分析其基因在細(xì)胞中的代謝通路及功能.
1.2.7 Unigene的SSR 信息分析
對拼接得到Unigene進(jìn)行SSR 簡單重復(fù)序列的查找.篩選標(biāo)準(zhǔn):單核苷酸重復(fù)的次數(shù)在10次或10次以上,二核苷酸重復(fù)的次數(shù)在6次或6次以上,三至六核苷酸重復(fù)的次數(shù)在5次或5次以上.同時,也篩選中間被少數(shù)堿基(間隔小于100或等于100)打斷的不完全重復(fù)的SSR.利用MISA(http:∥pgrc.ipkgatersleben.de/misa/)工具提供批量識別和定位簡單重復(fù)序列(SSR).
灰樹花子實體RNA 經(jīng)過NanoDrop定量后,獲得濃度為381.1ng/μL 的總RNA,260/280為2.12.完整性及28S∶18S(圖1)均符合轉(zhuǎn)錄組測序質(zhì)量要求,進(jìn)入下一步實驗.利用Trinity對RNA-seq的原始reads數(shù)據(jù)進(jìn)行拼接,獲得的contig進(jìn)一步拼接獲得Unigene.最終,我們獲得63 137個Unigene,資料組總長度155 171 094nt,最長Unigene 20 996nt,最短Unigene 201nt,平均組裝長度為2 457.689nt,(G+C)/(A+T+G+C)為0.522,N50為3 405nt,N90為1 390nt.
圖1 灰樹花子實體RNA 電泳檢測Fig.1 The electrophoresis detection of maitake RNA
圖2 Unigene長度分布統(tǒng)計Fig.2 Length distribution of maitake Unigene
從Unigene的長度分布來看,Unigene主要集中在1 500~10 000nt之間(圖2).在2 000~3 000nt之間的Unigene數(shù)量最多為13 135個,占總數(shù)的20.8%;1 500~2 000nt之間Unigene數(shù)為8 979,占總數(shù)的14.2%;3 000~4 000nt之間Unigene數(shù)為7 429,占11.76%.
將Unigene序列和NR 數(shù)據(jù)庫進(jìn)行Blast(參數(shù)為1.0×10-5)比對分析,能比對上的Unigene個數(shù)為46 640 個,占總的Unigene數(shù)目的百分比為73.87%.按物種分布統(tǒng)計,能比對上的物種所對應(yīng)的Unigene數(shù)目最多的是變色栓菌,比對上的Unigene數(shù)為14 593 個,占31.29%,其次為木質(zhì)素降解菌,比對上的Unigene數(shù)為9 220個,占19.77%(表1).
表1 灰樹花Unigene的NR 數(shù)據(jù)庫比對分析Tab.1 Blast results of maitake Unigene via NR
對Unigene進(jìn)行GO 注釋和GO 功能分類.最終(圖3),在細(xì)胞組成(Cellular component)、分子功能(Molecular function)、生物過程(Biological process)3 個本體中,分別獲得9,12,14個注釋條目(Class)數(shù).注釋到的Unigene數(shù)量最多的是生物過程本體,注釋到的Unigene數(shù)最少的是細(xì)胞成分本體.
圖3 灰樹花Unigene的GO 分類Fig.3 Gene ontology classifications of maitake Unigene
將所測物種的最佳蛋白序列提交到NCBI上(COG-4873PSSMs,E-value 0.01,Maximum number of hits 500),得到與Unigene編號相對應(yīng)的COG 編號,統(tǒng)計COG 每個類別Unigene數(shù)目.從基因數(shù)量分布來看(圖4),分類最多的是功能預(yù)測蛋白,其他較多的分類與基因的功能與糖轉(zhuǎn)運與代謝、脂質(zhì)轉(zhuǎn)運與代謝、氨基酸轉(zhuǎn)運和代謝、翻譯后修飾、蛋白轉(zhuǎn)換、分子伴侶有關(guān).
圖4 灰樹花Unigene的COG 分類Fig.4 COG functional classifications of maitake Unigene
KEGG 數(shù)據(jù)庫(http:∥www.genome.jp/kegg/)可系統(tǒng)分析其基因在細(xì)胞中的代謝通路及功能.通過KEGG 注釋,共有27 472 個Unigene被注釋,被Unigene注釋到的代謝通路有239個,注釋最多的代謝通路與生化代謝、微生物代謝、次生代謝產(chǎn)物生物合成、嘌呤代謝、RNA 運輸?shù)扔嘘P(guān)(表2,注釋到基因數(shù)前10位代謝通路).
表2 KEGG 注釋比例最多的前10位代謝通路Tab.2 The top 10pathways annotated by KEGG
從灰樹花63 137個Unigene中查找到5 294個SSR位點,占Unigene總數(shù)的比例為8.38%(表3).SSR 存在較為豐富的類型,包括單核苷酸重復(fù)類型至六核苷酸重復(fù)類型均有表現(xiàn)(表4).其中,單核苷酸重復(fù)所占比例最高,達(dá)到63.4%,其次是三核苷酸重復(fù),為24.44%,雙核苷酸重復(fù),比例為8.76%;比例最低的是六核苷酸重復(fù),僅為0.11%,四核苷酸重復(fù)和五核苷酸重復(fù)基本相同,分別為1.81%和1.42%.在檢出的SSR 中,出現(xiàn)頻率最高的重復(fù)基元為A/T(占56.10%),其次為CCG/CGG(6.18%),AG/CT(3.29%),ACAGG/CCTGT(1.28%),AATG/ATTC(0.62%),AACAGC/CTGTTG(0.11%).上述SSR 特征分析,有助于開展灰樹花及其同屬物種的基因組差異分析、通用性標(biāo)記開發(fā)和遺傳圖譜構(gòu)建研究.
表3 灰樹花的SSR 信息分析Tab.3 General statistics of maitake SSR search
表4 灰樹花SSR 基序重復(fù)類型統(tǒng)計Tab.4 Statistics of repeat type of maitake SSR motif
對灰樹花全基因組而言,其轉(zhuǎn)錄組序列不含內(nèi)含子及其它非編碼序列,能更高效的挖掘有用信息,在序列分析方面具有性價比高的優(yōu)勢.轉(zhuǎn)錄組研究可識別灰樹花子實體總轉(zhuǎn)錄本的表達(dá),從而了解灰樹花子實體完整的基因表達(dá)譜,為灰樹花具有生物功能的“蛋白質(zhì)組”研究的必然紐帶.基于灰樹花總轉(zhuǎn)錄水平的研究是目前研究最廣泛的調(diào)控研究方式[11].
本研究構(gòu)建了第一個高質(zhì)量灰樹花cDNA 文庫,首次采用了Illumina高通量測序技術(shù)對文庫進(jìn)行了測序,序列拼接后得到63 137個Unigene.將Unigene序列和NR 數(shù)據(jù)庫進(jìn)行Blast比對分析,能比對上的Unigene占總Unigene數(shù)的73.87%.COG 分類顯示,最多一類基因是功能預(yù)測蛋白,其他較多基因功能與糖轉(zhuǎn)運與代謝、脂質(zhì)轉(zhuǎn)運與代謝、氨基酸轉(zhuǎn)運和代謝、翻譯后修飾、蛋白轉(zhuǎn)換、分子伴侶有關(guān).該結(jié)果顯示,利用高通量測序不僅可監(jiān)測灰樹花特定時間段的基因表達(dá),更可大量挖掘其代謝過程中的重要基因.
根據(jù)KEGG 代謝通路數(shù)據(jù)庫,對所得灰樹花轉(zhuǎn)錄組的Unigene進(jìn)行代謝通路注釋和預(yù)測,共有27 472個Unigene被注釋,被Unigene注釋到的代謝通路有239個,該類基因參與了灰樹花子實體體內(nèi)的生化合成和次生產(chǎn)物代謝,研究該類基因,將為開展灰樹花基因克隆、功能基因驗證等分子手段提供生物信息學(xué)基礎(chǔ).
本次試驗通過SSR 位點查找共發(fā)現(xiàn)5 294個SSR 位點,利用SSR 位點,篩選目的條帶清晰、多態(tài)性好的引物,從而為分析灰樹花群體遺傳多樣性、構(gòu)建灰樹花遺傳連鎖圖譜、進(jìn)行灰樹花的分子育種奠定基礎(chǔ).
[1]周昌艷,吳愛忠,唐慶九,等.高分子量灰樹花多糖GFLP的分離純化及其對免疫細(xì)胞的作用[J].食用菌學(xué)報,2013,20(4):39-42.
[2]楊 海,耿傳信,周學(xué)鋒.灰樹花活性多糖藥理研究綜述[J].中國執(zhí)業(yè)藥師,2012,9(3):30-33.
[3]張美彥,尚曉冬,郭 倩,等.人工控制條件下的灰樹花菌株篩選[J].食用菌學(xué)報,2010,17(3):25-28.
[4]Yang F,Xu B,Li J J,et al.Transcriptome analysis of Termitomyces albuminosus reveals the biodegradation of lignocellulose[J].Acta Microbiologica Sinica,2012,52(4):466-477.
[5]陳士林,朱孝軒,陳曉辰,等.現(xiàn)代生物技術(shù)在人參屬藥用植物研究中的應(yīng)用[J].中國中藥雜志,2013,38(5):633-639.
[6]Tomas Maseka,Vaclav Vopalenskya,Petra Suchomelovab,et al.Denaturing RNA electrophoresis in TAE agarose gels[J].Analytical Biochemistry,2005,336(1):46-50.
[7]Shen R,F(xiàn)an J B,Campbell D,et al.High-throughput SNP genotyping on universal bead arrays[J].Mutat Res,2005,573(1/2):70-82.
[8]Haas B J,Papanicolaou A,Yassour M,et al.De novo transcript sequence reconstruction from RNA-seq using the Trinity platform for reference generation and analysis[J].Nature Protocols,2013,8(8):1494-1512.
[9]Quevillon E,Silventoinen V,Pillai S,et al.InterProScan:Protein domains identifier[J].Nucleic Acids Research,2005,33(2):116-120.
[10]Ye J,F(xiàn)ang L,Zheng H,et al.WEGO:A web tool for plotting GO annotations [J].Nucleic Acids Research,2006,34(2):293-297.
[11]Trapnell C,Williams B A,Pertea G,et al.Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation [J].Nature Biotechnology,2010,28(5):511-515.