艾鑫,趙文君,律鳳霞
(牡丹江師范學(xué)院生命科學(xué)與技術(shù)學(xué)院,黑龍江 牡丹江 157012)
白靈菇(Pleurotusostreatus),在我國是一個(gè)非常重要的食用菌,常常被認(rèn)為等同于阿魏菇[1],戴玉成課題研究組從分子生物學(xué)角度鑒定表明:白靈菇為刺芹側(cè)耳獨(dú)立進(jìn)化的新分支,學(xué)名刺芹側(cè)耳托里亞種(Pleurotuseryngiisubsp.tuoliensis),因此,白靈菇被提升為單獨(dú)的新種[2]。分類學(xué)上隸屬于菌物界、擔(dān)子菌門、傘菌綱、傘菌目、側(cè)耳科,其子實(shí)體形似靈芝,顏色純白,故稱白靈菇[3]。白靈菇子實(shí)體較大,菌蓋直徑8~15 cm或更大,厚3~4 cm,初期近扁球形,多側(cè)生或偏生,表面近平滑偶有絨狀膜,菌肉白色,肉質(zhì)脆嫩[4]。
我國白靈菇主要分布于新疆的阿勒泰、伊犁、托里、塔城和木壘等高原地區(qū),腐生或寄生于阿魏植物的根部或根莖處[5]。近年來,關(guān)于白靈菇在藥理作用研究方面受到廣泛關(guān)注,研究表明白靈菇具有抗氧化活性[6]、免疫活性[7]、抗腫瘤作用[8]、降血脂[9]和疲勞恢復(fù)作用[10]。目前國內(nèi)外對(duì)白靈菇的研究大多集中在營養(yǎng)成分、藥用價(jià)值和栽培技術(shù)等方面的研究,部分有關(guān)白靈菇地理分布和資源利用以及資源品質(zhì)的研究[11-13],但關(guān)于白靈菇的分子生物學(xué)研究以及轉(zhuǎn)錄組信息和基因組數(shù)據(jù)未見報(bào)道。
本研究基于SBS(sequencing by synthesis)技術(shù),用IIIumina Hiseq高通量平臺(tái)對(duì)白靈菇菌絲體進(jìn)行轉(zhuǎn)錄組測序[14-15],通過數(shù)據(jù)過濾、拼接、組裝重建形成了白靈菇轉(zhuǎn)錄組Unigene數(shù)據(jù),將數(shù)據(jù)與7大數(shù)據(jù)庫進(jìn)行功能注釋比對(duì)、分類以及SSR分子標(biāo)記。為今后有關(guān)白靈菇的有效成分利用、基因篩選、調(diào)控機(jī)制研究以及功能分析提供一定的理論依據(jù)[16-20]。
白靈菇:牡丹江師范學(xué)院生科院教研室提供。
培養(yǎng)基配方:葡萄糖20%,胰蛋白胨1%,KH2PO40.1%,MgSO40.05%,VB10.03%,pH值自然。
白靈菇總RNA:白靈菇菌26 ℃150 r/min振蕩培養(yǎng)10 d過濾得菌絲球,Plant Total RNA Isolation Kit(50T)試劑盒提取總RNA,檢測提取物的濃度、完整性及污染情況,符合要求的RNA進(jìn)行測序。
用軟件Bcl2fastq對(duì)測序原始數(shù)據(jù)進(jìn)行圖像堿基識(shí)別,lllumina內(nèi)置軟件篩選每個(gè)測序結(jié)果片段,形成原始測序數(shù)據(jù)(Pass Filter Data)[21-22],以FASTQ文件格式儲(chǔ)存。去除3`端接頭序列,過濾低質(zhì)量數(shù)據(jù),清除基因組污染。利用軟件Trinity(v2.2.0)對(duì)處理后數(shù)據(jù)從頭組裝,通過序列聚類對(duì)組裝結(jié)果進(jìn)一步序列拼接和清冗余處理,保留大于200bp的序列數(shù)據(jù),獲到非冗余Unigene序列。Unigene序列與COG、GO、KEGG、Nr和Swiss-Prot等數(shù)據(jù)庫進(jìn)行BLAST比對(duì),對(duì)比對(duì)的注釋基因進(jìn)行功能分類和統(tǒng)計(jì)分析。用三種SSRs預(yù)測軟件對(duì)樣本序列進(jìn)行SSR位點(diǎn)預(yù)測,將共有結(jié)果保留用于下一步的引物設(shè)計(jì)[23-25]。
利用Illumina測序平臺(tái)對(duì)白靈菇的液體菌球進(jìn)行轉(zhuǎn)錄組測序,數(shù)據(jù)經(jīng)過嚴(yán)格的質(zhì)量控制后過濾后數(shù)據(jù)共獲得26973356條純凈序列,共計(jì)4.02Gb個(gè)堿基,GC含量為53.09%,堿基質(zhì)量值 Q20 和 Q30 分別為 98.52%和 95.56%(表1)。以上結(jié)果說明白靈菇測序質(zhì)量較高,為后續(xù)的組裝和分析奠定了良好的基礎(chǔ)。
表1 測序數(shù)據(jù)質(zhì)量統(tǒng)計(jì)
采用軟件Trinity對(duì)樣品數(shù)據(jù)進(jìn)行序列組裝,組裝結(jié)果通過序列聚類做進(jìn)一步序列拼接和去冗余處理,得到長的非冗余的Unigene序列32969條,總堿基數(shù)量57.1318 M,序列數(shù)量與長度是組裝質(zhì)量的重要評(píng)價(jià)標(biāo)準(zhǔn),N50長度為2701 bp ,遠(yuǎn)大于其對(duì)應(yīng)平均長度1732.90 bp,說明組裝結(jié)果較好。統(tǒng)計(jì)Unigene數(shù)量與長度分布情況見表2。
表2 Unigene數(shù)量與長度分布統(tǒng)計(jì)
表2顯示:Unigene最小長度201bp,最大長度15498 bp,平均長度1732.90 bp,以500 bp為間距進(jìn)行分組(除200 bp以下部分),長度在2000 bp以上的數(shù)目最多,達(dá)到11011條占比33.40%;200~500 bp占比23.83%;500~1000 bp占比17.10%;1000~1500 bp占比13.93%;1500~2000 bp占比11.74%(圖1)。
圖1 白靈菇Unigene 不同長度分布比例
使用BLAST軟件將組裝得到的白靈菇Unigene對(duì)比到常用的7大數(shù)據(jù)庫(圖2),獲得注釋Unigene共有21808條,占總Unigene的66.15%。白靈菇Unigene在不同數(shù)據(jù)庫的注釋數(shù)目有較大差異,其中注釋數(shù)目最多的是Nr數(shù)據(jù)庫,共有21664條Unigene得到注釋,占比65.71%;其次為Swiss-Prot(12542條,占38.04%)、COG(12461條,占37.80%);白靈菇Unigene注釋數(shù)目最少的為KEGG數(shù)據(jù)庫,僅有1304條Unigene,占比3.96%。
圖 2 Unigene各數(shù)據(jù)庫注釋結(jié)果Venn圖
白靈菇Unigene在Nr數(shù)據(jù)庫比對(duì)后同源序列注釋最多,21664條(99.34%)。同源排序前十位的物種為(圖3):真姬菇(Hypsizygusmarmoreus)6603條同源注釋(30.48%);Moniliophthoraroreri1117條(5.16%);奧氏蜜環(huán)菌(Armillariasolidipes)1072條(4.95%);光蓋裸蓋菇(Psilocybecyanescens)1028條(4.75%);高盧蜜環(huán)菌(Armillariagallica)994條(4.59%);熱帶紫褐裸傘(Gymnopilusdilepis)974條(4.50%);阿太菌科FibularhizoctoniaspCBS 10969)785條(3.62%);TermitomycesspJ132 669條(3.09%);暗藍(lán)斑褶菇(Paneoluscyanescens)647條(2.99%);白環(huán)菌屬的LeucoagaricusspSymC.Cos636條(2.94%),另有32.93%的Unigene在其他物種中獲得注釋。
圖3 Unigene的Nr功能注釋物種分布Top10
1.催化活性;2.結(jié)合;3.轉(zhuǎn)運(yùn)活性;4.核酸結(jié)合轉(zhuǎn)錄因子活性;5.酶調(diào)節(jié)劑活性;6.結(jié)構(gòu)分子活性;7.抗氧化活性;8.蛋白質(zhì)結(jié)合轉(zhuǎn)錄因子活性;9.分子轉(zhuǎn)導(dǎo)活性;10.鳥苷酸交換因子活性;11.電子載流子活度;12.分子功能調(diào)節(jié)劑;13.營養(yǎng)庫活性;14.翻譯調(diào)節(jié)活性;15.蛋白標(biāo)簽;16.受體調(diào)節(jié)活性;17.金屬血紅素活性;18.趨化活性;19.化學(xué)活性;20.通道調(diào)節(jié)活性;21.細(xì)胞部分;22.細(xì)胞器;23.細(xì)胞器部分;24.膜部分;25.大分子復(fù)合物;26.膜;27.胞外區(qū);28.膜封閉腔;29.胞外區(qū)部分;30.細(xì)胞連接;31.突觸部分;32.突觸;33.細(xì)胞外基質(zhì);34.細(xì)胞;35.細(xì)胞外基質(zhì)成分;36.類核;37.其他有機(jī)體部分;38.膠原三聚體;39.病毒部分;40.細(xì)胞過程;41.代謝過程;42.單生物過程;43.生物調(diào)控;44.本土化;45.應(yīng)激反應(yīng)的過程;46.發(fā)展過程;47.多細(xì)胞生物進(jìn)程;48.細(xì)胞組織或生物合成;49.免疫過程;50.生長;51.生殖進(jìn)程;52.運(yùn)動(dòng);53.信號(hào);54.生物粘附;55.有節(jié)奏的過程;56.再生作用;57.行為;58.多細(xì)胞生物生長過程;59.細(xì)胞死亡;60.激素分泌;61.細(xì)胞聚集
白靈菇Unigene在GO數(shù)據(jù)庫中比對(duì),主要功能分類包括細(xì)胞組成、分子功能和生物過程三個(gè)主類61個(gè)亞類(圖4)。分子功能功能主類內(nèi)含20個(gè)亞類,Unigene功能以催化活性和結(jié)合的數(shù)量最多;細(xì)胞組成主類內(nèi)含19個(gè)亞類,Unigene功能以細(xì)胞部分?jǐn)?shù)量最多,細(xì)胞器、細(xì)胞器部分和膜部分次之;生物過程主類內(nèi)含22個(gè)亞類,Unigene功能以細(xì)胞過程、代謝過程和單生物過程為主。
1.全局和總覽圖;2.碳水化合物代謝;3.氨基酸代謝;4.脂質(zhì)代謝;5.核苷酸代謝;6.能量代謝7.其他氨基酸代謝8.輔助因子和維生素的代謝9.糖的生物合成和代謝10.萜類和多酮類化合物的代謝11.其他次生代謝產(chǎn)物的生物合成12.異生素的生物降解和代謝13.翻譯14.折疊、分類和降解15.轉(zhuǎn)錄16.復(fù)制和修復(fù)17.運(yùn)輸和分解代謝18.細(xì)胞生長和死亡19.信號(hào)轉(zhuǎn)導(dǎo)20.膜運(yùn)輸
白靈菇Unigene的KEGG生物通路富集分析顯示,共有1304個(gè)Unigene得到注釋,涉及到111條生物通路。KEGG數(shù)據(jù)庫的生物通路分四大類,細(xì)胞過程、環(huán)境信息處理、遺傳信息處理和新陳代謝,內(nèi)含20個(gè)二級(jí)亞類。亞類中涉及新陳代謝相關(guān)通路的最多,12條通路2053個(gè)基因(67.09%);其次是遺傳信息處理有4條通路694個(gè)基因(22.68%)、細(xì)胞過程有2條通路222個(gè)基因(7.25%)、環(huán)境信息處理有2條通路91個(gè)基因(2.97%)。
白靈菇Unigene與COG數(shù)據(jù)庫比對(duì)顯示(圖6):有12461條Unigene注釋到25個(gè)功能類別。一般功能預(yù)測功能注釋數(shù)目最多,有2187條(17.55%);翻譯后的修飾、蛋白質(zhì)轉(zhuǎn)換和分子伴侶類群等功能注釋有1204條(9.66%);信號(hào)轉(zhuǎn)導(dǎo)機(jī)制功能注釋有1093條(8.77%);次生代謝產(chǎn)物的生物合成,運(yùn)輸和分解代謝功能注釋有1005條(8.07%);細(xì)胞運(yùn)動(dòng)功能注釋有15條Unigene,僅占總數(shù)的0.12%,是注釋數(shù)目最少的類別。
A.RNA加工和修飾;B.染色質(zhì)結(jié)構(gòu)和動(dòng)力學(xué);C.能量生產(chǎn)及轉(zhuǎn)換;D.細(xì)胞周期控制,細(xì)胞分裂,染色體分裂;E.氨基酸的運(yùn)輸和代謝;F.核苷酸轉(zhuǎn)運(yùn)和代謝;G.碳水化合物的運(yùn)輸和代謝;H.輔酶的運(yùn)輸和代謝;I.脂質(zhì)運(yùn)輸和代謝;J.核糖體結(jié)構(gòu)和生物起源;K.轉(zhuǎn)錄;L.復(fù)制重組和修復(fù);M.細(xì)胞壁/細(xì)胞膜/包膜的生物發(fā)生;N.細(xì)胞運(yùn)動(dòng);O.翻譯后的修飾,蛋白質(zhì)轉(zhuǎn)換,分子伴侶. P.無機(jī)離子的轉(zhuǎn)運(yùn)和代謝;Q.次生代謝產(chǎn)物的生物合成,運(yùn)輸和分解代謝;R.一般功能預(yù)測;S.未知函數(shù);T.信號(hào)轉(zhuǎn)導(dǎo)機(jī)制;U.細(xì)胞內(nèi)運(yùn)輸,分泌和囊泡運(yùn)輸;V.防御機(jī)制;W.細(xì)胞外結(jié)構(gòu);Y.核結(jié)構(gòu);Z.細(xì)胞骨架
白靈菇轉(zhuǎn)錄組測序數(shù)據(jù)共檢索到3014個(gè)SSR位點(diǎn)(圖7),三核苷酸重復(fù)數(shù)為1869個(gè),占SSR位點(diǎn)總數(shù)的62.01%,而三核苷酸重復(fù)中CGA/GAC重復(fù)基元最多(390個(gè));單核苷酸重復(fù)有738個(gè)(24.49%),C/T重復(fù)基元最多(555個(gè));二核苷酸重復(fù)數(shù)284個(gè)(9.42%),CG/CT重復(fù)基元最多(167個(gè));四核苷酸重復(fù)數(shù)65個(gè)(2.16%),TGAG/AGGG重復(fù)基元為主(46個(gè));六核苷酸重復(fù)數(shù)最少,65個(gè)占總SSR位點(diǎn)的1.92%。
圖7 白靈菇SSR位點(diǎn)5種類型統(tǒng)計(jì)分析
白靈菇RNA轉(zhuǎn)錄組測序及數(shù)據(jù)處理后,獲得32969條Unigene,序列平均長度1732.90bp,N50為2701bp。其中21808條Unigene被注釋到GO、KEGG、Nr和COG等7大數(shù)據(jù)庫,占總Unigene的66.15%。這些被注釋的Unigene為今后有關(guān)白靈菇的有效成分利用、基因篩選、調(diào)控機(jī)制研究以及功能分析提供一定的理論依據(jù)。此外,還有11161條Unigene未得到注釋,推測可能是白靈菇的特異性新基因、非編碼RNA序列或目前公共基因數(shù)據(jù)庫尚未完善。
白靈菇Unigene數(shù)據(jù)在Nr數(shù)據(jù)庫中注釋21664條,30.48%同源注釋到真姬菇,真姬菇與白靈菇均屬于菌物界、擔(dān)子菌門、傘菌綱、傘菌目,同目不同屬下同源基因數(shù)目較多;還有32.93%的Unigene序列未匹配到同源序列,可能由于Unigene片段較小而無法同源匹配到單數(shù)據(jù)序列。
白靈菇Unigene數(shù)據(jù)在GO功能分類中共注釋到3個(gè)主類和61個(gè)亞類,主要集中在催化活性、結(jié)合功能和細(xì)胞部分功能等。白靈菇的KEGG代謝通路富集分析主要富集在次級(jí)代謝產(chǎn)物的生物合成、抗生素的生物合成和核糖體等路徑,表明白靈菇的生物合成表達(dá)上具有較高的基因豐度。分子標(biāo)記技術(shù)被廣泛應(yīng)用于研究的各個(gè)領(lǐng)域,其中SSR位點(diǎn)是目前應(yīng)用較為廣泛的一種標(biāo)記類型。本研究挖掘到3014個(gè)SSR位點(diǎn)在不同核苷酸重復(fù)類型中均有分布,證實(shí)白靈菇基因位點(diǎn)較為豐富。本研究對(duì)白靈菇進(jìn)行轉(zhuǎn)錄組測序及數(shù)據(jù)處理,獲得了高質(zhì)量的Unigene序列信息,經(jīng)生物信息學(xué)相關(guān)軟件對(duì)白靈菇Unigene進(jìn)行功能注釋分類、代謝通路富集分析及SSR位點(diǎn)的類型等多方面分析研究,為后續(xù)白靈菇基因組學(xué)功能研究、分子標(biāo)記輔助育種、種質(zhì)資源開發(fā)利用和遺傳多樣性修復(fù)等提供數(shù)據(jù)參考。