原曉龍,陳劍,華梅,李云琴,王娟,楊宇明,王毅
(1.云南省林業(yè)科學(xué)院,云南 昆明 650201;2.云南省森林植物培育與開發(fā)利用重點實驗室/國家林業(yè)局云南珍稀瀕特森林植物保護和繁育重點實驗室,云南 昆明 650201)
非核糖體肽(Nonribosomal peptides, NRPs)中含有許多具有醫(yī)藥價值的抗生素類藥物,是一種結(jié)構(gòu)豐富,由微生物經(jīng)非核糖體多肽合成酶(Nonribosomal peptides synthetases,NRPSs)超酶家族合成[1]。非核糖體多肽合成酶運輸氨基酸和肽鏈中間體到含有泛酰巰基乙胺輔因子的肽?;d體結(jié)構(gòu)域及其他不同的催化結(jié)構(gòu)域,促使初生肽鏈的延伸、修飾直至最終的釋放[2]。NRPSs由A(腺苷酰化結(jié)構(gòu)域,A結(jié)構(gòu)域)、C(縮合結(jié)構(gòu)域,C結(jié)構(gòu)域)、T(肽?;d體蛋白結(jié)構(gòu)域,或巰基化結(jié)構(gòu)域,T結(jié)構(gòu)域) 3個相互獨立及其他一些結(jié)構(gòu)域按一定的時空順序排列,形成具不同催化活性功能的酶[2]。NRPs被用于抗生素、抗真菌藥物、抗癌藥物、抗病毒藥物及免疫抑制劑等[3],其在細菌、放線菌及真菌中廣泛存在[1,4-6]。因此,非核糖體多肽合成酶編碼基因的可挖掘潛力巨大,通過基因挖掘技術(shù)、微生物發(fā)酵等技術(shù)合成藥品的類似物,甚至有較大的可能合成全新的藥品。隨著測序技術(shù)的不斷發(fā)展,基因操作手段持續(xù)成熟,基因挖掘技術(shù)已成為從基因組和轉(zhuǎn)錄組數(shù)據(jù)中挖掘新的天然產(chǎn)物的重要手段[7]。基因挖掘技術(shù)除能夠發(fā)現(xiàn)傳統(tǒng)方法不能發(fā)現(xiàn)的新化合物外,還能夠避免傳統(tǒng)方法重復(fù)發(fā)現(xiàn)的困境。對于在通常培養(yǎng)條件下不產(chǎn)生的化合物,利用基因挖掘技術(shù),從基因組或轉(zhuǎn)錄組數(shù)據(jù)出發(fā),分析可能的基因簇,再進行不同方式培養(yǎng),敲除負(fù)調(diào)控基因及異源表達等方式能獲得大量新的多肽、聚酮類、萜類化合物等[7]。
巖生樹花(Ramalinaintermedia)屬子囊菌門(Ascomycetes)子囊菌綱(Ascomycetes)茶漬目(Lecanorales)樹花科(Ramalinaceae)樹花屬(Ramalina)[8],是一種廣泛分布,多生長于巖石上的樹狀地衣[9]。巖生地衣含有石花酸、松蘿酸、荔枝素、扁枝衣二酸、樹花地衣酸等次生代謝產(chǎn)物[9-10],可作為天然藥物來源之一。隨著測序技術(shù)的不斷發(fā)展,以基因組和轉(zhuǎn)錄組數(shù)據(jù)為基礎(chǔ),結(jié)合生物信息學(xué)分析手段,挖掘查找新基因,已被廣泛應(yīng)用于天然次生代謝產(chǎn)物研究[11]。Lautru等[12]利用基因組挖掘技術(shù)從Streptomycescoelicolor中得到新的多肽化合物coelichelin;Wu等[13]通過分析西洋參(Panaxquinquefolius)的3個不同組織器官的轉(zhuǎn)錄組信息,從中克隆并鑒定了MVA途徑中的限速酶4-羥基-4-甲基戊二酰輔酶A還原酶(HMGR)基因。在真菌中模塊化的聚酮合酶(Polyketide synthase,PKS)的挖掘中,效果尤其顯著,近年來通過生物信息學(xué)分析不同的真菌轉(zhuǎn)錄組,從單一真菌菌株中發(fā)現(xiàn)的基因簇數(shù)量可達20-100個,這些基因簇中有接近一半數(shù)量的PKS[14-15];Abdel等[16]利用antiSMASH、NaPDoS等生物信息學(xué)分析軟件從Cladoniauncialis中發(fā)現(xiàn)并鑒定出了6-Hydroxymellein合成酶。利用生物信息學(xué)分析從轉(zhuǎn)錄組數(shù)據(jù)挖掘基因,其可靠性較高。本研究以巖生樹花的轉(zhuǎn)錄數(shù)據(jù)為分析基礎(chǔ),分離得到RiNRPS基因,通過一系列生物信息學(xué)分析軟件和工具,對其產(chǎn)物進行了預(yù)測分析,預(yù)測得到RiNRPS基因所編碼的次生代謝產(chǎn)物。通過對RiNRPS基因及其蛋白氨基酸序列的BLAST比對,結(jié)合antiSMASH、NRPSpredictor、NaDPoS(Natural Products Domain Seeker)及Norine等分析NRPS的在線工具,挖掘巖生樹花的RiNRPS基因,為巖生樹花的非核糖體多肽的研究提供前期基礎(chǔ)。
巖生樹花于2015年5月從云南省昆明市西山(24.94278°N、102.633192°E)采集。
在實驗室用藻菌分離技術(shù)分離出巖生樹花的地衣型真菌。將地衣型真菌在恒溫培養(yǎng)箱25℃條件MY培養(yǎng)基上培養(yǎng)60d后,轉(zhuǎn)錄組取樣方法:將培養(yǎng)60d的菌絲體收獲后,立即放入液氮中,用干冰將樣品送測序公司進行測序,測序平臺采用Illumina NextSeq,測序讀長為2×150bp,采用 FastQC(http://www.bioinformatics.babraham.ac.uk/projects/fastqc)對下機數(shù)據(jù)進行質(zhì)量控制,基于DBG(De Bruijn Grahp)拼接原理,利用Trinity (版本r20140717,k-mer 25bp)軟件對獲得的序列進行拼接。最后利用本地BLAST對轉(zhuǎn)錄組數(shù)據(jù)進行比對,并結(jié)合在線數(shù)據(jù)庫比對獲得巖石樹花地衣型真菌NRPS基因序列。
將獲得的NRPS基因序列在NCBI上進行BLAST比對后,初步確定RiNRPS基因,并查找其開放閱讀框。選擇結(jié)構(gòu)域相似度較高的蛋白序列和外加蛋白序列,多序列比對用MEGA 6.0軟件中的Cluster程序完成,采用默認(rèn)參數(shù);系統(tǒng)進化樹采用鄰位相接法(Neighbor-Joining),自展值設(shè)為1 000進行繪制;理化性質(zhì)的預(yù)測借助于ProParam在線工具;信號肽預(yù)測利用SignalP 4.1 server;用Target P預(yù)測其亞細胞定位,用NCBI中的Conversed Domain Database數(shù)據(jù)庫搜索RiNRPS蛋白的結(jié)構(gòu)功能域;再利用分析NRPS的在線工具確定其可能的化合物及其組成。
通過NRPS和PKS的軟件分析RiNRPS基因,通過antiSMASH從巖生樹花轉(zhuǎn)錄組中挖掘出RiNRPS基因并對其化合物進行識別和分析,獲得其基本結(jié)構(gòu)域和具體的母核結(jié)構(gòu);用NRPS predictor推斷該基因各個A-domain負(fù)責(zé)轉(zhuǎn)運和活化的氨基酸;采用NaPDoS對該基因C-domain進行識別和分類;最后通過Norine對該基因所產(chǎn)生多肽的具體結(jié)構(gòu)、活性等進行推測生物信息學(xué)所用在線工具及其網(wǎng)址見表1。
用在線軟件ProtParam預(yù)測RiNRPS蛋白氨基酸殘基序列的理化性質(zhì),相對分子質(zhì)量為702 699.9,結(jié)構(gòu)式C31099H49135N8579O9469S249,等電點5.83,哺乳動物體外培養(yǎng)半衰期30h,酵母體內(nèi)的半衰期大于20h,大腸桿菌(Escherichiacoli)體內(nèi)的半衰期大于10h,脂肪系數(shù)87.59,不穩(wěn)定系數(shù)41.01,為不穩(wěn)定蛋白。ORF Finder分析結(jié)果顯示,其開放閱讀框總長19 098bp,編碼6 362個氨基酸;SignalP分析顯示RiNRPS蛋白不存在信號肽,為非分泌蛋白;采用Target P軟件預(yù)測其亞細胞定位,結(jié)果表明其蛋白位于細胞質(zhì)基質(zhì)中。
通過對巖生樹花RiNRPS蛋白序列進行BLAST比對,選擇與其同源性較高且結(jié)構(gòu)域基本相似的其他蛋白序列,并添加與其結(jié)構(gòu)域具明顯差別的17條蛋白序列構(gòu)建分子系統(tǒng)進化樹(圖1)。
表1 生物信息學(xué)在線工具及其網(wǎng)址Tab.1 The softwrae online of Bioinformatics and its websites
圖1 RiNRPS蛋白序列與其他25條蛋白序列的分子系統(tǒng)進化分析Fig.1 Phylogenetic analysis of RiNRPS and other 25 protein sequences
由圖1可以看出,巖生樹花的RiNRPS蛋白與玉米(Zeamays)圓斑病病菌(Cochlioboluscarbonum,A45086)、玉米生離蠕孢菌(Bipolariszeicola, AAA33023.2)、互隔交鏈孢霉菌(Alternariajesenskae,AGQ43600.1)、指狀青霉菌(Penicilliumdigitatum,EKV04368.1,EKV17246.1)、粗球孢子菌(Coccidioidesimmitis,KMU89701.1)和小麥黃斑葉枯病菌(Pyrenophoratritici-repentis,XP001932133.1、EDU41238.1)聚為一類,其產(chǎn)物均為HC-toxin母核,而與產(chǎn)生膠霉毒素(Glitoxin)、青霉素母核(Penicillin)的距離較遠,未聚為一類,二者各自聚為一類。
antiSMASH分析結(jié)構(gòu)顯示該基因為NRPS,其結(jié)構(gòu)域順序為A-T-C-A-T-E-C-A-T-C-A-T-E-C-T-C(A為腺苷酰化結(jié)構(gòu)域、T為PCP結(jié)構(gòu)域,即肽酰基載體蛋白結(jié)構(gòu)域、E為差向異構(gòu)結(jié)構(gòu)域、C為縮合結(jié)構(gòu)域)(圖2A)。NRPS predictor 2能夠預(yù)測細菌和真菌A domain識別的氨基酸種類,推斷出該基因的A domain轉(zhuǎn)運的氨基酸依次為Orn(鳥氨酸)、Gln(谷氨酰胺)、Gln(谷氨酰胺)、Cys(半胱氨酸)。NaPDoS(Natural Products Domain Seeker)通過對RiNRPS基因的2個C domain聚類分析,結(jié)果顯示RiNRPS基因的2個C domain均與HC-toxin 聚為一類,表明該基因的可能目的化合物為HC-toxin。綜上所述,通過antiSMASH、NRPS predictor、NaPDoS分析,得出RiNRPS基因可能編碼的蛋白為HC-toxin 合成酶,其潛在化合物由Orn(鳥氨酸)、Gln(谷氨酰胺)、Gln(谷氨酰胺)、Cys(半胱氨酸)4個氨基酸單體合成,是一種三輪狀結(jié)構(gòu)的環(huán)狀四肽,具毒素活性的多肽,其可能結(jié)構(gòu)式為C21H32N4O6。
圖2 antiSMASH在線軟件分析的結(jié)構(gòu)域順序Fig.2 The domain’s sequence by the online software antiSMASH
轉(zhuǎn)錄組測序技術(shù)結(jié)合代謝調(diào)控、生物信息學(xué)分析等手段,可以通過不同次生代謝產(chǎn)物的變化查找新基因、推測代謝途徑和闡釋基因功能,在天然次生代謝產(chǎn)物生物合成途徑及相關(guān)基因功能注釋的研究中被廣泛應(yīng)用,已成為基因挖掘不可或缺的技術(shù)[11]。真菌的非核糖體多肽(NRPs)具有廣泛的生物活性,可作為抗生素、鐵載體、免疫抑制劑、抗癌藥物等[17-19]。NRPs是由NRPSs催化合成的,NRPSs因其結(jié)構(gòu)的多樣性,從微生物中發(fā)現(xiàn)的新NRPS基因其潛在化合物成藥性較高,如Pullen等[20]從衛(wèi)矛科(Celastraceae)植物中分離得到的內(nèi)生鏈霉菌產(chǎn)生的Chloropyrrol抗生素可抑制多種耐藥性細菌和分歧桿菌;Combs等[21]在蛇藤(ColubrinaasiaticaBrongn)中分離得到的新鏈霉菌StreptomycesNRRL30562,產(chǎn)生了4種新的廣譜抗生素Munumbicins A、B、C和D,能抑制殺滅多種植物的致病性霉菌、細菌。NRPS在生物合成途徑中因其結(jié)構(gòu)域的多樣性及其組合方式的不同變化,可形成的化合物數(shù)量及其龐大,結(jié)構(gòu)的多樣性形成了生物活性豐富的天然次生代謝產(chǎn)物[22-23]。
antiSMASH是一個分析次生代謝產(chǎn)物中抗生素和其他醫(yī)藥類的在線軟件,運用其可加速對天然此生代謝產(chǎn)物的識別和挖掘[24]。NaPDoS是一種能快速檢測和分析天然次生代謝產(chǎn)物的生物信息學(xué)分析工具,通過對DNA或蛋白質(zhì)序列中的C domain進行快速檢測和聚類分析能夠?qū)RPS進行有效地識別和分類,亦可有效地預(yù)測其化合物[25]。NRPS predictor 2是一個通過對能夠產(chǎn)生次生代謝產(chǎn)物的新NRPS基因簇進行識別和注釋,并對其A domain的底物專一性進行預(yù)測和分析的在線軟件[26]。本文利用生物信息學(xué)分析從巖生樹花地衣型真菌中挖掘出RiNRPS基因,推斷其蛋白可能為HC-toxin合成酶,潛在合成產(chǎn)物為HC-toxin的一種。HC-toxin是一種三輪狀結(jié)構(gòu)的環(huán)狀四肽,是黑粉病菌(Thecaphorasolani)侵染玉米過程中的特異性和毒力的決定性因素,是微生物中不常見的次生代謝產(chǎn)物,是植物、昆蟲和哺乳動物中組蛋白脫乙?;傅囊种埔蜃覽27-30];Orn是一種堿性非蛋白氨基酸,但經(jīng)常存在于具生理活性的環(huán)狀多肽中,如短桿菌肽S(Gramicidin S)含有兩個Orn,因Orn具α-和δ-兩個氨基,其中δ-氨基對短桿菌肽S在生物膜上的吸附和抗微生物活性方面尤其重要,Kondejewski等證明了這一點[31-32]。各種生物信息學(xué)分析方法結(jié)果一致,同HC毒素合成酶的同源序列比對、分子系統(tǒng)進化分析及antiSMASH、NaPDoS等的分析均顯示該基因的轉(zhuǎn)錄產(chǎn)物可能為HC-toxin合成酶。生物信息學(xué)分析的手段,是現(xiàn)代生物學(xué)中發(fā)現(xiàn)新基因的重要技術(shù)手段,與其他生物學(xué)技術(shù)相結(jié)合可作為發(fā)現(xiàn)NRPS、PKS及其他一些生物合成基因研究的必要途徑。本文通過對巖生樹花地衣型真菌轉(zhuǎn)錄組數(shù)據(jù)的分析,挖掘出巖生樹花地衣型真菌的RiNRPS基因,對其轉(zhuǎn)錄產(chǎn)物及其潛在的化合物做出了預(yù)測,為今后巖生樹花地衣型真菌的非核糖體多肽的研究提供前期的研究基礎(chǔ)。
參考文獻:
[1]Joleen M,Wesley M,Lingjie G,etal.A PKS/NRPS/FAS hybrid gene cluster fromSerratiaplymuthicaRVH1 encoding the biosynthesis of three broad spectrum,zeamine-related antibiotics[J].PLoS one,2013,8(1):350-352.
[2]Evans B S.Nonribosomal peptide and polyketide biosynthesis methods and protocols[M].Human press,London,UK,2016:53-62.
[3]Gregory L C,James H N.Structure aspects of non-ribosomal peptide biosynthesis[J].Current Opinion in Structural Biology,2004,14(6):748-756.
[4]Madeleine P,Kristina H r,Clara B,etal.Regulation of the P450 oxygenation cascade Involved in glycopeptide antibiotic biosynthesis[J].Journal of the American Chemical Society,2016,138:6746-6753.
[5]任丹,張波,張小平,等.川楝內(nèi)生真菌的遺傳及PKS、NRPS基因的多樣性[J].中草藥,2014,45(10):1461-1467.
[6]馬艷玲,鄧海,魏菁菁,等.稀有海洋放線菌Salinisporaarenicola非核糖體肽合成酶和鹵代酶生物合成基因簇核心區(qū)的克隆及序列分析[J].生物技術(shù)通報,2011(2):157-162.
[7]Kim S K,Wijesekara I.Development and biological activities of marine-derived bioactive peptides: A review[J].Journal of Functional Foods,2010,2(1):1-9.
[8]Kirk P M,Cannon P F,David J C,etal.Ainsworth &Bisby’s dictionary of the fungi:9thedition [M].CAB International,Wallingford Oxon,2001:1-655.
[9]文雪梅,阿迪力·阿不都拉,阿不都拉·阿巴斯,等.新疆北部樹華屬(RamalinaAch.)地衣生態(tài)分布與地理區(qū)系成分的初步分析[J].新疆農(nóng)業(yè)科學(xué),2009,46(3):626-629.
[10]Zrnzevic I,Stankovic M,Jovanovic V S.Ramalinacapitata(Ach.) Nyl.acetone extract: HPLC analysis,genotoxicity,cholinesterase,antioxidant and antibacterial activity[J].Excli Journal,2017,16:679-687.
[11]Liu T,Lv C G,WANG S,etal.Transcriptome-based gene mining and bioinformatics analysis of p-hydroxybenzoate geranyltransferase genes inArnebiaeuchroma[J].China Journal of Chinese Materia Medica,2016,41(8):56-63.
[12]Lautru S,Deeth R J,Bailey L M,etal.Discovery of a new peptide natural product byStreptomycescoelicolorgenome mining[J].Nature Chemical Biology,2005,1(5):265-269.
[13]Wu J,Zhong J J.Production of ginseng and its bioactive components in plant cell culture: current technological and applied aspects[J].Journal of Biotechnology,1999,68(2-3):89-99.
[14]Amselem J,Cuomo C A,van Kan J A,etal.Genomic analysis of the ecrotrophic fungal pathogensSclerotiniasclerotiorumandBotrytiscinerea[J].Plos Genetics,2011,7(8):1399-1400.
[15]O’Connell R J,Thon M R,Hacquard S,etal.Lifestyle transitions in plant pathogenicColletotrichumfungi deciphered by genome and transcriptome analyses[J].Nature Genetics,2012,44(9):1060-1065.
[16]Abdel H M,Bertrand R L,Piercey N M,etal.Identification of 6-Hydroxymellein Synthase and Accessory Genes in the LichenCladoniauncialis[J].Journal of Natural Products,2016,79(6):1645-1650.
[17]Cramer R A,Stajich J E,Yamanaka Y,etal.Phylogenomic analysis of non-ribosomal peptide synthetases in the genusAspergillus[J].Gene,2006,383: 24-32.
[18]Roongsawang N,Washio K,Morikawa M.Diversity of nonribosomal peptide synthetases involved in the biosynthesis of lipopeptide biosurfactants[J].International Journal of Molecular Sciences,2010,12(1):141-172.
[19]Meyer S,Kehr J C,Mainz A,etal.Biochemical dissection of the natural diversification of microcystin provides lessons for synthetic biology of NRPS[J].Cell Chemical Biology,2016,23(4):462-471.
[20]Pullen C,Schmitz P,Meurer K,etal.New and bioactive compounds fromStreptomycesstrains residing in the wood of Celasrraceae[J].Planta,2002,216(1):162-167.
[21]Combs J T,Franco C M,Loria R D,etal.Complete sequencing and analysis of pEN2701,a novel 13-kb plasmid from an endophyticStreptomycessp.[J].Plasmid,2003,49(1):86-92.
[][]
[22]朱鵬,鄭立,林晶,等.抗菌和細胞毒活性海洋細菌的篩選及其次生代謝基因證據(jù)[J].微生物學(xué)報,2007,47(2):228-234.
[23]方劍,朱鵬,嚴(yán)小軍.非核糖體肽合成酶的末端硫酯酶與多肽環(huán)化[J].中國生物化學(xué)與分子生物學(xué)報,2013,29(7):612-618.
[24]Kai B,Medema M H,Kazempour D,etal.antiSMASH 2.0-a versatile platform for genome mining of secondary metabolite producers [J].Nucleic Acids Research,2013,41(W1):W204-W212.
[25]Leclère V,Weber T,Jacques P,etal.Bioinformatics tools for the discovery of new nonribosomal peptides [J].Methods in Molecular Biology,2016,1401(14):209-232.
[27]Horbach R,Navarro-Quesada A R,Knogge W,etal.When and how to kill a plant cell: infection strategies of plant pathogenic fungi [J].Journal of Plant Physiology,2011,168(1):51-62.
[28]Walton J D.HC-toxin [J].Phytochemistry,2006,67(14):1406-1413.
[29]張杰,阮先樂,侯小歌,等.綠僵菌HC毒素合成酶基因的生物信息學(xué)分析[J].江蘇農(nóng)業(yè)科學(xué),2015,43(9):71-74.
[30]Yamane H,Konno K,Sabelis M,etal.Chemical defence and toxins of plants [J].Chemical Ecology,2010,4:339-385.
[31]Berditsch M,Trapp M,Afonin S,etal.Antimicrobial peptide gramicidin S is accumulated in granules of producer cells for storage of bacterial phosphagens [J].Scientific Reports,2017,7:44324.
[32] Kondejewski L H,Farmer S W,Wishart D S,etal.Modulation of structure and antibacterial and hemolytic activity by ring size in cyclic gramicidin S analogs [J].Journal of Biological Chemistry,1996,271(41):25261-25268.