董高超,劉 震,莫 朕,孫 林,王麗紅,夏亞穆
(青島科技大學(xué)化工學(xué)院,山東 青島 266042)
基因組挖掘在天然產(chǎn)物研究中的應(yīng)用進(jìn)展
董高超,劉 震,莫 朕,孫 林,王麗紅,夏亞穆*
(青島科技大學(xué)化工學(xué)院,山東 青島 266042)
基因組挖掘是通過對基因組進(jìn)行測序,然后預(yù)測合成的天然產(chǎn)物,進(jìn)而分離純化新化合物的技術(shù)。基因組挖掘可以促進(jìn)天然產(chǎn)物的研究,廣泛應(yīng)用于工農(nóng)業(yè)、食品、醫(yī)藥等領(lǐng)域。著重介紹了基因組挖掘在微生物、植物、新藥開發(fā)等方面的應(yīng)用研究進(jìn)展,并展望了基因組挖掘?qū)μ烊划a(chǎn)物研究的推動作用和應(yīng)用前景。
基因組挖掘;天然產(chǎn)物;次生代謝產(chǎn)物;生物信息學(xué)
從自然界存在的生物體內(nèi)分離、提取得到的有機(jī)化合物稱為天然產(chǎn)物。天然產(chǎn)物與人類的生活息息相關(guān),被用作工業(yè)催化劑、植物殺蟲劑、食品添加劑等,另外,它也是人類藥物的重要來源。據(jù)統(tǒng)計(jì),臨床上使用的大部分抗生素是天然產(chǎn)物或者天然產(chǎn)物衍生物[1]。然而,通過對生物次生代謝產(chǎn)物進(jìn)行活性追蹤從而分離得到天然產(chǎn)物的傳統(tǒng)方法遇到了越來越多的挑戰(zhàn):由于無法得知活性物質(zhì)的具體結(jié)構(gòu),導(dǎo)致所得天然產(chǎn)物很可能是為人所熟知的;由于有些生物體極少或者根本不產(chǎn)生某些天然產(chǎn)物,導(dǎo)致沒有足夠的化合物用于活性檢測,從而限制了天然產(chǎn)物的研究進(jìn)程[2]。
基因組挖掘是對編碼天然產(chǎn)物的基因組進(jìn)行測序,利用生物信息學(xué)預(yù)測可能產(chǎn)生的天然產(chǎn)物,然后根據(jù)所預(yù)測產(chǎn)物的理化性質(zhì),進(jìn)一步對基因簇進(jìn)行活化或者異源表達(dá),最終分離并鑒定目的產(chǎn)物。該方法的目的性比較強(qiáng),不受有機(jī)體體內(nèi)的產(chǎn)物含量及目的基因是否表達(dá)等因素的影響,從而擴(kuò)大了天然產(chǎn)物的研究范圍。作者在此對基因組挖掘在微生物、植物、新藥開發(fā)等幾方面的應(yīng)用研究進(jìn)展進(jìn)行了綜述,并展望了基因組挖掘?qū)μ烊划a(chǎn)物研究的推動作用和應(yīng)用前景。
1.1 在細(xì)菌方面的應(yīng)用
細(xì)菌可以產(chǎn)生許多獨(dú)特的活性化合物,被廣泛用作抗菌藥物、抗癌藥物等。然而,近年來,從細(xì)菌中發(fā)現(xiàn)新型天然產(chǎn)物越來越困難,為了克服傳統(tǒng)篩選方法的不足,研究者開發(fā)了一些新的尋找活性化合物的方法,基因組挖掘就是被廣泛使用的方法之一。
陳亮宇等[3]對星海鏈霉菌進(jìn)行基因組測序,然后用軟件將該序列與已知結(jié)構(gòu)功能的同源基因序列進(jìn)行比對,通過分析信號位點(diǎn)特征、密碼子使用偏好性等的相似性預(yù)測了4個(gè)聚酮合成酶類基因簇,利用生物信息學(xué)分析并預(yù)測出該基因簇具有抗活性補(bǔ)體的作用,并從其代謝產(chǎn)物中檢測到了較強(qiáng)的抗補(bǔ)體活性。
Mcclerren等[4]使用BLAST對芽孢桿菌B.haloduransC-125進(jìn)行基因組測序,挖掘出了一個(gè)非核糖體肽合成酶類化合物的基因簇,通過生物信息學(xué)分析推斷了該化合物的結(jié)構(gòu)及功能。生物活性分析表明,該化合物具有抗乳酸鏈球菌活性。
Gross等[5]將假單胞菌P.fluorescens基因序列與具有結(jié)構(gòu)注釋的已知基因序列進(jìn)行比對,建立相似性特征模型,預(yù)測一個(gè)基因簇可能合成一種環(huán)脂肽。生物活性分析發(fā)現(xiàn),該環(huán)脂肽具有抗白色假絲酵母活性。
目前,對鏈霉菌ATCC23877已經(jīng)研究很多年,除了紡錘菌素和螺旋霉素,暫且還未發(fā)現(xiàn)其它有價(jià)值的天然產(chǎn)物。但Bunet等[6]通過基因組挖掘,從該菌株中發(fā)現(xiàn)了控制次生代謝產(chǎn)物合成的十幾個(gè)基因簇和芳香族聚酮化合物kinamycins。
1.2 在真菌方面的應(yīng)用
真菌產(chǎn)生的許多活性次生代謝產(chǎn)物(如生物堿類化合物、萜類化合物等)具有抗菌、抗癌等生物活性。真菌是生產(chǎn)新藥的巨大寶庫,僅頭孢類藥物就有30多種。對真菌的研究熱點(diǎn)主要集中在新的抗腫瘤、抗菌等活性化合物的發(fā)現(xiàn)。
Robbel等[7]在紅霉菌物種中選擇一批基因組數(shù)據(jù),并用軟件分析基因組序列特征,建立統(tǒng)計(jì)學(xué)模型,然后利用這些模型對糖多孢紅霉菌某些保守區(qū)的DNA序列的基因結(jié)構(gòu)進(jìn)行檢測,發(fā)現(xiàn)了數(shù)十個(gè)可以控制次生代謝產(chǎn)物合成的基因簇,并對產(chǎn)物結(jié)構(gòu)進(jìn)行預(yù)測。通過同位素標(biāo)記等方法發(fā)現(xiàn)了新型天然產(chǎn)物異羥肟酸型嗜鐵素,該物質(zhì)具有調(diào)節(jié)生命代謝過程的作用,可應(yīng)用于生物防治、植物營養(yǎng)學(xué)、載體等方面。
K?nig等[8]對煙曲霉的基因組進(jìn)行測序,然后與其它已知結(jié)構(gòu)功能的序列進(jìn)行比對,尋找相似性區(qū)域以獲得基因的天然產(chǎn)物編碼區(qū),進(jìn)而推測基因結(jié)構(gòu)及功能。發(fā)現(xiàn)煙曲霉體內(nèi)的聚酮合酶類基因簇可以控制一種異戊烯化多酚的合成,該化合物可以對生物堿進(jìn)行異戊烯基化,從而使異戊烯基化后的生物堿具有廣泛的藥理學(xué)活性,如抗有絲分裂及抗癌等。
植物抗逆性是指植物抵抗非生物因素(如干旱)和生物因素(如蟲害)的能力,但由于其遺傳復(fù)雜,提高植物抗逆性一直受到極大的限制?;蚪M挖掘技術(shù)的興起對植物抗逆性的提高起到了重要作用,該技術(shù)通過挖掘新型的抗逆基因和闡述抗逆基因所產(chǎn)生的次生代謝產(chǎn)物在植物抗逆過程中所起到的調(diào)控作用,為農(nóng)作物抗逆育種提供了廣闊的前景。
樊龍江等[9]通過軟件對普通野生稻保守區(qū)域的序列與同源物種的基因序列進(jìn)行比對,分析相似性的區(qū)域及特征,并利用統(tǒng)計(jì)學(xué)模型發(fā)現(xiàn)了基因Pid3-A4與抗稻瘟病基因Pid3具有很高的相似性,從而預(yù)測Pid3-A4也是稻瘟病的抗病基因,Pid3-A4對稻瘟病菌的抗譜比Pid3更寬。
Devanna等[10]基于基因Pi54對藥用野生稻進(jìn)行等位基因挖掘,發(fā)現(xiàn)了Pi54of基因。功能學(xué)分析表明,Pi54of具有廣譜的抗病性,通過基因重組技術(shù)將其植入水稻中,可提高水稻對病蟲害的抗性。實(shí)踐證明,挖掘抗病基因是防治生物脅迫的重要手段。
趙陽[11]通過BLAST建立玉米同源物種的統(tǒng)計(jì)學(xué)模型,通過該模型對玉米全基因組進(jìn)行同源搜索,共鑒定了55個(gè)HD-Zip基因。通過干旱表達(dá)模式分析預(yù)測Zmhdz10基因具有抗逆作用。通過過量表達(dá)該基因發(fā)現(xiàn)其顯著提高了植株耐旱和耐鹽性,從而為改良作物的抗逆性提供了優(yōu)良的基因資源。
劉丹[12]對小麥品種旱選10號進(jìn)行了基因組測序,結(jié)合小麥D基因組數(shù)據(jù)庫,通過軟件ESTGenes預(yù)測出2個(gè)B″亞家族基因與植物抗逆性相關(guān),通過分析逆境下的表達(dá)模式發(fā)現(xiàn)這2個(gè)基因參與了植物對逆境反應(yīng)的調(diào)控網(wǎng)絡(luò),由其合成的蛋白磷酸酶可以提高小麥對滲透脅迫和冷害等非生物脅迫的耐受性。從而證明,挖掘抗逆基因并通過這些基因培育新品種是應(yīng)對逆境脅迫、提高產(chǎn)量的有效途徑。
謝瑩[13]通過對強(qiáng)筋小麥鄭麥366(A1)和弱筋小麥鄭麥004(A2)的基因組序列進(jìn)行比對,利用生物信息學(xué)的方法挖掘在強(qiáng)筋和弱筋材料中差異表達(dá)的基因,通過差異基因的過表達(dá)來分析該基因的功能,從而得到3個(gè)高品質(zhì)基因。這3個(gè)基因可以參與AGPase的活動,而AGPase則可以控制淀粉的合成。該研究對改良小麥品質(zhì)具有重要意義。
Beisson 等[14]通過對擬南芥基因組挖掘,發(fā)現(xiàn)了幾百個(gè)控制油脂合成的基因,為改善擬南芥油脂含量提供了優(yōu)良的基因資源。
成功研發(fā)一種新藥,需要篩選幾萬種化合物,耗資數(shù)億美元,高代價(jià)已成為新藥研發(fā)的限制因素。利用基因組挖掘研發(fā)新藥是指通過對基因組序列進(jìn)行分析,篩選目標(biāo)基因和進(jìn)行基因表達(dá),進(jìn)而進(jìn)行藥效研究得到新藥候選物,從而縮短新藥開發(fā)周期及降低研究成本。北京大學(xué)人類疾病研究中心以人類功能基因組為基礎(chǔ)建立了一系列人類功能基因組研究的新技術(shù)平臺,通過該平臺篩選和鑒定人類某些基因,發(fā)現(xiàn)了重組蛋白質(zhì)藥物PDCD5[15]和抗炎多肽新藥CKLF1-C19[16]。
Scherlach等[17]用生物信息軟件將構(gòu)巢曲霉基因序列與結(jié)構(gòu)功能已注釋的已知序列進(jìn)行比對,通過生物信息學(xué)分析預(yù)測基因的結(jié)構(gòu)及其可能產(chǎn)生的化合物的結(jié)構(gòu)和性質(zhì),最終發(fā)現(xiàn)了抗腫瘤劑異戊烯基喹啉-2-酮生物堿類物質(zhì)aspoquinolones A-D。
Banskota等[18]對2種放線菌NRRL18422和Eco86進(jìn)行測序,并對編碼PKS的基因簇進(jìn)行基因檢測分析,最終預(yù)測了2個(gè)化合物的結(jié)構(gòu)與性質(zhì),將預(yù)測的化合物進(jìn)行分離和活性分析,發(fā)現(xiàn)一個(gè)化合物具有抗真菌活性,另一個(gè)化合物具有明顯的抗革蘭氏陽性致病菌活性,都有成為新藥的潛力。隨著基因組挖掘技術(shù)的發(fā)展,新藥的研發(fā)也會迎來快速發(fā)展的時(shí)期。
目前,大量的天然產(chǎn)物還沒有被人類發(fā)現(xiàn),需要通過基因組挖掘等生物技術(shù)“挖掘”?;蚪M挖掘不僅能夠發(fā)現(xiàn)新穎的天然產(chǎn)物及其同類化合物,而且還能發(fā)現(xiàn)它們的合成途徑,從而提高從有機(jī)體中發(fā)現(xiàn)新天然產(chǎn)物的能力。
雖然基因組挖掘的潛力很大,但基因組挖掘在技術(shù)上和實(shí)用上仍有許多需要克服的難題,比如,用于基因操作和對目標(biāo)化合物進(jìn)行結(jié)構(gòu)預(yù)測的工具比較匱乏、從復(fù)雜的提取物中分離純化目標(biāo)化合物的步驟較為繁瑣。隨著天然產(chǎn)物化學(xué)、分子生物學(xué)、基因組學(xué)、生物化學(xué)等學(xué)科及高通量基因組測序技術(shù)的快速發(fā)展,基因組挖掘?qū)⒏油晟?,新的次生代謝產(chǎn)物的研究將因此迎來快速發(fā)展的時(shí)代。
[1] van LANEN S G,SHEN B.Microbial genomics for the improvement of natural product discovery[J].Current Opinion in Microbiology,2006,9(3):252-260.
[2] 孫文,顧文杰,吳永英,等.基因組水平的基因挖掘與功能分析方法的探討[J].生物信息學(xué),2007,5(2):94-96.
[3] 陳亮宇,徐小娜,王玉梅,等.利用基因組挖掘技術(shù)研究星海鏈霉菌的生物合成潛能[C]//紀(jì)念中國微生物學(xué)會成立六十周年大會暨2012年中國微生物學(xué)會學(xué)術(shù)年會論文集,2012.
[4] MCCLERREN A L,COOPER L E,QUAN C,et al.Discovery andinvitrobiosynthesis of haloduracin,a two-component lantibiotic[J].Proceedings of the National Academy of Sciences of the United States of America,2006,103(46):17243-17248.
[5] GROSS H,STOCHWELL V O,HENKENLS M D,et al.The ge-nomisotopic approach:a systematic method to isolate products of orphan biosynthetic gene clusters[J].Chemsitry and Biology,2007,14(1):53-63.
[6] BUNET R,SONG L,MENDES M V,et al.Characterization and manipulation of the pathway-specific late regulator AlpW revealsStreptomycesambofaciensas a new producer of kinamycins[J].Journal of Bacteriology,2011,193(5):1142-1153.
[7] ROBBEL L,KNAPPE T A,LINNE U,et al.Erythrochelin-a hydroxamate-type siderophore predicted from the genome ofSaccharopolysporaerythraea[J].FEBS Journal,2010,277(3):663-676.
[8] K?NIG C C,SCHERKACH K,SCHROECKH V,et al.Bacterium induces cryptic meroterpenoid pathway in the pathogenic fungusAspergillusfumigatus[J].ChemBioChem:A European Journal of Chemical Biology,2013,14(8):938-942.
[9] 樊龍江,郭興益.從水稻基因組序列中挖掘生物信息[J].浙江大學(xué)學(xué)報(bào)(農(nóng)業(yè)與生命科學(xué)版),2005,31(4):355-361.
[10] DEVANNA N B,VIJAYAN J,SHARMA T R.The blast resistance genePi54ofcloned fromOryzaofficinalisinteracts withAvr-Pi54 through its novel non-LRR domains[J].PLoS One,2014,9(8):e104840.
[11] 趙陽.玉米HD-Zip轉(zhuǎn)錄因子家族抗旱相關(guān)基因的鑒定及ZnYihdzlo功能分析[D].合肥:安徽農(nóng)業(yè)大學(xué),2013.
[12] 劉丹.小麥抗逆相關(guān)基因TaPP2AbB″-α/γ的克隆及功能分析[D].北京:中國農(nóng)業(yè)科學(xué)院,2014.
[13] 謝瑩.優(yōu)質(zhì)麥籽發(fā)育轉(zhuǎn)錄組構(gòu)建及品質(zhì)相關(guān)基因的挖掘[D].鄭州:鄭州大學(xué),2014.
[14] BEISSON F,KOO A J K,RUUSKA S,et al.Arabidopsis genes involved in acyl lipid metabolism.a 2003 census of the candidates,a study of the distribution of expressed sequence tags in organs,and a web-based database[J].Plant Physiology,2003,132(2):681-697.
[15] 陳以喬,馬曉莉.PDCD5基因與腫瘤關(guān)系的研究進(jìn)展[J].國際兒科學(xué)雜志,2012,39(4):348-351.
[16] 王應(yīng),馬大龍.抗炎多肽新藥——CNKF1-C19的開發(fā)研究[C]//新型疫苗與抗體創(chuàng)制關(guān)鍵技術(shù)及質(zhì)量控制研討會論文集,2011.
[17] SCHERLACH K,HERTWECH C.Discovery of aspoquinolones A-D,prenylated quinoline-2-one alkaloids fromAspergillusnidulans,motivated by genome mining[J].Organic & Biomolecular Chemistry,2006,4(18):3517-3520.
[18] BANSKOTA A H,MCALOINE J B,SORENSEN D,et al.Isolation and identification of three new 5-alkenyl-3,3(2H)-furano-nes from twoStreptomycesspeciesusing a genomic screening approach[J].The Journal of Antibiotics,2006,59(3):168-176.
Application Progress of Genome Mining in Research of Natural Products
DONG Gao-chao,LIU Zhen,MO Zhen,SUN Lin,WANG Li-hong,XIA Ya-mu*
(CollegeofChemicalEngineering,QingdaoUniversityofScience&Technology,Qingdao266042,China)
Genomeminingisanewtechniquetoisolateandpurifyundetectedcompoundsbysequencingthegenomeandpredictingstructureofnaturalproducts.Genomeminingcanpromotetheresearchofnaturalproducts,anditiswidelyusedinindustryandagriculture,food,pharmaceuticalandotherfields.Inthisarticle,theapplicationandresearchprogressofgenomeminingonmicroorganism,plant,developmentofnewdrugareemphaticallyintroduced.Thepromotingeffectandapplicationprospectofgenomeminingonnaturalproductsresearchareprospected.
genomemining;naturalproduct;secondarymetabolite;bioinformatics
國家自然科學(xué)基金資助項(xiàng)目(21472105)
2016-09-28
董高超(1990-),男,山東臨沂人,碩士研究生,研究方向:藥物合成,E-mail:1831813632@qq.com;通訊作者:夏亞穆,博士,副教授,E-mail:xiayamu@126.com。
10.3969/j.issn.1672-5425.2017.02.003
Q 78
A
1672-5425(2017)02-0010-03
董高超,劉震,莫朕,等.基因組挖掘在天然產(chǎn)物研究中的應(yīng)用進(jìn)展[J].化學(xué)與生物工程,2017,34(2):10-12.