齊育平,孫 蕾,劉琴英,蔣冬花
(浙江師范大學(xué)化學(xué)與生命科學(xué)學(xué)院,浙江金華 321004)
乳酸菌(Lactic acid bacteria,LAB)是指一類能夠通過(guò)同型發(fā)酵或異型發(fā)酵而產(chǎn)生乳酸的細(xì)菌[1]。大多數(shù)乳酸菌是有著重要經(jīng)濟(jì)價(jià)值的食品級(jí)微生物[2]。谷氨酸脫羧酶[3](Glutamate decarboxylase,EC 4.1.1.15,簡(jiǎn)稱GAD)在動(dòng)物、植物和微生物中廣泛存在,催化谷氨酸的α-脫羧反應(yīng),生成γ-氨基丁酸(GABA),是GABA唯一的合成酶[4],對(duì)維持整個(gè)GABA能系統(tǒng)穩(wěn)定地運(yùn)轉(zhuǎn)起著至關(guān)重要的作用。乳酸菌是一種優(yōu)良、高產(chǎn)、安全的菌種,利用乳酸菌生產(chǎn)GABA已經(jīng)成為一種較為理想的生物合成方法。目前已有多種乳酸菌的谷氨酸脫羧酶基因被克?。?-8]。生物信息學(xué)(bioinformatics)是一門利用應(yīng)用數(shù)學(xué)、信息學(xué)、統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)的方法研究生物學(xué)問(wèn)題的學(xué)科。生物信息學(xué)的研究工具是計(jì)算機(jī),研究方法包括對(duì)生物學(xué)數(shù)據(jù)的搜索(收集和篩選)、處理(編輯、整理、管理和顯示)及利用(計(jì)算、模擬)。目前主要的研究方向有序列比對(duì)、基因識(shí)別、基因重組、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)、基因表達(dá)、蛋白質(zhì)反應(yīng)的預(yù)測(cè)以及建立進(jìn)化模型。本文以1株高產(chǎn)GABA的短乳桿菌(Lactobacillus brevis)Lb-2菌株[9]為研究對(duì)象,克隆了其GAD基因,并利用生物信息學(xué)方法預(yù)測(cè)分析了其氨基酸組成、理化性質(zhì)、信號(hào)肽及其高級(jí)結(jié)構(gòu)等,以期指導(dǎo)分析該菌株的高產(chǎn)GABA特性、后續(xù)目的基因的表達(dá)純化以及研究該酶的生物學(xué)特性等。
1.1.1 菌種 短乳桿菌(Lactobacillus brevis)Lb-2菌株為本實(shí)驗(yàn)室篩選保存的1株高產(chǎn)γ-氨基丁酸(GABA)的菌株。
1.1.2 培養(yǎng)基 改良的MRS培養(yǎng)基(g):蛋白胨10,牛肉提取物10,酵母提取物5,葡萄糖5,乙酸鈉2,檸檬酸二胺2,MgSO4·7H2O 0.2,MnSO4·H2O 0.05,吐溫-80 1 mL,蒸餾水1 L,pH 6.50。
1.1.3 主要數(shù)據(jù)庫(kù)及軟件 NCBI blast:http://blast.ncbi.nlm.nih.gov/、ExPASy:http://www.expasy.org/、SignalP:http://www.cbs.dtu.dk/services/SignalP/、GOR Ⅰ:http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_gor.html、PSORT WWW Server:http://psort.hgc.jp/、SWISS-MODEL:http://swissmodel.expasy.org/;LaserGene、MEGA4、DNAMAN。
1.2.1 GAD基因克隆 以本實(shí)驗(yàn)室分離得到的短乳桿菌Lb-2菌株cDNA為模板,參照已發(fā)表的短乳桿菌GAD核苷酸序列設(shè)計(jì)引物,上游引物Forward:5'-ATG TTA CAC AGG CAC GGT TCT AAG CAG AAG-3';下游引物Reverse:5'-TCA ACA TGT TCC TCT ATA GTT TCT C-3')進(jìn)行PCR擴(kuò)增,引物由上海生工公司合成。
1.2.2 GAD基因氨基酸序列及保守結(jié)構(gòu)域 利用綜合性序列工具軟件LaserGene中的ORF Finder確定其完整的編碼序列(complete coding sequence,CDS),然后保存為Translation Sequence格式,輸出其氨基酸序列。利用NCBI的Conserved Domains檢測(cè)該序列的保守結(jié)構(gòu)域。
1.2.3 ProtParam預(yù)測(cè)GAD的理化性質(zhì) 用Ex-PASy[9]的ProtParam[10]工具對(duì)GAD氨基酸序列進(jìn)行分析,如分子量、等電點(diǎn)、氨基酸組成、摩爾消光系數(shù)、半衰期、穩(wěn)定性等。
1.2.4 GAD 的基本信息分析 Motifscan[11]預(yù)測(cè)一級(jí)結(jié)構(gòu)中糖基化、脂?;⒘姿峄?、硫酸化、GPI錨著位點(diǎn)等修飾位點(diǎn)和模序;用SignalP 4.1[12]在線進(jìn)行信號(hào)肽預(yù)測(cè);用PSORT WWW Server中的PSORT Prediction工具進(jìn)行細(xì)胞定位;用ExPASy的ProtScale進(jìn)行在線蛋白質(zhì)疏水性分析。
1.2.5 GAD 二級(jí)結(jié)構(gòu)預(yù)測(cè) 多肽鏈的螺旋和折疊使氨基酸形成穩(wěn)定的空間結(jié)構(gòu),從而使蛋白具有特定理化性質(zhì)和生物學(xué)活性,利用GORⅠ完成蛋白質(zhì)的二級(jí)結(jié)構(gòu)預(yù)測(cè)。
1.2.6 GAD 三級(jí)結(jié)構(gòu)同源建模 SWISS-MODEL[13-14]是一種使用同源建模方法來(lái)預(yù)測(cè)蛋白質(zhì)三維結(jié)構(gòu)的工具,利用Automated Mode將GAD與蛋白結(jié)構(gòu)數(shù)據(jù)庫(kù)中的蛋白質(zhì)三維結(jié)構(gòu)進(jìn)行匹配,預(yù)測(cè)GAD的三級(jí)結(jié)構(gòu)模型。
1.2.7 系統(tǒng)進(jìn)化樹(shù)的構(gòu)建 通過(guò)構(gòu)建系統(tǒng)進(jìn)化樹(shù)可以比較不同物種間的進(jìn)化距離,進(jìn)而判斷它們的親緣關(guān)系。檢索GenBank中已公布的GAD氨基酸序列,使用MEGA4[15]軟件進(jìn)行對(duì)比分析并構(gòu)建系統(tǒng)樹(shù)[15]。
1.2.8 多序列比對(duì) 利用DNAMAN軟件將獲得的GAD氨基酸序列與NCBI里已公布的4種短乳桿菌GAD氨基酸進(jìn)行多重序列比對(duì),分析所克隆到的GAD與其他短乳桿菌菌株GAD的異同。另4種分別為短乳桿菌877G菌株(Lb-877G,登錄號(hào):AFU61547.1)、短乳桿菌 BH2菌株(Lb-BH2,登錄號(hào):ABU55419.1),短乳桿菌CGMCC 1306菌株(Lb-CGMCC 1306,登錄號(hào):ADG02973.1)和短乳桿菌ATCC 367菌株(Lb-ATCC 367,登錄號(hào):YP_795941.1)。
本實(shí)驗(yàn)以短乳桿菌(圖1)cDNA為模板經(jīng)PCR擴(kuò)增和瓊脂糖凝膠電泳分析獲得一長(zhǎng)度為1 407 bp的PCR產(chǎn)物(圖2)。
圖1 短乳桿菌Lb-2顯微形態(tài)Fig.1 The morphology of Lb-2
圖2 PCR產(chǎn)物電泳圖Fig.2 The electrophoresis of PCR products
將上述片段回收、測(cè)序,最終得到一條全長(zhǎng)為1 407 bp的序列(圖3),經(jīng)軟件分析,該序列為一個(gè)完整的閱讀框,起始密碼子為ATG,終止密碼子為TAA,編碼468個(gè)氨基酸。將該序列進(jìn)行Blast檢索,發(fā)現(xiàn)其與短乳桿菌877G菌株的GAD基因(登錄號(hào):JX545343.1)相似性為99%,與短乳桿菌BH2菌株的GAD基因(登錄號(hào):EU084998.1)相似性為98%,推測(cè)該序列為短乳桿菌GAD基因序列。將此氨基酸序列提交到Conserved Domains檢測(cè)保守結(jié)構(gòu)域,結(jié)果顯示(圖4),該序列的保守結(jié)構(gòu)域類似多巴脫羧酶家族,該家族主要包括酪氨酸脫羧酶、組氨酸脫羧酶和谷氨酸脫羧酶。
短乳桿菌GAD共有468個(gè)氨基酸(表1),65個(gè)帶負(fù)電氨基酸殘基,46個(gè)帶正電荷氨基酸殘基,亮氨酸(Leu)所占比重最高,為9.2%;理論分子量和等電點(diǎn)(PI)分別為53 517.8 u和5.42,分子式為C2412H3675N637O703S21;含有6個(gè)半胱氨酸,假設(shè)形成3對(duì)二硫鍵,則該蛋白在水溶液中280 nm處的摩爾消光系數(shù)為87 125 M-1cm-1;蛋白濃度為l g/L時(shí),半胱氨酸未形成二硫鍵吸光系數(shù)(Abs)為1.621。當(dāng)成熟肽氨基端的第一個(gè)氨基酸為甲硫氨酸(Met)時(shí),GAD在哺乳動(dòng)物網(wǎng)狀紅細(xì)胞體外表達(dá)的半衰期為30 h,在酵母和大腸埃希菌中體內(nèi)表達(dá)的半衰期分別大于20 h和10 h。在溶液中的不穩(wěn)定指數(shù)為27.11,低于閾值40,表明在溶液中性質(zhì)穩(wěn)定。脂溶指數(shù)為85.04,疏水指數(shù)為-0.297,初步判斷該蛋白是親水性蛋白。
GAD翻譯后的修飾位點(diǎn)分析結(jié)果顯示:GAD含有3個(gè)潛在的N-糖基化位點(diǎn);3個(gè)酪蛋白激酶Ⅱ磷酸化位點(diǎn);5個(gè)潛在的N-肉豆蔻酰位點(diǎn);4個(gè)潛在的蛋白激酶C(PKC)磷酸化位點(diǎn);2個(gè)酪氨酸激酶磷酸化位點(diǎn);1個(gè)組氨酸脫羧酶活化位點(diǎn),位于38~428位氨基酸;1個(gè)L-酪氨酸脫羧酶活化位點(diǎn),位于45~445位氨基酸。
PSORT Prediction預(yù)測(cè)該蛋白位于細(xì)胞質(zhì)。TMHMM Server 2.0預(yù)測(cè)其沒(méi)有跨膜區(qū)域。SignalP 4.1 Server預(yù)測(cè)結(jié)果顯示該蛋白不含信號(hào)肽,可以推斷GAD在細(xì)胞質(zhì)中合成后,不進(jìn)行蛋白轉(zhuǎn)運(yùn);TargetP結(jié)果未發(fā)現(xiàn)線粒體、過(guò)氧化物酶體、溶酶體和細(xì)胞核等亞細(xì)胞定位序列。
表1 短乳桿菌GAD的氨基酸組成Table1 The amino acid composition of GAD of Lb-2
圖3 短乳桿菌Lb-2的GAD基因及氨基酸序列Fig.3 The gene and amino acid sequence of GAD of Lb-2
圖4 短乳桿菌Lb-2的GAD的保守結(jié)構(gòu)域Fig.4 The conserved domains of GAD of Lb-2
ExPASy的ProtScale在線預(yù)測(cè),疏水性氨基酸為正值,親水性氨基酸則為負(fù)值,氨基酸的絕對(duì)值越高則表明親疏水性越強(qiáng)。圖5顯示該GAD疏水性最小值約為-2.589,最大值約為2.544,整個(gè)多肽鏈中分值較低的氨基酸占多數(shù),即親水性氨基酸比例高于疏水性氨基酸,因此推斷該蛋白為親水性蛋白,與ProtParam預(yù)測(cè)結(jié)果一致。
圖5 短乳桿菌Lb-2的GAD氨基酸序列親水性分析Fig.5 The hydrophilicity analysis of the amino acid sequence of GAD from Lb-2
蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)方法有SOPM、SOPMA、HNN、PHD和GOR等,其中GOR方法將蛋白質(zhì)序列當(dāng)作一連串的信息值來(lái)處理,不僅考慮了被預(yù)測(cè)位置本身氨基酸種類的影響,而且考慮了相鄰氨基種類對(duì)該位置構(gòu)象的影響,預(yù)測(cè)效果較好。本文利用GORⅠ預(yù)測(cè)蛋白二級(jí)結(jié)構(gòu),結(jié)果顯示(圖6),該蛋白二級(jí)結(jié)構(gòu)中α-螺旋比例為51.71%,延伸鏈比例為31.20%,β-轉(zhuǎn)角占8.12%,無(wú)規(guī)卷曲占8.97%。
圖6 GORⅠ預(yù)測(cè)的短乳桿菌GAD二級(jí)結(jié)構(gòu)Fig.6 The predicted secondary structure of GAD by GORⅠ
三級(jí)結(jié)構(gòu)是由α-螺旋、β-折疊等二級(jí)結(jié)構(gòu)再折疊成一個(gè)球形的、包裹緊密的立體空間結(jié)構(gòu),可使一級(jí)結(jié)構(gòu)中2個(gè)離得較遠(yuǎn)的氨基酸殘基通過(guò)折疊使它們的側(cè)鏈相互靠近,并且通過(guò)疏水作用等構(gòu)成活性位點(diǎn)。采用SwissModel Automatic Modelling Mode預(yù)測(cè)短乳桿菌Lb-2的GAD三級(jí)結(jié)構(gòu)模型,系統(tǒng)自動(dòng)選取了擬南芥(Arabidopsis thaliana)GAD1基因作為模板,兩者序列相似度為40.23%,Evalue值為 0.00e-1,QMEAN Z-Score為-2.54,四級(jí)結(jié)構(gòu)信息顯示該模型為單鏈模型,沒(méi)有配體。模型(圖7)顯示該GAD蛋白含有大量的α-螺旋和β-折疊,與二級(jí)結(jié)構(gòu)的預(yù)測(cè)結(jié)果相符。
MEGA是一款主要集中于進(jìn)化分析進(jìn)而獲得綜合序列信息的軟件,可以編輯序列數(shù)據(jù)、序列比對(duì)、構(gòu)建系統(tǒng)發(fā)育樹(shù)、推測(cè)物種間的進(jìn)化距離等。在構(gòu)建進(jìn)化樹(shù)時(shí)可提供4種方法:最大簡(jiǎn)約法、鄰接法、最小進(jìn)化法、算術(shù)平均的非加權(quán)對(duì)群法。本文采用MEGA對(duì)乳桿菌目中12種菌的GAD氨基酸序列基于鄰位相連法構(gòu)建系統(tǒng)樹(shù),結(jié)果如圖8所示,短乳桿菌GAD與植物乳桿菌(Lactobacillus plantarum)和德氏乳酸桿菌(Lactobacillus delbrueckii)親緣關(guān)系最近。
圖7 短乳桿菌Lb-2的GAD的三級(jí)結(jié)構(gòu)預(yù)測(cè)Fig.7 The predicted tertiary structure of GAD from Lb-2
5種短乳桿菌GAD氨基酸序列多重序列比對(duì)結(jié)果見(jiàn)圖9。從圖9中可以看出,5種短乳桿菌GAD氨基酸序列的長(zhǎng)度一致,都是467個(gè);短乳桿菌種間的GAD氨基酸序列差異很小,只有個(gè)別氨基酸的不同;本文得到的短乳桿菌Lb-2的GAD氨基酸序列在416位上為丙氨酸(A),與其他序列有差異,但與短乳桿菌BH2菌株相同。
圖8 12種乳桿菌GAD的系統(tǒng)進(jìn)化樹(shù)Fig.8 The phylogenetic trees of 12 GADs
生物信息學(xué)研究的材料是生物學(xué)的數(shù)據(jù),通過(guò)情報(bào)學(xué)的方法,綜合運(yùn)用數(shù)學(xué)、計(jì)算機(jī)科學(xué)、情報(bào)信息等工具,對(duì)生物信息加工后得到相關(guān)信息。生物信息學(xué)是新興的學(xué)科,是當(dāng)今國(guó)內(nèi)外研究的熱點(diǎn),在生物技術(shù)、生物醫(yī)學(xué)、農(nóng)業(yè)、食品、環(huán)境、能源等研究領(lǐng)域發(fā)揮了重要作用[16]。
本研究克隆了短乳桿菌GAD基因序列,其全長(zhǎng)為1 407 bp,編碼468個(gè)氨基酸,有酪氨酸脫羧酶結(jié)構(gòu)域,理論分子量和等電點(diǎn)(PI)分別為53 517.8 u和5.42,位于細(xì)胞質(zhì),為親水性蛋白,不含信號(hào)肽。二級(jí)結(jié)構(gòu)預(yù)測(cè)顯示α-螺旋比例為51.71%,延伸鏈比例為31.20%,β-轉(zhuǎn)角占8.12%,無(wú)規(guī)卷曲占8.97%,構(gòu)建系統(tǒng)發(fā)育樹(shù)發(fā)現(xiàn)該短乳桿菌GAD基因與植物乳桿菌(Lactobacillus plantarum)和德氏乳酸桿菌(Lactobacillus delbrueckii)的GAD基因親緣關(guān)系最近。
應(yīng)用軟件預(yù)測(cè)蛋白的結(jié)構(gòu)和功能有一定的局限性,雖然不可能做到完全正確,但總體上近似。此外,由于在蛋白質(zhì)性質(zhì)分析過(guò)程中采用的方法不同,也會(huì)導(dǎo)致分析結(jié)果有差異。因此,本研究基本采用目前生物領(lǐng)域較為認(rèn)可的信息學(xué)分析方法,通過(guò)這些生物信息學(xué)的分析方法所得到信息有一定的參考價(jià)值,有助于更加深入地認(rèn)識(shí)乳桿菌谷氨酸脫羧酶,為研究谷氨酸脫羧酶的表達(dá)、分離、純化提供借鑒。
[1]金世琳.乳酸菌的科學(xué)與技術(shù)[J].中國(guó)乳品工業(yè),1998,26(2):14-20.
[2]閆肅,呂嘉櫪,郜洪濤.乳酸菌在食品工業(yè)中的應(yīng)用[J].中國(guó)釀造,2010,12:1-3
[3]林謙,楊勝遠(yuǎn),陸兆新,等.嗜熱鏈球菌谷氨酸脫羧酶基因及其側(cè)翼區(qū)序列分析[J].食品科學(xué),2011,32(3):121-125.
[4]杜昭,李世峰,李逸平.谷氨酸脫羧酶在神經(jīng)系統(tǒng)及雄性生殖系統(tǒng)中的功能[J].生命的化學(xué),2013,33(2):96-100.
[5]Masaru N,Ikuyo N,Yasuhita F,et al.Lactococcus lactiscontains only one glutamate decarboxylase gene[J].Microbiology,1999,145(6):1375-1380.
[6]Park K B,Oh S H.Cloning,sequencing and expression of a novel glutamate decarboxylase gene from a newly isolated lactic acid bacterium,Lactobacillus brevisOPK-3[J].Bioresource Technology,2007,98(2):312-319.
[7]Park K B,Heung O S.Cloning and expression of a full-length glutamate decarboxylase gene fromLactobacillus plantarum[J].Journal of Food Science and Nutrition,2004,9(4):324-329.
[8]Kim S H,Shin B H,Kim Y H,et al.Cloning and expression of a full-length glutamate decarboxylase gene fromLactobacillus brevisBH2[J].Biotechnology and Bioprocess Engineering,2007,12(6):707-712.
[9]繆存影,蔣冬花,徐曉波,等.酸菜中高產(chǎn) γ-氨基丁酸乳酸菌的篩選和鑒定[J].微生物學(xué)雜志,2010,30(2):28-32.
[10]Elisabeth G,Alexandre G,Christine H,et al.ExPASy:the proteomics server for in-depth protein knowledge and analysis[J].Nucleic Acids Research,2003,31(13):3784-3788.
[11]Ayan S,Md J A,Muhammad A K U,et al.Computational analysis of bovine alpha-1 collagen sequences[J].Bioinformation,2013,9(1):42-48.
[12]Shi M,Wang Y N,Zhu N,et al.Four heat shock protein genes of the endoparasitoid wasp,cotesia vestalis,and their transcriptional profiles in relation to developmental stages and temperature[J].Plos One,2013,8(3):1-10
[13]Petersen T N,Brunak S,Von Heijne G,et al.SignalP 4.0:discriminating signal peptides from transmembrane regions[J].Nature Methods,2011,8(10):785-786.
[14]Arnold K,Bordoli L,Kopp J,et al.The SWISS-MODEL Workspace:A web-based environment for protein structure homology modelling[J].Bioinformatics,2006,22:195-201.
[15]Kiefer F,Arnold K,Künzli M,et al.The SWISS-MODEL Repository and associated resources[J].Nucleic Acids Research,2009,37:D387-D392.
[16]Koichiro T,Joel D,Masatoshi N,et al.MEGA4:Molecular evolutionary genetics analysis(MEGA)software version 4.0[J].Molecular biology and evolution,2007,24(8):1596-1599.
[17]孟雙,徐沖,陳麗媛,等.生物信息學(xué)在生物學(xué)研究領(lǐng)域的應(yīng)用[J].微生物學(xué)雜志,2011,31(1):78-81.