唐標(biāo),吳靜,鄭華軍,趙維,楊華*
(1.浙江省農(nóng)業(yè)科學(xué)院 農(nóng)產(chǎn)品質(zhì)量安全與營養(yǎng)研究所,浙江 杭州 310021; 2.上海人類基因組研究中心,上海 201203;3.中國科學(xué)院 深圳先進(jìn)技術(shù)研究院,廣東 深圳 518055)
擬無枝酸菌(Amycolatopsis)大部分的菌株都是從土壤中分離,部分從海洋、沙漠、沉積物、臨床樣本等分離,歸屬于放線菌綱[1-2]、假諾卡氏菌目、假諾卡氏菌科[3-4]。近年來,該屬菌種數(shù)量逐漸增加,迄今為止已有82個有效發(fā)表的典型菌種(https://lpsn.dsmz.de/genus/amycolatopsis)。該屬的菌株可通過gyrB、recN和16S rDNA基因分劃為多個分支[5-6]。該屬菌種分為2個主要分支,東方擬無枝酸菌分支(Amycolatopsisorientalissubclade,AOS)和甲基擬無枝酸菌分支(Amycolatopsismethanolicasubclade,AMS)[5-8]。其中,AOS的菌株常被發(fā)現(xiàn)可以生產(chǎn)抗生素,例如A.orientalis生產(chǎn)萬古霉素[9]、Amycolatopsismediterranei生產(chǎn)利福霉素[10-11]等。AMS的代表菌株A.methanolica是一個兼性甲基營養(yǎng)放線菌,未發(fā)現(xiàn)產(chǎn)生抗生素,且次級代謝物較少[8-12]。AMS中的菌種能夠在45 ℃以上的條件下生長,屬于嗜熱放線菌[12-13]。后經(jīng)過gyrB-recN-16S的串聯(lián)核酸序列,將該屬的35個菌種分為A~F分支[6]。然而,由于采用不同的序列及方法,獲得的系統(tǒng)發(fā)育模式并不相同,因此,該屬菌種的系統(tǒng)發(fā)育地位仍需進(jìn)一步探究[14]。
全基因組數(shù)據(jù)目前已經(jīng)被越來越多的用來分析原核細(xì)菌之間的進(jìn)化關(guān)系,包括一些傳統(tǒng)方法很難區(qū)分的放線菌[15]?;蚪M序列提供了更多的潛在分子標(biāo)記用于系統(tǒng)發(fā)育。前期的研究在A.methanolica中發(fā)現(xiàn)了放線菌綱中普遍存在的特有基因AMETH_3452,定位在擬無枝酸菌屬環(huán)形基因組的復(fù)制終點附近[8]。但是該基因的生理特征和應(yīng)用前景尚不明確。
本研究對AMETH_3452基因進(jìn)行了蛋白表達(dá)分析,對可能存在的保守位點進(jìn)行了解析,利用AMETH_3452蛋白序列對擬無枝酸菌屬內(nèi)76個菌株的同源序列進(jìn)行了系統(tǒng)發(fā)育分析,為該基因的功能解析和潛在的檢測方法應(yīng)用提供了基礎(chǔ)。
菌株A.methanolica239來自本實驗室保藏,使用高天瓊脂培養(yǎng)基(20 g·L-1淀粉,0.5 g·L-1L-天冬氨酸,1 g·L-1硝酸鉀,0.5 g·L-1三水合磷酸氫二鉀,0.5 g·L-1氯化鈉,0.5 g·L-1七水硫酸鎂,1 g·L-1氯化鈣和15 g·L-1瓊脂粉,pH 7.5)在30 ℃條件下復(fù)蘇培養(yǎng)2 d,隨后轉(zhuǎn)接至ISP2液體培養(yǎng)基(0.4%酵母浸出物,1%麥芽浸出物和0.4%葡萄糖)在30 ℃條件下培養(yǎng)2 d。使用細(xì)菌基因組提取試劑盒(天根生化科技有限公司),按照說明書提取基因組DNA。
載體pET-28a(5.3 kb,kan+)用NdeⅠ/HindⅢ雙酶切、去磷、膠回收純化后,以A.methanolica239基因組為模板,用高保真聚合酶phanta(南京諾唯贊生物科技股份有限公司)進(jìn)行PCR擴增(F:5′-AGCCATATGGTGCGCTCCCACA GCTATGAC-3′,R:5′-CGCAAGCTTTCAGCCTTCCG GGTCGGTCAC3′)后純化。用NdeⅠ/HindⅢ雙酶切回收產(chǎn)物進(jìn)行黏性末端連接,轉(zhuǎn)化大腸桿菌DH10B菌株,37 ℃培養(yǎng),篩選得到陽性轉(zhuǎn)化子。將構(gòu)建成功的質(zhì)粒和對照質(zhì)粒pET-28轉(zhuǎn)化到大腸桿菌Rosetta(DE3)中,37 ℃過夜培養(yǎng)后獲得單克隆。接種單克隆至5 mL液體LB培養(yǎng)基中,30 ℃過夜培養(yǎng),按1%比例轉(zhuǎn)接到50 mL的LB液體培養(yǎng)基中,30 ℃培養(yǎng)至D600約為0.8時加入終濃度為0.2 mmol的IPTG,調(diào)整搖床溫度至16 ℃過夜培養(yǎng)。離心收集菌體,超聲裂解細(xì)胞,分離上清和沉淀,其中沉淀用50 mL TE緩沖液重懸,最后分別取樣進(jìn)行蛋白電泳。
AMETH_3452蛋白二級結(jié)構(gòu)預(yù)測使用PSIPRED server[16](http://bioinf.cs.ucl.ac.uk/psipred/);生理特性預(yù)測使用Expasy(http://web.expasy.org/protparam/);蛋白質(zhì)跨膜區(qū)預(yù)測使用TMHMM,(http://www.cbs.dtu.dk/services/TMHMM/);信號肽的預(yù)測使用SignalP[17](http://www.cbs.dtu.dk/services/SignalP)。AMETH_3452基因在擬無枝酸菌中的同源序列參考之前的報道[8],對位分析使用Clustal W,去除非對位堿基后,使用BioEdit進(jìn)行保守區(qū)可視化。
AMETH_3452的同源蛋白序列通過在GenBank的NR庫上BLAST檢索直系同源蛋白,選擇所有全長匹配(匹配長度>95%)的擬無枝酸菌的直系同源蛋白。使用Clustal W進(jìn)行比對,通過MEGA X軟件[18]基于最大似然法(Maximum-likelihood method)構(gòu)建系統(tǒng)發(fā)育樹,進(jìn)化樹分支模式的穩(wěn)定性分析采用bootstrap法,重復(fù)次數(shù)為1 000。外類群使用Pseudonocardiadioxanivorans菌株的同源蛋白。
通過對18個擬無枝酸菌不同種的基因序列對比發(fā)現(xiàn),該基因的全長在792~861 bp,不同的基因序列同源性在79.23%~99.02%。通過比對分析后可以看出,在300~500 bp的位置序列較為保守(圖1中A),可以作為該屬的分子標(biāo)記,用于核酸檢測。該蛋白序列通過預(yù)測后發(fā)現(xiàn)不穩(wěn)定系數(shù)為35.66(<40),說明蛋白性質(zhì)穩(wěn)定,親水性為-0.177,說明可溶性不好。預(yù)測到TMHs(跨膜螺旋)個數(shù)為0,即不存在跨膜區(qū),未預(yù)測到信號肽區(qū)域。在115位氨基酸之前主要的二級結(jié)構(gòu)以β-折疊為主,而在之后,α-螺旋增加(圖1中B)。另外,在蛋白的75~115位預(yù)測到結(jié)構(gòu)域,可能與水解酶相關(guān)。
圖1 AMETH_3452蛋白二級結(jié)構(gòu)預(yù)測與AMETH_3452基因保守性分析
AMETH_3452基因擴增后,通過NdeⅠ/HindⅢ雙酶切后黏性末端連接將基因序列構(gòu)建在表達(dá)載體pET-28a上,形成表達(dá)質(zhì)粒pTC17260,總長度為6 121 bp。AMETH_3452蛋白大小為29.2 KD,該蛋白和His標(biāo)簽融合表達(dá)(圖2中A)。表達(dá)宿主加入IPTG誘導(dǎo),裂解細(xì)菌通過蛋白電泳后發(fā)現(xiàn),AMETH_3452蛋白有表達(dá),并位于正確的可見條帶上(圖2中B)。在目標(biāo)產(chǎn)物的下方,仍有較明顯的蛋白條帶產(chǎn)生,可能存在其他基因被誘導(dǎo)表達(dá)的情況。另外,全細(xì)胞破碎后電泳,發(fā)現(xiàn)表達(dá)出的蛋白以包涵體的形式富集在沉淀中,但是仍有較多存在于上清中,為后期蛋白純化提供了有利條件。
圖2 AMETH_3452蛋白表達(dá)質(zhì)粒構(gòu)建與表達(dá)宿主上清液蛋白電泳
將AMETH_3452蛋白在NCBI數(shù)據(jù)庫比對后發(fā)現(xiàn),共檢索到76條擬無枝酸菌的直系同源蛋白,與AMETH_3452的同源性均大于77.82%。聚類分析后(圖3)可知,Amycolatopsiseurytherma[13]、Amycolatopsissp.ATCC 39116、Amycolatopsismethan-olica、Amycolatopsisdeserti、Amycolatopsisgranulosa、Amycolatopsisviridis、Amycolatopsisendophytica[19]菌株在同一個分支,為AMS(甲基擬無枝酸菌分支)。另外有49個菌株聚類在AOS分支(東方擬無枝酸菌分支)上。而AOS又可以分成穩(wěn)定的2個分支,自展值分別是83和99,可靠性較高。其中一支命名為AMEDS(地中海擬無枝酸菌分支),以A.mediterranei為代表,包括19個菌株;另一支為AORIS(東方擬無枝酸菌分支,屬于AOS的小分支),以A.orientalis為代表,共包括30個菌株。此外,從系統(tǒng)發(fā)育樹的根部可以看出,Amycolatopsisarida與其他菌株距離較遠(yuǎn)。該菌株在2018年被Imen Nouioui從Yuhushielladeserti重新命名為A.arida[15]。此外從整體上看,多個種名未命名的菌株均聚類在進(jìn)化樹中,與已有種名的菌株序列都有差異,同樣也說明該蛋白序列作為系統(tǒng)發(fā)育分析標(biāo)記具有較強的分辨率和準(zhǔn)確性。
圖3 AMETH_3452蛋白序列在擬無枝酸菌中系統(tǒng)發(fā)育分析
16S rDNA序列廣泛應(yīng)用于細(xì)菌的系統(tǒng)發(fā)育分析,但由于部分細(xì)菌基因組中存在多個不同的16S rDNA序列拷貝,給系統(tǒng)發(fā)育樹分支結(jié)構(gòu)造成了困擾[20-21]。本文利用一個廣泛存在于放線菌的具有269個氨基酸的保守蛋白AMETH_3452在擬無枝酸菌中進(jìn)行了系統(tǒng)發(fā)育分析,得到了穩(wěn)定的分支結(jié)構(gòu),與前人報道的系統(tǒng)發(fā)育樹具有一定相似性[5,6,14]。使用該蛋白序列在AOS中將菌株聚類,可明確將其分成2個分支AMEDS和AORIS。由于該蛋白序列的獲得主要依據(jù)NCBI數(shù)據(jù)庫中的全基因組序列,本文采用的序列相比16S rDNA的普適性具有一定劣勢,沒有窮盡該屬所有的菌株。
在擬無枝酸菌中,AMETH_3452基因序列保守性較高,下一步可以作為分子檢測的標(biāo)記應(yīng)用。此外,AMETH_3452蛋白具有一定的可溶性,未來可進(jìn)一步研究其生理功能。鑒于該蛋白的保守性,下一步擬通過在放線菌其他目中進(jìn)行更廣泛的系統(tǒng)發(fā)育分析,驗證該蛋白作為分子標(biāo)記的適用性和效果。