余水靜, 彭艷平, 鄧揚(yáng)悟, 郭燕華, 梁長利, 歐陽城添
(江西理工大學(xué)資源與環(huán)境工程學(xué)院,江西 贛州341000)
腸炎沙門氏菌 (Salmonella enterica serovar Enteritidis,SE)是腸道沙門氏菌(S.enteriea)重要血清型之一,能引起畜禽的胃腸炎以及人類腸炎[1].SE已成為近年來引起胃腸炎和食物中毒最為常見的病原菌之一.當(dāng)前SE的檢測鑒定主要基于傳統(tǒng)方法,即增菌培養(yǎng)、選擇分離、生化鑒定、血清分型,通常耗時5~7 d,不利于及時診斷病情控制疫情蔓延[2].鑒于SE嚴(yán)重威脅人類生命健康,國內(nèi)外學(xué)者一直致力于SE快速檢測技術(shù)的研究.采用PCR分子方法對沙門氏菌進(jìn)行血清分型,只用一個簡單的PCR反應(yīng)在數(shù)小時內(nèi)即可完成,省時省力、操作簡便、成本低廉,而且結(jié)果判斷準(zhǔn)確[3-4],可滿足SE流行病學(xué)研究和食品安全預(yù)警的實(shí)際需求.
PCR檢測方法的準(zhǔn)確度主要取決于檢測基因的特異性,因此,挖掘特異性基因是構(gòu)建PCR檢測方法的關(guān)鍵.測序技術(shù)的快速發(fā)展使得越來越多的微生物基因組信息可利用,目前,GenBank數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/genomes/lproks.cgi)中已公布有45個完全測序的沙門氏菌菌株基因組信息.如此豐富的基因組信息有助于通過比較基因組學(xué)方法有效地挖掘SE血清型特異性基因.為此,擬利用比較基因組學(xué)工具挖掘出SE血清型特異性基因,并從生物信息學(xué)角度分析這些基因特征,以期為SE血清型分子鑒定提供檢測靶點(diǎn)和理論依據(jù).
從美國國立生物技術(shù)信息中心網(wǎng)站(National Center for Biotechnology Information, NCBI)(http://www.ncbi.nlm.nih.gov/genomes/lproks.cgi)收集已完全測序的沙門氏菌共45菌株基因組信息,包括1株SE、2株邦戈?duì)柹抽T氏菌(S.bongori)和42株腸道沙門氏菌(S.enterica),其中腸道沙門氏菌涉及21種血清型.
利用文獻(xiàn)[5]中特異性靶點(diǎn)挖掘平臺SMM-system挖掘SE血清型特異性基因,具體過程為:去除SE全基因組序列,將其余44個沙門氏菌基因組并成一個基因組數(shù)據(jù)庫;以SE的4318個蛋白編碼序列(Coding Sequence,CDS)作為查詢序列,進(jìn)行BLASTN核酸序列比對,如果比對返回來的CDS最低e-value≥0.001,那么這個CDS對于數(shù)據(jù)庫任何核酸序列很少或沒有序列相似性,鑒定該CDS為特異性基因,對這些基因進(jìn)行NCBI網(wǎng)站在線BLASTN核酸比對,最終確定SE血清型特異性基因,挖掘流程見圖1.
圖1 SE血清型特異性基因挖掘流程
對鑒定的SE血清型特異性基因進(jìn)行生物信息學(xué)分析,包括利用ProtParam在線工具計(jì)算SE血清型特異性基因的理化性質(zhì)[6];蛋白二級結(jié)構(gòu)使用Hnn Secondary Prediction Method程序預(yù)測[7];TMpredict進(jìn)行蛋白質(zhì)序列跨膜區(qū)分析[8];利用SignalP v4.0進(jìn)行信號肽預(yù)測[9];利用PSORT進(jìn)行亞細(xì)胞定位分析[10].將血清型特異性基因氨基酸序列提交至NCBI網(wǎng)站PDB數(shù)據(jù)庫進(jìn)行PSI-BLAST比對,以獲得同源性PDB-ID,利用SWISS-MODEL在線服務(wù)器預(yù)測血清型特異性基因編碼的蛋白三級結(jié)構(gòu)[11].
通過BLASTN序列比對,最終鑒定了6個SE血清型特異性基因(見表1),通過分析這些基因的功能注釋,發(fā)現(xiàn)其中4個基因(SEN1382,SEN1936,SEN1945和SEN1959)編碼的蛋白與噬菌體(phage)相關(guān),而其余2個基因?yàn)榧僭O(shè)蛋白(Hypothetical Protein).
對6個SE血清型特異性基因編碼的蛋白理化性質(zhì)進(jìn)行了分析 (見表2),等電點(diǎn)(Isoelectric Point,PI)分析顯示:3個血清型特異性基因蛋白等電點(diǎn)小于7.0,呈酸性,其中SEN1388等電點(diǎn)最低(4.60);另外3個血清型特異性基因蛋白等電點(diǎn)大于7.0,呈堿性,其中SEN1945最高(9.13).脂溶指數(shù)(Aliphatic index)分析顯示:其中4個血清型特異性基因蛋白脂溶指數(shù)大于100,為親水性蛋白;其余2個血清型特異性基因蛋白脂溶指數(shù)均小于100,為疏水性蛋白.不穩(wěn)定指數(shù)(Instability index)分析表明:3個血清型特異性基因蛋白不穩(wěn)定指數(shù)大于40,為不穩(wěn)定蛋白;其余3個血清型特異性基因蛋白不穩(wěn)定指數(shù)小于40,為穩(wěn)定蛋白.
表1 挖掘的SE血清型特異性基因信息
表2 SE血清型特異性基因理化性質(zhì)
對6個SE血清型特異性基因蛋白質(zhì)二級結(jié)構(gòu)分析表明(見表3),這些血清型特異性基因蛋白二級結(jié)構(gòu)均由α-螺旋 (Alpha helix)、擴(kuò)展鏈(Extended strand)和無規(guī)則卷曲(Random coil)共 3種形式組成,其百分比均為:α-螺旋〉無規(guī)則卷曲〉擴(kuò)展鏈.
表3 SE血清型特異性基因二級結(jié)構(gòu)、跨膜區(qū)及亞細(xì)胞定位預(yù)測
對6個SE血清型特異性基因編碼的蛋白序列進(jìn)行了跨膜區(qū)預(yù)測和亞細(xì)胞定位分析(見表3),跨膜區(qū)預(yù)測結(jié)果表明:SEN1382和SEN1945基因所編碼的噬菌體膜蛋白 (Phage Membrane Protein)均存在跨膜區(qū),其中SEN1382存在2個跨膜區(qū),SEN1945存在4個跨膜區(qū),預(yù)測結(jié)果與這兩個基因功能注釋均為膜蛋白相一致;其余4個SE血清型特異性編碼的蛋白均不存在跨膜區(qū).
亞細(xì)胞定位分析結(jié)果表明:SEN1382和SEN1945基因編碼的噬菌體膜蛋白(Phage Membrane Protein)位于細(xì)菌內(nèi)膜 (Bacterial Inner Membrane)上,其余4個基因編碼的蛋白位于細(xì)胞質(zhì)(Bacterial Cytoplasm)中,亞細(xì)胞定位結(jié)果進(jìn)一步證實(shí)了跨膜區(qū)預(yù)測結(jié)果,并同時佐證了基因功能注釋.此外,信號肽分析結(jié)果表明,所有6個SE血清型特異性基因編碼的蛋白均無信號肽,可以推測這些基因編碼的蛋白不能分泌到細(xì)胞外.
將6個SE血清型特異性基因氨基酸序列提交至NCBI網(wǎng)站PDB數(shù)據(jù)庫進(jìn)行PSI-BLAST比對,獲得6個同源性PDB-ID為:1ZTM_A(SEN1382),3KZ3_A(SEN1383),4M3N_A (SEN1388),4C98_A(SEN1936),3R9C_A(SEN1945),2OWL_A(SEN1959).利用SWISS-MODEL在線服務(wù)器預(yù)測SE血清型特異性基因編碼的蛋白三級結(jié)構(gòu),結(jié)果只獲得SEN1383和SEN1959兩個基因的三級結(jié)構(gòu)模型(圖2),其余4個基因的三級結(jié)構(gòu)沒有預(yù)測結(jié)果.對這兩個基因的三級結(jié)構(gòu)預(yù)測模型進(jìn)行質(zhì)量評價,評估模型可信度區(qū)間為0~1之間(圖3)[11].研究中只預(yù)測出兩個基因的三級結(jié)構(gòu),可能與基因序列的特異性有關(guān),在比對獲得PDB-ID時發(fā)現(xiàn)其相似度不是很理想,因而還需其它分析方法進(jìn)一步證實(shí).
圖2 SE血清型特異性基因SEN1383和SEN1959的三級結(jié)構(gòu)模型
圖3 SE血清型特異性基因SEN1383和SEN1959的三級結(jié)構(gòu)模型評價
沙門氏菌血清型已超過2600種,呈現(xiàn)出明顯的多樣性特征[12].研究表明,噬菌體在沙門氏菌血清型多樣性形成過程中扮演著非常重要的角色[13].通過與鼠傷寒沙門氏菌 (S.enterica serovar Typhimurium LT2)基因組比較發(fā)現(xiàn),SE含有獨(dú)有的許多原噬菌體元件 (Prophage element)[14].挖掘出的SE血清型特異性基因有4個與噬菌體相關(guān),與該報(bào)道觀點(diǎn)一致.此外,鑒定的6個SE血清型特異性基因不存在其它沙門氏菌血清型菌株中,因而可以作為PCR檢測靶標(biāo)用于構(gòu)建SE分子鑒定方法.
靶標(biāo)序列的特異性是特異性檢測SE的關(guān)鍵.一個多重PCR方法已構(gòu)建用于特異性檢測SE,其靶向基因?yàn)閕nv A,hil A,spv A,sdf和16S rRNA基因[15].由于靶標(biāo)基因特異性問題,多重PCR方法避免了由單個基因單重PCR方法無法把所有血清型區(qū)分開的難題.然而,由于基因水平遷移或突變等原因,靶標(biāo)的不穩(wěn)定性問題也日益突出,因而需要更多的檢測靶點(diǎn)來檢測SE.研究中挖掘出的SE血清型特異性基因理論上可以用于構(gòu)建PCR方法特異性檢測SE,但仍需進(jìn)一步設(shè)計(jì)引物構(gòu)建PCR方法進(jìn)行實(shí)驗(yàn)驗(yàn)證.
沙門氏菌的血清型由O抗原和H抗原以及Vi抗原聯(lián)合所決定,抗原的差異導(dǎo)致了血清型的多樣性.抗原的多態(tài)性是由其編碼基因的多樣性決定的,主要是rfb、fliC和fljB等基因及其基因簇中一些相關(guān)基因的序列存在著差異,甚至有些基因的編碼序列完全不同而只有編碼的蛋白的高級結(jié)構(gòu)具有相似性[16].SE作為一個獨(dú)立的血清型必然有獨(dú)特的抗原相關(guān)基因,研究中挖掘的6個SE血清型特異性基因4個涉及到噬菌體相關(guān)蛋白,2個為假設(shè)蛋白.當(dāng)前,并沒有理由推測這些血清型特異性基因與O抗原、H抗原或Vi抗原的生物合成相關(guān).因此,沙門氏菌血清型多樣性的形成仍需從多角度研究.
(1)通過比較基因組學(xué)方法,挖掘獲得了6個SE血清型特異性基因,可為鑒定SE分子鑒定提供靶標(biāo).
(2)鑒定的4個SE血清型特異性基因編碼的蛋白與噬菌體相關(guān),因而可以推測,噬菌體與沙門氏菌血清型多樣性的形成密切相關(guān).
(3)對SE血清型特異性基因的理化性質(zhì)、二級結(jié)構(gòu)、亞細(xì)胞定位、信號肽和跨膜區(qū)分析,顯示出SE血清型特異性基因具有多樣性特征,暗示了沙門氏菌血清型形成過程的復(fù)雜性.
[1]Garcia-Huidobro D,Carreno M,Alcayaga S,et al.Clinical and epidemiological description of severe outbreak of foodborne infection by Salmonella Enteritidis[J].Revista Chilena de Infectologia: Organo Oficial de la Sociedad Chilena de Infectologia,2012,29(2):132-137.
[2]曹際娟.食品微生物學(xué)與現(xiàn)代檢測技術(shù)[M].大連:遼寧師范大學(xué)出版社,2006.
[3]Cardona-Castro N,Sanchez-Jimenez M,Lavalett L,et al.Development and evaluation of a multiplex polymerase chain reaction assay to identify Salmonella serogroups and serotypes[J].Diagnostic Microbiology and Infectious Disease,2009,65(3):327-330.
[4]Levy H,Diallo S,Tennant S M,et al.PCR method to identify Salmonella enterica serovars Typhi,Paratyphi A,and Paratyphi B among Salmonella Isolates from the blood of patientswith clinical enteric fever[J].JournalofClinicalMicrobiology,2008,46(5):1861-1866.
[5]Yu S,Liu W,Shi C,et al.SMM-system:A mining tool to identify specific markers in Salmonella enterica[J].Journal of Microbiological Methods,2011,84(3):423-429.
[6]Wilkins M R,Gasteiger E,Bairoch A,et al.Protein identification and analysis tools in the ExPASy server[J].Methods in Molecular Biology,1999,112:531-552.
[7]Combet C,Blanchet C,Geourjon C,et al.NPS@:network protein sequence analysis[J].NPS@:Network Protein Sequence Analysis,2000,25(3):147-150.
[8]Krogh A,Larsson B,Von Heijne G,et al.Predicting transmembrane protein topology with a hidden Markov model:application to complete genomes[J].Journal of Molecular Biology,2001,305(3):567-580.
[9]Petersen T N,Brunak S,Von Heijne G,et al.SignalP 4.0:discriminating signal peptides from transmembrane regions[J].Nature Methods,2011,8(10):785-786.
[10]Nakai K,Horton P.PSORT:a program for detecting sorting signals in proteins and predicting their subcellular localization[J].Trends in Biochemical Sciences,1999,24(1):34-36.
[11]Benkert P,Biasini M,Schwede T.Toward the estimation of the absolute quality of individual protein structure models[J].Bioinformatics,2011,27(3):343-350.
[12]Guibourdenche M,Roggentin P,Mikoleit M,et al.Supplement 2003-2007(No.47)to theWhite-Kauffmann-LeMinor scheme[J].Research in Microbiology,2010,161(1):26-29.
[13]Thomson N,Baker S,Pickard D,et al.The role of prophage-like elements in the diversity of Salmonella enterica serovars[J].Journal ofMolecular Biology,2004,339(2):279-300.
[14]Thomson N R,Clayton D J,Windhorst D,et al.Comparative genome analysis of Salmonella Enteritidis PT4 and Salmonella Gallinarum 287/91 provides insights into evolutionary and host adaptation pathways[J].Genome Research,2008,18(10):1624-1637.
[15]Trafny E A,Kozlowska K,Szpakowska M.A novelmultiplex PCR assay for the detection of Salmonella enterica serovar Enteritidis in human faeces[J].Letters in Applied Microbiology,2006,43(6):673-679.
[16]Liu D,Verma N K,Romana L K,et al.Relationships among the rfb regions of Salmonella serovars A,B,and D[J].Journal of Bacteriology,1991,173(15):4814-4819.