王姝懿,趙學亮,孫 柯,呼和巴特爾,王文龍
布魯氏菌病(Brucellosis)是由布魯氏菌引起的一種嚴重的人獸共患病,給人類健康及畜牧業(yè)帶來嚴重威脅。目前,疫苗接種是防控布病的重要手段之一。中國在布病嚴重流行區(qū)廣泛使用S2和A19疫苗。牛種疫苗布魯桿菌A19是弱毒疫苗株,1923年經(jīng)過自然減毒形成,毒力穩(wěn)定且免疫保護效果優(yōu)良,從1940年開始在中國推廣使用。而美國科學家發(fā)現(xiàn)另一種疫苗株S19,在國際上應用廣泛且更加安全,是對赤蘚糖醇敏感的菌株,也是迄今為止最有效的疾病疫苗[1]。大多數(shù)S19均有相應缺失序列(702 bp),在赤蘚醇相關的操縱子上有缺失,我國使用的A19和S19相比沒有缺失,在缺少赤蘚糖醇的培養(yǎng)基上可良好生長。
對于防控布病,疫苗的有效開發(fā)意義深遠。全基因組測序可以從根本上探究其基因組全面信息。本研究測序A19全基因組,并進行不同種之間的比較基因組學解析,篩選出基因在不同種型之間的差異。通過各種數(shù)據(jù)庫對其進行分類和注釋分析,預測其基因功能進而挖掘毒力相關因子。為A19后續(xù)研究給予有利的數(shù)據(jù)支撐,也為疫苗的改良、開發(fā)以及鑒別診斷方法的建立奠定理論依據(jù)。
1.1菌株 A19(齊魯動保有限公司)。
1.2主要試劑 TIANamp Bacteria DNA Kit 細菌基因組 DNA 提取試劑盒、核酸染料、瓊脂糖、λ-Hind Ⅲ digest DNA marker (Takara公司),DL2000(Takara公司)。
1.3提取DNA及凝膠電泳檢測 根據(jù)制造商的說明,使用TIANamp Bacteria DNA Kit(Tiangen Biotech Co.,Ltd.,Beijing,China)提取純化總基因組DNA。
1.4布魯氏菌A19全基因組檢測 主要完成對A19基因組 DNA樣品的測序、功能基因預測注釋以及串聯(lián)重復序列的預測等工作(Hangzhou Lianchuan Biological Technology Co., Ltd)。
1.5A19與豬羊牛種的比較基因組學分析 A19與豬種(VBI22、1330)、羊種(16M、 M28)和牛種(2308、S19、9-941、A13334)分別進行不同種型的比較基因組學解析,篩選出共有、特有基因以及牛種毒力基因。
2.1樣品DNA提取及檢測 提取和純化A19基因組DNA,用瓊脂糖凝膠電泳(1%)檢測(2 μL)樣品DNA,結(jié)果見圖1。經(jīng)分光光度法檢測DNA后,OD260/280=1.93, 濃度137.6 ng/μL,均符合測序標準。
M1:標準分子量 DNA DL2000;M2:標準分子量DNA λ-Hind Ⅲ digest; 1、2、3、4:A19基因組圖1 A19疫苗株基因組凝膠電泳Fig.1 Agarose gel electrophoresis of Brucella vaccine strain A19 genome DNA
2.2.1A19基因組序列的基本信息 通過Illumina Hiseq 4000平臺測序,A19共得到2.83G原始數(shù)據(jù), 經(jīng)過過濾為2.59G,測序平均深度790×。組裝結(jié)果表明,A19基因組3 286 167 bp, GC含量57.25%。組分分析發(fā)現(xiàn),預測出編碼基因3 371個,總長度2 829 795 bp且平均長度854 bp,占基因組全長的86.11%。tRNA預測數(shù)55個,rRNA12個。散在重復序列用RepeatMasker預測,A19預測出52個平均長度176 bp的序列。對串聯(lián)重復序列預測用 TRF 軟件,A19共預測出75個串聯(lián)重復序列,且60個小衛(wèi)星(Minisatellite DNA) DNA, 并沒有預測到微衛(wèi)星(Microsatellite DNA)DNA。A19組裝結(jié)果詳見表1,基因組序列預測見表2。
表1 A19基因組測序組裝結(jié)果統(tǒng)計
Tab.1 Assembly results of genome sequence ofBrucellavaccine strain A19
NameA19-Ch1A19-Ch2No. of all scaffolds11Base in all scaffolds21239971162170G+C content(%)57.1657.34N rate00
表2 A19基因預測結(jié)果統(tǒng)計
Tab.2 Gene prediction results ofBrucellavaccine strain A19
A19-Ch1A19-Ch2Gene amont(#)2 1641151Total total length/bp1 810 4221 019 373Gene average length/bp836885Gene density/bp1.020.99GC content in gene region/%58.3058.40Gene / Genome /%85.2087.70Intergenic region length/bp313 575142 797GC content in intergenic region/%50.0049.60Intergenic region length/ genome/%14.8012.30
2.2.2A19基因組的COG預測分析 A19與COG庫進行比對,與其相關的基因得到共2 560個,將這些基因信息依據(jù)COG分類標準進行分類,A19基因組被劃分為22類。
染色質(zhì)動力學、染色質(zhì)結(jié)構 (B),共1個基因;能量轉(zhuǎn)化產(chǎn)生 (C),共177個基因;細胞周期分裂、調(diào)控、染色體的分配 (D),共27個基因;氨基酸運輸(E),共306個基因;核苷酸代謝轉(zhuǎn)運(F),共73個基因;碳水化合物運輸 (G),共154個基因;輔酶代謝轉(zhuǎn)運 (H),共110個基因;脂質(zhì)代謝運輸 (I),共93個基因;核糖體合成及結(jié)構 (J),共164個基因;轉(zhuǎn)錄(K),共155個基因;復制、重組和修復(L),共125個基因;細胞膜壁的合成(M),共151個基因;細胞的運動(N),共34個基因;翻譯后蛋白質(zhì)折疊、修飾周轉(zhuǎn)(O),共125個基因;無機離子代謝轉(zhuǎn)運 (P),共182個基因;次級代謝產(chǎn)物運輸、合成、分解 (Q),共47個基因;一般性的預測功能 (R),195個基因;未知的功能 (S),294個基因;轉(zhuǎn)導信號機制(T),共67個基因;細胞內(nèi)及膜泡轉(zhuǎn)運(U),共42個基因;防御機制(V),共37個基因;細胞外結(jié)構(W),共1個基因。
2.2.3A19基因組的KEGG代謝通路分類 本研究比對KEGG庫,A19中與其對應的基因2 544個,將這些基因劃分為33類代謝通路,其分別對應不同基因序列表達產(chǎn)物。每一類基因的功能和數(shù)量見圖2:排泄系統(tǒng),共1個基因;消化系統(tǒng),共1個基因;神經(jīng)系統(tǒng),共6個基因;循環(huán)系統(tǒng),共3個基因;環(huán)境適應系統(tǒng),共6個基因;內(nèi)分泌系統(tǒng),共7個基因;合成次級代謝產(chǎn)物,共15個基因;合成糖類,共27個基因;能量代謝,共149個基因;全球概覽圖,共653個基因;氨基酸代謝,共218個基因;聚酮類及萜類代謝,共36個基因;核苷酸的代謝,共89個基因;共208個基因;其他氨基酸的代謝,共62個基因;外源化學物新陳代謝及降解,共61個基因;脂質(zhì)代謝,共72個基因;碳水化合物合成,共187個基因;輔助因子及維生素代謝,共156個基因;心血管疾病,共2個基因;神經(jīng)退行性疾病,共9個基因;內(nèi)分泌和代謝疾病,共9個基因;傳染性疾病,共18個基因;癌癥,共12個基因;轉(zhuǎn)錄,共4個基因;翻譯,共83個基因;折疊、分類和降解,共40個基因;復制和修復,共42個基因;膜轉(zhuǎn)運,共228個基因;信號轉(zhuǎn)導,共68個基因;代謝轉(zhuǎn)運及分解,共7個基因;細胞運動,共39個基因;細胞生長和死亡,共26個基因。
2.3A19與其它布魯氏菌的比較基因組學分析 A19與豬羊牛種共9株菌進行不同種型之間的比較基因組學分析,菌株統(tǒng)計信息見表3。結(jié)果顯示:A19,S19, 2308,9-941和A13334之間的共有基因有2 819個,特有基因有693個,非冗余基因有5 488個;A19,1330,VBI22, 16M和M28之間的共有基因有411個,特有基因有4 787個,非冗余基因有10 003個。可見不同種布魯桿菌之間在基因水平上還是存在很大差異的,即使同種不同型別之間也存在一定差異,且種間差異更大。
表3 6株菌基本信息統(tǒng)計結(jié)果
Tab.3 Basic information statistical results of 6 strains of bacteria
StrainsChrsSizeGC(%)GeneProteinA1923.2957.23 3713 126133023.3257.23 3583 164VBI2223.3257.23 3613 167M2823.3157.23 3813 14416M23.2957.23 3723 134230823.2857.23 3753 1539-94123.2957.23 3763 153S1923.2857.23 3793 151A1333423.2957.23 3863 168
本研究針對5株牛種野毒和疫苗株進行深入分析,在蛋白質(zhì)組之間進行成對和相互比較以鑒定100%相同的基因。在693個特有基因中,總共252 199和112個基因分別在野毒株9-941、A13334和2308中被鑒定為特異。且此3株野毒株中功能被注釋為假想蛋白的基因分別為39、24和9個。同時對具有明確功能定義的剩余基因進行文獻檢索以確定這些基因是否具有毒性。通過篩選,在功能明確的特異基因中,超過一半基因編碼與生物體基本生命周期有關的各種酶,其中,有幾種基因可能與毒力有關。對于9-941、A13334和2308這3株菌的毒力基因,其詳細功能注釋列于表4中。
圖2 A19基因組基因KEGG代謝通路分類Fig.2 KEGG pathway classification for genes of Brucella vaccine strain A19
上述毒力基因都可作為區(qū)分野毒株和疫苗株的重要依據(jù)。在這些毒力基因中,以ABC轉(zhuǎn)運蛋白(ABC-transporter-permease)、ATP結(jié)合蛋白(ATP-binding-protein)、雙組分轉(zhuǎn)錄調(diào)節(jié)因子(two-component-transcriptional-regulator)、鞭毛蛋白(flagellar protein)和 IV型分泌系統(tǒng)virB5蛋白等為主要毒力因子。它們會直接或間接影響生物機體的代謝和轉(zhuǎn)運系統(tǒng)。這些差異基因在野毒株中是特異的,意味著在疫苗株中缺失相應的功能,這可能是疫苗A19和S19減毒的原因之一,也為后續(xù)診斷方法的建立提供數(shù)據(jù)保證。
表4 牛種野毒株毒力基因
Tab.4 Virulence genes ofBrucellaabortusstrains
B.abortusstrainsGenesFunction9-941BRUAB_RS00525 (cgs)-cyclic-beta-1-2-glucan-synthetaseBRUAB_RS01455 (fleS/flrB)-sensory-box-sensor-histidine-kinaseBRUAB_RS01480 (allC)-allantoate-amidohydrolaseBRUAB_RS01530 (fadD13)-fatty-acid-CoA-ligaseBRUAB_RS15740 (pvdH)-2,4-diaminobutyrate-4-transaminase-BRUAB_RS02540 (wbpL)-glycosyl-transferase,-group-4-family-proteinBRUAB_RS02665 (pmm)-phosphomannomutaseBRUAB_RS03005 (phoQ)-sensor-kinase-proteinBRUAB_RS03040 (mprA)-two-component-transcriptional-regulator,-winged-helix-familyBRUAB_RS03045 (mprB)-two-component-sensor-kinase-MprBBRUAB_RS03060 (gacS)-sensor-histidine-kinase/response-regulator-GacS表4(續(xù))B.abortusstrainsGenesFunctionBRUAB_RS04200 (bscS)-periplasmic-solute-binding-proteinBRUAB_RS04595 (hasF)-ABC-transporter-permeaseBRUAB_RS05150 (farA)-fatty-acid-resistance-protein-ABRUAB_RS15760 (allR)-DNA-binding-transcriptional-repressor-AllRBRUAB_RS15850 (sugC)-sugar-ABC-transporter-ATP-binding-protein-SugCBRUAB_RS05750 (CbuK_0945)-hypothetical-proteinBRUAB_RS05990 (tuf)-elongation-factor-TuBRUAB_RS06330 (hmuS)-CobN/magnesium-chelatase-family-proteinBRUAB_RS06535 (ddrA)-daunorubicin-resistance-ABC-transporter-ATPase-subunitBRUAB_RS07120 (sigA/rpoV)-RNA-polymerase-sigma-factorBRUAB_RS07530 (mbtI)-anthranilate-synthase-component-IBRUAB_RS07680 (bplA)-probable-oxidoreductaseBRUAB_RS07715 (hitB)-iron(III)-transport-system-permease-protein-hFbpBBRUAB_RS07850 (vceA)-putative-cytoplasmic-proteinBRUAB_RS08040 (adeF)-RND-efflux-transporterBRUAB_RS08550 (hcnC)-hydrogen-cyanide-synthase-HcnCBRUAB_RS08885 (cfcV)-prepillin-peptidaseBRUAB_RS09030 (essC)-FtsK/SpoIIIE-family-proteinBRUAB_RS09305 (YPA_2067)-histidine-transport-system-permease-protein-HisQBRUAB_RS09985 gacS)-multi-sensor-hybrid-histidine-kinaseBRUAB_RS10460 (entD)-ENTEROBACTIN-SYNTHETASE-COMPONENT-DBRUAB_RS10900 (bplA)-probable-oxidoreductaseBRUAB_RS17155 (fliG)-putative-flagellar-motor-switch-protein-FliGBRUAB_RS11125 (flgI)-flagellar-P-ring-protein-FlgIBRUAB_RS17175 (yapJ)-autotransporter-protein-YapJBRUAB_RS11740 (ddrA)-daunorubicin-resistance-ABC-transporter-ATPase-subunitBRUAB_RS13155 (BAbS19_II05480)-Glycerol-3-phosphate-binding-periplasmic-protein-precursorBRUAB_RS13665 (bprC)-AraC-family-transcriptional-regulatorBRUAB_RS14130 (cfl)-coronafacic-acid-synthetase,-ligase-component
BRUAB_RS14260 (bplA)-probable-oxidoreductaseBRUAB_RS14400 (katA)-catalaseBRUAB_RS14465 amino-acid-polyamine-organocation-(APC)-supeorfamily-proteinBRUAB_RS14490 (adeG)-RND-family-efflux-transporterBRUAB_RS14590 (bplA)-probable-oxidoreductaseBRUAB_RS14615 (lpqY)-Probable-sugar-ABC-transporterBRUAB_RS14635 (narG)-nitrate-reductase,-alpha-subunitBRUAB_RS14740 (ddrA)-daunorubicin-resistance-ABC-transporter-ATP-binding-subunitBRUAB_RS14975 (oppA)-hypothetical-proteinBRUAB_RS15320 (pdhB)-Pyruvate-dehydrogenase-(lipoamide)A13334BAA13334_RS10830 (yapK)-autotransporter-protein-YapKBAA13334_RS14945 (adhD)-zinc-containing-alcohol-dehygenase-NAD-dependent,-AdhDdro表4(續(xù))B.abortusstrainsGenesFunctionBAA13334_RS11640 (flhB)-flagellar-biosynthetic-protein-FlhBBAA13334_RS14475 (sugC)-maltodextrin-import-ATP-bindingBAA13334_RS14795 (lngS)-LngSBAA13334_RS13850 (hmuV)-hemin-importer-ATPBAA13334_RS15005 (cyp143)-cytochrome-P450BAA13334_RS15890 (tuf)-elongation-factor-TuBAA13334_RS16075 (hlyB)-hemolysin-BBAA13334_RS01055 (badA/vomp/brp)-Surface-protein/Bartonella-adhesin-BadA-likeBAA13334_RS02065 (bplA)-probable-oxidoreductaseBAA13334_RS03085 (ptxR)-transcriptional-regulator-Ptx RBAA13334_RS03970(vctC)-iron(III)-ABC-transporter,-ATP-binding-proteinBAA13334_RS06480 (kdtB)-lipopolysaccharide-core-biosynthesis-proteinBAA13334_RS07015 (wbdA)-Glycosyl-transferase,-group-1BAA13334_RS07675 (htrB)-Bacterial-lipid-A-biosynthesis-acyltransferaseBAA13334_RS08640 (ETAE_0884)-putative-transglycosylase-signal-peptide-proteinBAA13334_RS09535 (mlsA1)-type-I-modular-polyketide-synthaseBAA13334_RS09580(wbmC)-putative-glutamine-a2308BAB_RS16955 (ctpV)-Putative-metal-cation-transporter-P-type-ATPase-CtpVBAB_RS16970 (fbpC)-iron-uptake-permease-ATP-binding-proteinBAB_RS17750 (ptxR)-transcriptional-regulator-PtxRBAB_RS18125 (pdhB)-pyruvate-dehydrogenase-E1-component-subunit-betaBAB_RS19590 (YPA_2067)-histidine-transport-system-permease-protein-HisQBAB_RS20005 (alcS)-putative-drug-resistance-translocaseBAB_RS22945 (lpg0769)-hypothetical-proteinBAB_RS24650 (mig-5)-putative-carbonic-anhydraseBAB_RS25310 (pbtD)-pyridoxal-phosphate-dependent-enzymeBAB_RS26665 (virB5)-attachment-mediating-protein-virB5BAB_RS27800 (hitC)-iron-utilization-ATP-binding-protein-hFbpCBAB_RS28740 (sugC)-sugar-ABC-transporter
BAB_RS29105 (sugC)-sugar-ABC-transporter-ATP-binding-protein-SugCBAB_RS30105 (msrA/B(pilB))-peptide-methionine-sulfoxide-reductaseBAB_RS30470 (hitB)-iron(III)-transport-system-permease-protein-hFbpBBAB_RS31210 (ipaH2.5)-invasion-plasmid-antigen,-fragmentBAB_RS31375 (sugB)-sugar-transport-integral-membrane-protein-ABC-transporter-SugBBAB_RS31825 (bhuA)-Pollen-allergen-Poa-pIX/Phl-pVI,-C-terminal
目前全基因組測序技術的發(fā)展在國內(nèi)外都十分迅速,為從研究單個基因水平向基因組整體功能等方向上奠定了基礎。2002年16M羊種布魯氏菌菌株首次完成測序工作[2],豬種1330[3]、牛種2308、9-941[4]也隨之公布了基因序列。測序結(jié)果顯示上述3種菌株具有很高的同源性,但無論在蛋白質(zhì)水平還是基因水平都存在異同[5]。在我國 A19是防控牛布病的重要疫苗[6],本研究測序A19全基因組、對生物信息學及比較基因組學匯總分析。為A19疫苗的后續(xù)實驗和毒力致弱機制提供了技術支持和理論保障。
通過測序和組分分析,A19疫苗株和其它種型相比均具有很高的相似度[7]。A19基因組預測出55個tRNA(41個位于ChrⅠ上,14個位于ChrⅡ上)和12個rRNA(8個位于ChrⅠ上,4個位于ChrⅡ上)。而2308、9-941以及S19的RNA預測數(shù)一致,均為55個tRNA(41個位于ChrⅠ上,14個位于ChrⅡ上)和9個rRNA(6個位于ChrⅠ上,3個位于ChrⅡ上)[8]。布魯氏菌104M的55個tRNA有40個位于ChrⅠ上,15個位于ChrⅡ上,且10個rRNA有7個位于ChrⅠ上,3個位于ChrⅡ上[9],作者推測這可能是由于不同的預測軟件或算法導致的。
通過COG庫注釋,得到2 560個基因,這些基因分別不同程度的參與合成和代謝過程,如細胞膜合成、能量轉(zhuǎn)化產(chǎn)生、轉(zhuǎn)錄、碳水化合物及氨基酸的運輸?shù)?,這些功能與A19的毒性關聯(lián)性很大。通過比對KEGG庫,代謝通路富集顯著的有氨基酸、膜運轉(zhuǎn)、能量、碳水化合物等,這些重要的功能或富集通路與胞內(nèi)運輸、毒力、基因表達的調(diào)控等都有不可或缺的關系。A19與8株菌(GenBank上公布)進行比較基因組學研究,表明即使近緣關系很近的菌株在核酸水平上也存在一些插入缺失的不同。同時找出牛種毒力基因,為疫苗減毒的研究提供了分析思路。
本研究分析了A19疫苗的分子進化、基因結(jié)構和毒力因子等特征,并預測了很多有意義的蛋白質(zhì)及相關的致病基因,豐富了布魯氏菌的基因組的各種數(shù)據(jù)庫。這些信息為疫苗的開發(fā)、診斷方法的建立以及后續(xù)的實驗研究提供分子基礎和指導方向。
利益沖突:無