王珊珊,石繼春,杜宗利,石剛,龍新星,葉強(qiáng),徐穎華
中國食品藥品檢定研究院衛(wèi)生部生物技術(shù)產(chǎn)品檢定方法及其標(biāo)準(zhǔn)化重點(diǎn)實(shí)驗(yàn)室,北京102629
右旋糖酐(dextran)也稱葡聚糖,是一種以葡糖苷鍵連接形成的高分子化合物,因其具有安全、無毒、生物相容性好等優(yōu)點(diǎn),在臨床上被廣泛用于代血漿或補(bǔ)鐵劑[1]。《中國藥典》二部(2020 版)中收載了右旋糖酐 20、40 和 70 及其不同制劑[2]。右旋糖酐制備方法主要有微生物發(fā)酵法和酶合成法,目前國內(nèi)臨床級右旋糖酐主要是由腸膜狀明串珠菌CMCC(B)34991(原編號為LM-1226)作為生產(chǎn)用菌種,發(fā)酵合成高分子葡聚糖,再經(jīng)酸水解、乙醇沉淀及烘干最終獲得不同分子量的右旋糖酐終產(chǎn)品[1,3]。
生產(chǎn)用菌種是藥品研究、生產(chǎn)和檢定的物質(zhì)基礎(chǔ),其質(zhì)量直接與藥物終產(chǎn)品的安全性和有效性密切相關(guān)[4]。腸膜狀明串珠菌能發(fā)酵糖類產(chǎn)生多種酸和醇,具有高產(chǎn)酸、抗氧化和拮抗致病菌等能力,被廣泛應(yīng)用于右旋糖酐和各種食品調(diào)味劑的生產(chǎn),并有望成為新型微生態(tài)制劑[1]。最近研究表明,腸膜明串珠菌包括4 個亞種:腸膜亞種(L.mesenteroides subsp.mesenteroides)、右旋葡聚糖亞種(L.mesenteroides subsp.dextranicum)、乳脂亞種(L.mesenteroides subsp.cremoris)和 L.mesenteroides subsp.jonggajibkimchii[5]。目前對腸膜狀明串珠菌生產(chǎn)用菌種的質(zhì)量控制主要包括形態(tài)觀察、培養(yǎng)特性和發(fā)酵率等傳統(tǒng)項(xiàng)目,缺乏菌株水平分子特征方面的評價(jià)。因此,基于藥品生產(chǎn)用菌種的菌株溯源、制劑工藝優(yōu)化以及檢定等方面考慮,了解該生產(chǎn)用菌種的分子特征和遺傳背景顯得尤為重要。本研究首次應(yīng)用高通量測序技術(shù),對右旋糖酐生產(chǎn)用菌種腸膜狀明串珠菌CMCC(B)34991 進(jìn)行全基因組序列測定,分析其基因組基本特征,與其他4 種亞種代表菌株進(jìn)行比較基因組學(xué)分析,并探討其系統(tǒng)發(fā)育進(jìn)化關(guān)系。
1.1 菌株 腸膜狀明串珠菌生產(chǎn)用菌種CMCC(B)34991 來自中國食品藥品檢定研究院的中國醫(yī)學(xué)細(xì)菌保藏管理中心。
1.2 主要試劑及儀器 10%含糖、蛋白胨及其瓊脂培養(yǎng)基由中國食品藥品檢定研究院北京三藥科技開發(fā)公司配制;其他試劑均為國產(chǎn)分析純;DNA 提取試劑盒購自德國QIAGEN 公司;TruSeqTMDNA Sample Prep Kit-Set A 和 TruSeq PE Cluster Kit 購自美國Illumina 公司;美國細(xì)菌培養(yǎng)箱為中儀國科(北京)科技有限公司產(chǎn)品;VITEK 全自動微生物生化鑒定儀為梅里埃診斷產(chǎn)品(上海)有限公司產(chǎn)品;Bruker MALDI Biotyper 系統(tǒng)為德國Bruker Daltonics 公司產(chǎn)品;超聲儀為美國Fisher 公司產(chǎn)品。
1.3 菌株形態(tài)觀察與生化鑒定 將CMCC(B)34991菌種接種于含糖、蛋白胨培養(yǎng)基復(fù)蘇,再轉(zhuǎn)接至其瓊脂平板培養(yǎng)基,觀察菌落形態(tài)、革蘭染色鏡檢,并使用VITEK 全自動微生物生化鑒定儀進(jìn)行生化鑒定。
1.4 基質(zhì)輔助激光解吸電離飛行時間質(zhì)譜分析 選取瓊脂平板上培養(yǎng)的第2 代單菌落,直接涂至清洗后的基質(zhì)輔助激光解吸電離飛行時間質(zhì)譜(MALDITOF MS)靶板上。覆蓋1 μL 70%甲酸水溶液,室溫下自然晾干。將1 μL HCCA 基質(zhì)溶液仔細(xì)涂敷在每個樣本上,室溫下晾干。將MALDI 靶板放入質(zhì)譜儀中進(jìn)行檢測分析。用儀器自帶Biotyper 軟件對所采集的譜圖進(jìn)行分析。當(dāng)Bruker Biotyper 系統(tǒng)分值≥1.7 時,認(rèn)為其結(jié)果高度可信。
1.5 16S rRNA 基因序列分析 取CMCC(B)34991菌種新鮮過夜培養(yǎng)物,按照DNA 提取試劑盒說明書提取細(xì)菌全基因組DNA,以其為模板,使用通用引物 27F(5′-AGAGTTTGATCMTGGCTCAG-3′)和1492R(5′-GGYTACCTTGTTACGACTT-3′)進(jìn)行擴(kuò)增,產(chǎn)物送北京中美泰和生物技術(shù)有限公司測序,最后將測序拼接結(jié)果提交NCBI 數(shù)據(jù)庫中進(jìn)行Blast 比對分析。
1.6 全基因組序列測定 使用illumina 公司的第2代solexa 測序技術(shù)進(jìn)行全基因組測序。取1 μg DNA,利用超聲儀打斷,切膠回收300 bp 片段,將純化的DNA 利用TruSeqTMDNA Sample Prep Kit-Set A制備文庫,并利用TruSeq PE Cluster Kit 進(jìn)行擴(kuò)增,最后在Illumina 機(jī)器上進(jìn)行測序反應(yīng)。應(yīng)用軟件velvet V1.2.03 對數(shù)據(jù)進(jìn)行拼裝,結(jié)合軟件glimmer 3.02 進(jìn)行基因預(yù)測;搜尋 NCBI 的 nr 庫、KEGG 蛋白數(shù)據(jù)庫以及SEED 蛋白數(shù)據(jù)庫進(jìn)行基因功能注釋,利用CDD 數(shù)據(jù)庫進(jìn)行直系同源簇(clusters of orthologous groups,COG)分類。通過KEGG 數(shù)據(jù)庫構(gòu)建代謝通路。
1.7 比較基因組學(xué)分析 將CMCC(B)34991 菌種拼接全基因組序列與已發(fā)表的4 種腸膜狀明串珠菌亞種代表株包括乳脂亞種ATCC 19254(ACKV0-1000000)、L.mesenteroidessubsp.jonggajibkimchii DRC-1506(CP014611-15)、右旋葡聚糖亞種DSM 20484(CP012009-10)和腸膜亞種 ATCC 8293(CP000414-15)進(jìn)行配對基因組的平均核苷酸一致性(average nucleotide identity,ANI)、DNA-DNA 雜交(DDH)以及共有與特有的基因比較分析。同時將上述5 株腸膜狀明串珠菌基因組與其他4 株明串珠菌屬細(xì)菌(L.pseudomesenteroides KCTC 3652、L.citreum KM20、L.gelidum subsp.gasicomitatum KG16-1 和L.kimchii IMSNU 11154)進(jìn)行核心基因的系統(tǒng)進(jìn)化樹分析。
2.1 腸膜狀明串珠菌生產(chǎn)用菌種的形態(tài)及生化特性 CMCC(B)34991 菌種在含糖瓊脂平板上的菌落無色透明、中間隆起、邊緣整齊。革蘭染色為陽性球菌,見圖1。生化鑒定結(jié)果為腸膜狀明串珠菌。
圖1 腸膜狀明串珠菌CMCC(B)34991 的革蘭染色分析結(jié)果(× 100)Fig.1 Gram staining of L.mesenteroides CMCC(B)34991 strain(× 100)
2.2 基質(zhì)輔助激光解吸電離飛行時間質(zhì)譜分析 3 個重復(fù)樣品分析結(jié)果的系統(tǒng)分值分別為2.326、2.358和2.425,均大于1.7,表明分析結(jié)果可靠,均鑒定為腸膜狀明串珠菌。
2.3 16S rRNA 基因序列分析 CMCC(B)34991 菌種16S rRNA 測序拼接結(jié)果經(jīng)NCBI 網(wǎng)站進(jìn)行Blast分析,發(fā)現(xiàn)與NCBI 數(shù)據(jù)庫中收錄的不同腸膜狀明串珠菌的16S rRNA 序列相似度均大于99%。進(jìn)一步將其與L.mesenteroides subsp.jonggajibkimchii DRC 1506、乳脂亞種ATCC 19254、腸膜亞種ATCC 8293和右旋葡聚糖亞種DSM 20484 四株亞種代表株的16S rRNA 序列比對分析,發(fā)現(xiàn)它們之間的核苷酸相似度分別為99.86%、99.79%、99.93%和99.93%。
2.4 全基因組序列分析 經(jīng)全基因組測序分析,共獲得5 673 333 個讀長片段,覆蓋其基因組大小500倍。對測序數(shù)據(jù)進(jìn)行拼裝,最終獲得36 個基因組contig片段,其中最大contig 片段為695 204 bp,平均每個contig 片段大小為58 365 bp。經(jīng)拼接比對分析發(fā)現(xiàn),CMCC(B)34991 菌種染色體全基因組序列全長為1 857 684 bp,同時通過結(jié)合軟件glimmer 3.02 進(jìn)行基因預(yù)測,最終在CMCC(B)34991 菌種基因組中鑒定出2 089 個基因,平均長度為889 bp。編碼基因占整個基因組序列的88.4%,其平均GC 含量為38.2%?;蚪M中非編碼基因間區(qū)域大小為243 467 bp,在基因組序列中占比為11.6%,基因間區(qū)域GC 含量為32.0%。在非編碼RNA 中鑒定出44 個tRNA 和3 個 rRNA 序列。
2.5 全基因組序列基因功能分析 應(yīng)用COG 數(shù)據(jù)庫注釋上述已獲得的全基因組序列,發(fā)現(xiàn)CMCC(B)34991 菌種中共有1 566 個CDS 具有明確的生物學(xué)功能,COG 功能注釋的蛋白有1 621 個,其中與氨基酸運(yùn)輸、碳水化合物代謝相關(guān)的蛋白最多,數(shù)量高達(dá)328 個,占總注釋基因的20.2%,主要負(fù)責(zé)細(xì)菌的氨基酸和碳水化合物轉(zhuǎn)運(yùn)與代謝(圖2);其次為負(fù)責(zé)轉(zhuǎn)錄的蛋白,為119 個。此外,仍有162 個(占9.9%)未知功能蛋白無法獲得功能注釋,有待后續(xù)進(jìn)一步分析。
圖2 腸膜狀明串珠菌CMCC(B)34991 菌種基因組的COG聚類分析Fig.2 COG clustering analysis of genome of L.mesenteroides CMCC(B)34991 strain
通過KEGG 數(shù)據(jù)庫構(gòu)建代謝通路,分析表明,CMCC(B)34991 菌種中1 125 個蛋白具有KEGG的ortholog。KEGG 功能分類主要包括對細(xì)胞內(nèi)過程、環(huán)境信息處理過程、遺傳信息處理過程、代謝和有機(jī)系統(tǒng)(圖3),其中代謝類基因數(shù)量最多,占KEGG 注釋總基因數(shù)的63.5%;其次為環(huán)境信息處理過程基因數(shù)量,具體包括膜轉(zhuǎn)運(yùn)和信號轉(zhuǎn)導(dǎo)通路,占比分別為9.7%和4.4%。
圖3 腸膜狀明串珠菌CMCC(B)34991 菌種基因組的KEGG 代謝通路分類Fig.3 Classification of KEGG metabolic pathways in genome of L.mesenteroides CMCC(B)34991 strain
2.6 比較基因組學(xué)分析 ANI 分析結(jié)果顯示,5 株腸膜狀明串珠菌之間的核苷酸一致性很高,在98.7% ~99.0%之間,見表 1;CMCC(B)34991 菌種與 4 種腸膜狀明串珠菌亞種代表株在全基因組水平的核苷酸一致性均在98.7%以上,其中與右旋葡聚糖亞種DSM 20484 的同源性最高,為99.0%;DDH 雜交分析表明,CMCC(B)34991 菌種與4 種腸膜狀明串珠菌亞種代表株的DDH 數(shù)值在89.6% ~91.6%之間。
通過維恩圖分析共有和特有基因,發(fā)現(xiàn)5 個全基因組共有的核心基因有1 186 個,見圖4,CMCC(B)34991 菌種基因組特有的基因有247 個。
圖4 CMCC(B)34991 菌種與4 株腸膜狀明串珠菌亞種代表株的共有和特有基因維恩圖Fig.4 Venn diagram of common and specific genes of CMCC(B)34991 strain and four representative strains of L.mesenteroides subspecies
2.7 系統(tǒng)發(fā)育進(jìn)化分析 系統(tǒng)發(fā)育進(jìn)化分析顯示,CMCC(B)34991 菌種與4 種腸膜狀明串珠菌亞種代表株共屬于一個進(jìn)化分支,但由于5 株腸膜狀明串珠菌之間核苷酸同源性較高,盡管5 株腸膜狀明串珠菌又被分成4 個小分支,但它們之間的進(jìn)化距離非常近。其他4 株明串珠菌屬細(xì)菌分別位于不同進(jìn)化分支,與腸膜狀明串珠菌進(jìn)化明顯不同。見圖5。
圖5 腸膜狀明串珠菌CMCC(B)34991 全基因組系統(tǒng)進(jìn)化分析Fig.5 Phylogenetic analysis of whole genome of L.mesenteroides CMCC(B)34991 strain
表1 CMCC(B)34991 菌種與4 種腸膜狀明串珠菌亞種代表株之間的ANI 和DDH 分析結(jié)果(%)Tab.1 ANI and DDH analyses of between CMCC(B)34991 and four representative strains of L.mesenteroides subspecies(%)
在任何一個國家或地區(qū),任何一種微生物要成為一株藥品生產(chǎn)用菌種,前期均需大量的有效性和安全性驗(yàn)證試驗(yàn)[4]。腸膜狀明串珠菌CMCC(B)34991自20 世紀(jì)50 ~60 年代起一直用于國內(nèi)右旋糖酐的生產(chǎn)。由于傳統(tǒng)的質(zhì)控方法只能鑒定到腸膜狀明串珠菌,并不能提供腸膜狀明串珠菌CMCC(B)34991的特定信息,為了全面了解生產(chǎn)用菌種的特征,在傳統(tǒng)形態(tài)與生化反應(yīng)之外,本研究應(yīng)用包括細(xì)菌自動生化鑒定、質(zhì)譜、16S rRNA 以及全基因組多種不同原理的微生物鑒定和溯源方法對腸膜狀明串珠菌CMCC(B)34991 進(jìn)行了分析,豐富了該生產(chǎn)用菌種的特征性背景資料。
目前,16S rRNA 基因序列廣泛用于細(xì)菌鑒定和分類,但由于16S rRNA 在同一種屬細(xì)菌內(nèi)核苷酸同源性很高,在用于一些同源性較高的細(xì)菌亞種分析就存在局限性[6-7]。本研究結(jié)果發(fā)現(xiàn),CMCC(B)34991 菌種與4 種腸膜狀明串珠菌亞種代表株的16S rRNA 基因序列僅差1 ~2 個堿基,核苷酸相似性均在99.5%以上。隨著高通量測序技術(shù)的發(fā)展,細(xì)菌全基因組的測序成本極大降低[8-10]。與單個特征基因序列分析比較,基于全基因組水平進(jìn)行微生物鑒定與分類具有更高的分辨率和準(zhǔn)確性。同一種屬兩株細(xì)菌之間的ANI 值 ≥ 95%或DDH 值 ≥ 70%通常認(rèn)為這兩株細(xì)菌為同一亞種[11-12]。本研究發(fā)現(xiàn),CMCC(B)34991 菌種與4 種腸膜狀明串珠菌亞種代表株的ANI 值均在98.5%以上,DDH 值均超過89%,進(jìn)一步支持腸膜狀明串珠菌亞種之間的核苷酸同源性很高。由于其同源性太高,研究人員建議當(dāng)腸膜狀明串珠菌亞種ANI 值≥99%或DDH 值≥91%,認(rèn)為隸屬同一亞種[5]。按照該推薦標(biāo)準(zhǔn),CMCC(B)34991 菌種與右旋葡聚糖亞種DSM 20484 的ANI值和DDH 值分別為99.0%和91.4%,建議CMCC(B)34991應(yīng)為右旋葡聚糖亞種。
腸膜狀明串珠菌jonggajibkimchii 亞種為2017年報(bào)道新發(fā)現(xiàn)的亞種,基于本研究比較基因組學(xué)分析獲得core 基因的系統(tǒng)進(jìn)化樹顯示,5 株腸膜狀明串珠菌位于同一個進(jìn)化分支內(nèi),與其他4 種明串珠菌種屬細(xì)菌進(jìn)化距離明顯不同。結(jié)合上述ANI 與DDH分析結(jié)果,也進(jìn)一步支持DRC 1506 菌株為腸膜狀明串珠菌新亞種。原核生物基因組中的共有基因在其物種長期進(jìn)化過程中的適應(yīng)性進(jìn)化與篩選重要功能性狀方面具有重要意義[13-14],因此,為了更深入地了解腸膜狀明串珠菌的進(jìn)化歷程,建議后續(xù)應(yīng)進(jìn)行比較基因組學(xué)獲得5 株腸膜狀明串珠菌1 186 個共有基因的功能分析。同時,篩選獲得各株細(xì)菌基因組的特有基因也為研究特定菌株的生物學(xué)功能提供了可能[15]??紤]到CMCC(B)34991 菌種作為右旋糖酐生產(chǎn)用菌種的特殊性,本研究獲得其基因組中247 個特有基因,為將來實(shí)現(xiàn)生產(chǎn)用菌種菌株水平的鑒定與質(zhì)量控制奠定了良好的基礎(chǔ)。
綜上所述,本研究首次獲得了我國右旋糖酐生產(chǎn)用菌種腸膜狀明串珠菌CMCC(B)34991 的全基因組基本特征,并詳細(xì)分析了基因功能、同源性及其系統(tǒng)發(fā)育進(jìn)化關(guān)系,不僅為后續(xù)鑒定生產(chǎn)用菌種到菌株水平的質(zhì)量控制提供了數(shù)據(jù)支持,也為后續(xù)右旋糖酐生產(chǎn)工藝的優(yōu)化奠定了基礎(chǔ)。
志謝感謝上海人類基因組研究中心鄭華軍、朱永強(qiáng)和金磊給予的幫助