劉 韜 魏文燕 劉家星 楊 馬 謝 恒 何晟毓 楊 倩 汪開(kāi)毓
(1. 四川農(nóng)業(yè)大學(xué)魚(yú)病研究中心, 成都 611130; 2. 四川農(nóng)業(yè)大學(xué)動(dòng)物疫病與人類(lèi)健康四川省重點(diǎn)實(shí)驗(yàn)室,成都 611130; 3. 成都市農(nóng)林科學(xué)院, 成都 610000)
魯氏耶爾森氏菌(Yersinia ruckeri)主要引起魚(yú)類(lèi)腸炎紅嘴病(Enteric redmouth disease, ERM)[1]。ERM是一種重要的水生動(dòng)物疾病, 早于1966年美國(guó)愛(ài)德荷州的養(yǎng)殖虹鱒(Oncorhynchus mykiss)中暴發(fā)[1]。20世紀(jì)70年代至80年代由美國(guó)傳至歐洲, 主要在英國(guó)和歐洲大陸之間傳播, 宿主一般為在淡、海水中的野生鮭魚(yú)和養(yǎng)殖鮭魚(yú)[2]。然而, 自ERM 首次報(bào)道以來(lái), 其宿主范圍和地理分布逐漸擴(kuò)大, 目前我國(guó)西南地區(qū)該病原被報(bào)道可感染養(yǎng)殖斑點(diǎn)叉尾鮰并引起嚴(yán)重死亡[3]。該病暴發(fā)往往由環(huán)境壓力介導(dǎo),例如水溫變化、水質(zhì)差異等。本研究中心于2008年簡(jiǎn)陽(yáng)三岔水庫(kù)養(yǎng)殖斑點(diǎn)叉尾鮰(Ictalurus punctatus)暴發(fā)的細(xì)菌性敗血癥中分離得到的Y.ruckeriSC09株, 并隨后進(jìn)行了細(xì)菌基因組完成圖測(cè)序[4,5]。
病原菌引起的魚(yú)類(lèi)疾病暴發(fā)往往與水溫有極為密切的相關(guān)性, 為進(jìn)一步分析該病原在水生環(huán)境中的生理發(fā)病溫度(28℃)和實(shí)驗(yàn)培養(yǎng)溫度(37℃)條件下的基因轉(zhuǎn)錄水平的差異, 本實(shí)驗(yàn)進(jìn)行了基于RNA-seq的菌體不同溫度條件下的鏈特異性轉(zhuǎn)錄組分析。本實(shí)驗(yàn)期望通過(guò)高通量測(cè)序技術(shù)更全面了解菌體中生物信息的變化情況, 為研究相關(guān)差異基因開(kāi)創(chuàng)新的方法和思路, 也為進(jìn)一步研究Y. ruc keriSC09菌株的致病機(jī)制和生存機(jī)制提供更豐富數(shù)據(jù)參考。
本研究中測(cè)序和實(shí)驗(yàn)所用菌株為2008年簡(jiǎn)陽(yáng)三岔水庫(kù)養(yǎng)殖斑點(diǎn)叉尾鮰(Ictalurus punctatus)暴發(fā)的細(xì)菌性敗血癥中分離得到的魯氏耶爾森氏菌(Yersinia ruckeri)的SC09株, 由四川農(nóng)業(yè)大學(xué)魚(yú)病研究中心分離保存。該菌株已進(jìn)行了細(xì)菌基因組完成圖測(cè)序, 菌株染色體NCBI基因組登錄號(hào)為:NZ_CP025800.1; 該菌株還含有2個(gè)野生型質(zhì)粒, 分別命名為pLT和pWKY, 其N(xiāo)CBI登錄號(hào)分別為:NZ_CP025802.1和NZ_CP025801.1。
為了研究菌株Y. ruckeriSC09在常規(guī)實(shí)驗(yàn)室菌體培養(yǎng)溫度(37℃)和該菌株分離時(shí)宿主所在環(huán)境的發(fā)病溫度(28℃)條件下菌體基因表達(dá)的差異, 本研究將菌株SC09在LB培養(yǎng)基(北京欣經(jīng)科生物技術(shù)有限公司)上劃線涂板, 置于37℃培養(yǎng)16h后, 挑取單菌落轉(zhuǎn)接至10 mL LB培養(yǎng)基, 分別在37℃(樣本命名為SC09-37)和28℃(樣本命名為SC09-28)180 r/min 過(guò)夜培養(yǎng)A600至0.8—0.9。離心收集菌體, 按照TRIzol?Reagent提取試劑盒(Invitrogen)操作說(shuō)明進(jìn)行菌體的總RNA 抽提, 并電泳質(zhì)檢合格后純化總RNA。
采用Illumina TruseqTMRNA sample prep Kit試劑(Invitrogen公司)并以5 μg total RNA起始量建庫(kù);磁珠法除rRNA(Ribo-Zero Magnetic kit (G+/G-Bacteria), EpiCentre公司); 離子打斷mRNA(TruseqTM RNA sample prep Kit, Illumina公司), 雙鏈cDNA合成, 第二鏈合成時(shí)采用dUTP代替dTTP, 并在合成雙鏈后接index接頭(TruseqTMRNA sample prep Kit, Illumina公司), 加入U(xiǎn)NG酶(Illumina公司)降解cDNA第二鏈; 文庫(kù)富集, PCR擴(kuò)增15個(gè)cycles;2%瓊脂糖膠回收目的條帶(Certified Low Range Ultra Agarose, Bio-Rad公司); TBS380(Picogreen)定量,按數(shù)據(jù)比例混合上機(jī); cBot(儀器產(chǎn)自Illumina公司)橋式PCR擴(kuò)增得到clusters; Hiseq(儀器產(chǎn)自Illumina公司)平臺(tái)進(jìn)行2×150 bp雙端測(cè)序。
對(duì)所有測(cè)序reads的每個(gè)circle進(jìn)行堿基分布和質(zhì)量波動(dòng)統(tǒng)計(jì), 得到(Raw data), 宏觀反映測(cè)序質(zhì)量和文庫(kù)質(zhì)量。Illumina Hiseq原始數(shù)據(jù)中會(huì)包含接頭序列、低質(zhì)量reads、N率較高序列及長(zhǎng)度過(guò)短序列, 其將影響后續(xù)序列組裝。為保證后續(xù)分析準(zhǔn)確性, 首先對(duì)原始測(cè)序數(shù)據(jù)進(jìn)行過(guò)濾, 從而得到高質(zhì)量的測(cè)序數(shù)據(jù)(Clean data)以保證后續(xù)分析的順利進(jìn)行, 具體步驟如下: 去除reads中的接頭序列, 去除由于接頭自連等原因?qū)е聸](méi)有插入片段的reads;將序列末端(3′端)質(zhì)量較低(質(zhì)量值小于20)的堿基修剪掉, 如剩余序列中仍然有質(zhì)量值小于10的堿基,則將整條序列剔除, 否則保留; 去除含N比率超過(guò)10%的reads; 舍棄去adapter及質(zhì)量修剪后長(zhǎng)度小于70 bp的序列。質(zhì)控使用軟件: SeqPrep (https://github.com/jstjohn/SeqPrep)和Sickle (https://github.com/najoshi/sickle)。
利用HTseq-count軟件并根據(jù)reads比對(duì)結(jié)果分配reads到特定的轉(zhuǎn)錄本進(jìn)行轉(zhuǎn)錄本reads計(jì)算分析(Read count)。采用Rockhopper軟件將各樣品過(guò)濾后的測(cè)序序列與參考基因組進(jìn)行比對(duì), 使其定到基因組。使用IGV(Integrative Genomics Viewer)瀏覽器對(duì)測(cè)序的bam文件格式化后的wig文件進(jìn)行可視化瀏覽以便于在不同尺度上顯示基因不同區(qū)域的豐度, 以反映不同區(qū)域的轉(zhuǎn)錄水平。
針對(duì)Read counts結(jié)果進(jìn)一步采用FPKM (Fragments Per Kilobase of transcript per Million fragments mapped)來(lái)表征基因表達(dá)量。
本研究菌體樣本無(wú)生物學(xué)重復(fù), 一般用logFC(FC是fold change的簡(jiǎn)寫(xiě), logFC是FC的對(duì)數(shù)值, 意為“差值倍數(shù)”)來(lái)對(duì)Read counts值進(jìn)行過(guò)濾, 隨后利用DESeq讀入, 通過(guò)在DESeq軟件內(nèi)部進(jìn)行標(biāo)準(zhǔn)化后進(jìn)行MA圖的繪制。
本次分析使用KOBAS (http://kobas.cbi.pku.edu.cn/home.do)進(jìn)行KEGG PATHWAY富集分析,使用Fisher精確檢驗(yàn)進(jìn)行計(jì)算。為控制計(jì)算假陽(yáng)性率, 采用BH (FDR)方法進(jìn)行多重檢驗(yàn), 計(jì)算公式與上節(jié)相同, 經(jīng)過(guò)校正的P(CorrectedP-Value)以0.05為閾值, 滿(mǎn)足此條件的KEGG通路定義為在差異表達(dá)基因中顯著富集的KEGG通路。
結(jié)合RNA-seq實(shí)驗(yàn)數(shù)據(jù)(計(jì)算所得基因表達(dá)量),采用Rockhopper軟件(http://cs.wellesley.edu/~btjaden/Rockhopper/)預(yù)測(cè)操縱子。具體是聯(lián)合基因間距離和基因表達(dá)量相關(guān)性2個(gè)特征用樸素貝葉斯分類(lèi)器模型來(lái)預(yù)測(cè)操縱子, 該預(yù)測(cè)算法的敏感性和特異性均高達(dá)95%。同時(shí), 對(duì)預(yù)測(cè)得到操縱子進(jìn)行長(zhǎng)度分布、包含的結(jié)構(gòu)基因數(shù)目和操縱子鏈分布進(jìn)行計(jì)算。進(jìn)一步地, 從預(yù)測(cè)到的操縱子中進(jìn)行毒力相關(guān)性分析。
Illumina測(cè)序得到的原始圖像數(shù)據(jù)經(jīng)過(guò)Base Calling轉(zhuǎn)化為序列數(shù)據(jù), 結(jié)果以FASTQ文件格式來(lái)存儲(chǔ)。FASTQ文件為最原始的數(shù)據(jù)文件, 文件包含測(cè)序read的序列信息以及測(cè)序質(zhì)量信息。對(duì)SC09-28和SC09-37兩個(gè)樣本的所有原始reads進(jìn)行統(tǒng)計(jì),得到所有原始讀長(zhǎng)的數(shù)量(Raw reads)和堿基總數(shù)(Raw base), 統(tǒng)計(jì)堿基的Quality scores (Q20和Q30),具體結(jié)果見(jiàn)表 1。
原始數(shù)據(jù)中包括測(cè)序接頭序列、低質(zhì)量讀段、N率較高序列及長(zhǎng)度過(guò)短序列, 經(jīng)過(guò)過(guò)濾后得到質(zhì)量更好的數(shù)據(jù)。原始數(shù)據(jù)質(zhì)控后得到的具體結(jié)果見(jiàn)表 2。
SC09-28和SC09-37兩個(gè)樣品過(guò)濾后的測(cè)序序列分別與參考基因組(包括pLT和pWKY兩個(gè)質(zhì)粒的參考基序列)進(jìn)行比對(duì), 使其定位到基因組。采用Rockhopper軟件進(jìn)行比對(duì), Rockhopper是一個(gè)全面的主要針對(duì)原核轉(zhuǎn)錄組數(shù)據(jù)的計(jì)算分析軟件, 采用的比對(duì)算法類(lèi)似Bowtie2, 基于BWT (Burrows-Wheeler_transform)數(shù)據(jù)轉(zhuǎn)化算法構(gòu)建參考基因組的FM-index, 使比對(duì)更加準(zhǔn)確快速。比對(duì)得到的結(jié)果如表 3所示。
同時(shí), 利用 RNA-seq reads在unigene上比對(duì)結(jié)果的wig格式文件, 使用IGV (Integrative GenomicsViewer)瀏覽器對(duì)wig文件進(jìn)行可視化瀏覽, 通過(guò)IGV在不同尺度上顯示基因不同區(qū)域的豐度, 以反映不同區(qū)域的轉(zhuǎn)錄水平, 結(jié)果如圖 1所示。SC09-28_MINUS是指樣本SC09-28 (28℃)的負(fù)義鏈基因的表達(dá)reads比對(duì)到SC09基因組的貼合水平,SC09-28_PLUS是指樣本SC09-28 (28℃)的正義鏈基因的表達(dá)reads比對(duì)到SC09基因組的貼合水平,SC09-37_MINUS是指樣本SC09-37(37℃)的負(fù)義鏈基因的表達(dá)reads比對(duì)到SC09基因組的貼合水平,SC09-37_PLUS是指樣本SC09-37(37℃)的正義鏈基因的表達(dá)reads比對(duì)到SC09基因組的貼合水平。
表 1 原始數(shù)據(jù)統(tǒng)計(jì)Tab. 1 Raw data statistics
表 2 原始數(shù)據(jù)質(zhì)控Tab. 2 Raw data quality control
表 3 原始數(shù)據(jù)比對(duì)到基因組Tab. 3 The raw data mapped to the genome
對(duì)Gene差異表達(dá)篩選結(jié)果進(jìn)行匯總統(tǒng)計(jì)如下,比較P<0.05閾值條件下的顯著上調(diào)和顯著下調(diào)的基因, 并繪制MA圖(圖 2)。圖中X軸為標(biāo)準(zhǔn)化后序列計(jì)數(shù)在兩組間的平均數(shù), Y軸代表倍數(shù)變化的對(duì)數(shù)值。從X軸看, 從左往右代表基因表達(dá)量從低到高; 從Y軸看, 越偏離Y=0這條曲線則代表倍數(shù)變化越大。位于紅色直線上方的為表達(dá)上調(diào)基因, 位于紅線下方的為表達(dá)下調(diào)的基因。紅色高亮數(shù)據(jù)點(diǎn)代表符合特定篩選閾值條件的顯著表達(dá)上調(diào)基因。綠色高亮數(shù)據(jù)點(diǎn)代表符合特定篩選閾值條件的顯著表達(dá)下調(diào)基因。由圖可知, 樣本SC09-37相對(duì)于SC09-28, 其顯著上調(diào)的基因有58個(gè), 而顯著下調(diào)的基因有115個(gè), 有差異表達(dá)但不顯著(不滿(mǎn)足閾值條件)的基因有3107個(gè)。
圖 1 IGV圖(SC09-28相對(duì)于SC09-37)Fig. 1 IGV map (SC09-28 compare to SC09-37)
將2個(gè)樣本的P<0.05的差異基因進(jìn)行KEGG功能富集分析(圖 3和圖 4)。SC09-37相對(duì)于SC09-28共有58個(gè)基因顯著上調(diào)表達(dá)(圖 2), 總計(jì)可印射到15個(gè)KEGG的pathway條目, 經(jīng)過(guò)超幾何分布檢驗(yàn)進(jìn)行統(tǒng)計(jì)計(jì)算后, 再次按閾值P<0.05進(jìn)行過(guò)濾后得到7個(gè)顯著富集的KEGG條目(圖 3, 紅色條目)。這些顯著上調(diào)的基因幾乎都與各種糖類(lèi)的獲取和代謝相關(guān), 包括磷酸轉(zhuǎn)移酶系統(tǒng)(Phosphotransferase system, PTS)相關(guān)的基因、淀粉和蔗糖代謝(Starch and sucrose metabolism)相關(guān)基因、氨基糖和核糖(Amino sugar and nucleotide sugar metabo lism)相關(guān)基因、半乳糖代謝(Galactose metabolism)相關(guān)基因、其他多糖代謝(Other glycan degradation)相關(guān)基因等。此外, 也包括較少的與脂類(lèi)(Sphingolipid metabolism)和氨基酸(Cysteine and methionine metabolism)代謝相關(guān)基因。由此可知,SC09菌株在溫度較高的37℃時(shí), 其糖類(lèi)代謝相關(guān)基因呈現(xiàn)顯著上調(diào)表達(dá)。需要注意的是這些顯著上調(diào)的KEGG的pathway中有重復(fù)出現(xiàn)的基因, 其中PTS相關(guān)的基因與Starch and sucrose metabolism相關(guān)有基因部分重復(fù)。二者都包含了NJ56_RS13690(NCBI登錄號(hào))和NJ56_RS13695 (NCBI登錄號(hào))兩個(gè)基因。
圖 2 SC09差異基因篩選MA圖(SC09-37相對(duì)于SC09-28)Fig. 2 MA plot of differentially expressed genes in SC09 (SC09-37 compare to SC09-28)
圖 3 上調(diào)表達(dá)基因的KEGG富集分析(SC09-37相對(duì)于SC09-28)Fig. 3 KEGG enrichment analysis of up-regulated genes (SC09-37 compare to SC09-28)
SC09-37相對(duì)于SC09-28共有115個(gè)基因顯著下調(diào)表達(dá)(圖 2), 總計(jì)可映射到29個(gè)KEGG的pathway條目, 經(jīng)過(guò)超幾何分布檢驗(yàn)統(tǒng)計(jì)計(jì)算后, 再次按閾值P<0.05過(guò)濾后得到3個(gè)顯著富集的KEGG條目, 分別是雙組份信號(hào)系統(tǒng)通路(Two-component system)、硫胺素代謝通路(Thiamine metabolism)和編碼鞭毛裝配(Flagellar assembly)相關(guān)的通路(圖 4,紅色條目)。在雙組份信號(hào)系統(tǒng)通路中比較典型的是編碼檸檬酸合酶(Citrate lyase)相關(guān)的基因(NJ 56_RS12650、NJ56_RS12655、NJ56_RS12660、NJ56_RS12665和NJ56_RS12670)顯著下調(diào)。這表明, 在37℃時(shí), SC09菌株的三羧酸循環(huán)被抑制, 代謝葡萄糖的能力顯著降低, 而在溫度較低的28℃時(shí)菌株則具有很好的代謝葡萄糖的能力。此外, 上述通路中編碼鞭毛素(Flagellin FliC)基因(NJ56_RS13110、NJ56_RS13115和NJ56_RS13120)也顯著下調(diào)。這表明, 當(dāng)較高的實(shí)驗(yàn)室培養(yǎng)溫度37℃時(shí),SC09菌株的運(yùn)動(dòng)能力較弱, 游泳性較差, 而溫度較低的水環(huán)境生理溫度28℃時(shí), SC09菌株的運(yùn)動(dòng)性較強(qiáng), 游動(dòng)能力強(qiáng)。需注意的是編碼鞭毛裝配相關(guān)的通路中的基因與雙組份信號(hào)系統(tǒng)通路中的基因重復(fù)出現(xiàn)。還值得關(guān)注的是硫胺素(維生素,)代謝通路相關(guān)基因NJ56_RS04720、NJ56_RS04725、NJ56_RS04730、NJ56_RS04740和NJ56_RS04745的顯著下調(diào)。這表明在較高的37℃時(shí)菌株相應(yīng)的輔酶的功能的降低, 而反之較低的28℃時(shí)菌株的相應(yīng)的輔酶的活性則得到提高。
基因原核鏈特異性轉(zhuǎn)錄組本研究預(yù)測(cè)了Y.ruckeriSC09鞭毛相關(guān)系統(tǒng)的完整操縱子, 包括鞭毛主體、調(diào)控和趨化三大系統(tǒng)(圖 5)。Y. ruckeriSC09帶有完整的鞭毛主體成分基因簇fli (NJ56_14270-NJ56_14400, 橘紅色基因簇)、flg (NJ56_14405-NJ56_14470, 金黃色基因簇)、flh (NJ56_14475-NJ56_14485, 綠色基因簇), 其后緊隨著調(diào)控鞭毛旋轉(zhuǎn)的趨化系統(tǒng)(NJ56_14560-NJ56_14605)以及啟動(dòng)裝配鞭毛主體結(jié)構(gòu)的一級(jí)調(diào)控基因flhC(NJ56_14610)、flhD (NJ56_14615)。比較特殊的是, 在fli-flg-flh基因簇和趨化系統(tǒng)之間還存在著一個(gè)編碼 CUP (Chaperone-usher pathway)型菌毛的基因簇(命名為 cup8, NJ56_14495-NJ56_14540), 推測(cè)其可能有助于鞭毛的協(xié)同運(yùn)動(dòng)。
RNA-seq的測(cè)序質(zhì)量分析是評(píng)估轉(zhuǎn)錄組當(dāng)中非常重要的數(shù)據(jù)內(nèi)容, 但需要注意的是一般的真核生物的轉(zhuǎn)錄組測(cè)序與細(xì)菌等原核生物轉(zhuǎn)錄組測(cè)序的測(cè)序策略具有明顯的差異。真核生物由于具有polyA尾巴, 所以可以采用polyA募集mRNA, 進(jìn)而展開(kāi)cDNA雙鏈的合成。因此, 真核生物轉(zhuǎn)錄組在測(cè)序序列中往往不能提供鏈方向的信息, 難以確定反義轉(zhuǎn)錄本, 且不能真實(shí)的反映轉(zhuǎn)錄情況。原核生物由于不具有polyA尾巴, 所以采取了鏈特異性建庫(kù)策略。此方法是在構(gòu)建文庫(kù)時(shí), 利用高保真Taq酶將mRNA鏈的方向信息存于測(cè)序文庫(kù)中, 一般最終數(shù)據(jù)分析可判斷轉(zhuǎn)錄本是來(lái)自正義還是負(fù)義鏈。原核生物轉(zhuǎn)租組測(cè)序策略目前僅能采用鏈特異性的方法。
測(cè)序質(zhì)量的好壞將直接影響后續(xù)分析的準(zhǔn)確性[6]。由表 1和表 2可知, 本研究2個(gè)樣本原始數(shù)據(jù)的Q20和Q30處于非常高的水平, 而進(jìn)一步經(jīng)過(guò)質(zhì)控后2個(gè)樣本的Q20更是高達(dá)99.02%和98.78%,Q30也高達(dá)96.75%和95.89%。同時(shí), 由表 3和圖 3可知原始數(shù)據(jù)匹配到SC09染色體基因組的比率也高達(dá)96%和92%。由此可知, 本研究測(cè)序數(shù)據(jù)準(zhǔn)確性高且基因組覆蓋率完整, 在此基礎(chǔ)上進(jìn)行的差異分析和基因富集分析以及操縱子基因簇分析十分可靠。
圖 4 下調(diào)表達(dá)基因的KEGG富集分析(SC09-37相對(duì)于SC09-28)Fig. 4 KEGG enrichment analysis of down-regulated genes (SC09-37 compare to SC09-28)
基因表達(dá)具有時(shí)間和空間特異性, 外界刺激和內(nèi)部環(huán)境都會(huì)影響基因的表達(dá)。在兩個(gè)不同條件下, 表達(dá)水平存在顯著差異的基因, 稱(chēng)之為差異表達(dá)基因[7]。在生物信息學(xué)中, 尋找差異表達(dá)基因的過(guò)程叫做差異表達(dá)分析, 也是本研究中RNA-seq分析的核心內(nèi)容。在本研究中,P<0.05時(shí), SC09-37相對(duì)于SC09-28顯著上調(diào)的基因有58個(gè), 而顯著下調(diào)的基因有115個(gè)。宏觀來(lái)看, 在較高的實(shí)驗(yàn)室培養(yǎng)溫度下(37℃)菌株多數(shù)基因明顯處于下調(diào)狀態(tài), 菌株相對(duì)顯得不那么“活躍”, 而較低的溫度下(28℃)菌株多數(shù)基因?qū)@著上調(diào), 菌株表現(xiàn)出更為“活躍”的狀態(tài)。
具體地, 通過(guò)基因的KEGG富集分析來(lái)看, 菌株SC09在溫度較高時(shí)(37℃)雙組份信號(hào)系統(tǒng)通路[8]中編碼檸檬酸合酶(Citrate lyase)相關(guān)的基因(NJ56_RS12650、NJ56_RS12655、NJ56_RS12660、NJ56_RS12665和NJ56_RS12670)顯著下調(diào), 這將導(dǎo)致菌株的三羧酸循環(huán)被抑制, 代謝葡萄糖的能力顯著降低, 反之, 28℃時(shí)菌株具有較好的代謝葡萄糖的能力。同時(shí), 硫胺素(維生素B1, VB1)代謝通路相關(guān)基因NJ56_RS04720、NJ56_RS04725、NJ56_RS04730、NJ56_RS04740和NJ56_RS04745在高溫時(shí)顯著下調(diào)。VB1在菌體內(nèi)主要以焦磷酸硫胺素(TPP)形式存在, 是α-酮酸氧化脫羧酶復(fù)合物的重要輔酶[9]。高溫時(shí)菌株相應(yīng)的輔酶的功能的降低, 進(jìn)一步抑制了菌株的三羧酸循環(huán)。這些基因的變化趨勢(shì)表明耶爾森氏菌更加趨向于在較低水溫條件下生存, 且在較低溫度下菌體往往表現(xiàn)出更加活躍的代謝及其他生命活動(dòng)。這進(jìn)一步提示菌體引發(fā)魚(yú)類(lèi)宿主疾病往往與其所在水生環(huán)境溫度密切相關(guān)。
圖 5 SC09 鞭毛系統(tǒng)基因簇Fig. 5 Gene clusters associated with flagellar in SC09
由于原核生物是多順?lè)醋觤RNA, 具有5′、3′UTR, 不具有poly(A)尾巴, 轉(zhuǎn)錄與翻譯同時(shí)進(jìn)行,具有操縱子結(jié)構(gòu)(很長(zhǎng)的基因簇), 所以我們通過(guò)RNA-seq完整的描繪了SC09菌株的編碼鞭毛相關(guān)的基因簇。細(xì)菌逆化學(xué)梯度的游動(dòng)能力有賴(lài)于于馬達(dá)驅(qū)動(dòng)的鞭毛(Flagellum), 其可通過(guò)跨膜離子運(yùn)動(dòng)(Proton motive force, PMF)所提供的能量來(lái)帶動(dòng)鞭毛的絲狀纖維的旋轉(zhuǎn)[10]。鞭毛也是一個(gè)分層基因調(diào)控的典范, 其可通過(guò)蛋白間互作和對(duì)蛋白分泌的控制在較短時(shí)間和較小空間中細(xì)致精密地裝配成一個(gè)復(fù)雜的多蛋白結(jié)構(gòu)[11]。因?yàn)楸廾闹匾?植物和動(dòng)物會(huì)專(zhuān)一性地產(chǎn)生識(shí)別鞭毛的受體來(lái)介導(dǎo)天然免疫反應(yīng)[12], 同時(shí), 作為一種精細(xì)自組裝的納米機(jī)器, 它使得細(xì)菌能向更好的生活環(huán)境運(yùn)動(dòng),在細(xì)菌的生命活動(dòng)中也發(fā)揮了重要作用(包括運(yùn)動(dòng)性、 致病性等)[13]。細(xì)菌的鞭毛呈長(zhǎng)細(xì)絲狀并突出于菌體表面, 其結(jié)構(gòu)主要由三部分組成: 引擎(Engine)、鞭毛絲(Propeller)以及連接引擎和鞭毛絲的接頭部分(Universal joint)[14]。此外, 細(xì)菌利用趨化性(Chemotaxis)向?qū)λ鼈兩L(zhǎng)有利的環(huán)境移動(dòng), 其表面的化學(xué)受體會(huì)偵測(cè)環(huán)境信號(hào)的變化并通過(guò)雙組份系統(tǒng)(Two-component systems)控制鞭毛的旋轉(zhuǎn)方向, 從而調(diào)節(jié)細(xì)菌的泳動(dòng)方向[15], 所以細(xì)菌的趨化系統(tǒng)一般與細(xì)菌的鞭毛系統(tǒng)毗鄰。同時(shí), 鞭毛的組裝還是一個(gè)多級(jí)反應(yīng), 因此調(diào)控鞭毛組裝的多個(gè)調(diào)控基因往往也靠近鞭毛系統(tǒng)[16]。菌株SC09在溫度較高時(shí), 編碼鞭毛素(Flagellin FliC)的基因NJ56_RS13110、NJ56_RS13115和NJ56_RS13120也顯著下調(diào), 意味著菌體鞭毛的主體部分表達(dá)的降低或不表達(dá), 提示菌體在實(shí)驗(yàn)室條件下(37℃)運(yùn)動(dòng)性不如在一般水體環(huán)境中(28℃)那么強(qiáng)烈。這表明, 較高溫度時(shí), SC09菌株的運(yùn)動(dòng)能力較弱, 游泳性較差。
菌株SC09在溫度較高時(shí)上調(diào)表達(dá)的基因中多數(shù)顯著富集到一些特殊的碳水化合物(糖類(lèi))代謝相關(guān)的pathway: 磷酸轉(zhuǎn)移酶系統(tǒng)(Phosphotransferase system, PTS)[17]、淀粉和蔗糖代謝(Starch and sucrose metabolism)、氨基糖和核糖(Amino sugar and nucleotide sugar metabolism)、半乳糖代謝(Galactose metabolism) 等。這表明, 盡管溫度較高時(shí), SC09菌株葡萄糖代謝通路受阻, 但代償性地提高了其他碳水化合物相關(guān)基因的表達(dá)。這提示在實(shí)驗(yàn)室培養(yǎng)條件下(37℃)SC09菌株往往不是以葡萄糖作為其主要攝入碳源, 而是以更為復(fù)雜多樣的其他碳水化合物來(lái)代替葡萄糖作為其碳源。這些基因變化趨勢(shì)進(jìn)一步說(shuō)明了耶爾森氏菌體的高溫適應(yīng)性機(jī)制,這為細(xì)菌在某一水生環(huán)境中長(zhǎng)期生存提供了生理基礎(chǔ)。
本研究首次揭示了Y. ruckeriSC09菌株在水生環(huán)境中的生理發(fā)病溫度(28℃)和實(shí)驗(yàn)培養(yǎng)溫度(37℃)條件下的基因轉(zhuǎn)錄水平的差異, 通過(guò)高通量測(cè)序技術(shù)更全面揭示了菌體中生物信息的變化情況, 為進(jìn)一步研究Y. ruckeriSC09菌株的致病機(jī)制和生存機(jī)制提供了數(shù)據(jù)參考。