王奇惠,時(shí)永強(qiáng),祝 宇,張賽飛,朱立力,曲偉杰
(云南農(nóng)業(yè)大學(xué)動(dòng)物科學(xué)技術(shù)學(xué)院,云南昆明 650201)
?
一株金黃色葡萄球菌小菌落突變株全基因組測(cè)序分析
王奇惠,時(shí)永強(qiáng),祝 宇,張賽飛,朱立力,曲偉杰*
(云南農(nóng)業(yè)大學(xué)動(dòng)物科學(xué)技術(shù)學(xué)院,云南昆明 650201)
對(duì)金黃色葡萄球菌小菌落突變株(small colony mutant strainsStaphylococcusaureus,SASCVs)和CP000253.1基因組差異進(jìn)行了研究,為后續(xù)研究金葡菌分泌抗藥物相關(guān)物質(zhì)能力提供數(shù)據(jù)支持。對(duì)一株金葡菌小菌落突變株進(jìn)行全基因組測(cè)序,并與CP000253.1參考序列進(jìn)行序列比較。結(jié)果顯示,金葡菌SCVs的文庫(kù)插入片段為350 bp,測(cè)序讀長(zhǎng)為150 bp,SCVs的原始數(shù)據(jù)量為551 Mb,SCVs的堿基含量分布在處理前后有所不同,通過(guò)重測(cè)序,存在單核苷酸多態(tài)性(SNP)的數(shù)量較大。金葡菌SCVs與CP000253.1參考序列之間存在明顯的序列差異,該數(shù)據(jù)為研究金葡菌感染奶牛乳房炎提供了一定的序列依據(jù)。
金葡菌小菌落突變株;基因序列差異;全基因組測(cè)序;單核苷酸多態(tài)性
奶牛乳房炎是奶牛最常見(jiàn)的疾病之一[1-2]。由金黃色葡萄球菌(Staphylococcusaureus)所引起的奶牛慢性乳房炎一直制約著我國(guó)奶牛養(yǎng)殖業(yè)的發(fā)展。細(xì)菌小菌落突變株(small colony variants,SCVs)于1910年首次被報(bào)道,當(dāng)時(shí)分離的一株SCVs被認(rèn)為是一種異常傷寒菌,后來(lái)被證實(shí)這株SCVs屬于腸傷寒沙門(mén)菌。在臨床上,SCVs 比相應(yīng)的野生株更能持續(xù)存在于哺乳動(dòng)物的細(xì)胞中,并且對(duì)抗生素不敏感,當(dāng)宿主細(xì)胞形成應(yīng)急保護(hù)性的環(huán)境時(shí),SCVs會(huì)引起隱性或者復(fù)發(fā)性感染。在許多細(xì)菌種屬中都發(fā)現(xiàn)有SCVs,但葡萄球菌SCVs研究的相對(duì)較少,尤其是金黃色葡萄球菌(簡(jiǎn)稱(chēng)金葡菌)。金葡菌 SCVs 的獨(dú)特表型與持續(xù)復(fù)發(fā)性感染之間的聯(lián)系在20世紀(jì)90年代中期才被認(rèn)知[3-7]。近幾年來(lái),金葡菌SCVs可致人和動(dòng)物嚴(yán)重感染。國(guó)內(nèi)外相繼報(bào)道了一類(lèi)具有特殊表型的金葡菌小菌落突變株[4](small colony mutant strainsStaphylococcusaureus,SASCVs),并證明了它們與金葡菌感染所致奶牛慢性乳房炎的關(guān)系非常密切,這無(wú)疑為研究該病的詳細(xì)致病機(jī)制提供了新的思路[5-6]。
全基因組測(cè)序是對(duì)已經(jīng)公布了其基因組序列的物種進(jìn)行其他個(gè)體的基因組測(cè)序,并在此基礎(chǔ)上針對(duì)個(gè)體或群體進(jìn)行差異性等分析[7]。全基因組測(cè)序的個(gè)體,通過(guò)把其測(cè)序的短序列比對(duì)到已知的基因組上,檢測(cè)出全基因組上大量的單核苷酸多態(tài)性位點(diǎn)(SNP,插入缺失位點(diǎn)(In Del、結(jié)構(gòu)變異位點(diǎn)(SV)位點(diǎn)等[8-9]?;谧儺愇稽c(diǎn)數(shù)據(jù),通過(guò)生物信息手段,分析不同個(gè)體或群體基因組間的結(jié)構(gòu)差異,同時(shí)完成注釋[11-13]。
為了研究金葡菌SCVs的基因組序列情況,應(yīng)用第2代測(cè)序方法[10]對(duì)1株金葡菌SCVs的基因組序列進(jìn)行了全基因組測(cè)序,并比較其與CP000253.1參考序列差異,旨在發(fā)現(xiàn)金葡菌SCVs菌株特有的序列特征,為研究不同來(lái)源金葡菌之間功能的差異提供基礎(chǔ)[14]。
1.1 材料
金葡菌SCVs分離自無(wú)菌采集的患病奶牛的奶樣中,由本實(shí)驗(yàn)室保存。營(yíng)養(yǎng)瓊脂(10 g/L的胰蛋白酶,5 g/L的酵母粉,5 g/L的NaCl,15 g/L的瓊脂)培養(yǎng)基37℃有氧培養(yǎng)18 h~24 h。
1.2 方法
1.2.1 基因組DNA提取及測(cè)序 基因組DNA用Ge-nomic-Tip500/G試劑盒(Qiagen Inc.,Valencia,CA,USA)試劑盒提取,10 mmol/L Tris-鹽酸(pH8.5)重懸保存?zhèn)溆?,?jīng)超聲波破碎儀(Diageno-de SA,Liège,Belgium)處理(工作15 s,間隔90 s,重復(fù)3次),得到 DNA片段。使用Tru Seq DNA Sample Preparation試劑盒(Illumina Inc.,San Diego,CA,USA)構(gòu)建基因組文庫(kù)。
1.2.2 序列的比對(duì)和SNP分析 首先對(duì)原始數(shù)據(jù)進(jìn)行過(guò)濾,提取高質(zhì)量的數(shù)據(jù)(clean data)與參考序列進(jìn)行比對(duì),其次根據(jù)比對(duì)情況檢測(cè)樣品的SNP,并對(duì)SNP結(jié)果注釋。
1.2.3 信息分析 數(shù)據(jù)處理,此步驟過(guò)濾測(cè)序質(zhì)量值低的reads,保留高質(zhì)量reads,過(guò)濾后的數(shù)據(jù)稱(chēng)為clean data;然后與參考基因組進(jìn)行比對(duì),通過(guò)序列比對(duì)的方法,將得到的clean data與參考基因組進(jìn)行序列比對(duì)分析;再進(jìn)行SNP分析,根據(jù)比對(duì)情況檢測(cè)金葡菌SCVs的SNP,并對(duì)SNP結(jié)果注釋。
2.1 金葡菌SCVs菌株的全基因組測(cè)序結(jié)果
本研究利用第2代測(cè)序技術(shù),使用Hiseq PE150測(cè)序平臺(tái)對(duì)樣品進(jìn)行測(cè)序,各樣品的數(shù)據(jù)經(jīng)過(guò)數(shù)據(jù)質(zhì)控,過(guò)濾低質(zhì)量的序列片段。詳細(xì)的質(zhì)控測(cè)序統(tǒng)計(jì)信息結(jié)果如下:SCVs的文庫(kù)插入片段(insert size)大小是350 bp(base pair,堿基對(duì)),測(cè)序長(zhǎng)度(reads length)是150 bp:150 bp(冒號(hào)前后分別為read1和read2的長(zhǎng)度)。SCVs的原始數(shù)據(jù)Raw data的數(shù)據(jù)量為551 Mb(Mega base pair,百萬(wàn)堿基對(duì)),其中被過(guò)濾掉的reads占raw data總reads的2.05%,clean data的數(shù)據(jù)量為504 Mb,其中有效數(shù)據(jù)的GC含量為34.55%,有效數(shù)據(jù)的Q20值為97.35%,有效數(shù)據(jù)的Q30值為93.1%,有效數(shù)據(jù)的堿基含量分布情況見(jiàn)圖1。從SCVs的堿基含量分布圖中可以看出,處理前堿基含量分布和處理后堿基含量分布并沒(méi)有太大的差別。將雜質(zhì)處理掉后,圖中沒(méi)有明顯的變化,只有稍微些許變化。
應(yīng)用SAMtools軟件,以CP000253.1作為參考基因組,依照SNP和基因之間的位置關(guān)系及相互作用,對(duì)SNP功能進(jìn)行注釋。通過(guò)對(duì)SCVs的SNP注釋結(jié)果統(tǒng)計(jì)(圖2),通過(guò)與CP000253.1參考序列進(jìn)行比對(duì),在SCVs中發(fā)現(xiàn)一共有16 946個(gè)SNP,其中位于CDs區(qū)域的非同義突變SNP為4 154個(gè),同義突變SNP為9 854個(gè)(圖2A);而位于基因間區(qū)的SNP為2 938個(gè)。金葡菌SCVs中80%以上的SNP位于蛋白編碼區(qū)。相同的SNP中,有14 008個(gè)SNP位于編碼蛋白基因的區(qū)域,位于基因間區(qū)的SNP為2 938個(gè)(圖2B)。
比較金葡菌SCVs和CP000253.1參考序列前200個(gè)錯(cuò)義突變頻率相對(duì)較高的基因發(fā)現(xiàn),有66個(gè)基因是完全相同的。前200個(gè)同義突變密度較高的基因中,有47個(gè)是完全相同的。然而,在同一個(gè)菌株中,前200個(gè)錯(cuò)義突變顯著的基因和前200個(gè)同義突變顯著的基因間并沒(méi)有重疊。
A.處理前堿基含量分布;B.處理后堿基含量分布A.Base content distribution before processing ;B.Base content distribution after processing
2.4 相關(guān)基因的SNP分析
單核苷酸多態(tài)性(SNP)主要是指在基因組水平上由單個(gè)核苷酸的變異所引起的DNA序列多態(tài)性,包括單個(gè)堿基的轉(zhuǎn)換、顛換等。如表3中顯示,與CP000253.1參考序列基因組相比,金葡菌SCVs中和耐藥能力相關(guān)的氨基糖苷類(lèi)耐藥基因的操縱子基因發(fā)生了明顯的序列變化,該操縱子的aac(6′)、aph(2″)、aph(3′)-Ⅲ基因發(fā)生較高頻率的錯(cuò)義突變(都屬于前200的高錯(cuò)義突變基因)。在金葡菌SCVs菌株中,aph(3′)-Ⅲ的錯(cuò)義突變頻率在所有基因中最為顯著,約為1.59每100 bp,同義突變頻率為0.51每100 bp。
A.金葡菌SCVs菌株在編碼蛋白基因區(qū)域的分布情況;B.金葡菌SCVs菌株在不同基因組功能區(qū)域的分布情況;#Non_syn.位于CDS區(qū)域,非同義突變的SNP個(gè)數(shù);#Syn.位于CDS區(qū)域,非義突變的SNP個(gè)數(shù);#Intergenic.位于基因間區(qū)的SNP個(gè)數(shù)
編碼β-內(nèi)酞胺類(lèi)耐藥基因的主要基因mecA的錯(cuò)義突變頻率為0.40,qacA基因只發(fā)生了同義突變。金葡菌SCVs中另外一些與耐藥能力相關(guān)的基因aac(6′)和aph(2″) 也發(fā)生了顯著的錯(cuò)義突變。進(jìn)一步分析耐藥相關(guān)基因的轉(zhuǎn)錄因子基因ermB、nucA和ypbH序列變化情況,均未發(fā)現(xiàn)顯著的錯(cuò)義改變(表1) 。
表1 金葡菌SCVs耐藥相關(guān)基因的SNP頻率(每100 bp)
通過(guò)采用SAMTOOLS進(jìn)行個(gè)體SNP的檢測(cè),全基因組及編碼區(qū)的轉(zhuǎn)換(transitions)和顛換(transversions)比例、雜合比率及SNP數(shù)目的統(tǒng)計(jì)結(jié)果是,與CP000253.1的參考序列進(jìn)行比對(duì),SNP檢測(cè)結(jié)果中,SCVs中轉(zhuǎn)換(ts)SNP為10 968個(gè),顛換(tv)SNP為5 978個(gè),SNP的轉(zhuǎn)換顛換率為1.83。所有的16 946個(gè)SNP中,雜合(Het)SNP為308,占參考序列基因組的0.01%,純合(Hom)SNP為16 638個(gè),SNP在參考序列基因組上的密度(density)為6.01/Kb。
通過(guò)對(duì)金葡菌SCVs菌株的全基因組測(cè)序分析,表明金葡菌SCVs菌其基因組序列與實(shí)驗(yàn)室菌株CP000253.1相比有很大的差異。研究發(fā)現(xiàn),與CP000253.1菌株相比,野生的金葡菌SCVs菌株在耐藥活性、生物膜形成[15]方面都有明顯不同。金葡菌SCVs相對(duì)于CP000253.1的基因突變率較高,尤其是錯(cuò)義突變基因,暗示在基因組的水平上野生型的菌株相對(duì)于馴化的菌株有一些差異,這些差異可能導(dǎo)致了其功能上的差異。另外,跟馴化菌株相比,其耐藥的相關(guān)基因有十分明顯的序列的改變,這些改變可能影響蛋白質(zhì)的功能,進(jìn)而有可能影響野生型菌株的耐藥能力。在自然的條件下,野生的菌株很難進(jìn)行轉(zhuǎn)化,很多研究致力于提高野生菌株的轉(zhuǎn)化能力,比較野生型菌株與馴化菌株基因序列上的變化能為更好理解金葡菌SCVs菌株轉(zhuǎn)化能力提供了一種新的途徑[1]。同時(shí),這些基因組的差異數(shù)據(jù)為后續(xù)研究金葡菌SCVs的相關(guān)物質(zhì)能力,提高奶牛乳房炎的治療方面的應(yīng)用提供更多的數(shù)據(jù)支持。參考文獻(xiàn):
[1] 王 林,梅 力,韋海濤,等.北京地區(qū)奶牛隱性乳房炎金黃色葡萄球菌的分離鑒定及藥敏試驗(yàn)[J].動(dòng)物醫(yī)學(xué)進(jìn)展,2015,36(4):124-127.
[2] 楊 峰,王 玲,王旭榮,等.金黃色葡萄球菌性奶牛乳房炎研究的知識(shí)圖譜分析[J].動(dòng)物醫(yī)學(xué)進(jìn)展,2016,37(2):38-44.
[3] Fan L,Bo S,Chen H,et al.Genome sequence ofBacillussubtilissubsp.spizizeniigtP20b,isolated from the Indian ocean[J].J Bacteriol,2011,193(5):1276
[4] 喻 鋼,田萬(wàn)紅,董思國(guó),等.2株枯草芽胞桿菌全基因組重測(cè)序分析[J].藥物分析雜志,2014,34(10):1907-1911.
[5] 吳三玲.半野生大豆(Glycine gracilis)基因組深度測(cè)序及其進(jìn)化分析[D].浙江杭州:浙江大學(xué),2013.
[6] 張志斌,鄧映明,熊瑤瑤,等.東鄉(xiāng)野生稻內(nèi)生放線(xiàn)菌分離及菌株S123 次級(jí)代謝產(chǎn)物分析[J].微生物學(xué)通報(bào),2015,42(9):1662-1670.
[7] 王琴翠.多粘類(lèi)芽胞桿菌SC2的全基因組測(cè)序[D].山東濟(jì)南:山東農(nóng)業(yè)大學(xué),2011.
[8] 何偉明.基于重測(cè)序數(shù)據(jù)的群體SNP位點(diǎn)檢測(cè)及基因型判斷[D].廣東廣州:華南理工大學(xué),2013.
[9] 程廷才,林 平,金盛凱,等.家蠶黑胸?cái)⊙堪麠U菌基因組測(cè)序及結(jié)構(gòu)分析和功能注釋[J].蠶業(yè)科學(xué),2014,40(6):1036-1043.
[10] 韓海格.馬銅綠假單胞菌全基因組重測(cè)序研究[D].內(nèi)蒙古呼和浩特:內(nèi)蒙古農(nóng)業(yè)大學(xué),2014.
[11] 劉 超,蘇龍翔,方向群,等.銅綠假單胞菌LCT-PA220菌株全基因組序列測(cè)定與分析[J].解放軍醫(yī)學(xué)院學(xué)報(bào),2014,35(7):738-740.
[12] 李澤鋒.一個(gè)中國(guó)南方野生大豆基因組深度測(cè)序及其分析[D].浙江杭州:浙江大學(xué),2012.
[13] 陳 重,李多云,程 航,等.一株腸致病性大腸桿菌的全基因組序列分析[J].中國(guó)熱帶醫(yī)學(xué),2015,15(5):525-528.
[14] 曹德民.一株糖蜜乙醇高產(chǎn)酵母的全基因組重測(cè)序研究[D].廣西南寧:廣西大學(xué),2014.
[15] 魏 武,丁國(guó)徽,王曉婧,等.豬鏈球菌全基因組序列比較分析[J].科學(xué)通報(bào),2016,51(7):808-815.
[16] 韓 笑,刀筱芳,張煥容,等.奶牛隱性乳房炎主要病原菌分離鑒定及耐藥性分析[J].動(dòng)物醫(yī)學(xué)進(jìn)展,2015,36(7):131-134.
Whole Genome Sequencing Analysis of a Small Colony Mutant Strain ofStaphylococcusaureus
WANG Qi-hui,SHI Yong-qiang,ZHU Yu,ZHANG Sai-fei,ZHU Li-li,QU Wei-jie
(FacultyofAnimalScienceandTechnology,YunnanAgriculturalUniversity,Kunming,Yunnan,650201,China)
To study on the genome difference between the small colony mutant strains ofStaphylococcusaureus(SASCVs) and the CP000253.1 for providing data to support subsequent research on the capacity ofS.aureusbacteria secrete of drug related materials.We did a research on a whole genome sequencing of the small colony mutant strains ofStaphylococcusaureus,and compared with those of sequence of CP000253.1 reference sequence.The results revealed that the library into fragments of the small colony mutant strains ofStaphylococcusaureusis 350 bp.The sequencing read long is 150 bp.The amount of raw data of SCVs is 551 Mb.The base content of SCVs distribution is different before and after processing.By sequencing weight,the number of SNP is larger.There is an obvious sequence difference between the small colony mutant strains ofStaphylococcusaureusand the CP000253.1 genome.The data provided the basis in a certain sequence for the study of dairy cow mastitisS.aureusinfection.
S.aureussmall colony mutant strain; difference of gene sequence; whole genome sequencing; SNP
2016-05-13
國(guó)家自然科學(xué)基金項(xiàng)目(31260629)
王奇惠(1990-),女,山東煙臺(tái)人,碩士,主要從事動(dòng)物營(yíng)養(yǎng)代謝病研究。*通訊作者
S852.611
A
1007-5038(2017)05-0077-04