劉 超,蘇龍翔,方向群,劉長庭
解放軍總醫(yī)院 南樓呼吸科,北京 100853
銅綠假單胞菌LCT-PA220菌株全基因組序列測定與分析
劉 超,蘇龍翔,方向群,劉長庭
解放軍總醫(yī)院 南樓呼吸科,北京 100853
目的 全基因組測序和分析銅綠假單胞菌LCT-PA220菌株,研究空間因素對細(xì)菌全基因組的影響,為宇航員的保健奠定基礎(chǔ)。方法通過革蘭染色鑒定LCT-PA220屬性,提取基因DNA、構(gòu)建文庫并上機(jī)測序;加工處理原始測序數(shù)據(jù)后進(jìn)行基因組組裝、注釋和分析。結(jié)果銅綠假單胞菌LCT-PA220菌株革蘭染色陰性,基因組為6.87M,包括5 829個編碼序列,平均長度為962 bp,預(yù)測到為54個tRNA基因,COG數(shù)據(jù)庫和KEGG數(shù)據(jù)庫比對共注釋到22組COG功能和32條KEGG信號通路。結(jié)論銅綠假單胞菌LCT-PA220菌株全基因組測序和基因組清楚,為后續(xù)對該菌株的研究打下了基礎(chǔ)。
銅綠假單胞菌;基因組;測序;編碼序列
銅綠假單胞菌,即綠膿桿菌,是一種非發(fā)酵革蘭陰性桿菌,菌體細(xì)長且長短不一[1]。它存在于土壤、水、皮膚、呼吸道和腸道等,在自然環(huán)境中廣泛分布,尤其是在潮濕的環(huán)境中,可引起人類和動物的疾病,是人類和動物的條件致病菌[2]。免疫力低下(長期使用激素類藥物、免疫抑制劑、實行腫瘤放療、化療治療)、侵入性診療操作(氣管切開、保留導(dǎo)尿管等)或手術(shù)后的病人易受該菌感染,因此其常被認(rèn)為是醫(yī)院內(nèi)感染的重要病原菌之一[3-4]。隨著生物信息學(xué)和新一代測序技術(shù)的發(fā)展,細(xì)菌的基因組研究日趨廣泛,為快速研究致病菌株的致病和耐藥機(jī)制提供了有效的手段[5]。本研究分析了一株銅綠假單胞菌菌株的全基因組測序結(jié)果,為更好地了解該菌株的各種生物學(xué)特性提供了一定的理論基礎(chǔ)。
1 主要材料 LCT-PA220來自中國菌種保存中心CGMCC1.2387經(jīng)過系列溫度培養(yǎng)的分離株,SOAPdenovo組裝軟件工具(華大基因)、高通量測序儀Illumina HiSeq 2000(Illumina公司)。
2 銅綠假單胞菌LCT-PA220菌株的培養(yǎng)和革蘭染色 取出凍存好的銅綠假單胞菌進(jìn)行平板劃線培養(yǎng),第2天挑取單克隆菌類,接種至LB培養(yǎng)中30℃培養(yǎng)24 h。取50 μl菌液離心,棄上清,加入無菌水50 μl,吸取20 μl于載玻片上進(jìn)行固定;加入革蘭染色Ⅰ(結(jié)晶紫)初染1 min,自來水沖洗后加入革蘭染色Ⅱ(碘液)媒染1 min,沖洗后加入革蘭染色Ⅲ(酒精)脫色30 s,沖洗后加入革蘭染色Ⅳ(番紅)復(fù)染1 min,沖洗晾干后用油鏡(100×)進(jìn)行觀察。
3 LCT-PA220菌株的基因組DNA提取和測序文庫構(gòu)建 通過裂解細(xì)菌、抽提、沉淀等步驟獲得基因組DNA,采用超聲將DNA打斷,再將接頭連接到片段上,經(jīng)PCR擴(kuò)增后制成測序文庫,隨后將已加入接頭的DNA片段固定在Flow cell上,經(jīng)PCR擴(kuò)增反應(yīng)形成Cluster。然后利用4種熒光標(biāo)記的染料邊合成邊測序。
4 LCT-PA220菌株基因組DNA的組裝和基因預(yù)測分析 原始測序數(shù)據(jù)下機(jī)后,經(jīng)過過濾去除污染、重復(fù)和接頭序列,得到用于組裝和分析的Clean數(shù)據(jù),運用華大自主開發(fā)的SOAP denovo組裝軟件對Reads數(shù)據(jù)進(jìn)行組裝,最終組裝成全基因組序列。采用Glimmer3.0軟件預(yù)測基因:通過與rRNA庫比對找到rRNA,或rRNAmmer軟件預(yù)測rRNA。通過tRNAscan軟件預(yù)測tRNA區(qū)域和tRNA的二級結(jié)構(gòu)[6-9]。
5 基因的注釋和功能分析 將編碼基因的蛋白質(zhì)序列與各功能數(shù)據(jù)庫進(jìn)行比對(包括KEGG和COG數(shù)據(jù)庫),得到相應(yīng)基因的功能注釋信息。根據(jù)每個編碼序列的比對結(jié)果,為了保證其生物意義,以比對效果最好的結(jié)果為此條基因的注釋。此外,還將測序得到的序列同銅綠假單胞菌的質(zhì)粒數(shù)據(jù)庫進(jìn)行了比對。
1 LCT-PA220菌株的革蘭染色 革蘭染色法是細(xì)菌學(xué)研究中常用的一種鑒別染色法。由于與周圍環(huán)境折光率差別異同,未經(jīng)染色的細(xì)菌在顯微鏡下不易觀察,染色后細(xì)菌與周圍環(huán)境差異明顯,可清晰地觀察到細(xì)菌的形態(tài)、排列及某些結(jié)構(gòu)特征。LCT-PA220菌株革蘭染色呈現(xiàn)為革蘭陰性桿狀細(xì)菌,呈單個排列,無芽孢。見圖1。
2 基因的組裝和預(yù)測 使用Illumina的Genome AnalyzerⅡ進(jìn)行測序并用SOAP denovo軟件行組裝,組裝結(jié)果見表1;最終得到211個Conntigs和39個Scaffolds。G+C含量被確定為66.17%,估計菌株LCT-PA220基因組大小為6.87 M,共預(yù)測到5 829個開放閱讀框,平均長度為962 bp,編碼序列的長度分布見圖2。tRNAscan-SE軟件,預(yù)測到為54個拷貝的tRNA基因。5S、16S和23S rRNA的鑒定使用RNAmmer軟件,總長度分別為114 bp、1 523 bp和2 888 bp。
3 基因功能的注釋和分析 將預(yù)測后的開放讀碼框的蛋白序列同各數(shù)據(jù)庫比對注釋后,發(fā)現(xiàn)3 904個編碼序列匹配到了22組COG的功能中,分別有2 929和3 807個CDS可分配到Swissprot和 KEGG數(shù)據(jù)庫。使用銅綠假單胞菌PAO1(accession No.NC_002516.2)作為參考的基因組序列進(jìn)行比較基因組分析。用SOAP比對軟件分析可知所有Reads均能夠比對上PAO1基因組,有大約95%的基因組覆蓋率和-120X的基因組覆蓋深度(圖3、圖4)。因此PAO1總基因長度的95%覆蓋了我們的Reads。同時使用SOAPaligner發(fā)現(xiàn)了4個銅綠假單胞菌質(zhì)粒(NC_008357,NC_009739,NC_010722和NC_007100)。但是,所有4個質(zhì)粒的基因組覆蓋率均<10%。來自假單胞菌的質(zhì)粒CT14(accession No NC_010891)覆蓋度超過31%,覆蓋區(qū)域是由兩個片段組成,覆蓋深度為120X,表明這兩個片段可能源于此質(zhì)粒并整合到了該菌株的基因組中。
4 GenBank登錄號 銅綠假單胞菌LCT-PA220菌株的全基因組序列存儲在DDBJ/EMBL/GenBank數(shù)據(jù)庫,序列號為AJKG00000000。
表1 LCT-PA220菌株基因組DNA測序數(shù)據(jù)的組裝結(jié)果統(tǒng)計表Tab. 1 Summary of assembly of LCT-PA220 genome
隨著人類基因組計劃的實施和進(jìn)行,生物體基因組研究已經(jīng)成為生命科學(xué)研究的前沿領(lǐng)域,而與之相對應(yīng)的微生物基因組研究正在廣泛開展[5]。細(xì)菌是微生物的一種,其基因組小、操作簡單且實驗周期短,其研究的工作可為人類基因組研究提供有益的參考;同時隨著測序技術(shù)的更新?lián)Q代和高通量測序技術(shù)的出現(xiàn),細(xì)菌基因組的測序成本和所需時間已大幅度降低[10]。通過基因組研究揭示細(xì)菌的遺傳規(guī)律,發(fā)現(xiàn)關(guān)鍵的功能基因并在此基礎(chǔ)上發(fā)展疫苗,開發(fā)新型的抗菌藥物或新的快速診斷方法,特別是針對某些新型傳染性病原菌的全基因組測序研究,對人類的醫(yī)療衛(wèi)生事業(yè)影響巨大[11]。
圖 1 LCT-PA220 菌株革蘭染色結(jié)果 (1 000×)Fig. 1 Gram staining of LCT-EF220 (1 000×)
圖 2 LCT-PA220菌株的基因長度分布圖Fig. 2 Gene length distribution of LCT-PA220 strain
圖 3 LCT-PA220菌株的COG功能分類圖Fig. 3 COG function classifcation of genes in LCT-PA220 strain
圖 4 LCT-PA220菌株的KEGG代謝通路分類圖Fig. 4 KEGG pathway classifcation of genes in LCT-PA220 strain
銅綠假單胞菌是臨床上一種常見的醫(yī)院內(nèi)獲得性感染的機(jī)會性致病菌。其常存在于潮濕環(huán)境中,如人體呼吸道、泌尿道、消化道、傷口等處,在各種常用的醫(yī)療設(shè)備如呼吸機(jī)、導(dǎo)管等處也被檢測到。隨著有創(chuàng)性診療手段的推廣和大量抗菌藥物的使用,銅綠假單胞菌的感染已經(jīng)上升至院內(nèi)革蘭陰性桿菌感染的第一位[2-3,12]。此外,國外研究尚無針對實際空間環(huán)境下的銅綠假單胞菌的全基因組測序,本研究對常見的銅綠假單胞菌衍生株LCT-PA220的全基因測序和分析,包括5 829個開放性讀碼框,功能基因的注釋分析發(fā)現(xiàn)大部分編碼序列都能比對上COG和KEGG數(shù)據(jù)庫,KEGG代謝通路分析以感知外界環(huán)境和代謝相關(guān)的信號通路居多,COG功能分析發(fā)現(xiàn)大部分基因是參與生命的代謝活動,還有一部分功能未知。通過對該菌株的基因組研究,希望能揭示銅綠假單胞菌致病的遺傳規(guī)律,為后續(xù)的功能基因組研究提供一些啟示。
1 Hancock RE. Resistance mechanisms in Pseudomonas aeruginosa and other nonfermentative gram-negative bacteria[J]. Clin Infect Dis,1998, 27 Suppl 1:S93-S99.
2 Lyczak JB, Cannon CL, Pier GB. Establishment of Pseudomonas aeruginosa infection: lessons from a versatile opportunist[J]. Microbes Infect, 2000,2(9):1051-1060.
3 Foca M, Jakob K, Whittier S, et al. Endemic Pseudomonas aeruginosa infection in a neonatal intensive care unit[J]. N Engl J Med, 2000, 343(10): 695-700.
4 Schelenz S, French G. An outbreak of multidrug-resistant Pseudomonas aeruginosa infection associated with contamination of bronchoscopes and an endoscope washer-disinfector[J]. J Hosp Infect, 2000, 46(1): 23-30.
5 Stover CK, Pham XQ, Erwin AL, et al. Complete genome sequence of Pseudomonas aeruginosa PAO1, an opportunistic pathogen[J]. Nature, 2000, 406(6799): 959-964.
6 Li R, Yu C, Li Y, et al. SOAP2: an improved ultrafast tool for short read alignment[J]. Bioinformatics, 2009, 25(15): 1966-1967.
7 Delcher AL, Bratke KA, Powers EC, et al. Identifying bacterial genes and endosymbiont DNA with Glimmer[J]. Bioinformatics,2007, 23(6): 673-679.
8 Lagesen K, Hallin P, R?dland EA, et al. RNAmmer: consistent and rapid annotation of ribosomal RNA genes[J]. Nucleic Acids Res,2007, 35(9): 3100-3108.
9 Lowe TM, Eddy SR. tRNAscan-SE: a program for improved detection of transfer RNA genes in genomic sequence[J]. Nucleic Acids Res, 1997, 25(5): 955-964.
10 Metzker ML. Sequencing technologies-the next generation[J]. Nat Rev Genet, 2010, 11(1): 31-46.
11 Wizemann TM, Heinrichs JH, Adamou JE, et al. Use of a whole genome approach to identify vaccine molecules affording protection against Streptococcus pneumoniae infection[J]. Infect Immun,2001, 69(3): 1593-1598.
12 Grundmann H, Kropec A, Hartung D, et al. Pseudomonas aeruginosa in a neonatal intensive care unit:reservoirs and ecology of the nosocomial pathogen[J]. J Infect Dis, 1993, 168(4): 943-947.
Whole genome sequencing and analysis of Pseudomonas aeruginosa strain LCT-PA220
LIU Chao, SU Long-xiang, FANG Xiang-qun, LIU Chang-ting
Respiratory Diseases Department in South Building, Chinese PLA General Hospital, Beijing 100853, China
LIU Chang-ting. Email:liuchangt@gmail.com
ObjectiveTo study the influence of the spatial factor which is closely associated with spacemen's health, the whole genome sequence of Pseudomonas aeruginosa strain LCT-PA220.MethodsThe characteristic was identified by gram stain examination. Then genomic DNA was extracted from LCT-PA220 strain and the library was constructed and followed by sequencing. The raw date were fltered, assembled into genome, annotated and analyzed.ResultsThe identify of LCT-PA220 strain was gram-negative bacteria whose genome was 6.87M containing 54 tRNA genes and 5 829 coding sequences with 962 bp average gene length. COG and KEGG annotation analysis revealed 22 COG functions and 32 KEGG pathways, respectively.ConclusionThe whole genome of LCT-PA220 strain is sequenced and annotated well, which paves the way for further study of this strain.
Pseudomonas aeruginosa; genome; sequencing; coding sequence
R 378
A
2095-5227(2014)07-0738-04
10.3969/j.issn.2095-5227.2014.07.025
時間:2014-03-20 15:01
http://www.cnki.net/kcms/detail/11.3275.R.20140320.1501.006.html
2014-01-16
國家“973”重點基礎(chǔ)研究發(fā)展規(guī)劃項目(2014CB744400);全軍醫(yī)學(xué)科研“十二五”課題重點項目(BWS12J046);武器預(yù)研重點基金(9140A26040312JB10078)
Supported by National “973” Program for Basic Science Research Development of China(2014CB744400); the Military Special-purpose Program of "Twelfth Five-Year"(BWS12J046)
劉超,男,碩士。研究方向:老年呼吸病學(xué),微生物學(xué)。Email:c6663619@163.com
劉長庭,男,教授,主任醫(yī)師,博士生導(dǎo)師,主任。Email:liuchangt@gmail.com