劉沐桑 張莉莉 呂桂霞 沈永年 胡素泉 劉維達
常見醫(yī)學真菌DNA條形碼BLAST數(shù)據(jù)庫的建立
劉沐桑 張莉莉 呂桂霞 沈永年 胡素泉 劉維達?
目的: 構(gòu)建我國重要醫(yī)學真菌DNA條形碼BLAST數(shù)據(jù)庫。方法: 對28種醫(yī)學真菌的ITS-rDNA序列(DNA條形碼)進行測定和匯總,并使用NCBI提供的數(shù)據(jù)庫工具將匯總的序列構(gòu)建成DNA條形碼數(shù)據(jù)庫。結(jié)果: 構(gòu)建的醫(yī)學真菌DNA條形碼數(shù)據(jù)庫包括28種中國常見醫(yī)學真菌的DNA條形碼序列,利用數(shù)據(jù)庫對待測真菌標本的DNA條形碼序列進行檢索,能進一步確定真菌類型。結(jié)論: 本實驗構(gòu)建的醫(yī)學真菌DNA條形碼數(shù)據(jù)庫可以用于醫(yī)學真菌的分子鑒別。
醫(yī)學真菌; DNA條形碼; BLAST檢索; 數(shù)據(jù)庫
DNA條形碼(DNA barcode)是一種統(tǒng)一的DNA標志序列,通常來源于某個基因或者它的部分序列,能提供對某一大類生物物種適用的分子鑒定標志。1能夠在人體致病的真菌已近400種,人的深部以及淺表真菌感染都有增多趨勢,2且還不斷出現(xiàn)新的真菌物種感染人體的報道。3由于不同醫(yī)學真菌的侵襲定植性質(zhì)、毒力和藥敏譜以及相關(guān)疾病的預后常有很大不同,因此準確地鑒定菌種對臨床成功診治有重要意義。建立醫(yī)學真菌的DNA條形碼系統(tǒng)可以實現(xiàn)對真菌分子鑒別的統(tǒng)一化,是一項有意義的科學實踐。
目前真菌界最通用的DNA條形碼序列是核糖體DNA的內(nèi)轉(zhuǎn)錄間區(qū)(internal transcribed spacer,ITS)序列,不同于動植物常用的細胞色素基因序列。4ITS基因作為分子標記的優(yōu)點是拷貝數(shù)多,而且擴增過程簡便,需要引物組合的數(shù)目也比較少。52012年發(fā)表的一項真菌DNA條形碼綜合研究表明,ITS序列基本適合用于真菌條形碼編制。6在此前的一項研究中,對我國臨床上最常見的8種醫(yī)學真菌做了DNA條形碼的初步研究,發(fā)現(xiàn)基于ITS區(qū)序列的條形碼對真菌種內(nèi)保守,而在種間具有顯著差異,條形碼可以用于鑒別我國常見真菌的種類。7
基本局域連配檢索工具(basic local alignment search tool,BLAST)是由美國國家生物信息中心(National Center for Biotechnology Information,NCBI)開發(fā)的序列查找和對比工具,BLAST及其相關(guān)數(shù)據(jù)庫是快速進行數(shù)據(jù)查找匹配的有力工具。8目前BLAST工具及其數(shù)據(jù)庫可以通過自行構(gòu)建的方法脫機運行,即通過本地數(shù)據(jù)庫進行查找,而無需連接到美國NCBI的中央數(shù)據(jù)庫。本地數(shù)據(jù)庫可以由研究者自己提供的序列構(gòu)建,使得查找更具針對性,速度更快,結(jié)果更準確。
本研究中,我們測定常見的28種醫(yī)學真菌的ITS序列,用于醫(yī)學真菌的物種鑒別,從而覆蓋臨床大多
數(shù)常見真菌感染病例。在此基礎(chǔ)上,我們構(gòu)建了我國常見真菌感染的醫(yī)學真菌DNA條形碼數(shù)據(jù)庫。該數(shù)據(jù)庫整合了BLAST檢索服務(wù)工具,臨床標本測序結(jié)果可通過該服務(wù)對數(shù)據(jù)庫進行檢索和比對,從而起到快速診斷的作用。
1.1 菌株 本研究使用菌株取自中國微生物菌種保藏委員會醫(yī)學真菌保藏中心標準菌株,具體如下:斷發(fā)毛癬菌(Trichophyton tonsurans)、克柔念珠菌(Issatchenkia orientalis)、季也蒙念珠菌(Pichia guilliermondii)、新生隱球菌(Cryptococcus neoformans)、阿薩西毛孢子菌(Trichosporon asahii)、糠秕馬拉色菌(Malassezia furfur)、球形馬拉色菌(Malassezia globosa)、合軸馬拉色菌 (Malassezia sympodialis)、黃曲霉(Aspergillus flavus)、黑曲霉(Aspergillus niger)、煙曲霉(Aspergillus fumigatus)、多變根毛霉 (Rhizomucor variabilis)、茄病鐮刀菌(Fusarium solani)、串珠鐮刀菌(Fusarium verticillioides)、鏈格孢霉(Alternaria alternata)、出芽短梗霉(Aureobasidium pullulans)、卡氏枝孢瓶霉(Cladophialophora carrionii)、新月彎孢霉(Curvularia lunata)、膝狀彎孢霉(Cochliobolus geniculatus)、皮炎外瓶霉(Exophiala dermatitidis)、甄氏外瓶霉(Exophiala jeanselmei)、須癬毛癬菌(Trichophyton mentagrophytes)、近平滑念珠菌(Candida parapsilosis)、石膏樣小孢子菌(Microsporium gypseum)、熱帶念珠菌(Candida tropicalis)、紅色毛癬菌株(Trichophyton rubrum)、光滑念珠菌(Candida glabrata)、白念珠菌(Candida albicans)。
1.2 試劑與儀器 DNA提取使用Fast DNA?SPIN試劑盒(美國MP Bio公司)。PCR實驗用TaKaRa TaqTM聚合酶、dNTP、PCR緩沖液、100 bp電泳分子量Marker均來源于寶生物工程(大連)有限公司。PCR和測序所用引物由上海生工公司合成。核酸提取使用FastDNA SPN試劑盒及其配套的Bio 101 Fastprep-24核酸提取儀都是購自MP Bio公司(美國)。培養(yǎng)基為實驗室自行配制的馬鈴薯葡萄糖瓊脂培養(yǎng)基(PDA)。
1.3 DNA提取和純化 樣品真菌接種于PDA培養(yǎng)基,28℃培養(yǎng)7~10 d,收取上層真菌約100mg放置到5 mL玻璃組織研磨器中進行研磨,并按照FastDNA SPN試劑盒說明書進行真菌DNA的提取。詳細如下:先加入1 mL CLS-Y緩沖液振蕩混勻,然后孵育20 min(室溫),放到Fastprep核酸提取儀上以5.0/s的速度振蕩30 s,再孵育30 min;然后用14 000 r/min離心5 min,上清移至新管中;加入600μL Binding matrix混勻后進行5 min孵育;然后在12 000 r/min離心1 min,取沉淀加入500μL SEWS-M吹打混勻,再次離心取沉淀干燥30 min;加入100μL DES吹打混勻,12 000 r/min過柱離心洗脫1min。洗脫下來的核酸放-20℃保存?zhèn)溆谩?/p>
1.4 PCR擴增與測序 根據(jù)文獻,采用了真菌通用引物ITS1(正向:5′-TCCGTAGGTGAACCTGCGG-3′)和ITS4(反向:5′-TCCTCCGCTTATTGATATGC-3′)擴增ITS基因。PCR反應(yīng)體系如下:2.5 mmol/L dNTPs 4μL,10×緩沖液5μL,10 mmol/L MgCl23μL,10 μmol/L引物各1μL,Taq DNA聚合酶2 U,模板DNA 2μL,雙蒸水將余下體積補至總體積50μL。反應(yīng)條件:預變性95℃ 5 min;變性95℃ 45 s;退火53℃ 45 s;延伸 72℃ 75s,共30個循環(huán),最末延伸72℃ 7 min。PCR產(chǎn)物送至上海生工生物公司純化并測序。測序結(jié)果使用SeqMan軟件(DNA Star軟件包)進行拼裝,并根據(jù)測序峰圖對序列進行手工核對,形成完整ITS區(qū)核酸序列,存為FASTA格式文本文件,即醫(yī)學真菌的DNA條形碼序列。
1.5 整合BLAST檢索服務(wù)數(shù)據(jù)庫的構(gòu)建 在我單位工作站計算機上安裝美國國家生物信息中心(NCBI)提供的BLAST-2.2.29軟件工具包。首先將28株醫(yī)學真菌的ITS區(qū)核酸序列存為單一的FASTA格式文件ITS_barcode_db.fas,然后使用BLAST-2.2.29工具包的makeblastdb命令對上述序列文件進行數(shù)據(jù)格式化和索引化(參數(shù):-in ITS_barcode_db.fas-db type nucl),形成可供BLAST檢索的本地數(shù)據(jù)庫。
1.6 數(shù)據(jù)庫的檢索使用 取我中心保藏的經(jīng)過鑒定的煙曲霉臨床株,標記為h 47號真菌標本。按1.3~1.4中描述方法提取DNA擴增ITS區(qū)DNA條形碼并進行單側(cè)測序,測序結(jié)果取中段峰圖清晰308 bp保存為test1.txt文件。使用本地數(shù)據(jù)庫的blastn命令將待檢索測序結(jié)果對數(shù)據(jù)庫進行檢索(參數(shù):-query test1.txt-db ITS_barcode_db.fas-out result1.txt),結(jié)果自動存于result1.txt文件。
2.1 真菌DNA條形碼序列 所得28株醫(yī)學真菌的條形碼序列(ITS rDNA序列)最短的是鏈格孢霉(301 bp),最長的是糠秕馬拉色菌(806 bp)。序列間差異最小的是斷發(fā)毛癬菌和須癬毛癬菌(7 bp),差異最大的是季也蒙念珠菌和糠秕馬拉色菌(349 bp)。
2.2 BLAST檢索服務(wù)的數(shù)據(jù)庫的建立 序列數(shù)據(jù)經(jīng)過BLAST-2.2.29工具包格式化后生成數(shù)據(jù)庫由以下三個文件構(gòu)成,分別為ITS_barcod_db.fas.nhr、ITS_ barcod_db.fas.nin和ITS_barcod_db.fas.nsq。上述三個文件分別是數(shù)據(jù)庫的庫索引(indices),序列(sequences)和頭(headers)文件,三者共同構(gòu)成完整數(shù)據(jù)庫。根據(jù)Makeblastdb命令運行結(jié)果判斷數(shù)據(jù)庫構(gòu)建成功。數(shù)據(jù)庫包含共28條核酸序列,總?cè)萘?4 337
字節(jié)。
2.3 數(shù)據(jù)庫的檢索應(yīng)用實例(待測標本h 47號的ITS-rDNA測序結(jié)果) 對數(shù)據(jù)庫進行Blast檢索,結(jié)果見圖1和圖2。Blast檢索的相似顯著性E值(EValue)的閾值默認為10-10。數(shù)據(jù)庫中檢索到的與提交序列具有顯著相似性的醫(yī)學真菌DNA條形碼序列(E值<10-10)共有20條。與提交序列最為相似的三條數(shù)據(jù)庫記錄均為曲霉菌,分別是煙曲霉,黑曲霉和黃曲霉。相似性最顯著的煙曲霉序列,其相似度打分為569,相似顯著性E值為10-165。圖2為數(shù)據(jù)庫的blast工具(核酸序列檢索)對提交序列與煙曲霉序列進行聯(lián)配比對的結(jié)果。兩條序列完全相同(identtities=100%),而且提交序列與數(shù)據(jù)庫中存儲的煙曲霉序列反向互補(Strand=Plus/Minus)。根據(jù)標本的DNA條形碼對醫(yī)學真菌DNA條形碼數(shù)據(jù)庫進行檢索和比對的結(jié)果,我們判定h 47號標本為煙曲霉。此結(jié)論與我中心根據(jù)h 47號臨床分離株的菌落形態(tài)學和顯微形態(tài)學進行的標準鑒定結(jié)果一致。
圖1 h 47號標本的ITS-rDNA序列在本數(shù)據(jù)庫的檢索結(jié)果
圖2 h 47號標本的ITS-rDNA序列與煙曲霉序列聯(lián)配比對結(jié)果(部分)
真菌是在人體引起感染的常見病原體之一,常引起淺部真菌病。此外,近年來由于移植手術(shù)和免疫抑制劑的廣泛應(yīng)用,深部真菌病對人類健康的威脅也日漸增加。因此,對醫(yī)學真菌進行分類鑒別工作的重要性也尤其凸顯出來。分子鑒別是目前除宏觀形態(tài)學和顯微形態(tài)學外的最有效手段,具有操作簡便、速度快和無需專門培訓技術(shù)人員等許多優(yōu)越性。而DNA條形碼作為統(tǒng)一鑒別生物物種的分子生物學技術(shù),在真菌鑒別上也得到了廣泛應(yīng)用。9
真菌的ITS和核糖體RNA編碼DNA(ITS-rDNA)是最早制定的真菌DNA條形碼序列;在論證過程,也有人嘗試使用線粒體COX1基因序列作為DNA條形碼來實現(xiàn)真菌在物種水平的鑒別和分類。10但是,最近一項較大規(guī)模的研究指出,作為真菌DNA條形碼的標記分子,ITS-rDNA序列相對其他真菌基因具有較大優(yōu)點。6因此,在本研究中,我們基于ITS-rDNA序列的真菌DNA條形碼的測定和匯總,并使用美國生物信息中心提供的數(shù)據(jù)庫工具,最終使我們的數(shù)據(jù)形成醫(yī)學真菌DNA條形碼數(shù)據(jù)庫。與原始的FASTA格式的序列文件不同,構(gòu)建成功的數(shù)據(jù)庫文件為二進制執(zhí)行代碼,不可進行文本閱讀和編輯,但是可使用BLAST檢索工具將未知序列提交數(shù)據(jù)庫進行匹配查找,并將提交序列與數(shù)據(jù)庫中的序列做聯(lián)配比對。經(jīng)過試驗,通過我們的醫(yī)學真菌DNA條形碼數(shù)據(jù)庫的比對鑒別結(jié)果與傳統(tǒng)形態(tài)學鑒定的結(jié)果一致,數(shù)據(jù)庫可有效輔助醫(yī)學真菌的鑒別。而且檢索和比對分析過程完全在本地計算機進行,無需連接網(wǎng)絡(luò),更無需連接到美國生物信息中心(NCBI)的生物序列數(shù)據(jù)庫。
為便于推廣數(shù)據(jù)庫的應(yīng)用,在本數(shù)據(jù)庫中我們嘗試使用中文字符標注真菌名稱,但是由于目前NCBI提供的BLAST工具包(2.2.29版)尚不支持多語言功能,格式化數(shù)據(jù)庫時出錯。因此,我們在序列名稱后使用豎括號(‖)間隔標注漢語拼音名稱,順利通過數(shù)據(jù)庫格式化。這樣,我們對數(shù)據(jù)庫進行檢索和比對操作時,結(jié)果可以同時顯示拉丁文學名和漢語拼音標注,更加方便了使用。
本研究在對28株我國常見醫(yī)學真菌的條形碼序列(即ITS-rDNA序列)的測定和匯總的基礎(chǔ)上,構(gòu)建了我國醫(yī)學真菌DNA條形碼數(shù)據(jù)庫。該數(shù)據(jù)庫可用于對未知醫(yī)學真菌標本的條形碼測序結(jié)果進行檢索和比對,從而實現(xiàn)基于DNA條形碼的醫(yī)學真菌分子鑒別。在以后的工作中,我們將繼續(xù)增加醫(yī)學真菌DNA條形碼數(shù)據(jù)庫的菌種數(shù)量,并計劃建立相應(yīng)網(wǎng)站加以推廣和應(yīng)用。
1 Hebert PD,Ratnasingham S,deWaard JR.Barcoding animal life:cytochrome c oxidase subunit 1 divergences among closely related species.Proc Biol Sci,2003,270(Suppl 1):S96-99.
2HofH.Developments in the epidemiolgy of invasive fungal infec-
tions-implications for the empiric and targeted antifungal therapy.Mycoses,2008,51(Suppl 1):1-6.
3Wang JL,Chang CH,Young-XY,et al.Systematic review and meta-analysis of the tolerability and hepatotoxicity of antifungals in empirical and definitive therapy for invasive fungal infection. Antimicrob Agents Chemother,2010,54(6):2409-2419.
4 Seifert KA,Crous PW.The all-fungi DNA barcoding campaign (FunBOL).Persoonia,2008,20:106.
5 Taylor JW,Geiser DM,Burt A,et al.The evolut ionary biology and population genetics underlying fungal strain typing.Clin Microbiol Rev,1999,2(1):126-146.
6 Schoch CL,Seifert KA,Huhndorf S,et al.Nuclear ribosomal internal transcribed spacer(ITS)region as a universal DNA barcode marker for Fungi.Proc Natl Acad Sci USA,2012,17 (16):6241-6246.
7劉沐桑,梅繯,呂桂霞,等.8種病原真菌DNA條形碼的構(gòu)建和應(yīng)用評價.中國麻風皮膚病雜志,2012,(5):311-313.
8 Zhang Z,Schwartz S,Wagner L,et al.A greedy algorithm for aligning DNA sequences.JComput Biol,2000,7(1-2):203-214.
9Begerow D,Nilsson H,Unterseher M,et al.Current state and perspectives of fungal DNA barcoding and rapid identification procedures.App l Microbiol Biotechnol,2010,87(1):99-108.
10 Seifert KA,Samson RA,Dewaard JR,et al.Prospects for fungus identification using CO1 DNA barcodes,with Penicillium as a test case.Proc Natl Acad Sci USA,2007,104(10):3901-3906.
(收稿:2014-10-09 修回:2014-11-16)
Construction of BLAST database ofmedical fungiDNA barcode
LIU Mu-sang,ZHANG Li-li,LVGui-xia,etal.Institute ofDermatology,Chinese Academy ofMedical Sciences and Peking Union Medical College,Nanjing,210042
Objective:To construct BLAST database ofmedical fungi DNA barcode.M ethods:ITS-rDNA regions(DNA barcode)of 28 species of themedical fungiweremeasured and the DNA barcode data base was constructed by using database tools provided by National Center for Biotechnology Information(NCBI).Results:Twenty-eighty DNA barcode sequences of medical fungi DNA barcode database were established.The specie of fungi could be confirmed by BLAST database ofmedical fungi DNA barcode.Conclusion:BLAST database ofmedical fungiDNA barcodewere constructed successfully and can be used formolecular identification ofmedical fungi.
medical fungi;DNA barcode;BLAST search;database
人力資源和社會保障部留學人員科技活動項目擇優(yōu)資助項目協(xié)和青年基金和中央高校基本科研業(yè)務(wù)費專項資金(編號: 33320140189)江蘇省臨床醫(yī)學科技專項(編號:BL2012003)科技部科技基礎(chǔ)性工作專項(編號:2013FY113700)
中國醫(yī)學科學院北京協(xié)和醫(yī)學院皮膚病研究所,南京,210042?通信作者