,,,,
近年來學(xué)者對(duì)于棘球絳蟲的分類做了大量研究,由于棘球絳蟲具有獨(dú)特的繁殖方式:成蟲雌雄同體,以自體受精為主;中絳期為無性繁殖。這種雙向發(fā)育和繁殖模式造就了棘球絳蟲的生物多樣性,加速了遺傳一致性種群的形成[1],目前至少有10種亞種的報(bào)道,學(xué)者們通過分析細(xì)粒棘球絳蟲mtDNA全基因組序列,將細(xì)粒棘球絳蟲 G1-G3基因型歸為狹義細(xì)粒棘球絳蟲(Echinococcusgranulosussensustricto)、G4基因型歸為馬棘球絳蟲(Echinococcusequinus、G5基因型歸為奧式棘球絳蟲(Echinococcusortleppi)、G6-G10基因型歸為加拿大棘球絳蟲(Echinococcuscanadensis)及細(xì)粒棘球絳蟲獅子株歸為獅棘球絳蟲(Echinococcusfelidis)[2]。但不少亞種能否單獨(dú)存在尚存在爭(zhēng)議。線粒體基因是典型的母性遺傳,因其具有結(jié)構(gòu)簡(jiǎn)單穩(wěn)定、無重組、易分離純化、由于受到線粒體內(nèi)氧化環(huán)境的影響而容易發(fā)生突變,因此其進(jìn)化速率快,是研究寄生蟲分子進(jìn)化的理想工具。在構(gòu)建親緣關(guān)系相近物種的進(jìn)化樹時(shí)比使用核 DNA序列更有優(yōu)勢(shì)。利用不同蟲株(基因型)在幼蟲形態(tài)、致病性、宿主范圍、流行病學(xué)意義等方面存在的差異,通過分析線粒體基因的種類和數(shù)量、遺傳密碼子進(jìn)化、同義密碼子使用、RNA轉(zhuǎn)錄成熟機(jī)制及堿基組成的偏向性、基因重疊及重排現(xiàn)象等問題[3],能反映寄生蟲的不同進(jìn)化路線,因而被廣泛用于生物間系統(tǒng)起源、演化、分類及親緣關(guān)系的研究[4]。同時(shí)對(duì)疫苗、診斷試劑及抗蟲藥物的研制和開發(fā)具有重要意義[5-6]。本研究通過分析棘球?qū)俳{蟲線粒體基因組序列的基因結(jié)構(gòu)、堿基組成、遺傳密碼子及分子系統(tǒng)發(fā)育,以期為種系鑒定提供理論參考。
1.1序列獲取 從NCBI GenBank數(shù)據(jù)庫下載棘球?qū)俳{蟲線粒體基因組DNA全序列,包括多房棘球絳蟲(Echinococcusmultilocularis,Em)、福氏棘球絳蟲(Echinococcusvogeli,Ev)、少節(jié)棘球絳蟲(Echinococcusoligarthrus,Eo)、獅棘球絳蟲(Echinococcusfelidis,Ef)、石渠棘球絳蟲(Echinococcusshiquicus,Es)及細(xì)粒棘球絳蟲(Echinococcusgranulosus,Eg)多個(gè)蟲株(G1、EchinococcusequinusG4、EchinococcusortleppiG5、EchinococcuscanadensisG6、EchinococcuscanadensisG7、EchinococcuscanadensisG8、EchinococcuscanadensisG10),并以豬帶絳蟲(Taenia solium,Ts)作為外類群。
1.2mtDNA的組成及排列使用OGDRAW(https://chlorobox.mpimp-golm.mpg.de/OGDraw.html)在線分析網(wǎng)站及Vector NTI Express軟件。
1.3序列分析及分子進(jìn)化樹的構(gòu)建 用Clust-X軟件對(duì)多個(gè)相似序列進(jìn)行多重序列比對(duì)分析。使用Mega4.0軟件選擇鄰接法(Neighbor-joining method,NJ)構(gòu)建進(jìn)化樹,并做Bootstrap檢驗(yàn),重復(fù)次數(shù)設(shè)置為10000,選擇Bootstrap檢驗(yàn)。密碼子使用情況使用Mega4.0軟件分析。
1.4核糖體基因分析及二級(jí)結(jié)構(gòu)預(yù)測(cè) l-rRNA和s-rRNA二級(jí)結(jié)構(gòu)預(yù)測(cè)使用RNAfold在線預(yù)測(cè)網(wǎng)站(http://rna.tbi.univie.ac.at//cgibin/RNAWebSuite/RNAfold.cgi),選擇minimum free energy (MFE) and partition function算法。
2.1線粒體基因組基因的組成及排列 除Eg G1外,棘球絳蟲屬線粒體基因組有36個(gè)編碼基因,包括22個(gè)轉(zhuǎn)運(yùn)RNA基因、12個(gè)蛋白基因、2個(gè)核糖體RNA基因。其中Eo、Es、Ev、Eg G1、Eg G4、Ef線粒體ND4L-ND4基因基因序列存在2-30 bp序列的重疊?;蚺帕写涡?yàn)椋簍rnY-trnL-trnS-trnL-trnR-ND5-trnG-COX3-trnH-CYTB-ND4L-ND4-trnQ-trnF-trnM-ATP6-ND2-trnV-trnA-trnD-ND1-trnN-trnP-trnI-trnK-ND3-trnS-trnW-COX1-trnT-rrnL-trnC-rrnS-COX2-trnE-ND6。但Eg G1線粒體基因組最小,只有30個(gè)編碼基因,在起始編碼區(qū)缺少6個(gè)編碼轉(zhuǎn)運(yùn)RNA(trnY-trnL-trnS-trnL-trnR-trnG)的基因。且第一個(gè)編碼基因不是ND5,而是COX3,ND5變?yōu)樽詈笠粋€(gè)。Em、EgG1 mtDNA全序列見圖1、圖2。
圖1 多房棘球絳蟲線粒體基因組全基因組序列Fig.1 Echinococcus multilocularis mitochondrion, complete genome
2.2棘球?qū)俳{蟲線粒體基因組的蛋白基因核苷酸序列變異位點(diǎn)分析 12種棘球?qū)俳{蟲線粒體基因組的蛋白基因核苷酸序列變異位點(diǎn)分析結(jié)果顯示,蛋白基因核苷酸序列變異率為27.9%~42.7%,其中COX1最為保守,這也是在棘球?qū)俜N系鑒定中常選擇COX1基因作為分子標(biāo)記物的原因之一,其次為ND3、COX2變異率分別為27.9%、29.7%,另外ND4、ATP6、ND6、ND5基因進(jìn)化速率較快,其中以ND5變異率最大達(dá)到42.7%,因此,ND4、ATP6、ND6、ND5基因也可以作為COX1基因的輔助分子標(biāo)記(表1)。
表1 棘球?qū)俳{蟲線粒體基因組的蛋白編碼基因核苷酸序列變異位點(diǎn)分析Tab.1 Nucleotide sequence variation of protein-coding genes in mitochondrial genome of Echinococcus genus
2.3轉(zhuǎn)錄密碼子使用情況 與大多數(shù)真核生物一樣,棘球?qū)倬€蟲線粒體蛋白基因起始密碼子主要為atg,但也有一些蛋白質(zhì)以gtg作為起始密碼子,COX2在12種棘球?qū)俳{蟲中均以gtg作為起始密碼子,有些蛋白質(zhì)只在部分蟲株中以gtg作為起始密碼,例如ND4L、ND4、ND2、ND1。終止密碼子以taa和tag常見,但也有以ttt作為終止密碼子(表2)。
表2 棘球?qū)俳{蟲線粒體編碼蛋白基因起始密碼子和終止密碼子Tab.2 Initiation codon and termination codon of mitochondrial protein gene in Echinococcus genus
2.4蛋白翻譯密碼子使用情況 棘球絳蟲屬使用的密碼子為棘皮類和扁形蟲線粒體密碼(transl_table=9),與標(biāo)準(zhǔn)密碼子表的區(qū)別為:在標(biāo)準(zhǔn)密碼子表中AAA編碼Lys,AGA、AGG編碼Arg,UGA為終止密碼子,而棘球?qū)俳{蟲中AAA編碼Asn,AGA、AGG編碼Ser,UGA編碼Trp。在棘球?qū)俳{蟲中編碼氨基酸的密碼子使用頻率最高的是UUG(2.72%),頻率最低的是CUC(1%)、CGC(1%),編碼亮氨酸 L(UUA、UUG、CUU、CUC、CUA、CUG)、精氨酸R(CGU、CGC、CGA、CGG、AGA、AGG)的密碼子最多達(dá)6個(gè),編碼甲硫氨酸M(AUG)、色氨酸W(UGG)最少只有1個(gè)。亮氨酸 L也是棘球?qū)俳{蟲最偏好的氨基酸達(dá)到6%(表3)。
表3 蛋白編碼密碼子使用情況Tab.3 Protein coding codon usage
2.5核糖體(rRNA)基因的二級(jí)結(jié)構(gòu) 棘球?qū)俳{蟲核糖體基因有兩個(gè)分別為l-rRNA及s-rRNA,長(zhǎng)度大小分別為977~985 bp、700~727 bp,兩個(gè)基因的位置十分靠近中間只隔一個(gè)trnC基因。通過RNAfold在線預(yù)測(cè)網(wǎng)站預(yù)測(cè)棘球絳蟲rRNA結(jié)構(gòu)類似,形成較多的莖環(huán)結(jié)構(gòu)。多房棘球絳蟲rRNA結(jié)構(gòu)見圖3。
s-rRNAl-rRNA
2.6線粒體基因組序列系統(tǒng)進(jìn)化分析 基于12種棘球絳蟲線粒體基因組全序列,以T.s作為外類群,使用鄰接法構(gòu)建系統(tǒng)進(jìn)化樹。由圖5可以看出Ev、Eo單獨(dú)為一枝,Em、Es及Eg G1、Ef形成姐妹枝。細(xì)粒棘球絳蟲G4、G5、G6、G7、G8、G10亞型聚為一枝,進(jìn)化距離較近(見圖4)。
圖4 棘球?qū)俳{蟲系統(tǒng)發(fā)育樹Fig.4 Phylogenetic tree of Echinococcus genus
目前棘球?qū)俳{蟲種及亞種的分類存在著爭(zhēng)議,自從多房棘球絳蟲、少節(jié)棘球絳蟲、福氏棘球絳蟲立為獨(dú)立種之后,爭(zhēng)論漸趨平息,目前比較公認(rèn)的棘球?qū)俳{蟲共有4種,但近年,我國(guó)學(xué)者肖寧等先后從高原鼠兔(Ochotonacurzoniae)和藏狐(Vulpesferrilata)分離出一種棘球絳蟲,其成蟲和幼蟲形態(tài)、分子遺傳特點(diǎn)、寄生宿主范圍和地理分布、物種進(jìn)化等方面與其他棘球?qū)俳{蟲存在較大差異,具備種間差異條件,并以其首次發(fā)現(xiàn)地——四川石渠縣命名為石渠棘球絳蟲[7-8]。但其能否作為新的種還存在許多疑點(diǎn),石渠棘球絳蟲是否為細(xì)粒棘球絳蟲或多房棘球絳蟲在非適宜宿主中適應(yīng)性的改變不得而知。由于棘球?qū)俳{蟲特別是細(xì)粒棘球絳蟲種內(nèi)變異現(xiàn)象非常普遍[9],根據(jù)線粒體COX1和NAD1基因部分序列的差異,細(xì)粒棘球絳蟲分為G1-G10 10種不同基因型[1,10-12]。
隨著新的寄生宿主[13]及生物學(xué)特征[14]被發(fā)現(xiàn),這樣的分類依然不盡完善,因此本研究通過分析12種報(bào)道的棘球?qū)俳{蟲的線粒體基因組序列,為深入了解棘球?qū)俳{蟲,本文從棘球?qū)俳{蟲線粒體基因組序列堿基組成、基因結(jié)構(gòu)與排列、密碼子使用及偏好、系統(tǒng)發(fā)育等進(jìn)行分析。通過分析發(fā)現(xiàn)棘球?qū)倬€粒體主要有三部分組成包括22個(gè)轉(zhuǎn)運(yùn)RNA基因、12個(gè)蛋白基因、2個(gè)核糖體RNA基因,但E.g G1 線粒體基因組發(fā)生了重排,只有30個(gè)編碼基因,且第一個(gè)編碼基因不是ND5,而是COX3,ND5變?yōu)樽詈笠粋€(gè),重排是種系進(jìn)化中的稀有事件,重排的規(guī)律性可為重建物種演化歷史提供重要信息。且E.g G1缺少6個(gè)編碼轉(zhuǎn)運(yùn)RNA,無法轉(zhuǎn)運(yùn)酪氨酸、亮氨酸、絲氨酸、精氨酸、甘氨酸,這些氨基酸可能有其他轉(zhuǎn)運(yùn)RNA轉(zhuǎn)運(yùn)或由宿主提供。
目前對(duì)于棘球?qū)俳{蟲基因型分類常用的工具包括核基因和mtDNA,核基因主要包括核糖體DNA第一、二內(nèi)轉(zhuǎn)錄間隔區(qū)基因ITSl、ITS2,肌動(dòng)蛋白III,延長(zhǎng)因子1A,轉(zhuǎn)化生長(zhǎng)因子,硫氧還蛋白過氧化物酶,鈣網(wǎng)蛋白,疏水性類彈性蛋白,抗原B 1,Eg9和Eg16等,而線粒體基因主要有cox1、nad1、nad2,nad3、cytb、ATP6、12s rRNA和16s rRNA等[15-16],一般認(rèn)為線粒體基因序列進(jìn)化較快,種系發(fā)育關(guān)系分析方面比核基因更有效,隨著近年來學(xué)者們對(duì)于棘球?qū)倬€粒體基因測(cè)序數(shù)據(jù)的不斷積累,棘球絳蟲mtDNA數(shù)據(jù)庫較核基因更完善,在棘球?qū)俳{蟲分類中更具有優(yōu)勢(shì)[17]。本研究通過多序列比較也發(fā)現(xiàn),12個(gè)線粒體基因編碼的基因中COXⅠ最為保守,ND5變異率最大達(dá)到42.7%,另外ND4、ATP6、ND6基因進(jìn)化速率較快,提示除COXⅠ基因外,ND4、ATP6、ND6、ND5也可輔助作為棘球絳蟲鑒定的分子標(biāo)記。
同時(shí),棘球絳蟲屬寄生蟲缺少高等生物擁有的ATP8基因,這可能是棘球?qū)俳{蟲在寄生的環(huán)境中丟棄了部分“無用”的基因[18],進(jìn)化為更高級(jí)的生存方式,這一點(diǎn)在多房棘球絳蟲生長(zhǎng)特性中表現(xiàn)得更為明顯,因?yàn)樵谥虚g宿主人中無法找到蟲體,僅有一層叫生發(fā)層的細(xì)胞即可實(shí)現(xiàn)無限增殖,在寄生蟲疾病中極為罕見[19];起始密碼中除以atg作為起始密碼外,一些進(jìn)化較快的基因例如COX2及ND部分亞基還以gtg作為起始密碼,終止密碼子中甚至有以ttt作為終止密碼的。如此一個(gè)基因的終止密碼中的堿基也可能是另一個(gè)基因的起始密碼中的堿基,使得線粒體堿基的利用度達(dá)到最大,結(jié)構(gòu)更為緊湊。棘球絳蟲屬使用頻率最高的蛋白編碼密碼子是UUG,頻率最低的是CUC和CGC,編碼亮氨酸、精氨酸的密碼子最多達(dá)6個(gè),而編碼甲硫氨酸(AUG)、色氨酸(UGG)最少只有1個(gè)。亮氨酸也是棘球?qū)俳{蟲最偏好的氨基酸達(dá)到6%,這也反映出棘球?qū)俳{蟲對(duì)于氨基酸具有明顯的偏好性。
使用鄰接法構(gòu)建系統(tǒng)進(jìn)化樹可以看出E.v、E.o單獨(dú)為一枝,E.m、E.s及E.g G1、E.f形成姐妹枝,細(xì)粒棘球絳蟲G4、G5、G6、G7、G8、G10亞型聚為一枝,進(jìn)化距離較近,這與Wassermann M等人的研究結(jié)果較為一致[20]。在發(fā)現(xiàn)石渠棘球絳蟲前,因其形態(tài)學(xué)上與Em相近似,則被誤認(rèn)為是多房棘球絳蟲的變異種,由線粒體進(jìn)化距離上看兩者親緣關(guān)系也較近??傊?,利用線粒體基因研究棘球絳蟲系統(tǒng)起源、演化、分類及親緣關(guān)系,離不開對(duì)于線粒體基因的充分了解,通過本文分析期望能為進(jìn)一步認(rèn)識(shí)棘球?qū)倬€粒體基因組提供一定的參考。