陳薈玉,趙素文
綜 述
噬菌體Z基因組生物合成通路的研究進(jìn)展
陳薈玉,趙素文
上??萍即髮W(xué)iHuman研究所與生命科學(xué)與技術(shù)學(xué)院,上海 201210
噬菌體基因組中存在豐富的堿基修飾,主要用于逃避宿主內(nèi)切酶的切割。40多年前,在藍(lán)藻噬菌體S-2L的DNA中,研究者發(fā)現(xiàn)2-氨基腺嘌呤(Z)完全取代腺嘌呤(A),與胸腺嘧啶(T)形成具有三根氫鍵的互補(bǔ)配對(duì),形成了特殊的Z基因組。近年來(lái),研究者在多個(gè)噬菌體中發(fā)現(xiàn)并證實(shí)了噬菌體Z基因組生物合成通路。該通路是一個(gè)多酶系統(tǒng),其中包含由噬菌體DNA編碼的2-氨基脫氧腺苷琥珀酸合成酶(PurZ)、脫氧腺苷三磷酸水解酶(dATPase/DatZ)、脫氧腺苷/脫氧鳥苷三磷酸的焦磷酸水解酶(DUF550/MazZ)和DNA聚合酶(DpoZ)。本文在簡(jiǎn)述噬菌體中各種修飾核苷發(fā)現(xiàn)歷史的基礎(chǔ)上,詳細(xì)介紹了Z基因組生物合成通路中多種酶的研究進(jìn)展,最后對(duì)Z基因組及其合成通路中多種酶的應(yīng)用進(jìn)行了展望,以期為該領(lǐng)域的研究提供借鑒和參考。
Z基因組;噬菌體;DNA修飾;2-氨基腺嘌呤;生物合成通路
眾所周知,DNA由四種標(biāo)準(zhǔn)脫氧核苷構(gòu)成,每種脫氧核苷都擁有一個(gè)獨(dú)特的堿基,分別是腺嘌呤(adenine,A)、胸腺嘧啶(thymine,T)、胞嘧啶(cytosine,C)、鳥嘌呤(guanine,G),這四種標(biāo)準(zhǔn)堿基構(gòu)成了生命的遺傳密碼表。除了四種標(biāo)準(zhǔn)堿基,在病毒、原核及真核的基因組中,還廣泛存在著多種天然的堿基修飾,即各種化學(xué)基團(tuán)連接到標(biāo)準(zhǔn)堿基上的現(xiàn)象。這些修飾對(duì)基因組的穩(wěn)定性、基因的復(fù)制和表達(dá)調(diào)控有著重要的影響[1]。在真核生物中,修飾通常比較簡(jiǎn)單,如甲基修飾、羥甲基修飾等;而在細(xì)菌及噬菌體中,存在氨基酸、胺類、糖類等更加復(fù)雜的修飾[2]。對(duì)于噬菌體來(lái)說(shuō),這些復(fù)雜修飾能夠幫助其逃避宿主的防御系統(tǒng),如限制-修飾系統(tǒng)[2,3]??梢哉f(shuō),這些修飾就是噬菌體和宿主進(jìn)行漫長(zhǎng)軍備競(jìng)賽的一類利器,也是人們研究?jī)烧邚墓胖两袢绾位ハ嘤绊懞瓦M(jìn)化的一類有效證據(jù)。
從20世紀(jì)50年代開始,噬菌體DNA中的堿基修飾就陸續(xù)地被人們發(fā)現(xiàn)。在已明確生物合成通路的噬菌體堿基修飾中,有部分修飾是在四種標(biāo)準(zhǔn)脫氧核苷聚合成DNA鏈后才發(fā)生的,這類通常被稱作表觀遺傳修飾;而另一部分堿基修飾發(fā)生在DNA聚合之前,基因組中的某種堿基全部被另一種修飾堿基替換,這打破了人們對(duì)生命遺傳物質(zhì)的傳統(tǒng)認(rèn)知。本文將介紹其中一種更為特殊的修飾堿基——2-氨基腺嘌呤(2-aminoadenine,簡(jiǎn)稱Z)。因該堿基的修飾發(fā)生在堿基配對(duì)邊,所以其改變了正常DNA堿基“A與T形成兩根氫鍵、G與C形成三根氫鍵”的配對(duì)原則。伴隨著噬菌體中各種修飾核苷的發(fā)現(xiàn)歷史,本文將對(duì)Z基因組的相關(guān)研究進(jìn)行系統(tǒng)地闡述:Z基因組及其合成通路如何一步步被發(fā)現(xiàn)、目前的研究進(jìn)展及其應(yīng)用的展望。
早在1953年,Wyatt等[4]就在大腸桿菌噬菌體T2、T4和T65(phage T2, T4, T65)的DNA中發(fā)現(xiàn)5-羥甲基胞嘧啶(5-hydroxymethylcytosine,5-hmC)修飾,該修飾能夠保護(hù)DNA免受CRISPR-Cas9降解[5]。隨后,多種胞嘧啶修飾被發(fā)現(xiàn)。例如,Teng等[6]發(fā)現(xiàn)了5-甲基胞嘧啶(5-methylcytosine,5mC);Hattman 等[7]發(fā)現(xiàn)了5-羥基胞嘧啶(5-hydroxycytosine,5hC)。
1962年,Kallen等[8]發(fā)現(xiàn),多種噬菌體DNA中含有完全取代胸腺嘧啶的5-羥甲基尿嘧啶(5-(hydroxymethyl)uracil,5-hmU),包括芽孢桿菌噬菌體SPO1、Φe、SP8、H1、2C和SP82(phage SPO1, Φe, SP8, H1, 2C, SP82)。多種噬菌體還對(duì)DNA上的5-hmU進(jìn)行進(jìn)一步修飾,生成如α-腐胺胸腺嘧啶(α-putrescine thymine,α-putT)、α-谷氨酰胺胸腺嘧啶(α-glutamine thymine,α-gluT)、5-(2-氨基乙基)尿嘧啶(5-(2-aminoethyl)uracil,5-NeU)、5-(2-氨基乙氧基)甲基尿嘧啶(5-(2-aminoethoxy)methyluracil,5-NeOmU)[9~11]等更加復(fù)雜的修飾。
1983年,Swinton等[12]發(fā)現(xiàn)大腸桿菌噬菌體Mu(phage Mu)中約15%的腺嘌呤被N6 -氨甲酰甲基腺嘌呤(N6-carbamoylmethyladenine,ncm6A)所取代,其基因組編碼的一種乙酰轉(zhuǎn)移酶家族蛋白可能與該堿基的合成有關(guān)。
2016年,Thiaville 等[13]在大腸桿菌噬菌體9g(phage 9g)中發(fā)現(xiàn)了7-甲脒基-7-脫氮鳥嘌呤(7-formamidino-7-deazaguanine,G+),其合成通路涉及到等一系列噬菌體基因組編碼的基因。在測(cè)試的214種Ⅱ型限制性內(nèi)切酶中,有 152種都不能順利切割含有G+的DNA[14]。除了G+,還存在幾種7-脫氮鳥嘌呤類似物:7-酰胺基-7-脫氮鳥嘌呤(7-amido-7-deazaguanine,ADG)、7-氰基-7-脫氮鳥嘌呤(7-cyano-7-deazaguanine,PreQ0)、7-氨甲基-7-脫氮鳥嘌呤(7-aminomethyl-7- deazaguanine,PreQ1)[15]。
上述絕大多數(shù)堿基修飾都發(fā)生在嘧啶環(huán)的5位或者嘌呤環(huán)的7位[2],這兩個(gè)位點(diǎn)并不在堿基的配對(duì)邊,因此對(duì)堿基互補(bǔ)配對(duì)的直接影響不大。
1977年,蘇聯(lián)莫斯科國(guó)立大學(xué)的Kirnos等[16]首次報(bào)道,在藍(lán)藻噬菌體S-2L(Cyanophage S-2L)基因組中,2-氨基腺嘌呤(Z)完全取代了腺嘌呤(A)。由于多出的2-氨基處于配對(duì)邊上,Z跟T配對(duì)會(huì)形成三根氫鍵[16,17](圖1A)。在正常DNA中,A跟T配對(duì)只能形成兩根氫鍵。這一微小的變化卻可以較大地改變DNA的結(jié)構(gòu)和理化性質(zhì)。和正常的DNA相比,dZ-DNA(dZ-DNA指Z完全取代A的DNA)具有更高的解鏈溫度(melting temperature,Tm)、更強(qiáng)的彎曲剛度(flexural rigidity)、更長(zhǎng)的持久長(zhǎng)度(persistence length)、更短的靜態(tài)輪廓長(zhǎng)度(static contour length)[17~20]。Z堿基也讓藍(lán)藻噬菌體S-2L能夠抵抗絕大部分識(shí)別序列中含有A的限制性內(nèi)切酶的切割[21,22]。Tan等[23]在研究DNA的轉(zhuǎn)錄效率時(shí)發(fā)現(xiàn),含Z的DNA還對(duì)T7 RNA聚合酶和人RNA聚合酶II介導(dǎo)的轉(zhuǎn)錄具有顯著的抑制作用。
圖1 A:T配對(duì)和Z:T配對(duì)的比較及Z基因組的生物合成通路
A:A:T配對(duì)和Z:T配對(duì)示意圖。圖中藍(lán)色虛線表示氫鍵;B:Z基因組的生物合成通路。藍(lán)色標(biāo)注酶為噬菌體編碼,橙色標(biāo)注酶為宿主編碼(也有少量噬菌體中編碼PurB,見圖2A)。
發(fā)現(xiàn)藍(lán)藻噬菌體S-2L的科學(xué)家在當(dāng)時(shí)沒有條件對(duì)這個(gè)噬菌體進(jìn)行測(cè)序,他們將S-2L及其宿主菌贈(zèng)與了多個(gè)感興趣的課題組,其中包括法國(guó)巴斯德研究所的Philippe Marliere和Pierre A. Kaminski等。到20世紀(jì)90年代末,巴斯德研究所的這些科學(xué)家使用Sanger測(cè)序法完成了對(duì)噬菌體S-2L的測(cè)序[24]。但可能由于S-2L的高GC含量以及Z對(duì)A的取代,這次測(cè)序結(jié)果中存在著不少錯(cuò)誤,這些錯(cuò)誤使得通路關(guān)鍵酶經(jīng)過合成純化后并不具備活性,從而將Z基因組合成通路的發(fā)現(xiàn)往后又推遲了十幾年。
從1977年到2021年以前,藍(lán)藻噬菌體S-2L都是唯一已知的Z基因組噬菌體,這不禁讓人懷疑Z基因噬菌體的存在是非常罕見的。然而,隨著測(cè)序價(jià)格的降低,測(cè)序變得越來(lái)越普遍,公共數(shù)據(jù)庫(kù)也開始不斷出現(xiàn)Z基因組噬菌體的測(cè)序數(shù)據(jù)——當(dāng)然,測(cè)序者并不知道它們的基因組中含有Z,因?yàn)橥ǔJ褂玫亩鷾y(cè)序方法受到測(cè)序原理的限制,是無(wú)法檢測(cè)出DNA上堿基修飾的。只有通過仔細(xì)的序列分析、結(jié)構(gòu)建模、分子對(duì)接,以及關(guān)鍵酶的克隆表達(dá)純化和活性實(shí)驗(yàn),Z基因組的生物合成通路才有可能被揭示出來(lái)。相應(yīng)地,數(shù)據(jù)庫(kù)中的Z基因組噬菌體才能根據(jù)含有Z基因組生物合成通路的相關(guān)基因而被鑒定出來(lái)。
2021年,噬菌體Z基因組的生物合成通路被趙素文/張雁/趙惠民合作團(tuán)隊(duì)以及法國(guó)巴斯德研究所Pierre A. Kaminski/Marc Delarue/Philippe Marliere合作團(tuán)隊(duì)各自獨(dú)立闡明(圖1B)[25~29]。這些課題組主要的研究對(duì)象,并不是測(cè)序結(jié)果存在問題的噬菌體S-2L,而是其他測(cè)序結(jié)果準(zhǔn)確的Z基因組噬菌體,如鮑曼不動(dòng)桿菌噬菌體SH-Ab 15497(phage SH-Ab 15497)和霍亂弧菌噬菌體PhiVC8 (phage PhiVC8)。
這幾個(gè)課題組對(duì)Z基因組生物合成通路的研究結(jié)果是高度一致的。首先,噬菌體會(huì)編碼dATP/dGTP焦磷酸水解酶(deoxyadenosine/deoxyguanosine tripho--sphate pyrophosphatase,DUF550,或稱MazZ)將脫氧鳥苷三磷酸(dGTP)去磷酸化成脫氧鳥苷單磷酸(dGMP),然后,噬菌體編碼的2-氨基脫氧腺苷琥珀酸合成酶(deoxy-2′-aminoadenylosuccinate synthetase,PurZ)在腺苷三磷酸(ATP)、L-天冬氨酸(L-Asp)和Mg2+存在時(shí),將dGMP轉(zhuǎn)化為2-氨基脫氧腺苷琥珀酸(2-aminodeoxyadenosylsuccinate,dSMP,或稱ADAS)。接下來(lái),宿主體內(nèi)的腺苷琥珀酸裂解酶(aminoadenylosuccinate lyase,PurB)將dSMP轉(zhuǎn)為2-氨基脫氧腺苷單磷酸(2-aminodeoxyadenosine mono-phosphate,dZMP),再經(jīng)宿主的鳥苷激酶(guanosine kinase,GmK)和核苷二磷酸激酶(nucleoside diphosphate kinase,Ndk)磷酸化為2-氨基脫氧腺苷三磷酸(2-aminodeoxyadenosine triphosphate,dZTP)。最終,噬菌體通過自身編碼的DNA聚合酶(DNA polymerase,DpoZ或PrimPol)完成dZ-DNA的聚合。為保證基因組中Z對(duì)A的完全取代,噬菌體編碼了兩個(gè)酶,脫氧腺苷三磷酸水解酶(deoxyadenosine triphosphate hydrolase,dATPase,或稱DatZ)和脫氧腺苷/脫氧鳥苷三磷酸的焦磷酸水解酶(DUF550,或稱MazZ)來(lái)水解dATP,降低它的濃度,杜絕噬菌體的DNA聚合酶對(duì)dATP的使用。其中,dATPase可以專一地把dATP轉(zhuǎn)化為dA,而DUF550因?yàn)榭梢詫ATP去磷酸化為dAMP,所以也可以協(xié)助降低dATP的濃度。還有一部分Z基因組噬菌體中缺少編碼DUF550和dATPase的基因,被注釋為“dUTPase”(deoxyuridine triphosphate hydrolase)的功能未知基因可能替代它們行使類似的功能(圖2A)。
圖2 噬菌體Z基因組合成通路的基因簇及在全球的地理分布
A:噬菌體中負(fù)責(zé)合成Z基因組的基因簇。最左邊是各噬菌體的PurZ的系統(tǒng)發(fā)育樹(使用IQ-TREE軟件構(gòu)建最大似然樹,替代模型為“LG+I+G4”,步長(zhǎng)為1000);用不同顏色標(biāo)注出了噬菌體對(duì)應(yīng)宿主的不同細(xì)菌門(綱);B:Z基因組噬菌體在全球的分布圖。地圖下載自中國(guó)地圖出版社與國(guó)家基礎(chǔ)地理信息中心聯(lián)合編制的“世界地形圖”,詳見地圖瀏覽(mnr.gov.cn)。
Philippe Marliere和Pierre A. Kaminski團(tuán)隊(duì)還指出,Z基因組噬菌體是相當(dāng)古老的生物。他們的推理如下:目前已知的Z基因組噬菌體的宿主細(xì)菌主要分布于變形菌門、藍(lán)藻門和放線菌門,而這些噬菌體Z基因組生物合成通路中的幾個(gè)關(guān)鍵酶,PurZ,dATPase和DNA聚合酶的進(jìn)化樹拓?fù)浣Y(jié)構(gòu)是一致的,這表明Z基因組在三個(gè)門的細(xì)菌分開(約35億年前)之前就已經(jīng)存在。有意思的是,Z堿基在年代早于地球的碳質(zhì)隕石中被鑒定出來(lái)[30],表明了該堿基可能是地外生命的遺傳物質(zhì),且可能參與了地球生命的起源。
趙素文/張雁/趙惠民團(tuán)隊(duì)重新對(duì)公共數(shù)據(jù)庫(kù)中含有PurZ的基因組進(jìn)行了盤點(diǎn),他們發(fā)現(xiàn),除了噬菌體S-2L,還有122個(gè)分離噬菌體和13個(gè)宏基因組測(cè)序片段中也具有Z基因組合成通路中的關(guān)鍵酶PurZ,它們構(gòu)成了目前已知的Z基因組噬菌體名單(表1)。這些噬菌體廣泛分布在世界各地[25,26](圖2B),是已知分離噬菌體總量的約1%,對(duì)應(yīng)的宿主能歸屬到細(xì)菌的4個(gè)門,分別為變形菌門、放線菌門、厚壁菌門和藍(lán)藻門(表1)。變形菌門的這些宿主分布于α、β和γ變形菌綱,涉及到7個(gè)細(xì)菌目,其中以γ變形菌綱-弧菌目-弧菌科-弧菌屬為宿主的噬菌體較為常見;放線菌門的宿主主要分布于放線菌綱的放線菌目、鏈霉菌目和微球菌目中,其中以微球菌目-微球菌科-節(jié)桿菌屬為宿主的噬菌體數(shù)量眾多;目前,人們?cè)诤癖诰T和藍(lán)藻門的宿主中只分別觀察到一種Z基因組噬菌體的存在。雖然目前發(fā)現(xiàn)的Z基因組噬菌體數(shù)量并不算多,但其存在于多個(gè)細(xì)菌門的現(xiàn)象就可以表明,Z基因組噬菌體已經(jīng)在地球上存在了幾十億年而未滅絕,并能夠以多種類型的細(xì)菌作為宿主,顯示出了頑強(qiáng)的生命力。相信隨著采樣和測(cè)序工作的穩(wěn)步推進(jìn),更多的Z基因組噬菌體將會(huì)被人們?cè)丛床粩嗟匕l(fā)現(xiàn)。
在所有Z基因組噬菌體中,鮑曼不動(dòng)桿菌噬菌體15497、霍亂弧菌噬菌體phiVC8、土地戈登氏菌噬菌體Ghobes(phage Ghobes)和節(jié)桿菌噬菌體Wayne(phage Wayne)的DNA經(jīng)酶解后的脫氧核苷產(chǎn)物,經(jīng)過高效液相色譜-紫外法(HPLC-UV)鑒定,確實(shí)都存在Z取代A的現(xiàn)象[25,27]。實(shí)驗(yàn)還表明,前述幾種噬菌體的DNA都不能被識(shí)別序列中含A的限制性內(nèi)切酶所消化,唯一的例外是一個(gè)底物范圍很寬的I[25],該酶以能夠耐受各種DNA修飾而著稱[21]。
關(guān)于Z基因組噬菌體生物合成通路的發(fā)現(xiàn),可追溯到20多年前Pierre A. Kaminski課題組對(duì)噬菌體S-2L的測(cè)序[24]。他們發(fā)現(xiàn)S-2L的基因組中包含了一個(gè)腺苷琥珀酸合成酶(adenylosuccinate synthetase,PurA)同源物的開放閱讀框(后稱為PurZ),并認(rèn)為PurZ會(huì)催化一個(gè)類似的反應(yīng)來(lái)合成Z核苷酸[2,24]。PurA是所有細(xì)胞生物共有的,是腺嘌呤核苷酸從頭合成通路中的一個(gè)酶,其在GTP、L-天冬氨酸(L-Asp)和Mg2+的存在下催化次黃嘌呤核苷酸(inosine monophosphate,IMP)生成腺苷琥珀酸(adenosyl-succinate)、GDP和磷酸根,后續(xù)再通過腺苷琥珀酸裂解酶(PurB)催化,脫去富馬酸生成AMP[32](圖3A)。而在S-2L中發(fā)現(xiàn)的PurZ,則催化了一個(gè)類似的反應(yīng)(圖3B)。和PurA相比,PurZ中IMP結(jié)合口袋的底物在兩個(gè)小地方發(fā)生了變化,一是堿基由I變?yōu)镚,二是核苷變?yōu)槊撗鹾塑眨欢鳪TP結(jié)合口袋的底物,則從GTP變成了ATP。系統(tǒng)發(fā)育分析顯示,這些噬菌體PurZ與某些古菌的PurA的進(jìn)化關(guān)系最近,而與原核和真核生物的PurA關(guān)系較遠(yuǎn)[33]。其實(shí),除了噬菌體,少數(shù)細(xì)菌中也存在著PurZ類似物[26],目前尚不清楚其在細(xì)菌中的功能。
2021年,PurZ的體外功能分別得到了趙素文/張雁/趙惠民團(tuán)隊(duì)和Pierre A. Kaminski課題組充分的實(shí)驗(yàn)驗(yàn)證。體外實(shí)驗(yàn)顯示,噬菌體S-2L、SH-Ab 15497、phiVC8腸道沙門氏菌噬菌體PMBT28 (phagePMBT28)和華桿菌(bacterium)宏基因組組裝片段中的PurZ(后續(xù)分別稱為CpPurZ、ApPurZ、VpPurZ、SpPurZ、SbPurZ)在與底物dGMP、ATP、L-Asp、Mg2+共同孵育后具有很強(qiáng)的酶活性(dGMP、ATP的kcat/KM范圍分別為7.5~171.9、1.8~67.1 [mM–1s–1])[25,26]。將dGMP換成GMP/IMP,或者把ATP換成其他NTPs都沒有活性。對(duì)于SbPurZ,dGMP換成dIMP還有38%的活性,但dIMP的kcat/KM約只有在體內(nèi)的真正底物dGMP的1/15[25]。SpPurZ和ApPurZ反應(yīng)的產(chǎn)物通過高效液相色譜-二級(jí)質(zhì)譜聯(lián)用法(HPLC-MS/MS)確證為ADP和dSMP[25](圖3B)。雖然另一組研究者發(fā)現(xiàn),將CpPurZ分別與dGMP、ATP/dATP、L-Asp、Mg2+孵育,有相當(dāng)?shù)幕钚?,且HPLC-MS/MS顯示底物為dSMP和ADP/dADP[28],但考慮到Z基因組噬菌體存在不止一條降低dATP濃度的途徑,生理情況下的dATP濃度應(yīng)該很低,不太可能與ATP競(jìng)爭(zhēng)這個(gè)口袋。
表1 已分離測(cè)序的Z基因組噬菌體名單
續(xù)表
續(xù)表
名單先按照宿主的物種分類排序,再按照基因組GC含量排序。以上信息來(lái)源于NCBI網(wǎng)站對(duì)應(yīng)噬菌體基因組頁(yè)面,例如phage DMU1的信息來(lái)源:eotide-NCBI (nih.gov)。
A:AMP從頭合成通路中的兩個(gè)步驟;B:Z基因組噬菌體產(chǎn)生dZMP的通路與細(xì)胞生物從頭合成AMP的通路類似。
值得一提的是,根據(jù)2004年測(cè)序結(jié)果注釋出的噬菌體S-2L CpPurZ,在經(jīng)過蛋白表達(dá)后并沒有活性,而根據(jù)2021年第二次測(cè)序結(jié)果注釋出的CpPurZ表現(xiàn)出了應(yīng)有的活性。把兩次測(cè)序結(jié)果進(jìn)行對(duì)比可知,第一次測(cè)序時(shí)基因上有兩個(gè)測(cè)序錯(cuò)誤[24],正是這兩個(gè)測(cè)序錯(cuò)誤導(dǎo)致了Z基因組生物合成通路的發(fā)現(xiàn)被推遲了十幾年。
法國(guó)巴斯德研究所Pierre A. Kaminski和Marc Delarue 課題組分別解析了VpPurZ和CpPurZ的晶體結(jié)構(gòu)[26,28],這使人們能夠更深入地理解這類蛋白功能變化的原因。其中,VpPurZ有apo-PurZ(PDB:6FLF),結(jié)合ATP的(PDB:6FM0),結(jié)合dGMP、ATP、Mg2+的(PDB:6FM1)以及結(jié)合AMPPcP(β,γ -亞甲基腺苷5′-三磷酸,β,γ-methyleneadenosine 5′-triphosphate)、dGMP、L-Asp的(PDB:6TNH)的四種晶體結(jié)構(gòu)。CpPurZ結(jié)構(gòu)中結(jié)合了dGMP和dATP(PDB:7ODX)[28]。和PurA一樣,PurZ也是二聚體[34,35]。對(duì)于dGMP和ATP/dATP這兩個(gè)主要的配體,VpPurZ(PDB:6FM1)和CpPurZ具有類似的結(jié)合方式。與經(jīng)典的大腸桿菌K-12(K-12) 的PurA(EcPurA,PDB:1CG0)相比,VpPurZ(PDB:6FM1)的(d)NMP結(jié)合口袋中的Ser14取代了Asp13,與dGMP的嘧啶部分形成氫鍵,正好可以容納底物上額外的2-氨基。同時(shí),Ile234對(duì)Thr271的取代,則改變了臨近殘基Val236的構(gòu)象,而Val236的不同構(gòu)象,可以決定底物是脫氧核糖核苷還是核糖核苷。在PurZ中,Val236的側(cè)鏈靠近底物的糖環(huán),空間位阻和非極性環(huán)境,決定了該處無(wú)法再容納核糖上的2′-OH (圖4A)。對(duì)于NTP結(jié)合口袋,VpPurZ中Asn297取代了EcPurA中的Asp333,與腺嘌呤形成氫鍵,有利于配體從GTP轉(zhuǎn)變?yōu)锳TP,與K331類似位置的Phe295仍與ATP嘌呤部分形成堆疊作用(圖4B)。
對(duì)于NTP口袋的297位結(jié)合位點(diǎn),天津大學(xué)張雁/上??萍即髮W(xué)趙素文/深圳大學(xué)李猛和劉楊團(tuán)隊(duì)通過對(duì)Z基因組噬菌體關(guān)鍵位點(diǎn)的保守性分析發(fā)現(xiàn),目前已知的所有感染放線菌門細(xì)菌的Z基因組噬菌體,其PurZ的297位仍是Asp (圖4B右),意味著這些噬菌體的NTP結(jié)合口袋很可能仍然結(jié)合GTP而非ATP[33]。巧合的是,上述經(jīng)過活性驗(yàn)證的PurZ均不來(lái)自感染放線菌門的噬菌體,所以它們的底物組合均為dGMP和ATP。通過對(duì)土地戈登氏菌噬菌體Archimedes(phage Archimedes,宿主為放線菌門)的PurZ(后稱為GpPurZ)進(jìn)行活性實(shí)驗(yàn),他們發(fā)現(xiàn),GpPurZ只有在以dGMP和GTP組合作為底物時(shí)才展現(xiàn)出很強(qiáng)的酶活性(GTP的kcat/KM為2.8~3 [mM–1s–1],反應(yīng)也需要L-Asp和Mg2+)[33]。與SbPurZ類似,雖然將GpPurZ的底物dGMP換成dIMP也有約50%的活性,但dIMP的kcat/KM約只有真正底物dGMP的1/13。另外,相應(yīng)底物在經(jīng)過GpPurZ孵育后的HPLC-MS/MS實(shí)驗(yàn)結(jié)果顯示,產(chǎn)物仍然是dSMP[33]。也就是說(shuō),這兩類PurZ都能夠?qū)GMP生成dSMP,但用來(lái)反應(yīng)的磷酸鹽供體并不相同:感染放線菌門的Z基因組噬菌體使用GTP,而其他Z噬菌體則使用ATP。
圖4 VpPurZ和EcPurA中口袋與底物結(jié)合示意圖
A:(d)NMP口袋與底物結(jié)合示意圖;B:NTP口袋與底物結(jié)合示意圖。藍(lán)色虛線表示氫鍵,右側(cè)均為相應(yīng)位點(diǎn)在所有Z基因組噬菌體PurZ/經(jīng)典PurA中的保守性。
對(duì)于上述提到的PurZ的關(guān)鍵殘基位點(diǎn),有不少突變實(shí)驗(yàn)證明了它們的重要性。例如對(duì)于SbPurZ的實(shí)驗(yàn),所有突變都不同程度地降低了其活性:Ser15突變成Asp失活(6FM1:Ser14),說(shuō)明了Ser15結(jié)合dGMP的重要性;Thr274突變成Gly(6FM1:Thr262)使Asp的KM升高271倍,說(shuō)明Thr274對(duì)結(jié)合Asp至關(guān)重要;突變ATP周圍三個(gè)殘基的任意一個(gè)(Asn306突變?yōu)門hr,Phe307突變?yōu)長(zhǎng)ys,Asn309突變?yōu)锳sp) (6FM1:Asn294, Phe295, Asn297)都會(huì)導(dǎo)致ATP的KM上升幾十倍,但并沒有一個(gè)突變體可以使用GTP[25]。而對(duì)于GpPurZ,Asp306突變?yōu)锳sn (6FM1:Asn297)使GTP的kcat/KM約只有原來(lái)的1%,但并沒有檢測(cè)到這種突變體對(duì)ATP的活性[33]。值得注意的是,上述任意一種突變體都不能成功改造PurZ,使其底物從原來(lái)的dGMP轉(zhuǎn)變成IMP[25],這說(shuō)明PurZ和PurA底物的變化需要多點(diǎn)突變的協(xié)同,是長(zhǎng)期演化的結(jié)果,以至于單突變體根本無(wú)法做到底物的切換。
為了探究是否還有其他酶參與Z基因組生物合成,趙素文/張雁/趙惠民團(tuán)隊(duì)了通過分析在基因組上的鄰近區(qū)域,發(fā)現(xiàn)多個(gè)噬菌體基因組中都存在一個(gè)HD結(jié)構(gòu)域蛋白。HD結(jié)構(gòu)域通常是一種結(jié)合DNA的結(jié)構(gòu)域,而這些噬菌體中的HD結(jié)構(gòu)域蛋白和普里斯特氏菌(megaterium)中發(fā)現(xiàn)的脫氧核苷三磷酸水解酶存在遠(yuǎn)緣關(guān)系,說(shuō)明該蛋白的功能可能也是脫氧核苷三磷酸水解酶。經(jīng)過HPLC-MS實(shí)驗(yàn)驗(yàn)證,S-2L和SH-Ab 15497中該酶的底物是dATP,在水解dATP時(shí),可以經(jīng)過一步反應(yīng)就切掉三磷酸,將dATP變?yōu)閐A,所以該酶是脫氧腺苷三磷酸水解酶,并因此被命名為dATPase (或稱為DatZ[36]) (圖2A)。實(shí)驗(yàn)還表明,S-2L、SH-Ab 15497和PMBT28的dATPase的活性,都是在使用Co2+作為金屬輔因子時(shí)最高。另外,該酶是dATP專一性的,對(duì)包括dZTP在內(nèi)的其他NTPs和dNTPs的活性非常低[25]。dATP的表觀KM值在先前報(bào)道的細(xì)菌胞內(nèi)dATP濃度范圍內(nèi),為6.5~74.8 mM[25]。當(dāng)然,除了直接催化dATP,dATPase還可催化dADP和dAMP分別脫去焦磷酸和磷酸,生成dA[25]。
Marc Delarue 課題組解析了S-2L dATPase的晶體結(jié)構(gòu)[36]。目前有三種含不同結(jié)合配體的結(jié)構(gòu):結(jié)合dA、沒加金屬離子但結(jié)合了一個(gè)Zn2+的(PDB:6ZPA),結(jié)合dA、加入且結(jié)合了兩個(gè)Co2+的(PDB:6ZPB),結(jié)合dATP、加入EDTA金屬螯合劑但仍結(jié)合了一個(gè)Zn2+的(PDB:6ZPC)。從結(jié)構(gòu)中可以觀察到,與堿性磷酸酶和3′-5′外切酶[37,38]類似,S-2L dATPase使用典型的雙金屬離子機(jī)制使dATP去磷酸化(圖5)。這些噬菌體dATPase的多序列比對(duì)顯示[36],所有穩(wěn)定兩種催化金屬離子的殘基都是嚴(yán)格保守的;與α-,β-和γ-磷酸具有相互作用的Arg19、Lys81和Lys116(使用S-2L dATPase編號(hào),下同)是保守的;與堿基具有相互作用的Trp20、Ile22、Pro79是保守的或發(fā)生保守取代的。
總之,dATPase可以降低dATP在胞漿里的濃度,使dATP和dZTP相比,在被噬菌體的DNA聚合酶DpoZ整合進(jìn)入Z基因組時(shí)失去競(jìng)爭(zhēng)力,從而解釋了Z噬菌體基因組中A完全缺失的原因。
趙素文/張雁/趙惠民團(tuán)隊(duì)還在多個(gè)噬菌體的基因附近,發(fā)現(xiàn)了另外一種編碼核苷三磷酸水解酶的基因:/,相應(yīng)的蛋白是脫氧腺苷/脫氧鳥苷三磷酸的焦磷酸水解酶(簡(jiǎn)稱DUF550[25]或MazZ[28])。S-2L DUF550的活性實(shí)驗(yàn)表明,活性最高的底物是dGTP/GTP,產(chǎn)物是 dGMP/GMP,包括dZTP在內(nèi)的其他dNTP都不是該酶的底物[28]。SH-Ab 15497 DUF550活性最高的兩個(gè)底物是dATP和dGTP,相應(yīng)的產(chǎn)物是dAMP和dGMP[25]。這兩種DUF550都是結(jié)合Co2+時(shí)活性最高[25](圖2A)。
圖5 Cyanophage S-2L dATPase (6ZPB) 的催化口袋示意圖
S-2L dATPase使用經(jīng)典的雙金屬離子(A和B點(diǎn),結(jié)合Co2+有最高活性)機(jī)制去磷酸化。藍(lán)色虛線為氫鍵,紫色和粉色虛線為金屬離子鍵。
根據(jù)序列特征,Marc Delarue 課題組將DUF550分成兩類:DUF550-1,存在于SH-Ab 15497、PMBT28等噬菌體中;DUF550-2,存在于PhiVC8、交替單胞菌噬菌體ZP6(phage ZP6)等噬菌體中。
Marc Delarue 課題組解析了S-2L DUF550、dGDP和三個(gè)Mn2+的復(fù)合物結(jié)構(gòu)(圖6A,PDB:7ODY)[28]。在該結(jié)構(gòu)中,三個(gè)Mn2+的位置與彎曲桿菌中的一種脫氧尿苷焦磷酸水解酶[39](PDB:1W2Y)的三個(gè)Mg2+位置是基本相同的(圖6A,A、B、C位置)。離子A與Glu34、Glu35、Glu38配位,離子B與Glu50和Asp53配位,而離子C與Glu38和Glu50配位(圖6B)。除Glu34外,S-2L DUF550中的Ile56、Asp60和與催化離子配位的殘基,在所有DUF550-1中都嚴(yán)格保守。DUF550-2中,Glu35、Glu38、Glu50和Glu53(S-2L MazZ編號(hào))同樣保守,但堿基結(jié)合殘基與DUF550-1不一致,可能意味著底物的另一種結(jié)合模式[28]。因?yàn)樯鲜鰧?shí)驗(yàn)觀察到DUF550也具有水解dATP的活性,所以根據(jù)目前結(jié)構(gòu)猜測(cè),其結(jié)合dATP時(shí),可能需要Asn20發(fā)生構(gòu)象翻轉(zhuǎn),使用側(cè)鏈的羰基結(jié)合腺嘌呤的6-氨基。
綜上,噬菌體中的DUF550不僅可以給PurZ的反應(yīng)提供原料dGMP,可能也協(xié)助降低了dATP在胞漿中的濃度。
噬菌體在利用PurZ合成出dSMP后,與腺嘌呤核苷酸的合成通路類似地,接下來(lái)又利用宿主體內(nèi)的腺苷琥珀酸裂解酶(PurB)、鳥苷激酶(Gmk)和核苷二磷酸激酶(Ndk)完成自身dZMP和dZTP的合成。目前除了鏈霉菌噬菌體Hiyaa(phage Hiyaa)、土地戈登氏菌噬菌體Ghobes和Archimedes的基因組編碼了PurB類似物[27](圖2A),其他含PurZ的噬菌體基因組中并未發(fā)現(xiàn)PurB類似物;并且研究者在這些噬菌體基因組中也并未發(fā)現(xiàn)編碼可能催化dZMP磷酸化的相關(guān)激酶基因。
實(shí)驗(yàn)證實(shí),SbPurZ反應(yīng)后的產(chǎn)物和重組大腸桿菌PurB共同孵育后能夠生成dZMP[25],同樣地,VpPurZ和PhiVC8宿主霍亂弧菌()的PurB在ATP、dGMP、L-Asp和Mg2+條件下的產(chǎn)物也是dZMP,說(shuō)明宿主的PurB能夠被噬菌體利用來(lái)生成dZMP。最后,dZMP經(jīng)過Gmk和Ndk的處理(或Gmk單一處理[25]),即可轉(zhuǎn)化為dZTP[26]。為了進(jìn)一步說(shuō)明噬菌體這兩步反應(yīng)對(duì)宿主的依賴性,Pierre A. Kaminski課題組構(gòu)建了霍亂弧菌 O1的突變體(使PurB表達(dá)減少),和霍亂弧菌O1的敲除株。他們發(fā)現(xiàn)含噬菌體PhiVC8對(duì)含突變體宿主的感染率僅是原來(lái)的10–5倍,而對(duì)敲除株宿主則是直接失去了感染性[26]。這些結(jié)果說(shuō)明,宿主的和基因?qū)基因組噬菌體的遺傳物質(zhì)復(fù)制起到關(guān)鍵的作用。
圖6 S-2L MazZ (7ODY) 的催化口袋示意圖
A:底物dGDP與殘基結(jié)合示意圖;B:三個(gè)催化金屬離子(結(jié)合Co2+時(shí)有最高活性)與殘基結(jié)合示意圖。藍(lán)色虛線為氫鍵,黃色虛線為金屬離子鍵。
所有細(xì)胞生物和病毒都通過DNA或RNA聚合酶來(lái)復(fù)制它們的基因組。因此,噬菌體利用宿主體內(nèi)的PurB、Gmk和Ndk成功合成dZTP后,還需要DNA聚合酶來(lái)發(fā)揮功能,使dZTP最終整合到其基因組中。已知的DNA聚合酶可以分成幾個(gè)家族:A, B, C, D, X, Y, RT和PrimPol[40,41]。除了S-2L,其他一些含有PurZ的噬菌體基因組中都編碼了DNA聚合酶A家族(DNA polA)的基因(圖2A),與大腸桿菌DNA polA的Klenow片段相對(duì)應(yīng),含有具有校對(duì)功能的3′-5′外切酶結(jié)構(gòu)域和聚合功能的5′-3′聚合酶結(jié)構(gòu)域[27]。對(duì)于PhiVC8、SH-Ab 15497、Wayne等宿主涉及3個(gè)細(xì)菌門的10個(gè)噬菌體,Philippe Marliere課題組以相同方法分別構(gòu)建其PurZ和DpoZ的系統(tǒng)發(fā)育樹,發(fā)現(xiàn)兩者的分支關(guān)系幾乎一致(除放線菌門-放線菌綱-鏈霉菌目的Hiyaa,其基因組是其他噬菌體的兩倍大)[27],說(shuō)明這兩種酶很可能共存于一個(gè)以Z為信息載體的共同祖先中,隨著35億年前的放線菌、藍(lán)藻和變形菌一直演化至今。
Philippe Marliere課題組還發(fā)現(xiàn),DpoZ相比A會(huì)更偏好Z的聚合[27]。在分別將dZTP和dATP生成到24 bp長(zhǎng)度的實(shí)驗(yàn)中,四種噬菌體(PhiVC8、SH-Ab 15497、Ghobes、Wayne)的DpoZ在經(jīng)過統(tǒng)一突變外切酶結(jié)構(gòu)域使其失活后,都是聚合dZ比聚合dA有更高的效率。PhiVC8和SH-Ab 15497的DpoZ以dZTP作為底物的效率分別是以dATP為底物的90和29倍。另外,SH-Ab 15497的引物延伸實(shí)驗(yàn)還顯示,無(wú)論模板中是否有Z,DpoZ都更偏好dZTP底物,大腸桿菌Klenow酶則展示出對(duì)dATP底物和含A模板的偏好性[27]。
Marc Delarue課題組希望能夠找到這些噬菌體DpoZ結(jié)構(gòu)上的特殊之處,來(lái)解釋其更偏好Z的原因。于是,他們解析了PhiVC8 apo-DpoZ的晶體結(jié)構(gòu)(PDB:7PBK)(圖7A),其由3′-5′外切酶和5′-3′聚合酶結(jié)構(gòu)域組成。在這個(gè)二聚體結(jié)構(gòu)中,兩個(gè)單體具有不同的構(gòu)象,主要涉及拇指(thumb)區(qū)和3′-5′外切酶(exonuclease)區(qū)的構(gòu)象變化,因此分別被稱為“thumb-exo”關(guān)閉和開啟狀態(tài)構(gòu)象[42]。而典型的polA結(jié)構(gòu)的開放和閉合形式主要涉及的是手指(finger)區(qū)[43,44]。Marc Delarue等[42]認(rèn)為,可能并不是酶本身的活性位點(diǎn)導(dǎo)致對(duì)Z的偏好,而是新生堿基對(duì)的雙鍵/三鍵造成了酶不同的動(dòng)力學(xué)方向。即,較強(qiáng)的新生Z:T對(duì)(三鍵)使聚合酶主要停留在延伸模式(“thumb-exo”關(guān)閉狀態(tài)),而較弱的A:T對(duì)(雙鍵)更容易導(dǎo)致聚合酶的校對(duì)模式(“thumb-exo”開啟狀態(tài)),造成新合并堿基的切除[42](圖7B)。然而,仍缺少有力的實(shí)驗(yàn)來(lái)證明這一觀點(diǎn)。
圖7 PhiVC8 DpoZ (7PBK) 的結(jié)構(gòu)域組成及兩種構(gòu)象
A:PhiVC8 DpoZ由聚合酶結(jié)構(gòu)域和外切酶結(jié)構(gòu)域組成。藍(lán)色為“thumb-exo”關(guān)閉構(gòu)象,橙色為“thumb-exo”開啟構(gòu)象。B:新生堿基對(duì)的雙鍵/三鍵造成了酶的不同動(dòng)力學(xué)方向。
不同于其他Z基因組噬菌體,S-2L的DNA聚合酶屬于另外一個(gè)家族,PrimPol。S-2L PrimPol從N到C端包含三個(gè)結(jié)構(gòu)域:AEP結(jié)構(gòu)域、PriCT-2結(jié)構(gòu)域、VirE家族結(jié)構(gòu)域。隨著從C到N端結(jié)構(gòu)域的逐步缺失,聚合酶活性逐漸降低,但只要存在AEP結(jié)構(gòu)域,就基本保持活性。雖然Z基因組噬菌體中PrimPol酶并不對(duì)dZTP或者dATP的使用具有選擇性,聚合酶活性實(shí)驗(yàn)顯示,相比于dZTP,S-2L PrimPol更傾向于使用dATP;但如果在加入PrimPol的同時(shí)也加入S-2L dATPase,則聚合酶產(chǎn)生的DNA中便無(wú)法觀察到A的存在[36]。
考慮到上述Marc Delarue等[42]的觀點(diǎn)缺乏有力的實(shí)驗(yàn)證明,以及S-2L的PrimPol聚合酶并不支持這一觀點(diǎn),因此,對(duì)于噬菌體能夠避免A進(jìn)入基因組而完全使用Z的原因,趙素文/張雁/趙惠民團(tuán)隊(duì)持有不同的看法。他們認(rèn)為,噬菌體編碼的DNA聚合酶并沒有那么特殊,它也可以使用dATP,關(guān)鍵是要在細(xì)胞內(nèi)提高dZTP的濃度和降低dATP的濃度。他們的實(shí)驗(yàn)表明,只要dZTP的濃度和dATP的濃度相當(dāng),那么利用普通聚合酶(如和Q5)生成的DNA產(chǎn)物中,Z就已經(jīng)可以100%取代A(尚未發(fā)表),因?yàn)閆可以輕松地通過配對(duì)能量上的優(yōu)勢(shì)勝出。
對(duì)噬菌體中Z堿基及其生物合成通路的研究不僅刷新了人們對(duì)生物學(xué)基本觀念的認(rèn)知,而且由此發(fā)現(xiàn)的Z核苷及Z基因組合成通路中的各種酶都有著廣泛的應(yīng)用前景。
噬菌體中Z基因組生物合成通路的發(fā)現(xiàn),使在細(xì)胞生物的基因組中引入Z成為可能。法國(guó)巴斯德所的Marc Delarue課題組發(fā)現(xiàn),在大腸桿菌相容表達(dá)質(zhì)粒中導(dǎo)入、和基因并表達(dá)培養(yǎng)后,能夠觀察到質(zhì)粒和染色體上分別平均有12.1%和3.9%的A被Z替代,且缺少其中任意一個(gè)基因,替代率就會(huì)降低[28]。所以,通過引入Z基因組噬菌體合成通路中噬菌體編碼的上述三個(gè)基因,細(xì)菌DNA上就能出現(xiàn)Z堿基。這也說(shuō)明細(xì)菌的DNA聚合酶在在體的情況下是可以使用dZTP進(jìn)行DNA聚合的。
Z堿基合成通路的發(fā)現(xiàn),也使批量生產(chǎn)Z核苷成為可能,為合成生物學(xué)提供了便利,借天然酶來(lái)實(shí)現(xiàn)多種類型核苷合成。例如,張雁/趙惠民/劉勝男課題組成功地使用華桿菌宏基因組噬菌體片段的PurZ(SbPurZ)和大腸桿菌的PurB將黃嘌呤脫氧核苷酸(xanthine deoxynucleotide,dXMP)轉(zhuǎn)化為異鳥嘌呤脫氧核苷酸(isoguanine deoxynucleotide,dBMP)[45](圖8)。若對(duì)PurZ家族進(jìn)行改造,還有可能實(shí)現(xiàn)更加多樣的嘌呤脫氧核苷的酶法合成。
圖8 PurZ和PurB可以催化dXMP成為dBMP
A:Z-噬菌體中利用PurZ和PurB合成dZMP;B:不經(jīng)過酶改造,利用SbPurZ和大腸桿菌PurB就可以催化dXMP成為dBMP。
非經(jīng)典核苷、DNA的生物合成,還可以應(yīng)用于DNA存儲(chǔ)、DNA折紙等新興技術(shù)[46,47]。DNA本質(zhì)就是儲(chǔ)存遺傳信息的載體,在如今數(shù)據(jù)量爆炸的時(shí)代,DNA存儲(chǔ)憑借著存儲(chǔ)密度高、穩(wěn)定性強(qiáng)、維護(hù)成本低等特點(diǎn),已成為國(guó)家重點(diǎn)研究的新興技術(shù)[48]。上述報(bào)道的DNA修飾酶可以作為工具酶,參與信息存儲(chǔ)系統(tǒng)的重新編寫等過程,有利于DNA存儲(chǔ)走向更廣闊的應(yīng)用場(chǎng)景。
在醫(yī)療領(lǐng)域,dZ-DNA還可能應(yīng)用于醫(yī)療診斷和治療。張等[49]的研究表明,與僅含有天然四堿基的DNA相比,包含合成堿基Z(非上述Z,6-氨基-5-硝基-3-(1′-β-D-2′-脫氧核糖)-2(1H)-吡啶酮)和P(2-氨基-8-(1′-β-D-2′-脫氧核糖)-咪唑[1,2-a]-1,3,5-三嗪- 4(8H)-丙酮)的DNA鏈能夠更好地與癌細(xì)胞結(jié)合。因此,dZ-DNA也可能被設(shè)計(jì)成探針,用于疾病的診斷。
另外,目前噬菌體療法面臨的一大挑戰(zhàn),就是細(xì)菌利用限制修飾系統(tǒng)或CRISPR-Cas系統(tǒng)進(jìn)行的噬菌體抵御,導(dǎo)致療法效果下降[50]。由于Z基因組噬菌體對(duì)多種識(shí)別A的限制性內(nèi)切酶的高抵抗性[21,22],可能使得天然或改造的Z基因組噬菌體具有治療耐藥細(xì)菌感染的潛力。對(duì)于CRISPR-Cas系統(tǒng),目前只有含糖基化5-hmdC修飾的大腸桿菌噬菌體T4抵抗CRISPR-Cas9系統(tǒng)的報(bào)道[5],對(duì)于含其他修飾噬菌體的抵抗情況,仍有待進(jìn)一步探索。
綜上所述,本文重點(diǎn)介紹的Z基因組生物合成通路不僅對(duì)噬菌體自身的生存有著重要意義,還有著廣闊的應(yīng)用前景:該通路中各種酶的發(fā)現(xiàn),能夠成為合成生物學(xué)的磚瓦,用來(lái)合成非常規(guī)嘌呤或在細(xì)胞生物的基因組中引入Z;也可以利用此通路批量合成dZ-DNA,作為材料或診斷試劑使用;而Z基因組噬菌體,也具有潛在的抵抗耐藥菌的能力,將來(lái)可能在噬菌體療法中發(fā)揮重要作用。
[1] Liyanage VRB, Jarmasz JS, Murugeshan N, Del Bigio MR, Rastegar M, Davie JR. DNA modifications: function and applications in normal and disease States., 2014, 3(4): 670–723.
[2] Weigele P, Raleigh EA. Biosynthesis and function of modified bases in bacteria and their Viruses., 2016, 116(20): 12655–12687.
[3] Gommers-Ampt JH, Borst P. Hypermodified bases in DNA., 1995, 9(11): 1034–1042.
[4] Wyatt GR, Cohen SS. The bases of the nucleic acids of some bacterial and animal viruses: the occurrence of 5-hydroxymethylcytosine., 1953, 55(5): 774–782.
[5] Bryson AL, Hwang Y, Sherrill-Mix S, Wu GD, Lewis JD, Black L, Clark TA, Bushman FD. Covalent modification of bacteriophage T4 DNA inhibits CRISPR-Cas9., 2015, 6(3): e00648.
[6] Kuo TT, Huang TC, Teng MH. 5-Methylcytosine replacing cytosine in the deoxyribonucleic acid of a bacteriophage for Xanthomonas oryzae., 1968, 34(2): 373–375.
[7] Swinton D, Hattman S, Benzinger R, Buchanan-Wollaston V, Beringer J. Replacement of the deoxycytidine residues in Rhizobium bacteriophage RL38JI DNA., 1985, 184(2): 294–298.
[8] Kallen RG, Simon M, Marmur J. The new occurrence of a new pyrimidine base replacing thymine in a bacteriophage DNA:5-hydroxymethyl uracil., 1962, 5: 248–250.
[9] Lee YJ, Dai N, Walsh SE, Müller S, Fraser ME, Kauffman KM, Guan CD, Corrêa IR, Weigele PR. Identification and biosynthesis of thymidine hypermodifications in the genomic DNA of widespread bacterial viruses., 2018, 115(14): E3116–E3125.
[10] Warren RA. Modified bases in bacteriophage DNAs., 1980, 34: 137–158.
[11] Kropinski AM, Bose RJ, Warren RA. 5-(4- Aminobutylaminomethyl)uracil, an unusual pyrimidine from the deoxyribonucleic acid of bacteriophage phiW-14., 1973, 12(1): 151–157.
[12] Swinton D, Hattman S, Crain PF, Cheng CS, Smith DL, McCloskey JA. Purification and characterization of the unusual deoxynucleoside, alpha-N-(9-beta-D-2′- deoxyribofuranosylpurin-6-yl)glycinamide, specified by the phage Mu modification function., 1983, 80(24): 7400–7404.
[13] Thiaville JJ, Kellner SM, Yuan YF, Hutinet G, Thiaville PC, Jumpathong W, Mohapatra S, Brochier-Armanet C, Letarov AV, Hillebrand R, Malik CK, Rizzo CJ, Dedon PC, de Crécy-Lagard V. Novel genomic island modifies DNA with 7-deazaguanine derivatives., 2016, 113(11): E1452–E1459.
[14] Tsai R, Corrêa IR, Xu MY, Xu SY. Restriction and modification of deoxyarchaeosine (dG+)-containing phage 9?g DNA., 2017, 7(1): 8348.
[15] Hutinet G, Kot W, Cui L, Hillebrand R, Balamkundu S, Gnanakalai S, Neelakandan R, Carstens AB, Fa Lui C, Tremblay D, Jacobs-Sera D, Sassanfar M, Lee YJ, Weigele P, Moineau S, Hatfull GF, Dedon PC, Hansen LH, de Crécy-Lagard V. 7-Deazaguanine modifications protect phage DNA from host restriction systems., 2019, 10(1): 5442.
[16] Kirnos MD, Khudyakov IY, Alexandrushkina NI, Vanyushin BF. 2-Aminoadenine is an adenine substituting for a base in S-2L cyanophage DNA.,1977, 270(5635): 369–370.
[17] Khudyakov IY, Kirnos MD, Alexandrushkina NI, Vanyushin BF. Cyanophage S-2L contains DNA with 2,6-diaminopurine substituted for adenine., 1978, 88(1): 8–18.
[18] Cheong C, Tinoco I, Chollet A. Thermodynamic studies of base pairing involving 2,6-diaminopurine., 1988, 16(11): 5115–5122.
[19] Sági J, Szakonyi E, Vorlícková M, Kypr J. Unusual contribution of 2-aminoadenine to the thermostability of DNA., 1996, 13(6): 1035–1041.
[20] Cristofalo M, Kovari D, Corti R, Salerno D, Cassina V, Dunlap D, Mantegazza F. Nanomechanics of diaminopurine- substituted DNA., 2019, 116(5): 760–771.
[21] Szekeres M, Matveyev AV. Cleavage and sequence recognition of 2,6-diaminopurine-containing DNA by site- specific endonucleases., 1987, 222(1): 89–94.
[22] Chollet A, Kawashima E. DNA containing the base analogue 2-aminoadenine: preparation, use as hybridi-zation probes and cleavage by restriction endonucleases., 1988, 16(1): 305–317.
[23] Tan Y, You CJ, Park J, Kim HS, Guo S, Sch?rer OD, Wang YS. Transcriptional perturbations of 2,6-diaminopurine and 2-aminopurine., 2022, 17(7): 1672–1676.
[24] Philippe Marliere, Pierre-Alexandre Kaminski, Frédérique GALISSON, Madeleine BouzonSylvie, PochetJean Weissenbach, William Saurin, Catherine Robert, Virginie Vico. Banque genomique du cyanophage s-2l et analyse fonctionnelle. WO2003093461A2. 2003-11-13.
[25] Zhou Y, Xu XX, Wei YF, Cheng Y, Guo Y, Khudyakov I, Liu FL, He P, Song ZY, Li Z, Gao Y, Ang EL, Zhao HM, Zhang Y, Zhao SW. A widespread pathway for substitution of adenine by diaminopurine in phage genomes., 2021, 372(6541): 512–516.
[26] Sleiman D, Garcia PS, Lagune M, Loc'h J, Haouz A, Taib N, R?thlisberger P, Gribaldo S, Marlière P, Kaminski PA. A third purine biosynthetic pathway encoded by aminoadenine-based viral DNA genomes., 2021, 372(6541): 516–520.
[27] Pezo V, Jaziri F, Bourguignon PY, Louis D, Jacobs-Sera D, Rozenski J, Pochet S, Herdewijn P, Hatfull GF, Kaminski PA, Marliere P. Noncanonical DNA polymerization by aminoadenine-based siphoviruses., 2021, 372(6541): 520–524
[28] Czernecki D, Bonhomme F, Kaminski PA, Delarue M. Characterization of a triad of genes in cyanophage S-2L sufficient to replace adenine by 2-aminoadenine in bacterial DNA., 2021, 12(1): 4710.
[29] Jin JY, Zhou JH. The mystery of Z-genome biosynthesis has been elucidated., 2022, 3(1): 1–5.金交羽, 周佳海. Z-基因組的生物合成奧秘被揭示. 合成生物學(xué), 2022, 3(1): 1–5.
[30] Callahan MP, Smith KE, Cleaves HJ, Ruzicka J, Stern JC, Glavin DP, House CH, Dworkin JP. Carbonaceous meteorites contain a wide range of extraterrestrial nucleobases., 2011, 108(34): 13995–13998.
[31] Wang ZY, Zhang F, Liang YT, Zheng KY, Gu CX, Zhang WJ, Liu YD, Zhang XR, Shao HB, Jiang Y, Guo C, He H, Wang HL, Sung YY, Mok WJ, Wong LL, He JF, McMinn A, Wang M. Genome and ecology of a novel alteromonas podovirus, ZP6, representing a new viral genus,., 2021, 9(2): e0046321.
[32] Honzatko RB, Fromm HJ. Structure-function studies of adenylosuccinate synthetase from Escherichia coli., 1999, 370(1): 1–8.
[33] Tong Y, Wu XY, Liu Y, Chen HY, Zhou Y, Jiang L, Li M, Zhao SW, Zhang Y. Alternative Z-genome biosynthesis pathway shows evolutionary progression from Archaea to phage., 2023, 8(7): 1330-1338.
[34] Wang W, Gorrell A, Honzatko RB, Fromm HJ. A study of Escherichia coli adenylosuccinate synthetase association states and the interface residues of the homodimer., 1997, 272(11): 7078–7084.
[35] Mehrotra S, Balaram H. Kinetic characterization of adenylosuccinate synthetase from the thermophilic archaea Methanocaldococcus jannaschii., 2007, 46(44): 12821–12832.
[36] Czernecki D, Legrand P, Tekpinar M, Rosario S, Kaminski PA, Delarue M. How cyanophage S-2L rejects adenine and incorporates 2-aminoadenine to saturate hydrogen bonding in its DNA., 2021, 12(1): 2420.
[37] Bochner BR, Ames BN. Complete analysis of cellular nucleotides by two-dimensional thin layer chromatography., 1982, 257(16): 9759–9769.
[38] Kim EE, Wyckoff HW. Reaction mechanism of alkaline phosphatase based on crystal structures: Two-metal ion catalysis., 1991, 218(2): 449–464.
[39] Moroz OV, Harkiolaki M, Galperin MY, Vagin AA, González-Pacanowska D, Wilson KS. The crystal structure of a complex of Campylobacter jejuni dUTPase with substrate analogue sheds light on the mechanism and suggests the "basic module" for dimeric d(C/U)TPases., 2004, 342(5): 1583–1597.
[40] Guilliam TA, Keen BA, Brissett NC, Doherty AJ. Primase-polymerases are a functionally diverse super-family of replication and repair enzymes., 2015, 43(14): 6651–6664.
[41] Braithwaite DK, Ito J. Compilation, alignment, and phylogenetic relationships of DNA polymerases., 1993, 21(4): 787–802.
[42] Czernecki D, Hu HD, Romoli F, Delarue M. Structural dynamics and determinants of 2-aminoadenine specificity in DNA polymerase DpoZ ofphage ?VC8., 2021, 49(20): 11974–11985.
[43] Li Y, Korolev S, Waksman G. Crystal structures of open and closed forms of binary and ternary complexes of the large fragment of Thermus aquaticus DNA polymerase I: structural basis for nucleotide incorporation., 1998, 17(24): 7514–7525.
[44] Wu EY, Beese LS. The structure of a high fidelity DNA polymerase bound to a mismatched nucleotide reveals an “Ajar” intermediate conformation in the nucleotide selection mechanism., 2011, 286(22): 19758–19767.
[45] Ceze L, Nivala J, Strauss K. Molecular digital data storage using DNA., 2019, 20(8): 456–466.
[46] Zhao FP, Wei YF, Wang XY, Zhou Y, Tong Y, Ang EL, Liu SN, Zhao HM, Zhang Y. Enzymatic synthesis of the un-na-tural nucleotide 2′-deoxyisoguanosine 5′-monophosphate., 2022, 23(21): e202200295.
[47] Rothemund PWK. Folding DNA to create nanoscale shapes and patterns., 2006, 440(7082): 297–302.
[48] Zhang DL, Ge Q, Feng YB, Chen WG. Comparison and analysis on scientific research programs on DNA data storage., 2022, 42(6): 116–129.張大璐, 葛奇, 馮一博, 陳為剛. DNA數(shù)據(jù)存儲(chǔ)的科研概況國(guó)際對(duì)比與分析. 中國(guó)生物工程雜志, 2022, 42(6): 116–129.
[49] Zhang LQ, Yang ZY, Sefah K, Bradley KM, Hoshika S, Kim MJ, Kim HJ, Zhu GZ, Jiménez E, Cansiz S, Teng IT, Champanhac C, McLendon C, Liu C, Zhang W, Gerloff DL, Huang Z, Tan WH, Benner SA. Evolution of func-tional six-nucleotide DNA., 2015, 137(21): 6734–6737.
[50] Tian EK, Wang Y, Wu ZX, Wan ZQH, Cheng W. Bacte-riophage therapy: retrospective review and future pros-pects., 2021, 52(2): 170–175.田而慷, 王玥, 吳卓軒, 萬(wàn)紫千紅, 程偉. 噬菌體療法:回顧與展望. 四川大學(xué)學(xué)報(bào)(醫(yī)學(xué)版), 2021, 52(2): 170–175.
Progress on Z genome biosynthetic pathway of bacteriophage
Huiyu Chen, Suwen Zhao
There are abundant base modifications in bacteriophages’ genomes, mainly for avoiding the digestion of host endonucleases. More than 40 years ago, researchers discovered that 2-amino-adenine (Z) completely replaced adenine (A) and forms a complementary pairing with three hydrogen bonds with thymine (T) in the DNA of cyanophage S-2L, forming a distinct “Z-genome”. In recent years, researchers have discovered and validated the biosynthetic pathway of Z-genome in various bacteriophages, constituting a multi-enzyme system. This system includes the phage-encoded enzymes deoxy-2′-aminoadenylosuccinate synthetase (PurZ), deoxyadenosine triphosphate hydrolase (dATPase/DatZ), deoxyadenosine/deoxyguanosine triphosphate pyrophosphatase (DUF550/MazZ) and DNA polymerase (DpoZ). In this review, we provide a concise overview of the historical discovery on diversely modified nucleosides in bacteriophages, then we comprehensively summarize the research progress on multiple enzymes involved in the Z-genome biosynthetic pathway. Finally, the potential applications of the Z-genome and the enzymes in its biosynthetic pathway are discussed in order to provide reference for research in this field.
Z-genome; bacteriophage; DNA modification; 2-aminoadenine; biosynthetic pathway
2023-05-26;
2023-08-17;
2023-08-18
國(guó)家自然科學(xué)基金項(xiàng)目(編號(hào):32122024),上海市生物大分子與精準(zhǔn)醫(yī)藥前沿科學(xué)研究基地資助[Supported by the National Natural Science Foundation of China (No. 32122024), and Shanghai Frontiers Science Center for Bomacromolecules and Precision Medicine]
陳薈玉,在讀碩士研究生,專業(yè)方向:計(jì)算化學(xué)與生物學(xué)。E-mail: chenhy6@shanghaitech.edu.cn
趙素文,博士,研究員,研究方向:計(jì)算化學(xué)與生物學(xué)。E-mail: zhaosw@shanghaitech.edu.cn
10.16288/j.yczz.23-059
(責(zé)任編委: 張?zhí)煊?