馮 華,劉運(yùn)超,李青梅,金前躍,張改平*
(1.河南省農(nóng)業(yè)科學(xué)院 動(dòng)物免疫學(xué)重點(diǎn)實(shí)驗(yàn)室/河南省動(dòng)物免疫學(xué)重點(diǎn)實(shí)驗(yàn)室/農(nóng)業(yè)部動(dòng)物免疫學(xué)重點(diǎn)實(shí)驗(yàn)室,河南鄭州 450002)
豬圓環(huán)病毒2型(Porcine circovirus type 2,PCV2)是一種環(huán)狀單鏈DNA病毒,是誘發(fā)一系列重要豬圓環(huán)病毒病(Porcine circovirus diseases,PCVD)的主要病原體[1]。PCV2系統(tǒng)性疾病(PCV2-systemic disease,PCV2-SD)是一種主要由PCV2引起的一種多誘因PCVD,之前被稱為斷奶仔豬多系統(tǒng)衰竭綜合征,臨床主要表現(xiàn)為生長(zhǎng)緩慢、呼吸困難、淋巴結(jié)腫大、腹瀉等[2]。該病主要影響7周齡~16周齡的仔豬,能夠造成4%~30%的發(fā)病率和4%~20%死亡率[3],導(dǎo)致巨大的經(jīng)濟(jì)損失。
PCV2屬于圓環(huán)病毒科、圓環(huán)病毒屬,其基因組大小約為1.7 kb,包含約11個(gè)開(kāi)放閱讀框(open reading frame,ORF)[4],其中ORF1和ORF2是2個(gè)主要的蛋白編碼序列,分別編碼病毒復(fù)制相關(guān)蛋白R(shí)ep(Rep′)和病毒結(jié)構(gòu)蛋白Cap[5]。在整個(gè)基因組中,相比其他ORFs,ORF2具有較高遺傳多樣性,因此經(jīng)常用于亞型的區(qū)分[6]。系統(tǒng)發(fā)育學(xué)分析顯示,基于PCV2全基因組和ORF2,PCV2目前分為5種亞型,包括PCV2a-2e,其中PCV2a、PCV2b和PCV2d是3種主要流行的亞型[5]。GenBank數(shù)據(jù)庫(kù)顯示,PCV2a在2003年以前主要流行于感染豬場(chǎng),之后在幾次嚴(yán)重的暴發(fā)后,PCV2b取代PCV2a成為主要的流行亞型[7]。近年來(lái),關(guān)于PCV2d亞型感染免疫豬場(chǎng)的報(bào)道的不斷上升,該亞型不斷地流行可能會(huì)導(dǎo)致新一輪的亞型轉(zhuǎn)變[8]。
密碼子使用偏性是指在基因轉(zhuǎn)錄到翻譯成蛋白質(zhì)的過(guò)程中,同義密碼子在某一物種或基因中的使用并不是隨機(jī)的,而是傾向于使用其中一種或幾種密碼子的現(xiàn)象,該現(xiàn)象已在病毒、原核和真核生物中得到了廣泛的驗(yàn)證[9]。相比表達(dá)量較低的基因,密碼子使用偏性在高表達(dá)基因中更為顯著[10],而影響密碼子使用形式的主要因素包括基因表達(dá)水平、復(fù)制和轉(zhuǎn)錄選擇、翻譯選擇、突變壓力、自然選擇蛋白質(zhì)二級(jí)結(jié)構(gòu)、GC含量等[11-14],其中突變壓力和自然選擇被認(rèn)為是造成不同物種間密碼子使用多樣性的主要因素[11]。之前研究顯示, PCV基因組密碼子使用模式同時(shí)受到自然選擇和突變壓力影響,然而對(duì)這兩個(gè)因素的作用程度解釋卻不一致[12-13,15]。此外,隨著PCV2的廣泛流行及其新亞型的不斷出現(xiàn)[8],對(duì)于該病毒基因組密碼子使用偏性的研究將有助于深入闡明病毒分子進(jìn)化和病毒基因表達(dá)調(diào)節(jié)機(jī)制,并為相關(guān)病毒新型疫苗的設(shè)計(jì)提供思路。因此,本研究以目前流行的PCV2為研究對(duì)象,根據(jù)其4種主要基因亞型篩選74株不同毒株的基因序列,利用生物信息學(xué)手段對(duì)其高表達(dá)編碼基因Rep和Cap的基因序列進(jìn)行分析,探索影響PCV2密碼子使用模式的主要因素,并分析該病毒對(duì)其寄主的進(jìn)化適應(yīng)度,為PCV2相關(guān)基礎(chǔ)及應(yīng)用研究提供支撐。
本研究中分析所用的74株不同的PCV2病毒基因組序列(23株P(guān)CV2a,22株P(guān)CV2b,4株P(guān)CV2c,20株P(guān)CV2d和5株P(guān)CV2e)均從National Center for Biotechnology Information (NCBI)數(shù)據(jù)庫(kù)下載(http://www.ncbi.nlm.nih.gov/GenBank)(附表1);針對(duì)每一條序列,使用MEGA-X程序提取其編碼主要蛋白的ORFs,Rep和Cap基因,將兩段ORF連接命名為ORF-RC,并用MUSCLE程序?qū)π蛄羞M(jìn)行對(duì)齊。
利用生物信息學(xué)軟件CAIcal(http://ppuigbo.me/programs/CAIcal/)和CondonW 1.4.4對(duì)提取的74株P(guān)CV2 ORF-RC基因序列進(jìn)行整體核酸組成分析分別計(jì)算序列中總體GC和AU含量,密碼子第3位堿基中4種堿基的使用頻率(U3%、A3%、C3%和G3%)和密碼子第1、2、3位置上GC含量(GC1、GC2和GC3)以及第1、2位上堿基的GC%總含量。在所有的分析計(jì)算中,編碼終止密碼子的3個(gè)堿基(UAA、UAG和UGA)、AUG和UGG沒(méi)有被計(jì)算入內(nèi)。
利用CodonW 1.4.4程序?qū)CV2 ORF-RC序列的相對(duì)同義密碼子使用頻率(relative synonymous codon usage,RSCU)和有效密碼字?jǐn)?shù)(effective number of codons,ENC)分別進(jìn)行分析。RSCU值主要用于評(píng)估基因的同義密碼子使用偏性;如果RSCU=1,則改密碼子的使用沒(méi)有偏性;如果RSCU>1,則密碼子使用偏性高,反之則偏性越低。對(duì)應(yīng)分析(correspondence analysis,COA)是一種多元統(tǒng)計(jì)方法,用于研究樣本與變量之間的內(nèi)部關(guān)系,在研究密碼子偏性中主要用于分析不同基因中密碼子使用形式的主要變化趨勢(shì)。在本研究中,以所有樣品中編碼基因密碼子的RSCU值為變量,按照密碼子種類分為59個(gè)維度,利用SPSS 20軟件對(duì)不同PCV2亞型之間密碼子使用形式的主要趨勢(shì)進(jìn)行對(duì)應(yīng)分析研究。
有效密碼字?jǐn)?shù)(effective number of codons,ENC)主要用于分析單個(gè)基因的密碼子使用偏性,能夠反應(yīng)同義密碼子的不均衡使用層度(20~61),ENC值越接近20,偏性越高,反之越接近61偏性則越低,利用CodonW 1.4.4計(jì)算得到。ENC繪圖可以展示ENC值與密碼子第3位GC含量(GC3%)之間的關(guān)系,用來(lái)鑒定影響密碼子使用多樣性的因素。針對(duì)每個(gè)GC3值的期望ENC值(ENCexpect)通過(guò)以下公式計(jì)算得到:
其中s代表密碼子第3位上GC的含量
中性繪圖分析用于分析突變壓力和自然選擇對(duì)密碼子使用形式影響的程度。分析中,通過(guò)對(duì)同義密碼子GC12和GC3含量分析,以確定突變壓力和自然選擇在PCV2毒株進(jìn)化中的特點(diǎn)。突變壓力和自然選擇對(duì)進(jìn)化速率的影響以線性回歸的斜率表示。
密碼子適應(yīng)指數(shù)(codon adaptation index,CAI)主要用于分析由于自然選擇造成的密碼子使用偏性,能夠反應(yīng)病毒基因組序列對(duì)寄主同義密碼子使用的相對(duì)適應(yīng)程度。CAI值范圍位0~1,值越高表示適應(yīng)程度越高。為了評(píng)估PCV2對(duì)其寄主豬類(Susscrofa,Sus.s)基因密碼子的適應(yīng)程度,本研究從http://www.kazusa.or.jp/codon/下載了Sus.s的密碼子使用模式,并利用CAIcal計(jì)算不同亞型PCV2 ORF-RC的CAI值。
針對(duì)74株不同亞型PCV2(2a-2e)代表性蛋白編碼基因Rep和Cap(ORF-RC)組成進(jìn)行整體分析,以了解PCV2轉(zhuǎn)錄本組成的主要特性。結(jié)果顯示(圖1),PCV2a-e整體上核苷酸A(27.99%)、U(25.29%)、G(23.43%)和C(23.28%)的分布并不平均,并顯示出較高的AU使用偏性;比較密碼子第3位堿基使用情況發(fā)現(xiàn),基因中使用C3(29.91%)和U3(27.07%)結(jié)尾的密碼子較多,以A3(22.07%)和G3(20.95%)較少,但較高的GC3%含量說(shuō)明以G和C結(jié)尾的密碼子能對(duì)密碼子使用模式造成影響。
針對(duì)PCV2a-2e ORF-RC序列的同義密碼子序列進(jìn)行RSCU分析并將其與其寄主Sus.s的RSCU進(jìn)行比較。PCV2a-2e整體分析結(jié)果顯示(表1),在使用較多的18密碼子中以A、U、C和G結(jié)尾的密碼子數(shù)分別為4(GUA、AAA、GAA、GGA)、5(UUU、AUU、GCU、AAU、GAU)、7(UCC、CCC、ACC、UAC、CAC、UGC和CGC)和2(CUG和CAG);進(jìn)一步分析發(fā)現(xiàn)在編碼特定氨基酸(AA)時(shí),PCV2a更傾向于使用GAC(Asp),PCV2c更傾向于使用CUU(Leu)、GUG(Val)、CAA(Gln)和AGA(Arg),PCV2d更傾向于使用CUC(Leu)、GUG(Val)和GGC(Gly),PCV2e則更傾向于使用UAU(Tyr)、CAA(Gln)和AGA(Arg)。對(duì)比寄主RSCU值,5種亞型之中分別有9(PCV2a)、8(PCV2b)、6(PCV2c)、9(PCV2d)和5(PCV2e)個(gè)最優(yōu)密碼子與寄主最優(yōu)密碼子一致。
圖1 PCV2a-2e亞型ORF-RC基因堿基組成整體分析
COA分析顯示(圖2),第1主成分軸(Axis 1)和第2主成分軸(Axis 1)分別反映變異總量的19.79%和15.6%,而第3和第4主成分軸(Axis 3,Axis 4)分別占14.34%和10.99%。整體上,PCV2a-2e各亞型的點(diǎn)聚集在同一區(qū)域并且相互之間有一定程度的重疊;相比PCV2a,PCV2b和2d的密碼子使用模式更為接近,而PCV2e則與PCV2a更為接近。該結(jié)果說(shuō)明,不同亞型PCV2之間在密碼子在使用偏性上差別不大,但是各亞型之間又有細(xì)微差別。
圖2 基于RSCU值的COA分析
PCV2的5個(gè)亞型ORF-RC的ENC值波動(dòng)不大,范圍在53.04~55.37(均值為54.54±0.59),因此PCV2各亞型基因組在密碼子使用上具有輕微的使用偏性。通過(guò)分析PCV2主要蛋白的ENC值與GC3%之間的關(guān)系,從而確定影響PCV2密碼子使用偏性的影響因素(圖3)。如基因僅或主要受突變選擇影響,那么散點(diǎn)將分布于期望曲線上或附近;反之,如果受自然選擇影響將會(huì)落在曲線較遠(yuǎn)的位置。結(jié)果顯示,各亞型所有點(diǎn)均落在期望值曲線下方附近,說(shuō)明PCV2各亞型ORF-RC基因組密碼子使用模式除了受到突變壓力影響,還會(huì)受到自然選擇影響。
A:黑線代表ENC值的標(biāo)準(zhǔn)曲線。A:The black line represents the standard curve of ENC value.
中性繪圖分析進(jìn)一步顯示(圖4),PCV2a-2e整體上GC12和GC3呈輕微的負(fù)相關(guān)線性回歸方程斜率為-0.098 4,證明相比突變壓力,自然選擇在影響PCV2密碼子使用模式上發(fā)揮了較大的作用;而PCV2a-e的GC12和GC3之間的線性回歸方程斜率分別為0.044 4、-0.048 5、-0.033 9、0.018 6和-0.187 5,進(jìn)一步證明自然選擇在PCV2分子進(jìn)化中起到較大的作用。
圖4 中性分析
表1 PCV2a-2e亞型 ORF-RC基因及其寄主Sus.s基因組各密碼子的RSCU值
續(xù)表1
CAI分析結(jié)果顯示,PCV2a-2e各基因亞型對(duì)于其寄主的CAI值分別為0.671±0.003(PCV2a)、0.675±0.003(PCV2b)、0.665±0.003(PCV2c)、0.666±0.003(PCV2d)和0.656±0.001(PCV2e),說(shuō)明病毒和Sus.s的密碼子使用模式有較大差異,而來(lái)自寄主的選擇壓力能夠?qū)CV2密碼子使用造成影響。
自1998年發(fā)現(xiàn)PCV2以來(lái),該病毒已成為嚴(yán)重威脅世界養(yǎng)豬業(yè)的一種重要的病原體。研究顯示,PCV2各基因型之間的遺傳距離至少在3.5%,而各毒株之間的差異卻能達(dá)到10%;雖然是最小的DNA病毒,但PCV2具有較高的進(jìn)化速度(1.26×10-3位點(diǎn)替換/年),與RNA病毒的進(jìn)化速率更為接近。目前,PCV2主要分為PCV2a-2e這5個(gè)亞型,其中PCV2a、PCV2b和PCV2d是目前流行的3種基因亞型[5]。因而,針對(duì)PCV2密碼子使用模式進(jìn)行深入的探索將有利于PCV2分子進(jìn)化和基因表達(dá)調(diào)控的研究,同時(shí)對(duì)其疫苗的研究提供理論指導(dǎo)。
本研究選擇74株不同亞型的PCV2(2a-2e)為研究對(duì)象,對(duì)其主要編碼蛋白基因序列ORF-RC(ORF1和ORF2)的密碼子使用模式進(jìn)行分析。密碼子使用模式通常會(huì)較大程度的受核苷酸組成影響,本研究中PCV2 基因組中GC%相比AU%較低,而在密碼子第3位中GC3%則高于AU3%,說(shuō)明PCV2更傾向于使用GC結(jié)尾的密碼子,這些結(jié)果顯示PCV2基因核苷酸總體組成和密碼子第3位核苷酸組成可能會(huì)對(duì)同義密碼子使用模式及選擇壓力造成一定程度的影響,這與之前的研究結(jié)果一致[14]。
RSCU分析顯示,PCV2病毒各亞型(2a-2e)ORF-RC序列中以C、U結(jié)尾的密碼子的RSCU值相比以A、G結(jié)尾的密碼子更高,說(shuō)明PCV2病毒在翻譯時(shí)更傾向于使用以C、U結(jié)尾的密碼子,這與核苷酸分析結(jié)果一致。進(jìn)一步分析發(fā)現(xiàn),PCV2各亞型在編碼特定氨基酸時(shí),對(duì)于密碼子的使用則有特殊的偏好,這可能與PCV2各亞型之間在密碼使用模式之間的差別有關(guān)(COA分析顯示)。此外,PCV2各亞型與寄主共有的最優(yōu)密碼子較少,說(shuō)明寄主可能會(huì)影響PCV2密碼子使用模式。研究顯示,較低的密碼子偏性有利于病毒在寄主中的有效復(fù)制,同時(shí)能夠降低在蛋白合成中病毒與寄主之間的競(jìng)爭(zhēng)[11]。本研究中,PCV2各亞型之間ENC之沒(méi)有較大波動(dòng)穩(wěn)定在54.54左右,沒(méi)有明顯的密碼子使用偏性。ENC-GC3%和中性分析證明,PCV2各亞型在密碼子使用上同時(shí)受到突變壓力和自然選擇的影響[13],并且較大程度的受自然選擇影響,而這可能是PCV2d最早在疫苗免疫豬場(chǎng)的出現(xiàn)的原因之一[1]。之前另一項(xiàng)研究顯示[12],突變壓力是影響PCV密碼子使用的主要因素,這可能與本研究所選擇的樣本、目標(biāo)基因的范圍和大小有關(guān)。此外,PCV2各亞型間CAI值相差不大,較低的CAI也進(jìn)一步證明來(lái)自寄主的選擇壓力可能會(huì)較大程度的影響PCV2密碼子使用形式和病毒對(duì)寄主翻譯資源的利用度,同時(shí)也解釋了PCV2在PK-15細(xì)胞中復(fù)制水平較低的現(xiàn)象;此外,相比PCV2c和PCV2e,PCV2a、PCV2b、PCV2d較高的CAI值說(shuō)明這3種亞型能夠較為有效利用寄主翻譯資源,進(jìn)一步側(cè)面解釋了相比其他亞型它們作為主要流行株在世界豬場(chǎng)廣為流行的原因。
綜上所述,本研究以不同PCV2亞型(2a-2e)主要蛋白編碼基因ORF-RC為研究對(duì)象,對(duì)PCV2的密碼子偏性進(jìn)行了深入的研究,證實(shí)PCV2各亞型間密碼子使用偏性較低,并進(jìn)一步闡明除突變選擇外,自然選擇是影響PCV2密碼子使用模式的主要因素。本研究結(jié)果為了解PCV2各亞型毒株在寄主中復(fù)制過(guò)程中的差異提供了依據(jù),同時(shí)了解了影響PCV2進(jìn)化的因素,為該病毒引起的相關(guān)疾病的預(yù)防和診斷提供了指導(dǎo)。