李冠英,王 政,張志燕,方和娣,譚小力
(江蘇大學(xué)生命科學(xué)研究院,鎮(zhèn)江212013)
密碼子的非均衡使用在生物界中普遍存在[1]。通用遺傳密碼子共有64個,除去3個終止密碼子外,其余61個密碼子編碼構(gòu)成生物體的20種氨基酸,這表明同一種氨基酸由幾個不同的密碼子編碼,通常將這些編碼同一種氨基酸的不同密碼子稱為同義密碼子(synonymous codon)。某一物種或某一基因家族對特定的同義密碼子的選擇使用具有偏好性,此現(xiàn)象稱為密碼子偏好性(codon bias),這一現(xiàn)象與遺傳信息的載體分子DNA和生物功能分子蛋白質(zhì)相關(guān)聯(lián),所以具有重要的生物學(xué)意義[2]。密碼子偏好性是長期進(jìn)化的結(jié)果,在進(jìn)化過程中受很多因素的影響,以至于不同密碼子承受的壓力不同,從而產(chǎn)生密碼子的偏好使用。影響密碼子使用偏好性的因素有多種,如 tRNA 分子的豐度[3,4]、突變偏好性[5]、氨基酸疏水性[6]、基因表達(dá)水平[7]等。密碼子的偏好使用還與基因的堿基組成相關(guān),如G+C(GC)含量,尤其與GC3s(密碼子第三位的 G+C)的含量相關(guān)[8]。另外,不同折疊類型蛋白的密碼子使用偏好性有著顯著的區(qū)別,這表明,在蛋白質(zhì)二級結(jié)構(gòu)和蛋白質(zhì)折疊類型的預(yù)測過程中,除蛋白質(zhì)一級結(jié)構(gòu)之外,密碼子偏好性是另一項重要的預(yù)測參考[9]。密碼子偏好性的分析有助于在預(yù)測基因的表達(dá)水平、基因異源表達(dá)最適宿主的選擇和優(yōu)化密碼子以提高異源表達(dá)水平等方面具有重要意義[2]。
WRKY基因家族是植物特有的一類轉(zhuǎn)錄因子,在擬南芥中的研究顯示,該家族廣泛地參與植物器官的發(fā)育和衰老、植物對生物、非生物脅迫的應(yīng)答反應(yīng)等一系列生理活動[10-12]。據(jù)報道顯示,在甘藍(lán)型油菜(Brassica napus)中,菌核病(Sclerotinia sclerotiorum)、黑斑病(Alternaria raphani)等油菜主要病原菌的侵染,以及各種植物激素的處理都能顯著地誘導(dǎo)WRKY基因的表達(dá)[13-15],表明WRKY基因家族在油菜抗逆反應(yīng)中起著重要的作用。
甘藍(lán)型油菜(Brassica napus)是中國最重要的油料作物之一,其所產(chǎn)菜籽油在目前位居中國食用油市場第三位,占食用油消費(fèi)量的18%[16]。本文主要從基因的堿基組成出發(fā),分析甘藍(lán)型油菜WRKY(BnWRKY)基因家族密碼子的組成、使用特性、及其密碼子偏好性,為更好實(shí)現(xiàn)該家族基因異源表達(dá),進(jìn)一步分析BnWRKY基因家族的性質(zhì)奠定基礎(chǔ)。
BnWRKY基因家族序列來源與Genbank數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/),踢除重復(fù)序列與不完整的CDS序列,最后得到44條完整CDS序列。
表1 BnWRKY基因家族密碼子使用特性Table 1 Characterization of codon usage of rapseed WRKY genes
利用CodonW軟件分析WRKY家族基因密碼子使用特性的參數(shù)包括:A3s,G3s,C3s,T3s(同義密碼子在第3位上相應(yīng)堿基的出現(xiàn)頻率),GC(基因的 G+C含量),GC3s(密碼子的第3位的G+C含量),ENC(有效密碼子數(shù)),F(xiàn)OP(最優(yōu)密碼子使用頻率),CBI(密碼子偏愛指數(shù)),CAI(密碼子適應(yīng)指數(shù)),L_aa(氨基酸數(shù)),Gravy(平均親水性值),RSCU(同義密碼子的相對使用度)等。運(yùn)用SPSS 19.0軟件對BnWRKY家族的密碼子特征各參數(shù)間相關(guān)性分析,運(yùn)用Origin 8.0制作圖表。
表1所示,BnWRKY基因家族密碼子各參數(shù)特征值。其中GC含量范圍在42.3% ~52.4%,平均含量為46.6%,經(jīng)分析發(fā)現(xiàn)其GC含量以平均值為界成雙峰分布,主要集中在44.5%和50%左右(圖1),總體來看,GC含量主要集中在50%左側(cè),說明BnWRKY基因家族略傾向于使用腺嘌呤(A)和胸腺嘧啶(T)這2種核苷酸。
從表1還可以看出,BnWRKY基因家族成員的Gravy值均為正值,表明該家族編碼蛋白質(zhì)的平均親水性值均呈親水性。
有效密碼子數(shù)(Effective Number of Codon,ENC)是檢測單個基因CDS區(qū)密碼子偏好選擇程度的一個參數(shù),取值范圍為20~61(單個基因每個氨基酸只選擇使用一個密碼子到每個密碼子均被使用)[17,18]。Jiang 等[19]將ENc的值等于35時作為區(qū)分密碼子選擇偏好性強(qiáng)弱標(biāo)準(zhǔn)的界限,ENc值小于35時,其值越低,密碼子的偏好性越強(qiáng),ENc的值大于35時密碼子沒有偏好性。Bn-WRKY基因家族的ENC取值范圍為44.51~61,集中在55左右(圖2),均大于35,說明BnWRKY基因家族對密碼子有一定的偏好性。BnWRKY基因家族的EENC取值范圍為44.51~61,集中在55左右(圖2),均大于35,說明BnWRKY基因家族對密碼子有一定的偏好性。
另外,通過比較ENC值可以預(yù)測內(nèi)源基因表達(dá)量的相對高低,ENC值越大,該基因的表達(dá)量就越低,ENC值越小,該基因的內(nèi)源表達(dá)量也越高[2]。BnWRKY基因家族,ENC值偏大,從而說明無脅迫條件下該家族基因表達(dá)水平一般。
CAI(密碼子適應(yīng)指數(shù))是對單基因CDS區(qū)同義密碼子與密碼子最佳使用相吻合水平的檢測,其值范圍在0~1之間,CAI值一般也用來預(yù)測種內(nèi)基因的表達(dá)水平[2]。BnWRKY 基因家族取值范圍為0.184 ~0.283,進(jìn)而說明該家族正常情況下表達(dá)水平不高。
為了研究多種可能因素對密碼子偏好性有無影響及影響程度,我們作了各種參數(shù)的相關(guān)性分析(表2)。分析結(jié)果表明,GC含量與CBI、Fop、ENC均成極顯著正相關(guān)(r>0.4,P <0.01),另外,GC3s、G3s、T3s、C3s分別與 CAI、CBI、Fop、ENC 等均有顯著(P <0.05)或極顯著(P<0.01)的相關(guān)性,顯示出堿基組成對密碼子的選擇偏好性有重要影響;A3s與CAI、Fop、ENc等高表達(dá)基因相關(guān)的指數(shù)均成極顯著負(fù)相關(guān)(r<-0.5,P<0.01),表明堿基在第三位上的腺嘌呤核苷酸(A3s)對基因的表達(dá)水平有顯著的影響,并且還直接影響密碼子的偏好性。
表2 各參數(shù)之間的相關(guān)系數(shù)Table 2 Correlation coefficients of the factors
由于堿基組成變異對密碼子偏好性有重要影響,我們以ENC為縱坐標(biāo),以GC3s為橫坐標(biāo),做ENc-plot分析(圖3),檢測堿基組成對密碼子偏好性的影響[20]。圖中的曲線表示在無進(jìn)化壓力的情況下ENC和GC3s的函數(shù)關(guān)系,如果密碼子的偏好性僅受堿基突變的影響,代表基因的點(diǎn)應(yīng)該落在理論曲線或其附近位置;在存在選擇壓力的情況下,相應(yīng)的點(diǎn)會落在曲線下方較遠(yuǎn)處。從圖3中可以看出,BnWRKY基因?qū)?yīng)的點(diǎn)只有少數(shù)幾個落在理論曲線上,暗示這些基因密碼子的用法僅受堿基組成的影響,但大多數(shù)點(diǎn)落在曲線下方,則說明存在自然選擇等其它壓力對密碼子偏好性也有重要影響。
圖3 BnWRKY基因的ENC-GC3s圖Fig 3 ENc-GC3s plot of BnWRKY gene
同義密碼子相對使用度(Relative Synonymous Codon Usage,RSCU)是一個氨基酸所對應(yīng)的密碼子實(shí)際運(yùn)用個數(shù)與理論運(yùn)用個數(shù)之間的比值[22]。當(dāng)實(shí)際運(yùn)用個數(shù)與理論運(yùn)用個數(shù)相同時,RSCU=1,此時密碼子不存在偏好性;當(dāng)RSCU>1時,則說明該密碼子出現(xiàn)的頻率比其它同義密碼子高,為基因偏好使用的密碼子;當(dāng)RSCU<1時,則密碼子出現(xiàn)的相對頻率較低,是基因較少使用的密碼子。在64個通用密碼子中,TAA、TAG和TGA為終止密碼子,不編碼任何氨基酸,ATG、TGG分別是編碼甲硫氨酸、色氨酸的唯一密碼子,以上5個密碼子均不存在偏好性,分析時排除這些密碼子。
利用CodonW軟件計算甘藍(lán)型油菜WRKY基因家族的RSCU值(表3),RSCU>1的密碼子如TTC、TTA、CTT、AGA等有29個,多以 T(10個)或 A(9個)結(jié)尾,說明BnWRKY基因家族偏愛使用以A或T結(jié)尾的密碼子。
表3 甘藍(lán)型油菜WRKY基因家族相對同義密碼子使用度Table 3 Average relative frequence of 59 synonymous codons genes of WRKY families of rapseed
在對BnWRKY基因家族堿基組成的分析中發(fā)現(xiàn),G+C含量總體均小于0.5,表明G+C的相對含量偏低(表1),即A+T的相對含量稍高;同時,在對密碼子相對使用度(RSCU)的分析時發(fā)現(xiàn),該家族偏愛的密碼子多以A或T結(jié)尾(表3)。以上分析說明該基因家族的堿基組成對密碼子偏愛的選擇有一定的影響。這與我們做的相關(guān)性分析(G+C含量與多個參數(shù)呈顯著或極顯著相關(guān),見表2)的結(jié)果相一致。ENC-plot曲線分析進(jìn)一步發(fā)現(xiàn),除了堿基組成外,自然選擇等其它因素也對BnWRKY基因家族密碼子的偏好性有影響,其影響程度有待進(jìn)一步研究。
BnWRKY基因家族各成員的基因表達(dá)水平的相關(guān)參數(shù)(CAI、ENc和Fop等)的值均偏小(表1),根據(jù)這些數(shù)據(jù)我們推測,該基因家族在甘藍(lán)型油菜中的表達(dá)量較低。在擬南芥的研究表明,AtWRKYs基因參與多種脅迫反應(yīng),在受到脅迫時進(jìn)行誘導(dǎo)表達(dá)[22]。根據(jù)報道的實(shí)驗(yàn)數(shù)據(jù)顯示,當(dāng)甘藍(lán)型油菜受到S.sclerotiorum、A.raphani等病原菌及各種植物激素處理時,測試的大部分Bn-WRKYs均被顯著誘導(dǎo),這些結(jié)果說明WRKY基因家族成員多為脅迫誘導(dǎo)型基因。
本研究調(diào)查了BnWRKY基因家族的密碼子偏好性及其偏好程度,這些分析可為該基因家族新成員的鑒定及其表達(dá)分析預(yù)測提供線索;同時既可為該基因家族實(shí)現(xiàn)異源表達(dá)選擇合適的宿主表達(dá)系統(tǒng),也可為通過優(yōu)化密碼子提高基因的表達(dá)量提供依據(jù)。
[1]Fuglsang A.The'effective number of codons'revisited[J].Biochem Biophys Res Commun,2004,317(3):957-964.
[2]吳憲明,吳松鋒,任大明,等.密碼子偏性的分析方法及相關(guān)研究進(jìn)展[J]. 遺傳,2007,29(4):420-426.
[3]Moriyama E N,Powell J R.Codon usage bias and tRNA abundance in Drosophila[J].J Mol Evol,1997,45(5):514-523.
[4]Olejniczak M,Uhlenbeck O C.tRNA residues that have coevolved with their anticodon to ensure uniform and accurate codon recognition[J].Biochimie,2006,88(8):943-950.
[5]Xia X.Mutation and selection on the anticodon of tRNA genes in vertebrate mitochondrial genomes[J].Gene,2005,345(1):13-20.
[6]Knight R D,F(xiàn)reeland S J,Landweber L F.A simple model based on mutation and selection explains trends in codon and amino-acid usage and GC composition within and across genomes[J].Genome Biol,2001,2(4):H10.
[7]石秀凡,黃京飛,柳樹群,等.人類基因同義密碼子偏好的特征以及與基因GC含量的關(guān)系[J].生物化學(xué)與生物物理進(jìn)展,2002,29(3):411-414.
[8]Carlini D B,Chen Y,Stephan W.The relationship between third-codon position nucleotide content,codon bias,mRNA secondary structure and gene expression in the drosophilid alcohol dehydrogenase genes Adh and Adhr[J].Genetics,2001,159(2):623-633.
[9]顧萬君,馬建民,周 童,等.不同折疊類型蛋白編碼基因的密碼子使用[J].東南大學(xué)學(xué)報(自然科學(xué)版),2002,32(3):362-366.
[10]Grunewald W,Karimi M,Wieczorek K,et al.A role for At-WRKY23 in feeding site establishment of plant-parasitic nematodes[J].Plant Physiol,2008,148(1):358-368.
[11]Jiang Y,Deyholos M K.Functional characterization of Arabidopsis NaCl-inducible WRKY25 and WRKY33 transcription factors in abiotic stresses[J].Plant Mol Biol,2009,69(1-2):91-105.
[12]De Michele R,F(xiàn)ormentin E,Todesco M,et al.Transcriptome analysis of Medicago truncatula leaf senescence:similarities and differences in metabolic and transcriptional regulations as compared with Arabidopsis,nodule senescence and nitric oxide signalling[J].New Phytol,2009,181(3):563-575.
[13]Zhao J,Wang J,An L,et al.Analysis of gene expression profiles in response to Sclerotinia sclerotiorum in Brassica napus[J].Planta,2007,227(1):13-24.
[14]Yang B,Jiang Y,Rahman M H,et al.Identification and expression analysis of WRKY transcription factor genes in canola(Brassica napus L.)in response to fungal pathogens and hormone treatments[J].BMC Plant Biol,2009,9:68.
[15]Zhao J,Buchwaldt L,Rimmer S R,et al.Patterns of differential gene expression in Brassica napus cultivars infected with Sclerotinia sclerotiorum[J].Mol Plant Pathol,2009,10(5):635-649.
[16]沈金雄,傅廷棟.中國油菜生產(chǎn)、改良與食用油供給安全[J].中國農(nóng)業(yè)科技導(dǎo)報,2011,13(1):1-8.
[17]Fuglsang A.The'effective number of codons'revisited[J].Biochem Biophys Res Commun,2004,317(3):957-964.
[18]Liu Q,F(xiàn)eng Y,Xue Q.Analysis of factors shaping codon usage in the mitochondrion genome of Oryza sativa[J].Mitochondrion,2004,4(4):313-320.
[19]Jiang Y,Deng F,Wang H,et al.An extensive analysis on the global codon usage pattern of baculoviruses[J].Arch Virol,2008,153(12):2273-2282.
[20]Wright F.The'effective number of codons'used in a gene[J].Gene,1990,87(1):23-29.
[21]Sharp P M,Li W H.An evolutionary perspective on synonymous codon usage in unicellular organisms[J].J Mol Evol,1986,24(1-2):28-38.
[22]Liu Z Q,Yan L,Wu Z,et al.Cooperation of three WRKY-domain transcription factors WRKY18,WRKY40,and WRKY60 in repressing two ABA-responsive genes ABI4 and ABI5 in Arabidopsis[J].J Exp Bot,2012,63(18):6371-6392.