楊 平
(南京曉莊學(xué)院,江蘇南京211171)
HKT家族是一個大的與K+吸收相關(guān)的家族,大多數(shù)植物中都可能存在HKT轉(zhuǎn)運(yùn)蛋白,首個高等植物HKT家族基因是在小麥中被發(fā)現(xiàn)的[1]。Horie等[2]在2001年分別分離了日本晴水稻(Oryza sativa L ssp japonica cv Nipponbare)和亞洲水稻(Oryza sativa L indica cv Pokkali)中的OsHKT2;1,這2個基因的氨基酸序列完全相同,與小麥TaHKT有66%的同源性。OsHKT2;1定位于根系皮層和內(nèi)皮層內(nèi)的微管組織中,而葉片中主要存在于圍繞微管系統(tǒng)的線性排列的細(xì)胞中,OsHKT2;1的表達(dá)差異可能與水稻鹽耐和鹽敏品種有很大的關(guān)系[3]。
同義密碼子的使用偏好性與諸多生命活動過程如蛋白質(zhì)的合成等有密切聯(lián)系,因此,對同義密碼子使用偏好性的研究具有重要的生物學(xué)意義。目前,對密碼子使用偏好性的研究,主要集中在對已知全基因組序列的低等生物和模式生物的基因組密碼子使用研究,對單一功能基因家族的密碼子用法研究還比較少。
本研究旨在通過分析水稻HKT基因家族全長編碼框密碼子的使用特性,為深入研究其進(jìn)化、表達(dá)調(diào)控機(jī)制等提供重要理論依據(jù)。
從 SWIWW_POROT(http://expasy.org/sprot/)和 NCBI(http://www.ncbi.nih.gov/)獲得水稻 HKT家族基因序列。序列名稱及NCBI對應(yīng)登錄號為:OsHKT1:AB061311;OsHKT2:AB061313;OsHK T2;2:EF373552;OsHKT3:AJ491820;OsHKT4:AJ 491816;OsHKT6:AJ491818;OsHKT7:AJ491853;OsHKT8:DQ148410;OsHKT1;5:HQ162137;OsH KT9:AJ491855。
利用 CodonW(http://codonw.source forge.net/)和CUSP(http://bioweb.pasteur.fr)軟件分析水稻HKT家族基因密碼子使用特性的參數(shù)包括:氨基酸數(shù)(L_aa),同義氨基酸數(shù)(number ofsynonymous codons(L_sym)),氨基酸組分指數(shù)(平均親水性值(Gravy)),芳香性值(aromaticity,縮寫為Aroma),A3s,T3s,G3s,C3s(同義密碼子在第 3 位上腺嘌呤、胸腺嘧啶、鳥嘌呤和胞嘧啶的出現(xiàn)頻率),基因的G+C含量(GC%),編碼同一氨基酸的同義密碼子的第3位的GC含量(GC3s),有效密碼子數(shù)(effective number of codon,ENC),最優(yōu)密碼子使用頻率(frequency of optimal codons,F(xiàn)OP),密碼子偏愛指數(shù)(Codon Bias Index,CBI),密碼子使用的相對概率(Relative Synonymous Codon Usage,RSCU),密碼子適應(yīng)指數(shù)(CAI)等。
運(yùn)用SPSS 17.0統(tǒng)計軟件進(jìn)行密碼子組成和使用偏好性各參數(shù)間相關(guān)性的分析。
表1所列的是水稻HKT基因家族氨基酸數(shù)(L_aa),同義氨基酸數(shù)(L_sym),氨基酸組分指數(shù)(平均親水性值) 和芳香性值,A3s,T3s,G3s,C3s基因的G+C含量(GC%),GC3s,有效密碼子數(shù)(ENC),CAI(密碼子適應(yīng)指數(shù)),GC含量等的情況。水稻HKT基因家族GC含量范圍為41.2%~64.2%,平均GC含量為50.27%,Wang等[4]對水稻全基因組的基因GC含量分布進(jìn)行分析,發(fā)現(xiàn)水稻基因GC含量分布為雙峰,以60%為界把水稻基因分為高GC含量和低GC含量2組基因。水稻HKT基因家族中有3個基因(OsHKT7,OsHKT8和OsHKT1;5)的含量高于60%,為高GC含量基因,說明這3個基因在整體編碼框區(qū)域內(nèi)都傾向于使用鳥嘌呤(G)和胞嘧啶(C)這2種核苷酸。利用CUSP軟件分析水稻HKT基因家族編碼區(qū)GC含量為50.26%,略低于整個基因組GC 含 量 55.26%(http://www.kazusa.or.jp/codon/)。GC1(48.24%),GC2(39.98%)含量都低于整個基因組 GC1(58.19%)和 GC2(45.97%)的含量,GC3的含量(62.55%)與整個基因組GC3含量(61.61%)基本一致。Gravy值為正值,表明水稻HKT基因家族成員全為疏水性蛋白質(zhì)。
有效密碼子數(shù)(effective number of codons,ENC or Nc)是檢測單個基因密碼子非均衡使用的偏好程度,取值范圍為20(每個氨基酸只使用一個密碼子)到61(各個密碼子被均衡使用),其值越低,表明該基因的密碼子使用偏好性越強(qiáng)。Jiang等[5]將ENC取值35作為偏性強(qiáng)弱的區(qū)分標(biāo)準(zhǔn)。水稻HKT基因家族ENC取值范圍為38.22~56.25,多數(shù)大于50,說明水稻HKT基因家族密碼子偏性較弱。
密碼子適應(yīng)指數(shù)(codon adaption index,CAI)是對大豆基因編碼區(qū)同義密碼子與密碼子最佳使用相符合程度的檢測,其取值范圍在0~1之間。水稻HKT基因家族CAI取值范圍為0.184~0.221,說明水稻HKT基因家族的密碼子偏性較弱。
表1 水稻HKT基因家族密碼子使用特性
水稻HKT基因家族密碼子使用特性各參數(shù)之間相關(guān)分析表明(表2),密碼子適應(yīng)指數(shù)(CAI)與最優(yōu)密碼子使用頻率(FOP)、密碼子偏愛指數(shù)(CBI)均呈極顯著正相關(guān)(P<0.01),有效密碼子數(shù)(ENC)與同義密碼子第3位堿基含量(C3s,G3s)、最優(yōu)密碼子使用頻率(FOP)、密碼子偏愛指數(shù)(CBI)、GC含量、GC3s均呈極顯著負(fù)相關(guān)(P<0.01),與同義密碼子第3位堿基含量(T3s,A3s)呈極顯著正相關(guān)(P<0.01),這表明同義密碼子第3位的堿基含量直接影響著基因的表達(dá)水平和密碼子使用偏好性程度的大小。
表2 水稻HKT基因家族密碼子使用特性各參數(shù)之間的相關(guān)系數(shù)
水稻HKT基因家族相對同義密碼子的使用度(RSCU)對應(yīng)性分析結(jié)果顯示,所給出的9個RSCU主坐標(biāo)軸可以解釋所有基因氨基酸使用特性總變異的25.93%,水稻HKT基因前4個軸對變異方差的貢獻(xiàn)分別為68.62%,12.18%,8.01%和6.51%,其余各軸對變異方差的貢獻(xiàn)更小。各基因密碼子在前兩軸的分布如圖1所示。
從圖1可以看出,水稻以A和T結(jié)尾的密碼子全部位于第1軸的右側(cè),以G和C結(jié)尾的密碼子除了 TTG,CAG,ATC,AAC和 AAG外,其余位于第1軸的左側(cè)。對應(yīng)分析中的第1軸與GC含量、ENC的相關(guān)系數(shù)分別為-0.997和0.990,均極顯著相關(guān)(P<0.01),表明堿基組成和基因表達(dá)水平都是影響水稻HKT基因家族同義密碼子使用偏好性的主要因素。
以ENC為縱坐標(biāo),GC3s為橫坐標(biāo),探討各基因密碼子使用偏性情況,并檢測堿基組成對密碼子偏性的影響(圖2),密碼子偏性僅受到突變影響的基因沿標(biāo)準(zhǔn)曲線分布(在無選擇壓力的情況下)或落在標(biāo)準(zhǔn)曲線附近,密碼子偏性受到選擇影響的基因家族應(yīng)該落在標(biāo)準(zhǔn)曲線下方較遠(yuǎn)的位置。水稻HKT基因家族落在標(biāo)準(zhǔn)曲線下方,而且ENC隨GC3s含量的增加而減少,且與GC3s含量之間呈極顯著負(fù)相關(guān)(P<0.01)(表2),表明除堿基組成偏性外,自然選擇等其他因素對密碼子的使用可能也有重要影響。
密碼子使用的相對概率(RSCU值)作為衡量密碼子偏好性的標(biāo)準(zhǔn)被該領(lǐng)域研究者普遍接受,并廣泛應(yīng)用。當(dāng)某一密碼子的RSCU值等于1時,表明它在編碼使用時出現(xiàn)的次數(shù)與期望值相等;當(dāng)其值大于1時,表明它的出現(xiàn)次數(shù)大于期望值,表現(xiàn)為使用偏好;反之則使用偏少。若某一密碼子RSCU值大于1,而其他編碼相同氨基酸的密碼子RSCU值均小于1,則表明該密碼子在編碼使用上具有較強(qiáng)的偏好性。
利用CodonW軟件計算水稻HKT基因的RSCU值(表3),RSCU>1的密碼子多以G或C結(jié)尾,說明密碼子以G或C結(jié)尾的出現(xiàn)頻率較高,是基因組偏愛的密碼子;以A或T結(jié)尾的密碼子RSCU值多數(shù)小于1,說明以A或T結(jié)尾的密碼子出現(xiàn)的頻率較低,是基因組非偏愛的密碼子。
表3 水稻HKT基因家族相對同義密碼子使用度
本研究對水稻HKT基因家族GC含量,有效密碼子數(shù),密碼子適應(yīng)指數(shù),氨基酸數(shù)(L_aa),同義氨基酸數(shù)(L_sym),平均親水性值(Gravy),芳香性值 (Aroma),A3s,T3s,G3s,C3s,GC3s,最優(yōu)密碼子使用頻率,密碼子偏愛指數(shù),密碼子使用的相對概率(RSCU),密碼子適應(yīng)指數(shù)等進(jìn)行了分析,綜合分析表明,水稻HKT基因家族的RSCU>1的密碼子多以G或C結(jié)尾,說明密碼子以G或C結(jié)尾的出現(xiàn)頻率較高,是基因組偏愛的密碼子。
不同物種的不同基因?qū)γ艽a子的偏好特性各有不同。劉慶坡等[7]通過對單、雙子葉植物基因組密碼子偏好特性的比較研究,結(jié)果表明,雙子葉植物偏向使用以A或T結(jié)尾的密碼子,而單子葉植物則偏向使用以C或G結(jié)尾的密碼子。本文的研究結(jié)果與其一致,水稻HKT基因家族偏向使用以C或G結(jié)尾的密碼子。
影響密碼子偏性的因素多種多樣。單子葉植物基因組的GC含量在同義密碼子使用偏性的產(chǎn)生過程中起著決定性的作用,同義密碼子偏性強(qiáng)烈的基因往往偏愛使用C或G結(jié)尾的密碼子,且第3位密碼子的變異往往是密碼子偏好性發(fā)生變化的決定性因素[8]。本研究通過分析參數(shù)間的相關(guān)性關(guān)系也得到同樣的結(jié)論,水稻HKT基因家族同義密碼子第3位的堿基含量直接影響著基因的表達(dá)水平和密碼子使用偏好性程度的大小。
[1]Schachtman D P,Schroeder JI.Structure and transportmechanism ofa high-affinity potassium uptake transporter from higher plants[J].Nature,1994,370:655-658.
[2] Horie T,Yoshida K,Nakayama H,et al.Two types of HKT transporterswith different properties of Na+and K+transport in Oryza sativa[J].The Plant Journa,2001,27:129-138.
[3]KaderM A,Seidel T,Golldack D,etal.Expressionsof OsHKT1,OsHKT2,and OsVHA are differentially regulated under NaCl stress in salt-sensitiveand salt-tolerantrice(Oryza sativa L.)cultivars [J].Journal of Experimental Botany,2006,57:4257-4268.
[4]Wang H C,Hickey D A.Rapid divergence of codon usage patternswithin the ricegenome[J].BMCEvol Biol,2007,7(Suppl 1):S6.
[5]Jiang Y,Deng F,Wang H L.An extensive analysis on the global codon usage pattern of baculoviruses[J].Archives of Virology,2008,153:2273-2282.
[6] Wright F.The effective number of codons used in a gene[J].Gene,1990,87(1):23-29.
[7]劉慶坡,馮英.20個物種同義密碼子偏性的比較分析[J].西北農(nóng)林科技大學(xué)學(xué)報:自然科學(xué)版,2004,32(7):67-71.
[8]張曉峰,薛慶中.水稻和擬南芥NBS-LRR基因家族同義密碼子使用偏好的比較[J].作物學(xué)報,2005,31(5):596-620.