王星淇,石小保,林芳柯,孫雪麗,劉范,田娜,郝向陽,程春振
(福建農(nóng)林大學(xué)園藝學(xué)院,福建福州 350002)
遺傳轉(zhuǎn)化是研究基因功能和植物遺傳改良的重要手段。在特定植物的遺傳轉(zhuǎn)化體系不夠成熟或研究一個(gè)植物的基因在其他植物或微生物中的作用時(shí),常常會(huì)用到異源表達(dá)系統(tǒng)。然而不同生物對密碼子的使用有一定的偏好性,這使得在異源表達(dá)某一基因時(shí)有時(shí)會(huì)出現(xiàn)基因在異源表達(dá)系統(tǒng)中不能成功翻譯出相應(yīng)蛋白的情況。因此,在進(jìn)行基因克隆、基因功能鑒定、異源表達(dá)系統(tǒng)選擇以及改進(jìn)和優(yōu)化提高基因表達(dá)水平等方面的研究時(shí),密碼子偏好性分析顯得極為重要[1]。
非洲菊是世界五大鮮切花之一[2],具有極高的經(jīng)濟(jì)價(jià)值。然而非洲菊抗逆性較弱,容易受病害和環(huán)境變化的影響[3],提高非洲菊的抗逆性對非洲菊產(chǎn)業(yè)的健康發(fā)展意義重大。木質(zhì)素生物合成途徑在植物抗逆反應(yīng)中發(fā)揮著重要作用[4]。肉桂醇脫氫酶(C A D)是木質(zhì)素生物合成途徑最早被研究的酶之一,其在木質(zhì)素單體生物合成的最后一步反應(yīng)過程中催化肉桂醛還原成相應(yīng)的木質(zhì)素單體的前體[5-6],在3種木質(zhì)素的合成過程中都起到了非常重要的作用。CAD基因自1973年被發(fā)現(xiàn)以來,國內(nèi)外學(xué)者從其組成結(jié)構(gòu)、生物性質(zhì)、基因克隆及遺傳轉(zhuǎn)化等方面展開了系列研究,并取得了一定的進(jìn)展。目前有關(guān)非洲菊CAD基因的研究較少,該研究基于前期獲得的非洲菊轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行了CAD基因篩選,并進(jìn)行了密碼子偏好性分析,旨在為今后該基因的功能研究、生物信息學(xué)分析和木質(zhì)素代謝研究奠定基礎(chǔ)。
基于實(shí)驗(yàn)室前期獲得的非洲菊轉(zhuǎn)錄組數(shù)據(jù),篩選包含全長CDS的CAD基因。5個(gè)常見模式生物:擬南芥(Arabidopsis thaliana)、煙草(Nicotiana sylvestris)、番茄(Solanum lycopersicum)、大腸桿菌(Escherichia coli)以及酵母菌(Saccharomyces cerevisiae)基因組密碼子偏好性數(shù)據(jù)下載自Codon Usage Database(http://www.kazusa.or.jp/codon/)[7]。
通過CodonW軟件計(jì)算非洲菊CAD基因的ENC和CAI值,并通過使用EMBOSS在線網(wǎng)站(http://www.bioinformatics.nl/emboss-explorer/) 分析計(jì)算得到非洲菊CAD基因密碼子第1、2、3位的GC含量(GC1s、GC2s、GC3s)與總GC含量。再使用CodonW軟件獲得非洲菊CAD基因的RSCU值。
利用軟件Origin8.0進(jìn)行中性繪圖分析、ENC-plot分析和 PR2分析(PR2-bias plot analysis),具體步驟參照屈蒙蒙等的方法[8]。
從非洲菊轉(zhuǎn)錄組數(shù)據(jù)中篩選獲得5條具有完整CDS的CAD基因,分別命名為CAD1、CAD2、CAD3、CAD4、CAD5。通過CodonW軟件計(jì)算它們的ENC和CAI值,利用EMBOSS在線分析得它們的總GC含量以及位于密碼子不同位置的GC含量,整理得表1。由表1可以看出,5個(gè)非洲菊CAD基因的ENC值相差不大,介于53.37~58.07,平均值為55.77,說明非洲菊CAD基因密碼子的使用偏好性較弱。從CAI指數(shù)看,非洲菊CAD基因CAI值介于0.191~0.225,平均值為0.210,遠(yuǎn)小于1,進(jìn)一步說明了非洲菊CAD基因的密碼子偏好性較弱??侴C含量為44.16%~50.23%,平均值為46.46%;GC1s為48.46%~55.71%,平均值為52.56%;GC2s為37.05%~40.67%,平均值為39.16%;GC3s為44.08%~57.94%,平均值為47.67%,由此推測非洲菊CAD基因家族編碼氨基酸時(shí)使用較多的A或T,G或者C的偏好性較弱,且偏向于以A或T結(jié)尾。
通過CodonW軟件分析后得到5個(gè)非洲菊CAD基因的RSCU值,取平均值后整理得到表2。偏好性較強(qiáng)的密碼子(RSCU>1)有32個(gè),其中以G或者C結(jié)尾的密碼子有12個(gè),以A或者U(T)結(jié)尾的密碼子有20個(gè),說明以A或者U(T)結(jié)尾的密碼子出現(xiàn)的頻率較高而G或者C的偏好性較弱,與GC含量值預(yù)測結(jié)果一致。此外,無相對使用度極大的特定同義密碼子,表明該家族成員對密碼子的偏好性較為平均,無特別偏好的密碼子。
表2 非洲菊CAD基因同義密碼子的使用頻率
采用 SPSS17.0 進(jìn)行GC1s、GC2s、GC3s、GC和ENC兩兩Pearson關(guān)聯(lián)分析,由表3可得GC1s、GC2s、GC3s、GC和ENC之間無顯著相關(guān)性(P<0.05為顯著,P<0.01為極顯著),說明非洲菊CAD基因第1、2和3位上的堿基組成無特別的相似關(guān)系。
表3 非洲菊CAD基因不同位置的密碼子GC含量及ENC的相關(guān)性
圖1 5個(gè)非洲菊CAD基因的密碼子使用偏好性中性繪圖
由圖1可得,5個(gè)非洲菊CAD基因較為分散,且分布在對角線兩側(cè),大部分都距離對角線較為接近。G1s、G2s與G3s無明顯的線性關(guān)系,與Pearson分析結(jié)果一致。
由圖2分析可得,5個(gè)非洲菊CAD基因的ENC值距離ENC的期望曲線都較遠(yuǎn),無顯著規(guī)律。而由圖3分析可得,這5個(gè)非洲菊CAD基因A3/(A3+T3)與G3/(G3+C3)的比值大部分與0.5偏離較大,這表明該基因編碼氨基酸時(shí)除受突變壓力的影響外,外界因素與自然壓力影響較大。且從圖3的整體布局上看,縱坐標(biāo)主要集中于小于0.5的位置,橫坐標(biāo)也主要集中在小于0.5的位置,這說明密碼子第3位上T(U)的含量大于A的含量,第3位上C的含量大于G的含量。
目前,國內(nèi)外對非洲菊遺傳轉(zhuǎn)化體系的研究仍較為少見[9-10],非洲菊的遺傳轉(zhuǎn)化體系的研究也較為不成熟[11-13],因此找尋非洲菊合適的異源表達(dá)系統(tǒng)和模式受體為基因進(jìn)行相關(guān)的功能驗(yàn)證以及為遺傳轉(zhuǎn)化體系的研究奠定基礎(chǔ)仍然非常重要。非洲菊CAD基因家族成員密碼子平均使用頻率分別與模式植物擬南芥(At)、煙草(Nt)、番茄(Sl)、大腸桿菌(Ec)、酵母菌(Sc)基因組密碼子使用偏性的數(shù)據(jù)比較的匯總表如表4所示,與大腸桿菌使用偏性相差較大的密碼子有18個(gè),而與酵母菌使用偏性相差較大的密碼子僅有10個(gè),說明酵母菌真核表達(dá)系統(tǒng)較適合成為非洲菊CAD的異源表達(dá)系統(tǒng);番茄、煙草、擬南芥與非洲菊CAD基因使用頻率相差較大的密碼子分別是10、7、6,由此推測擬南芥是作為非洲菊CAD基因遺傳轉(zhuǎn)化研究的更為理想的受體。
圖3 5個(gè)非洲菊CAD基因的PR2分析
表4 非洲菊CAD基因與5個(gè)常見模式生物基因組密碼子使用頻率的比較
通過對5個(gè)非洲菊CAD基因的ENC和CAI值和總GC含量以及位于密碼子不同位置的GC含量的分析可得,非洲菊CAD基因的密碼子偏好性較弱,基因表達(dá)水平總體偏低。該基因編碼氨基酸時(shí)使用較多的A或T,G或者C的偏好性較弱,且偏向于以A或T結(jié)尾。同時(shí),通過RSCU分析發(fā)現(xiàn),非洲菊CAD基因密碼子使用偏性較強(qiáng)的密碼子有32個(gè),其中以G或者C結(jié)尾的密碼子有12個(gè),以A或者U(T)結(jié)尾的密碼子有20個(gè)。以上結(jié)果與雙子葉植物更偏好使用A或T(U)結(jié)論一致[14]。
非洲菊CAD基因位于第1、2、3位的密碼子無明顯的線性關(guān)系,A3/(A3+T3)與G3/(G3+C3)的比值大部分與中間值0.5偏離較大,可推測該基因編碼氨基酸時(shí)除受突變壓力的影響外,外界因素與自然壓力影響較大。
目前,非洲菊基因原核表達(dá)多使用大腸桿菌原核表達(dá)系統(tǒng)[15-17],而該研究發(fā)現(xiàn)酵母菌真核表達(dá)系統(tǒng)更適合作為非洲菊CAD基因的異源表達(dá)系統(tǒng)。此外,該研究還發(fā)現(xiàn)擬南芥是非洲菊CAD基因異源植物表達(dá)最為理想的植物受體,該結(jié)論可對非洲菊CAD基因遺傳轉(zhuǎn)化研究以及功能驗(yàn)證提供參考。