李秋娥,秦 余,鄭喬木,譚國棟,廖 海,周嘉裕
(西南交通大學(xué) 生命科學(xué)與工程學(xué)院,成都 610031)
植物中所有含苯丙烷骨架的物質(zhì)都是由苯丙烷類合成途徑直接或間接所產(chǎn)生的,該途徑是植物中最重要的次生代謝途徑之一,與植物的生長發(fā)育和抗逆防御反應(yīng)等生理過程息息相關(guān)[1]。苯丙氨酸解氨酶(phenylalanine ammonia-lyase,PAL)將苯丙氨酸非氧化脫氨轉(zhuǎn)化生成反式肉桂酸,然后形成香豆素與綠原酸等中間體,最后轉(zhuǎn)化為異黃酮、木質(zhì)素與生物堿等次生代謝產(chǎn)物[2]。歐芹PAL結(jié)構(gòu)中的Ala-Ser-Gly形成了4-methylidene-imidazole-5-one(MIO)環(huán)化結(jié)構(gòu),與酶的催化反應(yīng)相關(guān),為解析PAL的催化機制與合理化改造奠定了基礎(chǔ)[3]。
PAL是苯丙烷合成途徑的第一個關(guān)鍵酶,其表達強弱與植物抗逆性強弱呈正相關(guān),這也使其成為苯丙烷途徑代謝調(diào)控的重要候選基因之一[4-5]。目前,已從單細(xì)胞藻類[6]、裸子[7]與被子植物[8]等不同類別植物中克隆獲得PAL基因。過表達PAL基因的轉(zhuǎn)基因植物獲得了較高的生長發(fā)育速度與較強的抗逆性,而降低PAL基因的表達導(dǎo)致植物木質(zhì)素合成減少和抗逆性減弱[2, 9]。提高PAL基因的表達效率是開展以PAL基因為靶點代謝調(diào)控的重要基礎(chǔ)。然而,由于物種密碼子的不同,其各自特有的偏好性也有所差別,因此必須分析外源基因密碼子偏好性,選擇適宜宿主來表達外源基因,通過對密碼子進行合理優(yōu)化進而提高外源基因的表達效率[10]。此外,通過對密碼子偏好性的分析,還能夠了解密碼子偏好性形成的機制及不同物種間的遺傳進化關(guān)系[11]。
本文從NCBI下載41條不同植物來源的PAL基因序列,及本課題組獲得的暗紫貝母轉(zhuǎn)錄組中的PAL基因序列,利用CodonW、EMBOSS、SPSS、Origin與MEGA等程序與在線軟件獲得密碼子偏好性、RSCU聚類樹及系統(tǒng)進化樹等信息。通過比較擬南芥、煙草、大腸桿菌和酵母等模式生物體的密碼子,確定最適表達宿主。以上結(jié)果將為開展PAL基因的功能鑒定、植物遺傳進化研究及轉(zhuǎn)基因植物培育奠定理論基礎(chǔ)。
暗紫貝母(Fritillariaunibracteata)轉(zhuǎn)錄組經(jīng)過功能注釋后,獲得暗紫貝母PAL(FuPAL)基因的CDS序列。其余41種不同植物的PAL基因序列來源于GenBank(http://www.ncbi.nlm.nih.gov/genbank/),登錄序號見表1。從密碼子使用數(shù)據(jù)庫(http://www.kazusa.or.jp/codon/)中獲得了模型生物如酵母菌(Saccharomycescerevisiae)和大腸桿菌(Escherichiacoli)的基因組密碼子偏好性數(shù)據(jù)。
表1 PAL的密碼子偏好性參數(shù)
采用EMBOSS在線程序(http://emboss.toulouse.inra.fr.)以及CodonW程序分析PAL基因的編碼序列(coding sequence,CDS)的RSCU、有效密碼子數(shù)(effective number of codon,ENc)、密碼子G/C含量、密碼子第3位G/C含量GC3s、密碼子適應(yīng)指數(shù)(codon adaptation index,CAI)等,并用SPSS分析相關(guān)基因及基因組密碼子使用偏好性聚類。用PAL基因的ENc及GC3s值構(gòu)建散點圖和ENc-GC3s期望曲線:ENc=2+GC3s+29/[GC3s2+(1-GC3s)2]。
利用MEGA-X軟件鄰接法(neighbor-joining)構(gòu)建PAL的系統(tǒng)進化樹,檢驗方法設(shè)為Bootstrpmethod,檢驗次數(shù)設(shè)為1 000,分析其在進化上的親緣關(guān)系。通過聚類樹的比較,分析PAL密碼子偏好性與物種進化之間的聯(lián)系。
RSCU反映的是特定密碼子編碼其對應(yīng)氨基酸時同義密碼子之間的相對使用概率,當(dāng)RSCU>1,說明該密碼子的相對使用頻率較高;當(dāng)RSCU<1,則說明相對使用頻率較低[12]。圖1為根據(jù)42條PAL的RSCU值制作的熱圖,結(jié)果顯示密碼子相對使用度在單子葉植物、雙子葉植物和其他低等植物PAL之間存在較大差異,并且單子葉與其他植物差異存在顯著分界線。單子葉、雙子葉及其他低等植物PAL的優(yōu)勢密碼子(RSCU>1)分別有22、18與10個,且最優(yōu)密碼子分別為CUC、UUG與CUG。由于單子葉植物有ACC、CUC、AUC和GGC等4種優(yōu)勢密碼子的RSCU>2,而其他種類植物優(yōu)勢密碼子的RSCU均小于2,說明單子葉植物的密碼子偏好性強于其他植物[13]。
圖1 PAL的RSCU熱圖
圖2為42條PAL的GC、GC3s、CAI與Enc熱圖,顯示不同植物類群的密碼子偏好性參數(shù)可以被有效聚類。單子葉、雙子葉和其他低等植物PAL的GC平均值分別是58.9%、46.6%和53.2%,GC3s平均值分別為75.4%、45%和59%。結(jié)果表明雙子葉植物PAL偏好AT,而單子葉和其他植物PAL偏好CG。單子葉、雙子葉和低等植物ENc平均值分別為42、51.8、50.4。這說明單子葉植物的PAL基因相比其他植物的PAL基因的密碼子偏好性更強。
圖2 PAL的密碼子偏好性參數(shù)
根據(jù)42條PAL基因的CDS序列構(gòu)建系統(tǒng)進化樹,發(fā)現(xiàn)能夠有效反映PAL基因在進化上的親緣關(guān)系(圖3)。42條PAL基因被分為兩大簇類,第1簇由被子植物組成(葡萄、紫萍例外),第2簇由其他植物組成。第1簇中,單雙子葉植物又分別聚類為兩個小簇。第2簇中,大多數(shù)蕨類與苔蘚植物小立碗蘚聚集。在RSCU聚類(圖4)中PAL基因也可大致分為2大簇。第1簇包含了大多數(shù)雙子葉及少量蕨類、裸子植物;第2簇主要由單子葉、蕨類與苔蘚植物組成,然而單子葉植物玉米和雙子葉植物莧卻單獨形成兩個分支。苔蘚植物小立碗蘚與蕨類問荊靠近,與蕨類退化形成苔蘚類植物的觀點相符。將RSCU聚類與系統(tǒng)進化樹進行比較,表明RSCU聚類反映植物進化的關(guān)系準(zhǔn)確度弱于系統(tǒng)進化樹。類似現(xiàn)象已多次發(fā)現(xiàn),其原因可能源于基因的倍增和重組、水平的基因轉(zhuǎn)移等[14]。
圖3 PAL系統(tǒng)進化樹
圖4 PAL的RSCU值聚類分析
以GC3s為橫坐標(biāo),ENC為縱坐標(biāo)繪制ENc-plot圖,自然選擇或是堿基突變的影響導(dǎo)致密碼子偏好性可以由圖中各點離期望曲線顯示,距期望值近則受堿基突變影響較大,反之受自然選擇影響大[15]。ENc-plot圖(圖5)顯示來源于單子葉植物的暗紫貝母、雜交百合、石蒜、紫萍與鳳梨PAL基因,以及來源于雙子葉植物的擬南芥PAL基因分布于期望曲線附近,表明突變影響是導(dǎo)致這6種PAL基因密碼子偏好性形成的主要因素,而自然選擇影響是導(dǎo)致其余植物密碼子偏好性形成的主要因素。
圖5 PAL基因的ENc-plot分析
將42種PAL密碼子使用頻率與大腸桿菌、酵母、煙草與擬南芥等常用表達宿主的基因組密碼子使用頻率進行比較,計算密碼子適應(yīng)指數(shù),值越大,則說明外源基因在宿主內(nèi)的表達水平越高。結(jié)果顯示,相比煙草,擬南芥更適合作為42種植物PAL的遺傳轉(zhuǎn)化宿主。暗紫貝母、百合、郁金香、異葉天南星、鳳梨、玉米、水稻、西谷椰子、香蕉與紫萍等10種單子葉植物和問荊、江南卷柏和小立碗蘚等低等植物,大腸桿菌是比酵母更適合的外源表達宿主,而酵母是適合其余植物的外源表達宿主。
單雙子葉、低等植物等不同植物來源PAL基因有不同的優(yōu)勢密碼子,提示余下的非優(yōu)勢密碼子可能是密碼改造的重點區(qū)域。裴建軍[16]利用類似思路,對海棲熱袍菌木聚糖酶基因的非優(yōu)勢密碼區(qū)域進行改造,提高了表達效率。Enc值是目前評價密碼子偏好性強弱最具參考價值的參數(shù),Enc分析發(fā)現(xiàn)植物PAL偏好性整體性較弱,這可能導(dǎo)致植物PAL基因的表達較弱,使其成為苯丙烷代謝途徑的關(guān)鍵步驟。Huang等[9]也發(fā)現(xiàn)類似結(jié)果,即植物苯丙烷類化合物與PAL基因的表達強度呈正相關(guān)性。分析同樣來自苯丙烷代謝途徑的COMT、4CL[17]等對G/C偏好性,發(fā)現(xiàn)它們具有相同的G/C偏好性,并且來自單子葉植物與低等植物PAL偏好G/C,雙子葉植物PAL偏好A/T,產(chǎn)生這一現(xiàn)象的原因可能是單、雙子葉植物在進化過程和生存環(huán)境的差異[18]。同時,推測來源于同一代謝途徑的基因可能受到相近的遺傳壓力,從而表現(xiàn)出相近的密碼子偏好性。
ENc-plot分析(圖5)顯示,雙子葉植物(除擬南芥)與低等植物的PAL基因偏好性主要受自然選擇的影響,單子葉植物既受到突變影響又受到自然選擇影響。這一結(jié)果與張孟偉等[19]的觀點一致,他們認(rèn)為自然選擇壓力導(dǎo)致了苯丙氨酸解氨酸密碼子使用偏好性的產(chǎn)生。嚴(yán)子成等[14]發(fā)現(xiàn)COMT基因的密碼子偏好性形成主要受自然選擇影響。對比基于密碼子偏好性的RSCU聚類與基于核酸序列的系統(tǒng)進化樹證實,RSCU聚類在一定程度上能夠反映物種進化的關(guān)系,但和系統(tǒng)進化樹相比其準(zhǔn)確度較弱,推測其原因,可能是PAL核酸序列更易受到自然選擇的影響,而單子葉植物PAL密碼子偏好性受自然選擇與突變的雙重影響。侯惠靜等[20]與嚴(yán)子成等[14]也認(rèn)為基于密碼子偏好性的聚類與物種的真實系統(tǒng)關(guān)系存在少量差異,提示物種分類不僅限于對核苷酸序列分析,也需要結(jié)合不同水平上的綜合結(jié)果才能獲得更準(zhǔn)確的結(jié)果。
通過與模式生物對比,可為不同植物PAL選擇適合的外源表達載體提供參考。例如,大腸桿菌相比酵母更適合作單子葉植物PAL的外源表達載體,已有單子葉植物玉米PAL在大腸桿菌中獲得了成功表達,其重組蛋白可同時催化苯丙氨酸和酪氨酸[21]。相比煙草,擬南芥更適合作為所有植物PAL的遺傳轉(zhuǎn)化系統(tǒng),提示以擬南芥基因組密碼子為參考,對PAL基因進行改造,能夠獲得高效表達,用于植物抗逆育種及PAL基因的功能研究。
通過分析42種PAL基因的密碼子偏好性,發(fā)現(xiàn)各序列的優(yōu)勢密碼子,可通過對該基因非優(yōu)勢密碼區(qū)域進行改造從而提高表達效率,為提高植物基因的表達提供理論指導(dǎo)。通過對比模式生物的密碼子偏好性,確定不同植物PAL基因最適表達宿主,大腸桿菌適合絕大多數(shù)單子葉植物表達,酵母適合雙子葉等植物;擬南芥相比煙草更適合作為所有42種植物PAL基因的遺傳轉(zhuǎn)化宿主,可為PAL的異源表達提供理論依據(jù)。研究結(jié)果可為開展植物PAL基因的功能鑒定、植物遺傳進化研究與轉(zhuǎn)基因植物培育等奠定理論基礎(chǔ)。