摘 要 為了更深入地了解PYL基因的遺傳和進(jìn)化特征,本研究針對(duì)5種山茶屬植物的PYL基因密碼子使用模式進(jìn)行分析?;诠嫉恼憬t山茶、狹葉油茶、‘云抗10號(hào)’、野生大樹茶、‘鐵觀音’基因組數(shù)據(jù)共鑒定出55個(gè)PYL基因。系統(tǒng)發(fā)育結(jié)果顯示,PYL基因可分為4類。共線性分析表明,PYL基因在進(jìn)化過程中受到的選擇壓力較小,主要受到純化選擇的作用。密碼子偏好指數(shù)和同義密碼子使用偏差分析, 59個(gè)同義密碼子的使用存在顯著差異。PYL基因偏好使用GCC、ATC、CTC、ACC、GTC等以G/C結(jié)尾編碼疏水性氨基酸的密碼子。通過ENC plot、PR2-plot、GC3-GC12分析表明,自然選擇在PYL基因進(jìn)化中發(fā)揮了重要作用。在異源表達(dá)時(shí),PYL基因密碼子使用頻率相似性高的受體為最佳受體。本研究揭示PYL基因在山茶屬植物中的密碼子使用特點(diǎn)和進(jìn)化關(guān)系,為深入理解其功能及適應(yīng)性機(jī)制提供了參考依據(jù)。
關(guān)鍵詞 山茶屬;PYL基因;系統(tǒng)發(fā)育分析;共線性分析;密碼子偏好性
山茶屬植物,作為常綠灌木或喬木,主要分布于熱帶和亞熱帶地區(qū)的山地與丘陵地帶,因品種多樣性與顯著的經(jīng)濟(jì)價(jià)值而受到廣泛關(guān)注[1-2]。茶樹、油茶和茶花等均為該屬中的代表性物種。其中,茶葉含有豐富的茶多酚、咖啡堿及茶氨酸等活性成分,這些物質(zhì)具有抗氧化、促進(jìn)認(rèn)知功能及脂肪代謝等重要作用[3-4]。油茶種子則是茶油的主要來源,因其豐富的不飽和脂肪酸和獨(dú)特的健康功效被譽(yù)為“東方橄欖油”[5]。山茶花則因其豐富的花色和持久的花期,在園藝、景觀設(shè)計(jì)和城市綠化等領(lǐng)域展現(xiàn)出較高的觀賞價(jià)值。近年來,隨著基因組學(xué)技術(shù)的飛速發(fā)展,山茶屬植物的基因組研究取得了顯著進(jìn)展。目前,茶樹、油茶和山茶等多個(gè)物種的基因組測(cè)序與組裝工作已經(jīng)完成,這為后續(xù)基因功能研究和遺傳育種提供了堅(jiān)實(shí)的物質(zhì)基礎(chǔ)[6-8]。
PYL基因家族在植物應(yīng)對(duì)環(huán)境脅迫方面發(fā)揮著至關(guān)重要的作用。該基因編碼的蛋白是脫落酸(ABA) 的受體,參與ABA介導(dǎo)的信號(hào)轉(zhuǎn)導(dǎo)途徑[9-10]。通過調(diào)控PYL-PP2C-SnRK2途徑,植物能夠感知ABA、傳遞信號(hào)以及表達(dá)應(yīng)答基因,從而應(yīng)對(duì)如干旱和鹽堿等非生物脅迫[11]。PYL基因家族成員數(shù)量在不同植物中有所不同,從幾個(gè)到幾十個(gè)不等。例如,擬南芥有14個(gè)成員,鵝掌楸5個(gè)[12]、大白菜25個(gè)[13]。這些不同的基因成員在功能上出現(xiàn)分化,發(fā)揮不同的作用。研究表明,過表達(dá)OsPYL/RCAR7基因的玉米,通過降低水分流失和調(diào)整氣孔導(dǎo)度來提高其在干旱環(huán)境中的生存率[14]。胡楊樹中PePYL4受ABA、滲透和脫水處理誘導(dǎo),且過表達(dá)PePYL4顯著增加了ABA敏感性,減小了氣孔孔徑[15]。研究發(fā)現(xiàn)過表達(dá)VaPYL9基因可與VaPCMT互作增強(qiáng)轉(zhuǎn)基因番茄的抗寒能力,過表達(dá)VaPYL9的番茄植物在冷應(yīng)激條件下表現(xiàn)出較高的抗氧化酶活性以及增強(qiáng)清除活性氧的能力[16]。這些研究結(jié)果表明,PYL基因能夠增強(qiáng)植物應(yīng)對(duì)非生物脅迫的耐受力。
在分子生物學(xué)中,密碼子是生物體遺傳信息傳遞的關(guān)鍵組成部分,具有簡(jiǎn)并性。不同的生物體或物種在利用這些密碼子時(shí)表現(xiàn)出一定的偏好性,密碼子偏好性是由多種因素決定的,包括生物體在進(jìn)化過程中基因突變及自然選擇等[17-18]。研究發(fā)現(xiàn),Usutu病毒的基因組構(gòu)成對(duì)其密碼子偏好性具有顯著影響,導(dǎo)致其蛋白質(zhì)編碼序列更傾向于使用G/C末端密碼子[19]。此外,病毒與宿主之間的密碼子使用呈現(xiàn)出一種復(fù)雜的關(guān)系,既存在一致性,又存在拮抗性。病毒的密碼子使用偏好可能受到多個(gè)宿主的共同影響,宿主對(duì)病毒密碼子的選擇和使用偏好起到重要作用[20]。這種偏好性不僅影響生物體的蛋白質(zhì)合成,還在許多其他生命活動(dòng)中起到關(guān)鍵作用,包括基因表達(dá)、蛋白質(zhì)相互作用和進(jìn)化等[21-22]。通過向畢赤酵母中引入額外的稀有tRNA基因拷貝,成功調(diào)整了其密碼子使用偏好,進(jìn)而影響了mRNA的表達(dá)水平,提高了目標(biāo)蛋白的產(chǎn)量[23]。通過研究密碼子偏好性,可以更深入地了解生物體的遺傳特性和表達(dá)模式,提升目的基因的表達(dá)水平和穩(wěn)定性,為基因功能和進(jìn)化研究提供重要參考。
1 材料與方法
1.1 基因篩選
從茶樹信息檔案庫(TPIA) 獲取浙江紅山茶(Camellia chekiangoleosa) 、狹葉油茶(Camellia lanceoleosa)、‘云抗10號(hào)’茶樹(Camellia sinensis ‘Yunkang10’)、野生大樹茶(Camellia sinensis ‘DASZ’)、‘鐵觀音’茶樹(Camellia sinensis ‘Tieguanyin’) 的基因組數(shù)據(jù)。從擬南芥信息資源庫(TAIR) 獲取擬南芥(Arabidopsis thaliana) PYL基因序列。通過BioEdit工具構(gòu)建這5個(gè)山茶屬植物的BLAST數(shù)據(jù)庫,利用擬南芥PYL基因作為查詢序列,期望值設(shè)置為1.0×10-10,搜索出同源的PYL序列。通過序列比對(duì)去除重復(fù)的基因,通過Pfam分析去除不含PF10604結(jié)構(gòu)域的基因。
1.2 序列分析
用ProtParam工具分析PYL基因序列的理化性質(zhì),包括分子質(zhì)量、等電點(diǎn)、不穩(wěn)定指數(shù)、親水性。用codonW軟件計(jì)算同義密碼子第3位的T3s、C3s、A3s、G3s、GC3s含量及同義密碼子相對(duì)使用度、密碼子適應(yīng)指數(shù)、密碼子偏愛指數(shù)、有效密碼子數(shù)。用EMBOSS網(wǎng)站的CUSP程序計(jì)算GC1、GC2、GC3含量。
1.3 系統(tǒng)發(fā)育關(guān)系與共線性分析分析
使用MEGA6軟件,采用Neighbor-Joining算法,設(shè)置Bootstrap為1 000,構(gòu)建擬南芥與這5種山茶屬植物PYL基因的系統(tǒng)發(fā)育樹。導(dǎo)出進(jìn)化樹文件后,用iTOL在線網(wǎng)站做進(jìn)一步地修飾。
使用TBtools生物軟件分別比較鐵觀音茶樹、浙江紅山茶、狹葉油茶PYL基因在基因組內(nèi)與不同基因組之間的進(jìn)化關(guān)系并進(jìn)行可視化。使用TBtools中的Simple Ka/Ks Calculator(NG)計(jì)算基因?qū)Φ腒s值和Ka/Ks比值,利用R腳本繪制Ks密度分布圖,根據(jù)Ks峰值粗略估計(jì)分化時(shí)間(T = Ks/2λ,λ =6.5×10-9)。
1.4 同義密碼子相對(duì)使用度(RSCU)分析
RSCU是基因樣本中某個(gè)密碼子使用頻率與其同義密碼子預(yù)期使用頻率之間的比值,能夠反映基因樣本中密碼子的使用狀況[24]。如果RSCU值為1,則說明該氨基酸的密碼子使用沒有偏好,其選擇是均等或隨機(jī)的;如果RSCU值大于1,則表明其使用頻率相對(duì)較高,反之亦然。PYL基因密碼子RSCU值堆積圖由Origin軟件制作。
1.5 有效密碼子數(shù)(ENC)和ENC plot分析
ENC的取值為20~61,這個(gè)數(shù)值用于衡量同義密碼子的偏好程度。通過以ENC為縱坐標(biāo),GC3s為橫坐標(biāo)用R腳本繪制ENC-GC3s圖,并生成ENC預(yù)期曲線,分析除突變外的其他因素是否參與了密碼子使用模式的形成。
1.6 奇偶性(PR2)分析
為了研究隨機(jī)突變和選擇對(duì)基因密碼子使用的影響,選擇具有4個(gè)簡(jiǎn)并同義密碼子的氨基酸來計(jì)算其第3個(gè)密碼子的ATGC組成,并以A3/(A3 + T3)為縱坐標(biāo),G3/(G3 + C3)為橫坐標(biāo)用R腳本繪制PR2圖[25-26]。
1.7 中性圖(GC3-G12)分析
用GC3表示密碼子第3位的GC含量,GC12表示密碼子第1位和第2位GC含量的平均值。以GC12為縱坐標(biāo),GC3為橫坐標(biāo)用R腳本作圖,并生成回歸線。通過二者的線性關(guān)系分析突變和自然選擇對(duì)密碼子偏好性的影響。
1.8 密碼子使用頻率比較分析
從Codon Usage Database中獲得擬南芥、煙草(Nicotiana tabacum)、毛白楊(Populus trichocarpa)、大腸桿菌(Escherichia coli)、酵母菌(Saccharomyces cerevisiae) 這5個(gè)物種的密碼子使用頻率。用TBtools中的HeatMap繪制密碼子使用頻率比值熱圖。通過比較PYL基因與這些物種之間的密碼子使用頻率差異,來分析其在特定物種中的最佳表達(dá)受體。
2 結(jié)果與分析
2.1 5種山茶屬植物PYL基因基本性質(zhì)及密碼子參數(shù)分析
經(jīng)過對(duì)5種山茶屬植物基因組的篩選,獲得了60個(gè)PYL同源序列。為確保數(shù)據(jù)的準(zhǔn)確性和可靠性,進(jìn)一步進(jìn)行了序列比對(duì),以排除潛在的重復(fù)序列。此外,經(jīng)過保守結(jié)構(gòu)域的篩選,最終鑒定出55個(gè)具有PF10604結(jié)構(gòu)域的PYL基因(表1) 。在5種山茶屬植物中,浙江紅山茶共鑒定出13個(gè)PYL基因,狹葉油茶有12個(gè),‘云抗10號(hào)’茶樹有10個(gè),野生大樹茶有8個(gè),‘鐵觀音’茶樹鑒定出12個(gè)。55個(gè)PYL基因編碼區(qū)的長度呈現(xiàn)出一定的變化范圍,從345 bp到735 bp不等,平均長度為587 bp。根據(jù)氨基酸序列的預(yù)測(cè),PYL蛋白的分子質(zhì)量為13 018.90 ~27 621.78 u,表明PYL蛋白在分子質(zhì)量上也存在較大的差異。此外,PYL蛋白的等電點(diǎn)為4.96~9.58,顯示出其電荷特性的多樣性。其中,等電點(diǎn)大于7的基因有18個(gè),而等電點(diǎn)小于7的基因有37個(gè)。PYL蛋白的不穩(wěn)定指數(shù)為32.06~53.28。這一指數(shù)反映了蛋白質(zhì)序列中氨基酸殘基的不穩(wěn)定性,較高的不穩(wěn)定指數(shù)可能意味著蛋白質(zhì)在細(xì)胞內(nèi)的穩(wěn)定性較低。密碼子適應(yīng)指數(shù)(CAI) 為 0.149~0.288,表明PYL基因在密碼子使用上存在一定的偏好性。較低的CAI值可能意味著這些基因在表達(dá)水平低。密碼子偏愛指數(shù)(CBI) 的值為-0.182~0.266,負(fù)值表明這些PYL基因密碼子偏好性較弱。PYL基因的有效密碼子數(shù)(ENC) 在40.29~56.68,平均為49.63。這一數(shù)值反映了基因在編碼過程中使用的密碼子種類和頻率,而較高的ENC值則可能表示基因在密碼子使用上更為均衡。PYL蛋白的親水性為負(fù)值,表明這些蛋白具有疏水性特性。
2.2 5種山茶屬植物PYL基因系統(tǒng)發(fā)育分析
基于擬南芥、浙江紅山茶、狹葉油茶、‘云抗10號(hào)’、野生大樹茶、‘鐵觀音’的69個(gè)PYL蛋白序列使用鄰接(Neighbor-Joining)法構(gòu)建進(jìn)化樹,揭示了這些蛋白在進(jìn)化過程中的親緣關(guān)系和分類。結(jié)果顯示(圖1),5種山茶屬植物的PYL蛋白可明確分為4類(clusterⅠ至clusterⅣ) ,這表明它們?cè)谶M(jìn)化過程中可能經(jīng)歷了不同的選擇壓力和功能分化。具體而言,clusterⅠ包含10個(gè)成員,clusterⅡ和clusterⅢ分別有10個(gè)和14個(gè)成員,而clusterⅣ則是最大的類群,包含21個(gè)成員。這一分布表明PYL蛋白在5種山茶屬植物中的多樣性和復(fù)雜性,其中clusterⅣ尤為顯著,可能在該類群中發(fā)揮著重要的生物學(xué)功能。值得注意的是,進(jìn)化樹的結(jié)果顯示親緣關(guān)系較近的PYL蛋白序列聚集在同一簇中,表明它們?cè)谶@些物種中可能具有相似的功能或結(jié)構(gòu)特征。同時(shí),不同cluster中PYL蛋白的數(shù)量差異可能與蛋白的冗余性、功能特化或丟失有關(guān),數(shù)量較多的cluster(如clusterⅣ) 可能涉及到更多的生物或非生物響應(yīng)。
2.3 5種山茶屬植物PYL基因共線性與進(jìn)化 分析
以基因組組裝質(zhì)量較好的‘鐵觀音’基因組代表茶樹基因組。如圖2-A~2-C所示,在浙江紅山茶、狹葉油茶和茶樹基因組內(nèi)分別有8、6和7對(duì)PYL旁系同源基因。說明PYL基因在山茶屬物種中經(jīng)歷了不同程度的基因復(fù)制事件。3個(gè)山茶屬物種的Ka/Ks均值在0.24左右,表示非同義突變的速率略高于同義突變的速率。因此可以推斷,PYL基因在山茶屬3個(gè)物種的進(jìn)化過程中受到了純化選擇的作用。為了探究PYL基因在山茶屬物種之間的進(jìn)化關(guān)系,構(gòu)建了浙江紅山茶、茶樹與油茶的共線性關(guān)系圖(圖2-D)。結(jié)果顯示,狹葉油茶與茶樹、茶樹與浙江紅山茶和狹葉油茶與浙江紅山茶之間分別有23、24和27對(duì)PYL直系同源基因,它們的Ka/Ks均值分別為0.296、0.278和0.301,說明PYL基因在這些山茶屬物種之間的進(jìn)化過程中,主要受到純化選擇的影響。如圖2-E所示,狹葉油茶與茶樹、茶樹與浙江紅山茶和狹葉油茶與浙江紅山茶之間的PYL直系同源基因的Ks峰值分別為0.084、 0.037和0.054,推測(cè)它們?cè)谖锓N中的分化時(shí)間分別發(fā)生在 6 496 881.54、2 822 213.08和 4 146 095.38年前。
2.4 5種山茶屬植物PYL基因密碼子RSCU分析[JP]
編碼氨基酸的61個(gè)密碼子中,有59個(gè)是同義密碼子,意味著它們?cè)诓煌纳锘蚧蛑锌赡芫哂胁煌氖褂妙l率。在本研究中,5種山茶屬植物的PYL基因顯示出對(duì)不同密碼子的偏好性,但它們之間也存在相似的密碼子使用模式(圖3)。對(duì)于浙江紅山茶,相對(duì)同義密碼子使用頻率(RSCU) 大于1時(shí),有29個(gè)密碼子被偏好使用,RSCU大于1.6時(shí),有6個(gè)密碼子(CTC、ATC、GTC、TCC、ACC、GCC) 被強(qiáng)烈偏好。狹葉油茶在RSCU>1時(shí)偏好使用27個(gè)密碼子,在RSCU>1.6時(shí)偏好使用5個(gè)密碼子(CTC、ATC、GTC、ACC、GCC以及AGG)?!瓶?0號(hào)’在RSCU>1時(shí)偏好使用28個(gè)密碼子,在RSCU>1.6時(shí)偏好使用6個(gè)密碼子(CTC、ATC、GTC、TCC、ACC、GCC)。野生大樹茶在RSCU>1時(shí)偏好使用26個(gè)密碼子,在RSCU>1.6時(shí)偏好使用6個(gè)密碼子(CTC、ATC、ACC、GCC、AGA、AGG)?!F觀音’在RSCU>1時(shí)偏好使用26個(gè)密碼子,在RSCU>1.6時(shí)偏好使用5個(gè)密碼子(CTC、ATC、GTC、ACC、GCC)。值得注意的是,在這些被強(qiáng)烈偏好的密碼子中,以G/C結(jié)尾的密碼子尤為顯著,包括編碼Alanine的GCC、編碼Isoleucine的ATC、編碼Leucine的CTC、編碼Threonine的ACC以及編碼Valine的GTC等。這可能與山茶屬植物中PYL基因的特定表達(dá)模式或功能需求有關(guān),這種偏好性也可能與轉(zhuǎn)錄和翻譯過程中的效率、準(zhǔn)確性或其他因素相關(guān)。
2.5 5種山茶屬植物PYL基因密碼子ENC plot分析
密碼子ENC plot分析揭示了山茶屬PYL基因在密碼子使用偏好性上的重要特征。在5個(gè)不同物種中,PYL基因的ENC值在不同基因之間存在顯著差異,平均值為49.63,且未發(fā)現(xiàn)ENC值低于35的基因,這表明PYL基因的密碼子使用偏好性普遍較低(圖4)。通過ENC plot分析發(fā)現(xiàn),大多數(shù)基因位于弧線以下,其ENC值低于ENC期望值,可能是在進(jìn)化過程中受到較強(qiáng)自然選擇的結(jié)果。然而,少數(shù)基因如 CchPYL1、 CSPYR1-DASZ、 CSPYL1-TGY和 CSPYL1-YK10的ENC值接近或達(dá)到ENC exp曲線, 這可能表明這些特定基因在密碼子使用上受到除自然選擇之外的其他因素的調(diào)控,如突變、重 組等。
2.6 5種山茶屬植物PYL基因密碼子PR2分析
在無特定密碼子偏好的情況下,堿基A/T與G/C的頻率通常保持均衡狀態(tài)。然而,PR2-plot分析揭示,數(shù)據(jù)點(diǎn)主要集中于G3 /(G3 + C3)< 0.5和A3 /(A3 + T3) < 0.5的特定區(qū)域。具體而言,G3 /(G3 + C3)的值多數(shù)位于0.21至0.58的范圍內(nèi),而A3 /(A3 + T3)的值則主要分布在0.26至0.54的區(qū)間內(nèi)(圖5)。這說明5個(gè)山茶屬物種在第3密碼子的使用上存在明顯的不平衡性,表現(xiàn)為T在第3位密碼子中的出現(xiàn)頻率高于A,而C的頻率則高于G。盡管總體趨勢(shì)如此,但仍存在個(gè)別基因的特例。例如,PYL2基因中堿基A的使用頻率超過T,而在PYL8密碼子中,第3個(gè)位置的堿基G的頻率則高于C。這種堿基使用的不平衡性可能反映了自然選擇在物種進(jìn)化中的主導(dǎo)作用,同時(shí)也不能排除突變等其他潛在影響因素的存在。
2.7 5種山茶屬植物PYL基因密碼子GC3-GC12分析
通過中性圖分析,探討5種山茶屬植物PYL基因中GC12和GC3的關(guān)系(圖6)。分析表明,GC12的含量為43.79%~54.33%,而GC3的含量則為44.14%~74.55%。這些山茶屬植物PYL基因的GC12與GC3之間存在正相關(guān)關(guān)系,R2值為0.44~0.84,同時(shí)回歸斜率也在 0.175~0.309。這說明在山茶屬植物的密碼子使用偏好中,自然選擇和突變可能共同發(fā)揮作用,但自然選擇的影響更為顯著。
2.8 5種山茶屬植物PYL基因密碼子使用頻率分析
對(duì)浙江紅山茶、狹葉油茶、‘云抗10號(hào)’、野生大樹茶以及‘鐵觀音’5種山茶屬植物的PYL基因密碼子使用頻率與擬南芥、煙草、毛白楊、大腸桿菌、酵母菌進(jìn)行了對(duì)比分析(圖7)。結(jié)果表明,與這些常用表達(dá)受體物種相比,各山茶屬植物PYL基因密碼子使用模式存在差異。具體而言,浙江紅山茶PYL基因密碼子使用頻率與參考物種的比值差異≥2.0或≤0.5的密碼子分別有19、21、20、23、23個(gè);狹葉油茶分別為21、24、19、24、23個(gè);‘云抗10號(hào)’分別為21、25、26、24、23個(gè);野生大樹茶分別為20、22、19、24、21個(gè);‘鐵觀音’分別為22、24、26、22、24個(gè)。盡管5種山茶屬植物PYL基因密碼子使用頻率存在一定差異,但仍存在相似性。其中,差異較大的密碼子主要包括GCA、CAC、CTT、CCC、CGT、CGC、CGA、CGG、AGA、ACC和GTC。這些密碼子的高頻或低頻使用可能與山茶屬植物特定的遺傳特征和生理機(jī)制有關(guān)。在異源表達(dá)時(shí),同一物種可根據(jù)密碼子使用頻率相似性選擇最佳受體。浙江紅山茶和擬南芥雖然屬于不同的植物類群,但PYL基因在密碼子使用模式上表現(xiàn)出更高的相似性,可能意味著在該表達(dá)受體轉(zhuǎn)錄和翻譯過程中具有更高的效率[27]。當(dāng)選擇密碼子使用頻率差異較大的作為受體時(shí),可通過對(duì)特定密碼子進(jìn)行優(yōu)化改造,如將編碼Gly的GGG改造為GGA或GGC,將編碼Val的密碼子改造為GTT等,以提高異源表達(dá)效率。
3 討 論
5種山茶屬植物在PYL基因家族成員數(shù)量上存在差異,其中浙江紅山茶最為豐富,擁有13個(gè)成員,而野生大樹茶則較為稀少,僅有8個(gè)成員?;蚪M的組裝水平對(duì)PYL基因鑒定的數(shù)量有直接影響。相比之下,如果使用了如3代測(cè)序及Hi-C組裝技術(shù),基因組組裝的質(zhì)量會(huì)相對(duì)較高,這有助于更準(zhǔn)確地鑒定PYL基因[28]。另外,在基因組注釋過程中,如果設(shè)定的閾值過濾標(biāo)準(zhǔn)較低,那么基因組整體的基因數(shù)量可能會(huì)偏多。盡管山茶屬植物PYL基因家族成員數(shù)量有所不同,但這種差異相對(duì)較小,可能反映了這些植物在適應(yīng)不同生態(tài)環(huán)境和進(jìn)化路徑上的高度保守性。在遺傳學(xué)中,Ka/Ks值是用來衡量非同義突變(Ka)和同義突變(Ks)的比例,它可以用來評(píng)估基因在進(jìn)化過程中的選擇壓力[29-30]。本研究中3個(gè)山茶屬物種PYL旁系同源基因和直系同源基因的Ka/Ks都小于1,這意味著PYL基因在山茶屬物種間的進(jìn)化過程中主要受到純化選擇的作用,保留了重要的生物學(xué)功能,且有害的非同義突變被自然選擇所淘汰。旁系同源基因也反映了基因復(fù)制事件的存在為這些基因可能發(fā)生功能分化和新功能化提供了潛力。此外,3個(gè)山茶屬物種的PYL基因進(jìn)化過程中面臨的進(jìn)化壓力較小且功能相對(duì)保守。山茶屬最近一次的WGD事件發(fā)生在約5 748萬年前[31],本研究中3個(gè)山茶屬植物的PYL直系同源基因的分化時(shí)間較晚,在這次WGD事件發(fā)生之后,可能通過串聯(lián)復(fù)制、逆轉(zhuǎn)錄等機(jī)制增加PYL基因的多樣性[32]。PYL基因通常與植物的ABA信號(hào)轉(zhuǎn)導(dǎo)相關(guān),這是植物應(yīng)對(duì)逆境(如干旱、高鹽等)的一種重要機(jī)制。密碼子偏好性主要反映了基因在轉(zhuǎn)錄和翻譯過程中的使用偏好,某些密碼子可能由于與tRNA的豐度匹配得更好,而被更頻繁地使用,從而提高蛋白質(zhì)的合成效率[33]。在山茶屬植物中,如果PYL基因表現(xiàn)出特定的密碼子偏好性,這可能意味著該基因在特定的生理或環(huán)境條件下有更高效的表達(dá)[34]。如果密碼子偏好性影響了PYL基因的表達(dá)水平或調(diào)控模式,那么這可能會(huì)進(jìn)一步影響山茶屬植物對(duì)逆境的響應(yīng)和適應(yīng)能力。
本研究對(duì)5種山茶屬植物的PYL基因進(jìn)行RSCU分析,探討其密碼子偏好性及其在不同物種間的變化。結(jié)果揭示山茶屬植物PYL基因在密碼子使用模式上具有一定的保守性,多數(shù)偏好使用的密碼子以G/C結(jié)尾,如GCC、ATC、CTC、ACC、GTC等。這與烏頭屬植物中的研究結(jié)果相契合,暗示了親緣關(guān)系相近的物種在密碼子使用模式上可能存在一定的相似性[35]。然而,在同一物種的不同基因間,密碼子使用偏好性呈現(xiàn)出差異性,這種差異可能與基因的結(jié)構(gòu)、轉(zhuǎn)錄和翻譯機(jī)制等因素密切相關(guān)[36-37]。例如,茶樹NRT1.1基因與PYL基因在密碼子使用偏好性上表現(xiàn)出一定的相似性,但兩者在具體偏好程度和密碼子種類的選擇上有所不同[38]。相比之下,茶樹LOX基因的密碼子偏好性較弱,偏好使用以A/T結(jié)尾的密碼子,這可能與LOX基因作為環(huán)境誘導(dǎo)型基因的特性有關(guān)[39]。此外,先前關(guān)于擬南芥、油菜等植物的HSP20基因密碼子偏好性的研究結(jié)果顯示,這些基因的密碼子偏好性相對(duì)較弱,偏好使用以A/T結(jié)尾的密碼子,如AGG、CCA、GAA、GAG、GCT、GUG、UCT和UGA等[40]。這些密碼子使用模式的差異可能反映了不同基因在進(jìn)化過程中對(duì)環(huán)境適應(yīng)性和基因功能優(yōu)化的不同策略。
密碼子偏好性的形成是一個(gè)復(fù)雜的過程,受到多種因素的共同影響,其中GC含量是一個(gè)關(guān)鍵因素。基因GC含量的差異會(huì)導(dǎo)致密碼子使用模式的顯著變化。以‘云抗10號(hào)’為例,其基因組整體的GC含量較低,分別為GC1 22.58%、GC2 40.00%、GC3 40.00%,均低于50%,因此其密碼子使用更偏好于以A/T結(jié)尾的密碼子[41]。然而,在其PYL基因中,GC含量分布卻與之不同,具體表現(xiàn)為GC1 54.57%、GC2 40.71%、GC3 60.96%,相對(duì)較高。這種GC含量的差異導(dǎo)致了PYL基因更傾向于使用GC結(jié)尾的密碼子,進(jìn)而影響了其密碼子偏好性。ENC(有效密碼子數(shù)) 作為一個(gè)評(píng)估基因或基因組密碼子使用隨機(jī)性程度的指標(biāo),其值在山茶屬植物的PYL基因中普遍較高。這一現(xiàn)象不僅在本研究的山茶屬植物中發(fā)現(xiàn),類似的高ENC值也在茶樹NRT1.1、LOX基因[38-39],以及茄科植物番茄、辣椒的PIF基因[42]中觀察到。這種較高的ENC值反映了這些基因的密碼子使用偏好性相對(duì)較弱,可能與不同物種間的保守性及基因表達(dá)緊密關(guān)聯(lián)[21,43]。然而,其具體的分子機(jī)制目前仍不清楚。為了深入理解密碼子偏好性的形成因素,結(jié)合ENC與GC3的作圖分析揭示了山茶屬PYL基因在密碼子使用上可能受到的自然選擇、突變或其他因素的影響。PR2-plot分析和GC3-GC12分析則進(jìn)一步證實(shí)了自然選擇和突變?cè)谏讲鑼僦参锩艽a子使用偏好中的共同作用。盡管這種現(xiàn)象在藏紅花、十字花科植物中均有報(bào)道[40,44],但具體的影響因素和機(jī)制可能因物種而異,仍需要進(jìn)一步的研究和探索。
同義密碼子使用頻率與表達(dá)受體使用頻率呈現(xiàn)出差異性,這種差異對(duì)基因表達(dá)水平產(chǎn)生顯著影響。以大腸桿菌為例,其同義密碼子間的翻譯效率差異可高達(dá)6倍,這種差異很可能與首選密碼子與同源tRNA的豐度有關(guān)[45-46]。同時(shí),異源表達(dá)基因與最優(yōu)受體物種通常展現(xiàn)出相似的密碼子偏好,這種偏好在選擇表達(dá)受體物種時(shí)具有重要作用[22,27]。因此,山茶屬PYL基因可通過密碼子使用頻率來選擇最優(yōu)表達(dá)受體,或?qū)Π谢蛑械暮币娒艽a子進(jìn)行修改,從而優(yōu)化翻譯系統(tǒng)并提高基因表達(dá)效率。需要指出的是,密碼子優(yōu)化并非簡(jiǎn)單的密碼子替換過程。它需要考慮多種因素,如宿主細(xì)胞的密碼子使用頻率、mRNA的穩(wěn)定性、啟動(dòng)子序列、蛋白折疊和修飾等[47]。如果其他環(huán)節(jié)存在問題,那么整體的異源表達(dá)效率仍然可能受到限制。密碼子優(yōu)化在實(shí)際應(yīng)用中還需要考慮到成本、時(shí)間等因素。如果優(yōu)化策略過于復(fù)雜或成本過高,那么其實(shí)際應(yīng)用就會(huì)受到限制。為了更準(zhǔn)確地評(píng)估和優(yōu)化異源表達(dá)效率,需要針對(duì)具體宿主進(jìn)行深入的試驗(yàn)研究和數(shù)據(jù)分析。
4 結(jié) 論
本研究對(duì)5種山茶屬植物的55個(gè)PYL基因進(jìn)行了系統(tǒng)鑒定,結(jié)果顯示PYL基因在這些物種中具有高度保守性,且進(jìn)化過程中主要受到純化選擇的作用。通過進(jìn)一步的密碼子使用分析,發(fā)現(xiàn)PYL基因偏好使用編碼疏水性氨基酸的以G/C結(jié)尾的密碼子,這種偏好可能受到自然選擇的影響更為顯著。此外,不同物種PYL基因在異源表達(dá)過程中可能具有不同的最佳受體。這些結(jié)果對(duì)于深入理解山茶屬植物PYL基因的功能及其進(jìn)化歷程具有重要意義。
參考文獻(xiàn) Reference:
[1] 廖初琴,繆紳裕.山茶屬植物傳統(tǒng)及現(xiàn)代分類的研究進(jìn)展[J].熱帶農(nóng)業(yè)科學(xué),2023,43(7):37-45.
LIAO CH Q,MIAO SH Y.Advances in the traditional and modern classification of Camellia[J].Chinese Journal of Tropical Agriculture,2023,43(7):37-45.
[2]閔天祿.山茶屬山茶組植物的分類,分化和分布[J].云南植物研究,1998,20(2):127-148.
MIN T L.The classification,differentiation and distribution of the Genus Camellia Sect.Camellia[J].Acta Botanica Yunnanica,1998,20(2):127-148.
[3]TANG G,MENG X,GAN R,et al.Health functions and related molecular mechanisms of tea components:an update review[J].International Journal of Molecular Sciences,2019,20(24):6196.
[4]申 雯,黃建安,李 勤,等.茶葉主要活性成分的保健功能與作用機(jī)制研究進(jìn)展[J].茶葉通訊,2016,43(1):8-13.
SHEN W,HUANG J A,LI Q,et al. The research progress of health care function and mechanism of the active ingredients in tea [J].Journal of Tea Communication,2016, 43(1):8-13.
[5]ZHU M,SHI T,CHEN Y,et al.Prediction of fatty acid composition in Camellia oil by 1H NMR combined with PLS regression[J].Food Chemistry,2019,279:339-346.
[6]GAO Q J,T W,LI F D,et al.TPIA2:an updated tea plant information archive for Camellia genomics[J].Nucleic acids research,2023,52(D1):D1661-D1667.
[7]WEN G,SHI X,LIN W,et al.Chromosome-level genome of Camellia lanceoleosa provides a valuable resource for understanding genome evolution and self-incompatibility[J].The Plant Journal :for Cell and Molecular Biology,2022,110(3):881-898.
[8]TENG S,BIN H,MENG X,et al.The reference genome of Camellia chekiangoleosa provides insights into Camellia evolution and tea oil biosynthesis[J].Horticulture Research,2022,9(1):3692-3702.
[9]PARK S Y,F(xiàn)UNG P,NISHIMURA N,et al.Abscisic acid inhibits PP2Cs via the PYR/PYL family of ABA-binding START proteins[J].Science,2009,324(5930):1068-1071.
[10] HIROAKI F,VISWANATHAN C,AMERICO R,et al.In vitro reconstitution of an abscisic acid signalling pathway[J].Nature,2009,462(7273):660-664.
[11]CUTLER S R,RODRIGUEZ P L,F(xiàn)INKELSTEIN R R, et al.Abscisic acid:emergence of a core signaling network[J].Annual Review of Plant Biology,2010,61(1):651-679.
[12]XIN W,JUN Z,XIN C, et al.PYL family genes from liriodendron chinense positively respond to multiple stresses[J].Plants(Basel,Switzerland),2023,12(14):2609.
[13]FU X X,TANG J,ZHANG C W,et al. Genome-wide characterization and expression analysis of the abscisic acid receptors PYR/PYL/RCAR(PYLs) in Chinese cabbage during abiotic stresses[J].Russian Journal of Plant Physiology,2022,69(2):29.
[14]KI H J,YEONHEE L,BEOMGI K,et al.Overexpressing OsPYL/RCAR7 improves drought tolerance of maize seedlings by reducing stomatal conductance[J].Agriculture,2022,12(12):2140.
[15]QING L,CHAO S,YUE Z,et al.PePYL4 enhances drought tolerance by modulating water use efficiency and ROS scavenging in Populus[J].Tree Physiology,2022,43(1):102-117.
[16]GUO N,GUO L,WEI M,et al.Overexpression VaPYL9 improves cold tolerance in tomato by regulating key genes in hormone signaling and antioxidant enzyme[J].BMC Plant Biology,2022,22(1):344.
[17]ADAMS M J,ANTONIW J F.Codon usage bias amongst plant viruses[J].Archives of Virology,2004,149(1):113-135.
[18]KANAYA S,YAMADA Y,KINOUCHI M,et al.Codon usage and tRNA genes in eukaryotes:correlation of codon usage diversity with translation efficiency and with CG-dinucleotide usage as assessed by multivariate analysis[J].Journal of Molecular Evolution,2001,53(4/5):290-298.
[19]JIANG Z,YA X,ZHE Z,et al.A comprehensive analysis of Usutu virus(USUV) genomes revealed lineage-specific codon usage patterns and host adaptations[J/OL].Frontiers in Microbiology,2023,13:1-15.https://doi.org/10.3389/fmicb.2022.967999.
[20]JITOBAOM K,PHAKARATSAKUL S,SIRIHONGTHONG T,et al. Codon usage similarity between viral and some host genes suggests a codon-specific translational regulation[J].Heliyon,2020,6(5):e03915.
[21]LIU X Y,LI Y,JI K K,et al.Genome-wide codon usage pattern analysis reveals the correlation between codon usage bias and gene expression in Cuscuta australis[J].Genomics,2020,112(4):2695-2702.
[22]CHANEY J L,CLARK P L.Roles for synonymous codon usage in protein biogenesis[J].Annual Review of Biophysics,2015,44(1):143-166.
[23]ZHANG S,LIN R,CUI L,et al.Alter codon bias of the P.pastoris genome to overcome a bottleneck in codon optimization strategy development and improve protein expression[J].Microbiological Research,2024,282:127629.
[24]SHARP P M,TUOHY M F,MOSURSKI K R.Codon usage in yeast:cluster analysis clearly differentiates highly and lowly expressed genes[J].Nucleic Acids Research,1986,14(13):5125-5143.
[25]SUEOKA N.Intrastrand parity rules of DNA base composition and usage biases of synonymous codons[J].Journal of Molecular Evolution,2004,40(3):318-325.
[26]SUEOKA N.Translation-coupled violation of parity rule 2 in human genes is not the cause of heterogeneity of the DNA G+C content of third codon position[J].Gene,1999,238(1):53-58.
[27]MENG Z,CHUN F T,JI S S.A preliminary analysis of synonymous codon usage in poplar species[J].Journal of Plant Physiology and Molecular Biology,2007,33(4):285-293.
[28]XIA E H,TONG W,WU Q,et al.Tea plant genomics: achievements,challenges and perspectives[J].Horticulture research,2020,7(1):7.
[29]HURST L D.The Ka/Ks ratio:diagnosing the form of sequence evolution [J].Trends Genet,2002,18(9):486.
[30]SONG J,GAO Z H,HUO X M,et al.Genome-wide identification of the auxin response factor(ARF) gene family and expression analysis of its role associated with pistil development in Japanese apricot(Prunus mume Sieb.et Zucc) [J].Acta Physiol Plant,2015,37(8):145.
[31]SHEN T F,HUANG B,XU M,et al.The reference genome of Camellia chekiangoleosa provides insights into Camellia evolution and tea oil biosynthesis[J].Horticulture Research,2022,9:uhab083.
[32]KONG H,LANDHERR L L,F(xiàn)ROHLICH M W,et al. Patterns of gene duplication in the plant SKP1 gene family in angiosperms:evidence for multiple mechanisms of rapid gene birth[J].The Plant Journal,2007,50(5):873-885.
[33]GUSTAFSSON C,GOVINDARAJAN S,MINSHULL J.Codon bias and heterologous protein expression[J].Trends in Biotechnology,2004,22(7):346-353.
[34]SWATI T,GORAKHANATH P K,NIRANJANI G, et al.Codon usage provide insights into the adaptation of rice genes under stress condition[J].International Journal of Molecular Sciences,2023,24(2):1098.
[35]MEI Y,JIA L,WAN Y,et al. Analysis of codon usage patterns in 48 Aconitum species[J].BMC Genomics,2023,24(1):703.
[36]PRESNYAK V,ALHUSAINI N,CHEN Y H, et al.Codon optimality is a major determinant of mRNA stability[J].Cell,2015,160(6):1111-1124.
[37]STOLETZKI N,EYRE A.Synonymous codon usage in Escherichia coli:selection for translational accuracy[J].Molecular Biology & Evolution,2007,24(2):374.
[38]胡振民,萬 青,李 歡,等.茶樹CsNRT1.1基因密碼子使用特性分析[J].江蘇農(nóng)業(yè)學(xué)報(bào),2019,35(4):896-903.
HU ZH M,WAN Q,LI H,et al.Analysis of codon usage features of CsNRT1.1 gene in Camellia sinensis[J] Jiangsu Journal of Agricultural Sciences,2019,35(4):896-903.
[39]周子維,常笑君,游芳寧,等.茶樹脂肪氧合酶(LOX)基因家族成員的分子進(jìn)化及密碼子偏好性分析[J].中國農(nóng)業(yè)科技導(dǎo)報(bào),2017,19(12):43-51.
3WciikGNGmHGpHSyjizM6ZQzjqh/87QZwpX9EoFqNPg=ZHOU Z W,CHANG X J,YOU F N,et al.Analysis of molecular evolution and codon bias of lipoxygenase(LOX) gene family in tea tree[J].Journal of Agricultural Science and Technology,2017,19(12):43-51.
[40]JI H,LIU J,CHEN Y,et al.Bioinformatic analysis of codon usage bias of HSP20 genes in four Cruciferous species[J].Plants,2024,13(4):468.
[41]王占軍,李 豹,姜行舟,等.兩種茶樹全基因組數(shù)據(jù)的密碼子偏好性比較分析[J].中國細(xì)胞生物學(xué)學(xué)報(bào),2018, 40(12):2028-2039.
WANG ZH J,LI B,JIANG X ZH,et al.Comparative analysis of the codon preference patterns in two species of Camellia sinensis based on genome data[J].Chinese Journal of Cell Biology,2018,40(12):2028-2039.
[42]陳 悅,仇學(xué)文,李 鈺,等.辣椒和番茄PIF基因家族密碼子偏好性分析[J].分子植物育種,2023,21(17):5602-5610.
CHEN Y,QIU X W,LI Y,et al.Codon bias analysis of PIF gene family in pepper and tomato[J] Molecular Plant Breeding,2023,21(17):5602-5610.
[43]王芳平,李 宏.密碼對(duì)的使用與基因組進(jìn)化[J].生物物理學(xué)報(bào),2007,23(3):176-184.
WANG F P,LI H.Codon pairs usage and genome evolution[J] Acta Biophysica Sinica,2007,23(3):176-184.
[44]SHAMSUN N,SURUCHI G,WAQAS A,et al. Environmental implications of codon usage bias in Crocus sativus and its impact on host pathogen interactions[J].Rhizosphere,2024,29:100819.
[45]FRUMKIN I,LAJOIE J,GREGG J,et al.Codon usage of highly expressed genes affects proteome-wide translation efficiency[J].Proceedings of the National Academy of Sciences of the United States of America,2018,115(21):E4940-E4949.
[46]SORENSEN M,KURLAND C,PEDERSEN S.Codon usage determines translation rate in Escherichia coli[J].Journal of Molecular Biology,1989,207(2):365-377.
[47]MERT K,F(xiàn)IDAN E.Effect of codon optimization and promoter choice on recombinant endo-polygalacturonase production in Pichia pastoris[J/OL].Enzyme and Microbial Technology,2020,139:1-9.https://doi.org/10.1016/j.enzmictec.2020.109589.
Codon Preference Analysis of PYL Genes in Five Camellia Species
LIU Dandan,WANG Leigang,WU Qiong,SUN Minghui,JIAO Xiaoyu,RUAN Xu and WANG Wenjie
(Tea Research Institute,Anhui Academy of Agricultural Sciences,Hefei 230001,China)
Abstract To further elucidate the genetic and evolutionary characteristics of PYL genes,this study analyzed the codon usage patterns of five Camellia species.Based on the published genome data,55 PYL genes were identified across Camellia chekiangoleosa,Camellia lanceoleosa,Camellia sinensis ‘Yunkang 10’,DASZ,and ‘Tieguanyin’.The phylogenetic analysis revealed that PYL genes could be classified into four groups,exhibiting high conservation.The collinearity analysis indicated that PYL genes were subjected to minimal selection pressure during evolution and mainly influenced by purifying selection.The analysis of codon preference index and synonymous codon usage bias demonstrated significant differences among 59 synonymous codons.The PYL genes showed a preference for codons ending with G/C,such as GCC,ATC,CTC,ACC,GTC,which were associated with encoding hydrophobic amino acids.ENC plot,PR2-plot,and GC3-GC12 analysis suggested that natural selection play an important role in the evolution of PYL genes.The receptor with high similarity in codon usage frequency of PYL genes is considered optimal for heterologous expression analysis.This study provides valuable insights into the codon usage characteristics and evolutionary relationships of PYL genes in Camellia species,contributing to a deeper understanding of their functional and adaptive mechanisms.
Key words Camellia L; PYL genes; Phylogenetic analysis; Collinearity analysis; Codon usage bias
Received 2024-03-25 Returned 2024-05-21
Foundation item National Natural Science Foundation of China(No.U23A20213); Tea Industry Technology System of Anhui Province(No.AHCYJSTX-11); Achievement Transformation of Anhui Academy of Agricultural Sciences(No.2024YL041).
First author LIU Dandan,female,master,assistant research fellow.Research area:the stress resistance mechanism of tea plants.E-mail:1653082943@qq.com
Corresponding author WANG Wenjie,male,research fellow.Research area:tea plant genetics and breeding.E-mail:391590137@qq.com
(責(zé)任編輯:史亞歌 Responsible editor:SHI Yage)
基金項(xiàng)目:國家自然科學(xué)基金(U23A20213);安徽省茶葉產(chǎn)業(yè)技術(shù)體系(AHCYJSTX-11);安徽省農(nóng)業(yè)科學(xué)院成果轉(zhuǎn)化項(xiàng)目(2024YL041)。
第一作者:劉丹丹,女,碩士,助理研究員,從事茶樹抗逆機(jī)制研究。E-mail:1653082943@qq.com
通信作者:王文杰,男,研究員,從事茶樹遺傳育種研究。E-mail:391590137@qq.com