楊克彬 單雪萌 史晶晶 朱成磊 高志民
(國際竹藤中心竹藤資源基因科學(xué)與基因產(chǎn)業(yè)化研究所,國家林業(yè)和草原局/北京市竹藤科學(xué)與技術(shù)重點(diǎn)開放實驗室,北京 100102)
丙烷類代謝初始途徑是以苯丙氨酸為原料,由苯丙氨酸解氨酶(phenylalnine ammonialyase,PAL)、肉桂酸4-羥化酶(cinnamic acid 4-hydroxylase,C4H)和4-香豆酸酯:輔酶a連接酶(4-coumarate:CoA ligase,4CL)3個酶介導(dǎo)催化的復(fù)雜的生化反應(yīng),并合成一系列植物所必需的物質(zhì),如木質(zhì)素單體、植物激素、類黃酮和苯丙烯類等[1-2]。4CL作為該途徑的最后一種酶,催化幾種羥基肉桂酸轉(zhuǎn)化為相應(yīng)的輔酶A(coenzyme A,CoA)酯,從而控制碳通過苯丙烷代謝途徑進(jìn)入特定生物合成途徑[3-4]。木質(zhì)素作為丙烷類代謝途徑的重要產(chǎn)物之一,是次生壁的主要成分,其在細(xì)胞壁的結(jié)構(gòu)完整性、水分運(yùn)輸和保護(hù)植物免受病原體感染等方面發(fā)揮著關(guān)鍵作用。在4CL氨基酸序列中存在2個高度保守的基序,即SSGTTGLPKGV和GEICIRG,負(fù)責(zé)識別、結(jié)合和催化底物形成相應(yīng)的CoA酯[5]。根據(jù)參與物質(zhì)合成途徑的不同,可將4CL分為兩大類,其中Ⅰ類參與木質(zhì)素單體的合成途徑,而Ⅱ類主要參與黃酮類化合物合成的酶促反應(yīng)[6-7]。在擬南芥中,Ⅰ類的At4CL1、At4CL2和At4CL4編碼的同工酶參與木質(zhì)素生物合成,而At4CL3激活p-香豆酸作為查耳酮合成酶的底物,負(fù)責(zé)類黃酮代謝[8-9];大豆Gm4CL3/4基因調(diào)控類黃酮的生物合成,且在根和上胚軸的表達(dá)較高[10]。
4CL作為木質(zhì)素生物合成過程中關(guān)鍵的限速酶,已在數(shù)十種植物中分離并鑒定,如擬南芥[11]、小立碗蘚[12]、毛果楊[13]水稻[14]和柑橘[15]等。竹子作為我國最具特色的非木質(zhì)林產(chǎn)品資源,在當(dāng)下木材資源短缺的情況下,竹材的優(yōu)良材性使其成為木材潛在的重要替代品,倍受關(guān)注。竹材的材性與其木質(zhì)素含量密不可分,研究人員已經(jīng)從木質(zhì)素的生物合成途徑角度開展研究,包括參與竹子木質(zhì)素生物合成的CoCOMT[16]、PePAL1[17]、C4H[18]和PeLAC[19]等基因。木質(zhì)素生物合成的每個基因家族都包括多個成員,然而對于竹子中4CL基因家族的了解并不全面。因此,本研究以毛竹(Phyllostachysedulis)為對象,在全基因組水平篩選與鑒定4CL基因的基礎(chǔ)上,系統(tǒng)分析其基因結(jié)構(gòu)、蛋白保守結(jié)構(gòu)域和進(jìn)化關(guān)系,并通過毛竹轉(zhuǎn)錄組數(shù)據(jù)構(gòu)建的基因表達(dá)譜測序(RNA-seq)分析4CL基因的組織表達(dá)特異性,結(jié)合筍木質(zhì)素組織化學(xué)染色和實時熒光定量PCR(quantitative real-time PCR,qPCR)技術(shù),研究隨著竹筍高度的增加,其木質(zhì)化程度和4CL基因的表達(dá)模式,以期為揭示4CL在竹子木質(zhì)素生物合成和木質(zhì)化中的功能提供參考。
以江西南昌(28°45′58″N,115°45′39″E,海拔399.0 m)野外生長良好的毛竹作為試驗材料,分別采集不同生長階段竹筍(0.2、1.0、3.0和6.7 m)基部為樣品。樣品經(jīng)液氮處理后,存儲于-80℃冰箱中,用于提取RNA。此外,取相同樣品固定在標(biāo)準(zhǔn)固定液(formalinacetic acid alcohol,FAA)中保存于4℃冰箱,用于樹脂切片。
1.2.1 毛竹4CL基因的鑒定 以模式植物擬南芥(Arabidopsisthaliana)和水稻(Oryzasativa)中4CL基因作為種子序列,在毛竹基因組數(shù)據(jù)庫進(jìn)行BLAST獲取其中4CL的同源基因候選序列。運(yùn)用BLASTN和BLASTP進(jìn)一步對候選基因逐條比對分析,并對候選基因編碼的氨基酸序列進(jìn)行保守結(jié)構(gòu)域完整性鑒定。最終獲得毛竹4CL家族基因成員,并編號。采用在線工具ProtParam(http://web.expasy.org/protparam/)分析毛竹4CL基因編碼蛋白的基本理化性質(zhì)。利用Plant-mPLoc(http://www.csbio.sjtu.edu.cn/bioinf/plant-multi/#)軟件進(jìn)行蛋白亞細(xì)胞定位預(yù)測。
1.2.2 毛竹4CL基因的生物信息學(xué)分析 運(yùn)用GSDS(http://gsds.cbi.pku.edu.cn/)對毛竹4CL基因的結(jié)構(gòu),即內(nèi)含子/外顯子結(jié)構(gòu)進(jìn)行分析[20];運(yùn)用在線軟件MEME(http://meme.nbcr.-net/meme/intro.html)對毛竹4CL的保守蛋白基序進(jìn)行分析,軟件參數(shù):motifs最大數(shù)量10;長度為6~300,其他參數(shù)為默認(rèn)值。運(yùn)用DNAMAN軟件對毛竹4CL蛋白氨基酸序列進(jìn)行多重序列比對后進(jìn)行保守結(jié)構(gòu)分析,并運(yùn)用在線軟件Pfam(ttps://www.ebi.ac.uk/Tools/hmmer/)和WEBLOGO(http://weblogo.berkeley.edu/logo.cgi)對其保守結(jié)構(gòu)域進(jìn)行功能注釋并構(gòu)建Seqlogo圖[21-22]。
為了探索毛竹4CL的進(jìn)化關(guān)系,利用毛竹、水稻、二穗短柄草(Brachypodiumdistachyon)、擬南芥、大豆(Glycinemax)和毛果楊(Populustrichocarpa)等植物的4CL氨基酸序列,通過MEGA 7.0內(nèi)置的ClustalW程序?qū)?CL家族成員的氨基酸序列進(jìn)行多重序列比對,并采用鄰接法(neighbor-joining method,NJ)構(gòu)建系統(tǒng)進(jìn)化樹(使用系統(tǒng)默認(rèn)值),校驗參數(shù)Bootstrap值設(shè)置為重復(fù)1 000次。其中,水稻、二穗短柄草、擬南芥、大豆和毛果楊的4CL氨基酸序列分別從Rice genome annotation database、Arabidopsisgenome TAIR release 10.0和Phytozome數(shù)據(jù)庫下載[23]。
1.2.3 毛竹4CL基因的組織特異性表達(dá)分析 從NCBIShort Read Archive(SRA)下載毛竹不同發(fā)育階段的鞭、根、筍、葉片、鞘和芽的轉(zhuǎn)錄組數(shù)據(jù)[24],獲取其中4CL基因的FPKM(每千個堿基的轉(zhuǎn)錄每百萬映射讀取的碎片值,fragments per kilobase of exon model per million fragments)值,用以表示基因的表達(dá)豐度。為方便統(tǒng)計,對每個表達(dá)數(shù)值取以2為底數(shù)的對數(shù)(Log2),使用 Matrix2png(http://www.chibi.ubc.ca/matrix2png/)繪制基因表達(dá)熱圖。
1.2.4 PEG樹脂切片分析 參照Yang等[25]的試驗方法對FAA固定液中的竹筍樣品進(jìn)行包埋處理,經(jīng)過不同濃度的聚乙二醇(polyethylene glycol,PEG)逐級脫水后,包埋于PEG 4000中。用Leica RM2165旋轉(zhuǎn)切片機(jī)(Leica,德國)進(jìn)行切片,厚度為10μm;用0.05%甲苯胺藍(lán)(toluidine blue O,TBO)對展片的切片于80℃染色3 min,并拍照觀察。
1.2.5 毛竹4CL基因在筍不同發(fā)育時期中的表達(dá)模式分析 利用Primer Premier 5.0軟件設(shè)計毛竹4CL家族基因特異性引物,由上海生工生物合成工程技術(shù)服務(wù)公司合成(表1)。采用Trizol(Promega,美國)法提取毛竹各樣品的總RNA,用DNaseⅠ(TaKaRa,日本)除去基因組DNA后,使用反轉(zhuǎn)錄試劑盒(Promega,美國)合成cDNA第一鏈,操作參照相關(guān)試劑盒說明書進(jìn)行。試驗在qTOWER熒光定量PCR儀(耶拿,德國)進(jìn)行,反應(yīng)體系(10μL):2×SYBRⅡGreen 1 Master 5.0 μL、正向和反向引物各0.2μL(10μmol·L-1)、cDNA模板0.8μL、ddH2O 3.8μL。兩步法進(jìn)行PCR,擴(kuò)增程序:95℃預(yù)變性6 min;95℃變性10 s,62℃退火10 s,45個循環(huán)。以PeNTB為內(nèi)參基因[26],采用2-ΔΔCT法分析基因的相對表達(dá)量[27]。
表1 qPCR所用引物Table1 Primers used in qPCR
利用擬南芥和水稻同源基因序列,從毛竹基因組數(shù)據(jù)庫中經(jīng)BLAST分析,共鑒定獲得15個4CL家族成員,均具有完整的保守結(jié)構(gòu)域,依次命名為Pe4CL1~Pe4CL15。通過ProtParam工具,對Pe4CLs編碼蛋白質(zhì)的長度、分子量及等電點(diǎn)等理化性質(zhì)進(jìn)行分析,結(jié)果顯示,Pe4CLs的氨基酸長度為520~671 aa,對應(yīng)分子量為55 044.15~72 445.28 Da;Pe4CLs的蛋白不穩(wěn)定系數(shù)為33.41~51.43,其中7個成員的不穩(wěn)定系數(shù)小于40屬于穩(wěn)定蛋白,其余為不穩(wěn)定蛋白;平均親水系數(shù)為-0.135~0.207,等電點(diǎn)為5.00~8.72,且除Pe4CL4和Pe4CL14外,其余氨基酸的等電點(diǎn)均小于7.00;經(jīng)過亞細(xì)胞定位預(yù)測,15個Pe4CLs均被定位在過氧物酶體上(表2)。
基因結(jié)構(gòu)分析表明,15個Pe4CLs均具有內(nèi)含子,數(shù)量為2~5個;大部分成員含有5個或6個外顯子(圖1)。Pe4CLs的基因結(jié)構(gòu)差異明顯,結(jié)構(gòu)具有多樣性,具體表現(xiàn)在內(nèi)含子的大小和位置存在較大差異。
根據(jù)序列的相似性和系統(tǒng)進(jìn)化,毛竹的4CL基因家族被分為2個亞家族(A和B),分別含有7個和8個Pe4CLs成員(圖2),通過MEME在線軟件分析Pe4CLs中的保守基序,研究其中基序組成的多樣性與保守性。由圖2可知,在Pe4CLs中共鑒定出10個保守基序,命名為Motif 1~Motif 10。Motif 1~3、Motif 5和Motif 7為15個Pe4CLs所共有,其中,Motif 1和Motif 5分別包含4CL特征保守域SSGTTGLPKGV和GEICIRG,而Motif 10只存在于亞家族A中。大多數(shù)同亞類的成員具有相同的Motif組成,例如亞家族A中各成員均含有全部的10個基序,表明這些成員可能具有相似蛋白功能。
為了研究Pe4CLs的保守結(jié)構(gòu)域序列特征,對其氨基酸序列進(jìn)行多重序列比對分析其保守結(jié)構(gòu)域,結(jié)果顯示,從蛋白質(zhì)的N端到C端,依次發(fā)現(xiàn)了以下5個保守結(jié)構(gòu)域:BoxⅠ(SSGTTGLPKGV)、BoxⅡ(QGYGMTE)、Box Ⅲ (GEICIRG)、Box Ⅳ(GWLHTGD)和BoxⅤ(VDRLKELIK)(圖3)。BoxⅠ和BoxⅢ為2個已知的4CL特征保守域,負(fù)責(zé)識別、結(jié)合和催化反應(yīng)底物,在毛竹中具有很高的保守性,但也存在差異位點(diǎn),如BoxⅢ4號位的半胱氨酸(Cys)是最保守的氨基酸位點(diǎn),直接參與酶催化反應(yīng),而在毛竹中少數(shù)Pe4CLs變?yōu)榱松彼?Trp)和苯丙氨酸(Phe)。雖然BoxⅡ、BoxⅣ和BoxⅤ各自的功能尚不明確,但是通過在線軟件Pfam分析保守結(jié)構(gòu)域發(fā)現(xiàn)BoxⅠ~BoxⅤ共同組成了腺苷-1-磷酸(adenosine 5′-monophephate,AMP)結(jié)合結(jié)構(gòu)域,行使?;鵆oA合成酶功能,通過產(chǎn)生AMP參與到苯丙烷代謝途徑中。
表2 Pe4CLs蛋白的理化性質(zhì)和亞細(xì)胞定位預(yù)測Table2 Putative basic physical and chemical characteristics,and subcellular localization of Pe4CLs
為了確定Pe4CLs與其他物種已知的4CL蛋白之間的進(jìn)化關(guān)系,對毛竹、水稻、二穗短柄草、擬南芥、大豆和毛果楊的4CL氨基酸序列進(jìn)行了多重比對,并利用MEGA 7.0軟件構(gòu)建了系統(tǒng)發(fā)育樹。結(jié)果顯示,6個物種的4CL成員被分成兩個分支(A和B),且分支A中涵蓋6個物種的4CL成員,而分支B只包含毛竹的8個成員(Pe4CL1/2/4/6/7/11/14/15)(圖4)。進(jìn)一步分析表明,分支A中的4CL又分為3個類型,即TypeⅠ~TypeⅢ[14],其中TypeⅠ僅包含一個毛竹成員(Pe4CL3),與Os4CL2聚類在一起;TypeⅡ中不包含毛竹成員,全都來自雙子葉植物;TypeⅢ全是來自單子葉植物毛竹、水稻和二穗短柄草的4CL,且毛竹與水稻的距離較近,而與擬南芥、大豆和毛果楊的距離較遠(yuǎn)。
由圖5可知,15個Pe4CLs在毛竹不同組織和不同生長時期有著不同程度的表達(dá),表達(dá)豐度存在明顯差異。7個基因(Pe4CL1/2/5/8/10/13/15)在各組織中均檢測到表達(dá),它們可能作為組成型基因在毛竹整個生長發(fā)育過程中發(fā)揮重要作用,其中Pe4CL8、Pe4CL10和Pe4CL15在各個組織中相對表達(dá)量均較高,其余8個基因具有組織特異性,即只在特定組織中檢測到表達(dá)且相對表達(dá)量較高,如Pe4C3在發(fā)育成熟的根和葉片中較其他組織具有較高的相對表達(dá)量。在不同生長階段的筍中,大多數(shù)Pe4CLs的相對表達(dá)量具有相同的變化趨勢,即隨著竹筍高度的增加呈先升高后降低的趨勢,且在1.0 m或3.0 m處達(dá)到峰值;同一基因在同一高度竹筍不同部位的相對表達(dá)量則表現(xiàn)為中下部高于尖部。此外,Pe4CL2在0.2 m竹筍中的相對表達(dá)量高于其他高度,且尖部的相對表達(dá)量高于中下部。
毛竹筍切片TBO染色結(jié)果表明,隨著竹筍高度的增加,維管束的染色加深區(qū)域明顯逐漸擴(kuò)大,說明其木質(zhì)化逐漸增強(qiáng),尤其是后生木質(zhì)部導(dǎo)管周圍的厚壁細(xì)胞木質(zhì)化程度最高(圖6)。
由圖7可知,12個Pe4CLs在不同生長高度竹筍中均呈現(xiàn)差異表達(dá),隨著竹筍高度的增加,除了Pe4CL6的表達(dá)下調(diào)外,其他基因均不同程度地上調(diào),且具有兩種變化趨勢。具體表現(xiàn)為Pe4CL3和Pe4CL15的相對表達(dá)量持續(xù)上調(diào),在6.7 m竹筍中Pe4CL3和Pe4CL15的相對表達(dá)量分別是0.2 m筍中的82倍和3倍;其他9個基因(Pe4CL1/2/5/8/9/10/11/13/14)表現(xiàn)出類似的表達(dá)趨勢,即先升高后降低,峰值出現(xiàn)在1.0 m或3.0 m竹筍中,且它們在峰值處的相對表達(dá)量均較0.2 m竹筍均上調(diào)10倍以上,其中Pe4CL9的最高,上調(diào)幅度達(dá)到3 862倍。然而,這9個基因在6.7 m竹筍中的表達(dá)量均較峰值明顯下降,幅度超過85%。Pe4CL6的相對表達(dá)量呈現(xiàn)完全不同的趨勢,即與0.2m竹筍中的相對表達(dá)量相比,該基因在1.0 m竹筍中的表達(dá)量急劇下調(diào)(約為0.2 m竹筍的2%),并在之后不同高度的竹筍中保持相對穩(wěn)定的低水平。此外,本研究還對另外3個基因(Pe4CL4/7/12)進(jìn)行了定量分析,但由于設(shè)計不出特異引物而未獲得理想的結(jié)果。
木質(zhì)素含量對竹材的機(jī)械強(qiáng)度起著決定性作用,4CL是木質(zhì)素生物合成的關(guān)鍵酶。因此,開展毛竹4CL基因的結(jié)構(gòu)特征和表達(dá)模式分析,對于揭示其在竹材形成過程中的作用具有重要的參考價值。本研究從毛竹中鑒定出15個具有完整結(jié)構(gòu)域的4CL家族成員,而在雙子葉植物擬南芥和楊樹中,或在單子葉植物水稻和二穗短柄草中,4CL成員均不多于5個,這可能與毛竹進(jìn)化過程中經(jīng)歷了染色體加倍事件有關(guān)[28]。進(jìn)一步分析發(fā)現(xiàn),BoxⅠ和BoxⅢ作為底物結(jié)合區(qū)域的絕對保守結(jié)構(gòu)域,在Pe4CLs中某些位點(diǎn)并不保守,說明它們進(jìn)化過程中功能發(fā)生了分化,可識別與結(jié)合不同的反應(yīng)底物,尤其是BoxⅢ的Cys殘基的突變可能造成它們功能弱化或者失去催化羥基肉桂酸的功能,這與楊樹和水稻等物種中的4CL類似[10,29-30]。
本研究中,系統(tǒng)進(jìn)化分析發(fā)現(xiàn),A亞家族中所有Pe4CLs(7個)均與水稻的4CL聚類到較近的分支,分布在TypeⅠ和TypeⅢ中,而與雙子葉的4CL成員距離較遠(yuǎn)。對Os4CL1/3/4/5體外表達(dá)重組蛋白活性研究表明,4-香豆酸和阿魏酸是水稻木質(zhì)素單體生物合成的主要底物[14,31],Os4CL2則參與類黃酮的形成[31]。隨著水稻莖稈的生長,其中木質(zhì)素含量增加,木質(zhì)化程度加強(qiáng),Os4CL1/2/3/4/5呈現(xiàn)不同的表達(dá)模式,但轉(zhuǎn)錄水平Os4CL3>Os4CL5>Os4CL1>Os4CL4>Os4CL2,其中抑制Os4CL3的表達(dá),水稻木質(zhì)素含量顯著降低[14]。TypeⅢ中Pe4CL5和Pe4CL10與Os4CL3、Pe4CL8與Os4CL4、Pe4CL9和Pe4CL12與Os4CL5、Pe4CL13與Os4CL1分別聚類到較近的分支,推測毛竹4CL可能與對應(yīng)的水稻4CL具有相似的功能,參與竹子木質(zhì)素生物合成;而Pe4CL3在TypeⅠ中與Os4CL2聚類到一起,Pe4CL3可能具有參與類黃酮形成的功能。
基因的表達(dá)模式是其生物學(xué)功能的具體表現(xiàn)形式之一。本研究轉(zhuǎn)錄組表達(dá)譜熱圖結(jié)果顯示,7個基因(Pe4CL1/2/5/8/10/13/15)在各組織中均檢測到表達(dá),表明這些基因不僅參與竹筍成熟過程中木質(zhì)化進(jìn)程,同時也可能參與到其他組織的生長過程中,尤其是Pe4CL8、Pe4CL10和Pe4CL15在各個組織中的高表達(dá)說明它們對這些組織的形成均具有重要作用,但是否直接參與竹稈成熟過程的木質(zhì)化,需要進(jìn)一步驗證。其他8個基因如Pe4CL12在籜片中、Pe4CL14在葉片中特異表達(dá),而Pe4CL4在葉片、葉鞘和籜片均表達(dá)較高,說明它們可能參與特定組織細(xì)胞壁的木質(zhì)化過程。此外,現(xiàn)有轉(zhuǎn)錄組結(jié)果中毛竹根系中尚不存在明顯的與木質(zhì)素含量相關(guān)的Pe4CLs表達(dá)模式。
本研究中,隨著竹筍高度的增加,木質(zhì)化程度也逐漸加強(qiáng),這與本試驗前期研究結(jié)果一致[20]。同時,切片結(jié)果顯示隨著竹筍高度的增加,木質(zhì)化的速度減緩,3.0 m和6.7 m竹筍纖維束的染色范圍和深淺變化不明顯。隨竹筍高度的增加,11個Pe4CLs的轉(zhuǎn)錄水平顯著上調(diào),且有9個基因的相對表達(dá)量呈現(xiàn)先升高后下降的變化趨勢,這與切片顯示的筍木質(zhì)化程度變化相一致,其原因可能是6.7 m竹筍較4.0 m竹筍中基因表達(dá)量下降導(dǎo)致其木質(zhì)化程度減緩。而Pe4CL3和Pe4CL15的相對表達(dá)量持續(xù)增加,說明這兩個基因?qū)S木質(zhì)化的作用持續(xù)增強(qiáng)。以上結(jié)果說明,Pe4CLs通過表達(dá)參與到毛竹木質(zhì)素的生物合成中,基因上調(diào)的表達(dá)模式表明它們可能是木質(zhì)素合成的正向調(diào)控因子,這與前人對模式植物的研究結(jié)果相一致[29,32-33]。B亞家族中Pe4CL6的表達(dá)隨著竹筍高度的增加而下調(diào),可能該基因只在幼筍中發(fā)揮作用,但其具體功能尚需驗證。由此表明,大部分Pe4CLs可能在毛竹的苯丙氨酸代謝途徑中控制著底物是否流向木質(zhì)素,在木質(zhì)素的合成過程中發(fā)揮著重要作用;而有3個基因的表達(dá)未被檢測到,1個基因表達(dá)下調(diào),它們可能具有新的功能。此外,qPCR檢測的基因表達(dá)模式與轉(zhuǎn)錄組數(shù)據(jù)存在一定的差異,這可能是由于所取樣品差異造成的。
本研究基于基因組與轉(zhuǎn)錄組數(shù)據(jù),利用生物信息學(xué)方法從毛竹中鑒定了15個4CL成員,根據(jù)進(jìn)化關(guān)系將它們分為兩個亞家族。轉(zhuǎn)錄組表達(dá)譜分析揭示出不同Pe4CLs在毛竹不同組織與不同發(fā)育時期的表達(dá)存在明顯差異。竹筍組織切片染色和qPCR結(jié)果證實,隨著竹筍高度的增加,木質(zhì)化程度加深,大多數(shù)Pe4CLs的相對表達(dá)量上調(diào),與筍的木質(zhì)化程度相一致,表明它們參與木質(zhì)素的生物合成。本研究結(jié)果為進(jìn)一步揭示Pe4CLs參與竹材形成的分子機(jī)制提供了參考依據(jù)。