唐 昊,鄭 莉,張 羽,李沅秋,羅朝兵
(1.樂山師范學(xué)院生命科學(xué)學(xué)院,四川樂山 614000;2.竹類病蟲防控與資源開發(fā)四川省重點實驗室,四川樂山 614000)
WRKY轉(zhuǎn)錄因子是植物中的調(diào)節(jié)蛋白中的一個大家庭,WRKY轉(zhuǎn)錄因子約有60個高度保守的氨基酸,其特征為N端WRKYGQK基序和C端CCHC- (C2HC)或CCHH- (C2H2)型鋅指基序,WRKY蛋白通過與基因啟動子中的W-BOX motif (TTGACC/T)結(jié)合來調(diào)控基因表達(dá)[1-4].同時根據(jù)WRKY結(jié)構(gòu)域的數(shù)量和鋅指基序的特征,可以劃分為三個主要的家族[1-3],其中家族Ⅰ具有兩個典型的WRKY結(jié)構(gòu)域和一個C2H2-型鋅指基序,而其他大多數(shù)的WRKY蛋白只含有一個WRKY結(jié)構(gòu)域,歸屬于家族II或家族Ⅲ,家族II的鋅指基序與家族Ⅰ相同,家族Ⅲ的鋅指基序為C2HC.此外,家族II中的WRKY蛋白可以進一步分為IIa 、 IIb、IIc、IId 和IIe五個亞族,而家族III中WRKY蛋白分為IIIa和IIIb亞族[3,5].大量的WRKY轉(zhuǎn)錄因子在多種植物的基因組中被發(fā)現(xiàn)并鑒定,例如擬南芥[1],水稻[6],玉米[7]和小麥[8]等.同時遺傳和分子生物學(xué)研究表明,WRKY轉(zhuǎn)錄因子在植物中一方面參與抵御諸如細(xì)菌[9-11]、真菌[12-13]、病毒病原體[14]及病毒[15]各種生物脅迫的調(diào)控中起著關(guān)鍵作用;另一方面也在響應(yīng)如干旱脅迫[8,16-18]、水脅迫[19]、鹽脅迫[20]和寒冷脅迫[21-22]等非生物脅迫時的植物體內(nèi)的調(diào)控.此外,WRKY轉(zhuǎn)錄因子還能參與植物自身的生長發(fā)育調(diào)控,如葉片的衰老調(diào)控[23-24]、開花調(diào)控[25-27]、細(xì)胞內(nèi)信號轉(zhuǎn)導(dǎo)[28]、植物種子的發(fā)育及毛狀體起始和衰老[3,29].
慈竹(Bambusaemeiensis)屬于叢生竹類,廣泛分布于我國南方地區(qū),被廣泛應(yīng)用于造紙及園林綠化等領(lǐng)域[30].其中在造紙領(lǐng)域,按照竹種對造紙質(zhì)量的影響進行分級排序,竹種可以被分為四級,而慈竹屬于最重要的第一級[31].長足大竹象(Cyrtotrachelusbuquet)是主要的竹林害蟲之一,屬于鞘翅目象甲科.成蟲期的長足大竹象可將喙完全的伸入幼嫩竹筍內(nèi)部, 取食竹腔內(nèi)層的幼嫩組織[32],造成新竹生長不良或形成膿包竹,引起竹腔變黑、腐爛,造成大量退筍,這將極大的影響了慈竹的產(chǎn)業(yè)化發(fā)展[33-34].
根據(jù)目前的研究現(xiàn)狀,對于慈竹而言,其目前尚未有基因組草圖公布,且暫未有慈竹在長足大竹象取食脅迫下的WRKY轉(zhuǎn)錄因子的研究.因此本文結(jié)合長足大竹象取食脅迫狀態(tài)下慈竹轉(zhuǎn)錄組的測序及生物信息學(xué)分析,對慈竹中WRKY轉(zhuǎn)錄因子進行鑒定及分析,以期發(fā)現(xiàn)WRKY轉(zhuǎn)錄因子在慈竹抗蟲害表征中所發(fā)揮的作用,同時為研究慈竹WRKY轉(zhuǎn)錄因子結(jié)構(gòu)和功能提供信息參考.
新鮮慈竹竹筍樣本采集于四川省樂山市沐川縣.長足大竹象(C.buqueti)于2017年8月收集于四川省沐川縣,成蟲在出土后三日喂養(yǎng)于光照培養(yǎng)箱中(保持26℃恒溫和70%的濕度,并維持16 h的光照及8 h的黑暗處理).在試驗處理前,使長足大竹象保持饑餓狀態(tài)24 h.
取100只饑餓處理后長足大竹象成蟲置于新鮮竹筍上,分為長足大竹象未取食的竹筍部位(Group1)及同一竹筍上長足大竹象取食的竹筍部位(Group3)及同一叢竹筍中另一竹筍上長足大竹象完全未取食的竹筍部位(Group2)三個組,Group1和Group2取樣的部位盡量保持在不同竹筍上近似的部位.實驗的詳細(xì)處理方法參照李沅秋等的實驗方法[35].
提取慈竹竹筍RNA,經(jīng)質(zhì)量檢測后用Illumina HiSeqTM2000平臺測序.將測序得到的原始數(shù)據(jù)過濾掉低質(zhì)量和冗余的Reads讀段后,采用 Trinity 軟件進行數(shù)據(jù)的從頭組裝及拼接,最終得到慈竹的轉(zhuǎn)錄本 Transcripts并從中選取最主要的轉(zhuǎn)錄本作為 Unigene序列,進一步并對 Unigene 數(shù)據(jù)去冗余處理并得到非冗余 Unigene 庫.對Unigene序列進行基因功能注釋[36,37].根據(jù)注釋結(jié)果搜索“WRKY transcription factor”,查找注釋相關(guān)的Unigene名稱,手動調(diào)取 Transcript.fa中上述Unigene序列,去除掉序列小于200bp的Unigene基因序列信息.
利用ORFFinder( https://www.ncbi.nlm.nih.gov/orffinder/)功能查找每個基因的ORF,只保留氨基酸殘基數(shù)大于100的相應(yīng)核苷酸序列作進一步分析.利用ProtParam程序(http://web.expasy.org/protparam/)對WRKY蛋白進行相關(guān)性質(zhì)參數(shù)的預(yù)測[38].
在Plant Transcription Factor Database(http://planttfdb.cbi.pku.edu.cn/.)中下載擬南芥(Arabidopsisthaliana)WRKY蛋白序列,使用DNAMAN6.0及MEGA 7.0軟件對慈竹及山羊草的WRKY蛋白進行多序列比對,然后在MEGA 7.0軟件中的系統(tǒng)進化樹構(gòu)建方法中選用鄰接法并設(shè)置1000次重復(fù)bootstrap檢驗、Poisson模型構(gòu)建WRKY蛋白的系統(tǒng)發(fā)生樹[39-40].利用在線網(wǎng)站(http://meme-suite.org/index.html)并使用默認(rèn)參數(shù)設(shè)置對WRKY轉(zhuǎn)錄因子蛋白進行motif分析[41].
根據(jù)慈竹轉(zhuǎn)錄組數(shù)據(jù)中鑒定出的WRKY轉(zhuǎn)錄因子相對表達(dá)量的豐度值,將值導(dǎo)入 MeV 4.9.0分析軟件中,繪制熱圖并進行聚類分析[42].
根據(jù)ORFFinder查找結(jié)果,從慈竹轉(zhuǎn)錄組中篩選出29個大于100個氨基酸的ORF序列.這些WRKY蛋白的ORF的氨基酸含量差別較大,最長ORF的氨基酸數(shù)從153(comp46865_seq1)到688(comp7071_seq3);相對分子量位于16234.32 Da(comp46865_seq1)到74034.74 Da(comp7071_seq3)之間;等電點介于4.89(comp55566_seq0)到10.15(comp46865_seq1)之間;此外,蛋白質(zhì)的親水性總平均值結(jié)果表明慈竹WRKY 蛋白大多為親水性蛋白質(zhì)(表1).
表1 慈竹WRKY 蛋白的相關(guān)性質(zhì)分析Tab.1 Analysis of the related properties of the WRKY protein in Bambusa emeiensis
使用DNAMAN6.0軟件對初步鑒定出的29條慈竹WRKY轉(zhuǎn)錄因子蛋白進行多序列比對,結(jié)果如下:在29條WRKY蛋白質(zhì)序列中,有4條序列C端缺失(comp9372_seq1、comp17764_seq1、comp34208_seq1及comp51858_seq0),主要原因或為轉(zhuǎn)錄組數(shù)據(jù)拼接不完整所致;其余25條具有完整WRKY轉(zhuǎn)錄因子蛋白質(zhì)結(jié)構(gòu)域的序列中,有8條序列C端為CCHC型鋅指結(jié)構(gòu),17條為C端CCHH型鋅指結(jié)構(gòu);在N端, comp34208_seq1的WRKYGQK基序變?yōu)榱薟PKYGSQK,存在著2個氨基酸殘基的變異.此外,comp5390_seq0和comp51858_seq0轉(zhuǎn)錄因子的WRKYGQK基序中,Q(谷氨酰胺)被K(賴氨酸)所替代(圖1).
圖1 慈竹WRKY轉(zhuǎn)錄因子序列比對分析Fig.1 Sequence alignment of Bambusa emeiensis WRKY transcription Factor
圖2 慈竹與擬南芥WRKY轉(zhuǎn)錄因子的系統(tǒng)進化樹Fig.2 Phylogenetic tree of WRKY Transcription Factor in Bambusa emeiensis and Arabidopsis thaliana
為進一步對慈竹WRKY轉(zhuǎn)錄因子的進化關(guān)系進行分析,從Plant Transcription Factor Database下載了41條擬南芥(Arabidopsisthaliana)WRKY轉(zhuǎn)錄因子的蛋白質(zhì)序列,利用MEGA 7.0軟件中CLUSTAL參數(shù)對這70條WRKY蛋白序列進行比對,繪制出慈竹WRKY 轉(zhuǎn)錄因子的進化樹(圖2).
根據(jù)系統(tǒng)進化樹的分析結(jié)果,可以將70條序列分為3個家族.其中家族Ⅰ(Group 1)含有6個慈竹WRKY轉(zhuǎn)錄因子序列,家族II(Group 2)含有包括5個亞族,共有15個WRKY轉(zhuǎn)錄因子序列.家族III(Group 3)包含8個序列慈竹WRKY轉(zhuǎn)錄因子.
利用MEME分析慈竹WRKY的motif(圖3),結(jié)果發(fā)現(xiàn)所有慈竹WRKY轉(zhuǎn)錄因子均含有motif1,其序列包含WRKYGQK基序,這與多序列比對結(jié)果相吻合(圖1).
此外、comp34208_seq1、comp9372_seq1、comp17764_seq1缺失motif3和motif5,導(dǎo)致它們的C端CCHC- (C2HC)或CCHH- (C2H2)型鋅指基序的缺失,可能原因是在進行序列拼接時組裝不完善所致.
目前尚未有慈竹WRKY轉(zhuǎn)錄因子在蟲害(長足大竹象)取食脅迫下基因表達(dá)量變化的研究,根據(jù)本試驗的結(jié)果(圖4):在不同竹筍的未被取食部位(Group1與Group2),WRKY轉(zhuǎn)錄因子在慈竹中表達(dá)量基本接近,而在同一根竹筍的取食與未被取食部位(Group1與Group3),comp5294_seq2、comp7144_seq0、comp4915_seq1、comp1871_seq0、comp5390_seq0、comp26614_seq1、comp30333_seq1等WRKY轉(zhuǎn)錄因子表達(dá)量存在著較大的變化,表明這幾個WRKY轉(zhuǎn)錄因子可能對慈竹抵御蟲害有重要作用.
圖3 慈竹WRKY轉(zhuǎn)錄因子motif分析Fig.3 Analysis of Bambusa emeiensisWRKY transcription factor motif圖4 長足大竹象取食脅迫下慈竹WRKY轉(zhuǎn)錄因子的表達(dá)模式分析Fig.4 Analysis of expression patterns of Bambusa emeiensis WRKY transcription factors under under the Cyrtotrachelus buquet feeding-stress
WRKY因子通常被認(rèn)為是存在的植物特異性,但在馴化和多倍體化的選擇過程中,野生和栽培植物中都保留了重復(fù)的WRKY轉(zhuǎn)錄因子[43].此外,WRKY轉(zhuǎn)錄因子被發(fā)現(xiàn)與倍間雜交種的生存能力有關(guān)[44].系統(tǒng)發(fā)育序列分析和比較轉(zhuǎn)錄組學(xué)表明,它們在單子葉植物和雙子葉植物之間保留了各自的功能[45].WRKY轉(zhuǎn)錄因子家族在多種模式植物的基因組中被發(fā)現(xiàn)并鑒定,如擬南芥[1],水稻[6]和玉米[7]等.在慈竹中,劉紅梅等鑒定了兩個 WRKY轉(zhuǎn)錄因子,它們主要參與慈竹對逆境的響應(yīng)及干旱和ABA(脫落酸)的脅迫響應(yīng)[46],而對于慈竹中WRKY轉(zhuǎn)錄因子在遭受蟲害(長足大竹象)時其相關(guān)研究尚未有報到.在本研究中,comp5294_seq2、comp7144_seq0、comp4915_seq1、comp1871_seq0、comp1486_seq1、comp6576_seq0、comp5390_seq0、comp26614_seq1、comp30333_seq1在長足大竹象取食之后表達(dá)量存在較大的變化.根據(jù)系統(tǒng)進化樹的結(jié)果,comp1871_seq0、comp7144_seq0、comp6576_seq0與擬南芥WRKY70轉(zhuǎn)錄因子親緣關(guān)系較近,而在擬南芥中的研究表明WRKY70是植物對病原菌響應(yīng)過程中水楊酸(SA)和茉莉酸(JA)介導(dǎo)的信號事件的匯聚節(jié)點,且在決定依賴于SA和依賴于JA的防御途徑之間的平衡中起著關(guān)鍵作用[47].對于comp1486_seq1,其與擬南芥的WRKY13的轉(zhuǎn)錄因子存在較高的同源性,而WRKY13在擬南芥中促進了莖的整體發(fā)育,因為WRKY13突變體的厚壁組織細(xì)胞數(shù)量、莖粗和維管束數(shù)量均減少.WRKY13突變體中木質(zhì)素合成相關(guān)基因被抑制,導(dǎo)致莖稈較弱[48],因此,comp1486_seq1在慈竹被長足大竹象取食時其表達(dá)量的上調(diào)可能與促進慈竹筍的發(fā)育來提升對蟲害脅迫的抗性.除此之外,comp5390_seq0 與擬南芥的WRKY51轉(zhuǎn)錄因子及comp5294_seq2與擬南芥的WRKY60轉(zhuǎn)錄因子均存在較高的同源性, 而WRKY51蛋白介導(dǎo)了在低油酸(18:1)條件下JA介導(dǎo)的信號抑制[49], WRKY60和WRKY40的共表達(dá)作用使植物對丁香假單胞菌和灰葡萄孢的抗性增強[50].根據(jù)上述結(jié)果,我們推測慈竹在遭受蟲害的生物脅迫時,慈竹基因組內(nèi)的WRKY轉(zhuǎn)錄因子可能參與了由SA合JA介導(dǎo)的信號轉(zhuǎn)導(dǎo)(如comp1871_seq0、comp7144_seq0、comp6576_seq0、comp5390_seq0)及通過慈竹筍發(fā)育相關(guān)的WRKY轉(zhuǎn)錄因子(comp1486_seq1)表達(dá)量的上調(diào)來響應(yīng)蟲害的脅迫.
此外,本文從慈竹的蟲害脅迫的轉(zhuǎn)錄組數(shù)據(jù)中鑒定了29個慈竹轉(zhuǎn)錄因子,其中26個WRKY轉(zhuǎn)錄因子具有完整的結(jié)構(gòu)域,通過對其表達(dá)模式的分析可為以慈竹中WRKY轉(zhuǎn)錄因子如何響應(yīng)長足大竹象取食脅迫及慈竹蟲害的防控方面提供部分理論依據(jù).