袁紅梅,郭文棟,趙麗娟,于 瑩,吳建忠,張利國,程莉莉,趙東升,吳廣文,關(guān)鳳芝
?
亞麻纖維素合酶超基因家族的生物信息學(xué)及表達(dá)分析
袁紅梅1,郭文棟2,趙麗娟3,于 瑩1,吳建忠1,張利國1,程莉莉1,趙東升1,吳廣文1,關(guān)鳳芝1
(1黑龍江省農(nóng)業(yè)科學(xué)院經(jīng)濟(jì)作物研究所,哈爾濱 150086;2黑龍江省科學(xué)院自然與生態(tài)研究所,哈爾濱 150040;3黑龍江省農(nóng)業(yè)科學(xué)院作物 育種研究所,哈爾濱 150086)
【目的】全基因組水平鑒定亞麻纖維素合酶超家族基因,并對(duì)基因的進(jìn)化、基因結(jié)構(gòu)及組織表達(dá)特性等進(jìn)行分析,為亞麻纖維發(fā)育的機(jī)理研究奠定基礎(chǔ)?!痉椒ā坷肞hytozome基因組數(shù)據(jù)庫,通過生物信息學(xué)手段,鑒定亞麻纖維素合酶超基因家族成員,并進(jìn)行蛋白理化特性分析;利用MEGA 5.0、GSDS、MEME等軟件構(gòu)建系統(tǒng)進(jìn)化樹,并進(jìn)行基因結(jié)構(gòu)、蛋白保守基序分析;根據(jù)RNA-Seq數(shù)據(jù)對(duì)進(jìn)行表達(dá)分析?!窘Y(jié)果】系統(tǒng)分析鑒定了45個(gè)亞麻超家族基因,該家族基因在scaffolds上是分散分布的,沒有明顯的成簇現(xiàn)象。CesA/Csls蛋白主要分布于質(zhì)膜上,氨基酸數(shù)目為409—1 167,分子量為47 401.1—130 578.3,等電點(diǎn)分布在5.43—9.08。CesA/Csl蛋白均含有跨膜結(jié)構(gòu)域,數(shù)目為2—8。根據(jù)系統(tǒng)進(jìn)化分析將其分成CesA與Csl兩類,細(xì)分為CesA、CslA、CslB、CslC、CslD、CslE、CslG共7組。基因結(jié)構(gòu)分析顯示,亞麻基因的長度在2.1—6.8 kb,外顯子數(shù)量在2—14。保守基序分析表明,不同組間Motif組成有一定的差異,Motif 1、Motif 2、Motif 3、Motif 4、Motif 12在CesA、CslB、CslD、CslE、CslG組蛋白中均有分布,Motif 18、Motif 20在CslA、CslC組蛋白中均有分布,而Motif 13、Motif 14、Motif 15、Motif 19的分布則表現(xiàn)出一定的組間特異性。表達(dá)譜分析結(jié)果表明,家族成員在不同發(fā)育階段表達(dá)模式不同,部分可被NaCl、BR和Brz誘導(dǎo)上調(diào)或下調(diào)表達(dá),預(yù)示功能的多樣性以及在植物發(fā)育過程中扮演著不同角色?!窘Y(jié)論】鑒定出45個(gè)亞麻家族基因成員,分屬于兩類,7組,分布于scaffolds上,基因結(jié)構(gòu)和蛋白基序具有組間多樣性和組內(nèi)保守性。不同的基因在不同發(fā)育階段具有一定的時(shí)空特異性。中部分基因響應(yīng)激素BR、Brz及NaCl脅迫。
亞麻;纖維素合酶;;基因家族;表達(dá)分析
【研究意義】纖維素、半纖維素是地球上最豐富和重要的可再生資源。纖維素是由D-葡萄糖通過β-1,4糖苷鍵連接而成的一種線性葡聚糖,而半纖維素主要包含木聚糖、葡甘露聚糖和半乳葡甘露聚糖等,它們共同組成了細(xì)胞壁的主要骨架結(jié)構(gòu)。深入研究纖維植物中纖維素的生物合成過程,挖掘控制纖維發(fā)育的重要基因,進(jìn)而通過遺傳操作改良植物的纖維品質(zhì)和產(chǎn)量具有重要的理論和實(shí)踐意義?!厩叭搜芯窟M(jìn)展】纖維素、半纖維素作為細(xì)胞壁的重要組成部分,對(duì)其生物合成的研究具有重要意義。纖維素合酶超基因家族包括纖維素合酶(cellulose synthase,CesA)和纖維素合酶類蛋白(cellulose_synthase_like protein,Csl蛋白),是纖維形成的關(guān)鍵酶,分別參與纖維素和半纖維的合成[1-3]。目前已從40多種植物中克隆了1 400多個(gè)的相關(guān)序列[4-5]。在擬南芥()及毛果楊()中分別鑒定出10個(gè)和18個(gè)。在四倍體陸地棉()中共鑒定出37個(gè),其中,19個(gè)來自At亞基因組,18個(gè)來自Dt亞基因組,而在二倍體雷蒙德氏棉()中鑒定出15個(gè)[6]。在擬南芥中,AtCesA1、AtCesA3、AtCesA6組成纖維素合酶復(fù)合體,參與初生細(xì)胞壁合成,AtCesA4、AtCesA7、AtCesA8則參與次生細(xì)胞壁合成[7-13]。AtCesA2、AtCesA5、AtCesA9被認(rèn)為是AtCesA6的同源蛋白,這些蛋白彼此之間存在功能冗余。在棉花中,、、、、參與初生細(xì)胞壁合成,、、、參與次生細(xì)胞壁合成[14]。楊樹木質(zhì)部細(xì)胞膜上至少存在2種纖維素合酶復(fù)合體,復(fù)合體Ⅰ由PtCesA4、PtCesA7、PtCesA8、PtCesA17、PtCesA18組成,參與細(xì)胞次生壁的合成;復(fù)合體Ⅱ由PtCesA3、PtCesA10、PtCesA11、PtCesA13、PtCesA15、PtCesA16組成,參與細(xì)胞初生壁和次生壁的合成[15]。除CesA蛋白之外,植物體內(nèi)還有Csl蛋白,該類酶則在高爾基體體腔中介導(dǎo)半纖維素的合成[16-17]。依據(jù)序列結(jié)構(gòu)特征的不同,Csl蛋白被分為9個(gè)亞族,分別為CslA—CslH及CslJ,其中CslF、CslH和CslJ只存在于單子葉植物中[18-19]。CslA催化(1,4)-b-D-甘露聚糖的合成,CslC參與催化木葡聚糖骨架的形成,CslD則在多糖(木聚糖和半乳醛聚糖)的合成中起作用。但目前,CslB、CslE和CslG的生物學(xué)功能尚不清楚。亞麻(L.)是一種重要的韌皮纖維作物。其韌皮纖維細(xì)胞的發(fā)育主要經(jīng)歷2個(gè)階段:細(xì)胞伸長和次生細(xì)胞壁加厚,這兩個(gè)時(shí)期互不重疊,分別決定了韌皮纖維的長度和強(qiáng)度,次生細(xì)胞壁加厚與韌皮纖維的品質(zhì)密切相關(guān)。韌皮纖維細(xì)胞發(fā)育是個(gè)復(fù)雜的過程,受很多基因表達(dá)調(diào)控影響,如、、等,其中,CesA是催化纖維素合成的關(guān)鍵酶之一,一直是植物纖維素合成研究領(lǐng)域中的一個(gè)熱點(diǎn)。但亞麻纖維發(fā)育的分子生物學(xué)基礎(chǔ)相對(duì)滯后。隨著亞麻基因組測(cè)序計(jì)劃的完成,生物信息學(xué)、生物化學(xué)、分子生物學(xué)和遺傳學(xué)等研究方法的不斷完善,亞麻纖維發(fā)育的分子生物學(xué)基礎(chǔ)才得以不斷推進(jìn)。筆者前期研究發(fā)現(xiàn),現(xiàn)蕾期噴施適當(dāng)濃度的植物激素油菜素內(nèi)酯(brassinosteroids,BR)及蕓苔素吡咯(brassinazole,Brz)能夠提高亞麻的纖維產(chǎn)量和耐鹽性。為深入研究BR、Brz調(diào)控亞麻纖維發(fā)育和提高耐鹽性的分子機(jī)制,利用Solexa技術(shù),比較分析了BR、NaCl、Brz處理對(duì)亞麻現(xiàn)蕾期莖部組織基因轉(zhuǎn)錄表達(dá)譜的影響。結(jié)果發(fā)現(xiàn),差異基因中存在大量細(xì)胞壁合成相關(guān)基因,這些基因涉及纖維素合成、木質(zhì)素合成、細(xì)胞壁結(jié)構(gòu)、細(xì)胞壁多糖合成代謝等?!颈狙芯壳腥朦c(diǎn)】盡管對(duì)纖維素合酶超基因家族的研究有了較大進(jìn)展,但大多局限于擬南芥、棉花、楊樹等模式植物中,亞麻中大多成員尚未得到分離和鑒定。隨著亞麻基因組序列的公布,有必要對(duì)亞麻纖維素合酶超家族基因進(jìn)行全基因組挖掘和全面、系統(tǒng)分析?!緮M解決的關(guān)鍵問題】本研究采用生物信息學(xué)方法,從基因組水平對(duì)亞麻纖維素合酶超家族基因的理化特性、定位、基因結(jié)構(gòu)、進(jìn)化等進(jìn)行闡釋,并根據(jù)Solexa表達(dá)譜數(shù)據(jù)對(duì)的表達(dá)特性進(jìn)行分析,為亞麻纖維發(fā)育的機(jī)理研究奠定基礎(chǔ)。
1.1 植物材料
材料為高纖亞麻品種Diana,在不同時(shí)期播種于黑龍江省農(nóng)業(yè)科學(xué)院民主園區(qū)試驗(yàn)田,以期在同一時(shí)期獲得不同發(fā)育階段的亞麻植株。選擇苗期植株噴施清水;同時(shí),選擇現(xiàn)蕾期植株,分別噴施清水(對(duì)照CK)、BR(0.2 mg·L-1)和Brz(1 mg·L-1)及根灌NaCl(300 mmol·L-1)等4種處理。處理12 h后分別選擇生長一致的植株,取其莖中部1/3,每個(gè)處理分別取3株,3次生物學(xué)重復(fù)。取材后將樣品置于液氮中迅速冷凍,-80℃保存,用于RNA的提取及Solexa數(shù)字表達(dá)譜分析。
1.2 亞麻的鑒定
根據(jù)擬南芥AtCesA及AtCsl蛋白氨基酸序列,在Phytozome數(shù)據(jù)庫中進(jìn)行BlastP比對(duì),搜索亞麻同源序列。利用NCBI CDD(http://www.ncbi.nlm.nih. gov/Structure/cdd/)在線工具對(duì)獲得的基因是否含有Cellulose-synt保守結(jié)構(gòu)域進(jìn)行確認(rèn)。亞麻基因家族蛋白序列下載自phytozome數(shù)據(jù)庫(http://phytozome.jgi.doe.gov/),擬南芥CesA/Csl蛋白序列下載自TAIR(http://www.arabiodpsis.org)。
1.3 亞麻的特性分析
通過phytozome數(shù)據(jù)庫查詢的Scaffold位點(diǎn)信息,利用ExPASy Proteomics Server(http://web. expasy.org/protparam/)預(yù)測(cè)蛋白氨基酸序列的基本信息,包括蛋白質(zhì)的長度、分子量、等電點(diǎn)。利用TMHMM Server V2.0(http://www.cbs.dtu.dk/services/ TMHMM/)進(jìn)行蛋白跨膜螺旋預(yù)測(cè)。通過在線軟件WoLF PSORT(http://wolfpsort.or)進(jìn)行亞細(xì)胞定位分析。
1.4 亞麻系統(tǒng)發(fā)育樹的構(gòu)建
使用Clustal X軟件對(duì)鑒定出的45個(gè)亞麻CesA/Csl蛋白與分別來自于楊樹、棉花和擬南芥的CesA/Csl蛋白進(jìn)行氨基酸序列比對(duì),比對(duì)結(jié)果通過MEGA5軟件生成進(jìn)化樹,采用鄰接法(Neighbor-Joining,NJ)構(gòu)建進(jìn)化樹,矯正參數(shù)Bootstrap重復(fù)1 000次。
1.5 亞麻基因家族的基因結(jié)構(gòu)分析及蛋白基序分析
利用Gene Structure Display Server(http://gsds1.cbi. pku.edu.cn/)在線分析基因家族的基因結(jié)構(gòu);通過MEME網(wǎng)站(http://meme-suite.org/tools/meme)在線分析基因家族蛋白的保守基序,參數(shù)設(shè)置:基序?qū)挾葹?×50,鑒定最大基序數(shù)量為20。
1.6 亞麻表達(dá)分析
對(duì)高通量測(cè)序表達(dá)譜數(shù)據(jù)進(jìn)行背景扣除、均一化,提取亞麻45個(gè)在苗期、現(xiàn)蕾期以及BR、NaCl及Brz不同處理的表達(dá)量(RPKM值),利用Excel軟件繪制柱形圖。運(yùn)用SPSS 16.0軟件進(jìn)行數(shù)據(jù)分析,一維方差分析(One-way ANOVA)進(jìn)行組間比較,多重比較使用最小差數(shù)比較法(LSD),<0.05代表差異顯著。
2.1 亞麻的鑒定
從亞麻全基因組中共篩選到51個(gè)擬南芥AtCesA/ Csl的同源蛋白,利用NCBI CDD(http://www.ncbi.nlm. nih.gov/Structure/cdd/)在線工具對(duì)其進(jìn)一步鑒定,獲得45個(gè)在CDD軟件上預(yù)測(cè)含有CesA保守結(jié)構(gòu)域的蛋白,其中,35個(gè)蛋白含有CESA_CelA_like(cd06421)結(jié)構(gòu)域,10個(gè)含有CESA_CaSu_A2(cd06437)結(jié)構(gòu)域。因此,該45個(gè)蛋白被確認(rèn)為亞麻CesA/Csl家族蛋白。
2.2 亞麻的基因組定位及特性分析
CesA/Csl蛋白理化特性分析表明,氨基酸長度為409—1 167,分子量為47 401.1—130 578.3,等電點(diǎn)分布在5.43—9.08。根據(jù)WoLF PSORT預(yù)測(cè)顯示(表1),35個(gè)CesA/Csl蛋白定位于質(zhì)膜上,是亞麻CesA/Csl蛋白定位最多的細(xì)胞部位。4個(gè)CesA/Csl蛋白(Lus10023056、Lus10032415、Lus10025046、Lus10022982)屬于葉綠體蛋白,1個(gè)CesA/Csl蛋白(Lus10030035)位于細(xì)胞核內(nèi),還有5個(gè)CesA/Csl蛋白(Lus10003525、Lus10013851、Lus10026568、Lus10020539、Lus10039475)暫不能確定其亞細(xì)胞位置。大多數(shù)CesA/Csl蛋白都含有跨膜結(jié)構(gòu)域,跨膜區(qū)是β-1,4-葡萄糖苷鏈穿過質(zhì)膜進(jìn)入細(xì)胞壁的重要通道,在亞麻中,除Lus10003525蛋白可能是截短的不完整蛋白序列,未預(yù)測(cè)到跨膜結(jié)構(gòu)域外,其余CesA/Csl蛋白均含有跨膜結(jié)構(gòu)域,數(shù)目為2—8。
盡管亞麻全基因測(cè)序已完成,但并未公布測(cè)序亞麻品種的染色體物理圖譜,所以目前亞麻家族基因僅能定位于scaffolds上,尚無法定位到染色體上。亞麻家族基因在scaffolds上是分散分布的,無明顯的成簇現(xiàn)象。在Scaffold 617中含有3個(gè),在Scaffold 33、Scaffold144、Scaffold 325、Scaffold 917、Scaffold 1060、Scaffold 1186中均各含有2個(gè),其他Scaffold上僅含有1個(gè)。
2.3 亞麻與楊樹、棉花及擬南芥的進(jìn)化關(guān)系
對(duì)已鑒定含有纖維素合酶保守結(jié)構(gòu)域的45個(gè)亞麻纖維素合酶CesA/Csl蛋白與楊樹、棉花、擬南芥的CesA/Csl蛋白構(gòu)建系統(tǒng)進(jìn)化樹(圖1),主要聚為7個(gè)明顯的分支。根據(jù)氨基酸序列比對(duì)和進(jìn)化關(guān)系遠(yuǎn)近,將CesA/Csl蛋白分為CesA、Csl兩類,而Csl蛋白被細(xì)分為6組,分別命名為CslA、CslB、CslC、CslD、CslE與CslG。不同組間的之間直向相似度(ortholog)遠(yuǎn)大于平行(paralog)進(jìn)化相似度,表明纖維素合酶在進(jìn)化中產(chǎn)生分化的時(shí)期很早,在這4個(gè)物種分化之前,不同的纖維素合酶就已進(jìn)化產(chǎn)生了不同的類型和組型。
表1 亞麻CesA/Csl基因家族信息
“—”:不明確unknown
在基因進(jìn)化過程中,突變積累的數(shù)量和時(shí)間成正比,從進(jìn)化樹可以看出,亞麻和毛果楊的遺傳距離相對(duì)較近,與棉花次之,而與擬南芥的遺傳距離相對(duì)較遠(yuǎn),與物種間的生物進(jìn)化關(guān)系趨于一致。進(jìn)一步分析發(fā)現(xiàn),在這4個(gè)物種中數(shù)目分布基本一致,但在不同物種中數(shù)量分布具有較大差異,如亞麻CslD組基因數(shù)目較多,CslB、CslE組基因數(shù)目較少;擬南芥CslA組基因數(shù)目較多,CslE組基因數(shù)目較少;棉花CslE、CslG組基因數(shù)目較多,CslB、CslC組基因數(shù)目較少;而楊樹各組基因數(shù)目分布較為均勻。推測(cè)在這4個(gè)物種的祖先中可能只存在少量的,在物種分離之后,通過基因重復(fù)的方式進(jìn)行了擴(kuò)增,但不同物種在不同組基因中擴(kuò)張程度并不一致。
進(jìn)化樹上,CesA組與CslD組位于相鄰的2個(gè)分支,進(jìn)化關(guān)系最近。亞麻CesA組有13個(gè)基因成員,其中11個(gè)基因與楊樹、棉花、擬南芥的、、、、、、聚在一起,在功能上可能參與初生細(xì)胞壁的合成;2個(gè)基因與聚在一起,在功能上可能參與次生細(xì)胞壁的合成,但沒有發(fā)現(xiàn)和的亞麻同源基因。亞麻CslD組有15個(gè)基因,為基因成員最多的一組。Richmond等[16]推測(cè)為纖維素合酶超家族中最為古老的一個(gè),可能在進(jìn)化時(shí)間上早于。4個(gè)基因與聚為一組(CslG組),CslB與CslE組各有1個(gè)基因成員,2個(gè)基因與聚為一組(CslA組),CslC組有8個(gè)基因成員。、組基因在進(jìn)化樹上位于最遠(yuǎn)的分支,與組基因遺傳距離最遠(yuǎn),分化最大。
2.4 亞麻家族的基因結(jié)構(gòu)分析
擬南芥中已克隆了10個(gè),通過比較分析發(fā)現(xiàn),擬南芥的10個(gè)最大的差異在于某些區(qū)域中內(nèi)含子的有無,內(nèi)含子的位置是確定纖維素合成酶功能的關(guān)鍵因素之一[20]?;蚪Y(jié)構(gòu)分析顯示,亞麻的長度為2.1—6.8 kb,外顯子數(shù)量為2—14。外顯子數(shù)量在不同組間有較大變化(圖2),CesA組成員外顯子數(shù)目較多,在11—14,CslD組外顯子數(shù)目較少(外顯子數(shù)目為2—5)。不同組中,各組內(nèi)部成員之間外顯子數(shù)目相近,其中CesA組、CslC組及CslD組內(nèi)部成員的基因結(jié)構(gòu)保守性較高。
2.5 亞麻CesA/Csl家族的蛋白基序分析
利用MEME在線工具對(duì)亞麻CesA/Csl蛋白序列進(jìn)行了保守基序分析,預(yù)測(cè)出20個(gè)Motif(圖3)。在同一組內(nèi),大多數(shù)成員的Motif組成基本相同,不同組間Motif組成有一定的差異。在進(jìn)化上,CesA組與CslD組親緣關(guān)系最近,Motif組成相對(duì)保守,但也存在分化,Motif13、Motif15特異分布于CesA組中,Motif14、Motif 19則特異分布于CslD組中。Motif13是CesA蛋白N末端特有的鋅指結(jié)構(gòu)域,是維持纖維素合成酶復(fù)合體穩(wěn)定結(jié)構(gòu)的重要功能區(qū)。亞麻CesA和Csl之間存在的最大區(qū)別是Csl蛋白(除5個(gè)CslD蛋白)缺少該鋅指結(jié)構(gòu)域(Motif 13)。與CslD相比,CslE、CslB、CslG、CslA、CslC組蛋白序列相對(duì)較短,保守基序數(shù)目顯著減少。在進(jìn)化上,CslE、B、G三組蛋白親緣關(guān)系較近,Motif組成相對(duì)保守;CslA、CslC組蛋白則分支較遠(yuǎn),序列保守程度低,保守基序數(shù)目較少。
CesA組及CslD、CslE、CslB、CslG組成員均具有CESA_CelA_like(cd06421)保守結(jié)構(gòu)域,與具有CESA_CaSu_A2(cd06437)保守結(jié)構(gòu)域的CslA、CslC組成員在Motif組成上具有明顯的差異。Motif 12、Motif 4、Motif 1、Motif 3、Motif 2特異分布于CesA及CslD、CslE、CslB、CslG組蛋白中,這些Motif主要分布于酶的中央結(jié)構(gòu)域中,酶的中央結(jié)構(gòu)域通常包含2個(gè)保守區(qū)(A區(qū)和B區(qū)),Motif 12、Motif 4、Motif 1、Motif 3位于A區(qū)中,該區(qū)域可結(jié)合纖維素合成的底物;Motif 2位于B區(qū)中,含有保守序列QxxRW, 與纖維素合酶的催化活性有關(guān)。Motif 20、Motif 18特異分布于CslA、C組蛋白中,Motif 20與Motif 3、Motif 18與Motif 2在功能上具有相似性,但經(jīng)過長期的進(jìn)化,除保守結(jié)構(gòu)域D、QxxRW外,序列已發(fā)生明顯改變。
圖3 亞麻CesA/Csl基因家族蛋白的保守基序
2.6 亞麻的表達(dá)分析
亞麻不同發(fā)育時(shí)期、不同處理的RNA-Seq數(shù)據(jù)進(jìn)行預(yù)處理和統(tǒng)計(jì)分析后,獲得45個(gè)CesA/Csl基因家族成員對(duì)應(yīng)表達(dá)量的RPKM值(圖4),其中6個(gè)基因RPKM值都小于1,說明這些基因在5個(gè)樣品中的表達(dá)量極低或不表達(dá)。通過分析發(fā)現(xiàn)亞麻CesA組基因中大多數(shù)基因在亞麻的苗期和現(xiàn)蕾期中均有較強(qiáng)表達(dá),并且存在明顯的共表達(dá),表明這些基因是植株生長發(fā)育所必需的基因。Lus10039607、Lus10002939、Lus10007296、Lus10029245則表現(xiàn)為苗期低豐度表達(dá),現(xiàn)蕾期高豐度表達(dá),差異達(dá)到顯著水平(<0.05)。其中,Lus10007296、Lus10029245是的同源基因。筆者通過熒光定量PCR分析不同發(fā)育階段亞麻Lus10007296、Lus10029245基因的表達(dá)特性,發(fā)現(xiàn)這2個(gè)基因表達(dá)模式相似,在快速生長期,基因的表達(dá)量達(dá)到最高;進(jìn)入花期和綠熟期時(shí)基因的表達(dá)量再次上調(diào)??焖偕L期是亞麻纖維細(xì)胞啟動(dòng)次生細(xì)胞壁加厚階段,至花期、綠熟期亞麻次生細(xì)胞壁進(jìn)一步加厚,纖維素沉積,纖維逐漸成熟,由此推測(cè)Lus10007296、Lus10029245基因與亞麻次生細(xì)胞壁加厚密切相關(guān)。
亞麻Csl蛋白被分為CslA、CslB、CslC、CslD、CslE、CslG共6個(gè)亞組。CslA催化(1,4)-b-D-甘露聚糖的合成,亞麻中2個(gè)基因在苗期、現(xiàn)蕾期表現(xiàn)出相似的表達(dá)豐度,但它們均可被NaCl誘導(dǎo)上調(diào)表達(dá),差異達(dá)到顯著水平(<0.05)。亞麻中有1個(gè)(Lus10030035),該基因在不同發(fā)育時(shí)期、不同處理下均低豐度表達(dá)。CslC參與催化木葡聚糖骨架的形成,CslD則在多糖(木聚糖和半乳醛聚糖)的合成中起作用,亞麻中有8個(gè)和15個(gè),其中Lus10039440、Lus10039475、Lus10007715、Lus10030453、Lus10009248的RPKM值為10—20,其他基因在不同發(fā)育時(shí)期、不同處理下均低豐度表達(dá)或無表達(dá)(RPKM<10)。其中,Lus10039475、Lus10007715 2個(gè)基因可被NaCl誘導(dǎo)上調(diào)表達(dá),被Brz抑制表達(dá),但差異未達(dá)到顯著水平(>0.05)。亞麻CslE組只有1個(gè)基因(Lus10016625),該基因在苗期高豐度表達(dá),現(xiàn)蕾期低豐度表達(dá),且可被Brz誘導(dǎo)上調(diào)表達(dá)。亞麻CslG組有4個(gè)基因,該組基因在不同發(fā)育時(shí)期均表現(xiàn)出明顯的不同,其中3個(gè)基因Lus10023056、Lus10003196、Lus10023057 現(xiàn)蕾期與苗期相比較上調(diào)表達(dá),1個(gè)基因(Lus10032415)現(xiàn)蕾期與苗期相比較下調(diào)表達(dá)。Lus10023056可被BR、NaCl、Brz誘導(dǎo)下調(diào)表達(dá);Lus10003196可被NaCl誘導(dǎo)下調(diào)表達(dá),差異均達(dá)到顯著水平(<0.05)。與其他Csl組比較,CslE、CslG組基因的表達(dá)量相對(duì)較高,而且在苗期和現(xiàn)蕾期,CslE、CslG組基因的表達(dá)豐度發(fā)生顯著變化,由此推測(cè)CslE、CslG組基因可能在纖維發(fā)育中起重要作用。
本研究通過對(duì)亞麻全基因組生物信息學(xué)分析,共鑒定出2類,7組共45個(gè)亞麻CesA/Csl 蛋白超家族成員,該基因家族與擬南芥、楊樹同源性較高,是一類植物進(jìn)化中保守的家族。在亞麻中發(fā)現(xiàn)的編碼的蛋白質(zhì)與楊樹、擬南芥具有相似的結(jié)構(gòu),在N末端都有1個(gè)環(huán)形鋅指結(jié)構(gòu)或LIM結(jié)構(gòu)域(Motif 13),此種結(jié)構(gòu)域具有保守序列CxxC(半胱氨酸-xx-半胱氨酸)。Kurek等[21]通過酵母雙雜交發(fā)現(xiàn),GhCesA1和GhCesA2通過此鋅指結(jié)構(gòu)可以形成為同源或異源的二聚體。除草劑(CGA325’615)能夠通過阻止各蛋白鋅指結(jié)構(gòu)域之間的相互作用從而破壞纖維素合成酶復(fù)合體的穩(wěn)定結(jié)構(gòu)[21]。由此推測(cè),纖維素合成酶基因的鋅指結(jié)構(gòu)域與蛋白間的相互作用有關(guān),是維持纖維素合成酶復(fù)合體穩(wěn)定結(jié)構(gòu)的重要功能區(qū)。CesA和Csl之間存在的最大區(qū)別是大多數(shù)Csl蛋白(除5個(gè)CslD蛋白)缺少鋅指結(jié)構(gòu)[22]。纖維素的合成必須在CesA蛋白復(fù)合體的作用下完成,相比而言Csl蛋白中大多數(shù)都沒有鋅指結(jié)構(gòu),因此,目前學(xué)者認(rèn)為類纖維素的合成很可能不需要Csl蛋白復(fù)合體結(jié)構(gòu),單一的Csl蛋白也具有催化類纖維素主鏈合成的活性[23]。Richmond和Somerville根據(jù)內(nèi)含子與外顯子排列組合的進(jìn)化趨勢(shì),曾推測(cè)CslD基因家族為纖維素合酶超家族中最為古老的一個(gè),可能在進(jìn)化時(shí)間上早于CesA[16]。同時(shí),本研究發(fā)現(xiàn)15個(gè)CslD蛋白中有5個(gè)成員與CesA相同,具有鋅指結(jié)構(gòu),而且在進(jìn)化上CslD蛋白與CesA蛋白親緣關(guān)系最近,由此推測(cè)在進(jìn)化上很可能由CslD蛋白分支出CesA和Csl類其他蛋白。
大多數(shù)亞麻CesA蛋白含有8個(gè)跨膜結(jié)構(gòu)域,N-端有2個(gè)預(yù)測(cè)的跨膜區(qū)在第250個(gè)氨基酸殘基附近,C-末端有6個(gè)預(yù)測(cè)的跨膜區(qū),跨膜區(qū)是β-1,4-葡萄糖苷鏈穿過質(zhì)膜進(jìn)入細(xì)胞壁的重要通道[24]。鋅指結(jié)構(gòu)域和N端跨膜結(jié)構(gòu)域之間有一個(gè)蛋白序列的高變區(qū)Ⅰ(HVRI),富含酸性氨基酸,功能尚不清楚。在第2和第3跨膜結(jié)構(gòu)域之間是酶的中央結(jié)構(gòu)域,其間有一個(gè)蛋白序列高變區(qū)Ⅱ(HVRII)。通過高變區(qū)可以區(qū)分不同的CesA蛋白,在功能上,高變區(qū)可能參與調(diào)控不同發(fā)育時(shí)期纖維素的合成[25]。高變區(qū)Ⅱ兩邊各有一個(gè)保守基序A區(qū)和B區(qū),A區(qū)含有保守基序Motif 12、Motif 4、Motif 8、Motif 15、Motif 1、Motif 17和Motif 3,該區(qū)域可結(jié)合纖維素合成的底物,B區(qū)除含有一個(gè)保守的D-天冬氨酸殘基外(Motif 9),還有保守序列QxxRW(Motif 2),該保守區(qū)與纖維素合成酶的催化活性有關(guān)[25]。除了蛋白序列高變區(qū)Ⅱ外,不同CesA蛋白之間中央結(jié)構(gòu)域高度保守。CesA、CslD組蛋白相比保守基序數(shù)目極多,序列更加保守,而CslA、CslB、CslC、CslE和CslG組蛋白相對(duì)序列較短,保守基序數(shù)目極少,序列保守程度低,由此產(chǎn)生的遺傳多樣性對(duì)于植物更好地調(diào)控自身纖維素合成具有重要意義。
不同的CesA/Csl基因家族成員在時(shí)空上具有不同的表達(dá)模式,預(yù)示不同的CesA/Csl基因家族成員存在著功能特異性[26-28]。Suzuki等[17]對(duì)楊樹中的48個(gè)的表達(dá)特性進(jìn)行分析,通常在葉片組織中表達(dá)量較低,和在發(fā)育的木質(zhì)部中高豐度表達(dá),、、和在木質(zhì)部中特異表達(dá),但表達(dá)量相對(duì)較低。與擬南芥類似,的表達(dá)量明顯低于,30個(gè)中只有21個(gè)基因被檢測(cè)出表達(dá)量。、、和在發(fā)育的木質(zhì)部中高豐度表達(dá),和在莖尖中組織特異性表達(dá),其他15個(gè)的表達(dá)不表現(xiàn)出組織特異性。Li等[29]研究發(fā)現(xiàn),在陸地棉和海島棉中在纖維素大量積累時(shí)期發(fā)揮重要作用。在非纖維組織中大量表達(dá),則類似持家基因,在不同組織中組成型表達(dá)。同時(shí),他們發(fā)現(xiàn)果膠質(zhì)的積累與木葡聚糖的減少促進(jìn)細(xì)胞壁的轉(zhuǎn)化。本文通過對(duì)RNA-seq分析發(fā)現(xiàn),亞麻大部分的表達(dá)豐度都低于,如CslB、CslC及CslD中的部分成員在不同發(fā)育時(shí)期表達(dá)豐度都極低,這與楊樹、擬南芥的表達(dá)特性相同,推測(cè)基因表達(dá)量可能與纖維素、半纖維素在次生木質(zhì)部中所占組分相關(guān)。苗期為亞麻纖維細(xì)胞分化,初生細(xì)胞壁形成階段;現(xiàn)蕾期亞麻纖維細(xì)胞數(shù)快速增加,次生細(xì)胞壁迅速加厚。亞麻中,部分及全部CslE、CslG組基因在苗期、現(xiàn)蕾期表達(dá)豐度表現(xiàn)出明顯的不同,暗示這些基因可能在參與纖維發(fā)育及初生、次生細(xì)胞壁合成中擔(dān)任不同的角色。目前,Csl蛋白的生物學(xué)功能尚不清楚,有待于深入研究。
對(duì)亞麻上游啟動(dòng)子區(qū)域進(jìn)行預(yù)測(cè),發(fā)現(xiàn)多個(gè)逆境響應(yīng)的順式調(diào)控元件。RNA-seq結(jié)果表明,家族基因中個(gè)別基因可被NaCl誘導(dǎo)上調(diào)或下調(diào)表達(dá),推測(cè)這些基因參與逆境脅迫信號(hào)通路。BR是植物中的甾醇類生長促進(jìn)激素,參與調(diào)控纖維發(fā)育。SUn等[30]研究發(fā)現(xiàn),BR受體基因抑制表達(dá)的轉(zhuǎn)基因棉花,棉纖維的伸長受影響較小,但次生細(xì)胞壁的發(fā)育受到明顯抑制;相反,過量表達(dá)的轉(zhuǎn)基因棉花纖維素沉積顯著增加。筆者前期研究發(fā)現(xiàn),在亞麻現(xiàn)蕾期噴施適當(dāng)濃度的外源BR及BR特異性合成抑制劑Brz能夠影響亞麻纖維發(fā)育,提高亞麻的纖維產(chǎn)量。本研究中,BR、Brz處理與對(duì)照相比,部分被BR、Brz誘導(dǎo)上調(diào)或下調(diào)表達(dá),這些基因可能是植物激素BR信號(hào)調(diào)控通路的下游基因。
植物纖維素生物合成機(jī)制的研究對(duì)纖維作物改良、木材定向培育以及紡織業(yè)、造紙等化工業(yè)都具有積極的科學(xué)意義,因此,通過了解植物纖維素的生物合成機(jī)制,進(jìn)而改善植物纖維的品質(zhì)與產(chǎn)量就顯得十分必要。纖維素生物合成的調(diào)節(jié)涉及的表達(dá)調(diào)控、CesA蛋白修飾、CesA蛋白在高爾基體中的分泌、胞質(zhì)中纖維素合酶復(fù)合體的裝配、纖維素的沉積等多個(gè)方面[31],但由于纖維素合酶的生化研究難度大,該領(lǐng)域研究一直停滯不前。近年來,隨著基因組學(xué)研究的進(jìn)展及植物細(xì)胞壁突變體的發(fā)現(xiàn)使植物的功能研究成為可能[32],但是總體來說人們對(duì)Csl蛋白的功能尚不十分清楚,尤其的表達(dá)調(diào)控及CesA/Csl的運(yùn)輸、復(fù)合體的裝配等問題更有待于深入研究。
鑒定出45個(gè)亞麻家族基因成員,分屬于2類、7組,分散分布于scaffolds上,基因結(jié)構(gòu)和蛋白基序具有組間多樣性和組內(nèi)保守性。不同的基因在不同發(fā)育階段具有一定的時(shí)空特異性,中部分基因響應(yīng)激素BR、Brz及NaCl脅迫。
[1] CHANDRASHEKHAR P J, SHAWN D M. The cellulose paradoxsimple molecule, complex biosynthesis., 2007, 10(3): 220-226.
[2] 魏建華, 宋艷茹. 植物纖維素合酶基因研究進(jìn)展. 植物學(xué)通報(bào), 2002, 19(6): 641-649.
WEI J H, SONG Y R. Advances of studies on plant cellulose synthase., 2002, 19(6): 641-649. (in Chinese)
[3] 劉長斌, 薛永常, 聶會(huì)忠. 高等植物纖維素合酶超家族. 生命的化學(xué), 2007, 27(6): 533-535.
LIU C B, XUE Y C, NIE H Z. The cellulose synthase supergene family in flax., 2007, 27(6): 533-535. (in Chinese)
[4] DOBLIN M S, KUREK I, JACOB-WILK D, DELMER D P. Cellulose biosynthesis in plants: from genes to rosettes., 2002, 43( 12): 1407-1420.
[5] HOLLAND N, HOLLAND D, HELENTJARIS T, DHUGGA K S, XOCONOSTLE-CAZARES B, DELMER D P. A comparative analysis of the plant cellulose synthase (CesA) gene family., 2000, 123(4): 1313-1323.
[6] YUAN D, TANG Z, WANG M, GAO W, TU L, JIN X, ChEN L, HE Y, ZhANG L, ZhU L, LI Y, LIANG Q, LIN Z, YANG X, LIU N, JIN S, LEI Y, DING Y, LI G, RUAN X, RUAN Y, ZhANG X. The genome sequence of Sea-Island cotton () provides insights into the allopolyploidization and development of superior spinnable fibres.,2015, 5:17662.
[7] LI S, LEI L, GU Y. Functional analysis of complexes with mixed primary and secondary cellulose synthases., 2013, 8(3): e23179.
[8] TAYLOR N G, LAURIE S, TURNER S R. Multiple cellulose synthase catalytic subunits are required for cellulose synthesis in., 2000, 12(12): 2529-2540.
[9] PERSSON S, PAREDEZ A, CARROLL A, PALSDOTTIR H, DOBLIN M, POINDEXTER P, KHITROV N, AUER M, SOMERVILLE C R. Genetic evidence for three unique components in primary cell-wall cellulose synthase complexes in., 2007, 104(39): 15566-15571.
[10] KIM H J, TRIPLETT B A, ZHANG H B, LEE M K, HINCHLIFFE D J, LI P, FANG D D. Cloning and characterization of homeologous cellulose synthase catalytic subunit 2 genes from allotetraploid cotton (L.).,2012, 494(2): 181-189.
[11] KOTAKE T, AOHARA T, HIRANO K, SATO A, KANEKO Y, TSUMURAYA Y, TAKATSUJI H, KAWASAKI S. Rice Brittle culm 6 encodes a dominant-negative form of CesA protein that perturbs cellulose synthesis in secondary cell walls., 2011, 62(6): 2053-2062.
[12] SONG D L, SHEN J H, LI L. Characterization of cellulose synthase complexes in Populus xylem differentiation.2010, 187(3): 777-790.
[13] CREUX N M, RANIK M, BERGER D K, MYBURG A A. Comparative?analysis?of orthologous?cellulose synthase?promoters from, Populus and Eucalyptus: evidence of conserved?regulatory?elements?in angiosperms., 2008, 179(3): 722-737.
[14] LI A, WANG R, LI X, LIU M, FAN J, GUO K, LUO B, CHEN T, FENG S, WANG Y, WANG B, PENG L, XIA T. Proteomic profiling of cellulase-aidextracted membrane proteins for functional identification of cellulose synthase complexes and their potential associated- components in cotton fibers.,2016, 6: 26356.
[15] SONG D L, SHEN J H, LI L G. Characterization of cellulose synthase complexes in Populus xylem differentiation., 2010, 187(3): 777-790.
[16] RICHMOND T A, SOMERVILLE C R. The cellulose synthase superfamily., 2000, 124(2): 495-498.
[17] SUZUKI S, LI L, SUN Y H, Chiang V L. The cellulose synthase gene superfamily and biochemical functions of xylem-specific cellulose synthase-like genes in., 2006, 142(3): 1233-1245.
[18] HAMANN T, OSBORNE E, YOUNGS H L, MISSON J, NUSSAUME L, SOMERVILLE C. Global expression analysis of CESA and CSL genes in., 2004, 11(3/4): 279-286.
[19] FARROKHI N, BURTON R A, BROWNFIELD L, HRMOVA M, WILSON S M, BACIC A, FINCHER G B. Plant cell wall biosynthesis: genetic, biochemical and functional genomics approaches to the identification of key genes., 2006, 4(2): 145-167.
[20] RICHMOND T. Higher plant cellulose synthases., 2000, 1(4): 3001-3006.
[21] KUREK I, KAWAGOE Y, JACOB-WILK D, DOBLIN M, DELMER D. Dimerization of cotton fiber cellulose synthase catalytic subunits occurs via oxidation of the zinc-binding domains., 2002, 99(17): 11109-11114.
[22] SAXENA I M, LIN F C, BROWN RM J R. Cloning and sequencing of the cellulose synthase catalytic subunit gene of., 1990, 15(5): 673-683.
[23] RICHMOND?T A, SOMERVILLE?C R. Integrative approaches to determining Csl function., 2001, 47(1/2): 131-143.
[24] PEAR J R, KAWAGOE Y, SCHRECKENGOST W E, DELMER D P,STALKER D M. Higher plants contain homologs of the bacterialgenes encoding the catalytic subunit of cellulose synthase., 1996, 93(22): 12637-12642.
[25] KAUR S, DHUGGA K S, GILL K, SINGH J. Novel structural and functional motifs in cellulose synthase (CesA) genes of bread wheat (L.)., 2016, 11(1): e0147046.
[26] SUN Y, ALLEN R D. Functional analysis of the BIN2 genes of cotton., 2005, 274(1): 51-59.
[27] TAKATA N, TANIGUCHI T. Expression divergence of cellulose synthase () genes after a recent whole genome duplication event in Polulus., 2015, 241: 29-42.
[28] 朱煜, 譚夢(mèng)月, 鄒愛蘭, 張文舉, 戚金亮, 楊永華. 擬南芥、水稻和毛果楊中基因的進(jìn)化和表達(dá)分析. 南京林業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版), 2013, 37(3): 11-16.
ZHU Y, TAN M Y, ZOU A L, ZHANG W J, QI J L, YANG Y H. Phylogenetic and expression analysis ofgenes in,and., 2013, 37(3): 11-16. (in Chinese)
[29] LI A, XIA T, XU W, CHEN T, LI X, FAN J, WANG R, FENG S, WANG Y, WANG B, PENG L. An integrative analysis of four CESA isoforms specific for fiber cellulose production betweenand., 2013, 237(6): 1585-1597.
[30] SUN Y, FOKAR M, ASAMI T, YOSHIDA S, ALLEN R D. Characterization of the brassinosteroid insensitive 1 genes of cotton., 2004, 54(2): 221-232.
[31] ROACH M J, MOKSHINA N Y, BADHAN A, SNEGIREVA A V, HOBSON N, DEYHOLOS M K, GORSHKOVA T A. Development of cellulosic secondary walls in flax fibers requires beta-galactosidase., 2011, 156(3): 1351-1363.
[32] DESPREZ T, VERNHETTES S, FAGARD?M, REFRéGIER G, DESNOS T, ALETTI E, PY N, PELLETIER S, H?FTE H. Resistance against herbicideisoxaben and cellulose deficiency caused by distinct mutations in same cellulose synthase isoform CESA6., 2002, 128(2): 482-490.
(責(zé)任編輯 李莉)
Bioinformatics and Expression Analysis of the Cellulose Synthase Supergene Family in Flax
YUAN Hong-mei1, GUO Wen-dong2, ZHAO Li-juan3, YU Ying1, WU Jian-zhong1, ZHANG Li-guo1, CHENG Li-li1, ZHAO Dong-sheng1, WU Guang-wen1, GUAN Feng-zhi1
(1Industrial Crops Institute of Heilongjiang Academy of Agricultural Sciences, Harbin 150086;2Nature and Ecology Institute of Heilongjiang Academy of Sciences, Harbin 150040;3Crop Breeding Institute of Heilongjiang Academy of Agricultural Sciences, Harbin 150086)
【Objective】 Thegenes were identified in flax. Then the phylogeny, gene structure and tissue expression pattern were analyzed in order to provide a theoretical basis for studying the mechanism of flax fiber development.【Method】Based on flax genome database and bioinformatics method,genes were identified and the physico-chemical characteristics were analyzed. The phylogenetic tree was constructed by MEGA 5.0 software. The gene structure and conservative motifs were analyzed by the bioinformatics softwares GSDS and MEME. Finally, the expression ofgenes was analyzed by using the RNA-seq data. 【Result】A total of 45genes were systematically identified in flax. The genes appeared to be dispersed within the chromosome and were not clustered. The CesA/Csl proteins were mainly located on the plasma membrane. The number of amino acid of the proteins ranged from 409 to 1 167. The isoelectric point distributed from 5.43 to 9.08. All of the 45 CesA/Csl proteins possessed the transmembrane domains, the number of which was from 2 to 8. The genes were classified into 2 classes (CesA and Csl) and seven groups (CesA, CslA, CslB, CslC, CslD, CslE, CslG) according to the phylogetic relationship. Gene structure prediction indicated thatgenes ranged from 2.1 to 6.8 kb in size and most of them consist of 2 to 14 exons.The gene structure was conserved within a group. Obvious differences were observed in motif composition in genes from different groups. motif 1 to motif 4, motif 12 were observed in most of CesA, CslB, CslD, CslE, and CslG group proteins,and motif 18, and motif 20 were observed in most of CslA, CslC group proteins. Motif 13, motif 14, motif 15, and motif 19 as the spectific motifs were observed in different groups. Futhermore, somegenes could be upregulated or downregulated by BR, Brz and NaCl stress. The results of digital gene expression profile showed thatwere expressed differently at different development stages. It indicated thathad various functions and played different roles in the process of plant development. 【Conclusion】A total of 45genes in flax were systematically identified by genome-wide screening. The genes were classified into 2 classes and seven groups. The genes appeared to be dispersed within the scaffolds. The analysis of gene structure and conservative motifs indicated that there were obvious differences between groups, but the genes within a group varied slightly. RNA-seq expression profiling of thegenes revealed unique, homoeolog-specific expression patterns at different development stages. Some of them could be induced by BR, Brz or NaCl stress.
flax; cellulose synthase;; gene family; expression analysis
2016-03-21;接受日期:2016-08-30
國家博士后面上項(xiàng)目(2014M560275)、黑龍江省博士后項(xiàng)目(LBH-Z13181)、哈爾濱市科技局創(chuàng)新人才項(xiàng)目(2013RFQYJ162)、國家麻類產(chǎn)業(yè)技術(shù)體系(CARS-19-S03)
袁紅梅,E-mail:yuanhm1979@163.com