朱利利 慶 軍 杜慶鑫 何 鳳 杜紅巖*
(1.中國(guó)林業(yè)科學(xué)研究院經(jīng)濟(jì)林研究開(kāi)發(fā)中心,鄭州 450003; 2.國(guó)家林業(yè)局杜仲工程技術(shù)研究中心,鄭州 450003)
杜仲(EucommiaulmoidesOliv.)為杜仲科(Eucommiaceae)杜仲屬(Eucommia)的單科單屬植物,是第四紀(jì)冰川期后僅留存于我國(guó)的孑遺植物,具有重要的藥用價(jià)值和經(jīng)濟(jì)價(jià)值[1]。杜仲的皮、葉、果等器官中含有豐富的杜仲膠、黃酮、多酚、綠原酸等次生代謝物質(zhì)[2~4]。杜仲通過(guò)調(diào)節(jié)一系列代謝途徑激活防御系統(tǒng)保護(hù)其在多種環(huán)境條件下正常生長(zhǎng)發(fā)育,其中茉莉酸、愈傷激素、脂肪酸氫過(guò)氧化物、醛類揮發(fā)物在植物的生長(zhǎng)發(fā)育和防御過(guò)程中發(fā)揮重要作用,而這些物質(zhì)的生物合成過(guò)程受到脂氧合酶(Lipoxygenases,LOX)(EC:1.13.11.12)催化[5]。脂氧合酶(LOX)是一種含有非血紅素鐵的氧合酶,廣泛存在于真核和原核生物中,參與JA,醛類、醇類等芳香物質(zhì)的生物合成[6]。LOX在植物中以亞油酸、亞麻酸為底物,其9位或13位碳原子加氧生成脂氫過(guò)氧化物,根據(jù)加氧位置分為9-LOX和13-LOX[7]。LOX定位于植物不同亞細(xì)胞器,如黃瓜(Cucumissativus)的脂溶性LOX存在于胞槳和液泡中,而以跨膜蛋白形式存在的LOX定位于脂體膜和質(zhì)膜上[8],同時(shí)LOX也定位于葉綠體、微粒體、脂體等細(xì)胞器[9]。
LOX是一個(gè)多基因家族,研究發(fā)現(xiàn)擬南芥(Arabidopsisthaliana)中有6個(gè)LOX[10],葡萄(Vitisvinifera)中有18個(gè)LOX(有5個(gè)為假基因)[11],楊樹(Populustrichocarpa)中有21個(gè)LOX[12]。LOX是一種同工酶,植物的不同發(fā)育階段和脅迫條件可誘導(dǎo)相應(yīng)特異LOX基因的表達(dá)。水稻(Oryzasativa)[13]、擬南芥[14]、番茄[15]等植物受到機(jī)械損傷時(shí),其13-LOX基因特異表達(dá)誘導(dǎo)JA生物合成;煙草(Nicotianatabacum)受到病菌感染時(shí),9-LOX類型基因活性增加[16];土豆(Solanumtuberosum)葉片接種真菌后,POTLX-3(9-LOX類型)表達(dá)量增加,但機(jī)械損傷對(duì)9-LOX基因沒(méi)有影響[17]。
目前杜仲的基因組測(cè)序已完成,在全基因組水平上研究杜仲的LOX基因信息對(duì)探索杜仲的生長(zhǎng)發(fā)育和抗脅迫能力提供參考。本研究利用生物信息學(xué)方法對(duì)杜仲的LOX基因家族進(jìn)行鑒定和分類,同時(shí)結(jié)合杜仲的RNA-seq,分析LOX家族在杜仲不同發(fā)育時(shí)期、組織器官的表達(dá)譜,探索杜仲LOX基因家族功能。
杜仲基因組測(cè)序數(shù)據(jù)、CDS序列、蛋白質(zhì)序列及其注釋信息均來(lái)源于杜仲基因組數(shù)據(jù)(NCBI登錄號(hào)PRJNA357336、SRP095726及SRS2666014)。查閱國(guó)內(nèi)外文獻(xiàn),下載已分類的5種植物的LOX氨基酸序列,水稻下載自水稻基因組(http://rice.plantbiology.msu.edu/)、擬南芥下載自TAIR(http://www.arabidopsis.org/),番茄下載自NCBI(登錄號(hào)TomLOXA(U09026)、TomLOXB(U09025)、TomLOXC(U37839)、TomLOXD(U37840)、TomLOXE(AY008278)和TomLOXF(FJ617476)),葡萄和楊樹的LOX氨基酸序列下載Phytozomev.11.0(https://phytozome.jgi.doe.gov/pz/portal.html)。
LOX基因的結(jié)構(gòu)域信息(PF00305)下載自Pfam數(shù)據(jù)庫(kù),利用Hmmer 3.0軟件建立Profile HMM模型,并利用此模型檢索下載杜仲基因組數(shù)據(jù)中的蛋白質(zhì)序列,根據(jù)已得到的杜仲LOX基因家族序列建立新的HMM模型,用新的模型再次檢索杜仲蛋白質(zhì)序列,得到的序列被認(rèn)為是候選蛋白質(zhì)序列,所有蛋白結(jié)構(gòu)域經(jīng)過(guò)SMART(http://smart.embl/heidelberg.de/)驗(yàn)證。利用GSDS在線工具(http://gsds.cbi.pku.edu.cn/)制作基因外顯子-內(nèi)含子結(jié)構(gòu)圖。利用Plant-Ploc在線工具(http://www.csbio.sjtu.edu.cn/bioinf/plant/)、WOLFPSORT(http://wolfpsort.seq.cbrc.jp/)和Softberry(http://www.softberry.com/)預(yù)測(cè)亞細(xì)胞定位,綜合3個(gè)軟件預(yù)測(cè)結(jié)果進(jìn)行分析。
利用ClustalX2.0.12軟件對(duì)杜仲、擬南芥、番茄、葡萄、楊樹和水稻的LOX氨基酸序列進(jìn)行多重序列比對(duì)。比對(duì)結(jié)果用軟件MEGA6.0的最大似然法(Maximum Likelihood)構(gòu)建系統(tǒng)進(jìn)化樹,抽樣次數(shù)為1000(bootstrap:1000 relications),其他為默認(rèn)值。
使用在線工具ProtParam(http://web.expasy.org/protparam/)評(píng)估杜仲LOX蛋白的理論等電點(diǎn)、分子量、疏水性等理化性質(zhì),利用在線分析工具HNN Secondary StructurePrediction(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_hnn.html)預(yù)測(cè)LOX蛋白的α-螺旋、延伸鏈等二級(jí)結(jié)構(gòu)。
通過(guò)下載不同發(fā)育時(shí)期的國(guó)家審定杜仲良種‘華仲6號(hào)’的葉片(4月18日、5月18日、6月17日、7月17日、8月16日及9月20日)、果實(shí)(采樣時(shí)間同葉片相同)和‘神農(nóng)架’樹皮(5月20日、7月20日及9月20日)的轉(zhuǎn)錄組數(shù)據(jù)獲得杜仲LOX基因的測(cè)序表達(dá)譜(FPKM值,fragments per kilobase of exon per million fragments mapped),數(shù)據(jù)來(lái)源于杜仲基因組RNA數(shù)據(jù),同時(shí)從NCBI網(wǎng)站SRA數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/sra)下載‘華仲6號(hào)’花后70天和160天種仁的測(cè)序表達(dá)譜(登錄號(hào)分別是SRR3203265,70d;SRR3203241,160d)。去除在不同發(fā)育時(shí)期和組織中FPKM均小于1的基因,利用EXCELL對(duì)篩選的基因FPKM值進(jìn)行l(wèi)og10(FPKM+1)轉(zhuǎn)換,對(duì)數(shù)轉(zhuǎn)換后的數(shù)據(jù)利用SPSS進(jìn)行標(biāo)準(zhǔn)化,利用軟件Cluster 3.0和JAVA TreeView-1.1.6對(duì)標(biāo)準(zhǔn)化的表達(dá)數(shù)據(jù)聚類分析。
通過(guò)Hmmer 3.0搜索,杜仲基因組共鑒定出23個(gè)LOX基因家族成員(表1)。23個(gè)LOX基因分布于12條scaffolds,每條scaffold上分布的基因數(shù)量為1~5個(gè),而多基因分布的scaffolds上的基因呈聚集形式分布,形成串聯(lián)重復(fù),推測(cè)這些基因發(fā)生過(guò)復(fù)制事件。杜仲LOX基因內(nèi)含子數(shù)量分布范圍是0~6,有9個(gè)LOX基因不含內(nèi)含子,有4個(gè)基因含5個(gè)內(nèi)含子,有5個(gè)基因含6個(gè)內(nèi)含子,其他LOX基因分別含有1~2個(gè)內(nèi)含子,其中EU05484-RA的內(nèi)含子序列長(zhǎng)度顯然長(zhǎng)于其它LOX基因內(nèi)含子序列,內(nèi)含子具體分布位置如圖1所示。亞細(xì)胞定位預(yù)測(cè)結(jié)果顯示杜仲23個(gè)LOX基因有15個(gè)定位于細(xì)胞質(zhì),8個(gè)定位于葉綠體。
表1 杜仲LOX基因家族信息
圖1 杜仲LOX基因內(nèi)含子外顯子結(jié)構(gòu)Fig.1 The intron-exon structures of LOX genes in E.ulmoide
圖2 杜仲與其他植物L(fēng)OX氨基酸序列的系統(tǒng)進(jìn)化樹Fig.2 Phylogenetic tree analysis of the amino acid sequences of LOX in E.ulmoides and other plants
依據(jù)杜仲LOX家族氨基酸長(zhǎng)度和序列結(jié)構(gòu)特征差異等特點(diǎn),運(yùn)用ClustalX2.0.12和MEGA對(duì)杜仲LOX氨基酸序列和已進(jìn)行分類和功能研究的水稻、擬南芥、番茄、楊樹、葡萄的LOX氨基酸序列構(gòu)建系統(tǒng)進(jìn)化樹。進(jìn)化樹顯示杜仲的LOX編碼蛋白與番茄的LOX蛋白遺傳距離最近,其次與葡萄、楊樹和擬南芥的距離較近,而與水稻的LOX編碼蛋白距離最遠(yuǎn)。杜仲23個(gè)LOX蛋白與其他5種植物的LOX蛋白分類結(jié)果相似,也可分為9-LOX蛋白和13-LOX蛋白兩個(gè)類型,其中僅有EUC05484-RA編碼蛋白屬于9-LOX,其余22個(gè)LOX蛋白均屬于13-LOX,杜仲的13-LOX蛋白家族成員數(shù)量占據(jù)明顯優(yōu)勢(shì),說(shuō)明杜仲的13-LOX家族成員在進(jìn)化上產(chǎn)生了較多擴(kuò)增事件。杜仲的22個(gè)13-LOX家族成員聚為2個(gè)分支,其中第一個(gè)分支由EUC09637-RA和EUC22336-RA組成,分別與葡萄的GSVIVT01010359001編碼蛋白和番茄的TomLOXD蛋白聚成一支,且較杜仲其他13-LOX家族成員與9-LOX類型聚類距離更近;杜仲其余20個(gè)13-LOX家族成員組成第二個(gè)分支,同時(shí)第二分支又繼續(xù)分為3個(gè)小支,其中有17個(gè)成員與番茄的TomLOXC和TomLOXF蛋白聚為第一個(gè)小支,而EUC19390-RA單獨(dú)與葡萄的GSVIVT01032029001編碼蛋白聚為第二小支,EUC23900-RA和EUC19389-RA與楊樹的Potri.009G022400.1蛋白聚為第三小支。杜仲的9-LOX家族唯一成員EUC05484-RA與葡萄的3個(gè)9-LOX蛋白聚在一起、遺傳距離較近。遺傳距離越近,表明蛋白結(jié)構(gòu)和功能更為相似,暗示杜仲的LOX蛋白功能可能與番茄、葡萄和楊樹的特定LOX蛋白具有相似的生理作用。
利用Protparam在線工具分析杜仲LOX蛋白一級(jí)結(jié)構(gòu),表2顯示杜仲23個(gè)LOX基因家族成員中,EUC22336-RA編碼的氨基酸數(shù)量最多為968aa,EUC24023-RA編碼的氨基酸數(shù)量最少為92,同時(shí)結(jié)果表明杜仲LOX基因家族編碼氨基酸數(shù)目與其分子質(zhì)量整體呈正相關(guān),23個(gè)LOX基因的氨基酸數(shù)量和分子質(zhì)量均具有差異。根據(jù)理論等電點(diǎn)氨基酸可以分為堿性氨基酸(Theoretical pI>7)和酸性氨基酸或中性氨基酸(Theoretical pI≦7);蛋白質(zhì)總平均疏水性正值表現(xiàn)疏水性、負(fù)值表現(xiàn)為親水性,且疏水值越大越疏水,值越小越親水。其中EUC05484-RA為9-LOX家族成員,編碼氨基酸數(shù)量為401,理論等電點(diǎn)是5.98,為酸性氨基酸,同時(shí)總平均疏水值為-0.312,為親水性氨基酸。其余13-LOX類型中包括6個(gè)堿性氨基酸和16個(gè)酸性氨基酸或中性氨基酸,22個(gè)LOX蛋白疏水值均為負(fù)值,表現(xiàn)為親水性。
表2 杜仲LOX基因家族蛋白理化性質(zhì)分析
HNN Secondary Stucture Prediction分析顯示α-螺旋、延伸鏈和無(wú)規(guī)則卷曲在杜仲整個(gè)LOX蛋白質(zhì)都有散布,其中無(wú)規(guī)則卷曲易受側(cè)鏈相互作用,經(jīng)常構(gòu)成活性部位和功能部位,而α-螺旋在DNA結(jié)合基序中具有重要作用。杜仲有21個(gè)LOX蛋白以無(wú)規(guī)則卷曲所占比例較高為主要構(gòu)成元件,α-螺旋所占比例次之,延伸鏈比例最低,其中以EUC19389-RA蛋白的無(wú)規(guī)則卷曲比例最高為60.31%。而EUC16930-RA和EUC24023-RA 2個(gè)LOX蛋白則以α-螺旋所占比例較高為主要構(gòu)成元件,比例分別為47.29%和52.17%,其次無(wú)規(guī)則卷曲比例略低,分別為44.96%和35.87%,而延伸鏈比例最低。
杜仲LOX基因家族在3個(gè)組織中的表達(dá)模式顯示,有6個(gè)LOX基因(EUC16892-RA、EUC16893-RA、EUC16929-RA、EUC16930-RA、EUC24023-RA和EUC26492-RA)在不同發(fā)育時(shí)期及各組織中的FPKM值為0或接近0,暗示這6個(gè)基因在杜仲皮、葉、果和種仁中均不表達(dá),其余17個(gè)LOX基因表達(dá)具有組織和時(shí)空特異性。組織特異性表達(dá)規(guī)律顯示,這17個(gè)LOX基因表達(dá)模式可以分為3類,第Ⅰ類基因包含7個(gè),在不同發(fā)育時(shí)期的果和葉中表達(dá)相對(duì)高,而在皮和種仁中表達(dá)相對(duì)較低;第Ⅱ類包含2個(gè)基因,在種仁中表達(dá)相對(duì)較高,其次在不同發(fā)育時(shí)期杜仲的皮、果有一定的表達(dá)量,而在不同發(fā)育時(shí)期的杜仲葉中表達(dá)相對(duì)較低;第Ⅲ類有8個(gè)基因,在杜仲皮中表達(dá)相對(duì)較高,在不同發(fā)育時(shí)期葉中有一定表達(dá),在不同生長(zhǎng)發(fā)育時(shí)期的果和種仁中表達(dá)相對(duì)較低,且第Ⅱ類和第Ⅲ類基因的表達(dá)更為相似。時(shí)空特異性表達(dá)規(guī)律顯示,杜仲9-LOX基因(EUC05484-RA)在5月20日的皮、4月18日的果、4月18日的葉及花后70天的種仁中表達(dá)量相對(duì)其它時(shí)期較高,可能在生長(zhǎng)發(fā)育早期階段發(fā)揮重要作用;杜仲13-LOX基因在不同發(fā)育時(shí)期的組織中表達(dá)模式多樣,一些基因在生長(zhǎng)初期和后期表達(dá)高于中期,如EUC18779在4月份和8月份的果和葉中表達(dá)高于其他時(shí)期;同時(shí)也存在后期生長(zhǎng)發(fā)育階段表達(dá)高于前期的基因,如EUC16932在9月份皮、8月份果、葉及花后160天種仁中表達(dá)高于其他時(shí)期;也存在一些基因在各個(gè)發(fā)育時(shí)期的組織中表達(dá)量均相似,如EUC21473在4個(gè)組織的不同時(shí)期表達(dá)無(wú)明顯差異。表達(dá)譜聚類圖結(jié)果顯示定位于一條Scaffold的基因表達(dá)模式總體相似,說(shuō)明串聯(lián)重復(fù)的基因可能具有相似的生理功能。
圖4 杜仲LOX基因表達(dá)聚類分析Fig.4 Heat map of LOX gene expression obtained from RNA-seq in E.ulmoides
通過(guò)全基因組分析,從杜仲中鑒定了23個(gè)LOX基因,13-LOX型家族成員22個(gè),9-LOX型家族成員僅一個(gè)。其中一些13-LOX成員以基因簇形式分布,可能發(fā)生了復(fù)制,形成串聯(lián)重復(fù)?;驈?fù)制在基因家族進(jìn)化過(guò)程中具有重要作用,可產(chǎn)生新基因并發(fā)生亞功能化或新功能化,以功能互補(bǔ)的方式分擔(dān)祖先基因的功能[18],串聯(lián)重復(fù)基因更易發(fā)生內(nèi)含子獲得,促進(jìn)外顯子重組和基因進(jìn)化[19]。杜仲表達(dá)譜聚類顯示其串聯(lián)重復(fù)基因在不同發(fā)育時(shí)期的各個(gè)組織器官中表達(dá)量雖有一定差異,但總體變化趨勢(shì)是相似的,表明杜仲的串聯(lián)重復(fù)基因在生理功能更可能發(fā)生了亞功能化,以功能互補(bǔ)的方式作用機(jī)體。
前人研究顯示13-LOX及其衍生物更多參與茉莉酸、醛類、醇類物質(zhì)合成,在逆境脅迫防御過(guò)程中發(fā)揮作用[21],而9-LOX基因及其衍生物與植物生長(zhǎng)發(fā)育[20]和抗菌[22]具有一定的相關(guān)性。Chauvin等發(fā)現(xiàn)擬南芥的13-LOX基因能夠促進(jìn)JA的合成抵抗機(jī)械損傷脅迫[14]。孫炎鋒等發(fā)現(xiàn)13-LOX基因在擬南芥葉片衰老過(guò)程中也發(fā)揮重要生理作用[23]。此外,番茄的13-LOX類型(TomLOXC、TomLOXD和TomLOXF)與茉莉酸合成相關(guān),其中TomLOXC和TomLOXD與機(jī)械損傷有關(guān),具有抵抗生物和非生物脅迫作用,同時(shí)兩者也參與C6醛類揮發(fā)物合成以形成特殊風(fēng)味;而番茄9-LOX基因(TomLOXA、TomLOXB和TomLOXE)則與果實(shí)成熟相關(guān)[15]。但研究發(fā)現(xiàn)擬南芥和小麥在感染病菌后其9-LOX基因通過(guò)調(diào)節(jié)水楊酸和茉莉酸信號(hào)傳導(dǎo)能力促進(jìn)抗病[24]。
杜仲的22個(gè)13-LOX基因,其中有18個(gè)基因與番茄的13-LOX基因(TomLOXC、TomLOXF)遺傳距離比較近,表明杜仲的13-LOX基因可能參與茉莉酸、醛類、醇類物質(zhì)的合成,或許與植物衰老、機(jī)械損傷等過(guò)程相關(guān),暗示杜仲的13-LOX具有抵抗生物和非生物脅迫的潛在能力,同時(shí)13-LOX在不同組織中和不同發(fā)育時(shí)期表達(dá)特征存在多樣性,不同類型13-LOX基因在杜仲的特定生長(zhǎng)發(fā)育階段具有高表達(dá),這些基因可能以功能互補(bǔ)的方式在杜仲整個(gè)生長(zhǎng)發(fā)育時(shí)期發(fā)揮生理作用。表達(dá)分析結(jié)果顯示杜仲9-LOX基因EU05485表達(dá)同樣具有組織特異性,且在組織發(fā)育前期表達(dá)較高,在生長(zhǎng)后期表達(dá)量下降,但在發(fā)育后期是否作用減弱還需要試驗(yàn)驗(yàn)證。目前關(guān)于杜仲LOX基因家族的具體生理功能還需進(jìn)一步的試驗(yàn)驗(yàn)證分析。