李雪垠,武懿茂,張鳳潔,韓淵懷*,王興春*
(1.山西農(nóng)業(yè)大學(xué) 生命科學(xué)學(xué)院,山西 太谷 030801;2.山西農(nóng)業(yè)大學(xué) 農(nóng)學(xué)院,山西 太谷 030801)
谷子(Setariaitalica)俗稱“小米”,是二倍體(2n=18)禾本科狗尾草屬糧食作物,基因組大約500 M。谷子起源于中國,具有耐旱、耐貧瘠的特性,是我國北方重要的抗旱雜糧作物[1,2]。小米營養(yǎng)價值很高,富含維生素和其他微量元素,是孕產(chǎn)婦和嬰幼兒的傳統(tǒng)營養(yǎng)食品,即可食用,又具藥用功能[3],越來越受到人們的重視。
谷子通常生長于夏季的北方地區(qū),生長周期內(nèi)經(jīng)常面臨干旱、干熱風(fēng)以及土壤貧瘠等情況。植物有別于動物,不能通過逃避等行為避免如干旱、鹽堿、低溫、干熱風(fēng)等自然災(zāi)害,而且個別地區(qū)自然災(zāi)害頻發(fā)、持續(xù)時間較長,如何保證糧食作物在不確定的逆境下高產(chǎn)、穩(wěn)產(chǎn)是研究者普遍關(guān)注的問題。
轉(zhuǎn)錄因子是動植物中一類重要的調(diào)控蛋白,能對下游基因的時空特異性表達(dá)進(jìn)行精確調(diào)節(jié),是控制植物生物發(fā)育過程和逆境脅迫應(yīng)答反應(yīng)的關(guān)鍵因子[4]。熱激轉(zhuǎn)錄因子(heat shock transcription factor, HSF)在植物熱激反應(yīng)中扮演重要角色,精確調(diào)控植物的熱激反應(yīng)和植物對熱脅迫的耐受性。HSF的特征是具有5個功能結(jié)構(gòu)域,分別是N端的DNA結(jié)合域、寡聚化結(jié)構(gòu)域、核定位信號、核輸出信號和C端的轉(zhuǎn)錄激活結(jié)構(gòu)域[5,6]。
HSF家族成員的鑒定是挖掘植物中熱激響應(yīng)相關(guān)基因、研究植物熱激響應(yīng)機(jī)制的基礎(chǔ)。目前多種植物的全基因組測序已完成,植物中越來越多的HSF基因家族成員已經(jīng)被鑒定和分析,如通過全基因鑒定發(fā)現(xiàn)擬南芥、水稻、番茄、玉米、楊樹和苜蓿等物種中分別含有21、25、18、25、28、16個HSF轉(zhuǎn)錄因子基因家族成員[7]。谷子全基因測序于2012年完成[8],然而谷子HSF轉(zhuǎn)錄因子家族成員仍未進(jìn)行系統(tǒng)鑒定。本研究在全基因組水平上鑒定了谷子HSF轉(zhuǎn)錄因子基因家族成員,并對其進(jìn)行了系統(tǒng)的生物信息學(xué)分析,即系統(tǒng)進(jìn)化、基因結(jié)構(gòu)、蛋白模體、啟動子順式作用元件分析等,對其中的熱激響應(yīng)順式作用元件進(jìn)行了重點(diǎn)分析和研究,并對不同植物組織和不同生長環(huán)境下谷子HSF轉(zhuǎn)錄因子基因的表達(dá)情況進(jìn)行深入分析,旨在為進(jìn)一步鑒定和克隆谷子耐熱基因、挖掘相關(guān)耐熱基因資源奠定理論基礎(chǔ)。
基于PlantTFDB數(shù)據(jù)庫(V4.0, http://planttfdb.cbi.pku.edu.cn/index.php)[9]鑒定谷子HSF轉(zhuǎn)錄因子家族成員,并根據(jù)其在染色體上的分布,分別給谷子HSF基因命名。谷子HSF基因的編碼區(qū)序列(coding sequence, CDS)、氨基酸序列以及染色體定位、基因組位置等信息來源于Phytozome數(shù)據(jù)庫(V12, https://phytozome.jgi.doe.gov/pz/portal.html)。利用在線工具ExPASy-Compute pI/Mw(http://web.expasy.org/compute_pi/)計(jì)算相應(yīng)HSF蛋白質(zhì)的理論等電點(diǎn)和分子量。
利用Clustal X2[10]對谷子HSF基因的氨基酸序列進(jìn)行多重序列比對,并用MEGA5.0[11]以Neighbor-Joining算法構(gòu)建系統(tǒng)發(fā)育樹,參數(shù)No. of Bootstrap replications設(shè)置為1 000。利用GSDS在線工具(Gene Structure Display Server 2.0, http://gsds.cbi.pku.edu.cn/)[12]分析谷子HSF基因的外顯子-內(nèi)含子結(jié)構(gòu)。
利用MEME在線工具(Multiple Em for Motif Elicitation, V5.0.3, http://meme-suite.org/tools/meme)[13]分析谷子HSF轉(zhuǎn)錄因子的蛋白模體。從Phytozome數(shù)據(jù)庫中下載谷子HSF基因5’UTR上游的1.5 kb序列作為其啟動子序列,并利用PlantCARE數(shù)據(jù)庫(Plant Cis-Acting Regulatory Element, http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)[14]分析啟動子序列上的順式作用元件。
谷子HSF轉(zhuǎn)錄因子基因在不同組織中和不同環(huán)境誘導(dǎo)條件下的表達(dá)數(shù)據(jù)來源于Phytozome數(shù)據(jù)庫,利用R語言及pheatmap程序包分析這些HSF基因的表達(dá)數(shù)據(jù)并制作基因表達(dá)熱圖。
利用PlantTFDB數(shù)據(jù)庫在谷子全基因組水平共鑒定谷子HSF轉(zhuǎn)錄因子基因27個,根據(jù)在谷子9條染色體上的分布情況,依次將其命名為SiHSF1-27(表1)。從表1可以看出,谷子HSF基因在染色體上的分布很不均勻,在1~9號染色體上分別有4、5、1、3、4、1、1和8個HSF基因。谷子HSF蛋白質(zhì)的理論等電點(diǎn)和分子量如表1所示。SiHSF2和SiHSF16的等電點(diǎn)偏高(分別為11.49和9.27),等電點(diǎn)偏高與蛋白質(zhì)中堿性氨基酸(精氨酸、賴氨酸、組氨酸)含量較高密切相關(guān)。SiHSF2和SiHSF16蛋白質(zhì)分別含有48和42個堿性氨基酸,較其他HSF蛋白質(zhì)含有更多的堿性氨基酸,這與它們等電點(diǎn)偏高的預(yù)測是相符的。
表1 谷子HSF基因基本信息及其蛋白質(zhì)基本理化性質(zhì)Table 1 Basic information of foxtail millet HSF genes and basic physicochemical properties of the proteins
對27個谷子HSF基因的氨基酸序列進(jìn)行多重序列比對并構(gòu)建系統(tǒng)發(fā)育樹(圖1)。從圖1可看出,27個谷子HSF基因親緣關(guān)系較為相近,比如SiHSF1/SiHSF11/SiHSF15/SiHSF16、SiHSF12/SiHSF13/SiHSF14/SiHSF23、SiHSF5/SiHSF21、SiHSF24/SiHSF27、SiHSF3/SiHSF10/SiHSF17、SiHSF8/SiHSF18/SiHSF19、SiHSF6/SiHSF9/SiHSF25很可能是旁系同源基因,很可能產(chǎn)生于同一個HSF祖先基因的基因復(fù)制事件。
谷子HSF基因的外顯子-內(nèi)含子結(jié)構(gòu)分析結(jié)果如圖1(右)所示,大部分(23個)HSF基因只含有2個外顯子,剩下的4個HSF基因有3個外顯子。從圖1(右)可以看出,親緣關(guān)系較近的HSF基因的基因結(jié)構(gòu)也較為相似,如SiHSF1/SiHSF11/SiHSF15/SiHSF16、SiHSF5/SiHSF21、SiHSF3/SiHSF10/SiHSF17每組都具有相似的基因結(jié)構(gòu),說明親緣關(guān)系較近的HSF基因的基因結(jié)構(gòu)具有較強(qiáng)的保守性。還可以看出,谷子HSF基因的絕大多數(shù)內(nèi)含子的相位是0,只有少數(shù)內(nèi)含子的相位是1或2。
圖1 谷子HSF轉(zhuǎn)錄因子系統(tǒng)進(jìn)化樹(左)與基因結(jié)構(gòu)(右)Fig.1 Phylogenetic tree (Left) and gene structures (Right) of HSF transcription factors in foxtail millet
采用MEME在線工具,分析谷子HSF基因的蛋白質(zhì)模體,結(jié)果如圖2所示。親緣關(guān)系較近的HSF基因的蛋白質(zhì)模體較相似,如SiHSF14/SiHSF23、SiHSF5/SiHSF21、SiHSF10/SiHSF17、SiHSF8/SiHSF18、SiHSF9/SiHSF25每組基因親緣關(guān)系較近(圖1左),它們的蛋白質(zhì)氨基酸序列(基序)也相似(圖2)。從圖2可以看出,27個HSF蛋白質(zhì)序列都含有motif1、motif2和motif3,說明motif1、motif2和motif3在谷子HSF蛋白質(zhì)序列中的分布最為廣泛,具有最強(qiáng)的保守性。motif1、motif2和motif3長度分別為33、38和21個氨基酸,motif2最長,motif3最短;motif1的前4個氨基酸(FVVW)和后16個氨基酸(FKHNNFSSFYRQLNTY)較為保守,motif1富含苯丙氨酸(F);而在motif2中,前13個氨基酸(GFRKYDPDRWEFA)較為保守。此外,這27個HSF蛋白質(zhì)中有25個序列含有motif4,說明motif4在谷子HSF蛋白質(zhì)序列中的保守性也較強(qiáng)。上述蛋白質(zhì)基序中的保守氨基酸很可能與HSF蛋白質(zhì)的功能密切相關(guān)。
利用PlantCARE在線工具分析27個谷子HSF基因的啟動子順式作用元件,結(jié)果如表2所示,每類順式作用元件的核心序列和功能如表3所示。
SiHSF20基因啟動子區(qū)域含有2個ABRE元件、1個MBS元件和1個TC-rich repeats元件。ABRE元件的核心序列為ACGTG,功能涉及植物ABA響應(yīng),研究表明植物的耐熱反應(yīng)與ABA信號通路密切相關(guān)[5,7];MBS元件的核心序列為CAACTG,功能涉及植物干旱誘導(dǎo),高溫、干熱風(fēng)等熱脅迫往往伴隨著干旱;TC-rich repeats元件的核心序列為GTTTTCTTAC,功能涉及植物脅迫響應(yīng),可能參與植物的熱激應(yīng)答。
圖2 谷子HSF轉(zhuǎn)錄因子蛋白質(zhì)模體Fig.2 Protein motifs of HSF transcription factors of foxtail millet
基因GeneABRECAAT-boxCGTCA-motifG-boxGT1-motifMBSLTRTATA-boxTCA-elementTGA-elementTGACG-motifAuxRR-coreP-boxSp1TC-rich repeatsSiHSF112413101171010000SiHSF251834000141030010SiHSF33206411052060000SiHSF401621031171020041SiHSF502601120151201101SiHSF642334100210030031SiHSF71184200000040210SiHSF8575400120050090SiHSF932113000270010001SiHSF10797701051170400SiHSF118635011120130000SiHSF1232124000241120000SiHSF1342924000160020020SiHSF146200600090001001SiHSF15372221071020240SiHSF167212523012002010SiHSF1751315100190010210SiHSF1831422012130020010SiHSF1921433021141030030SiHSF2022910010141210001SiHSF211214022290241000SiHSF22637500010070030SiHSF2321643100181040020SiHSF2432223110100221110SiHSF252012001210010000SiHSF264164300060140000SiHSF271200101210000000
表3 谷子HSF基因啟動子順式作用元件核心序列與功能Table 3 Core sequences and functions of cis-acting elements in the promoters of foxtail millet HSF genes
SiHSF4基因啟動子區(qū)域含有3個MBS元件和1個TC-rich repeats元件,SiHSF16基因啟動子區(qū)域含有7個ABRE元件和3個MBS元件,SiHSF19基因啟動子區(qū)域含有2個ABRE元件和2個MBS元件,SiHSF11基因啟動子區(qū)域含有8個ABRE元件和1個MBS元件,SiHSF10基因啟動子區(qū)域含有7個ABRE元件和1個MBS元件,SiHSF14基因啟動子區(qū)域含有6個ABRE元件和1個TC-rich repeats元件。上述基因(SiHSF4、SiHSF10、SiHSF11、SiHSF14、SiHSF16、SiHSF19、SiHSF20)啟動子區(qū)域內(nèi)富含熱激相關(guān)順式作用元件,所以它們可能與谷子的熱激應(yīng)答密切相關(guān)。
利用R語言及pheatmap程序包分析谷子HSF基因在不同組織中和不同環(huán)境誘導(dǎo)條件下的表達(dá)數(shù)據(jù)(圖3)。在圖3中,具有相似表達(dá)情況的基因聚類在一起,如SiHSF6、SiHSF9、SiHSF13、SiHSF15和SiHSF18在黃化的幼苗(Etiolated_seedling)中表達(dá)量較高,在其他組織中的表達(dá)量較低,所以它們聚類在同一分支。SiHSF1、SiHSF2和SiHSF3在干旱處理的根組織(Root_drought)中表達(dá)量都較高,在其他組織中表達(dá)量較低,它們也聚類在同一分支中。
SiHSF10、SiHSF19和SiHSF24三個基因在遠(yuǎn)紅光處理的地上部分(Total_aerial_far_red_light)表達(dá)量較高,說明遠(yuǎn)紅光能夠誘導(dǎo)這3個HSF基因的表達(dá)。
谷子具有耐旱、耐貧瘠的特性,對生長環(huán)境要求不高,是典型“環(huán)境友好型”作物,由于谷子耐逆境脅迫能力較其它作物更強(qiáng),所以對谷子的基礎(chǔ)研究也逐漸引起植物科學(xué)家的關(guān)注,谷子中的抗逆基因資源的挖掘更是成為一個新的研究熱點(diǎn)。植物的抗逆境脅迫反應(yīng)機(jī)制較為復(fù)雜,往往涉及很多轉(zhuǎn)錄因子的調(diào)控,比如bZIP、MYB、NAC、WRKY、DREB、HSF等轉(zhuǎn)錄因子[15~24]。研究表明,HSF轉(zhuǎn)錄因子廣泛參與植物熱激響應(yīng)和抗逆反應(yīng)[5],HSF基因家族的鑒定是研究植物熱激反應(yīng)機(jī)理和植物耐熱、耐旱特性的基礎(chǔ),目前谷子HSF轉(zhuǎn)錄因子的鑒定和系統(tǒng)分析尚未見報(bào)道,本研究從全基因組水平上對谷子HSF基因家族進(jìn)行鑒定,并進(jìn)行了一系列生物信息學(xué)分析。
圖3 谷子HSF基因在不同組織和不同環(huán)境誘導(dǎo)條件下的基因表達(dá)Fig.3 Expressions of foxtail millet HSF genes in different tissues and under different conditions
谷子中親緣關(guān)系較近的HSF基因一般具有相似的基因結(jié)構(gòu)和蛋白質(zhì)模體,如SiHSF5/SiHSF21、SiHSF10/SiHSF17每對HSF基因的親緣關(guān)系都很近,其基因結(jié)構(gòu)和蛋白質(zhì)模體也很相似,推測每對HSF基因很有可能來源于同一祖先基因,是基因復(fù)制的結(jié)果,很有可能是旁系同源基因。由于SiHSF5位于2號染色體上,SiHSF21位于9號染色體上,所以旁系同源基因SiHSF5/SiHSF21很可能來源于并聯(lián)基因復(fù)制事件;SiHSF10位于3號染色體,SiHSF17位于5號染色體上,所以旁系同源基因SiHSF10/SiHSF17也很可能來源于并聯(lián)基因復(fù)制事件。
植物對熱脅迫等逆境的響應(yīng)很可能和ABA信號通路密切相關(guān)[7],而自然條件下的干熱風(fēng)等熱脅迫往往伴隨干旱。SiHSF20基因啟動子區(qū)域同時包含ABRE、MBS和TC-rich repeats元件,說明SiHSF20基因作為熱激轉(zhuǎn)錄因子家族成員,很有可能參與植物熱激響應(yīng)。SiHSF4等基因的啟動子區(qū)域都含有ABRE、MBS和TC-rich repeats元件中的兩種,而且元件數(shù)量也較多,說明這些熱激轉(zhuǎn)錄因子基因也有可能參與谷子對熱脅迫的應(yīng)答。
值得一提的是,谷子SiHSF6和SiHSF9基因在系統(tǒng)發(fā)育樹中親緣關(guān)系較近,而基因表達(dá)分析顯示SiHSF6和SiHSF9基因都在黃化的幼苗(Etiolated_seedling)中表達(dá)量較高,在其他組織中的表達(dá)量較低,說明親緣關(guān)系較近的HSF基因有可能具有相似的表達(dá)特性;然而,還有很多同源基因的表達(dá)量差異很大。由于順式作用元件能夠顯著影響基因表達(dá)的時空特性,這些同源基因的表達(dá)量差異可能與它們啟動子區(qū)域的順式作用元件的種類和數(shù)量變異密切相關(guān)。
本研究基因表達(dá)分析顯示,干旱處理?xiàng)l件下SiHSF1、SiHSF2和SiHSF3基因的表達(dá)量較高,說明干旱可以誘導(dǎo)SiHSF1、SiHSF2和SiHSF3基因的表達(dá),自然條件下干熱風(fēng)等熱脅迫往往伴隨著干旱,所以熱激轉(zhuǎn)錄因子基因SiHSF1、SiHSF2和SiHSF3很可能與植物熱激響應(yīng)密切相關(guān),它們可能在谷子逆境脅迫和熱激應(yīng)答中扮演著重要角色。谷子HSF基因的表達(dá)分析有助于進(jìn)一步鑒定熱激應(yīng)答相關(guān)基因,為挖掘植物耐熱基因資源提供理論依據(jù),為后續(xù)分子育種奠定基礎(chǔ)。