王蕊,高峰,Kenneth Omondi Ouma,倪照君,侍婷,高志紅
(南京農(nóng)業(yè)大學(xué)果樹生物技術(shù)實驗室/園藝學(xué)院,江蘇 南京 210095)
梅(Prunusmume)原產(chǎn)于中國,其果實具有較高的營養(yǎng)價值,經(jīng)濟(jì)栽培主要分布在東亞和東南亞的亞熱帶地區(qū),中國是目前梅種植面積最大的國家[1]。植物芽休眠對多年生落葉果樹抵抗冬季不利生長環(huán)境,并在次年春季正常萌芽和開花具有特別重要的意義[2]。而梅需冷量范圍較廣,對于研究果樹季節(jié)性休眠機(jī)制具有獨特優(yōu)勢[3]。
生長調(diào)控因子(growth regulating factors,GRF)編碼的蛋白是植物特有的,2000年在水稻中被首次發(fā)現(xiàn),并命名為OsGRF1[4]。2003年,Kim等[5]進(jìn)一步研究發(fā)現(xiàn)GRF基因在調(diào)控植物生長和發(fā)育中發(fā)揮著至關(guān)重要的作用。在擬南芥中異位過表達(dá)白菜BrGRF8,可使植株子葉增大[6],過表達(dá)AtGRF1和AtGRF2則使葉片顯著增大[5]。在擬南芥中超表達(dá)AtGRF7和AtGRF9會影響雌蕊的發(fā)育[7],過表達(dá)AtGRF1和AtGRF2 則導(dǎo)致晚花現(xiàn)象[5]。在油菜中超表達(dá)BnGRF2可提高種籽粒質(zhì)量和油脂含量[8]。菊花GRF參與開花和周期調(diào)控以及對鹽和低溫等脅迫響應(yīng)過程[9]。以上研究表明,植物GRF基因在生長、品質(zhì)形成和脅迫響應(yīng)方面都發(fā)揮了重要作用,是植物特有的一個重要調(diào)控因子。落葉果樹休眠及開花機(jī)制一直都是研究熱點,但目前PmGRF基因家族在功能相關(guān)方面的研究還存在空缺。本研究利用生物信息學(xué)手段對PmGRF家族進(jìn)行分析,主要包括基因結(jié)構(gòu)和保守基序分析、共線性分析以及在休眠4個時期的表達(dá)模式等,以期進(jìn)一步了解PmGRF基因家族的功能。
供試材料為梅品種‘桃形梅’,采自位于南京的國家果梅種質(zhì)資源圃。從2020年9月27日至2021年1月31日,每隔7 d采集一年生枝條上的花芽,用液氮速凍后立刻帶回實驗室置于-80 ℃冰箱保存,并按照當(dāng)年物候以及芽的發(fā)育狀況將樣品按照抑制性休眠、生理休眠、生態(tài)休眠和休眠解除4個階段歸類。其中,2020年9月27日至2020年11月1日為抑制性休眠階段,2020年11月2日至2020年12月1日為生理休眠階段,2020年12月2日至2021年1月3日為生態(tài)休眠階段,2020年1月4日至2021年1月31日為生態(tài)休眠階段。
從NCBI網(wǎng)站(http://www.ncbi.nlm.nih.gov)下載梅GRF蛋白序列,從Pfam網(wǎng)站(http://pfam.xfam.org/)下載WRC(PF08879)和QLQ(PF08880)保守域的隱馬爾可夫模型(HMM)。利用Hmmer 3.0 軟件檢索梅蛋白組數(shù)據(jù)庫,去除登錄號相同的冗余序列,得到候選蛋白序列,利用SMATR網(wǎng)站(http://smart.embl.de/smart/batch.pl)驗證候選蛋白是否存在WRC和QLQ結(jié)構(gòu)域,若存在則屬于梅GRF 蛋白家族。
用ProtParam在線網(wǎng)站(https://web.expasy.org/protparam/)分析梅GRF基因家族成員的蛋白質(zhì)特性,例如相對分子質(zhì)量、等電點(pI)和疏水性(GRAVY)等。運用BUSCA在線網(wǎng)站(http://busca.biocomp.unibo.it/)預(yù)測梅GRF基因家族成員蛋白的亞細(xì)胞定位。從NCBI數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov)下載PmGRF基因家族成員的內(nèi)含子、外顯子信息、梅8條染色體的長度以及每個PmGRF基因的染色體位置,利用在線軟件GSDS 2.0(http://gsds.gao-lab.org/index.php)繪制基因結(jié)構(gòu)示意圖,并使用MG2C在線網(wǎng)站(http://mg2c.iask.in/mg2c_v2.1/)在每條染色體上繪制精確的基因分布位置。利用MEME網(wǎng)站(http://meme-suite.org/tools/meme)分析PmGRF基因家族蛋白的保守基序,保守基序的最大檢索值設(shè)置為15?;蜷g以及物種間的共線性圖譜繪制和Ka/Ks計算由MCScanX軟件(http://chibba.pgml.uga.edu/mcscan2)和KaKs計算器(http://code.google.com/p/kaks-calculator/wiki/KaKs_Calculator)完成。從NCBI數(shù)據(jù)庫中檢索每個PmGRF基因的啟動子序列后利用PlantCARE網(wǎng)站(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)進(jìn)行啟動子順式作用元件分析。
使用ClustalW比對所有GRF序列,參數(shù)設(shè)置為默認(rèn),再用MEGA X構(gòu)建擬南芥、梅、杏、扁桃和桃GRF基因家族的綜合系統(tǒng)發(fā)育樹。從NCBI SRA數(shù)據(jù)庫下載RNA-seq數(shù)據(jù)后用TBtools繪制熱圖[10],分析PmGRF基因在莖、葉、根、芽和果實中的表達(dá)譜。
采用多糖多酚植物RNA提取試劑盒(成都福際生物技術(shù)有限公司)提取RNA,使用SYBR PreMixExTaqTM(TaKaRa)進(jìn)行反轉(zhuǎn)錄得到4個休眠階段的cDNA,然后對15個PmGRF進(jìn)行RT-qPCR試驗,并用公式2-ΔΔCT計算各個基因的相對表達(dá)量。用于RT-qPCR的引物如表1所示。
表1 用于檢測PmGRF 基因表達(dá)的RT-qPCR 引物序列Table 1 Primer sequences for detection of the PmGRF genes expression with RT-qPCR
根據(jù)GRF基因中的QLQ(PF08880)和WRC(PF08879)保守結(jié)構(gòu)域,從梅基因組中檢索并去除冗余序列后最終共鑒定出15個梅GRF基因,命名為PmGRF01—PmGRF15。由表 2可知:GRF蛋白在理論等電點、相對分子質(zhì)量等方面均存在差異,其中PmGRF01編碼的氨基酸序列中含有連續(xù)的未知氨基酸,所以其理論等電點以及相對分子質(zhì)量無法確定。PmGRF基因編碼的氨基酸數(shù)為283(PmGRF06)~2 254(PmGRF15),相對分子質(zhì)量為31 560.8(PmGRF06)~252 420.6(PmGRF15),蛋白質(zhì)理論等電點(pI)為5.75(PmGRF02)~9.50(PmGRF05)。87%的PmGRF基因家族編碼蛋白的pI大于7,因此,說明梅GRF基因家族編碼的多數(shù)蛋白富含堿性氨基酸。蛋白質(zhì)疏水性(GRAVY)介于-1.064(PmGRF06)~-0.607(PmGRF09),疏水性負(fù)值越大表示越親水,正值越大表示越疏水,疏水值介于-0.5~0.5的為兩性氨基酸[11]。所有PmGRF編碼的蛋白GRAVY值小于0,表明其都是親水蛋白。亞細(xì)胞定位的結(jié)果顯示,全部的基因都位于細(xì)胞核中,所以PmGRF屬于典型的核蛋白。
表2 梅GRF基因及其編碼蛋白的基本信息和理化性質(zhì)Table 2 Basic information and physicochemical properties of GRF gene and coding proteins in Prunus mume
由圖1可見:PmGRF基因的內(nèi)含子數(shù)差異較大,為2~15個,其中PmGRF15的內(nèi)含子數(shù)最多(15個)。有5個基因(PmGRF04、PmGRF05、PmGRF06、PmGRF08、PmGRF14)包含2個內(nèi)含子,有5個基因(PmGRF09、PmGRF10、PmGRF11、PmGRF12、PmGRF13)包含3個內(nèi)含子。
圖1 梅PmGRF基因結(jié)構(gòu)分析Fig.1 Structure analysis of the PmGRF genes in P.mume
如圖2所示:除PmGRF06、PmGRF12外,其余PmGRF都具有motif 2,除PmGRF15外,其余PmGRF都具有motif 1,說明PmGRF家族的成員具有相似的基序類型。利用Pfam網(wǎng)站對motif 1和motif 2進(jìn)行注釋,發(fā)現(xiàn)motif 1屬于WRC結(jié)構(gòu)域,motif 2屬于QLQ結(jié)構(gòu)域。在Ⅶ亞家族中,PmGRF家族成員的保守基序近似,基因結(jié)構(gòu)也相似,這進(jìn)一步支持了系統(tǒng)發(fā)育樹的準(zhǔn)確性。
圖2 梅PmGRF基因編碼的蛋白motif分析Fig.2 The motif analysis of the proteins encoded by PmGRF genes in P.mume
由圖3可見:PmGRF01、PmGRF02分布在第1條染色體上,PmGRF03位于第3條染色體,PmGRF04位于第4條染色體,第5條染色體上分布的最多,有6個,即PmGRF05、PmGRF06、PmGRF07、PmGRF08、PmGRF09、PmGRF15。第7條染色體上分布著PmGRF10、PmGRF11,而PmGRF12、PmGRF13、PmGRF14位于第8條染色體上。
表3 PmGRF基因串聯(lián)重復(fù)序列的Ka/Ks值Table 3 The Ka/Ks values of tandemly repeated sequences of PmGRF gene
圖3 梅PmGRF基因在梅6條染色體的定位分布Fig.3 Location and distribution of PmGRF genes on 6 chromosomes of P.mume藍(lán)線代表梅的染色體。染色體編號位于每個染色體的頂部。左側(cè)的比例尺展示染色體長度。The blue line represents the chromosome of P.mume. The chromosome number is at the top of each chromosome. The scale bar on the left shows the chromosome length.
共線性分析結(jié)果(圖4)表明,3對基因(PmGRF01和PmGRF02,PmGRF09和PmGRF11,PmGRF04和PmGRF14)存在節(jié)段性重復(fù),為了進(jìn)一步分析AtGRF和PmGRF的進(jìn)化關(guān)系,繪制了擬南芥和梅的基因組共線性圖譜。圖譜結(jié)果表明,AtGRF04和PmGRF13以及AtGRF05和PmGRF04之間存在線性關(guān)系,表示們之間具有同源性,推斷可能有相似的功能。
圖4 PmGRF基因間共線性分析(a)以及梅和擬南芥GRF間共線性關(guān)系(b)Fig.4 The collinearity analysis between PmGRF genes(a)and collinearity between GRF genes of P.mume and Arabidopsis thaliana(b)
通過計算,結(jié)果(表3)發(fā)現(xiàn)所有PmGRF基因重復(fù)序列的Ka值都小于Ks值,Ka/Ks值都遠(yuǎn)小于1,說明進(jìn)化過程中,基因受純化選擇,來降低堿基非同義替換帶來的氨基酸變化,從而減少蛋白質(zhì)構(gòu)象和功能的改變。當(dāng)Ka/Ks>1時,說明該基因近期正在快速進(jìn)化,因此PmGRF基因進(jìn)化緩慢。
如圖5所示:PmGRF的啟動子順式作用元件主要包括4類:生長發(fā)育相關(guān)作用元件、低溫干旱等脅迫相關(guān)作用元件、光響應(yīng)相關(guān)作用元件和參與激素反應(yīng)的順式調(diào)控元件。其中生長發(fā)育相關(guān)作用元件最多,光響應(yīng)相關(guān)作用元件和參與激素反應(yīng)的順式調(diào)控元件次之,低溫干旱等脅迫相關(guān)作用元件最少。不同基因含有不同類型的作用元件,如PmGRF03含有生長發(fā)育、脫落酸、茉莉酸甲酯、光響應(yīng)、干旱等脅迫相關(guān)作用元件,PmGRF09含有光響應(yīng)、生長素、水楊酸、茉莉酸甲酯、赤霉素、干旱脅迫等相關(guān)作用元件,說明PmGRF對不同的激素或環(huán)境因素起作用。
圖6為4個薔薇科植物梅、杏、桃、扁桃和擬南芥GRF家族的系統(tǒng)發(fā)育分析,參照擬南芥的GRF家族分組方式,這些蛋白被分為7個亞家族(Ⅰ—Ⅶ)。其中Ⅶ亞家族包含的PmGRF的成員最多,有4個。所選的4種薔薇科植物GRF家族中,梅與杏有較高的同源性,例如PmGRF13與PaCAB4287233.1、PmGRF09 與PaCAB4271658.1、PmGRF01與PaCAB4264059.1。而PmGRF與AtGRF家族同源性不高。其余薔薇科植物的GRF家族同源性都較高,如杏家族與扁桃家族、扁桃家族與桃家族,說明薔薇科植物的GRF具有高度保守的結(jié)構(gòu)。
如圖7所示:PmGRF12、PmGRF06和PmGRF09在芽中的表達(dá)豐度最高,可能與芽休眠有關(guān),而PmGRF11在果實中表達(dá)豐度最高,可能與果實生長發(fā)育相關(guān)。轉(zhuǎn)錄組數(shù)據(jù)表明,PmGRF09、PmGRF07、PmGRF10、PmGRF15、PmGRF05、PmGRF14、PmGRF03和PmGRF11在生理休眠時期的轉(zhuǎn)錄水平達(dá)到峰值,然后表達(dá)開始下調(diào),而PmGRF02在抑制性休眠時期的表達(dá)豐度就已達(dá)到峰值,但總體來說PmGRF家族基因在不同的休眠時期都有不同的表達(dá)譜,這說明PmGRF家族可能在休眠調(diào)控過程中發(fā)揮作用。
圖6 梅PmGRF與其他物種GRF的系統(tǒng)進(jìn)化樹Fig.6 Integrated phylogenetic tree of GRF of P.mume and other species
圖7 PmGRF在不同組織(a)和不同休眠階段(b)中的表達(dá)水平Fig.7 Expression levels of PmGRF in different tissues(a)and different dormancy stages(b)para.抑制性休眠Paradormancy;endo.生理休眠Endodormancy;eco.生態(tài)休眠Ecodormancy;release.休眠解除Dormancy release. 下同。The same as follows.紅色代表高表達(dá),藍(lán)色代表低表達(dá)。Red represents higher expression,blue represents lower expression.
圖8 PmGRF在4個休眠階段的RT-qPCR表達(dá)分析Fig.8 Expression analysis of PmGRF in four dormancy stages不同字母表示在0.05水平(Tukey檢驗)時顯著性差異。Different letters above the bars represent significant differences at 0.05 level by Tukey’s test.
采用RT-qPCR分析15個PmGRF基因在不同休眠時期的表達(dá)量,結(jié)果(圖8)表明,RT-qPCR分析結(jié)果和轉(zhuǎn)錄組數(shù)據(jù)分析結(jié)果基本一致。PmGRF的表達(dá)隨著休眠時期的推進(jìn)而呈現(xiàn)出不同的表達(dá)趨勢,分為3個趨勢,并且在不同的休眠時期出現(xiàn)峰值,趨勢與轉(zhuǎn)錄組數(shù)據(jù)基本吻合。大多數(shù)PmGRF基因都呈先升高后下降趨勢,其中,PmGRF03、PmGRF04、PmGRF05、PmGRF07、PmGRF08、PmGRF09、PmGRF10、PmGRF11、PmGRF13、PmGRF14和PmGRF15在生理休眠表達(dá)水平達(dá)到峰值而后逐漸下降,而PmGRF12在生態(tài)休眠時期達(dá)到峰值。PmGRF06在整個休眠階段都呈上升趨勢,而PmGRF01和PmGRF02呈一直下降趨勢。值得注意的,大部分PmGRF基因的表達(dá)水平都在某個休眠階段有急劇上調(diào)的趨勢,這暗示PmGRF在梅休眠的整個過程中都可能起到非常重要的調(diào)節(jié)作用。
植物特有的GRF基因具有多方面的生理功能,涉及植物開花、葉和根的發(fā)育以及逆境脅迫下的轉(zhuǎn)錄調(diào)控等[12-14],但是關(guān)于梅GRF基因家族的報道還很缺乏。本研究中,從梅基因組中鑒定到15個PmGRF基因,其數(shù)量高于葡萄(8個)[15]、番茄(13個)[16]、茶樹(11個)[17]、水稻(11個)[18]等植物,這可能是由于梅基因組出現(xiàn)廣泛復(fù)制。蛋白分析發(fā)現(xiàn),梅GRF基因編碼的氨基酸基本都是堿性氨基酸,且多數(shù)GRF蛋白均是親水蛋白。PmGRF 蛋白符合GRF的基本特征,即含有2個典型的結(jié)構(gòu)域(WRC和QLQ),且 2個結(jié)構(gòu)域均位于GRF的N端。QLQ含有大量芳香族/疏水性氨基酸,這對于QLQ作為蛋白質(zhì)—蛋白質(zhì)相互作用域發(fā)揮作用可能很重要[4]。而WRC結(jié)構(gòu)域可能包括NLS和鋅指結(jié)構(gòu)域,因此它可能結(jié)合DNA而發(fā)揮作用[19]。Ka/Ks=1 時基因進(jìn)化模式表現(xiàn)為中性選擇,當(dāng)Ka/Ks>1 時表現(xiàn)為正向選擇,當(dāng)Ka/Ks<1 時基因受純化選擇[20]。本研究中,所有PmGRF基因重復(fù)序列的Ka/Ks值均遠(yuǎn)小于1,說明進(jìn)化過程中PmGRF受純化選擇。本研究中,親緣關(guān)系較近的4種薔薇科果樹中,桃GRF家族成員較多(22個),其他物種的家族成員數(shù)量接近(15~16 個)。4 種薔薇科植物GRF家族進(jìn)化分析結(jié)果顯示梅與杏的GRF同源性較高,表明二者在進(jìn)化過程中親緣關(guān)系較近。
本研究中,啟動子區(qū)域順式元件分析表明生長發(fā)育相關(guān)元件最多,說明PmGRF與植物生長發(fā)育密切相關(guān)。另外PmGRF基因家族還含有激素響應(yīng)元件,包括脫落酸和赤霉素響應(yīng)元件,說明PmGRF的表達(dá)水平可能一定程度上受ABA和GA的誘導(dǎo),而GA/ABA比值與休眠解除和開花過程有密切關(guān)系[5]。在梨中,油菜素內(nèi)酯(BR)可能是通過平衡ABA與GA之間的含量來促進(jìn)破眠[21],因此這表明PmGRF可能與GA和ABA相關(guān)轉(zhuǎn)錄因子結(jié)合進(jìn)而在休眠和開花過程中發(fā)揮作用。在擬南芥中,AtGRF1 和AtGRF2 也控制開花時間[5]。最近的研究表明,AtGRF1 和AtGRF3 主要作用為調(diào)節(jié)植物生長發(fā)育、防御反應(yīng)以及相關(guān)的激素水平,從而幫助植物適應(yīng)脅迫條件[22]。Wu等[23]在茶樹轉(zhuǎn)錄組中鑒定得到6個GRF基因,發(fā)現(xiàn)其中3個成員在 ABA處理后表達(dá)水平升高,5個成員在 MeJA 處理后表達(dá)水平降低,1個成員被GA誘導(dǎo)顯著上調(diào),因此這進(jìn)一步表明PmGRF可能響應(yīng)ABA和GA進(jìn)而參與休眠的調(diào)控過程。在水稻中,GRF基因在芽、未成熟葉和花芽中高表達(dá)并通過調(diào)節(jié)生長組織中的細(xì)胞增殖參與植物生長和發(fā)育[18]。而CsGRF基因家族則被推測在茶樹生長組織尤其是芽葉中起重要作用[17]。本研究組織特異性表達(dá)譜分析表明PmGRF12、PmGRF06和PmGRF09在芽中的表達(dá)豐度最高,這從另一個角度說明PmGRF與芽休眠密切相關(guān)。另外,PmGRF04、PmGRF07、PmGRF08、PmGRF01、PmGRF14含有低溫響應(yīng)元件,預(yù)示著PmGRF有可能通過響應(yīng)低溫信號參與休眠過程。本研究中,PmGRF的表達(dá)隨著休眠時期的推進(jìn)而呈現(xiàn)出的表達(dá)趨勢不同,例如PmGRF04、PmGRF05、PmGRF10、PmGRF11、PmGRF13、PmGRF14、PmGRF15在生理休眠時期表達(dá)水平顯著增加,而當(dāng)休眠解除時逐漸下降,PmGRF12在生態(tài)休眠時期時達(dá)到峰值后逐漸下降,推測它們與維持休眠有關(guān)。而PmGRF06在整個休眠階段都呈上升的趨勢,推測其與解除休眠有關(guān)。每個PmGRF基因的表達(dá)水平在某個休眠階段都有急劇變化的趨勢,這暗示PmGRF在梅休眠的整個過程中可能起到非常重要的調(diào)節(jié)作用。本研究利用生物信息學(xué)對PmGRF基因家族進(jìn)行了系統(tǒng)鑒定,并結(jié)合表達(dá)差異推測其在梅休眠過程中起作用。后續(xù)將繼續(xù)深入驗證部分基因的功能,為完善梅休眠機(jī)制提供參考。
南京農(nóng)業(yè)大學(xué)學(xué)報2022年6期