楊森要 張修月 毛文文 戴 晉 高 杉 王 丹 劉勇鵬 胡建斌 李麗麗*
(1 河南省漯河市農業(yè)科學院,河南漯河 462000;2 河南農業(yè)大學園藝學院,河南省果樹瓜類生物學重點實驗室,河南鄭州 450002)
熱激蛋白(heat shock proteins,HSPs)是一種古老的、高度保守的分子伴侶,廣泛存在于原核和真核生物體中(Sun et al.,2002)。當生物體受到高溫、干旱、重金屬和高鹽等脅迫時,HSPs可以通過穩(wěn)定細胞結構、運輸和折疊輔助蛋白來維持細胞功能從而提高生物體對脅迫的適應能力(Tyedmers et al.,2010;Yadav et al.,2021)。 根據氨基酸序列同源性和分子量,熱激蛋白可分為5類,分別是HSP100、HSP90、HSP70、HSP60 和HSP20 家族(Waters,2013)。HSP20s 也被稱為小熱激蛋白,是植物HSPs 中最普遍、最豐富的蛋白質,分子量在15~42 kDa 之間(Ji et al.,2019)。HSP20s 含有保守的α-晶體蛋白結構域(ACD),該結構域由約90 個氨基酸組成,包含多個β-鏈結構和2 個保守區(qū):位于N-端的保守結構域Ⅰ(CR Ⅰ)和位于C-端的保守結構域Ⅱ(CR Ⅱ)(Bondino et al.,2012;Lin et al.,2019)。研究表明,HSP20s 參與植物的發(fā)育過程和非生物脅迫,如高溫、高鹽和干旱等。在高溫和高鹽脅迫下,過表達OsHSP20的轉基因水稻發(fā)芽率和根長都高于對照植株(Guo et al.,2020)。在擬南芥中過表達PtHSP17.8可增強其對高溫和鹽脅迫的耐受性,轉基因擬南芥的幼苗存活率、根長、相對含水量、抗氧化酶活性、脯氨酸和可溶性糖含量都有所提高(Li et al.,2016)。sHSP22與生長素的極性運輸有關,并在高溫脅迫下參與生長素調節(jié)的下胚軸伸長(Li et al.,2018)。CaHSP16.4通過增強植物清除活性氧的能力來提升辣椒對高溫和干旱的耐受性(Huang et al.,2019)。
隨著高通量測序和生物信息學的快速發(fā)展,HSP20基因家族在擬南芥(Scharf et al.,2001)、番茄(Yu et al.,2016)、 水稻(Ouyang et al.,2009)、 黃瓜(Huang et al.,2022)、 西瓜(He et al.,2018)、南瓜(Hu et al.,2021)等多個作物中已被鑒定。甜瓜(CucumismeloL.)是重要的園藝作物,其栽培面積和產量在世界范圍內穩(wěn)中有升,但各種不利的栽培環(huán)境因素導致了甜瓜產量和品質的下降。在擬南芥和水稻等作物中研究發(fā)現,HSP20 蛋白在多種生物和非生物脅迫中發(fā)揮著重要作用(Li et al.,2016;Guo et al.,2020),然而尚未對甜瓜HSP20基因家族進行系統(tǒng)地研究。本試驗基于甜瓜基因組信息,通過生物信息學手段,鑒定了甜瓜HSP20基因家族,并對其染色體分布、基因結構、系統(tǒng)發(fā)育關系和親緣關系進行了詳細分析,以期為深入研究甜瓜HSP20基因家族功能和在響應逆境脅迫中的作用提供基礎信息。
2023年3-6月,從葫蘆科基因組數據庫(http://cucurbitgenomics.org/)下載甜瓜全基因組數據和西瓜、黃瓜、南瓜HSP20基因家族的蛋白序列。分別從擬南芥數據庫(https://www.arabidopsis.org/index.jsp) 和番茄基因組數據庫(https://solgenomics.net/)下載擬南芥和番茄HSP20基因家族的蛋白序列。利用下載的HSP20基因家族序列對甜瓜的蛋白序列進行本地BLASTP 比對(E-value<1e-5),獲得候選蛋白序列。根據Pfam數據庫(http://pfam.xfam.org/)獲得HSP20 蛋白的隱馬爾可夫模型(Pf00011),通過HMMER 軟件包的hmmsearch 程序篩選甜瓜蛋白數據庫得到候選蛋白序列。將兩種方法獲得的候選蛋白序列提交Pfam 數據庫和NCBI 數據庫進行結構域鑒定,利用ExPASy(http://web.expasy.org/compute_pi)計算候選蛋白序列的分子量等生化屬性。通過Wolf Psort網站(https://www.genscript.com/wolf-psort.html)進行亞細胞定位預測。
通過TBtools(Chen et al.,2020)軟件將鑒定到的CmHSP20s基因染色體位置顯示出來,利用MCScanX 軟件對甜瓜、黃瓜、西瓜和南瓜之間的HSP20基因家族進行共線性鑒定,并通過TBtools進行可視化。
利用MEME 在線軟件(https://meme-suite.org/meme/tools/meme)預測甜瓜HSP20 家族蛋白的保守基序,最大Motif 設置為10,其余參數默認。使用MEGAⅩ軟件中的MUSCLE 程序進行多序列比對,采用鄰接法(Neighbor-joining Tree)構建進化樹,bootstrap 設置為1 000(司修洋 等,2020)。將通過TBtools 提取的基因上游2 000 bp 序列提交PlantCARE(https://bioinformatics.psb.ugent.be/webtools/plantcare/html/)進行順式作用元件分析。
以擬南芥、番茄、黃瓜、西瓜和南瓜HSP20蛋白序列為參考,本地BLASTP 比對得到43 個候選蛋白。HMM 搜索甜瓜蛋白數據庫得到33 個候選蛋白,2 次結果合并共得到45 個候選蛋白。通常認為功能結構域決定了蛋白功能的發(fā)揮,將含有完整α-晶體蛋白結構域(ACD)的基因保留,最終得到42 個CmHSP20s基因,并根據其在染色體上的位置信息進行編號命名(表1)。甜瓜HSP20基因家族編碼氨基酸長度為71(CmHSP20-36)~510(CmHSP20-18)aa;理論等電點(PI)為4.43(CmHSP20-40)~9.72(CmHSP20-35);分子量范圍 在8 390.40(CmHSP20-36)~57 350.14(CmHSP20-37)Da 之間;蛋白親水性指數均為負值,表明CmHSP20s基因均編碼疏水性蛋白;亞細胞定位預測顯示17 個CmHSP20s基因(40.48%)定位于細胞質,13 個CmHSP20s基因(30.95%)定位在葉綠體,另外12個CmHSP20s基因(28.57%)定位于細胞核。
42 個CmHSP20s基因不均勻地分布在甜瓜12條染色體上(圖1)。每條染色體上分布數量為1~7個,6號和10號染色體上分布最多(7 個),11號染色體上分布最少(1 個);大多數CmHSP20s基因分布于染色體兩端,這與基因密度的分布相似。對CmHSP20s進行串聯(lián)重復分析顯示,6號、7號和10號染色體上分別存在1 個串聯(lián)復制基因對(CmHSP20-19/CmHSP20-20、CmHSP20-21/CmHSP20-22和CmHSP20-30/CmHSP20-31),12號染色體上包含2 個串聯(lián)復制基因對(CmHSP20-38/CmHSP20-39和CmHSP20-38/CmHSP20-40)。
圖1 甜瓜HSP20 基因家族的染色體分布
為進一步分析葫蘆科HSP20基因家族的系統(tǒng)發(fā)育機制,分別構建了甜瓜與黃瓜、西瓜、南瓜的共線性圖譜。結果表明(圖2),32 個CmHSP20s基因與黃瓜、西瓜和南瓜中的基因存在共線性關系。其中,30 個CmHSP20s基因與黃瓜中的46 個基因存在共線性(圖2-A),29 個CmHSP20s基因與西瓜中的48 個基因存在共線性(圖2-B),26個CmHSP20s基因與南瓜中的53 個基因存在共線性(圖2-C)。另外,CmHSP20-3和CmHSP20-15只與黃瓜中的基因有共線性關系,CmHSP20-29只與南瓜中的基因有共線性關系。然而,還有10 個CmHSP20s基 因(CmHSP20-4、CmHSP20-13、CmHSP20-20、CmHSP20-22、CmHSP20-23、CmHSP20-31、CmHSP20-33、CmHSP20-35、CmHSP20-36、CmHSP20-38) 與黃瓜、 西瓜、南瓜中的基因均無共線性關系,表明它們是甜瓜HSP20基因家族中的保守成員。
圖2 甜瓜與黃瓜(A)、西瓜(B)、南瓜(C)HSP20 基因家族的共線性關系
為了進一步探究甜瓜HSP20基因家族的同源進化關系,利用擬南芥、番茄和甜瓜HSP20家族成員的蛋白序列構建進化樹。由圖3 可知,103 個HSP20家族成員(擬南芥19 個,番茄42 個,甜瓜42 個)被分為5 個類群(Ⅰ~Ⅴ)。其中,Ⅰ類群包含1 個CmHSP20和4 個SlHSP20s;Ⅱ類群包含10 個CmHSP20s、5 個SlHSP20s和1 個AtHSP20;Ⅲ類群包含6 個CmHSP20s和8 個SlHSP20s;Ⅳ類群包含7 個CmHSP20s、7 個SlHSP20s和7 個AtHSP20s;Ⅴ類群最大,包含18 個CmHSP20s、18 個SlHSP20s和11 個AtHSP20s。且系統(tǒng)進化樹顯示,甜瓜與擬南芥存在2 對直系同源基因對,與番茄存在7 對直系同源基因對;甜瓜HSP20家族成員共形成8 對旁系同源基因對。以上結果表明,甜瓜HSP20家族成員與番茄HSP20家族成員具有較近的親緣關系,且甜瓜HSP20家族成員在進化過程中發(fā)生了多次基因復制事件。
圖3 甜瓜、擬南芥和番茄HSP20 基因家族進化分析
甜瓜HSP20家族成員基因結構存在較大差異,外顯子數量1~12 個,內含子數量0~12 個(圖4)。其中,除CmHSP20-11和CmHSP20-18含有2 個以上內含子外,其余CmHSP20s基因內含子數量為0~2 個(圖4-C)。分析甜瓜HSP20家族成員保守基序,共鑒定到10 個保守基序,寬度為8~50 個氨基酸,其中Motif 7 寬度為8 個氨基酸,Motif 5 和Motif 6 寬度為50 個氨基酸(圖4-B,表2)。Motif 1(81.0%)和Motif 2(90.5%)在甜瓜HSP20家族成員中出現頻次較高,經Pfma比對發(fā)現這2 個Motif 對應于ACD 結構域,可能在甜瓜熱激反應中發(fā)揮重要作用。
圖4 甜瓜HSP20 基因家族的聚類分析(A)、保守基序預測(B)和基因結構(C)
對42 個CmHSP20s基因上游2 000 bp 區(qū)域進行順式元件預測,共鑒定到4 類順式作用元件,包括激素響應、應激響應、植物發(fā)育和光響應元件(圖5)。所有甜瓜HSP20家族成員啟動子均含有大量光響應元件,大多數成員啟動子包含激素響應(ABRE、CGTCA-motif、TGACG-motif 和TCAelement)和應激響應(ARE、LTR、TC-rich repeats和MBS)相關順式作用元件,說明甜瓜HSP20基因家族可能參與調控植物響應光周期和非生物逆境等。此外,部分CmHSP20s基因啟動子包含1~4個植物發(fā)育相關順式作用元件,可能參與植物生長發(fā)育的調控。
圖5 甜瓜HSP20 基因家族啟動子區(qū)域的順式作用元件
熱激蛋白不僅在植物生長發(fā)育中發(fā)揮著至關重要的作用,而且在調節(jié)多種形式的細胞應激反應中也發(fā)揮著重要作用(Neto et al.,2020)。HSP20s廣泛存在于植物中,并在環(huán)境脅迫下快速合成并參與應激反應(Wang et al.,2004)。目前,在多個物種中已完成HSP20基因家族的鑒定,如擬南芥(19 個)(Scharf et al.,2001)、水稻(39 個)(Ouyang et al.,2009)、番茄(42 個)(Yu et al.,2016)、蘋果(41 個)(Yao et al.,2020)、桃(42個)(Lian et al.,2022)、 黃瓜(30 個)(Huang et al.,2022)、西瓜(44 個)(He et al.,2018)和南瓜(33 個)(Hu et al.,2021)。本試驗從甜瓜基因組數據中鑒定出42 個CmHSP20s家族成員,在葫蘆科作物中僅次于西瓜的44 個,明顯多于黃瓜和南瓜,這表明基因組的大小與HSP20家族成員的數量無關;大部分CmHSP20s基因分布于染色體兩端,與黃瓜、西瓜和南瓜HSP20基因家族在染色體上的分布不同,這可能有助于甜瓜HSP20基因家族重復事件的發(fā)生,本試驗鑒定到的5 對串聯(lián)復制基因對均位于染色體兩端。
基因結構分析表明,大多數CmHSP20s基因沒有內含子(40.5%)或者只有1 個內含子(45.2%),基因結構相對簡單。同樣,大多數黃瓜(93.3%)、西瓜(93.2%) 和南瓜(90.9%)HSP20s基因沒有內含子或者只有1 個內含子,這可能有利于HSP20s基因可以被各種應激反應所快速激活(Bahler et al.,2008)。此外,研究發(fā)現含有少量或沒有內含子的基因往往在植物中具有較高的表達水平(Chung et al.,2006)。保守基序研究表明,64.3%的CmHSP20s基因具有3 個以上的Motif,對應于ACD 結構域的Motif 1 和Motif 2 出現在大多數CmHSP20s基因中。此外,還發(fā)現位于同一亞群的CmHSP20s基因具有相似的保守基序和基因結構,這與它們的進化關系和亞群分類結果一致。
在甜瓜HSP20家族成員啟動子區(qū)域鑒定到大量激素響應、應激響應、植物發(fā)育和光響應相關的順式作用元件,表明甜瓜HSP20基因家族可能廣泛參與調控植株生長發(fā)育與逆境響應。其中,所有CmHSP20s基因啟動子均包含大量光響應元件,暗示了甜瓜HSP20基因家族在植株生長發(fā)育和光周期調控等方面可能發(fā)揮重要作用。有趣的是,甜瓜、黃瓜和南瓜HSP20s基因的啟動子區(qū)域均未發(fā)現熱響應元件,但黃瓜和南瓜的HSP20s基因能夠響應熱應激(Hu et al.,2021;Huang et al.,2022),據此推測甜瓜HSP20基因家族可能存在類似的功能,仍需進一步試驗證明。植物激素是調節(jié)植物生長、發(fā)育和應激反應的關鍵信號化合物,研究發(fā)現生長素、脫落酸、赤霉素、油菜素甾醇和茉莉酸在植物熱應激響應中發(fā)揮著重要作用(Waadt et al.,2022)。高溫脅迫下,BR 信號通路中的關鍵轉錄因子BES1被激活,并直接與HSFs基因啟動子上HSEs元件結合,誘導HSPs的表達(Albertos et al.,2022)。sHSP22 熱激蛋白可被生長素誘導參與高溫下擬南芥下胚軸的伸長(Li et al.,2018)。由此可見,植物激素與熱激蛋白的表達密切相關。本試驗通過分析CmHSP20s基因的啟動子區(qū)域,發(fā)現了大量激素響應相關順式作用元件,如ABRE、CGTCA-motif、TGACG-motif、TCA-element 等,這些元件是否參與以及如何參與甜瓜響應高溫脅迫仍需進一步深入研究。