王江麗,張慧哲,王希胤
(1. 華北理工大學(xué) 生命科學(xué)學(xué)院,河北 唐山 063210;2. 華北理工大學(xué) 基因組學(xué)與計算生物學(xué)研究中心,河北 唐山 063210)
轉(zhuǎn)錄因子(Transcription factors, TFs)是一種序列特異性的蛋白,通過調(diào)控靶基因,在植物生長、發(fā)育、激素反應(yīng)以及生物和非生物脅迫應(yīng)答中起著重要作用[1]。與ABI3/VP1轉(zhuǎn)錄因子家族相關(guān)的RAV轉(zhuǎn)錄因子,編碼一個B3結(jié)構(gòu)域和一個APETALA2(AP2)結(jié)構(gòu)域,屬于APETALA2/乙烯響應(yīng)元件結(jié)合因子(AP2/ERF)或B3超家族,在調(diào)節(jié)種子萌發(fā)、植物生長發(fā)育和響應(yīng)生物或非生物脅迫中發(fā)揮重要作用[2-4]。首先在玉米中發(fā)現(xiàn)ABI3/VP1家族成員中的VP1基因,隨后在模式植物擬南芥中也鑒定出其同源基因[5]。后來,為分析RAVs在植物生長發(fā)育過程中的作用,在苜蓿、大麥、蓖麻等許多糧食作物中做了一些研究[6-8]。比如在苜蓿中ABI3/VP1相關(guān)基因的表達能夠?qū)е聰M南芥抗逆性增強和分枝增加,其研究結(jié)果為MtRAVs在豆科植物中的應(yīng)用奠定了基礎(chǔ)[6]。
花生是豆科重要的模式物種,也是世界上重要的糧食作物之一,對花生基因組內(nèi)部各個功能基因的研究對提升其產(chǎn)量和品質(zhì)具有重要意義[9-11]。研究表明,2個野生二倍體花生Arachis duranensis(后續(xù)縮寫為Adu)和Arachis ipaensis(后續(xù)縮寫為Aip)是所有栽培花生的二倍體祖先,其基因組測序的完成對花生相關(guān)生物信息學(xué)分析奠定了基礎(chǔ)[12]?;ㄉ鳛榉N植面積最大、產(chǎn)量最高的油料作物之一,其種植面積在國內(nèi)非常廣泛,而河北省是北方地區(qū)花生種植面積較大的省份之一[13]?;ㄉ粌H是一種營養(yǎng)價值高的食物,而且其藥用價值較高,花生籽、種皮、種殼和花生油等均可入藥。除了其營養(yǎng)上的重要性,花生也是一種在遺傳學(xué)、功能基因組學(xué)和育種方面被許多作物領(lǐng)域研究人員所深入研究的植物?;ㄉδ芑虻耐诰蚴欠肿佑N工作的關(guān)鍵[14-17],許多轉(zhuǎn)錄因子家族的基因鑒定和表達分析能夠揭示花生在種子休眠或種子萌發(fā)過程中的關(guān)鍵作用,為花生品質(zhì)和產(chǎn)量的提高提供參考[18-20]。
目前對于花生ABI3/VP1轉(zhuǎn)錄因子家族的相關(guān)研究還未見報道。本研究將對花生ABI3/VP1轉(zhuǎn)錄因子家族進行全基因組鑒定,并通過一系列生物信息學(xué)方法對其進行系統(tǒng)發(fā)育、理化性質(zhì),二級結(jié)構(gòu)和亞細(xì)胞定位,啟動子順式作用元件分析,為后續(xù)開展花生ABI3/VP1基因調(diào)控脫落酸信號轉(zhuǎn)導(dǎo)相關(guān)的研究提供參考。
從擬南芥基因組數(shù)據(jù)庫(https://www.arabidopsis.org/)下載ABI3/VP1 轉(zhuǎn)錄因子家族的相關(guān)基因ID及其對應(yīng)的cds與pep序列數(shù)據(jù),從花生基因組數(shù)據(jù)庫(https://www.peanutbase.org/)下載2個二倍體花生Adu及Aip的全基因組數(shù)據(jù)。利用擬南芥的ABI3/VP1基因的蛋白序列文件,使用BLASTP[21]搜索工具進行同源序列比對,得到花生的ABI3/VP1基因的蛋白序列文件。同時,在SMART網(wǎng)站(http://smart.embl-heidelberg.de/)對蛋白序列針對基因家族特有結(jié)構(gòu)域進行篩選,在NCBI(https://www.ncbi.nlm.nih.gov/)網(wǎng)站對CDD結(jié)構(gòu)域進行分析并利用TBtools軟件[22]進行可視化分析得到候選基因的結(jié)構(gòu)域情況,去除不完整結(jié)構(gòu)域基因后得到最終花生ABI3/VP1的基因。
利用ClustalW[23]工具將鑒定出的蛋白序列進行多重比對,使用MEGA-X軟件[24]構(gòu)建系統(tǒng)發(fā)育進化樹并用在線軟件iTOL(https://itol.embl.de/)進行美化。利用TBTools軟件展示ABI3/VP1家族基因結(jié)構(gòu)。
利用SOPMA(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)和 PSORT在線網(wǎng)站(http://psort.hgc.jp/)分別預(yù)測花生ABI3/VP1編碼蛋白的二級結(jié)構(gòu)和亞細(xì)胞定位。
利用TBTools分析獲得花生ABI3/VP1基因在染色體上的物理位置,并繪制其在染色體上的分布圖。利用PlantCARE在(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)進行啟動子順式作用元件的預(yù)測并將結(jié)果整理。
利用擬南芥ABI3/VP1基因家族的11個蛋白序列建庫,通過Blastp搜索同源序列,在2個花生Adu和Aip基因組中鑒定出18個ABI3/VP1候選基因(見表1)。同時將擬南芥的11個已鑒定基因與其所具有的功能制表,并在基因名稱后添加相應(yīng)功能注釋(見表2)。為了檢驗ABI3/VP1候選基因結(jié)構(gòu)域的完整性,進一步利用SMART、TBtools進行結(jié)構(gòu)域搜索,發(fā)現(xiàn)花生ABI3/VP1候選基因Ad_01326結(jié)構(gòu)域片段不完整,僅含有22個氨基酸殘基,而它與擬南芥該基因家族的blast結(jié)果中相應(yīng)匹配的基因為AT4G30080,該基因在該家族中并不具有重要作用,推測ABI3/VP1候選基因Ad_01326可能是假基因(見圖1),不對它進行分析。在剩下的17個基因中,發(fā)現(xiàn)其全部位于花生2個種的2、4、5、6、7、8、9號染色體上,且大部分位于2、5、6和9號染色體。另外有7個基因位于正向鏈,10個位于負(fù)向鏈(見表3)。
表1 擬南芥ABI3/VP1基因與二倍體野生花生blast比對結(jié)果
表2 擬南芥根據(jù)已知的功能修改名稱
表3 花生ABI3/VP1基因家族成員信息
利用擬南芥和花生共28個ABI3/VP1基因編碼的蛋白質(zhì)氨基酸序列構(gòu)建其ABI3/VP1基因家族進化樹(見圖2)。根據(jù)進化樹拓?fù)浣Y(jié)構(gòu),可將ABI3/VP1蛋白分為3個亞家族。在3個亞家族中均包含擬南芥和花生的ABI3/VP1基因,同時在進化樹拓?fù)浣Y(jié)構(gòu)中發(fā)現(xiàn),花生ABI3/VP1基因在現(xiàn)代支與中間支中分布很少,一共只有 4個ABI3/VP1基因,其余 13個ABI3/VP1基因均位于古老支。為了進一步研究花生ABI3/VP1基因結(jié)構(gòu)的多樣性和系統(tǒng)發(fā)生情況,對17個ABI3/VP1基因的蛋白質(zhì)氨基酸序列單獨構(gòu)建系統(tǒng)發(fā)育進化樹(見圖3),結(jié)果也分為3個亞家族(分類方式同上)。對這些蛋白質(zhì)的保守基序分析發(fā)現(xiàn)(見圖4),共有20種motif被分析出來,其中motif 1、2、3、5、6、16、20在花生ABI3/VP1基因家族中廣泛存在,Ad_16476.1、Ad_12990.1、Ad_19871.1、Ad_16464.1中僅有motif 1的存在,Ad_23541.1和Ad_24141.1中沒有檢測到motif的存在。古老支的特有基序有motif3、motif4、motif8、motif14、motif15、motif16、motif17,中間支特有基序有motif10和motif12。通過比較花生ABI3/VP1基因結(jié)構(gòu)發(fā)現(xiàn),除Ad_30160.1沒有內(nèi)含子外,其余ABI3/VP1基因均含有1~7個內(nèi)含子。
圖2 花生與擬南芥ABI3/VP1基因家族的系統(tǒng)進化樹
圖3 花生ABI3/VP1基因家族的系統(tǒng)進化樹
圖4 花生ABI3/VP1基因家族的系統(tǒng)進化和基因結(jié)構(gòu)
二級結(jié)構(gòu)分析顯示(見表4),花生17個ABI3/VP1基因的氨基酸序列均含有α-螺旋、延伸鏈、β-轉(zhuǎn)角和無規(guī)則卷曲,其含量分布范圍有所不同。如α-螺旋和隨機卷曲在ABI3/VP1基因編碼蛋白質(zhì)二級結(jié)構(gòu)中的含量范圍分別為8.43%~40.27%、28.32%~66.81%,而拓展鏈和β-轉(zhuǎn)角的含量范圍分別為11.62%~34.85%、2.88%~15.15%,以上表明17個ABI3/VP1基因氨基酸序列二級結(jié)構(gòu)主要以α-螺旋和隨機卷曲為主。同時,亞細(xì)胞定位預(yù)測顯示花生ABI3/VP1基因有11個定位在細(xì)胞核中,2個定位在葉綠體中,4個定位在細(xì)胞質(zhì)中。
表4 花生ABI3/VP1基因編碼蛋白的二級結(jié)構(gòu)及亞細(xì)胞定位
染色體定位分析結(jié)果顯示(見圖5),花生的17個ABI3/VP1基因在11條染色體上呈不均勻分布,其中Ad種的12個基因分別位于2、4、5、6、7、8、9號共7條染色體, Ai種的5個基因位于2、5、6、9號共4條染色體。
圖5 花生ABI3/VP1基因的染色體定位
對花生17個ABI3/VP1基因啟動子序列的順式作用元件的預(yù)測結(jié)果顯示,共有21種397個順式作用元件,且多種順式作用元件與植物生長過程中的相關(guān)激素應(yīng)答、組織特異性表達等密切相關(guān)(見圖6)。其中,光照響應(yīng)元件在花生的17個ABI3/VP1基因中都存在,暗示花生ABI3/VP1基因表達可能受光照影響。
圖6 花生ABI3/VP1基因的順式作用元件分析
(1)研究從花生基因組中成功鑒定出17個ABI3/VP1基因,并且不均勻地分布在11條染色體上,相比于作為十字花科的擬南芥具有的11個而言,豆科的花生具有了較多的基因,這可能是在兩者祖先物種分歧時發(fā)生的基因丟失或加倍導(dǎo)致。
(2)系統(tǒng)發(fā)育表明,花生古老支中有較多基因與擬南芥親緣關(guān)系較近,并且在觀察花生2個不同種在3個亞家族中的分布后發(fā)現(xiàn),在古老的分支中Adu和Aip 2個種的基因數(shù)量并無差別,而隨著時間的推移,在中間支和現(xiàn)代支Aip的該家族基因數(shù)量明顯小于Adu的數(shù)量,推測為地緣差異或者種間相關(guān)基因的差異造成。值得注意的是,Aip的該家族相關(guān)基因從中間支到現(xiàn)代支經(jīng)歷了從無到有的變化,推測與基因的丟失或古老基因的加倍與進化有關(guān)。綜合理化性質(zhì)、亞細(xì)胞定位及順式作用元件分析,推測花生ABI3/VP1基因參與多個信號通路調(diào)控花生的生長發(fā)育過程和對環(huán)境刺激的響應(yīng)。