李棟成,李魁印,韋興啟,段麗麗,莫澤君,劉仁祥*
(1. 貴州大學(xué)煙草學(xué)院/貴州省煙草品質(zhì)研究重點實驗室,貴州 貴陽 550025;2. 安順學(xué)院農(nóng)學(xué)院,貴州 安順 561000;3. 黔南州煙草公司長順縣分公司,貴州 長順 550700)
轉(zhuǎn)錄因子是能與靶標(biāo)基因啟動子區(qū)域的順式元件發(fā)生特異性相互作用從而調(diào)控靶標(biāo)基因表達的DNA結(jié)合蛋白,又稱反式作用因子[1]。目前,在植物中發(fā)現(xiàn)60多個轉(zhuǎn)錄因子家族,其中Trihelix是植物中最早發(fā)現(xiàn)的轉(zhuǎn)錄因子家族之一,因為其保守結(jié)構(gòu)域中含有3個串聯(lián)的α螺旋而得名[2]。根據(jù)Trihelix家族的保守域結(jié)構(gòu)特征,將Trihelix家族分為5個亞家族,分別為 GT-1、GT-2、SH4、SIP1和GTγ[3]。Trihelix轉(zhuǎn)錄因子家族在植物生長發(fā)育、光響應(yīng)及器官建成方面發(fā)揮著重要的作用[4],同時也在植物的生物和非生物脅迫方面也有響應(yīng)[5—6]。過表達ShCIGT基因顯著增強多毛番茄(Solanum habrochaites)植株對低溫和干旱的耐受能力[7]。過表達Sb06g023980和 Sb06g024110基因顯著增強高粱(Sorghum bicolor)轉(zhuǎn)基因植株對低溫、干旱和高鹽的耐受能力[8]。
煙草(Nicotiana tabacum)是喜溫、冷敏感植物,其生長發(fā)育對溫度和水分等環(huán)境因素有較高要求,低溫和干旱是影響煙草生長與品質(zhì)的主要因素[9]。目前,有關(guān)煙草抗冷基因的發(fā)掘和利用,以及煙草Trihelix轉(zhuǎn)錄因子家族的研究鮮有報道,其家族成員種類、數(shù)量及進化關(guān)系也不清楚。因此,本研究利用比較基因組和生物信息學(xué)方法,對煙草基因組的Trihelix轉(zhuǎn)錄因子家族成員理化性質(zhì)系統(tǒng)進化、共線性、保守基序、基因結(jié)構(gòu)、作用元件和基因表達進行分析,為進一步研究Trihelix家族成員的生物學(xué)功能,以及挖掘煙草抗冷基因奠定理論基礎(chǔ)。
從茄科數(shù)據(jù)庫(https://solgenomics.net/)獲得普通煙草品種K326的基因組序列(2017年由Edwards發(fā)布,包括蛋白序列文件,GFF文件和核酸序列文件),在擬南芥(Arabidopsis thaliana)TAIR數(shù)據(jù)庫(http://www.arabidopsis.org/)下載擬南芥 Trihelix轉(zhuǎn)錄因子家族成員的蛋白序列[10]。以模式植物擬南芥Trihelix蛋白在Pfam數(shù)據(jù)庫(http://pfam.sanger.ac.uk/)中搜索到Trihelix基因家族的蛋白特征結(jié)構(gòu)域[11](標(biāo)號為PF13837),利用HMMER3.0程序(http://hmmer.janelia.org/)以 PF13837隱馬可夫模型(Hidden Markov Model, HMM)在煙草全基因組序列中搜索含有Trihelix結(jié)構(gòu)域特征的序列,E值設(shè)為1e-10。再利用 SMART在線程序檢測候選蛋白,去除不含Trihelix結(jié)構(gòu)域特征的序列,即獲得煙草Trihelix轉(zhuǎn)錄因子家族序列[12]。同時在 ExPASy數(shù)據(jù)庫(http://www.expasy.org/)中對煙草 Trihelix蛋白的分子量、等電點和疏水性等理化性質(zhì)進行分析[13]。
根據(jù)得到的煙草 Trihelix轉(zhuǎn)錄因子,從 NCBI數(shù)據(jù)庫中查詢獲取染色體定位信息,利用染色體定位軟件MapInspect作出煙草Trihelix轉(zhuǎn)錄因子家族的染色體定位圖。利用在線網(wǎng)站 Softberry (http://linux1.softberry.com/)的Proparam工具進行亞細胞定位分析[14]。
在NCBI和茄科基因組數(shù)據(jù)庫分別下載擬南芥、水稻(Oryza sativa)和普通煙草 K326、番茄(Lycopersicon esculentum)的基因組注釋信息。利用McScan X (http://chibba.pgml.uga.edu/mcscan2/#tm)在線分析軟件對煙草與擬南芥、水稻、番茄及煙草種內(nèi)間進行共線性分析,然后利用 TBtools軟件對分析結(jié)果進行可視化[15—16]。
從 Uniprot數(shù)據(jù)庫(https://www.uniprot.org)獲取擬南芥 Trihelix基因和以上述方法得到的煙草Trihelix基因。然后利用MEGA軟件進行多序列比對(采用ClusalW比對方式,參數(shù)默認(rèn)),構(gòu)建NJ樹(檢驗方式為Bootstrap法,檢驗次數(shù)設(shè)置為1000次,gap處理選擇Pairwise Deletion)[17]。然后利用在線網(wǎng)站EVOLVIEW (https://evolgenius.info//evolview-v2/#)對進化樹進行可視化分析[18]。
利用蛋白質(zhì)保守基序在線程序 MEME (http://meme.nbcr.net/meme/cgi-bin/meme.cgi)分析煙草Trihelix轉(zhuǎn)錄因子家族的保守基序,參數(shù)設(shè)置保守基序最佳匹配長度為6~100 aa,保守基序個數(shù)為10,其他參數(shù)默認(rèn)。利用 GS-DS (http://gsds1.cbi.pku.edu.cn/)在線軟件繪制基因結(jié)構(gòu)圖[19]。
在茄科數(shù)據(jù)庫(https://solgenomics.net/search/locus)下載煙草Trihelix基因家族基因起始密碼子上游3000 bp區(qū)域序列,將序列輸入PlantCare在線網(wǎng)站(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/),預(yù)測啟動子區(qū)域順式作用元件[20]。
在NCBI SRA (https://www.ncbi.nlm.nih.gov/sra/?term=SRP097876)下載煙草 K326冷害處理和對照的轉(zhuǎn)錄組數(shù)據(jù),利用TBtools軟件繪制基因表達熱圖。
煙草基因組共鑒定出32個Trihelix轉(zhuǎn)錄因子家族成員(表1)。根據(jù)煙草Trihelix轉(zhuǎn)錄因子在染色體上的位置,依次將其命名為NtTH1~NtTH32。結(jié)果表明,煙草 Trihelix基因家族編碼的蛋白質(zhì)長度在261 aa (NtTH31)~650 aa (NtTH16),其平均長度為373 aa;蛋白質(zhì)分子量在 31351.4 Da (NtTH31) ~71503.5 Da (NtTH16)之間,理論等電點在 4.48(NtTH27)~10.12 (NtTH3)之間。通過在線網(wǎng)站Softberry預(yù)測整個家族有28個基因定位在細胞核,2個基因定位于細胞質(zhì),1個基因定位在葉綠體,1個基因定位于線粒體。這些結(jié)果煙草Trihelix基因功能研究提供了基本信息。
煙草 Trihelix家族基因的染色體定位顯示,Trihelix基因在煙草染色體上的分布不均勻,Nt15號染色體上的Trihelix基因分布最多,有6個基因,Nt01、Nt06、Nt22號染色體上僅有1個Trihelix基因(表1、圖1)。煙草Trihelix家族的部分基因緊密地聚集在染色體上,呈現(xiàn)一種聚類現(xiàn)象,如NtTH2和NtTH3緊密地排列在2號染色體上,NtTH28和NtTH29緊密排列在 23號染色體上。說明煙草Trihelix家族基因在染色體上的分布存在熱點區(qū)域。
圖1 煙草Trihelix基因在染色體上的位置Fig. 1 Mapping of the Trihelix genes on tobacco chromosomes
表1 煙草Trihelix家族基因信息Table 1 Gene information of Trihelix family in tobacco
(續(xù)表 1)
為進一步推斷植物間Trihelix基因的進化關(guān)系,對煙草、水稻及擬南芥的Trihelix基因進行染色體內(nèi)共線性分析(圖2)。結(jié)果顯示,煙草與擬南芥有2對共線性Trihelix基因,煙草與水稻僅有1對共線性Trihelix基因,煙草與番茄有 10對共線性 Trihelix基因,這表明煙草Trihelix基因與番茄之間的同源關(guān)系更近,可能具有共同的祖先(圖2)。
隨著人口老齡化和社會發(fā)展,終末期腎病的發(fā)病率越來越高, 血液透析是目前慢性腎衰竭患者腎臟替代治療方法,因患者增加,因此維持性血液透析患者群越來越大。這一群體中存在許多嚴(yán)重的心身問題,如焦慮抑郁情緒,嚴(yán)重影響患者的預(yù)后、依從性和生活質(zhì)量。隨著透析技術(shù)的進步,心理健康對維持性透析患者依從性的提高以及生活質(zhì)量的改善影響尤為重要。因此,有必要在血液凈化中心加強對于維持性血液透析患者的心理評估和干預(yù),通過采用合理積極的心理護理干預(yù),促成患者提高生活信心,依從性,克服疾病,促進患者身心健康的恢復(fù)[1-2]。本研究選擇2016年4月本研究分析了改善維持性血液透析患者心理健康的心理護理方法,現(xiàn)報告如下。
圖2 Trihelix家族基因的物種間共線性Fig. 2 Species collinearity of Trihelix family genes
煙草物種內(nèi)Trihelix基因共線性分析顯示,NtTH1和NtTH30基因在Nt01和Nt23號染色體上具有共線性;NtTH5、NtTH13和NtTH25基因在Nt02、Nt10和Nt19號染色體上具有共線性;NtTH9和NtTH32基因在Nt05和Nt24號染色體上具有共線性;NtTH10和NtTH17基因在Nt05和 Nt15號染色體上具有共線性;NtTH20和NtTH21基因在Nt17號染色體上具有共線性(圖3)。由此說明,煙草Trihelix家族的成員可能由于基因復(fù)制而增加。
圖3 煙草Trihelix家族基因物種內(nèi)共線性分析Fig. 3 Intra-species collinearity analysis of Trihelix family genes in tobacco
為明確煙草Trihelix轉(zhuǎn)錄因子的進化關(guān)系,選取了擬南芥和煙草的Trihelix轉(zhuǎn)錄因子家族進行構(gòu)建系統(tǒng)發(fā)育進化樹(圖4)。結(jié)果顯示,煙草Trihelix家族基因可以大致分成5個亞家族,即GT-1、GT-2、GTγ、SH4和SIP1,在這5個亞家族中,SIP1亞家族的成員最多,有10個成員。其次GTγ亞家族,有7個成員。GT-1、GT-2和SH4亞家族最少,只有5個成員。說明煙草Trihelix家族成員在不同的亞家族的數(shù)量不均勻。
圖4 擬南芥和煙草Trihelix轉(zhuǎn)錄因子系統(tǒng)進化樹Fig. 4 Phylogenetic tree of Trihelix transcription factor family in tobacco and Arabidopsis thaliana
對煙草32個Trihelix轉(zhuǎn)錄因子的保守基序進行分析顯示,5個亞家族都有Motif1和Motif2 (圖5A)。在32個家族成員中,除了NtTH18和NtTH3之外,其余成員均有Motif1基序,且NtTH1、NtTH30僅有Motif1。GT-1亞家族中,除 NtTH18外,均含有Motif1/2/6,且NtTH10和NtTH17還含有Motif10。GT-2亞家族除含有Motif1/2/6/7外,還含有Motif8。GTγ亞家族都含有 Motif3/5/9,且 Motif9和 Motif5緊鄰,除NtTH3外,其余成員均含有Motif1/2/6。SH4亞家族僅含有 Motif1/2/6。SIP1亞家族 NtTH2和NtTH24不含Motif4,其余成員均含有Motif4基序。說明在同一亞家族,煙草Trihelix轉(zhuǎn)錄因子具有相似和特殊的保守基序,各亞家族之間有著較強的差異。
煙草Trihelix基因結(jié)構(gòu)分析顯示,煙草Trihelix家族基因的內(nèi)含子數(shù)從0到6個不等,大部分內(nèi)含子數(shù)在3個以下,1個的最多,共有16個基因,分布在 GT-1、GT-2、GTγ、SIP1 亞家族(圖 5B)。GTγ和SIP1亞家族的11個基因無內(nèi)含子。含2個內(nèi)含子和 3個內(nèi)含子的基因數(shù)均為 2個,分別為 GT-2亞家族NtTH12、SH4亞家族NtTH22和GT-1亞家族NtTH10、NtTH17。含6個內(nèi)含子的基因只有SIP1亞家族 NtTH2。說明同一亞家族的基因結(jié)構(gòu)相似,同時也有差異。
圖5 煙草Trihelix轉(zhuǎn)錄因子保守基序和基因結(jié)構(gòu)Fig. 5 Gene motifs and gene structure of tobacco Trihelix family transcription factors
對32個煙草Trihelix基因上游2000 bp啟動子序列中的順式作用元件進行分析,結(jié)果表明順式作用元件主要分為光信號響應(yīng)元件(G-Box、Box4、ATCT-motif、MRE等)、脅迫和激素響應(yīng)元件(圖6)。對煙草 Trihelix基因啟動子中與多種激素和脅迫相關(guān)的順式作用元件進行歸納,結(jié)果顯示在其啟動子區(qū)至少含有12種相關(guān)的順式元件,包括5種激素和2種脅迫相關(guān)的元件。其中煙草Trihelix基因的MeJA響應(yīng)元件(TGACG-motif、CGTCA-motif)最多,共有38個,且在同一基因的個數(shù)相同。其次是脫落酸響應(yīng)元件(ABRE),有20個。AuxRR-core順式作用元件含量最少,只有3個。NtTH14不含激素和非生物脅迫響應(yīng)順元件,NtTH24基因所含的順式作用元件最多。說明煙草Trihelix家族基因可能在煙草的生長發(fā)育和非生物脅迫中發(fā)揮著重要作用。
圖6 煙草Trihelix基因啟動子順式作用調(diào)控元件Fig. 6 The cis-acting regulatory elements of tobacco Trihelix gene promoter
利用普通煙草 K326在低溫脅迫下的轉(zhuǎn)錄組RNA-seq數(shù)據(jù)篩選煙草的32個Trihelix家族基因,通過繪制熱圖分析 32個基因在低溫脅迫(4 ℃處理1 d)下的表達情況(圖7)。結(jié)果顯示,大部分NtTH基因低溫處理后表達量都呈現(xiàn)上調(diào)。而 NtTH4和 NtTH25基因在低溫處理后的表達量顯著增加,NtTH3和NtTH9等基因的表達量明顯降低。表達量增加的 NtTH4和 NtTH25基因分別屬于GT-1和 GTγ亞家族,表達量降低的基因分布SIP1、GTγ、GT-2和 SH4亞家族。說明 NtTH2、NtTH3、NtTH4、NtTH9、NtTH13、NtTH14、NtTH16、NtTH22、NtTH24、NtTH25 和 NtTH30基因與冷害脅迫相關(guān)。
圖7 煙草Trihelix家族基因在冷脅迫下的特異性分析Fig. 7 The specificity of the tobacco Trihelix family genes under cold stress analysis
植物Trihelix基因家族已被廣泛地在水稻[1]、棉花(Gossypium hirsutum)[21]等作物上研究。然而,關(guān)于煙草Trihelix基因家族的研究較少。本研究鑒定了32個煙草Trihelix基因,其序列長度、分子量和等電點等差異較大,大部分基因位于細胞核。32個煙草Trihelix基因分類與擬南芥Trihelix家族的分類一致,并與擬南芥同一亞家族的Trihelix基因有著相似的理化性質(zhì)和基因結(jié)構(gòu),說明煙草Trihelix基因家族與已知擬南芥Trihelix基因家族有較高的同源性。
同一家族的不同成員在染色體上或進化樹的同一區(qū)域彼此相鄰或接近,那么他們之間可能存在串聯(lián)重復(fù)關(guān)系,可能具有相同或相似的功能[22]。煙草Trihelix轉(zhuǎn)錄因子家族部分基因聚集到同一染色體上,因此,可以推測在 Nt02號染色體上的 NtTH2和NtTH3基因、23號染色體上的NtTH28和NtTH29基因是串聯(lián)重復(fù)序列,可能有相同或相似的功能(圖 1)。
共線性分析可闡明物種間的進化關(guān)系,提供物種多樣性、基因組進化的模式[23]。本研究煙草與番茄之間存在的同源基因最多,表明煙草與番茄的Trihelix基因是由同一祖先進化而來的。同時,物種內(nèi)共線性分析表明,煙草內(nèi)某些基因存在共線性,這可能是基因復(fù)制的結(jié)果。保守基序分析顯示,在煙草 Trihelix轉(zhuǎn)錄因子在各亞家族之間有較強的特異性。同時,煙草Trihelix家族中GTγ和SIP1亞家族中的大部分基因無內(nèi)含子,表明其保守性較高。
在系統(tǒng)發(fā)育樹中,聚集在同一組的基因家族成員往往具有相似的功能[24]。本研究顯示,煙草與擬南芥有相似功能的Trihelix同源基因。GT-2亞家族的 NtTH16基因與擬南芥 AT5G28300、AT1G33240基因同源(圖4),AT5G28300是可以依靠Ca2+的鈣素調(diào)節(jié)蛋白,對冷害和干旱脅迫具有逆境脅迫應(yīng)答[25],該基因的過表達增強擬南芥植株的抗冷性[6]。GTγ亞家族的NtTH3基因與擬南芥AT3G10040基因同源,而AT3G10040基因與冷害、干旱和鹽脅迫相關(guān)[26]。因此,推測NtTH16、NtTH3基因也有著響應(yīng)冷害和干旱脅迫的功能。
不同順式作用元件在啟動子區(qū)域的分布表明其功能和調(diào)控的差異[27]。而與非生物脅迫相關(guān)的元件有脫落酸反應(yīng)元件(ABRE)[28]和低溫響應(yīng)元件(LTR)[29],這些與脅迫相關(guān)的元件已經(jīng)被證明在脅迫下對植物的生存有著重要的作用。順式作用元件分析顯示,煙草Trihelix基因啟動子序列包含多個與激素反應(yīng)和非生物脅迫相關(guān)的響應(yīng)元件(圖6),表明煙草 Trihelix基因廣泛地參與生長發(fā)育和非生物脅迫響應(yīng),且 12個順式啟動元件中的 NtTH16基因的ABRE最多,數(shù)量遠高于其他基因。因此,NtTH16基因在植物生長和非生物脅迫相關(guān)反應(yīng)中發(fā)揮重要作用。
基因在植物組織和發(fā)育階段的表達特異性表明該基因可能的功能[30]。對低溫處理下煙草轉(zhuǎn)錄組數(shù)據(jù)的分析表明(圖7),煙草Trihelix家族大部分基因在處理前后表達量都較高,部分基因在低溫處理后表達量發(fā)生改變。因此,可以確定煙草Trihelix基因在響應(yīng)低溫脅迫上起重要作用,但各基因的具體功能還需進一步驗證。
本研究利用比較基因組和生物信息學(xué)的方法,對煙草Trihelix家族基因進行系統(tǒng)性鑒定和分析。煙草Trihelix家族基因的理化性質(zhì)有著較大的差異;不同亞家族之間的基因結(jié)構(gòu)有差異,與番茄進化關(guān)系相近;煙草Trihelix家族基因在生長和非生物脅迫中有重要作用,NtTH16等基因有響應(yīng)冷害和干旱脅迫的功能。為今后研究煙草Trihelix基因功能及抗冷機制奠定基礎(chǔ)。