劉 俊,李 龍,吳耀松,劉 燕,任閃閃,陳玉龍*
杜仲TCP轉(zhuǎn)錄因子鑒定及生物信息學(xué)分析
劉 俊1, 3, 4,李 龍2,吳耀松1,劉 燕1,任閃閃1,陳玉龍1*
1. 河南中醫(yī)藥大學(xué)中醫(yī)藥科學(xué)院 河南省中醫(yī)方證信號傳導(dǎo)重點實驗室,河南 鄭州 450046 2. 西北農(nóng)林科技大學(xué)林學(xué)院,陜西 楊凌 712100 3. 國際竹藤中心 國家林業(yè)和草原局竹藤科學(xué)與技術(shù)重點開放實驗室,北京 100102 4. 國際竹藤中心 安徽太平試驗中心,安徽 黃山 245716
對杜仲TCP(teosinte branched 1/cycloidea/proliferating)基因家族進行篩選分析,以期為基因功能深入研究奠定基礎(chǔ)。以杜仲基因組數(shù)據(jù)庫為基礎(chǔ),通過生物信息學(xué)系統(tǒng)分析基因家族的理化性質(zhì)、系統(tǒng)進化、基因結(jié)構(gòu)、啟動子順式作用元件及其在杜仲葉片發(fā)育及膠形成中的表達水平。從杜仲基因組中共鑒定到14個,氨基酸數(shù)目介于139~492,理論等電點分布在5.54~9.72,相對分子質(zhì)量區(qū)域為18 880~53 620,亞細胞定位預(yù)測在細胞核中,均為親水性蛋白。系統(tǒng)進化分為PCF、CIN和CYC/TB1 3個亞家族,分別包含5、6、3個EuTCPs蛋白。表達模式分析顯示,在杜仲葉片不同發(fā)育時期存在顯著差異,每個發(fā)育時期表達量各不相同,正調(diào)控杜仲膠的形成。杜仲中TCP家族包含14個成員,各成員的分子特征和組織表達特異性存在差異,可能參與杜仲葉片發(fā)育及杜仲膠的形成。
杜仲;TCP轉(zhuǎn)錄因子;亞細胞定位;系統(tǒng)進化;表達分析
TCP(teosinte branched1,cycloidea,and proliferating cell factor family)蛋白一般由60個氨基酸組成,含有一個非典型的基本螺旋(basic helix-loop-helix,bHLH)結(jié)構(gòu)和R結(jié)構(gòu)域[1]。TCP基因家族分為Class I和Class II 2個亞家族,Class I又稱為PCF亞家族,Class II進一步劃分為CIN和CYC/TB1亞家族[2]。TCP轉(zhuǎn)錄因子參與植物胚胎發(fā)育[3]、側(cè)枝形成[4-5]、開花調(diào)控[6]、脅迫響應(yīng)[7]以及激素信號[5]等多種生物學(xué)過程。
TB1和TB1-like蛋白屬于CYC/TB1亞家族,抑制擬南芥分枝發(fā)育[8]。通過誘導(dǎo)脂肪氧化酶()基因表達,促進茉莉酸(jasmonic acid,JA)生物合成和成熟葉片衰老[9],在花器官中抑制基因表達[10]。通過靶向生長素生物合成酶基因調(diào)控生長素生物合成[11],是PCF亞家族成員,在種子萌發(fā)過程中發(fā)揮負調(diào)控作用[12]。毛竹通過脫落酸(abscisic acid,ABA)依賴信號在抗旱中發(fā)揮正調(diào)控作用,以茉莉酸甲酯(methyl jasmonate,Me-JA)介導(dǎo)途徑負調(diào)控側(cè)根生長[13]。通過正調(diào)控影響水稻耐鹽性[14],和是microRNA319的靶基因,在冷脅迫中發(fā)揮正調(diào)控作用[15]。在擬南芥中超表達誘導(dǎo)、、上調(diào)表達,下調(diào)表達,導(dǎo)致側(cè)根數(shù)目減少,提高轉(zhuǎn)基因植株脅迫耐受性[16]。
杜仲Oliver是我國特有單科、單屬、單種的多年生第三紀孑遺樹種,雌雄異株,具有橡膠和藥材的雙重性質(zhì)[17]。廣泛分布于溫帶及亞熱帶地區(qū),適應(yīng)能力強,在酸性或鹽堿性的貧瘠土壤中均能生長良好[18]。其樹皮、葉片及種子均可入藥,富含多種活性成分,對多種疾病的預(yù)防及提高人體免疫力具有顯著的效果,是我國二級珍稀保護植物。目前,對杜仲的研究與利用多局限于資源收集、藥理學(xué)及形態(tài)學(xué)研究,分子遺傳學(xué)方面的報道相對較少,嚴重制約了杜仲分子育種及相關(guān)生物學(xué)特性研究。目前TCP轉(zhuǎn)錄因子已在多個物種中進行了研究,然而杜仲TCP基因家族還未報道,本研究以杜仲基因組數(shù)據(jù)[19]為基礎(chǔ),從基因組水平對基因家族進行鑒定、理化性質(zhì)、進化關(guān)系、保守基序以及表達模式分析,以期為進一步探索杜仲基因功能奠定基礎(chǔ)。
杜仲材料種植于西北農(nóng)林科技大學(xué)苗圃(陜西楊凌),經(jīng)西北農(nóng)林科技大學(xué)李龍博士鑒定為杜仲Oliver。取生長正常、長勢一致的2年生“秦仲1 號”(Qinzhong 1)杜仲幼苗的葉芽(莖尖)、生長葉(長葉片,3 cm)、幼葉(完全展開的新葉)、老葉(完全展開60 d葉片),每個樣品3個重復(fù),經(jīng)液氮處理后?80 ℃冰箱保存,用于RNA提取。
從杜仲基因組數(shù)據(jù)庫Genome Warehouse(https://bigd.big.ac.cn/gwh/Assembly/13/show)中下載TCP蛋白候選序列,利用NCBI的(Conserved Domain Search Service(CD Search))分析蛋白結(jié)構(gòu)域,保留含有完整bHLH結(jié)構(gòu)域的序列。通過在線軟件ProtParam (http://web.expasy. org/protparam/)分析蛋白理化性質(zhì),使用Plant-mPLoc (http:// www.csbio.sjtu.edu.cn/bioinf/ plant-multi/)預(yù)測EuTCPs蛋白亞細胞定位,利用在線工具ExPASY(https://www.expasy.org/tools)預(yù)測EuTCPs氨基酸數(shù)量、相對分子質(zhì)量(W)、理論等電點(PI),通過Expasy(https://web. expasy.org/protscale/)軟件分析蛋白的親疏水性,利用SOPMA(https://npsa- prabi.ibcp.fr/cgi-bin/npsa_automat.plpage=npsa_sopma.html)和Phyre 2(http://www.sbg.bio.ic.ac.uk/ phyre2/html/page. cgi?id= index)軟件分別預(yù)測蛋白的二級結(jié)構(gòu)和三級結(jié)構(gòu)。
通過Clustal X1.83軟件對杜仲、水稻、擬南芥和毛竹TCPs氨基酸序列進行多序列比對,利用MEGA 6.0的鄰接法(neighbor-joining,N-J)構(gòu)建系統(tǒng)發(fā)育樹,重復(fù)次數(shù)設(shè)置為1000次,其他參數(shù)為默認值[20]。
通過MEME(http://meme-suite.org/)在線軟件對EuTCP基因家族成員進行基序分析(參數(shù)是:any number of Repetitions(anr),maximum number of Motifs=10,minimum width≥6,and maximum width ≤50)。為了解析啟動子區(qū)域順式作用元件,對基因ATG上游2000 bp序列進行查找分離,利用Plant CARE(http://bioinformatics. psb.ugent.be/webtools/plant care/htmL/)軟件進行啟動子順式作用元件分析。
從NCBI的Short Read Arshive(SRA)數(shù)據(jù)庫中下載杜仲葉片不同發(fā)育時期(葉芽、初生葉、幼葉、老葉)(版本號SRP218063)[21]及不同膠含量(低含量、高含量)(版本號SRP158357)[22]轉(zhuǎn)錄組數(shù)據(jù),基因相對表達豐度用FPKM值表示,對該數(shù)值取對數(shù)(log2)進行統(tǒng)計分析,通過MeV4-9-0工具繪制基因表達圖譜,表達量最高的用綠色方框表示,表達量最低的用黃色方框表示。
利用STRING軟件(https://string-db.org/)上傳EuTCPs蛋白序列,選擇擬南芥數(shù)據(jù)庫進行序列比對,根據(jù)已知擬南芥蛋白互作關(guān)系,通過Blast比對杜仲同源蛋白,通過Cytoscape 3.7.0軟件對EuTCP基因家族蛋白互作信息進行評估和預(yù)測[23]。
通過Genome Warehouse數(shù)據(jù)庫,從杜仲基因組中共鑒定到14個基因(表1),利用Pfam和NCBI的Conserved Domain Search在線分析軟件對EuTCPs蛋白進行結(jié)構(gòu)域驗證。結(jié)果顯示:14個EuTCPs蛋白均含有非典型的bHLH(BASIC、HELIX I、LOOP和HELIX II)特征結(jié)構(gòu)域,分別命名為EuTCP1~EuTCP14。使用ExPASy工具,對EuTCP家族成員進行蛋白質(zhì)理化性質(zhì)分析,EuTCP14蛋白最長,編碼492個氨基酸,EuTCP13蛋白最短,編碼139個氨基酸,相對分子質(zhì)量分布區(qū)域為18 880~53 620,等電點范圍是5.54(EuTCP14)~9.72(EuTCP6)。亞細胞定位預(yù)測結(jié)果顯示,EuTCPs均定位在細胞核中(表1)。
表1 杜仲TCP蛋白序列特征及亞細胞定位預(yù)測
Table 1 Amino acid sequence characteristics and predicted subcellular location of E. ulmoides TCP proteins
基因ID基因名擬南芥同源基因染色體定位CDS長度/bp蛋白質(zhì)大小/aaMWPI亞細胞定位 EUC12473-RAEuTCP1AT2G37000Super-Scaffold_57 62720822 441.518.85細胞核 EUC20760-RAEuTCP2AT2G31070scaffold865_obj 78025929 028.368.48細胞核 EUC13147-RAEuTCP3AT4G18390Super-Scaffold_67131143647 303.138.82細胞核 EUC03320-RAEuTCP4AT3G27010Super-Scaffold_177 93030932 689.328.99細胞核 EUC22153-RAEuTCP5AT3G02150scaffold1183_obj102934238 298.696.90細胞核 EUC10434-RAEuTCP6AT5G23280Super-Scaffold_46 79826527 785.139.72細胞核 EUC05665-RAEuTCP7AT1G68800Super-Scaffold_28108336041 030.627.75細胞核 EUC03513-RAEuTCP8AT3G02150Super-Scaffold_174 87629132 694.719.44細胞核 EUC15623-RAEuTCP9AT1G67260scaffold1436_obj 74724827 907.408.86細胞核 EUC12970-RAEuTCP10AT3G47620Super-Scaffold_113112537440 069.247.26細胞核 EUC06461-RAEuTCP11AT1G53230scaffold166_obj 87929232 398.815.65細胞核 EUC10433-RAEuTCP12AT5G23280Super-Scaffold_46 79826527 785.139.72細胞核 EUC15622-RAEuTCP13AT1G67260scaffold1436_obj 50716918 878.146.41細胞核 EUC07713-RAEuTCP14AT3G15030Super-Scaffold_600147949253 623.465.54細胞核
二級結(jié)構(gòu)分析顯示,EuTCPs蛋白主要由α螺旋、無規(guī)則卷曲、延伸鏈和β轉(zhuǎn)角組成,順序均是由無規(guī)則卷曲>α螺旋>延伸鏈>β轉(zhuǎn)角,具體數(shù)值見表2。α螺旋在DNA結(jié)合基序中發(fā)揮重要作用,無規(guī)則卷曲易受側(cè)鏈相互作用,構(gòu)成活性部位和功能部位。EuTCPs蛋白三級結(jié)構(gòu)非常相似,結(jié)果如圖1所示,無規(guī)則卷曲所占比例最大,蛋白空間結(jié)構(gòu)不同,決定功能的差異。
表2 杜仲TCP基因家族二級結(jié)構(gòu)分析
Table 2 Secondary structures analysis of E. ulmoides TCP gene family
基因名最低值位點最高值位點α螺旋(占比/%)延伸鏈(占比/%)β轉(zhuǎn)角(占比/%)無規(guī)則卷曲(占比/%) EuTCP1?2.733 122.056150 37(17.79) 27(12.98)15(7.21)129(62.02) EuTCP2?2.889 361.278232 39(15.06) 43(16.60)13(5.02)164(63.32) EuTCP3?3.400 351.700 340 71(16.28) 49(11.24) 9(2.06)307(70.41) EuTCP4?3.300 132.022 135 79(25.57) 31(10.03)14(4.53)185(59.87) EuTCP5?3.1443330.811 4827(7.89)27(7.89) 0(0.00)278(81.29) EuTCP6?2.944 191.778 57 72(27.17) 42(15.85)13(4.91)138(52.08) EuTCP7?3.789 2351.722 314129(35.83)25(6.94) 9(2.50)197(54.72) EuTCP8?2.522 1271.41122928(9.62) 34(11.68) 7(2.41)222(76.29) EuTCP9?2.756 841.200 166 84(33.87) 30(12.10)10(4.03)124(50.00) EuTCP10?3.533 2251.444 54 53(14.17) 46(12.30)17(4.55)258(68.98) EuTCP11?2.978 311.167 108 61(20.89) 40(13.70)10(3.42)181(61.99) EuTCP12?2.944 191.778 57 72(27.17) 42(15.85)13(4.91)138(52.08) EuTCP13?3.056 871.022 30 55(32.54) 17(10.06) 2(1.18) 95(56.21) EuTCP14?3.800 2261.300 452 87(17.68) 59(11.99)20(4.07)326(66.26)
圖1 杜仲TCPs三級結(jié)構(gòu)預(yù)測
利用MEGA 6.0分析軟件,對14個杜仲EuTCPs,22個水稻OsTCPs[24],24個擬南芥AtTCPs[25]和19個毛竹PheTCPs[26]蛋白進行1000次重復(fù)搜索,構(gòu)建系統(tǒng)進化樹。結(jié)果如圖2所示,79個TCPs蛋白分為Class I和Class II 2個大亞家族,其中Class I又稱為PCF亞家族;Class II亞家族進一步劃分為CYC/TB1和CIN亞家族。PCF亞家族所包含TCPs成員數(shù)量最多,含有40個TCPs蛋白,5個EuTCPs,13個AtTCPs,10個OsTCPs和12個PtTCPs,其次是CIN亞家族,由29個TCPs蛋白組成,CYC/TB1亞家族所含蛋白數(shù)量最少,僅包含10個TCPs蛋白,3個AtTCPs,3個EuTCPs,3個OsTCPs,1個PheTCPs。
為了分析杜仲TCP轉(zhuǎn)錄因子家族保守結(jié)構(gòu)域序列特征,利用DNAMAN7.0工具對杜仲、擬南芥和水稻TCP家族成員氨基酸序列進行比對,結(jié)果如圖3所示,杜仲TCP結(jié)構(gòu)域氨基酸分布與擬南芥和水稻十分相似,14個杜仲TCP家族成員均含有完整的非典型性bHLH結(jié)構(gòu)域,暗示杜仲TCP結(jié)構(gòu)域高度保守性。BASIC區(qū)域由19個氨基酸組成,其中有9個氨基酸是高度保守的,HLH區(qū)域含有5個高度保守的氨基酸。杜仲TCP轉(zhuǎn)錄因子家族有5個蛋白(EuTCP1、EuTCP4、EuTCP6、EuTCP10和EuTCP12)BASIC區(qū)域缺少4個氨基酸,圖2系統(tǒng)進化樹結(jié)果顯示,他們均屬于Class I亞家族,其余蛋白均屬于Class II亞家族,這與前人研究結(jié)果相一致[2],表明杜仲TCP轉(zhuǎn)錄因子家族進化的保守性。
為了解析基因結(jié)構(gòu)多樣性和進化關(guān)系,利用MEME在線軟件對EuTCPs轉(zhuǎn)錄因子家族進行基序分析。結(jié)果如圖4所示,EuTCPs轉(zhuǎn)錄因子分為3個亞家族(PCF、CYC/TB1和CIN),進化關(guān)系與圖2結(jié)果相一致,20個保守基序,分別命名為Motif 1~Motif 20,14條EuTCPs蛋白均含有Motif 1基序,表明均屬于TCP轉(zhuǎn)錄因子家族。同一亞家族EuTCPs蛋白基序具有高度相似性,CIN亞家族均含有Motif 1和Motif 2,PCF亞家族成員均含有Motif 1和Motif 19,表明同一亞家族EuTCPs可能具有相似的功能。不同亞家族基序存在顯著差異,有些Motifs只在特定亞家族中存在,例如,Motif 3~Motif 6只存在于PCF亞家族,只有CYC/TB1亞家族含有Motif 7和Motif 9,暗示某些基序在亞家族功能特異性方面發(fā)揮重要作用。
利用MEGA 6.0的鄰接法構(gòu)建系統(tǒng)進化樹,不同物種TCPs蛋白用不同顏色標記,藍色三角形代表擬南芥,紅色圓形代表水稻,藍綠色菱形代表毛竹,杜仲TCPs蛋白由綠色菱形標記
結(jié)構(gòu)域名稱在序列上方標記,黑色橫線代表該區(qū)域的范圍。黑色表示氨基酸是保守的,紅色和藍綠色表示氨基酸是相似的,無顏色表示氨基酸保守性較低。
A-利用MEGA 6.0的鄰接法構(gòu)建EuTCP基因家族系統(tǒng)進化樹 B-EuTCPs基因結(jié)構(gòu)分析 C-保守基序氨基酸分布
為了探索基因功能和表達調(diào)控模式,利用Plant CARE在線分析軟件對起始密碼子(ATG)上游2000 bp序列進行順式作用元件分析,結(jié)果如圖5所示,啟動子中不僅含有基本順式作用元件,還存在4種類型元件:一、激素調(diào)控元件,如赤霉素響應(yīng)元件:ABRE;生長素響應(yīng)元件:AuxRR-core;水楊酸響應(yīng)元件:CGTCA-motif;二、光響應(yīng)元件,如Box 4、G-box、G-Box、GT1-motif、GATA-motif等,三、脅迫響應(yīng)元件,如干旱脅迫響應(yīng)元件:MBS,低溫響應(yīng)元件:LTR和厭氧脅迫相關(guān)元件:ARE等;四、生理響應(yīng)元件,如O2-site、CAT-box等,推測可能在杜仲生長發(fā)育、脅迫響應(yīng)、激素調(diào)節(jié)以及光周期調(diào)控中發(fā)揮重要作用?;蛑泄忭憫?yīng)元件數(shù)量最多,共有135個,其中G-box元件有38個,含有28個Box 4元件,暗示s基因的轉(zhuǎn)錄可能受光周期調(diào)控。啟動子區(qū)域含有44個ABRE元件和25個ARE元件(圖5-B),表明可能參與ABA調(diào)節(jié)和厭氧調(diào)控。
為了解析基因在杜仲葉片不同發(fā)育時期及膠形成中的功能,根據(jù)轉(zhuǎn)錄組數(shù)據(jù),檢測基因的表達模式。結(jié)果如圖6、7所示,不同基因在杜仲葉片不同發(fā)育時期及膠含量中表達豐度存在顯著差異,大部分基因在杜仲葉片發(fā)育時期表達豐度較低,有2個基因(和)在杜仲葉片中未檢測到,推測和在杜仲葉片中不發(fā)揮作用?;蛟诙胖偃~片不同發(fā)育時期表達趨勢不盡相同,暗示在杜仲葉片發(fā)育中具有不同的功能,5個基因(、、、、)在杜仲葉芽中表達量最高,4個基因(、、、)在初生葉中表達豐度最高,3個基因(和)在老葉中轉(zhuǎn)錄水平最高。
為了預(yù)測在杜仲膠形成中的功能,利用不同膠含量的轉(zhuǎn)錄組數(shù)據(jù),檢測基因的轉(zhuǎn)錄水平。結(jié)果如圖7所示,大部分在杜仲不同膠含量中表達水平較低,并且低膠含量葉片中的轉(zhuǎn)錄水平低于高膠含量葉片,例如,在高膠含量葉片中的FPKM平均值是17.25,在低膠含量葉片中為7.26,在高膠含量中的轉(zhuǎn)錄水平是24.26,在低膠中為5.05,推測在杜仲膠形成過程中發(fā)揮正調(diào)控作用。
A-每個EuTCP基因啟動子區(qū)域順式作用元件的數(shù)目 B-順式作用元件數(shù)量和含有順式作用元件EuTCPs基因數(shù)量
T01~T03-葉芽 T04~T06-初生葉 T3-1~T3-3-幼葉 T4-1~T4-3-老葉;熱圖右側(cè)為色標,藍色表示低表達豐度,紅色表示高轉(zhuǎn)錄水平
L-1~L-3-低膠含量葉片 H-1~H-3:高膠含量葉片。熱圖上方為色標,藍色表示低轉(zhuǎn)錄水平,紅色表示高轉(zhuǎn)錄水平
表達模式結(jié)果顯示,在杜仲葉片不同發(fā)育階段和膠含量中表達量均較高,特別在初生葉中,F(xiàn)PKM值為111,暗示在杜仲葉片發(fā)育和膠形成過程中發(fā)揮重要作用。為了檢測EuTCP3與其他蛋白的互作關(guān)系,利用STRING數(shù)據(jù)庫,預(yù)測EuTCP3的互作蛋白。結(jié)果如圖8所示,EuTCP3可以與10個蛋白發(fā)生相互作用,其中7個屬于EuTCP基因家族,參與種子萌發(fā)、生物鐘調(diào)節(jié)、細胞周期以及蛋白轉(zhuǎn)錄調(diào)控。MYB-like轉(zhuǎn)錄因子,在發(fā)育種子的原花青素積累中發(fā)揮關(guān)鍵的決定性作用,LOB轉(zhuǎn)錄因子AS2,是葉片正面細胞增殖負調(diào)控因子,調(diào)節(jié)葉片對稱層的形成和脈絡(luò)的建立,AN1-like(SAP11)鋅指蛋白,參與植物非生物脅迫響應(yīng)[27],推測EuTCP3可能與其他蛋白相互作用共同參與杜仲葉片生長發(fā)育以及脅迫響應(yīng)。
利用Cytoscape 3.7.0軟件,構(gòu)建EuTCP轉(zhuǎn)錄因子家族共表達調(diào)控網(wǎng)絡(luò)。結(jié)果如圖9所示,調(diào)控網(wǎng)絡(luò)中共有11個節(jié)點(代表EuTCPs蛋白)和35條邊(代表蛋白質(zhì)之間的相互作用),表明14個EuTCPs中有11個蛋白存在互作關(guān)系,其中EuTCP3、EuTCP5和EuTCP8蛋白互作數(shù)量最多,均與8個EuTCPs蛋白存在互作關(guān)系,暗示EuTCP3、EuTCP5、EuTCP8可能處于EuTCP基因家族核心位置,EuTCP1、EuTCP10、EuTCP11和EuTCP14與7個EuTCPs蛋白互作,EuTCP4和EuTCP6預(yù)測與5個EuTCPs蛋白互作,EuTCP7與4個EuTCPs蛋白互作,EuTCP9與2個EuTCPs蛋白發(fā)生互作關(guān)系。
圖8 EuTCP3蛋白互作網(wǎng)絡(luò)
杜仲是絞木目(Garryales)杜仲科(Eucommiaceae)杜仲屬L.中唯一現(xiàn)存的一個種,是我國主要天然橡膠樹種,也是重要的木本油料和名貴中藥材[28],主要分布于我國的陜西、湖南、貴州、云南、四川、江西等地區(qū)[29]。TCP蛋白是植物特有的參與生長發(fā)育、非生物脅迫、葉片衰老、側(cè)枝形成、花粉發(fā)育等多種生物學(xué)過程的一類轉(zhuǎn)錄因子[13, 30]。目前為止,TCP基因家族已在多個物種中進行了報道,擬南芥中有24個AtTCPs[25],水稻含有22個OsTCPs[24],玉米中存在29個ZmTCPs成員[31],棉花中包含38個GrTCPs[32],番茄中有30個SlTCPs[33],黃瓜中存在22個CsTCPs[34],柑橘中含有20個CsTCPs[35],西瓜中有27個ClTCPs[36],葡萄中包含18個VvTCPs[37],蘋果中52個MdTCPs[38],菠蘿中有9個[39]、毛竹中存在19個PheTCPs[26]等。本研究以杜仲基因組數(shù)據(jù)為基礎(chǔ),利用生物信息學(xué)方法,從杜仲基因組中共鑒定到14個基因,分為3個亞家族,這與前人研究結(jié)果相一致。PCF亞家族包含5個EuTCPs蛋白,CYC/TB1亞家族含有3個,6個EuTCPs蛋白屬于CIN亞家族。序列比對結(jié)果顯示,14個EuTCPs與擬南芥、水稻TCP蛋白結(jié)構(gòu)域具有高度的相似性,N末端均含有非典型的basic-helix-loop-helix結(jié)構(gòu)域(圖3),基序分析發(fā)現(xiàn),Motif 1基序存在于所有EuTCPs轉(zhuǎn)錄因子(圖4),表明他們均屬于TCP轉(zhuǎn)錄因子家族,在基因進化過程中具有較保守性。根據(jù)保守結(jié)構(gòu)域是否含有四種氨基酸殘基,將TCP基因家族分為2個亞家族,Class I亞家族保守結(jié)構(gòu)域含有16個氨基酸殘基,Class II亞家族TCP結(jié)構(gòu)域包含20個氨基酸,保守結(jié)構(gòu)域外含有促進蛋白質(zhì)相互作用的精氨酸富集R結(jié)構(gòu)域[1],EuTCP3、EuTCP5、EuTCP7和EuTCP9均含有motif 8(R結(jié)構(gòu)域),與AtTCPs、OsTCPs[24]、BpTCPs[40]、VvTCPs[37]、PmTCPs[41]和FvTCPs[42]等具有相似性,推測EuTCP3、EuTCP5、EuTCP7和EuTCP9可能具有相似的功能。
圖9 EuTCP基因家族蛋白互作預(yù)測
聚類分析結(jié)果顯示,與聚為同一分支,參與調(diào)節(jié)擬南芥細胞擴張、分裂和分化,在硝酸鹽誘導(dǎo)的系統(tǒng)信號通路中發(fā)揮重要作用[43],菊花為的同源基因,超表達增加轉(zhuǎn)基因菊花和擬南芥的側(cè)根數(shù)量和長度[44]。是的同源基因,主要在胚胎維管組織中表達,促進幼嫩節(jié)間細胞增殖,抑制葉片細胞擴增,突變體提高種子萌發(fā)對外源脫落酸和多效唑的敏感性,參與激活擬南芥胚胎生長[45],異源轉(zhuǎn)化擬南芥導(dǎo)致細胞周期相關(guān)基因下調(diào)表達,抑制器官大小,葉綠素和類胡蘿卜素含量升高,延長花期,延緩葉片衰老[46]。和聚為同一分支的、、、和均在擬南芥幼嫩葉片中表達,與野生型相比,突變體增加葉片面積,四重突變體和五重突變體蓮座葉數(shù)目減少,葉片增大[47]。為的同源基因,在幼苗子葉中表達,激活和的光響應(yīng)表達,通過光敏色素相互作用因子(PIFs)調(diào)節(jié)與、和啟動子的結(jié)合,黑暗條件下抑制與上述啟動子的結(jié)合[48]。與(CO)啟動子結(jié)合,黃昏前后誘導(dǎo)基因表達,與細胞核中另一個開花調(diào)節(jié)因子A()結(jié)合,誘導(dǎo)以依賴方式表達,調(diào)節(jié)發(fā)育和開花調(diào)控[49]。與互為同源基因,超表達導(dǎo)致轉(zhuǎn)基因擬南芥在光依賴條件下下胚軸矮小,特別是藍光條件下,與隱花色素蛋白(CRY1)互作,正調(diào)控和基因表達[50]。與親緣關(guān)系最近,在陰暗條件下顯著積累,及其同源基因和通過PIF依賴和獨立途徑誘導(dǎo)生長素生物合成,在介導(dǎo)陰暗誘導(dǎo)下胚軸伸長中發(fā)揮重要作用。白光下,三重突變體()表現(xiàn)出下胚軸缺陷;陰暗條件顯著降低下胚軸伸長,與和的啟動子結(jié)合,誘導(dǎo)生長素表達[51],推測EuTCPs轉(zhuǎn)錄因子在杜仲生長發(fā)育、激素調(diào)節(jié)和開花調(diào)控中發(fā)揮重要作用。
綜上所述,本研究以杜仲全基因組數(shù)據(jù)為背景,對杜仲TCP轉(zhuǎn)錄因子家族進行了全面的生物信息學(xué)分析,共鑒定出14個,分為Class I與Class II 2大類,進一步劃分為3個亞家族(PCF、CYC/TB1和CIN)。理化性質(zhì)分析顯示,EuTCPs編碼139~492個氨基酸,PI分布于5.54~9.72,w區(qū)域為18 880~53 620,亞細胞定位于細胞核中,均為親水性蛋白,二級結(jié)構(gòu)以α-螺旋和無規(guī)則卷曲為主,均含非典型bHLH保守結(jié)構(gòu)域。表達模式分析顯示,EuTCPs基因家族在杜仲葉片發(fā)育中具有不同的表達模式,在高膠含量中的轉(zhuǎn)錄水平高于低膠含量,推測在杜仲膠形成中發(fā)揮正向調(diào)控作用,本研究為深入探索基因功能奠定理論基礎(chǔ)。
利益沖突 所有作者均聲明不存在利益沖突
[1] Cubas P, Lauter N, Doebley J,. The TCP domain: A motif found in proteins regulating plant growth and development [J]., 1999, 18(2): 215-222.
[2] Martín-Trillo M, Cubas P. TCP genes: A family snapshot ten years later [J]., 2010, 15(1): 31-39.
[3] Takeda T, Suwa Y, Suzuki M,. The OsTB1 gene negatively regulates lateral branching in rice [J]., 2003, 33(3): 513-520.
[4] Maurya J P, Singh R K, Miskolczi P C,. Branching regulator BRC1 mediates photoperiodic control of seasonal growth in hybrid aspen [J]., 2020, 30(1): 122-126.
[5] Wang M, le Moigne M A, Bertheloot J,. BRANCHED1: A key hub of shoot branching [J]., 2019, 10: 76.
[6] Yang X, Zhao X G, Li C Q,. Distinct regulatory changes underlying differential expression of teosinte branched1-cycloidea-proliferating cell factor genes associated with petal variations in zygomorphic flowers ofspp. of the family Gesneriaceae [J]., 2015, 169(3): 2138-2151.
[7] Guan P Z, Ripoll J J, Wang R H,. Interacting TCP and NLP transcription factors control plant responses to nitrate availability [J]., 2017, 114(9): 2419-2424.
[8] Finlayson S A.Teosinte Branched1-like 1 regulates axillary bud outgrowth and is homologous to monocot Teosinte Branched1 [J]., 2007, 48(5): 667-677.
[9] Danisman S, van der Wal F, Dhondt S,.class I and class II TCP transcription factors regulate jasmonic acid metabolism and leaf development antagonistically [J]., 2012, 159(4): 1511-1523.
[10] Rubio-Somoza I, Weigel D. Coordination of flower maturation by a regulatory circuit of three microRNAs [J]., 2013, 9(3): e1003374.
[11] Challa K R, Aggarwal P, Nath U. Activation of YUCCA5 by the transcription factor TCP4 integrates developmental and environmental signals to promote hypocotyl elongation in[J]., 2016, 28(9): 2117-2130.
[12] Rueda-Romero P, Barrero-Sicilia C, Gómez-Cadenas A,.DOF6negatively affects germination in non-after-ripened seeds and interacts with TCP14 [J]., 2012, 63(5): 1937-1949.
[13] Liu H L, Gao Y M, Wu M,. TCP10, a TCP transcription factor in moso bamboo (), confers drought tolerance to transgenic plants [J]., 2020, 172: 104002.
[14] Almeida D M, Gregorio G B, Oliveira M M,. Five novel transcription factors as potential regulators of OsNHX1 gene expression in a salt tolerant rice genotype [J]., 2017, 93(1/2): 61-77.
[15] Wang S T, Sun X L, Hoshino Y,. microRNA319 positively regulates cold tolerance by targeting OsPCF6and OsTCP21 in rice (L.) [J]., 2014, 9(3): e91357.
[16] Mukhopadhyay P, Tyagi A K. Erratum: OsTCP19 influences developmental and abiotic stress signaling by modulating ABI4-mediated pathways [J]., 2015, 5: 12381.
[17] 杜紅巖. 中國杜仲圖志 [M]. 北京: 中國林業(yè)出版社, 2014: 23.
[18] 劉建斌. 杜仲種子的化學(xué)成分研究 [D]. 西安: 西北大學(xué), 2006.
[19] Wuyun T N, Wang L, Liu H M,. The hardy rubber tree genome provides insights into the evolution of polyisoprene biosynthesis [J]., 2018, 11(3): 429-442.
[20] Tamura K, Stecher G, Peterson D,. MEGA6: molecular evolutionary genetics analysis version 6.0 [J]., 2013, 30(12): 2725-2729.
[21] Li L, Liu M H, Shi K,. Dynamic changes in metabolite accumulation and the transcriptome during leaf growth and development in[J]., 2019, 20(16): 4030.
[22] Ye J, Han W J, Fan R S,. Integration of transcriptomes, small RNAs, and degradome sequencing to identify putative miRNAs and their targets related to Eu-rubber biosynthesis in[J]., 2019, 10(8): 623.
[23] Liu J, Cheng Z C, Li X Y,. Expression analysis and regulation network identification of the-like gene family in moso bamboo () under photoperiod treatments [J]., 2019, 38(7): 607-626.
[24] Yao X, Ma H, Wang J,. Genome-wide comparative analysis and expression pattern ofgene families inand[J]., 2007, 49(6): 885-897.
[25] Cubas P.[M] // CRC Press:: 2002: 247-266.
[26] 劉俊, 黃容, 程占超, 等. 毛竹TCP基因家族全基因組鑒定與分析 [J]. 基因組學(xué)與應(yīng)用生物學(xué), 2018, 37(12): 5388-5397.
[27] Giri J, Vij S, Dansana P K,. Rice A20/AN1zinc-finger containing stress-associated proteins (SAP1/11) and a receptor-like cytoplasmic kinase (OsRLCK253) interact via A20 zinc-finger and confer abiotic stress tolerance in transgenicplants [J]., 2011, 191(3): 721-732.
[28] Wang L, Jing T, Li T Z,. Identification and expression analysis of thefarnesyl diphosphate synthase gene family to reveal the key gene involved in rubber biosynthesis [J]., 2017, 40(1): 1-5.
[29] 張榮榮. 土壤干旱下杜仲截干苗生長和光合生理響應(yīng)及引種栽培研究 [D]. 太原: 山西農(nóng)業(yè)大學(xué), 2016.
[30] Manassero N G, Viola I L, Welchen E,. TCP transcription factors: Architectures of plant form [J]., 2013, 4(2): 111-127.
[31] Chai W B, Jiang P F, Huang G Y,. Identification and expression profiling analysis of TCP family genes involved in growth and development in maize [J]., 2017, 23(4): 779-791.
[32] Ma J, Wang Q L, Sun R R,. Genome-wide identification and expression analysis of TCP transcription factors in[J]., 2014, 4: 6645.
[33] Parapunova V, Busscher M, Busscher-Lange J,. Identification, cloning and characterization of the tomato TCP transcription factor family [J]., 2014, 14: 157.
[34] 袁偉, 顧掌根, 褚偉雄, 等. 黃瓜轉(zhuǎn)錄因子TCP基因家族的鑒定及結(jié)構(gòu)分析 [J]. 分子植物育種, 2014, 12(2): 287-295.
[35] 周延培, 張雅劍, 伊華林. 柑橘TCP家族生物信息學(xué)及表達譜分析 [J]. 果樹學(xué)報, 2016, 33(5): 513-522.
[36] Shi P B, Guy K M, Wu W F,. Genome-wide identification and expression analysis of the ClTCP transcription factors in[J]., 2016, 16: 85.
[37] Leng X P, Wei H R, Xu X Z,. Genome-wide identification and transcript analysis of TCP transcription factors in grapevine [J]., 2019, 20(1): 786.
[38] 張士剛. 蘋果TCP轉(zhuǎn)錄因子家族生物信息學(xué)分析 [J]. 山東農(nóng)業(yè)科學(xué), 2014, 46(5): 12-17.
[39] 阮城城, 胡福初, 羅志文, 等. 菠蘿TCP基因家族的鑒定及成花誘導(dǎo)階段的表達譜分析 [J]. 果樹學(xué)報, 2020, 37(11): 1623-1635.
[40] Zhao M L, Peng X J, Chen N Z,. Genome-wide identification of thegene family inand functional analysis of BpTCP8, 14 and 19 in shoot branching [J].(), 2020, 9(10): 1301.
[41] Zhou Y Z, Xu Z D, Zhao K,. Genome-wide identification, characterization and expression analysis of thegene family in[J]., 2016, 7: 1301.
[42] Wei W, Hu Y, Cui M Y,. Identification and transcript analysis of the TCP transcription factors in the diploid woodland strawberry[J]., 2016, 7: 1937.
[43] Guan P Z, Wang R C, Nacry P,. Nitrate foraging byroots is mediated by the transcription factor TCP20 through the systemic signaling pathway [J]., 2014, 111(42): 15267-15272.
[44] Fan H M, Sun C H, Wen L Z,. CmTCP20 plays a key role in nitrate and auxin signaling-regulated lateral root development in[J]., 2019, 60(7): 1581-1594.
[45] Tatematsu K, Nakabayashi K, Kamiya Y,. Transcription factor AtTCP14 regulates embryonic growth potential during seed germination in[J]., 2008, 53(1): 42-52.
[46] Zhang T, Qu Y X, Wang H B,. The heterologous expression of aTCP-P transcription factor CmTCP14 suppresses organ size and delays senescence in[J]., 2017, 115: 239-248.
[47] Aguilar-Martínez J A, Sinha N. Analysis of the role ofclass I TCP genes AtTCP7, AtTCP8, AtTCP22, and AtTCP23 in leaf development [J]., 2013, 4: 406.
[48] Dong J, Sun N, Yang J,. The transcription factors TCP4 and PIF3 antagonistically regulate organ-specific light induction of SAUR genes to modulateopening during de-etiolation in[J]., 2019, 31(5): 1155-1170.
[49] Kubota A, Ito S, Shim J S,. TCP4-dependent induction of constans transcription requiresin photoperiodic flowering in[J]., 2017, 13(6): e1006856.
[50] He Z M, Zhao X Y, Kong F N,. TCP2 positively regulates HY5/HYH and photomorphogenesis in[J]., 2016, 67(3): 775-785.
[51] Zhou Y, Zhang D Z, An J X,. TCP transcription factors regulate shade avoidance via directly mediating the expression of boths and auxin biosynthetic denes [J]., 2018, 176(2): 1850-1861.
Identification and bioinformatics analysis of TCP family genes in
LIU Jun1, 3, 4, LI Long2,WU Yao-song1, LIU Yan1, REN Shan-shan1, CHEN Yu-long1
1. Henan key Laboratory of TCM Prescription and Syndrome Signaling, Academy of Chinese Medicine, Henan University of Chinese Medicine, Zhengzhou 450046, China 2. College of Forestry, Northwest Agriculture and Forestry University, Yangling 712100, China 3. International Center for Bamboo and Rattan, Key Open Laboratory of Bamboo and Rattan Science and Technology, China National Forestry and Grassland Administration, Beijing 100102, China 4. Anhui Taiping Experimental Station of International Center for Bamboo and Rattan, Huangshan 245716, China
To screen and analyze TCP (Teosinte branched 1/Cycloidea/Proliferating) gene family of, so as to lay a foundation for further study ofgene function research.Based ongenome database, the physicochemical properties, phylogeny, gene structure, promoter-acting elements and their expression levels in the leaf development and eu-rubber formation of the TCP gene family were analyzed by bioinformatics system.A total of 14were identified fromgenome, EuTCPs encoded 139—492 amino acids, and theoretical isoelectric points distribution were 5.54—9.72, molecular weight was between 18 880 to 53 620 by physicochemical analysis, all of EuTCPsproteins were hydrophilic proteins and expressed in nucleus. EuTCP gene family was divided into three subfamilies: PCF, CIN and CYC/TB1, which contained five, six and three EuTCPs proteins, respectively. Expression pattern analysis showed thatwere significantly different at different developmental stages ofleaves, and the expression levels ofwere different at each developmental stage.positively regulated the formation of eu-rubber.There are 14 members of TCP family identified in, and their molecular characteristics and tissue expression specificity are different, which may be involved in the development of leaves and eu-rubber formation.
Oliver; TCP gene family; subcellular location; phylogeny evolution; expression analysis
R286.12
A
0253 - 2670(2022)18 - 5813 - 12
10.7501/j.issn.0253-2670.2022.18.024
2022-01-09
河南省高等學(xué)校重點科研項目(22A360005);國家林業(yè)和草原局/北京市共建竹藤科學(xué)與技術(shù)重點實驗室開放基金(ICBR-2020-05);國際竹藤中心安徽太平試驗中心開放課題基金(1632021006-4);河南中醫(yī)藥大學(xué)博士科研基金資助項目(RSBSJJ2019-04)
劉 ?。?990—),女,助理研究員,博士,主要從事藥用植物分子生物學(xué)研究。E-mail: liujun_0325@163.com
陳玉龍,男,教授,博士,主要從事中醫(yī)藥防治炎癥與免疫。E-mail: cyl72621@163.com
[責任編輯 時圣明]