劉 俊,李 龍,陳玉龍,劉 燕,吳耀松,任閃閃
(1. 河南中醫(yī)藥大學(xué) 中醫(yī)藥科學(xué)院 河南省中醫(yī)方證信號(hào)傳導(dǎo)重點(diǎn)實(shí)驗(yàn)室,河南 鄭州 450046;2. 國(guó)際竹藤中心國(guó)家林業(yè)和草原局竹藤科學(xué)與技術(shù)重點(diǎn)開(kāi)放實(shí)驗(yàn)室,北京 100102;3. 國(guó)際竹藤中心 安徽太平試驗(yàn)中心,安徽黃山 245700;4. 西北農(nóng)林科技大學(xué) 林學(xué)院,陜西 楊凌 712100)
CONSTANS-like是植物中保守的一類鋅指蛋白轉(zhuǎn)錄因子,N端含有1個(gè)或2個(gè)由2個(gè)半胱氨酸組成C-X2-C-X16-C-X2-C(C為半胱氨酸,X為可變氨基酸)介導(dǎo)蛋白互作的B-box結(jié)構(gòu)域[1],C端包含1個(gè)由43個(gè)氨基酸組成參與蛋白核定位的CCT(CONSTANS、CONSTANS-like、TOC1)結(jié)構(gòu)域[2-3]。CO/CO-like(COL)基因家族已在多個(gè)物種中進(jìn)行了報(bào)道,擬南芥Arabidopsis thaliana中鑒定到17個(gè)CONSTANS-like成員[2],水稻Oryza sativa中有17個(gè)[4],甜菜Beta vulgaris中有13個(gè)[5],大麥Hordeum vulgare中有9個(gè)[4],甘藍(lán)型油菜Brassica napus中有4個(gè)[6],小麥Triticum aestivum中有3個(gè)[7],挪威云杉Picea abies中含有2個(gè)COL成員[8]。
研究表明:COL基因具有功能多樣性,特別是在光響應(yīng)介導(dǎo)的開(kāi)花和生長(zhǎng)調(diào)控方面[2,4-5,9]。CO基因的表達(dá)和蛋白穩(wěn)定受生物鐘和光周期調(diào)節(jié);長(zhǎng)日照條件下,CO與FLOWERING LOCUS T (FT)啟動(dòng)子結(jié)合,誘導(dǎo)FT基因表達(dá),促進(jìn)擬南芥提前開(kāi)花[10-11],CO通過(guò)調(diào)節(jié)TERMINAL FLOWER 1 (TFL1)的表達(dá),抑制FT誘導(dǎo)開(kāi)花[12]。AtCOL9通過(guò)抑制CO基因表達(dá),減緩FT轉(zhuǎn)錄,延遲開(kāi)花[13]。在水稻中,超表達(dá) OsCOL15 通過(guò)上調(diào)開(kāi)花抑制因子 Ghd7 (grain number, plant height and heading date 7),下調(diào)激活因子RID1 (rice indeterminate 1)、 Ehd1 (early heading date 1)、 Hd3a (heading date 3a)、 FLT1 (FLOWERING LOCUS T1),導(dǎo)致開(kāi)花延遲[14]。在長(zhǎng)日照條件下,過(guò)表達(dá)甘菊Chrysanthemum lavandulifolium 的 ClCOL5誘導(dǎo)轉(zhuǎn)基因擬南芥提前開(kāi)花[15]。大部分PheCOLs在毛竹Phyllostachys edulis葉片中表達(dá)量最高,具有顯著的光周期響應(yīng)模式[16];在早竹Ph. violascens中,PvCO1和PvCO2主要在葉片中表達(dá)[17]。毛果楊Populus trichocarpa的PtCOLs優(yōu)先在葉片中表達(dá)[18];銀杏Ginkgo biloba中GbCO基因主要在葉片和莖尖表達(dá)[19]。超表達(dá)PhCOL16提高轉(zhuǎn)基因矮牽牛Petunia corollas葉綠素含量,正調(diào)控葉綠素生物合成[20]。COL不僅參與開(kāi)花調(diào)控,在植物發(fā)育和逆境脅迫中也發(fā)揮重要作用。AtCOL4提高轉(zhuǎn)基因植株鹽和脫落酸 (abscisic acid, ABA)耐受性[21],AtCOL7促進(jìn)擬南芥?zhèn)戎π纬珊拖屡咻S伸長(zhǎng)[22]。
杜仲Eucommia ulmoides是單科、單屬、單種植物,雌雄異株,廣泛分布于陜西、河南、四川、貴州、云南等地,是中國(guó)特有的經(jīng)濟(jì)樹(shù)種。因杜仲樹(shù)皮、根、葉、花和果實(shí)中均含有大量的白色絲狀杜仲橡膠,被譽(yù)為優(yōu)質(zhì)的天然橡膠樹(shù)種[23]。COL蛋白在植物生長(zhǎng)發(fā)育的多個(gè)方面發(fā)揮重要作用,具有重要的藥用價(jià)值和橡膠用價(jià)值。杜仲COL基因家族系統(tǒng)進(jìn)化及其在杜仲葉片生長(zhǎng)發(fā)育和杜仲膠形成中的表達(dá)模式尚未報(bào)道。本研究以杜仲基因組數(shù)據(jù)為基礎(chǔ),利用生物信息學(xué)分析方法,對(duì)杜仲CONSTANS-like基因家族進(jìn)行全基因組鑒定、理化性質(zhì)和系統(tǒng)進(jìn)化分析,初步鑒定EuCOLs基因在杜仲葉片生長(zhǎng)發(fā)育及杜仲膠生物合成中的功能,為進(jìn)一步探索EuCOLs基因的功能提供理論依據(jù)。
杜仲種植于西北農(nóng)林科技大學(xué)苗圃(陜西楊凌)。取生長(zhǎng)正常,長(zhǎng)勢(shì)一致的2年生‘秦仲1號(hào)’‘Qinzhong 1’杜仲幼苗的葉芽(莖尖)、生長(zhǎng)葉(3 cm長(zhǎng)葉片)、幼葉(完全展開(kāi)的新葉)、老葉(完全展開(kāi)60 d葉片);取同一生長(zhǎng)條件,與‘秦仲1號(hào)’相同發(fā)育時(shí)期的‘紫葉’杜仲E. ulmoides ‘Ziye’葉片,經(jīng)液氮處理后凍存于-80 ℃冰箱,用于RNA提取。
1.2.1 杜仲 COL 基因家族鑒定及理化性質(zhì)分析 從杜仲基因組數(shù)據(jù)庫(kù) Genome Warehouse (https://bigd.big.ac./gwh/Assembly/13/show)中下載COL蛋白候選序列,利用美國(guó)國(guó)家生物信息中心(NCBI)保守結(jié)構(gòu)域搜索服務(wù)(CD Search)分析蛋白結(jié)構(gòu)域,保留含有完整B-box和CCT結(jié)構(gòu)域序列。通過(guò)在線軟件ProtParam(http://web.expasy.org/protparam/)分析蛋白理化性質(zhì),使用Plant-mPLoc (http://www.csbio.sjtu.edu.cn/bioinf/plant-multi/)預(yù)測(cè)EuCOLs蛋白亞細(xì)胞定位,利用在線工具ExPASY (https://www.expasy.org/tools)分析EuCOLs氨基酸數(shù)量、分子量、理論等電點(diǎn),通過(guò)Expasy (https://web.expasy.org/protscale/)軟件分析蛋白的親疏水性,利用SOPMA (https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.plpage=npsa_sopma.html)軟件預(yù)測(cè)蛋白的二級(jí)結(jié)構(gòu)。
1.2.2 杜仲 COLs 基因 scaffold 定位及系統(tǒng)進(jìn)化分析 通過(guò)杜仲基因組數(shù)據(jù)庫(kù),查找 EuCOLs 基因在scaffolds上的位置以及scaffolds長(zhǎng)度,使用DNAMAN軟件進(jìn)行EuCOLs蛋白序列比對(duì),通過(guò)Clustal X1.83軟件對(duì)杜仲、水稻、擬南芥、毛果楊和玉米Zea mays的COLs蛋白進(jìn)行多序列比對(duì),利用MEGA 6.0的鄰接法(neighbor-joining),重復(fù)次數(shù)設(shè)置為1 000次[24],構(gòu)建系統(tǒng)發(fā)育樹(shù)。
1.2.3 杜仲 COLs 基因結(jié)構(gòu)、基序及啟動(dòng)子分析 利用 GSDS (http://gsds.gao-lab.org/index.php)軟件分析EuCOLs基因結(jié)構(gòu),通過(guò) MEME (http://meme-suite.org/)對(duì) EuCOLs進(jìn)行基序分析 (參數(shù)是:any number of Repetitions (anr),maximum number of Motifs= 20,minimum width≥6,and maximum width≤50)。通過(guò)Clustal X 1.83比對(duì)和DNAsp5軟件分析EuCOLs同源基因?qū)Γ⒂?jì)算非同義替換率(non-synonymous substitution rate, Ka) 和同義替換率 (synonymous substitution rate, Ks)。杜仲同源基因復(fù)制和分離的時(shí)間(t)由公式 t=Ks/1.3×10-8計(jì)算[16]。利用 Plant CARE (http://bioinformatics.psb.ugent.be/webtools/plantcare/htmL/)軟件對(duì)EuCOLs基因啟動(dòng)子(ATG)上游2 000 bp序列進(jìn)行查找分離,進(jìn)行啟動(dòng)子順式作用元件分析。
1.2.4 杜仲 EuCOL 基因家族表達(dá)模式分析 從 NCBI的 Short Read Arshive (SRA)數(shù)據(jù)庫(kù)中下載‘秦仲1號(hào)’不同發(fā)育時(shí)期葉片(葉芽、初生葉、幼葉、老葉,版本號(hào):SRP218063)[25]及不同膠含量杜仲品種(高產(chǎn)膠杜仲品種‘秦仲2號(hào)’‘Qinzhong 2’、低產(chǎn)膠杜仲品種‘小葉’‘Xiaoye’含量,版本號(hào):SRP158357)[26]的轉(zhuǎn)錄組數(shù)據(jù),利用1百萬(wàn)個(gè)映射上的堿基中映射到外顯子的1千個(gè)堿基上的堿基個(gè)數(shù)(fragments per kilobase million,F(xiàn)PKM)值表示 EuCOLs基因相對(duì)表達(dá)豐度 (A),對(duì)該數(shù)值取對(duì)數(shù) (Log2A)進(jìn)行統(tǒng)計(jì)分析,通過(guò)TBtools工具繪制基因表達(dá)圖譜[27]。
利用Trizol (天根DP424)試劑提取‘紫葉’杜仲的葉芽(莖尖)、生長(zhǎng)葉(3 cm長(zhǎng)葉片)、嫩葉(完全展開(kāi)的新葉)總 RNA,反轉(zhuǎn)錄合成 cDNA,利用 Quant Studio 6 (Life Technologies公司,新加坡),All-in-One SYBR Premix EX TaqTM kit (Gene Copoeia 公司,美國(guó))進(jìn)行實(shí)時(shí)熒光定量 PCR (qRT-PCR)反應(yīng),10.0 μL 反應(yīng)體系: 2×mix 5.0 μL、正向引物/反向引物各 0.25 μL、cDNA 2.0 μL、ddH2O 2.5 μL。反應(yīng)程序:95 ℃ 預(yù)變性 5 min,95 ℃ 變性 10 s,60 ℃ 退火 10 s,72 ℃ 延伸 20 s,45 個(gè)循環(huán)。內(nèi)參基因?yàn)閁BC E2[28],使用法對(duì)3次生物學(xué)重復(fù)的數(shù)據(jù)進(jìn)行分析。
1.2.5 杜仲 COL7 蛋白互作分析 利用 STRING 軟件 (https://string-db.org/),選擇擬南芥數(shù)據(jù)庫(kù)進(jìn)行序列比對(duì),根據(jù)已知擬南芥COLs蛋白互作關(guān)系,預(yù)測(cè)EuCOL7互作蛋白,通過(guò)Cytoscape 3.7.0軟件進(jìn)行評(píng)估和預(yù)測(cè)[16]。
通過(guò)Genome Warehouse數(shù)據(jù)庫(kù),從杜仲基因組中共查找到8個(gè)EuCOLs基因,利用Pfam和NCBI的Conserved Domain Search軟件,驗(yàn)證EuCOLs蛋白保守結(jié)構(gòu)域。結(jié)果顯示:8個(gè)EuCOLs蛋白均含有B-box和CCT結(jié)構(gòu)域,分別命名為EuCOL1~EuCOL8。通過(guò)ExPASy工具,對(duì)EuCOL家族成員進(jìn)行理化性質(zhì)分析,EuCOL3蛋白序列最長(zhǎng),編碼469個(gè)氨基酸,EuCOL7序列最短,編碼315個(gè)氨基酸,分子量分布區(qū)域?yàn)?35.21~52.65 kDa,等電點(diǎn)范圍是 5.10 (EuCOL1)~6.47 (EuCOL6),亞細(xì)胞定位預(yù)測(cè)結(jié)果顯示:EuCOLs均定位在細(xì)胞核中(表1),屬于疏水性蛋白,8個(gè)EuCOLs分布于8條scaffolds。
表1 杜仲 CO-like 蛋白序列特征及亞細(xì)胞定位預(yù)測(cè)Table 1 Sequence characteristics and predicted subcellular location of E. ulmoides CO-like proteins
為了分析杜仲EuCOL基因家族的進(jìn)化關(guān)系,將8個(gè)EuCOLs蛋白與17個(gè)擬南芥AtCOLs、水稻OsCOLs、ZmCOLs和14個(gè)毛果楊PtCOLs[18]導(dǎo)入MEGA 6.0軟件,通過(guò)鄰接法構(gòu)建系統(tǒng)發(fā)育樹(shù),73個(gè)COLs蛋白分為3個(gè)亞家族(分別是群組 Ⅰ、群組 Ⅱ和群組 Ⅲ)(圖1)。群組Ⅰ亞家族包含2個(gè)B-box和1個(gè)CCT結(jié)構(gòu)域,由28個(gè)COLs蛋白組成,包含2個(gè)EuCOLs蛋白(EuCOL6和EuCOL7);群組Ⅱ亞家族含有1個(gè)B-box、1個(gè)CCT和1個(gè)分化的鋅指結(jié)構(gòu)域,所含COLs蛋白數(shù)量最少,有15個(gè)COLs蛋白,分別含有4個(gè)AtCOLs,3個(gè)PtCOLs蛋白和OsCOLs蛋白,5個(gè)ZmCOLs蛋白,不含EuCOLs蛋白;群組Ⅲ亞家族由1個(gè)B-box和1個(gè)CCT結(jié)構(gòu)域組成,所含蛋白數(shù)量最多,包含30個(gè)COLs蛋白,有6個(gè)EuCOLs蛋白,進(jìn)化關(guān)系顯示杜仲與毛果楊親緣關(guān)系最近。
圖1 杜仲、水稻、擬南芥、毛果楊和玉米CO-likes蛋白系統(tǒng)進(jìn)化樹(shù)Figure 1 Phylogenetic tree of CO-like proteins from E. ulmoides, O. sativa, A. thaliana, P. trichocarpa and Z. mays
為了進(jìn)一步分析EuCOLs基因的保守性和多樣性,對(duì)EuCOLs基因結(jié)構(gòu)及蛋白基序進(jìn)行了分析,結(jié)果顯示:EuCOLs基因結(jié)構(gòu)較為簡(jiǎn)單(圖2),EuCOL1和EuCOL6分別含有2個(gè)和3個(gè)外顯子,4個(gè)EuCOLs基因含有4個(gè)外顯子,EuCOL2和EuCOL3外顯子數(shù)目最多,含有6個(gè)外顯子。
圖2 杜仲 COLs 基因結(jié)構(gòu)分析Figure 2 Structural analysis of COLs in E. ulmoides
利用MEME在線軟件,對(duì)EuCOLs家族進(jìn)行保守基序分析,基序鑒定個(gè)數(shù)設(shè)置為20,分別命名為motif 1~motif 20。結(jié)果如圖 3 所示:motif 1 和 motif 2 為 EuCOLs 蛋白的特征性結(jié)構(gòu)域,存在于所有EuCOLs蛋白中。只有EuCOL7含有1個(gè)B-box結(jié)構(gòu)域,其余EuCOLs蛋白均由2個(gè)B-box組成,這與圖2蛋白序列比對(duì)結(jié)果一致。同一亞家族EuCOLs基序具有高度相似性,其中motif 1包含1個(gè)典型的由C-X2-C-X16-C-X2-C編碼的GATA鋅指結(jié)構(gòu)域。不同亞家族基序存在顯著差異,例如:motif 7和motif 14只存在于群組Ⅲ亞家族,motif 12只在群組Ⅱ亞家族中存在。EuCOLs蛋白之間基序也有差異,只有EuCOL1和 EuCOL4 含有 motif 5、motif 7 和 motif 9,motif 10 僅存在于 EuCOL2,推測(cè)基因功能差異可能與基序有關(guān)。
圖3 EuCOLs 蛋白保守基序分析Figure 3 Conservative motif analysis of EuCOL proteins
利用Plant CARE軟件對(duì)EuCOLs起始密碼子(ATG)上游2 000 bp序列進(jìn)行順式作用元件分析(圖4)。EuCOLs啟動(dòng)子中不僅包含基本順式作用元件,還存在3種類型元件。①脅迫響應(yīng)元件,如干旱脅迫響應(yīng)元件MBS;低溫響應(yīng)元件LTR;厭氧脅迫相關(guān)元件ARE等。②光響應(yīng)元件,如Box 4、G-box、GBox、GT1-motif、I-box、GATA-motif、TCCC-motif等。③激素響應(yīng)元件,如赤霉素響應(yīng)元件ABRE;生長(zhǎng)素響應(yīng)元件AuxRR-core;水楊酸響應(yīng)元件CGTCA-motif等。推測(cè)EuCOLs可能參與杜仲生長(zhǎng)發(fā)育、脅迫響應(yīng)以及光周期調(diào)控。EuCOLs基因中光響應(yīng)元件數(shù)量最多,共79個(gè),包含18個(gè)Box 4,G-box和GT1-motif均有12個(gè),暗示EuCOLs基因的轉(zhuǎn)錄可能受光周期調(diào)控。EuCOLs啟動(dòng)子區(qū)域含有16個(gè)ABRE和14個(gè)ARE元件(圖4B),推測(cè)EuCOLs可能參與ABA調(diào)節(jié)和厭氧調(diào)控。
圖4 EuCOLs 啟動(dòng)子順式作用元件分布Figure 4 Cis-elements distributed in the promoters of EuCOLs
為了探索EuCOLs基因在杜仲葉片發(fā)育中的功能,利用杜仲葉片不同發(fā)育時(shí)期的轉(zhuǎn)錄組數(shù)據(jù),進(jìn)行表達(dá)模式分析。圖5顯示:EuCOLs在杜仲葉片發(fā)育中轉(zhuǎn)錄水平較低,大部分基因FPKM值小于1,EuCOL6在杜仲葉片中不表達(dá),暗示EuCOLs在杜仲葉片中發(fā)揮作用較小,EuCOL5在葉片中的轉(zhuǎn)錄水平相對(duì)較高,并且隨著葉片發(fā)育,轉(zhuǎn)錄水平逐漸升高,推測(cè)EuCOL5在杜仲葉片中可能發(fā)揮正調(diào)控作用。
圖5 EuCOLs 基因在杜仲葉片不同發(fā)育時(shí)期表達(dá)模式Figure 5 Expression patterns of EuCOLs genes at different development stages of E. ulmoides leaves
利用高產(chǎn)膠杜仲品種‘秦仲2號(hào)’和低產(chǎn)膠杜仲品種‘小葉’成熟葉片轉(zhuǎn)錄組數(shù)據(jù),檢測(cè)EuCOLs基因的表達(dá)水平,結(jié)果如圖6所示。大部分EuCOLs轉(zhuǎn)錄水平較低,只有EuCOL5和EuCOL7的表達(dá)量較高,EuCOL7在各樣品中的FPKM值大于150,并且高膠含量葉片中的轉(zhuǎn)錄水平高于低膠含量葉片,推測(cè)EuCOL7在杜仲膠形成過(guò)程中發(fā)揮正調(diào)控作用,相反EuCOL5在‘小葉’中的轉(zhuǎn)錄水平高于‘秦仲2號(hào)’,暗示EuCOL5在杜仲膠形成中可能發(fā)揮負(fù)調(diào)控作用。
圖6 EuCOLs 基因在杜仲膠形成中的表達(dá)模式Figure 6 Expression pattern of EuCOL genes in the formation of eurubber
為了驗(yàn)證EuCOLs基因在杜仲葉片發(fā)育中的表達(dá)模式 ,以‘紫葉’杜仲不同發(fā)育階段的葉片為材料,通過(guò)qRT-PCR檢測(cè)EuCOLs基因的表達(dá)水平。結(jié)果顯示:EuCOLs在杜仲葉片中差異表達(dá)(圖7),EuCOL1和EuCOL4在葉芽中表達(dá)量最高,隨著葉片發(fā)育,表達(dá)水平逐漸降低,嫩葉中降為最低,暗示EuCOL1和EuCOL4在杜仲葉片發(fā)育的起始階段發(fā)揮重要作用;相反EuCOL7隨著葉片發(fā)育轉(zhuǎn)錄水平逐漸升高,嫩葉中的表達(dá)量是葉芽中的5.8倍,推測(cè)EuCOL7在杜仲成熟葉片中扮演重要角色。5個(gè)EuCOLs基因(EuCOL2、EuCOL3、EuCOL5、EuCOL6和EuCOL8)在幼葉中表達(dá)量最高,在葉片發(fā)育中,呈現(xiàn)先升高后降低的表達(dá)趨勢(shì)。
圖7 杜仲 COL 家族基因在葉片發(fā)育中的表達(dá)模式Figure 7 Expression patterns of E. ulmoides COL family genes during leaf development
表達(dá)模式分析顯示:EuCOL7在杜仲葉片發(fā)育和杜仲膠形成中均具有較高表達(dá)量,暗示EuCOL7在葉片發(fā)育和杜仲膠形成中發(fā)揮重要作用。利用STRING軟件,預(yù)測(cè)EuCOL7與其他蛋白質(zhì)的互作關(guān)系。結(jié)果顯示:EuCOL7可以與10個(gè)蛋白質(zhì)發(fā)生相互作用(圖8),其中3個(gè)屬于BBX蛋白質(zhì)家族,LHY、CCA和JAC家族各有1個(gè),7個(gè)蛋白質(zhì)(LNK2、LHY、CCA、RVE、COL、BBX25和BBX19)參與光周期響應(yīng)。
圖8 EuCOL7 蛋白互作網(wǎng)絡(luò)預(yù)測(cè)Figure 8 Prediction of interaction network between EuCOL7
杜仲具有重要的經(jīng)濟(jì)價(jià)值、藥用價(jià)值和生態(tài)價(jià)值,廣泛分布于中國(guó)27個(gè)省(市、自治區(qū))[29]。COL(CONSTANS-like)基因是植物光周期途徑重要的調(diào)控基因。在營(yíng)養(yǎng)生長(zhǎng)階段,COL基因在葉片中表達(dá);光周期途徑中,COL可將光信號(hào)和生物鐘信號(hào)轉(zhuǎn)變?yōu)殚_(kāi)花信號(hào),誘導(dǎo)成花基因FT、LFY表達(dá),促進(jìn)植株開(kāi)花[30-31]。本研究以杜仲基因組數(shù)據(jù)為基礎(chǔ),通過(guò)生物信息學(xué)方法,搜索杜仲CONSTANS-Like基因家族,共鑒定到8個(gè)EuCOLs基因,根據(jù)基因組注釋位置,8個(gè)EuCOLs基因分別映射到8條特定的染色體上,表明EuCOLs基因在染色體上均勻分布。
系統(tǒng)進(jìn)化結(jié)果顯示:EuCOLs分為2個(gè)亞家族(群組Ⅰ和群組Ⅲ),分別包含2和6個(gè)EuCOLs蛋白。在擬南芥中,AtCO、AtCOL1~AtCOL5屬于群組Ⅰ亞家族,含有2個(gè)B-box和1個(gè)CCT結(jié)構(gòu)域,超表達(dá)AtCOL3延長(zhǎng)轉(zhuǎn)基因擬南芥開(kāi)花時(shí)間[32],在短日照條件下,超表達(dá)AtCOL5可以促進(jìn)FT和SOC1基因表達(dá),誘導(dǎo)擬南芥提前開(kāi)花[33]。大麥HvCO1和Hd1基因與CO親緣關(guān)系最近,可以通過(guò)激活HvFT1誘導(dǎo)大麥開(kāi)花[4],擬南芥co突變體過(guò)表達(dá)牽?;≒harbitis nil的PnCO基因可促進(jìn)植物開(kāi)花[34]。黑麥草Lolium perenne的LpCO可以互補(bǔ)擬南芥co突變體晚花表型[35],毛果楊PtCO促使植株提前開(kāi)花,也可調(diào)控植株的生長(zhǎng)和芽的分化[36]。群組Ⅲ亞家族含有1個(gè)B-box和1個(gè)CCT結(jié)構(gòu)域。在擬南芥中,AtCOL6~AtCOL8和AtCOL16屬于群組Ⅲ亞家族,AtCOL7和AtCOL8在開(kāi)花調(diào)控中是轉(zhuǎn)錄抑制因子,超表達(dá)AtCOL7和AtCOL8導(dǎo)致轉(zhuǎn)基因擬南芥開(kāi)花延遲[22,37-38],推測(cè)EuCOLs可能也參與杜仲開(kāi)花調(diào)控。
蛋白序列比對(duì)結(jié)果顯示:EuCOLs與擬南芥、毛果楊COLs蛋白結(jié)構(gòu)域具有高度的相似性,N末端含有1~2個(gè)典型的B-box結(jié)構(gòu)域,C端包含1個(gè)CCT結(jié)構(gòu)域。B-box1和B-box2結(jié)構(gòu)域保守氨基酸殘基分布相似,B-box1結(jié)構(gòu)域中的5個(gè)Cys殘基和2個(gè)His殘基比其他氨基酸殘基更保守,B-box2結(jié)構(gòu)域中的第1個(gè)組氨酸(His)殘基被蘇氨酸(Thr)取代或者丟失(EuCOL2和EuCOL7)。在葡萄Vitis vinifera中,VviBBX9和VviBBX10蛋白B-box2結(jié)構(gòu)域中的第1個(gè)His殘基被天冬酰胺(Asn)取代[39],暗示EuCOL2和EuCOL7可能具有特異的功能。
外顯子-內(nèi)含子結(jié)構(gòu)與基因系統(tǒng)進(jìn)化存在密切關(guān)系,外顯子-內(nèi)含子的增加或減少有助于基因家族的擴(kuò)展和多樣化[40]。結(jié)構(gòu)分析顯示:EuCOLs基因含有2~6個(gè)外顯子,EuCOL2含有6個(gè)外顯子,其同源基因EuCOL8含有4個(gè)外顯子,EuCOL3和EuCOL6分別含有6和3個(gè)外顯子,而EuCOL5和EuCOL7分別含有4和2個(gè)外顯子,推測(cè)EuCOLs在進(jìn)化過(guò)程中可能存在外顯子丟失現(xiàn)象,這與葡萄VviBBXs蛋白情況類似[39]。基序分析發(fā)現(xiàn):motif 1和motif 2分別編碼B-box和CCT結(jié)構(gòu)域,存在于所有EuCOLs轉(zhuǎn)錄因子,同一亞家族EuCOLs蛋白motifs分布較為相似,不同亞族之間有差異。
EuCOLs啟動(dòng)子中含有多個(gè)脅迫、激素和光周期響應(yīng)元件,其中光響應(yīng)元件數(shù)量最多,共有79個(gè),暗示EuCOLs可能參與杜仲光周期調(diào)節(jié)。研究表明:COLs基因參與多種植物光周期開(kāi)花調(diào)控,在矮牽牛中,PnCO和PnCOL1具有顯著的晝夜振蕩節(jié)律,PnCO可以恢復(fù)擬南芥co突變體晚開(kāi)花表型[41-42];大部分香蕉Musa acuminate的MaCOLs基因表達(dá)量在白天達(dá)到峰值,夜晚降為最低[43]。楊樹(shù)PttCO1和PttCO2黃昏時(shí)表達(dá)水平開(kāi)始增加,黎明時(shí)達(dá)到峰值[44]。短日照條件下,OsCOL3通過(guò)抑制Hd3a和RFT基因表達(dá),導(dǎo)致水稻延遲開(kāi)花[45],OsCOL13和OsCOL10在開(kāi)花中發(fā)揮負(fù)調(diào)控作用[46-47];超表達(dá)HvCO1和ClCOL3促進(jìn)開(kāi)花[15,48]。EuCOLs在杜仲雄花芽苞葉原基分化中期和雄蕊原基分化初期差異表達(dá),EuCOL7在雄蕊原基分化初期上調(diào)表達(dá),EuCOL1下調(diào)表達(dá)[49],表明EuCOLs參與杜仲開(kāi)花調(diào)控。
大量研究表明:COLs不僅調(diào)控植物開(kāi)花,還參與非生物脅迫以及生長(zhǎng)發(fā)育等生物學(xué)過(guò)程[22,50]。擬南芥STO與CONSTNS結(jié)構(gòu)相似,超表達(dá)STO提高轉(zhuǎn)基因植株的耐鹽性[51]。在菊花Chrysanthemum morifolium中,Cm-BBX24-RNAi轉(zhuǎn)基因株系開(kāi)花提前,冷凍和干旱脅迫耐受性降低,光周期和赤霉素生物合成相關(guān)基因上調(diào)表達(dá),表明Cm-BBX24在菊花開(kāi)花時(shí)間和非生物脅迫中發(fā)揮多重作用[52]。低溫誘導(dǎo)葡萄葉片、莖和花中VvZFPL基因上調(diào)表達(dá),超表達(dá)VvZFPL導(dǎo)致轉(zhuǎn)基因擬南芥下胚軸伸長(zhǎng),蓮座葉變小,葉綠素含量降低[53],提高轉(zhuǎn)基因擬南芥低溫、干旱和鹽脅迫耐受性[54]。AtCOL4基因表達(dá)受ABA、高鹽和滲透脅迫的誘導(dǎo),在種子萌發(fā)和子葉綠化過(guò)程中,atcol4突變體增加ABA和鹽脅迫的敏感性[21]。表達(dá)模式分析顯示:大部分EuCOLs在杜仲葉片發(fā)育中表達(dá)水平較低,各發(fā)育階段轉(zhuǎn)錄水平無(wú)顯著差異。EuCOL5轉(zhuǎn)錄水平相對(duì)較高,尤其在老葉中;EuCOL7在幼葉中表達(dá)量最高。在杜仲膠形成中,EuCOL5在‘小葉’中高量表達(dá),EuCOL7在‘秦仲2號(hào)’中表達(dá)水平最高。qRT-PCR結(jié)果顯示:EuCOL1和EuCOL4在葉片發(fā)育起始階段表達(dá)量最高,EuCOL7隨著葉片發(fā)育,轉(zhuǎn)錄水平逐漸增加,EuCOL2、EuCOL3、EuCOL5、EuCOL6和EuCOL8在葉片發(fā)育中,呈現(xiàn)先升高后降低的表達(dá)趨勢(shì),表明EuCOLs在杜仲葉片發(fā)育中具有功能差異性。
蛋白互作網(wǎng)絡(luò)結(jié)果顯示:EuCOL7可以與10個(gè)蛋白質(zhì)互作,10個(gè)蛋白質(zhì)中有7個(gè)(LNK2、LHY、CCA、RVE、COL、BBX25和BBX19)參與光周期調(diào)控,推測(cè)EuCOL7參與杜仲光周期響應(yīng),具體互作蛋白還需實(shí)驗(yàn)驗(yàn)證。在毛竹中,PheCOLs具有顯著的晝夜振蕩表達(dá)模式,光照抑制大部分PheCOLs基因表達(dá),黑暗誘導(dǎo)。酵母單雜交結(jié)果顯示:PheCOL14可以與PheCOL3啟動(dòng)子結(jié)合[16]。在擬南芥中,LHY屬于同源域蛋白超家族,參與晝夜調(diào)控,與APRR1/TOC1和TCP21/CHE的啟動(dòng)子結(jié)合,抑制其轉(zhuǎn)錄,并抑制CCA1基因表達(dá)[55-56]。AtCOL5在維管組織中表達(dá),超表達(dá)AtCOL5導(dǎo)致開(kāi)花提前,然而AtCOL5缺失突變體并不影響開(kāi)花時(shí)間,暗示AtCOL5可能與其他開(kāi)花調(diào)控因子存在功能冗余現(xiàn)象[33]。