李玲 楊麗霞 郭梅
(天津農學院食品科學與生物工程學院,天津 300384)
成熟果實為人們提供日常生活所需的營養(yǎng)。果實成熟包括一系列的生理代謝過程,在分子層面上果實的生長、發(fā)育及成熟是由許多轉錄因子通過單獨或者協同調控特定的下游基因來實現的[1]。SPL(SQUAMOSA promoter-binding protein-like)是植物中特有的轉錄因子,參與植物葉、花和果實發(fā)育,發(fā)育時期轉化,植物激素和光信號轉導,花青素合成,逆境脅迫等過程[2-12]。SPL7 和SPL14 分別通過配置銅元素和控制病原抗性來調節(jié)植物的脅迫應答[13]。SPL 調控植物孢子產生和雌雄配體發(fā)育[14]。大多數SPL基因具有miR156/157 結合位點,在轉錄后水平受其調控[15-17]。miR156 調控擬南芥SPL3基因進而在翻譯后抑制SPL3 蛋白[17]。miR156/157 的靶基因SPL在番茄莖尖、花和果實中高效表達[18]。Wang等[19]發(fā)現SPL 通過MADS box基因調控植物開花時間,提高SPL基因表達水平有助于MADS-box基因家族的轉錄,促進開花。
CNR 是SPL 轉錄因子家族中一個比較特殊的成員,已經被證明在果實的發(fā)育和成熟過程中起很重要的作用。Manning 等[20]通過使用定點克隆的方法,在第2 條染色體長臂上發(fā)現LeSPL-CNR基因。LeSPL-CNR基因啟動子區(qū)域發(fā)生表觀遺傳變異會影響果皮類胡蘿卜素生物合成和細胞壁結構,導致果實不能正常成熟[20]。番茄突變體Cnr(Colourless non-ripening)果實表現出不成熟性狀,果皮為黃色,果實類胡蘿卜素合成量減少,果實不會變軟,與成熟相關酶基因的表達也受到影響[21-22]。Cnr突變體的多聚半乳糖醛酸酶和果膠酯酶的含量及活性比同時期野生型果實低[23]。Karlova 等[24]發(fā)現SlAP2a位于LeNAC-NOR、LeMADS-RIN和LeSPL-CNR的下游,LeSPL-CNR 能夠與SlAP2a的啟動子直接結合,SlAP2a也可以對LeSPL-CNR表達進行反饋調節(jié)。總之,CNR 位于RIN、LeHB1、SlAP2a 和 SlTAGL1 的下游,對果實成熟起正調控作用[25]。
目前,由轉錄因子組成的調控網絡是研究果實成熟分子機制的熱點,CNR 是調控番茄成熟的關鍵轉錄因子。我們團隊已經證明CNR 蛋白在破色期番茄果實中表達量最高,發(fā)揮了至關重要的作用[26],但是其調控番茄果實成熟的機制和路徑尚不清楚。所以,本研究以野生型AC 和突變體Cnr番茄果實為材料,通過轉錄組測序(RNA-seq)篩選出差異表達基因,然后應用qRT-PCR 技術進一步確定差異基因,最后采用染色質免疫共沉淀技術(ChIP)確定轉錄因子CNR 直接調控的靶基因,以期為構建以CNR 為中心的果實成熟調控網絡奠定理論基礎。這不僅能夠完善果實成熟的調控理論,而且可以從生物工程角度有效延緩果實成熟,保持果實品質和延長果實貯藏期。
選取由美國康奈爾大學BTI 植物研究所提供的Alisa Craig野生型和Cnr突變體番茄種子,由本實驗室繁育保存。番茄種子種植于天津農學院大棚,進行常規(guī)管理。選取無機械損害、無病蟲害且大小均一的番茄果實進行實驗。
1.2.1 番茄果實總RNA 的提取 采用TRIzol 法提取破色期野生型AC 和突變體Cnr番茄果實總RNA,具體操作步驟依據《分子克隆實驗指南》[27]。將組織置于液氮中迅速研磨成干粉,放在10 mL 離心管中,加入4 mL TRIzol 提取液及80 μL β-巰基乙醇,充分混合均勻,室溫靜置10 min。向提取體系中加入60%氯仿/異戊醇(24∶1),15%無水乙醇,室溫靜置2 min,4℃ 5 000×g離心15 min。取上清液加入等體積氯仿/異戊醇,4℃ 5 000×g離心10 min,再吸取上清液加入兩倍體積的無水乙醇和五分之一體積的3 mol/L NaAC-HAC(pH 5.0)溶液,混合均勻,-20℃靜置1h。4℃ 5 000×g離心15 min 得到上清液,加等體積75%乙醇離心5 min,棄去上清,晾干內壁殘留的乙醇溶液,用適量DEPC 水溶解沉淀。
1.2.2 RNA-seq 測序及數據分析 從野生型AC 和突變體Cnr番茄果實中提取的RNA 檢測合格后,用于構建測序文庫,然后送至諾禾致源基因研究中心進行高通量RNA-seq。每個樣本3 次生物學重復。最終的數據處理和分析參考Bemer 等[28]的方法。
1.2.3 GO 和KEGG 富集分析 Gene Ontology(簡稱GO,http://www.geneontology.org)是基因功能國際標準分類體系,由基因本體聯合會(Gene Onotology Consortium)建立數據庫?;蚩梢酝ㄟ^ID 對應或者序列注釋的方法找到與之對應的GO 編號,而GO 編號可對應到Term,即功能類別或者細胞定位。采用Goseq 軟件進行GO 富集分析。KEGG(Kyoto Encyclopedia of Genes and Genomes)是系統分析基因功能、基因組信息,與Pathway 相關的主要公共數據庫,是進行生物體內代謝分析、代謝網絡研究的強有力工具。應用KOBAS(2.0)軟件進行Pathway富集分析。
1.2.4 qRT-PCR 表達差異分析 參照Brown 等[29]的方法進行實時定量PCR 分析,檢測差異基因的表達量。qRT-PCR 使用的引物序列見表1。以Actin基因作為內參,每個基因在AC 番茄果實中的表達量歸為1。Expression(2-ΔΔCt)表示為平均值±SE。
1.2.5 染色質免疫共沉淀(ChIP)分析 按照Upstate 試劑盒說明書和Li 的方法進行ChIP 分析[30-31]。參照Zhu 等[32]的方法結合GE Health Ni Sepharose six 快速流動親和層析柱操作說明書進行CNR 蛋白的原核表達和純化。然后將制備的高純度、有活性的CNR 蛋白免疫小鼠得到抗CNR 蛋白的多克隆抗體[26]??贵w純化后用于ChIP 分析。
野生型AC 和突變體Cnr番茄果實的總RNA 用于構建測序文庫,然后在Illumina HiSeq 平臺上進行高通量測序。從圖1 可以看出,野生型AC 番茄果實3 個重復樣本的R2均大于0.974,Cnr突變體番茄果實3 個重復的R2都大于0.971。說明樣品的重復性良好,數據非常可靠。
原始圖像數據文件通過CASAVA 堿基識別分析轉換成Raw Reads,Raw Reads 包含低質量、帶接頭的Reads。所以Raw Reads 必需經過濾得到Clean Reads 以保證轉錄組測序數據分析的質量。后續(xù)的生物信息學分析都是基于Clean Reads。測序數據質量情況如表2 所示,6 個樣本Q20 和Q30 的最小值分別是94.18%和88.92%,表明所有的測序數據均符合生物信息學分析的要求。
選用HISAT 軟件將經過拼接的序列進行比較分析和基因組定位。軟件的各項參數選擇默認值,比對統計結果如表3 所示。各個樣本reads mapped 的比例為92.92%-94.77%均高于70%,這說明參考基因組選擇恰當,且不存在實驗污染的情況,數據和測序結果可信。
圖2 是野生型AC 和突變體Cnr番茄果實表達基因的venn 圖,以fpkm>1 作為判斷基因表達的標準。從圖2 中可以看出,AC 表達了17 225 個基因,Cnr表達了19 389 個基因。二者之間共有的表達基因是16 653 個。不同番茄果實差異基因的篩選條件為padj<0.05 且|log2fold change|>1。如圖3 所示,野生型AC 和突變體Cnr番茄果實的差異基因有10 223 個,其中上調的差異基因4 341 個,下調的差異基因5 882 個。
從圖4 可以看出,與突變體Cnr番茄果實相比,野生型AC 番茄果實中與能量代謝相關具有顯著性表達差異的基因是68 個,上調基因28 個,下調基因40 個;有4 個與固碳作用相關的上調差異基因;與線粒體電子傳遞或ATP 合成相關的基因是11 個差異上調基因,14 個差異下調基因;與脂質代謝有關的基因是22 個差異上調基因和33 個差異下調基因;6 個基因負調控肌醇磷酸鹽代謝;與氨基酸代謝相關的是24 個差異上調基因和39 個差異下調基因;存在9 個與核酸代謝有關的差異上調基因和14個差異下調基因;6 個上調基因和6 個下調基因與氧化還原狀態(tài)有關;2 個下調基因與谷胱甘肽代謝相關;與次生代謝相關的基因有7 個差異上調和10個差異下調;與細胞壁及細胞膜完整性相關的基因包括18 個上調基因和19 個下調基因;3 個基因與番茄紅素合成相關,其中2 個上調,1 個下調;4 個上調基因與乙烯生物合成相關;與乙烯信號轉導相關的差異基因有4 個上調表達,4 個下調表達;8 個上調差異基因和15 個下調差異基因與植物激素相關;與植物MAPK 信號途徑相關的是1 個上調表達的差異基因;3 個下調基因與植物防御應答相關;2個上調和8 個下調基因與植物病原途徑相關;3 個上調基因和1 個下調基因與植物非生物脅迫有關;2個差異上調基因與維生素代謝相關。
GO 分 為 分 子 功 能(Molecular Function)、生物進程(Biological Process)和細胞組分(Cellular Component)3 部分。通過對野生型和突變體番茄差異表達基因(DEGs)進行GO 富集分析,以揭示哪些生物進程、分子功能和細胞組分與CNR 轉錄因子相關。如圖5 所示,生物進程極顯著的集中在次級代謝物生物合成、次級代謝、含硫化合物代謝、α-氨基酸代謝、對高光強度的應答、有機酸生物合成、羧酸生物合成、谷胱甘肽代謝和對脂類的細胞應答;細胞組分顯著性的存在于色素體、葉綠體、細胞器亞單位、質體類囊體、質體基質、葉綠體類囊體、類囊體、葉綠體基質、質體包膜、類囊體膜、葉綠體被膜、色素體類囊體膜、葉綠體類囊體膜;分子功能顯著性的集中于鐵離子束、亞鐵血紅素結合物、單加氧酶活性、氧化還原酶活性、蛋白絲氨酸/蘇氨酸激酶活性、四吡咯結合物、谷胱甘肽轉移酶活性、轉移酶活性。
表1 用于qRT-PCR 驗證的引物序列
圖1 番茄果實樣本的相關性
表2 數據產出質量情況一覽表
表3 Reads 與參考序列比對情況一覽表
在生物體內,不同基因相互協調行使其生物學功能,通過Pathway 顯著性富集能確定差異表達基因參與的最主要代謝途徑和信號轉導途徑。對差異表達基因進行KEGG Pathway 富集分析,根據P<0.05,選取26 個差異最顯著的 KEGG 通路,如圖6 所示。野生型AC 和突變體Cnr番茄的差異基因主要富集在谷胱甘肽代謝、MAPK 信號途徑、類黃酮化合物代謝、半胱氨酸和甲硫氨酸代謝、類胡蘿卜素合成、脂代謝、糖代謝、苯丙素生物合成、萜類化合物合成、植物激素信號轉導等途徑。
圖2 野生型AC 和突變體Cnr 番茄果實差異基因維恩圖
圖3 野生型AC 和突變體Cnr 番茄果實基因差異表達分析火山圖
圖4 野生型AC 和突變體Cnr 番茄果實差異基因的篩選結果
選擇AC 和Cnr番茄果實中有極顯著差異的一些代表性基因進行qRT-PCR 驗證。由表4 可知,AC 番茄果實中參與果糖和甘露糖代謝的甘露聚糖-1,4-β-甘露糖苷酶基因(Solyc01g008710.2)的表達量是Cnr番茄果實的2 500 倍。亞油酸9S-脂氧合酶參與亞油酸代謝,AC 番茄果實中該酶基因(Solyc08g014000.2)的相對表達量是Cnr番茄果實的10 000 倍。參與細胞壁果膠代謝的果膠酯酶基因(Solyc07g064180.2)在AC 番茄果實中的相對表達量與亞油酸9S -脂氧合酶基因相似。發(fā)現一個新基因(novel.9194)參與番茄紅素合成,在AC 番茄果實中的表達量是Cnr番茄果實的100 倍。1-氨基環(huán)丙烷-1-羧酸合成酶基因(Solyc05g050010.2)在乙烯生物合成中起重要作用,該基因在AC 番茄果實的表達量是Cnr番茄果實的180 倍。脫落酸和環(huán)境應激誘導蛋白TAS14 基因(Solyc02g084850.2)參與植物激素代謝。硫胺素噻唑合酶基因(Solyc07g064160.2)參與硫胺素代謝。促分裂原活化蛋白激酶基因(Solyc02g084870.2)在Cnr 番茄果實中的相對表達量是0.069 7。以上這些基因在AC 番茄果實中上調表達。
圖5 野生型AC 和突變體Cnr 番茄果實GO 顯著性富集分析
圖6 KEGG 顯著富集通路
已糖載體基因(Solyc02g079220.2)在Cnr突變體中的相對表達量是101.640 3,鈣轉運ATP 合成酶基因(Solyc01g096190.2)在Cnr突變體中的相對表達量是6.597 4。脂氧合酶基因(Solyc08g029000.2)在Cnr番茄果實中的表達量是AC 果實中的276 367倍。過氧化物酶基因(Solyc02g082090.2)與氧化還原狀態(tài)有關,在Cnr番茄果實中的表達量是AC 果實中的1 233 倍。谷胱甘肽S-轉移酶基因(Solyc09g011630.2)參與谷胱甘肽代謝,在Cnr番茄果實中的相對表達量是5 383.808 2。果膠酯酶基因(Solyc09g075330.2)在Cnr番茄果實中的表達量是AC 番茄果實中的1 026 倍。番茄紅素ε-環(huán)化酶基因(Solyc12g008980.1)參與番茄紅素代謝,在Cnr突變體中的表達量是15.691 3。乙烯響應蛋白抑制因子1 基因(Solyc08g080630.2)位于乙烯信號轉導途徑,在Cnr番茄果實中的相對積累量為222.453 4。植物生長素載體組分基因(Solyc07g006900.1)在植物激素代謝過程有重要作用,其在Cnr番茄果實中的相對表達量是 254.237 6,相對表達量較高。葡聚糖-1,3-β-葡萄糖苷酶B 基因(Solyc01g060020.2)與防御應答相關,在Cnr突變體果實中的表達量是AC 果實中的71 倍。
為了證明CNR 在番茄果實體內直接結合的靶基因,我們進行了ChIP 檢測。染色質從粉紅期果實中提取并與蛋白質交聯。用抗CNR 的鼠IgG 免疫沉淀CNR 及其相關DNA-蛋白復合物(ChIP)。陰性對照為正常小鼠的免疫球蛋白G(IgG)。ChIP-qPCR 顯示八氫番茄紅素合成酶基因(PSY)、多聚半乳糖醛酸酶基因(PG)、1-氨基環(huán)丙烷-1-羧酸合成酶基因(ACS)、亞油酸9S-脂氧合酶基因和果膠酯酶基因的GTAC 基序顯著富集(圖7)。八氫番茄紅素合成酶基因的結合能力最強,果膠酯酶基因結合能力最弱。ChIP-qPCR 結果說明在番茄果實體內CNR 直接結合在PSY、ACS、LOX、PE以及PG基因的啟動子區(qū)域,這些基因是轉錄因子CNR 的靶基因。
番茄果實的成熟和衰老過程是復雜而有序的,包括顏色、質地、風味、香氣成分和其他新陳代謝的變化,同時又與基因調控過程高度相關。野生型AC 和突變體Cnr番茄果實的差異基因涉及番茄果實生長發(fā)育的多個方面,包括能量相關代謝途徑、固碳作用、線粒體電子傳遞、ATP 合成、脂代謝、磷酸肌醇代謝、氨基酸代謝、核酸代謝、氧化還原狀態(tài)、谷胱甘肽代謝、次生代謝、細胞壁、細胞膜完整性、番茄紅素合成、乙烯生物合成、乙烯信號轉導、植物激素、植物防御應答、植物病原相關、非生物脅迫、維生素代謝和MAPK 信號通路。
脂氧合酶(LOX)是高等植物中的一種非血紅素鐵蛋白,參與香氣成分合成、果實成熟和衰老、氧脅迫、脂質過氧化等過程,對細菌感染和不利的外部條件有很好的防御作用[33-34]。LOX 的反應產物可能通過參與乙烯對躍變型果實的觸發(fā)而加速果實成熟。另一方面,LOX 通過催化不飽和脂肪酸的氧化影響植物成熟和衰老。亞油酸9S-脂氧合酶基因(Solyc08g014000.2)在AC 番茄果實中表達量較高,脂氧合酶基因(Solyc08g029000.2)的相對表達量在AC 番茄果實中降低。果膠酯酶在植物組織和微生物中分布較為廣泛,作用于細胞壁降解、細胞分裂,果實軟化及植物抗?。?5]。與Cnr突變體番茄果實相比,AC 番茄果實中的果膠酯酶基因(Solyc07g064180.2)上調,另一個果膠酶基因(Solyc09g075330.2)下調。以上結果表明,脂氧合酶和果膠酯酶是由多基因家族編碼的,各個基因在番茄果實成熟和軟化過程中起不同作用。
表4 AC 和Cnr 番茄果實差異基因的相對表達量
圖7 鑒定CNR 在番茄果實體內結合的順式元件
過氧化物酶催化涉及過氧化氫的各種氧化反應,有多重氧化還原進程。谷胱甘肽過氧化物酶基因(Solyc08g080940.2)參與上述反應。過氧化物酶的積累可以應對由不良傷害和非生物脅迫引起的活性氧(ROS)過量產生。過氧化物酶基因(Solyc02g082090.2)在AC 番茄果實中下調表達。谷胱甘肽轉移酶(GST)屬于蛋白質超家族,當植物受到非生物脅迫時,它可以清除活性氧并保護植物細胞膜結構完整和蛋白質的活性[36]。AC 番茄果實的谷胱甘肽 S-轉移酶基因(Solyc09g011630.2)下調。絲裂原激活蛋白激酶(MAPK)信號通路在植物免疫反應中起重要作用,該酶基因(Solyc02g084870.2)在Cnr突變體番茄果實中沒有表達,僅在AC 番茄果實中檢測到,這揭示CNR 轉錄因子與MAPK 途徑密切相關。番茄紅素具有抗氧化性能,能夠保護機體免受氧化帶來的損傷,同時可以介導細胞通訊對內分泌和免疫系統進行調控[37]。本研究發(fā)現了一個與番茄紅素合成相關的新基因(novel.9194),該基因在AC 番茄果實中上調表達;番茄紅素ε-環(huán)化酶基因(Solyc12g008980.1)在AC 番茄果實中下調表達,這兩個基因在番茄果實的著色過程中共同起作用。
乙烯是一種激素,影響成熟相關基因的表達,在水果的生長過程中起重要的調節(jié)作用[38]。AC 番茄果實中ACS基因(Solyc05g050010.2)呈上調表達,Cnr突變體中該基因不表達,無乙烯合成。乙烯響應蛋白抑制因子1 基因(Solyc08g080630.2)在AC番茄果實中呈負調控。LOX 途徑是植物特有的芳香物質合成途徑,一些揮發(fā)性化合物通過LOX 途徑合成,如LOX 通過亞麻酸途徑參與醛香物質的合成[39]。也有研究發(fā)現,在香氣物質的形成過程中乙烯發(fā)揮了重要作用。LOX 途徑中與香氣相關的基因Tomlox C表達降低,說明番茄果實LOX 途徑中香氣物質的產生依賴乙烯[40]。氨基酸代謝途徑的差異表達基因決定野生型AC 和突變體Cnr番茄果實具有不同風味,但是番茄果實香氣的組成和形成機理仍需進一步研究。
CNR 轉錄因子的功能涉及番茄果實生長發(fā)育階段的各個方面。CNR 通過直接結合八氫番茄紅素合成酶基因(PSY)、1-氨基環(huán)丙烷-1-羧酸合成酶基因(ACS)、亞油酸9S-脂氧合酶基因(LOX)、果膠酯酶基因(PE)以及聚半乳糖醛酸酶基因(PG)的啟動子來調控番茄的成熟軟化過程。