張宇鑫,李惠,張夢(mèng),宋翔,余游,余馬,陳華
(1.西南科技大學(xué)生命科學(xué)與工程學(xué)院,四川 綿陽 621010;2.綿陽市農(nóng)畜產(chǎn)品質(zhì)量安全檢驗(yàn)檢測(cè)中心,四川 綿陽 621000)
月季(Rosa chinensis)是世界上最受歡迎的觀賞花之一,具有重要觀賞價(jià)值和經(jīng)濟(jì)價(jià)值。花瓣的形狀及顏色決定了月季的五彩斑斕,因而花瓣的發(fā)育對(duì)月季的美觀起著重要作用。Squamosa promoter binding protein like(SPL)基因家族作為植物特有的轉(zhuǎn)錄因子,其家族成員能夠與SQUAMOSA啟動(dòng)子結(jié)合,被稱為SQUA啟動(dòng)子結(jié)合蛋白[1]。SPL基因編碼一個(gè)高度保守的SBP結(jié)構(gòu)域。該結(jié)構(gòu)域約含76個(gè)氨基酸殘基,包括Cys-Cys-His-Cys和Cys-Cys-Cys-His兩個(gè)串聯(lián)鋅指,并在C端具有核定位信號(hào)[2]。研究表明,SPL調(diào)控植物從營養(yǎng)生長到生殖生長的轉(zhuǎn)化,調(diào)節(jié)葉片形態(tài)發(fā)生,參與環(huán)境信號(hào)的響應(yīng)對(duì)植物生長發(fā)育發(fā)揮著重要作用[3]。此外,SPL基因參與調(diào)節(jié)花器官的形成及其后期發(fā)育[4]。
SPL基因最初從金魚草的cDNA文庫中分離出來[5],隨著植物基因組數(shù)據(jù)的不斷發(fā)表,許多物種相繼進(jìn)行了SPL基因的全基因組鑒定與分析。擬南芥的基因組共鑒定出16個(gè)SPL基因[6],隨后SPL家族在番茄、苦蕎、白樺樹、綠藻、苔蘚、玉米、葡萄、蘋果、甜瓜、丹參、蓖麻、棉花、梅花、矮牽?;ā⒏涕?、小麥、菊花、辣椒等[7-24]中相繼被分離鑒定出來,但目前月季的SPL基因尚未被鑒定。
本研究通過生物信息學(xué)的方法對(duì)月季RcSPL基因家族進(jìn)行了全面分析,包括基因結(jié)構(gòu)、染色體位置和共線性分析等,旨在探究RcSPL基因在月季花瓣發(fā)育中所行使的功能,為調(diào)控月季花瓣發(fā)育提供分子基礎(chǔ)。
從已公布的轉(zhuǎn)錄組數(shù)據(jù)中挖掘月季轉(zhuǎn)錄組數(shù)據(jù),月季轉(zhuǎn)錄組材料為花蕾期、開花期、凋謝期的近軸與遠(yuǎn)軸端月季花瓣。
1.2.1 月季SPL基因序列的鑒定 月季的基因組序列和注釋文件下載于月季Rosa chinensis‘Old Blush’基因組網(wǎng)站(https://lipm-browsers.toulouse.inra.fr//pub/RchiOBHm-V2/)[25]。擬 南 芥 的16條SPL基 因下載于擬南芥數(shù)據(jù)庫(https://www.arabidopsis.org)。SPL基因家族的SBP-box結(jié)構(gòu)域(PF03110)下載于Pfam(http://pfam.xfam.org)數(shù)據(jù)庫。16條擬南芥的SPL基因的蛋白序列被作為query序列進(jìn)行比對(duì),利用BLASTP(E<10-5)在月季蛋白質(zhì)數(shù)據(jù)庫進(jìn)行比對(duì)搜索,并除去重復(fù)序列。采用HMMER 3.0軟件的隱馬爾可夫模型(HMM)對(duì)SBP結(jié)構(gòu)域[26]再次進(jìn)行比對(duì)搜索,將2次搜索得到的序列取交集,最終確認(rèn)為月季的RcSPL家族基因數(shù)目。
1.2.2 月季SPL基因家族分類及蛋白結(jié)構(gòu)域、順式作用元件分析 利用ClustalX 1.83將鑒定到的月季RcSPL家族蛋白序列和擬南芥SPL家族蛋白序列進(jìn)行多重序列比對(duì)[27],隨后利用MEGA5采用鄰接法(neighbor-joining,NJ)構(gòu)建系統(tǒng)進(jìn)化樹[28],Bootstrap method設(shè)置為1 000。利用在線軟件GSDS 2.0(http://gsds.cbi.pku.edu.cn)繪制基因結(jié)構(gòu)圖[29]。利用 在 線 軟 件MEME 5.0.2(http://meme-suite.org)[30]對(duì)SPL蛋白家族的保守基序進(jìn)行預(yù)測(cè),預(yù)測(cè)數(shù)目設(shè)置為10,其他參數(shù)為默認(rèn)值。利用plantcare(http://bioinformatics.psb.ugent.be)網(wǎng)站預(yù)測(cè)月季RcSPL基因上游2 000 bp的順勢(shì)作用元件。
1.2.3 染色體定位以及共線性分析 使用MapChart 2.2軟件繪制月季RcSPL家族在染色體每條染色體的位置[31]。利用MCscanX軟件分析月季RcSPL基因家族在基因組中的共線性以及復(fù)制事件[32]。
1.2.4 月季SPL基因的表達(dá)分析 根據(jù)已發(fā)表NCBI的SRA數(shù)據(jù)庫中月季轉(zhuǎn)錄組數(shù)據(jù)(https://www.ncbi.nlm.nih.gov/bioproject)提取出RcSPL基因的相關(guān)表達(dá)量,利用pheatmap軟件包繪制相關(guān)熱圖[33]。
通過blast和hmmer在月季的基因組中共檢索出17個(gè)RcSPL基因,分別命名為RcSPL1至RcSPL17(表1)。系統(tǒng)發(fā)育樹將擬南芥與月季的RcSPL基因分成8個(gè)亞組(圖1),RcSPL6為Ⅰ組,RcSPL7、RcSPL8、RcSPL17為Ⅱ組,RcSPL1為Ⅲ組,RcSPL11、RcSPL14、RcSPL15為Ⅳ組,RcSPL2、RcSPL10為Ⅴ組,RcSPL3、RcSPL12、RcSPL13為Ⅵ組,RcSPL4、RcSPL9、RcSPL16為Ⅶ組,RcSPL5為Ⅷ組,Ⅳ組與Ⅶ組處于同一進(jìn)化分支,Ⅲ組、Ⅷ組、Ⅴ組處于同一分支且親緣關(guān)系更近。RcSPL基因蛋白序列長度為156~1 075 aa,分子量為17.7~118.62 kDa,等電點(diǎn)除RcSPL7均超過7,顯弱堿性。
表1 月季SPL基因的起始位置、終止位置、相對(duì)分子質(zhì)量、蛋白序列長度和等電點(diǎn)
圖1 擬南芥和月季的SPL基因的系統(tǒng)發(fā)育樹
多序列比對(duì)分析結(jié)果表明,RcSPL基因中SBP結(jié)構(gòu)域非常保守(圖2),其包含兩個(gè)鋅指結(jié)構(gòu),Zn-1、Zn-2和一個(gè)高度保守的核定位信號(hào)。比較RcSPL基因外顯子和內(nèi)含子數(shù)量和位置(圖3),RcSPL基因含有2~10個(gè)外顯子,各亞組間成員所含外顯子差異較大,Ⅱ亞組中含有最多的外顯子,其中RcSPL7包含10個(gè)外顯子,Ⅵ亞組成員所含外顯子最少,均為2~3個(gè);各亞組內(nèi)成員間外顯子數(shù)目相似。
圖2 月季SPL蛋白序列關(guān)鍵部位的多序列比對(duì)結(jié)果
圖3 月季SPL基因的基因結(jié)構(gòu)
保守基序分析預(yù)測(cè)到10個(gè)保守基序(圖4),將這10個(gè)保守基序按順序命名為Motif 1~Motif 10,分析發(fā)現(xiàn)所有蛋白序列均含有Motif 1。Ⅱ亞組成員具有最多的保守基序,并且所含種類也最多,Ⅲ、Ⅴ、Ⅵ、Ⅶ亞組成員均只含有Motif 1。
圖4 月季SPL基因的進(jìn)化關(guān)系和motif的預(yù)測(cè)
預(yù)測(cè)月季SPL基因上游2 000 bp的順勢(shì)作用元件(圖5),定向分析了MYB與MYC的作用位點(diǎn),發(fā)現(xiàn)其上游2 000 bp中含有2~13個(gè)MYB與MYC作用位點(diǎn),除RcSPL2、RcSPL5均含有5個(gè)及以上的作用位點(diǎn)。
圖5 月季SPL基因部分順式作用元件分布情況
染色體定位分析表明,RcSPL基因在除6號(hào)染色體外的其余6條染色體上均有分布(圖6)。RcSPL的復(fù)制事件分析結(jié)果表明,該家族在月季中有兩對(duì)串聯(lián)復(fù)制基因,分別為1號(hào)染色體的RcSPL1和Rc-SPL2,2號(hào)染 色體的RcSPL7和RcSPL8。RcSPL1和RcSPL2分別為Ⅲ亞組和Ⅴ亞組,RcSPL7和RcSPL8均為Ⅱ亞組。共線性分析發(fā)現(xiàn),月季中RcSPL基因有四個(gè)共線性塊(圖7)。
圖6 月季SPL基因在染色體上的分布情況
圖7 月季SPL基因的共線性分析
通過NCBI轉(zhuǎn)錄組數(shù)據(jù)分析發(fā)現(xiàn)月季花蕾期(FB)、開花期(OF)、凋花期(SF)花瓣的近軸(AD)與遠(yuǎn)軸(AB)RcSPL基因表達(dá)相關(guān),大多數(shù)月季SPL基因的表達(dá)模式具有相似性,RcSPL3與RcSPL5顯著正相關(guān)為0.9,且與其他基因具有相反的表達(dá)模式(圖8)?;虮磉_(dá)分析表明月季的RcSPL基因在開花后期表達(dá)相對(duì)較高,RcSPL3、RcSPL5、RcSPL16在花蕾期表達(dá)相對(duì)較高,RcSPL1、RcSPL13、RcSPL9、RcSPL12在花凋謝時(shí)期表達(dá)相對(duì)較高,RcSPL2、Rc-SPL14、RcSPL4、RcSPL15在開花期和花蕾期表達(dá)相對(duì)較 高,RcSPL10、RcSPL11、RcSPL17、RcSPL6、Rc-SPL7、RcSPL8在花蕾期表達(dá)相對(duì)較高(圖9)。
圖8 月季SPL基因表達(dá)模式的相關(guān)性
圖9 月季花瓣近軸與遠(yuǎn)軸RcSPL基因花蕾期、開花期、凋謝期的表達(dá)量
SPL基因在植株的生長發(fā)育過程行使著重要的功能,研究在月季的基因組中共發(fā)掘出17個(gè)RcSPL成員,系統(tǒng)發(fā)育樹分析將其分成8個(gè)亞組,每個(gè)亞組具有較為相似的基因結(jié)構(gòu)且外顯子數(shù)目基本相同,這與前人研究結(jié)果相符[34,35]。通過RcSPL蛋白序列的保守基序分析發(fā)現(xiàn),每條RcSPL均具有Motif 1。此外,Ⅱ亞組具有最多的保守基序,最多的外顯子,具有較高水平的表達(dá),推測(cè)其在月季花開過程行使重要的功能。
RcSPL基因上游2 000 bp的順式作用元件分析發(fā)現(xiàn),該段區(qū)域具有2~13個(gè)MYB與MYC轉(zhuǎn)錄因子的作用位點(diǎn),MYB是一種調(diào)控花色的轉(zhuǎn)錄因子,MYB與MYC在花青素的合成中起著重要的作用。有研究表明SPL基因與花青素的含量和花香有關(guān)[36],因此推測(cè)SPL基因很可能與MYB和MYC相互作用調(diào)控月季花青素的含量,共同調(diào)控花的生長發(fā)育。
分析基因表達(dá)模式的相關(guān)性發(fā)現(xiàn),大多數(shù)月季RcSPL基因的表達(dá)模式具有相似性,RcSPL3、RcSPL5的表達(dá)模式與其他基因相反,推測(cè)這兩個(gè)基因可能發(fā)揮與其他RcSPL基因相反的功能。轉(zhuǎn)錄因子通常在控制組織特異性基因的表達(dá)中起著關(guān)鍵性作用[37]。根據(jù)RcSPL家族表達(dá)量的分析,發(fā)現(xiàn)RcSPL成員間表達(dá)差異明顯。研究表明,擬南芥SPL8能夠影響花粉的發(fā)育[38],GbSBP6基因在銀杏胚珠中顯著表達(dá)且與擬南芥SPL8位于同一亞組,可能參與了銀杏的花發(fā)育[39],RcSPL1也位于該亞組,推測(cè)RcSPL1可能參與月季花粉形成的調(diào)控。前人研究表明擬南芥SPL3、SPL4、SPL5編碼的轉(zhuǎn)錄因子能夠調(diào)控開花時(shí)間和成花轉(zhuǎn)變,該亞組的多數(shù)SPL成員與植物生殖器官的生長發(fā)育有關(guān),野生葡萄的VvSBP11參與了 成 花 轉(zhuǎn) 變 過 程[40]。RcSPL3與 擬 南 芥 的SPL3、SPL4、SPL5處于同一亞組且在花蕾期有相對(duì)的高表達(dá),因此推測(cè)RcSPL3可能參與月季開花時(shí)間的調(diào)控。