時(shí)小東,吳 琪,向達(dá)兵,萬(wàn) 燕,趙 鋼*
(1.成都大學(xué)農(nóng)業(yè)部雜糧加工重點(diǎn)實(shí)驗(yàn)室, 四川 成都 610106; 2. 成都大學(xué)藥學(xué)與生物工程學(xué)院, 四川 成都 610106)
【研究意義】苦蕎(Fagopyrumtataricum)為蓼科蕎麥屬一年生植物,營(yíng)養(yǎng)豐富,富含黃酮類化合物等營(yíng)養(yǎng)物質(zhì),是一種藥食同源的雜糧作物[1-2]。此外,苦蕎品種多樣,抗逆性強(qiáng),能夠適應(yīng)干旱、低溫、紫外輻射、鋁脅迫等惡劣環(huán)境[3-5],在我國(guó)主要分布在四川、云南、貴州等干旱高海拔地區(qū)生長(zhǎng)。表皮毛作為植物表面凸起,能夠增加植物表皮組織的厚度,形成一道天然屏障,保護(hù)植物抵御機(jī)械損傷、惡劣天氣、紫外輻射、病蟲害等脅迫[6-7]。具有腺體的表皮毛能夠分泌多種次生代謝產(chǎn)物,如生物堿、類黃酮、萜類等,這些物質(zhì)不僅能夠產(chǎn)生經(jīng)濟(jì)效益,還能夠起到驅(qū)逐昆蟲的生物防御和抵抗非生物脅迫的作用[8]。因此,對(duì)苦蕎表皮毛的形成及調(diào)控機(jī)理研究具有重要的理論意義和潛在的應(yīng)用價(jià)值。【前人研究進(jìn)展】表皮毛是一種覆蓋于植物表面的特化細(xì)胞,是表皮細(xì)胞向外延伸形成的表皮附屬結(jié)構(gòu)[9]。植物表皮毛形態(tài)多樣,可分為多種類型,如單細(xì)胞和多細(xì)胞、腺毛和非腺毛,以及分枝和不分枝,如擬南芥的表皮毛為典型的單細(xì)胞、分枝和非腺毛結(jié)構(gòu)[10]。植物表皮毛對(duì)細(xì)胞分化機(jī)制研究、脅迫防御和經(jīng)濟(jì)效益具有重要意義。由于植物缺失表皮毛仍能正常生長(zhǎng),試驗(yàn)操作簡(jiǎn)單,表皮毛已經(jīng)成為重要的細(xì)胞發(fā)育和分化機(jī)制研究的重要模型[6,11]。植物表皮毛發(fā)育相關(guān)基因的研究較多,尤其是在植物模式植物擬南芥。在擬南芥中GL1-GL3/EGL3-TTG1形成核心調(diào)控復(fù)合體,調(diào)控?cái)M南芥單細(xì)胞表皮毛的發(fā)育[12]。同時(shí),擬南芥表皮毛的形成、分枝和延伸等過(guò)程受到多種植物激素和轉(zhuǎn)錄因子的協(xié)同調(diào)控[13]。在擬南芥中已經(jīng)挖掘得到多個(gè)轉(zhuǎn)錄因子對(duì)擬南芥單細(xì)胞表皮毛形成起著正調(diào)控的作用,如C2H2型鋅指蛋白基因GIS家族(如GIS、GIS3、ZFP6、ZFP8等)[14-15]。同時(shí),研究表明擬南芥表皮毛發(fā)育相關(guān)的GIS基因能夠引起煙草多細(xì)胞表皮毛的增加,并促進(jìn)腺毛代謝產(chǎn)物的生成[16]。Shi等研究也表明鋅指蛋白基因JcZFP8(GIS家族基因)能夠促進(jìn)煙草多細(xì)胞表皮毛的形成[17]。在多細(xì)胞表皮毛植物番茄中,C2H2鋅指蛋白基因能夠調(diào)控番茄和煙草表皮毛的形成[18]。上述結(jié)果表明,GIS家族基因在不同類型表皮毛形成中均發(fā)揮這重要的作用,可能是所有植物表皮毛發(fā)育的關(guān)鍵保守基因。但已有的GIS家族基因調(diào)控表皮毛發(fā)育機(jī)制研究?jī)H集中在擬南芥、番茄和煙草等少數(shù)植物,在其他植物中研究調(diào)控機(jī)制還不清楚。慕勤國(guó)對(duì)苦蕎營(yíng)養(yǎng)器官進(jìn)行解剖學(xué)研究表明,苦蕎葉柄有明顯表皮毛,且葉片上下表皮細(xì)胞均有腺毛的表皮毛[19]。游亞麗等對(duì)金蕎麥和蕎麥形態(tài)結(jié)構(gòu)研究也表明其莖葉等部位均具有表皮毛,對(duì)其干旱適應(yīng)性起到促進(jìn)作用[20]?!颈狙芯壳腥朦c(diǎn)】苦蕎表皮毛發(fā)育的調(diào)控機(jī)理研究還不深入。因而,開展苦蕎表皮毛發(fā)育機(jī)制研究對(duì)于深入分析其抗逆性和高含量活性成分等具有重要意義。【擬解決的關(guān)鍵問(wèn)題】本研究根據(jù)苦蕎基因組數(shù)據(jù),對(duì)GIS家族基因進(jìn)行挖掘,并采用生物信息學(xué)方法對(duì)其理化性質(zhì)、染色體定位、保守結(jié)構(gòu)域,以及逆境下表達(dá)情況等進(jìn)行分析,為苦蕎基因組數(shù)據(jù)的深入挖掘及皮毛發(fā)育機(jī)理研究奠定了基礎(chǔ)。
通過(guò)NCBI(https://www.ncbi.nlm.nih.gov/)下載苦蕎基因組數(shù)據(jù)和結(jié)構(gòu)文件;擬南芥GIS家族基因序列下載于TAIR(https://www.arabidopsis.org/)。
以提取的擬南芥GIS家族基因的蛋白序列作為查詢序列信息,利用BLAST軟件對(duì)苦蕎全基因組數(shù)據(jù)進(jìn)行同源搜索,篩選參數(shù)為E-value 使用ExPaSy(https://web.expasy.org/protparam/)對(duì)篩選序列進(jìn)行氨基酸數(shù)目、分子量、理論等電點(diǎn)等信息進(jìn)行預(yù)測(cè);使用SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/)對(duì)α螺旋、延伸鏈和β轉(zhuǎn)角等二級(jí)結(jié)構(gòu)進(jìn)行預(yù)測(cè)。利用ProtComp(http://linux1.softberry.com/berry.phtml?group=programs & subgroup=proloc & topic=protcompan)和SignalP 4.1(http://www.cbs.dtu.dk/services/SignalP/)進(jìn)行亞細(xì)胞定位和信號(hào)肽分析。參數(shù)設(shè)置為默認(rèn)值。利用SWISS-MODEL進(jìn)行蛋白三維結(jié)構(gòu)分析,選擇最適三維結(jié)構(gòu)模板。 使用ClustalX 2.1和MEGA 7.0進(jìn)行系統(tǒng)進(jìn)化樹構(gòu)建,采用鄰接法(Neighbor-Joining,NJ),bootstrap值為1000。利用DNAMAN 5.0 對(duì)FtZFP蛋白序列進(jìn)行多序列比對(duì),用MEME(http://meme-suite.org/tools/meme)進(jìn)行保守基序分析。 根據(jù)Wu等報(bào)道的苦蕎鹽脅迫的轉(zhuǎn)錄組數(shù)據(jù)[21]和Zhuang等報(bào)道的鋁脅迫的轉(zhuǎn)錄組數(shù)據(jù)[22],利用FPKM值,對(duì)挖掘得到的FtZFP基因的表達(dá)模式進(jìn)行分析。 利用已報(bào)道的擬南芥中GIS家族基因的蛋白序列,BLAST對(duì)比結(jié)果顯示,從苦蕎基因組中對(duì)比得到了10個(gè)同源序列,分布于6條染色體上(圖1)。FtZFP分布涉及染色體1、3、4、5、6和7,染色體2和8上沒(méi)有分布。其中,定位于6號(hào)染色體上序列最多,為3條,且基因在染色體上的位置相對(duì)集中;其次是染色體7號(hào),存在2條基因分布;其余染色體上分布數(shù)目各為1條,涉及染色體1、3、4和5。 圖1 苦蕎FtZFP基因染色體定位Fig.1 Chromosome mapping of F. tataricum FtZFP proteins 對(duì)10個(gè)FtZFP基因結(jié)構(gòu)分析結(jié)果顯示,發(fā)現(xiàn)10條基因序列中8條僅含有1個(gè)外顯子,占總個(gè)數(shù)的80 %;FtZFP10含有外顯子數(shù)目最多,為5個(gè);FtZFP8含有外顯子數(shù)目為2個(gè)(表1)。結(jié)果表明,苦蕎GIS家族基因結(jié)構(gòu)具有高度相似性。 利用生物信息學(xué)軟件對(duì)得到的FtZFP序列的理化特性進(jìn)行分析。由表1可知,10個(gè)FtZFP基因編碼氨基酸數(shù)目介于115~270,F(xiàn)tZFP3編碼氨基酸數(shù)目最少,F(xiàn)tZFP10編碼氨基酸數(shù)目最多;其中氨基酸數(shù)目大于200和小于200的蛋白數(shù)量各為5個(gè),F(xiàn)tZFP氨基酸跨度相對(duì)較小。蛋白質(zhì)分子量介于12 750.14~28 977.52 kDa,蛋白質(zhì)分子量與氨基酸數(shù)目相一致。理論等電點(diǎn)分析表明,其中FtZFP3編碼蛋白的等電點(diǎn)最小,為5.77,表現(xiàn)為酸性;FtZFP5編碼蛋白的等電點(diǎn)最大,為9.22,表現(xiàn)為堿性。在堿性和堿性范圍內(nèi)蛋白各為5個(gè),說(shuō)明苦蕎FtZFP編碼蛋白含有基本一致的堿性氨基酸和酸性氨基酸。 對(duì)FtZFP蛋白不穩(wěn)定指數(shù)分析表明,10個(gè)蛋白的不穩(wěn)定指數(shù)介于42.05~70.14,均大于40.0。從不穩(wěn)定指數(shù)結(jié)果可知,苦蕎基因組中挖掘得到的FtZFP均表現(xiàn)為不穩(wěn)定蛋白。對(duì)脂肪指數(shù)和疏水性進(jìn)行分析,F(xiàn)tZFP蛋白脂肪指數(shù)介于35.07~71.91,均小于100。氨基酸的疏水性數(shù)值介于(-1.063)~(-0.456),均為負(fù)值,說(shuō)明得到的苦蕎FtZFP均表現(xiàn)為疏水性。 蛋白質(zhì)二級(jí)結(jié)構(gòu)是衡量蛋白質(zhì)穩(wěn)定性的重要因素,α螺旋和β轉(zhuǎn)角結(jié)構(gòu)具有高度穩(wěn)定性,為蛋白質(zhì)的有序結(jié)構(gòu);而無(wú)規(guī)則卷曲為蛋白質(zhì)的無(wú)序結(jié)構(gòu)。對(duì)10個(gè)苦蕎FtZFP編碼蛋白的二級(jí)結(jié)構(gòu)進(jìn)行預(yù)測(cè)分析結(jié)果表明,F(xiàn)tZFP蛋白二級(jí)結(jié)構(gòu)主要以無(wú)規(guī)則卷曲為主,其次是α螺旋,β轉(zhuǎn)角二級(jí)結(jié)構(gòu)最少(表2)。蛋白二級(jí)結(jié)構(gòu)分析表明,苦蕎中GIS家族基因的蛋白二級(jí)結(jié)構(gòu)整體表現(xiàn)為不穩(wěn)定性,這一結(jié)果與蛋白不穩(wěn)定指數(shù)預(yù)測(cè)結(jié)果相一致。 對(duì)蛋白序列進(jìn)行信號(hào)肽分析,10個(gè)FtZFP蛋白未發(fā)現(xiàn)信號(hào)肽序列。對(duì)10個(gè)FtZFP蛋白進(jìn)行亞細(xì)胞定位分析,10個(gè)基因編碼蛋白均定位于細(xì)胞核,符合作為轉(zhuǎn)錄因子的亞細(xì)胞定位特征,這為其發(fā)揮生物學(xué)功能奠定基礎(chǔ)。 利用MEME在線軟件對(duì)蛋白序列進(jìn)行保守基序繪制,得到1個(gè)高度保守的結(jié)構(gòu)域,該結(jié)構(gòu)域含有40個(gè)氨基酸序列,存在C2H2結(jié)構(gòu)域(圖2)。同時(shí),該保守序列結(jié)構(gòu)在10個(gè)FtZFP均有分布,有且僅有1個(gè),表明苦蕎10個(gè)FtZFP均為單一C2H2鋅指結(jié)構(gòu)。通過(guò)多序列對(duì)比發(fā)現(xiàn),10個(gè)FtZFP蛋白都含有C-X2-C-X12-H-X3-H,即C2H2結(jié)構(gòu)區(qū)域,這與MeMe分析結(jié)果相一致。8個(gè)FtZFP蛋白結(jié)構(gòu)域中均含有QALGGH,該結(jié)構(gòu)為植物所特有,此類鋅指蛋白稱為Q型。FtZFP1中第4為G變?yōu)镈,F(xiàn)tZFP4中第3位L變?yōu)閅。前人研究表明,QALGGH結(jié)構(gòu)與鋅指蛋白結(jié)合DNA能力相關(guān),任何一個(gè)氨基酸的突變都會(huì)導(dǎo)致DNA能力的降低或失去,表明FtZFP1和FtZFP4可能在進(jìn)化過(guò)程中發(fā)生突變而失去相應(yīng)功能。 表1 苦蕎FtZFP外顯子數(shù)目和蛋白一級(jí)結(jié)構(gòu) 表2 苦蕎FtZFP蛋白二級(jí)結(jié)構(gòu)和亞細(xì)胞定位預(yù)測(cè) FtZFP蛋白結(jié)構(gòu)域中具有保守性的C2H2,中心位置Zn2+能夠與2個(gè)His和Cys結(jié)合形成緊密的空間結(jié)構(gòu)維持整個(gè)蛋白的穩(wěn)定性(圖2)。同時(shí),F(xiàn)tZFP還含有QALGGH和其他保守氨基酸殘基,能夠更好地維持FtZFP的結(jié)構(gòu),從而與DNA分子進(jìn)行結(jié)合而發(fā)揮功能。 為揭示苦蕎GIS家族基因成員之間的進(jìn)化關(guān)系,基于氨基酸序列對(duì)10個(gè)FtZFP進(jìn)行系統(tǒng)進(jìn)化樹構(gòu)建(圖3)。根據(jù)進(jìn)化樹分枝情況,可以將苦蕎FtZFP蛋白成員分為2類家族,除FtZFP10單獨(dú)為1類,其他9個(gè)FtZFP聚類為1類家族。FtZFP10基因含有5個(gè)外顯子序列,其他9個(gè)FtZFP含有1-2個(gè)外顯子序列。第1類家族進(jìn)一步分為3個(gè)亞家族,第I亞家族含有5個(gè)成員,數(shù)量最多;第II和III亞家族含有成員數(shù)量相同,均為2個(gè)成員。利用MEME對(duì)苦蕎FtZFP鋅指蛋白進(jìn)行結(jié)構(gòu)域分析和繪制圖譜,結(jié)果顯示所有基因家族成員都含有1個(gè)C2H2鋅指結(jié)構(gòu),多位于肽鏈的N端,在數(shù)量和分布上均具有一致性。 圖2 苦蕎FtZFP氨基酸序列對(duì)比和保守序列結(jié)構(gòu)Fig.2 Amino acid alignments and conserved motif structure of F.tataricum FtZFP proteins 圖3 苦蕎FtZFP系統(tǒng)進(jìn)化樹和C2H2結(jié)構(gòu)分布Fig.3 The phylogenetic analysis and C2H2 motif distribution of F.tataricum FtZFP proteins 基于已報(bào)道苦蕎鹽脅迫和鋁脅迫的RNA-seq測(cè)序數(shù)據(jù),篩選涉及FtZFP的FPKM值。結(jié)果表明,在苦蕎鹽脅迫中,F(xiàn)tZFP8表現(xiàn)為上調(diào)表達(dá),而FtZFP3表現(xiàn)為下調(diào)表達(dá);在苦蕎鋁脅迫下,F(xiàn)tZFP7表現(xiàn)為上調(diào)表達(dá),推測(cè)與其生物學(xué)作用具有一定的關(guān)聯(lián)。 隨著高通量測(cè)序技術(shù)的發(fā)展,特別是三代測(cè)序技術(shù)的誕生,為植物全基因組數(shù)據(jù)的獲得提供了基礎(chǔ)。植物基因組測(cè)序工作的完成,為基因家族的挖掘和關(guān)鍵基因的深入分析提供了基礎(chǔ)。楊明磊等運(yùn)用BLASTp對(duì)普通煙草(Nicotianatabacum)基因組數(shù)據(jù)中C2H2鋅指蛋白轉(zhuǎn)錄因子家族序列進(jìn)行鑒定,最終獲得了118條序列[23]。Muthamilarasan等在谷子(Setariaitalica)基因組中鑒定得到124個(gè)C2H2鋅指蛋白基因,并對(duì)其非生物脅迫響應(yīng)進(jìn)行分析[24],表明基于基因組進(jìn)行C2H2鋅指蛋白基因家族深入挖掘的可行性。2017年,Zhang等運(yùn)用二代、三代測(cè)序平臺(tái),并結(jié)合光學(xué)圖譜和Hi-C技術(shù),完成了苦蕎基因組測(cè)序工作,獲得了489.3 Mb的高質(zhì)量染色體水平的參考基因組,預(yù)測(cè)得到了33 366個(gè)基因[22]??嗍w基因組測(cè)序工作的完成,為其功能基因的挖掘和途徑分析提供了基礎(chǔ),有助于推動(dòng)苦蕎成為抗逆研究的模式植物。本研究基于報(bào)道的苦蕎基因組數(shù)據(jù),運(yùn)用生物信息學(xué)手段,對(duì)苦蕎關(guān)鍵基因家族進(jìn)行挖掘。 表皮毛與植物生物脅迫和非生物脅迫等密切相關(guān),GIS家族基因在表皮毛發(fā)育調(diào)控中起著重要的作用。從苦蕎基因組數(shù)據(jù)中,挖掘得到了10條GIS家族基因序列。對(duì)10條FtZFP染色體定位分析發(fā)現(xiàn),其分散定位于6條不同染色體上,這與其他C2H2基因家族成員染色體定位結(jié)果具有一致性[25],說(shuō)明C2H2基因家族成員分布廣泛,并可能存在功能互補(bǔ)性。亞細(xì)胞定位預(yù)測(cè),10個(gè)FtZFP蛋白均定位于細(xì)胞核,這與其他表皮毛相關(guān)的C2H2鋅指蛋白研究結(jié)果相同[26],符合其作為轉(zhuǎn)錄因子發(fā)揮調(diào)控功能的亞細(xì)胞定位特征。 在結(jié)構(gòu)上,10個(gè)FtZFP均含有一個(gè)保守的C2H2結(jié)構(gòu)域,這與擬南芥和番茄等植物中毛發(fā)育相關(guān)的C2H2鋅指蛋白家族基因相一致[14-18],表明在植物中參與表皮毛發(fā)育調(diào)控的鋅指蛋白基因均為單鋅指結(jié)構(gòu)。在C2H2結(jié)構(gòu)域中存在QALGGH基序,為植物鋅指蛋白所特有,對(duì)C2H2型鋅指蛋白轉(zhuǎn)錄因子結(jié)合到特定的DNA序列具有重要的作用[27],說(shuō)明FtZFP蛋白家族可能通過(guò)與其他因子相互作用從而調(diào)控植物表皮毛的發(fā)育。 基于報(bào)道的苦蕎脅迫轉(zhuǎn)錄組數(shù)據(jù),大部分FtZFP基因在鹽脅迫和鋁脅迫過(guò)程中表現(xiàn)為上調(diào)表達(dá),說(shuō)明FtZFP可能通過(guò)增加表皮毛的密度或形態(tài),從而通過(guò)表皮毛物理防御或次生產(chǎn)物代謝形成增加苦蕎的抗性。目前,對(duì)擬南芥調(diào)控表皮毛發(fā)育相關(guān)基因的研究較多,在番茄、煙草、水稻、黃瓜等植物中已經(jīng)開展了部分研究[28]。苦蕎作為高海拔作物,能夠抵抗干旱、低溫、紫外等惡劣環(huán)境,且富含黃酮類等次生代謝物質(zhì),其逆境適應(yīng)性和高生物活性物質(zhì)是否與苦蕎表皮毛有關(guān)仍有待進(jìn)行深入研究。 從苦蕎全基因組中共鑒定得到了10條GIS家族基因序列,序列分析和保守結(jié)構(gòu)域等分析結(jié)果表明,所有序列均含有保守的單一C2H2結(jié)構(gòu)域。與其他植物一樣,多數(shù)苦蕎FtZFP含有植物C2H2鋅指蛋白特有的QALGGH基序。對(duì)苦蕎基因組中GIS家族基因進(jìn)行挖掘?qū)?duì)苦蕎抗逆性研究和資源開發(fā)具有實(shí)際意義和應(yīng)用價(jià)值。1.3 FtZFP序列的基本性質(zhì)分析
1.4 FtZFP序列保守結(jié)構(gòu)域和進(jìn)化分析
1.5 逆境脅迫下FtZFP的表達(dá)分析
2 結(jié)果與分析
2.1 苦蕎基因組中GIS家族基因信息
2.2 FtZFP蛋白一級(jí)結(jié)構(gòu)分析
2.3 FtZFP蛋白二級(jí)結(jié)構(gòu)和亞細(xì)胞定位預(yù)測(cè)分析
2.4 FtZFP保守結(jié)構(gòu)域分析
2.5 FtZFP系統(tǒng)進(jìn)化樹分析
2.6 FtZFP脅迫下表達(dá)分析
3 討 論
4 結(jié) 論