張帥,林科運,侯純樸,方玉潔,王幼平
(揚州大學生物科學與技術(shù)學院,江蘇 揚州,225009)
質(zhì)體藍素(phytocyanin,PC)是一類植物特異性I型藍銅蛋白(blue copper proteins,BCP),包括plastocyanin 和PC 相關蛋白[1,2]。盡管PC 蛋白家族成員之間的序列一致性通常并不高,但該家族所有成員的蛋白質(zhì)序列均具有兩個保守的能形成二硫鍵的半胱氨酸(cysteine,Cys),其中部分成員具有4 個保守的銅離子結(jié)合位點,由2 個組氨酸(histidine,His)、1個Cys和1個甲硫氨酸(methionine,Met)或谷氨酰胺(glutamine,Gln)組成[2,3]。PC 蛋白有4 個結(jié)構(gòu)域(IIV),包括1 個必要的類質(zhì)體藍素域(plastocyaninlike domain,PLCD)(結(jié)構(gòu)域II)和3 個可選結(jié)構(gòu)域(結(jié)構(gòu)域I、III和IV)[4]。
根據(jù)銅配體殘基的特性和蛋白結(jié)構(gòu)組分等特征,PC 家族可分為4 個亞家族:類質(zhì)體藍素蛋白(plantacyanin-like protein,PLCL)、類花青素苷蛋白(uclacyanin-like protein,UCL)、類漆樹藍蛋白(stellacyanin-like protein,SCL)和類早期結(jié)瘤素蛋白(early nodulin-like protein,ENODL)[5,6]。其中UCL與PLCL 的銅配體殘基相同,由2個His、1個Cys和1個Met 組成,而UCL 則屬于嵌合型糖蛋白,PLCL 為非糖蛋白[7]。與UCL 和PLCL 不同,SCL 銅配體殘基中的Gln被Met所取代,但SCL與作為嵌合型糖蛋白的UCL 相似,它們不僅包含銅結(jié)合結(jié)構(gòu)域,而且其蛋白質(zhì)骨架中還包含糖蛋白樣結(jié)構(gòu)域,SCL 和UCL通過Asn-X-Thr/Ser 中的Asn 殘基提供N-糖基化位點,部分SCL 和UCL 通過Ser 和羥脯氨酸(Hyp)殘基提供O-糖基化位點[8]。與另外三個亞家族不同,ENODL 家族成員的蛋白骨架缺乏完整的銅離子結(jié)合位點,銅配體中的4 個氨基酸殘基部分或全部被其它氨基酸殘基取代[9]。研究發(fā)現(xiàn),在擬南芥(Arabidopsis thaliana)和水稻(Oryza sativa)中,大部分PC中存在類阿拉伯半乳聚糖蛋白域(arabinogalactan protein-like region,ALR),因此PC基因家族也被歸為AGP超家族中的一個亞家族[9,10]。
在已有的研究報道中,PLCL、SCL、UCL 蛋白功能研究較少。在擬南芥中,過表達plantacyanin抑制花粉粒萌發(fā),破壞花粉管的定向生長,并導致種子結(jié)實率降低[11]。在辣椒中,SCL 參與了被野油菜黃單胞菌葉斑病無毒菌株感染的葉片的超敏反應[12]。過表達OsUCL8導致花粉管的生長和授粉出現(xiàn)明顯異常,影響水稻結(jié)實率;相反,敲除OsUCL8和過表達miR408 的植株花粉萌發(fā)率顯著提高[13]。與功能研究較少的PLCL、SCL、UCL 相比,ENODL 蛋白的功能研究更為廣泛和全面,且在根中的研究居多。豆科植物中的研究表明,大豆中的GmENODL55[14],豌豆中的VsENODL5、VsENODL12和VsENODL40[15],以及苜蓿中的MtENODL16和MtENODL20[16]在根瘤中高表達,參與了豆科植物的結(jié)瘤過程。已有研究證實,VsENOD5在受根瘤菌侵染前的根瘤原基中并不表達,而在受侵染后攜帶侵染線的豌豆根皮層細胞和被侵染的根瘤細胞中表達[15,17]。大豆GmENOD55也顯示出相似的表達模式,僅在受慢生型大豆根瘤菌侵染后的大豆根瘤細胞中表達[14]。MtENOD20是一個在根皮層細胞激活過程中受結(jié)瘤因子誘導的標志基因,該基因的轉(zhuǎn)錄激活起始于對應根瘤原基形成位置處于分裂狀態(tài)的內(nèi)皮層細胞,隨后該基因在含有侵染線的根毛細胞中表達[18]。最近的研究顯示,蒺藜苜蓿MtENODL27和MtENODL28 在根瘤中特異表達,且在被侵染的根中表達上調(diào);抑制MtENODL27和MtENODL28表達會阻礙根瘤菌的侵染和根瘤形成,說明MtENODL27/28 是根瘤菌侵染和根瘤發(fā)育的必需因子[4]。除了在根系中表達之外,ENODL基因也被發(fā)現(xiàn)在水稻的高蛋白淀粉層中表達[19]。ENODL家族中的Pn14基因在牽?;ǎ≒harbitis nil)的分生組織、原形成層、莖尖周圍的葉原基表皮毛以及根尖的分生組織和原形成層中表達,暗示其可能參與植物的細胞壁重建和器官分化[20]。此外,擬南芥中At3g20570編碼的ENODL 蛋白在篩管分子的細胞膜中積聚,并參與調(diào)控擬南芥的生殖能力[21]。這些研究表明ENODL 不僅在根中發(fā)揮作用,而且可能在植物發(fā)育的其它階段發(fā)揮功能。
前人的研究表明,PC也參與植物對非生物脅迫的應答過程。厚葉蛛毛苣薹(Boea crassifolia)中BcBCP1受干旱脅迫和鹽脅迫誘導上調(diào)表達,在煙草中異源過表達BcBCP1使轉(zhuǎn)基因煙草的抗旱性增強,在滲透脅迫下表現(xiàn)出更高的存活率和更高的光合速率[22]。玉米中的PC基因家族也參與對鹽脅迫和干旱脅迫的響應,在鹽處理條件下,玉米中9 個PC基因(ZmUC10、ZmUC16、ZmUC19、ZmSC2、ZmUC21、ZmENODL10、ZmUC22、ZmENODL13和ZmENODL15)表達下調(diào);在干旱處理條件下,5個PC基因(ZmUC19、ZmSC2、ZmENODL10、ZmUC22和ZmENODL13)的表達下調(diào),而ZmUC16表達顯著增強[23]。早期的研究證實,擬南芥藍銅結(jié)合蛋白基因AtBCB的表達受光負調(diào)節(jié),其編碼的藍銅結(jié)合蛋白可能作為電子載體參與細胞膜區(qū)的電子傳遞反應[24]。AtBCB/AtSC3受鋁脅迫和氧化脅迫誘導表達[25,26]。后續(xù)研究表明,AtBCB蛋白主要定位于細胞膜上,與野生型植株相比,過表達AtBCB的轉(zhuǎn)基因擬南芥在根中積累更多的木質(zhì)素,過表達AtBCB的酵母轉(zhuǎn)化子對鋁的抗性增強,說明AtBCB 能夠抑制鋁的吸收和鋁毒害造成的氧化脅迫[27]。
全基因組系統(tǒng)分析能夠為鑒定基因家族成員并闡明其生物學作用提供有效的途徑和依據(jù)。目前研究者們已經(jīng)對擬南芥[10]、水稻[9]、大白菜(Brassica rapa)[28]、玉米(Zea mays)[23]、蝴蝶蘭(Phalaenopsis equestris)[29]和蒺藜苜蓿(Medicago truncatula)[4]中的PC 家族基因進行了全基因組鑒定和分析。甘藍型油菜(Brassica napus)是一種由白菜和甘藍自然雜交形成的異源四倍體植物[30],作為集食用、飼用和觀賞價值于一身的常見農(nóng)作物,該物種中PC基因家族的功能尚不明確。本研究對甘藍型油菜PC基因(BnPC)家族進行了全基因組范圍內(nèi)的鑒定、生物信息學分析和表達分析,旨在了解BnPC基因家族成員的組成、分類和表達特征,為揭示該家族成員的生物學功能提供線索。
本研究利用HMMER 軟件和PLCD 的HMM 在甘藍型油菜全基因組范圍內(nèi)對PC 家族成員進行鑒定,并進一步利用SMART 和UniProt 數(shù)據(jù)庫對這些潛在的PC 蛋白進行PLCD 結(jié)構(gòu)域的確認。在Pfam 33.1 數(shù)據(jù)庫(http://pfam. xfam. org/)中利用關鍵詞“phytocyanin”和“plastocyanin”進行搜索,并利用PLCD 的隱馬爾可夫模型(Hidden-Markov Model,HMM)PF02298(Plastocyanin-like domain)和HMMER 軟件對甘藍型油菜數(shù)據(jù)庫(http://www. genoscope.cns.fr/brassicanapus/)全基因組蛋白序列進行檢索(E-value ≤1e-5),獲得潛在的BnPC 家族成員信息。進一步利用SMART(http://smart. embl-heidelberg. de)和UniProt(http://www. uniprot. org/)數(shù)據(jù)庫對獲得的假定PC 成員的PLCD 結(jié)構(gòu)域進行鑒定,篩選確認具有完整PLCD 結(jié)構(gòu)域的序列,即為BnPC家族成員。
從甘藍型油菜數(shù)據(jù)庫獲取各BnPC基因相應的染色體位置等信息,利用TBtools(https://github.com/CJ-Chen/TBtools/releases)軟件[31]中的基因可視化工具繪制BnPC基因在甘藍型油菜19條染色體上的定位圖。采用MCSCANX(http://chibba.pgml.uga.edu/mcscan2/)分析甘藍型油菜(B. napus)、擬南芥(A.thaliana)、白菜(B. rapa)和甘藍(B. oleracea)之間的基因復制事件和共線性關系[32]。為了確認BnPC之間的同源關系,以及BnPC與其它物種PC之間的同源關系,分別用TBtools 軟件中的AmazingSuper-Circos 和Dual Systeny Plotter 進行可視化[31]。用KaKs 計算器2.0 計算各基因?qū)Φ耐x替換率(Ks)、非同義替換率(Ka)和Ka/Ks比值[33]。
首先利用Clustal W 軟件對BnPC 的PLCD 結(jié)構(gòu)域序列進行多序列比對分析,生成軟件MEGA 可識別的比對文件(默認參數(shù)設置)[34],然后利用MEGA5.0 軟件(https://www. megasoftware. net/),采用鄰接法(Neighbor-joining Method)基于上述多序列比對文件進行系統(tǒng)發(fā)生分析[35]。Bootstrap 設置為1000,選用p-distance 模型,Gap 設置為Partial deletion,Site Coverage Cutoff設置為95%,生成無根樹。
將存在PLCD 結(jié)構(gòu)域的BnPC 蛋白序列文件保存為FASTA 格式,利用SignalP 5.0(http://www.cbs.dtu.dk/services/signalP/)、Big-PI Plant Predictor(http://mendel. imp. ac. at/gpi/plant_server. html)和NetNGlyc 1.0 Server 軟件(http://www. cbs. dtu. dk/services/NetNGlyc/)分別預測其N-端信號肽(NSP)、GAS 和N-糖基化位點(默認參數(shù)設置)。依據(jù)前人研究擬南芥AtPC 蛋白序列中潛在阿拉伯半乳聚糖蛋白樣域(Arabinogalactan protein-like region,ALR)的原則[10]:以非鄰接的脯氨酸(Pro)殘基基序([Ala/Ser/Thr/Gly]-Pro-X(0, 10)-[Ala/Ser/Thr/Gly]-Pro)和([Ala/Ser/Thr/Gly]-Pro3-4)為阿拉伯半乳聚糖(AG)糖模體;Ser-Pro2-4為假定的伸展蛋白糖模體;手動分析BnPC 蛋白序列中潛在的ALR。利用軟件Clustal X 1.81(http://www. clustal. org/clustal2/)對BnPC 氨基酸序列進行多重序列比對分析(使用默認參數(shù))[34],手動標記結(jié)構(gòu)域特征位點。
從甘藍型油菜數(shù)據(jù)庫獲得油菜BnPC基因的基因組序列及CDS 序列,利用基因結(jié)構(gòu)預測的可視化工具TBtools 繪制BnPC的基因結(jié)構(gòu)圖[31]。利用在線軟件MEME Suite5.1.0(http://meme. nbcr. net/meme/cgi-bin/meme. cgi)分析BnPC 蛋白的氨基酸序列,預測其中的保守模體(motif),參數(shù)設定為軟件默認值[36]。
從甘藍型油菜數(shù)據(jù)庫獲得BnPC基因的起始密碼子上游區(qū)域2000 bp 序列,利用在線網(wǎng)站Plant-Care(http://bioinformatics. psb. ugent. be/webtools/plantcare/html/)對上述區(qū)域進行順式元件分析[37],利用TBtools軟件對該區(qū)域的順式元件進行可視化[31]。
根據(jù)本實驗室前期創(chuàng)建的甘藍型油菜不同發(fā)育階段各組織器官中以及不同逆境脅迫條件下的轉(zhuǎn)錄組數(shù)據(jù)(BioProject ID PRJNA687395),分析各BnPC基因的時空表達模式以及在不同逆境處理條件下的表達變化。對于時空表達模式,分別對各BnPC基因在甘藍型油菜子葉、根、莖、幼葉、莖頂端分生組織(shoot apical meristem,SAM)、成熟葉、花苞、子房以及受精后14 d、24 d、34 d、50 d 的種子和角果皮中的表達水平進行分析。對于逆境表達模式分析,分別對各BnPC基因在干旱、鹽、冷和高溫脅迫條件下的表達變化情況進行分析。將甘藍型油菜揚油9 號種子在濕潤濾紙上發(fā)芽后,選取生長健康且長勢一致的幼苗移栽至光照培養(yǎng)箱(22℃,16 h 光照/8 h 黑暗)進行水培,待幼苗生長至四葉期開始脅迫處理。本研究采用15% PEG6000 模擬干旱脅迫(drought),利用150 mmol/L NaCl 處理進行鹽脅迫(salt),分別在4℃和42℃培養(yǎng)箱中進行冷脅迫(cold)和高溫脅迫(heat),以種植在正常條件下培養(yǎng)的植株作為對照。分別在干旱和鹽處理后24 h,冷處理后6 h,高溫處理后1 h采集處理材料的葉片,并在對應的時間點同時采集對照植株的葉片,立即用液氮冷凍,在-80℃冰箱中保存至提取RNA。使用華中農(nóng)業(yè)大學(武漢)Illumina 測序平臺(HiSeq 3000)進行RNA-Seq測序。
結(jié)果表明,甘藍型油菜中有183 個蛋白具有PLCD結(jié)構(gòu)域,其中10個蛋白由于保守PLCD結(jié)構(gòu)域中關鍵Cys 殘基缺失而被排除,因此,在甘藍型油菜中共鑒定得到173 個PC 蛋白(附表1,見首頁OSID二維碼),遠多于前人在擬南芥中的發(fā)現(xiàn)PC 成員的數(shù)量(38個)[28]。
對BnPC 家族成員的PLCD 結(jié)構(gòu)域進行多重序列比對分析,結(jié)果表明:140 個成員的PLCD 結(jié)構(gòu)域中含有完整的2 個Cys 殘基,其余8 個BnPC 蛋白只含有一個Cys殘基,Cys在PLCD結(jié)構(gòu)域中高度保守;49個BnPC 蛋白中含有4個完整的銅結(jié)合配體(His、Cys、His、Met/Gln),其中28 個成員的銅配體為His、Cys、His、Met 類型,21 個成員的銅配體為His、Cys、His、Gln 類型(附表1,見首頁OSID 二維碼)。根據(jù)銅結(jié)合位點以及糖基化位點的差異,可以將BnPC蛋白劃分為4 個亞家族:其中25 個成員歸屬于類花青苷蛋白(BnUCL),21 個成員歸屬于類漆樹藍蛋白(BnSCL),3 個成員歸屬于類質(zhì)體藍素蛋白(Bn-PLCL);其余99 個不含銅結(jié)合位點的BnPC 歸屬于類早期結(jié)瘤素蛋白(BnENODL)亞家族。與以往的研究結(jié)果不同,甘藍型油菜中有5 個SCL(SCL5、SCL6、SCL13、SCL15 和SCL16)不具有N-糖基化位點,這可能是由于進化過程中蛋白序列的趨異造成的。此外,多重序列比對的結(jié)果顯示,在BnENODL亞家族成員的序列中,與其它亞家族成員銅結(jié)合位點相對應的位置上有一些氨基酸取代His、Cys、His、Met/Gln從而形成了其它形式的保守模體,其功能可能與結(jié)合銅有關。
對BnPC基因在甘藍型油菜19條染色體上的分布進行分析。如圖1 所示,在173 個BnPC基因中,有25個BnPC基因由于甘藍型油菜基因組組裝信息不全而未被定位到特定染色體上,其余148 個BnPC基因在19條染色體上分布不均。共有67個和81個BnPC基因分別位于A 和C 亞基因組上,每條染色體上的BnPC基因數(shù)目從4到15不等,C07染色體上包含的BnPC基因最多(15 個),其次是C03、A03 和C04 染色體,分別有13、12 和10 個BnPC。A08 和A07 染色體上的BnPC基因數(shù)目最少(分別有4 個),各條染色體上BnPC基因的數(shù)目與染色體長度不存在明顯相關關系。
圖1 BnPC基因在甘藍型油菜染色體上的分布Fig.1 Distribution of BnPC genes on Brassica napus chromosomes
基因復制是物種進化過程中產(chǎn)生新基因的一種重要途徑,主要是在多個基因非常接近的情況下通過串聯(lián)復制,或者通過片段復制來實現(xiàn)[38]。為了研究BnPC 家族基因在進化過程中的擴增情況,本研究對BnPC 家族中的基因復制事件進行了分析。結(jié)果表明,137 個BnPC基因是復制事件的產(chǎn)物(附表2,見首頁OSID二維碼),其中123個BnPC來自全基因組復制(whole genome duplication,WGD)或片段復制(segmental duplication),另外14 個BnPC基因來自分散復制(dispersed duplication)。利用MCScanX 軟件在BnPC 家族中共鑒定出120 對基因具有共線性。為了解甘藍型油菜和擬南芥以及蕓薹屬植物BnPC基因家族間的進化關系,本研究進一步對甘藍型油菜與自身、擬南芥以及兩種二倍體祖先(白菜和甘藍)基因之間的共線性關系進行了分析。如圖2 和圖3 所示,甘藍型油菜與擬南芥、白菜、甘藍中存在大量的同源PC基因。在148 個BnPC中,有118 個(79.73%)與其它物種的PC具有共線性關系,其中92 個BnPC基因(87 個來源于WGD 或片段復制,占94.57%)與擬南芥PC基因具有共線性關系,118 個BnPC(112 個來源于WGD 或片段復制,占94.92%)與白菜PC基因具有共線性關系,96 個Bn-PC(86個來源于WGD 或片段復制,占89.58%)與甘藍PC基因具有共線性關系。上述結(jié)果表明,基因復制在很大程度上促進了甘藍型油菜基因組中PC基因家族的擴張,其中WGD 或片段復制事件起主要的驅(qū)動作用。
圖2 甘藍型油菜基因組內(nèi)PC基因的共線性分析Fig.2 Syntenic relationship of PC genes in B.napus genome
圖3 甘藍型油菜與擬南芥、白菜和甘藍PC基因的共線性關系Fig.3 Syntenic relationship of PC genes in B.napus and three Cruciferae plants(Arabidopsis,B.rapa and B.oleracea)
為了評估在甘藍型油菜進化過程中復制BnPC基因受到的選擇壓力,我們計算了甘藍型油菜中的同源基因?qū)Φ腒a、Ks和Ka/Ks比值。結(jié)果表明,大部分BnPC基因?qū)Φ腒a/Ks<0.5,表明BnPC基因家族在進化過程中經(jīng)歷了強烈的純化選擇(附表3,見首頁OSID二維碼)。
為了闡明BnPC 蛋白之間的系統(tǒng)發(fā)生關系,我們利用PLCD 保守結(jié)構(gòu)域序列對BnPC 蛋白進行無根樹的構(gòu)建。如圖4 所示,BnPC 蛋白可分為6 個進化枝(Clade A-F)。與其它物種中的情況類似,Bn-PLCL 亞家族的成員最少,在甘藍型油菜中僅有3 個成員,3個PLCL成員在進化關系上均與BnUCL亞家族比較接近,推測它們可能是由UCL 亞家族成員直接分化而來。有趣的是,與BnPLCL1、BnPLCL2 進化關系上相近的BnUCL23 卻與UCL 亞家族其它成員相距較遠,推測BnUCL23 可能是由BnENODL 亞家族分化而來,隨后在進化過程中進一步分化為BnPLCL1 和BnPLCL2。成員數(shù)量最多的BnENODL亞家族,主要分布于三個進化枝,其中50 個BnENODL 占據(jù)了全部A 進化枝,C 進化枝中包含了32 個BnENODL,而剩余的BnENODL 幾乎全部分布于F進化枝中,處于同一進化枝中的BnENODL 成員序列差異較小,可能具有類似的功能。除了BnUCL23 位于F 進化枝中,BnUCL 亞家族其它成員全部分布于B 進化枝中。BnSCL 亞家族成員中有3 個成員位于C 進化枝中,其余成員則主要存在于D 和E進化枝中,BnSCL成員分布相對分散,暗示著該亞家族成員在功能上存在分化。
對BnPC 蛋白的其它三個功能域(SP、ALR、GAS)進行分析(附表1,見首頁OSID 二維碼),根據(jù)四種結(jié)構(gòu)域在BnPC 蛋白中的組成,BnPC 蛋白可分為10 種類型(I~X)(圖5)。除VII、VIII、IX 和X 型成員外,共有133個BnPC 蛋白具有分泌蛋白所需要的N-端信號肽。V 型、VI 型和X 型成員具有兩個PLCD 結(jié)構(gòu)域,PLCD 結(jié)構(gòu)域的重復可能來源于甘藍型油菜進化過程中PLCD 結(jié)構(gòu)域區(qū)段的復制。此外,屬于II、IV、VIX 型的77 個BnPC 具有GAS,暗示著這些蛋白質(zhì)可能定位于細胞膜上。除了I、II、VI和VII 型的BnPC 成員,其余95 個BnPC 具有一個ALR 域,在這些成員中,同時具有N-端信號肽的蛋白可歸屬于AGP 超家族。蛋白質(zhì)結(jié)構(gòu)域組成類似的PC 成員傾向于在系統(tǒng)發(fā)生樹上聚集在一起。例如,I 型BnPC 主要聚集在E 進化枝中,IV 型BnPC 主要聚集在A進化枝中(圖4)。
圖4 甘藍型油菜PC家族系統(tǒng)發(fā)生分析Fig.4 Phylogenetic analysis of the PC family in B.napus
圖5 基于結(jié)構(gòu)域組成的BnPC分類Fig.5 Classification of BnPC proteins based on domain composition
外顯子-內(nèi)含子結(jié)構(gòu)的差異對于基因功能起重要作用,特別是對于重復基因[39]。本研究對148 個BnPC家族基因成員編碼區(qū)序列進行結(jié)構(gòu)分析的結(jié)果表明,BnPC基因的外顯子數(shù)目在1 個到6 個之間,其中100個BnPC基因包含2個外顯子,20個Bn-PC基因包含3 個外顯子,9 個BnPC基因包含3 個外顯子,18 個BnPC基因(BnENODL9/12/22/27/39/61/65/71/83/98、BnSCL4/5/6/7/8/12/13/15)只有1 個外顯子,沒有內(nèi)含子,僅BnENODL42基因含有多達6 個外顯子(圖6)。此外,同一亞家族的同一系統(tǒng)發(fā)育類群的基因的外顯子-內(nèi)含子結(jié)構(gòu)更相似,例如Clade A 中大多數(shù)成員有兩個外顯子,Clade D 中大多數(shù)基因沒有內(nèi)含子。屬于相同亞家族的一些成員外顯子長度接近,而內(nèi)含子長度差異較大(例如:BnENODL30 和BnENODL87、BnUCL13 和BnUCL22、BnPLCL1和BnPLCL2),這可能與重復基因的功能分化有關。
利用MEME 分析BnPC 蛋白的模體組成,共鑒定出10 個保守模體,其長度在14~50 個氨基酸之間(圖6,附圖1,見首頁OSID二維碼),其中Motif 1/2/3/4/5/7/8 屬于PLCD 保守結(jié)構(gòu)域的一部分,Motif 6 出現(xiàn)在具有兩個PLCD 保守結(jié)構(gòu)域的蛋白中,位于兩個PLCD 結(jié)構(gòu)域之間,Motif 9/10 則是新發(fā)現(xiàn)的保守結(jié)構(gòu)域。結(jié)果表明,同一亞類中BnPC 的結(jié)構(gòu)相似。除了BnENODL58、BnENODL91 和BnSCL16 外,其他所有BnPC 都包含Motif 1,Motif 2/3/4/5 也存在于大部分BnPC 成員中,Motif 6/7/8/9 在Clade C 的成員中較為保守,部分PC成員的N端和C端包含Motif 10。
圖6 BnPC家族成員的模體組成和基因結(jié)構(gòu)分析Fig.6 Motif analysis and gene structure of the BnPC family members
順式作用元件在基因表達調(diào)控中起重要作用,基因啟動子區(qū)域包含的不同類型的順式調(diào)控元件可能介導基因在不同條件下表達。本研究利用PlantCARE 軟件對148 個BnPC基因的啟動子區(qū)域的順式元件進行了分析,結(jié)果發(fā)現(xiàn)了10種順式作用元件,主要可分為以下4 類:與植物生長發(fā)育、非生物脅迫應答、激素應答相關的元件,以及真核生物中的基本啟動子元件(如CAAT 盒和TATA 盒)。與生長發(fā)育相關的啟動子元件主要包括參與胚乳表達的GCN4 元件和AACA 元件;與分生組織表達相關的CAT元件;以及大量的光響應元件,如Box4、GBox 和TCT 元件(附表4,見首頁OSID 二維碼)。在BnPC啟動子中,與光反應有關的元件是最常見的元件,此外,本研究還鑒定到一些與赤霉素(gibberellin acid,GA)、生長素(auxin)、脫落酸(abscisic acid,ABA)、MeJA 和水楊酸(salicylic acid,SA)應答相關的順式元件,其中與ABA 應答相關的元件最為豐富,其次是與MeJA 反應相關的元件(表1,附表4,見首頁OSID 二維碼)。此外,在BnPC的啟動子區(qū)域還發(fā)現(xiàn)了許多與脅迫答應相關的元件,如低溫應答相關的低溫應答元件(low-temperature responsiveness,LTR)、干旱誘導的MYB 結(jié)合位點(MBS)、與創(chuàng)傷反應相關的創(chuàng)傷應答元件(wound-responsive element)和厭氧誘導所必需的厭氧調(diào)節(jié)元件(anaerobic induction)。這些結(jié)果表明BnPC可能在調(diào)節(jié)植物生長發(fā)育、對非生物脅迫的應答和激素應答中發(fā)揮作用。大多數(shù)BnPC基因的啟動子區(qū)具有不同類型順式元件,暗示這些BnPC基因可能參與多種生理過程和調(diào)控途徑。
表1 BnPC基因啟動子順式元件分析Table 1 Cis-acting elements of the promoter regions of BnPC genes
基于甘藍型油菜不同發(fā)育階段各組織器官的轉(zhuǎn)錄組測序數(shù)據(jù)對BnPC基因的時空表達模式進行分析(圖7A,各基因FPKM 值詳見附表5,首頁OSID二維碼),結(jié)果顯示,42 個BnPC基因在所有檢測的組織器官中均未表達或者表達水平極低(FPKM<0.5,圖7 中未顯示)。根據(jù)時空表達特點,BnPC基因大致可以分為四種類型。第一種類型在所有組織器官中表達水平均較低或未表達。第二種類型在幾乎所有組織器官中均有表達,且在各組織器官中的表達水平差別不明顯,如BnENODL32、BnENODL38、BnENODL42和BnENODL93。第三種類型在大多數(shù)組織中表達,但在特定組織中高表達,如BnUCL9、BnUCL13和BnUCL22。第四種類型基因的表達表現(xiàn)出很強的組織器官特異性:例如BnUCL6、BnUCL17和BnUCL20只在根(Root)中表達,而BnENOD31、BnENODL48、BnENODL55、BnENODL97和BnUCL23只在受精后24 d 的種子(Seed-24 DAP)和角果皮(Silique wall-24 DAP)中表達。此外,幾乎所有的BnUCL基因均在根中具有高水平的表達(除了BnUCL23),暗示著BnUCL亞家族成員可能在根的發(fā)育中起著重要作用,而BnPLCL3與BnUCL亞家族成員表現(xiàn)出非常相似的表達模式,這與上述系統(tǒng)發(fā)生分析的結(jié)果相符,BnPLCL3是由BnUCL亞家族成員進化而來,BnPLCL3與BnUCL亞家族成員在功能上可能也極為相似;而BnPC家族中其余的2 個BnPLCL基因BnPCLC1和BnPCLC2在各個組織中均有一定程度的表達。BnENODL亞家族的成員在甘藍型油菜不同組織器官中的表達呈現(xiàn)一定程度的分化,9 個成員(例如BnENODL21/70/37/18/63/7/52/6/51)在受精后14 d 的種子(Seed-14 DAP)中特異表達,9 個成員(例如BnENODL48/97/31/89/11/55/16/30/86)在受精后24 d 的種子(Seed-14 DAP)中表達水平較高,8 個成員(例如BnENODL28/73/59/3/5/14/20/69)在花苞(bud)中特異表達,說明BnENODL亞家族中的這些成員可能參與了甘藍型油菜花和幼嫩種子的發(fā)育過程。
為探究BnPC基因?qū)Ω鞣N非生物逆境脅迫的應答模式,本研究利用轉(zhuǎn)錄組數(shù)據(jù)分析了在干旱、鹽、冷和高溫處理條件下各BnPC基因的表達水平(圖7B,附表6,見首頁OSID 二維碼)。結(jié)果表明,95 個BnPC基因的表達水平在至少一種逆境處理前后發(fā)生變化,53 個基因在脅迫處理前后的表達水平?jīng)]有明顯變化。與組織器官表達數(shù)據(jù)對比發(fā)現(xiàn),前文所述的在各組織器官中未表達和弱表達的42 個BnPC基因中,除了4 個基因(BnENODL9、BnENODL62、BnENODL71和BnENODL91)在逆境處理后表達明顯上調(diào),其余38 個基因仍檢測不到表達,推測這38個基因可能在甘藍型油菜的進化過程中因為功能喪失而不表達,或由于表達部位非常特異而在本文使用的數(shù)據(jù)中沒有檢測到表達量。在95 個逆境處理條件下表達水平發(fā)生變化的基因中,在干旱處理條件下,有38個基因上調(diào)表達,48個基因下調(diào)表達;在鹽處理條件下,24 個基因表達量上升,59 個基因表達量下降;在冷處理條件下,25 個基因上調(diào)表達,58 個基因下調(diào)表達;在高溫處理條件下,40 個基因表達量上升,44 個基因表達量下降。這些結(jié)果表明,相當一部分BnPC基因?qū)Ψ巧锩{迫表現(xiàn)出明顯的響應,暗示著BnPC可能也廣泛參與甘藍型油菜對不利環(huán)境條件的適應。
圖7 BnPC基因的表達特征Fig.7 Expression profile of BnPC genes
PC基因作為古老的藍銅蛋白基因,可能與銅原子結(jié)合,在各種生物系統(tǒng)中起電子轉(zhuǎn)運的作用,如銅的轉(zhuǎn)運和植物光合作用,因此PC基因家族成員可能受到光誘導廣泛參與植物的生長發(fā)育[28]。在BnPC基因啟動子中,我們也發(fā)現(xiàn)了大量的光反應元件,表明PC基因可能對甘藍型油菜的生長發(fā)育有關鍵性作用。目前,植物中對PC基因家族的相關研究比較少,在油料作物甘藍型油菜中PC基因家族的綜合分析尚未見報道。本研究在甘藍型油菜中鑒定到173 個BnPC基因。根據(jù)銅配體殘基的特性、蛋白結(jié)構(gòu)組分的差異,將這些BnPC基因分為BnENOLD、BnUCL、BnSCL和BnPLCL4 個亞家族,其中BnENODL亞家族基因數(shù)量最多,BnUCL亞家族、BnSCL亞家族其次,BnPLCL亞家族基因數(shù)量最少,與之前在擬南芥[10]和水稻[9]中報道的結(jié)果類似。Bn-PC基因結(jié)構(gòu)的變化可能是由于在長期進化過程中內(nèi)含子/外顯子的增加或減少所致。基于BnPC 保守模體分析的結(jié)果,推測BnPC基因家族的功能分化可能是由類特異性和亞類特異性模體引起的。此外,在BnPC 的每個亞類中,相似的模體結(jié)構(gòu)、外顯子-內(nèi)含子結(jié)構(gòu)組成模式和氨基酸組成可能預示著進化過程中的基因復制事件。
甘藍型油菜是一種由白菜和甘藍自然雜交形成的異源四倍體植物[30]?;驈椭朴袃煞N主要機制,WGD/片段復制和串聯(lián)復制[40]。WGD/片段復制在植物基因組中很常見,許多植物在進化過程中經(jīng)歷了多倍化事件,因此在它們的基因組中保留了許多重復的染色體片段[41,42]。前人在擬南芥[10]、水稻(O.sativa)[9]、大豆(Glycine max)[4]、大白菜[28]、玉米[23]、蝴蝶蘭[29]、蒺藜苜蓿[4]和鐵皮石斛[43]中分別鑒定到38、62、90、84、60、30、82 和38 個PC基因,甘藍型油菜中PC家族基因的數(shù)量(173 個)遠遠多于上述植物物種中PC基因的數(shù)量,說明在甘藍型油菜進化過程中,基因組復制對BnPC基因的多樣性有很大貢獻。我們的結(jié)果表明,137 個BnPC基因是基因復制的結(jié)果,其中123 個來源于WGD 或片段復制,其余是分散復制的結(jié)果。串聯(lián)復制是另一種類型的基因復制,其特征是一個基因家族的多個成員存在于同一個或相鄰的基因間區(qū)域[40]。本研究發(fā)現(xiàn),4 個BnPC基因:BnSCL8、BnENODL81、BnENODL82和BnENODL83來源于這種復制方式。為了比較不同物種中PC基因家族擴張機制的異同,我們也分析了其他物種中PC基因家族成員的復制類型。水稻中20 個OsPC來源于片段復制,18個來源于串聯(lián)復制[9];玉米中14 個ZmPC來源于片段復制,8 個來源于串聯(lián)復制[23];而在蒺藜苜蓿中,40 個MtPC來源于串聯(lián)復制,其余32 個來源于其他復制方式[4]。在這些物種中,片段復制和串聯(lián)復制在PC基因家族擴張中均起著重要作用。有趣的是,擬南芥中有12 個AtPC來源于片段復制,僅有2個PC來源于串聯(lián)復制[10];白菜中63 個PC來源于片段復制,沒有PC基因來源于串聯(lián)復制[28]。與白菜和擬南芥中的情況類似,BnPC基因家族中僅有4個基因來源于串聯(lián)復制,這表明WGD/片段復制是BnPC基因家族擴張的主要動力,該現(xiàn)象是否在蕓薹屬甚至十字花科植物中普遍存在,還有待進一步研究。在人類基因組中,諸如轉(zhuǎn)座子插入和拷貝數(shù)變異等分散復制是非常常見的[44],但在植物中鮮有報道,已報道的植物物種中尚未發(fā)現(xiàn)有PC基因來源于這種復制方式。本研究發(fā)現(xiàn),有14 個BnPC基因來源于分散復制。在異源多倍體植物中,基因組的擴張通常伴隨著轉(zhuǎn)座子因子的插入[45,46]。蕓薹屬植物的轉(zhuǎn)座子也很豐富[46,47],然而,這些轉(zhuǎn)座子是否是PC基因家族擴張的原因之一還需要進一步的研究。
PC 蛋白成員主要包含下列4 個結(jié)構(gòu)域,結(jié)構(gòu)域I 包含內(nèi)質(zhì)網(wǎng)靶向信號肽,介導PC 進入分泌途徑。結(jié)構(gòu)域II 是一個保守的PLCD 結(jié)構(gòu)域,負責使PC 與銅氧化物結(jié)合,該結(jié)構(gòu)域包含天冬酰胺-X-蘇氨酸/絲氨酸(Asn-X-Thr/Ser)序列,提供潛在的N-糖基化位點,并進一步通過內(nèi)質(zhì)網(wǎng)分泌途徑促進蛋白分揀,所有的PC 都至少有一個PLCD 域;結(jié)構(gòu)域Ⅲ是一個類阿拉伯半乳聚糖蛋白域(arabinogalactan protein-like region,ALR)[4]。含有ALR 結(jié)構(gòu)域的PC 被認為是形成細胞壁的氧化還原活性成分,并參與防御反應[5]。結(jié)構(gòu)域IV 具有GAS的特征,能夠?qū)C錨定在細胞膜上[5]。根據(jù)結(jié)構(gòu)域組成,我們將BnPC 蛋白分成10 類(圖5),而在蒺藜苜蓿[4]和大白菜[28]中,分為9類。在甘藍型油菜中,我們比蒺藜苜蓿[4]多鑒定到Type VI 和Type X 成員,但并未鑒定到SPPLCD-PLCD-ALR-GAS 結(jié)構(gòu)域形式組成的成員;與大白菜相比,我們多鑒定到Type VIII、Type IX 和Type X,但并未鑒定到PLCD-PLCD 和PLCD-GAS結(jié)構(gòu)域組成形式的成員。而甘藍型油菜由白菜和甘藍自然雜交形成[30],我們推測在甘藍型油菜起源過程中,PLCD-PLCD 和PLCD-GAS 結(jié)構(gòu)域組成的成員可能發(fā)生了丟失,而Type VIII、Type IX 和Type X 的成員可能在進化過程中由Type III、Type IV 和Type V成員丟失結(jié)構(gòu)域I進而演化而來。
BnPLCL是成員最少的亞家族,在甘藍型油菜中僅有3 個成員,其中BnPLCL3僅在根中微弱表達而BnPLCL1和BnPLCL2在所有組織中均表達,推測這兩個基因?qū)χ仓甑恼0l(fā)育可能極為重要。幾乎所有的BnUCL基因均在根中具有較高水平的表達量(除了BnUCL23),特別是BnUCL3和BnUCL16在其它組織中微弱表達或者不表達,但在根中的表達量非常高,暗示BnUCL亞家族成員可能在根的發(fā)育中起著重要作用;除此之外,BnUCL3/10/13/21/22在14 d、24 d和34 d角果皮中均高表達,而在其它組織中幾乎不表達,說明這5 個基因可能在角果發(fā)育中發(fā)揮重要作用。SCL基因表達水平普遍較低,主要在根和莖中表達,有趣的是,BnSCL2基因是BnPC基因中在花苞中表達水平最高的基因,遠超其它基因,且這個基因的表達受非生物脅迫影響不明顯,推測這個基因在花苞中的功能可能非常重要且穩(wěn)定。前人的研究結(jié)果表明BnENODL基因在根中高表達,參與了豆科植物的結(jié)瘤[4,14,15],與前人研究結(jié)果相似,我們發(fā)現(xiàn)大部分BnENODL基因也均在根中高表達,表明BnENODL基因在根中的功能可能十分關鍵。某些BnENODL基因在部分組織器官中特異性高表達,比如BnENODL21/37和BnENODL31/48/55/97分別在受精后14 d 和24 d 的種子中高表達,這些基因可能在種子發(fā)育過程中發(fā)揮重要功能。
本研究結(jié)果對甘藍型油菜BnPC基因家族在全基因組水平上進行了系統(tǒng)分析,鑒定出173 個BnPC成員,并對它們的染色體分布情況、序列特征、系統(tǒng)發(fā)生關系、啟動子順式元件組成以及時空表達模式和逆境響應情況進行了分析,為深入研究甘藍型油菜BnPC 蛋白功能和挖掘該家族中有利于甘藍型油菜遺傳改良的基因資源提供了一定的理論依據(jù)。