丁洪艷馮曉溪汪柏宇張積森,*
1廣西大學(xué)農(nóng)學(xué)院, 廣西南寧 530004;2廣西大學(xué)亞熱帶農(nóng)業(yè)生物資源保護(hù)與利用國家重點(diǎn)實(shí)驗(yàn)室, 廣西南寧 530004;3福建農(nóng)林大學(xué)農(nóng)學(xué)院, 福建福州 350002
植物類受體蛋白激酶(receptor-like protein kinases, RLK)是一種類似于動物受體蛋白激酶(receptor protein kinases, RPK)的絲氨酸/蘇氨酸蛋白激酶, 在信號轉(zhuǎn)導(dǎo)方面與動物十分相似。RLKs參與了植物各種各樣的生物過程, 包括植物生長發(fā)育調(diào)控、激素感知、病害防御及自交不親和性識別等[1]。RLK基因家族是植物基因家族中的一類超家族, 具有數(shù)量非常龐大的家族成員, 在擬南芥中至少有610個RLK基因[2], 水稻大約有1132個RLK基因[3]。RLK基因家族編碼植物中一種非常重要的細(xì)胞識別受體, 在細(xì)胞信號轉(zhuǎn)導(dǎo)過程中發(fā)揮著重要作用, 它是一種跨膜蛋白, 具有特定的氨基末端胞外結(jié)構(gòu)域和羧基末端胞內(nèi)結(jié)構(gòu)域, 這些結(jié)構(gòu)域涉及廣泛的信號轉(zhuǎn)導(dǎo)途徑[4]。大多數(shù)RLK基因定位于細(xì)胞質(zhì)膜, 也有一些既不具有胞外結(jié)構(gòu)域, 也不具有跨膜結(jié)構(gòu)域的成員, 定位于細(xì)胞質(zhì)中, 被稱為細(xì)胞質(zhì)受體樣激酶(receptor-like cytoplasmic kinase,RLCK)。根據(jù)RLK胞外結(jié)構(gòu)域和胞內(nèi)激酶結(jié)構(gòu)域的特征可以將RLK家族分為幾十種亞家族, 其中富含亮氨酸重復(fù)序列(leucine-rich repeat, LRR)結(jié)構(gòu)域的LRR-RLK家族是其最大的亞家族, 擬南芥中含有225個該亞家族的成員, 可以再將其分為15個亞家族(LRR I-LRR XV)[5]。
LRR-RLK基因功能的研究表明, 它們有2個主要功能: 防御病原體和參與植物生長發(fā)育[6-7]。擬南芥中LRR-RLK基因家族的CLV1和BAK1在植物生長發(fā)育中發(fā)揮著重要作用, 其中CLV1具有抑制細(xì)胞增長的作用, 它通過介導(dǎo)CLAVATA信號通路與CLV2形成異二聚體, 然后通過胞外結(jié)構(gòu)域與CLV3相互作用, 從而控制頂端分生組織細(xì)胞的大小[8];LRR-RLK基因大部分成員參與植物抵御外界的生物脅迫和非生物脅迫, 例如FLS2和EFR介導(dǎo)植物對細(xì)菌病原體的抗性[9-10]; 屬于RLK超家族的LRR的亞家族II的基因BAK1, 通過與油菜素內(nèi)酯受體BRI1體內(nèi)體外相互作用而參與植物的生長發(fā)育調(diào)節(jié), 并且通過與FLS2相互作用參與病害防御[11-12]。新發(fā)現(xiàn)的植物另一種病毒防御機(jī)制依賴于跨膜免疫受體核穿梭蛋白(nuclear shuttle protein, NSP)-相互作用激酶1 (NSP-interacting kinase 1, NIK1)介導(dǎo)的宿主翻譯抑制,NIK1在防御病毒侵染表現(xiàn)出的活性,被認(rèn)為是雙生病毒NSPs的毒力靶標(biāo), 它在病毒侵染期間與雙生病毒的核穿梭蛋白相互作用[13-14]。擬南芥中NIK的3個旁系同源基因(AtNIK1、AtNIK2、AtNIK3)也有報(bào)道與NSP相互作用, 參與病毒防御[15-16], NIK結(jié)構(gòu)類似于SERK, NIK基因和SERK基因都是LRRII-RLK亞家族的成員。
甘蔗(Saccharumspp.)是經(jīng)濟(jì)上非常重要的生物能源作物和糖料作物, 主要分布在熱帶和亞熱帶地區(qū)[17]?,F(xiàn)代甘蔗栽培品種主要是異源多倍體和種間雜交種, 是由含糖量高的熱帶種(Saccharum officinarum)和抗逆性強(qiáng)的割手密種(Saccharum spontaneum)雜交, 并經(jīng)過多次與熱帶種回交或相互雜交而來。與其他作物相比, 甘蔗的遺傳背景十分復(fù)雜且基因組龐大, 所以甘蔗在遺傳學(xué)方面的研究一直很遲緩, 直至2018年甘蔗割手密種AP85-441基因組的首次破譯, 而使得甘蔗基礎(chǔ)生物學(xué)的研究又跨越一個新的臺階[18]。本研究通過與擬南芥的LRRII-RLK 基因進(jìn)行比較, 在割手密種中對LRRII-RLK基因進(jìn)行了鑒定和分類。同時(shí), 通過比較基因組和比較轉(zhuǎn)錄組的方法對甘蔗LRRII-RLK基因家族的演化、基因結(jié)構(gòu)和表達(dá)模式等進(jìn)行了分析。研究結(jié)果為進(jìn)一步揭示甘蔗LRRII-RLK基因家族在植物生長發(fā)育和病毒防御過程中的功能奠定了基礎(chǔ)。
本研究所使用的甘蔗材料分別為甘蔗割手密種SES 208 (2n=8x=64), 和以SES 208花藥離體培養(yǎng)產(chǎn)生的四倍體材料AP85-441 (2n=4x=32), 種植于福建農(nóng)林大學(xué)金山校區(qū)中華園溫室試驗(yàn)基地; 還有對梢腐病(pokkah boeng disease, PBD)高度敏感的甘蔗現(xiàn)代栽培品種中蔗1號(Zhongzhe 1, ZZ1)和對甘蔗花葉病(Sugarcane mosaic disease)高度易感的熱帶種拔地拉(Badila), 種植于廣西大學(xué)扶綏試驗(yàn)基地。
甘蔗割手密種AP85-441基因組相關(guān)數(shù)據(jù)通過在線數(shù)據(jù)庫(http://sugarcane.zhangjisenlab.cn/sgd/html/index.html)獲得。從擬南芥(Arabidopsis thaliana)在線信息資源庫TAIR (http://www.arabidopsis.org/)下載14個擬南芥LRRII-RLK基因的蛋白序列[5]。以這14個蛋白序列為查詢序列, 利用Blastp軟件, 檢索本地甘蔗割手密種數(shù)據(jù)庫中LRRII-RLK蛋白, 獲得LRRII-RLK亞家族的候選基因。再通過在線工具SMART (http://smart.emblheidelberg.de/)和NCBI CD-search (https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)對候選基因蛋白的保守結(jié)構(gòu)域進(jìn)行預(yù)測,并從中進(jìn)一步篩選出有擬南芥LRRII-RLK相同蛋白結(jié)構(gòu)域的基因, 再通過TMHMM網(wǎng)站(http://www.cbs.dtu.dk/services/TMHMM/)預(yù)測它們的跨膜結(jié)構(gòu)域[19], 確保上述候選基因同時(shí)含有胞外LRR結(jié)構(gòu)域、跨膜區(qū)和胞內(nèi)絲氨酸/蘇氨酸激酶結(jié)構(gòu)域。將通過上述方法確定的SsLRRII-RLK基因候選成員與擬南芥的225個LRR-RLK基因家族成員使用Fastree軟件構(gòu)建系統(tǒng)發(fā)育樹[20], 將其中與擬南芥LRRII-RLK聚類在同一分支的基因確定為甘蔗割手密種LRRII-RLK家族的成員。從植物基因組網(wǎng)站 Phytozome (https://phytozome.jgi.doe.gov/)和EnsemblPlant (http://plants.ensembl.org/index.html)數(shù)據(jù)庫分別下載的高粱和水稻的蛋白序列, 以同樣的鑒定方法獲得它們的LRRII-RLK基因家族成員。通過與高粱同源蛋白序列比較, 篩選出不同SsLRRII-RLK等位基因的代表性基因, 根據(jù)其在染色體上的物理位置, 將16個具有代表性的SsLRRIIRLK基因從SsLRRII-RLK1命名至SsLRRII-RLK16,將其確定為甘蔗割手密種LRRII-RLK家族的單倍型基因, 隨后用數(shù)字補(bǔ)充等位基因名稱, 等位基因ID中末尾是P或T的基因, 不視為等位基因, 命名時(shí)將其重新編號, 高粱的LRRII-RLK基因家族成員也采用相同的命名方法命名[21]。利用ExPASy7的在線工具ProtParam (https://web.expasy.org/protparam/)對鑒定到的甘蔗LRRII-RLK基因的理化性質(zhì)進(jìn)行了預(yù)測。
將鑒定得到的甘蔗割手密種LRRII-RLK基因序列與擬南芥、水稻和高粱的蛋白序列利用MAFFT軟件[22]進(jìn)行比對, 采用默認(rèn)參數(shù)。最大似然(ML)樹由FastTree構(gòu)建, 根據(jù)擬南芥分類標(biāo)準(zhǔn)對家族成員進(jìn)行分類。將已報(bào)道的薔薇科的草莓(Fragaria ananassa)、蘋果(Malus domestica)、中國白梨(Pyrus bretschneideri)、梅(Prunus mume)、桃子(Prunus persica)[23], 柑橘屬的克萊門柚(Citrus clementina)和甜橙(Citrus maxima)[24], 以及棉花(Gossypium hirsutum)[25]、蘿卜(Raphanus sativusL.)[26]、番茄(Solanum lycopersicum)[27]、馬鈴薯(Solanum tuberosum)[28]、黃瓜(Cucumis sativus)[29]等物種的LRRII-RLK成員的基因序列, 通過在線數(shù)據(jù)庫網(wǎng)站(http://www.timetree.org/)構(gòu)建LRRII-RLK基因的系統(tǒng)發(fā)育樹。利用在線網(wǎng)站GSDS 2.0 (http://gsds.gao-lab.org/)繪制甘蔗割手密種LRRII-RLK基因內(nèi)含子-外顯子結(jié)構(gòu)的示意圖, 每個基因結(jié)構(gòu)都是根據(jù)系統(tǒng)發(fā)育樹位置排列的[30]。利用在線軟件MEME Version 5.4.1(http://meme-suite.org/tools/meme)對這些基因的蛋白序列進(jìn)行保守基序分析, 基序數(shù)量設(shè)置為10, 其他參數(shù)默認(rèn)[31]。提取LRRII-RLK基因上游2000 bp啟動子序列, 使用在線網(wǎng)站PlantCARE (http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)預(yù)測啟動子中的順式作用元件, 只保留了典型的和功能性的順式元件, 過濾掉了大多數(shù)基因中普遍存在的順式作用元件, 例如CAAT-box、TATA-box、TATC-box等。
根據(jù)甘蔗的基因組注釋信息獲得LRRII-RLK基因的染色體位置信息, 利用Blastp軟件和MCScanX軟件進(jìn)行基因共線性分析[32], 最后使用circos v 0.69-8軟件對染色體定位和種內(nèi)共線性基因?qū)M(jìn)行可視化[33]。運(yùn)用JCVI軟件[34]對甘蔗和高粱種間共線性進(jìn)行分析和可視化, 通過 KaKs_Calculator Version 2.0軟件計(jì)算甘蔗割手密種LRRII-RLK基因家族與高粱SbLRRII-RLK基因之間的Ka/Ks值[35],分歧時(shí)間(T)通過公式T = Ks/(2×6.5×10-9)×10-6計(jì)算得出[36]。
本研究基于本實(shí)驗(yàn)室和合作實(shí)驗(yàn)室現(xiàn)有的甘蔗不同發(fā)育組織、葉片梯度、晝夜節(jié)律和不同病害侵染葉片的轉(zhuǎn)錄組數(shù)據(jù)來探究SsLRRII-RLK基因在甘蔗中的表達(dá)模式。其中不同發(fā)育組織的轉(zhuǎn)錄組數(shù)據(jù)的材料使用SES 208苗期(35 d齡)、成熟前期(9個月齡)和成熟期(12個月齡)的葉和莖[37], 葉片發(fā)育梯度轉(zhuǎn)錄組材料來源于11 d齡的SES 208的卷葉, 晝夜節(jié)律轉(zhuǎn)錄組數(shù)據(jù)的材料使用19個時(shí)間點(diǎn)(從第1天凌晨06:00到第2天凌晨04:00間隔2 h取一次樣,從第2天凌晨06:00到第3天凌晨06:00間隔4 h取一次樣)的SES 208的成熟期+1葉片[38]。再結(jié)合本課題組現(xiàn)有的梢腐病脅迫下的中蔗1號和甘蔗花葉病脅迫下的拔地拉2種葉片轉(zhuǎn)錄組數(shù)據(jù), 分析SsLRRII-RLK基因在病害脅迫下的表達(dá)模式。梢腐病脅迫下中蔗1號的轉(zhuǎn)錄組所用葉片材料中, 根據(jù)葉片染病的嚴(yán)重程度, 將其分為0~5級, 采集輕度病葉(1級或2級)和重度病葉(4級或5級), 還有健康葉片作為對照(CK); 在花葉病侵染試驗(yàn)中, 采用無病毒組織培養(yǎng)的拔地拉作為侵染對象, 在侵染后1個月后采集其+1葉, 以未脫毒的健康拔地拉+1葉片作為對照。以上轉(zhuǎn)錄組所用材料均設(shè)3個生物學(xué)重復(fù)。
使用TRIzol (Invitrogen)試劑分別提取甘蔗割手密種SES 208晝夜節(jié)律中間隔4 h不同時(shí)間點(diǎn)材料的總RNA, 使用反轉(zhuǎn)錄試劑盒StarScript II First-strand cDNA Synthesis Kit With gDNA Remover (A222-10,Genstar)合成cDNA。引物設(shè)計(jì)、qRT-PCR反應(yīng)程序和使用儀器參考Li等[39], 引物名稱及序列詳見表1,使用 2-ΔΔCt法計(jì)算相關(guān)基因的相對表達(dá)量[40], 以GAPDH作為內(nèi)參基因[41], 使用Graphpad prism 9.0軟件繪圖[42]。
表1 qPCR引物序列Table 1 Primers for qPCR study
通過Blastp軟件比對, 再經(jīng)過NCBI-CDD數(shù)據(jù)庫和SMART在線程序的篩選, 最終在割手密種基因組中鑒定到27個LRRII-RLK基因, 同時(shí)分別在高粱和水稻中鑒定到15個和12個LRRII-RLK基因。由于甘蔗的同源多倍體特性, 鑒定得到的SsLRRIIRLK基因具有多個等位基因, 這些SsLRRII-RLK基因總的有1~3個等位基因, 其中3個SsLRRII-RLK成員有3個等位基因, 5個SsLRRII-RLK成員有2個等位基因。
根據(jù)蛋白質(zhì)一級結(jié)構(gòu)預(yù)測結(jié)果顯示, 甘蔗割手密種LRRII-RLK氨基酸長度在336~982之間, 等電點(diǎn)在5.13~10.63之間, 分子量在37.00~105.55 kD之間, 蛋白質(zhì)不穩(wěn)定系數(shù)在26.89~46.82之間, 平均親疏水性在-0.382~0.105之間(表2)。根據(jù)不穩(wěn)定系數(shù)小于40為穩(wěn)定蛋白、等電點(diǎn)小于7為酸性蛋白的規(guī)則, 推測甘蔗割手密種LRRII-RLK基因家族中, 有16個基因?yàn)榉€(wěn)定的酸性蛋白, 9個為不穩(wěn)定的堿性蛋白, 2個為穩(wěn)定的堿性蛋白。
表2 甘蔗割手密種LRRII-RLK家族基因和編碼蛋白基本信息Table 2 Information of LRRII-RLK gene family inSaccharum spontaneum
(續(xù)表2)
將27個甘蔗、15個高粱和12個水稻的LRRIIRLK基因與14個擬南芥LRRII-RLK基因的蛋白序列進(jìn)行比對, 構(gòu)建ML系統(tǒng)發(fā)育樹。結(jié)果表明, 甘蔗割手密種、水稻、高粱和擬南芥中LRRII-RLK基因的蛋白存在于所有簇中(圖1), 根據(jù)擬南芥成員的聚類, 將這些分支分為NIK、SERK和LRRII-C 3個分支, NIK分支分別由11個甘蔗、9個高粱、6個水稻和6個擬南芥成員組成, 4個物種的LRRII-RLK基因在這個分支最多。SERK分支中將擬南芥5個SERK基因和7個甘蔗、4個高粱、3個水稻的LRRII-RLK基因聚集在一起。LRRII-C分支由9個甘蔗、2個高粱、3個水稻和3個擬南芥未知功能的LRRIIRLK基因組成。值得注意的是, 在NIK和SERK分支中, 甘蔗的LRRII-RLK單倍型基因數(shù)量與高粱中的一致, 而在LRRII-C分支中, 甘蔗的單倍型LRRII-RLK基因數(shù)量比高粱中的多了3倍, 這表明LRRII-C分支中的LRRII-RLK基因在甘蔗中出現(xiàn)了擴(kuò)增。
圖1 甘蔗(Ss)、擬南芥(AT)、水稻(Os)和高粱(Sb) LRRII-RLK蛋白的系統(tǒng)進(jìn)化樹Fig. 1 Phylogenetic tree of LRRII-RLKs informSaccharum spontaneum(Ss) and presentative species includingArabidopsis thaliana(AT),Oryza sativa(Os), andSorghum bicolor(Sb)
LRRII-RLK基因家族在植物中分布十分廣泛,為了深入了解LRRII-RLK家族基因的系統(tǒng)發(fā)育關(guān)系,我們篩選了代表8個科的17個代表性物種, 構(gòu)建了一個物種系統(tǒng)發(fā)育樹, 包括禾本科、十字花科、薔薇科、茄科等。由圖2可知, LRRII-RLK基因在高等植物中的顯著擴(kuò)增和分化時(shí)間大約在120 Mya年之后,也就是白堊紀(jì)時(shí)期, 并且與其他禾本科物種相比,甘蔗擁有更多的LRRII-RLK基因, 可能是由于甘蔗同源多倍體的性質(zhì)。當(dāng)校正倍性水平后, 割手密種中SsLRRII-RLK基因的數(shù)量仍然高于大多數(shù)物種, 包括擬南芥和其他禾本科作物。與其他2種禾本科作物相比, 甘蔗和高粱的分化時(shí)間最晚, 由此也可以看出甘蔗和高粱的親緣關(guān)系更近。
圖2 17種植物的LRRII-RLK蛋白系統(tǒng)發(fā)育關(guān)系Fig. 2 Phylogenetic relationships of LRRII-RLK proteins in 17 plant species樹的底部顯示了時(shí)間Mya (百萬年前)的標(biāo)尺。17種植物包括: 甘蔗割手密種(Saccharum spontaneum)、水稻(Oryza sativa)、二穗短柄草(Brachypodium distachyon)、高粱(Sorghum bicolor)、馬鈴薯(Solanum tuberosum)、番茄(Solanum lycopersicum)、陸地棉(Gossypium hirsutum)、擬南芥(Arabidopsis thaliana)、蘿卜(Raphanus sativus)、甜橙(Citrus sinensis)、柑橘(Citrus clementina)、黃瓜(Cucumis sativus)、草莓(Fragaria vesca)、梨(Pyrus bretschneideri)、蘋果(Malus domestica)、梅(Prunus mume)、桃(Prunus persica)。Linear scale Time Mya (millions of years ago) was shown at the tree’s bottom. Seventeen plants includingSaccharum spontaneum,Oryza sativa,Brachypodium distachyon,Sorghum bicolor,Solanum tuberosum,Solanum lycopersicum,Gossypium hirsutum,Arabidopsis thaliana,Raphanus sativus,Citrus sinensis,Citrus clementina,Cucumis sativus,Fragaria vesca,Pyrus bretschneideri,Malus domestica,Prunus mume,andPrunus persica.
基因結(jié)構(gòu)的多樣性可能是基因家族進(jìn)化的證據(jù)之一。本研究在甘蔗割手密種中預(yù)測了所有SsLRRII-RLK基因的外顯子-內(nèi)含子和保守基序。由圖 3可知, 甘蔗割手密種LRRII-RLK基因外顯子和內(nèi)含子數(shù)量分別為2~12和1~11。在SERK和LRRII-C 2個分支中, 大多數(shù)LRRII-RLK基因包含8~11個外顯子, 而且等位基因之間的基因結(jié)構(gòu)都非常相似, 而在NIK分支中, LRRII-RLK基因的結(jié)構(gòu)多樣性更高, 例如SsLRRII-RLK2和SsLRRIIRLK162個基因都有一個等位基因的基因結(jié)構(gòu)可能產(chǎn)生變異, 但是其他基因大多也是包含8~11個外顯子, 說明LRRII-RLK基因家族在進(jìn)化過程中也是比較保守的。
根據(jù)對全部割手密種LRRII-RLK基因蛋白序列的保守基序分析(圖3), 共鑒定出10個保守基序,并根據(jù)每個基序的E值指定為基序1~10, 其中最為保守的是基序2和基序4, 它們在27個割手密種的LRRII-RLK基因中都存在。基序1和基序7分別只在2個和3個SsLRRII-RLK基因中沒有發(fā)現(xiàn), 且在甘蔗割手密種LRRII-RLK家族的3個主要分支中都尚未發(fā)現(xiàn)特異的保守基序。
圖3
圖3 甘蔗割手密種LRRII-RLK基因家族蛋白保守基序和基因結(jié)構(gòu)分析Fig. 3 Analysis of conserved motifs and gene structure of LRRII-RLK gene family inSaccharum spontaneumA: SsLRRII-RLK基因結(jié)構(gòu)分析, 不同顏色方框表示不同的基因結(jié)構(gòu), 黑線表示內(nèi)含子。B: SsLRRII-RLK蛋白保守基序分析, 不同顏色方框表示不同保守基序, 黑線表示氨基酸序列。A: SsLRRII-RLK genes structure analysis, different colored boxes indicate different gene structures, black lines indicate introns. B:SsLRRII-RLK proteins conserved motif analysis, different colored boxes indicate different conserved motifs, and black lines indicate amino acid sequences.
啟動子區(qū)的順式作用元件對基因的轉(zhuǎn)錄和表達(dá)起著至關(guān)重要的控制作用, 因此對基因啟動子順式作用元件分析可以加深對基因功能的理解。順式元件分析結(jié)果顯示, 甘蔗割手密種LRRII-RLK基因啟動子的基序涉及到其多種生物過程(圖4)。這些不同的順式調(diào)節(jié)元件在功能上可分為四大類: 響應(yīng)光反應(yīng)、響應(yīng)激素反應(yīng)、響應(yīng)脅迫反應(yīng)和植物生長代謝。第1類是光響應(yīng)元件, 絕大多數(shù)的SsLRRII-RLK基因都包含有光響應(yīng)元件, 例如, 保守的G-box廣泛存在于基因的上游序列中。第2類是激素響應(yīng)元件,在所有的激素響應(yīng)元件中, 參與茉莉酸甲酯和脫落酸反應(yīng)的元件在SsLRRII-RLK基因中占比較高, 其中26個基因啟動子富含參與茉莉酸甲酯反應(yīng)的調(diào)控元件CGTCA基序和TGACG基序, 21個基因啟動子富含參與脫落酸反應(yīng)的調(diào)控元件ABRE。根據(jù)預(yù)測結(jié)果, 這些SsLRRII-RLK基因可能調(diào)控植物中的MeJA和ABA信號, 并在植物防御和葉片脫落中發(fā)揮作用。第3類是參與脅迫響應(yīng)的元件, SsLRRIIRLK基因在缺氧誘導(dǎo)和干旱誘導(dǎo)中所占比例較高,包含著部分低溫反應(yīng)元件(LTR)、防御和應(yīng)激反應(yīng)元件(TC-rich repeats), 表明SsLRRII-RLK基因可能參與脅迫響應(yīng)的調(diào)控。第4類是響應(yīng)植物生長代謝的元件, 如胚乳表達(dá)元件(GCN4-motif)、分生組織表達(dá)元件(CAT-box)、種子特異性調(diào)節(jié)元件(RY-element)等等, 除了這四大類元件, 還包含了一些最常見的啟動子元件。
圖4 甘蔗割手密種LRRII-RLK基因順式元件分析Fig. 4Cis-elements analysis of LRRII-RLK genes inSaccharum spontaneum
基因復(fù)制是基因組一個十分顯著的特征, 多項(xiàng)研究表明, 基因家族是由于全基因組復(fù)制、片段復(fù)制或串聯(lián)復(fù)制進(jìn)行進(jìn)化的, 在這些復(fù)制事件之后,基因發(fā)生了多樣化[43]。割手密種是同源多倍體, 是由8個同源染色體組組成, 每個染色體組有4個成員。本研究通過共線性分析估計(jì)了割手密種基因組中基因復(fù)制事件, 如圖5所示, 27個SsLRRII-RLK基因只分布在17條染色體上, 在2號同源染色體組上不包含任何SsLRRII-RLK基因, 而4A、4D、6A和6B四條染色體上的SsLRRII- RLK基因最多, 都有3~4個成員。共線性分析結(jié)果顯示在割手密種SsLRRII-RLK基因家族中總共有35對共線性對, 包括24對等位基因共線性對和11對非等位基因共線性對, 其中一半以上的共線性對主要集中在4號和6號同源染色體組。分別都只有1個(3.70%) SsLRRIIRLK基因來源于分散復(fù)制、鄰近復(fù)制或串聯(lián)復(fù)制, 24個(88.89%) SsLRRII-RLK基因被鑒定來自于片段復(fù)制。由以上結(jié)果可知甘蔗割手密種LRRII-RLK基因主要是以基因復(fù)制的方式進(jìn)行擴(kuò)增, 且主要以片段復(fù)制的方式擴(kuò)增。
圖5 SsLRRII-RLK基因在染色體上的分布及共線性關(guān)系Fig. 5 Distribution and syntenic analysis ofSsLRRII-RLKgenes inSaccharum spontaneum內(nèi)部連線表示甘蔗割手密種LRRII-RLK基因家族間的共線性。The internal line indicates the collinearity within SsLRRII-RLK genes.
為進(jìn)一步研究甘蔗割手密種LRRII-RLK基因家族的進(jìn)化機(jī)制, 本研究還構(gòu)建了割手密種與高粱的比較共線性圖。由圖6可知, 在割手密種和高粱LRRII-RLK基因之間鑒定出17對共線性對, 本研究還發(fā)現(xiàn)高粱中一個基因?qū)?yīng)多個甘蔗割手密種基因的現(xiàn)象。本研究通過計(jì)算甘蔗和高粱直系同源基因?qū)Ψ峭x和同義位點(diǎn)的替換率比率(Ka/Ks)來了解甘蔗LRRII-RLK基因的選擇壓力(圖7)。甘蔗與高粱的同源對之間所有的Ka/Ks均小于1, 表明甘蔗與高粱在分化的時(shí)候可能經(jīng)歷了嚴(yán)格的純化選擇作用[44]。根據(jù)成對的Ks值估計(jì)了SsLRRII-RLK與其同源基因SbLRRII-RLK之間的分化時(shí)間, 在所有甘蔗和高粱的LRRII-RLK直系同源基因?qū)χ? 有4對的分歧時(shí)間在8.037~21.633 Mya之間, 有10對的分歧時(shí)間在2.874~7.416 Mya之間, 短于甘蔗和高粱的分歧時(shí)間(7.779 Mya)[38](表3)。
圖6 甘蔗與高粱物種間的共線性分析Fig. 6 Synteny analysis betweenSaccharum spontaneumandSorghum bicolorspecies灰線表示2個物種基因組間的共線性區(qū)塊, 紅線表示2個物種間LRRII-RLK的共線基因?qū)?。The grey lines in the background indicate the collinear blocks within two genomes. The red lines indicate the LRRII-RLK syntenic gene pairs.
圖7 甘蔗和高粱中同源LRRII-RLK基因?qū)a/Ks值分析Fig. 7 Ka/Ks value distribution of all LRRII-RLK orthologous gene pairs betweenSaccharum spontaneumandSorghum bicolor*、**分別表示在0.05和0.01概率水平差異顯著。* and ** mean significant difference at the 0.05 and 0.01 probability levels, respectively.
表3 甘蔗和高粱LRRII-RLK基因、Ks信息和基因分歧時(shí)間Table 3 Divergence time based on Ks estimation for the orthologous genes of LRRII-RLK fromSorghum bicolorandSaccharum spontaneum
為探究甘蔗LRRII-RLK基因在時(shí)間和空間的表達(dá)模式, 本研究使用甘蔗割手密種SES 208不同組織、葉片發(fā)育梯度和晝夜節(jié)律的轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行表達(dá)分析。由圖8可知, 在甘蔗不同發(fā)育階段(苗期、成熟前期、成熟期)的組織中, SsLRRII-RLK基因在莖和葉中表達(dá)模式主要分為3種, 第1種是在甘蔗的不同發(fā)育階段, 15個SsLRRII-RLK基因在甘蔗莖和葉中都呈現(xiàn)顯著低表達(dá)或者不表達(dá)的模式, 比較典型的有SsLRRII-RLK2、SsLRRII-RLK3、SsLRRIIRLK6、SsLRRII-RLK7等。第2種是在甘蔗的3個不同發(fā)育階段, 5個SsLRRII-RLK基因在甘蔗的葉中表達(dá)高于莖, 尤其是SsLRRII-RLK4、SsLRRII-RLK4-2和SsLRRII-RLK14, 說明這些基因可能在葉組織中發(fā)揮的作用更甚于在莖中。第3種是在甘蔗的3個不同發(fā)育階段, 7個SsLRRII-RLK基因在甘蔗的莖中表達(dá)高于葉, 比較典型的有SsLRRII-RLK1、SsLRRII-RLK3-2、SsLRRII-RLK9和SsLRRII-RLK9-3,表示這些基因更有可能在莖的生長發(fā)育中發(fā)揮作用。在不同發(fā)育梯度的葉片中, 大多數(shù)SsLRRIIRLK基因不表達(dá), 表明這些基因在甘蔗葉片發(fā)育過程發(fā)揮非常有限的作用, 但是有8個SsLRRII-RLK基因在15個葉段中高表達(dá), 例如SsLRRII-RLK3-2、SsLRRII-RLK4-2、SsLRRII-RLK9-3等, 說明這些基因在葉片發(fā)育中發(fā)揮著一定的作用。
圖8 SsLRRII-RLK基因在甘蔗不同組織, 葉片發(fā)育梯度和晝夜節(jié)律中的表達(dá)Fig. 8 Relative expression profiles of SsLRRII-RLK genes in different tissues, leaf gradients, and day-night rhythms in sugarcaneSd: 苗期; PM: 成熟前期; M: 成熟期; SL: 苗期葉; SS: 苗期莖; LR: 卷葉; LF: 正葉; BZ: 基部區(qū); TZ: 過渡區(qū); MZ1: 成熟區(qū)1; MZ2:成熟區(qū)2。Sd: seedling stage; PM: pre-mature; M: mature; SL: seeding leaf; SS: seeding stem; LR: leaf roll; LF: leaf; BZ: basal zone; TZ: translational zone; MZ1: maturing zone 1; MZ2: maturing zone 2.
在晝夜不同時(shí)間段中, 僅僅有幾個SsLRRIIRLK基因在晝夜不同時(shí)間段中表達(dá), 例如SsLRRIIRLK1、SsLRRII-RLK4-2、SsLRRII-RLK9-3、SsLRRIIRLK11-2這幾個基因在黑夜和白天的不同時(shí)間段差異表達(dá), 其中SsLRRII-RLK14在每周期的凌晨06:00的表達(dá)量達(dá)到最高, 且在黑夜中的表達(dá)略高于白天,說明這個基因可能參與了甘蔗葉片的光合作用過程。為了驗(yàn)證RNA-seq數(shù)據(jù)的可靠性, 本研究選取了6個在甘蔗晝夜節(jié)律每間隔4 h的樣品中FPKM值較高的SsLRRII-RLK基因進(jìn)行qPCR分析(圖9)。表明qPCR表達(dá)模式與RNA-Seq數(shù)據(jù)集一致。
圖9 SsLRRII-RLK基因表達(dá)模式的qRT-PCR驗(yàn)證Fig. 9 Verification for the relative expression pattern of SsLRRII-RLKs genes by qRT-PCR
甘蔗梢腐病是一種由真菌病原體引起的破壞力最強(qiáng)的病害, 它會導(dǎo)致甘蔗的頂部腐爛, 進(jìn)而使其頂部死亡[45-47]。由圖10可知, 3個SsLRRII-RLK基因的表達(dá)與甘蔗梢腐病的感染有關(guān), 其中SsLRRIIRLK4和它的等位基因SsLRRII-RLK4-2具有十分相似的表達(dá)模式, 其表達(dá)量從甘蔗健康葉片到發(fā)病輕微的葉片顯著降低, 而后在發(fā)病嚴(yán)重的葉片中又重新升高, 而SsLRRII-RLK1則是隨著梢腐病的病害逐漸嚴(yán)重而表達(dá)量逐漸下降。說明在甘蔗受到甘蔗梢腐病病原菌感染一定程度時(shí), 它們積極參與到甘蔗對病害脅迫的應(yīng)激反應(yīng)和防御反應(yīng)中。
甘蔗花葉病是影響甘蔗生產(chǎn)最普遍的、傳染性極強(qiáng)的病毒性病害, 廣泛存在于世界各地的甘蔗種植區(qū)[48]。甘蔗花葉病毒(Sugarcane mosaic virus,SCMV)屬于正義單鏈RNA病毒, 通過破壞葉綠體進(jìn)而阻止光合作用來降低產(chǎn)量[49-50]。由圖10可知,甘蔗感染SCMV之后,SsLRRII-RLK4和它的等位基因SsLRRII-RLK4-2表達(dá)量增加,SsLRRII-RLK1、SsLRRII-RLK-11、SsLRRII-RLK-11-2和SsLRRIIRLK-12表達(dá)量減少, 說明這些SsLRR-RLK基因可能參與了SCMV感染甘蔗時(shí)的防御反應(yīng)和涉及到甘蔗病毒性病害的調(diào)控過程。
圖10 SsLRRII-RLK基因在不同病害(梢腐病和花葉病)侵染甘蔗中的表達(dá)熱圖Fig. 10 Heat map of LRRII-RLK genes in sugarcane infected with different diseases (pokkah boeng disease and sugarcane mosaic disease)P1: CK; P2: 輕微; P3: 嚴(yán)重; S1: CK; S2: 脫毒; S3: 侵染后。P1: CK; P2: inchoate; P3: advanced. S1: CK; S2: CK detoxify; S3:post-infection.
甘蔗現(xiàn)代栽培品種是由熱帶種和割手密種雜交后產(chǎn)生的, 割手密種為現(xiàn)代栽培甘蔗提供了抗逆、分蘗等優(yōu)良性狀。LRRII-RLK基因目前已經(jīng)在多種植物中發(fā)現(xiàn), 例如擬南芥[5]、大豆[51]、棉花[25]、蘿卜[26]、番茄[27]、馬鈴薯[28]、黃瓜[29]等, 并且發(fā)現(xiàn)它們在植物中對多種生物脅迫反應(yīng)起著關(guān)鍵作用[14],因此, LRRII-RLK基因可能在甘蔗育種中具有提高甘蔗抗逆性和產(chǎn)量的潛能。由于甘蔗復(fù)雜的遺傳背景, LRRII-RLK基因尚未在甘蔗中有比較系統(tǒng)的研究, 甘蔗割手密種基因組的破譯[18]為LRRII-RLK基因的鑒定、探索其在甘蔗生長發(fā)育和病毒防御機(jī)制的研究提供了機(jī)會。本研究在割手密種基因組中共鑒定出27個LRRII-RLK基因, 單倍型基因16個;它們同時(shí)都含有胞外LRR結(jié)構(gòu)域、跨膜區(qū)和胞內(nèi)絲氨酸/蘇氨酸激酶結(jié)構(gòu)域3種結(jié)構(gòu)域, 符合LRRIIRLK基因家族的特點(diǎn)。并且初步分析了LRRII-RLK家族的系統(tǒng)發(fā)育關(guān)系、基因結(jié)構(gòu)、共線性和在甘蔗不同時(shí)空以及在2種不同病害脅迫下的表達(dá)模式。根據(jù)擬南芥的分類標(biāo)準(zhǔn)將甘蔗割手密種、高粱和水稻分成NIK、SERK、LRRII-C 3個分支, 其中NIK分支中基因成員最多, NIK基因在植物中主要是參與病毒的防御, 例如擬南芥中NIK的3個旁系同源基因(AtNIK1、AtNIK2、AtNIK3)在病毒感染期間直接與雙生病毒NSP相互作用, 從而參與病毒防御反應(yīng)[15,52];其次是SERK分支, SERK基因與植物多種反應(yīng)過程相關(guān), 例如, 油菜素內(nèi)酯信號傳導(dǎo)、細(xì)胞死亡、光反應(yīng)和病原體相關(guān)分子模式反應(yīng)等[12]。有研究表明, 水稻通過介導(dǎo)防御信號轉(zhuǎn)導(dǎo)來對抗真菌病原體感染[53],說明LRRII-RLK基因家族發(fā)揮著防御植物病害和調(diào)控植物生長發(fā)育的雙重功能。根據(jù)物種系統(tǒng)發(fā)育樹的結(jié)果, 甘蔗割手密種LRRII-RLK基因的數(shù)量在17種物種中居于第2, 遠(yuǎn)遠(yuǎn)超過禾本科的其他作物, 甘蔗LRRII-RLK基因的顯著增多可能是受到兩輪全基因組復(fù)制的影響, 包括異源多倍化, 然后是自多倍化[54], 或者2輪多倍化[18]。27個SsLRRII-RLK基因都有2個非常保守的基序——基序2和基序4, 且其他基序也都存在于一半以上的SsLRRII-RLK基因中。通過基因結(jié)構(gòu)分析發(fā)現(xiàn), 在NIK、SERK和LRRII-C 3個分支中, 它們成員的基因結(jié)構(gòu)都是比較相似的,在SERK和LRRII-C分支中, 大多數(shù)LRRII-RLK基因都包含8~11個外顯子和2~12個內(nèi)含子, 在番茄基因組[55]中的LRRII-RLK家族中也發(fā)現(xiàn)了相同的趨勢, 說明LRRII-RLK基因家族在進(jìn)化過程中是比較保守的, 也表明我們對甘蔗割手密種基因組進(jìn)行的分類是準(zhǔn)確和可靠的。而在NIK分支中基因結(jié)構(gòu)多樣性較大, 且部分等位基因之間的遺傳結(jié)構(gòu)差異較大, 如SsLRRII-RLK2和SsLRRII-RLK11。
本研究中, 所有的SsLRRII-RLK基因主要包含光響應(yīng)元件、植物激素響應(yīng)元件、脅迫響應(yīng)元件和生長代謝元件四大類, 其中光響應(yīng)元件和植物激素響應(yīng)元件占比最多, 且甘蔗LRRII-RLK基因的順式元件數(shù)量和種類存在差異, 推測SsLRRII-RLK基因在復(fù)制的過程中又產(chǎn)生了新的功能。本研究還分析了LRRII-RLK基因家族擴(kuò)增的方式, 基因的擴(kuò)增和功能分化主要是由于基因復(fù)制產(chǎn)生的, 其中全基因組復(fù)制, 串聯(lián)復(fù)制和片段復(fù)制在植物中最常見, 因?yàn)榇蠖鄶?shù)植物在染色體重排后通過多倍體在其基因組中保留了大量重復(fù)的染色體塊[56-58]。甘蔗割手密種基因組包含35對LRRII-RLK基因共線性對, 27個SsLRRII-RLK基因, 分別都只有一個基因來自串聯(lián)復(fù)制, 分散復(fù)制或鄰近復(fù)制, 有24個來自于片段復(fù)制, 說明LRRII-RLK基因家族在甘蔗割手密種中主要是以片段復(fù)制的方式進(jìn)行擴(kuò)增。結(jié)合高粱和甘蔗種間共線性的結(jié)果, 推測SsLRRII-RLK基因家族的擴(kuò)增方式主要是由于片段復(fù)制以及割手密種的全基因組復(fù)制。
植物基因的表達(dá)模式常常與其功能高度相關(guān)[59]。根據(jù)表達(dá)譜結(jié)果, SsLRRII-RLK基因家族在甘蔗不同組織具有不同的表達(dá)模式, 表明SsLRRII-RLK基因直接或者間接參與植物的生長發(fā)育, 例如SsLRRII-RLK1和SsLRRII-RLK3-2在甘蔗莖組織表達(dá)上調(diào), 這些基因可能主要發(fā)揮調(diào)控與莖發(fā)育相關(guān)生物過程的作用。一些基因在甘蔗葉片組織中上調(diào),例如SERK分支的SsLRRII-RLK4和LRRII-C分支的SsLRRII-RLK14, 這些基因很有可能主要參與葉片生長的發(fā)育過程。根據(jù)先前的研究, 其他植物L(fēng)RRII-RLK基因家族的成員NIK和SERK在植物生長過程中具有重要的功能, 例如擬南芥AtSERK3-5調(diào)控激素信號、參與油菜素內(nèi)酯信號的調(diào)節(jié)、影響植物生長發(fā)育[60-61]; 而在葉片發(fā)育不同梯度中,SsLRRII-RLK基因同它的等位基因之間的表達(dá)模式都是相似的, 例如SsLRRII-RLK4和SsLRRII-RLK4-2,說明這些基因復(fù)制可能產(chǎn)生功能冗余, 在之前的研究中也有報(bào)道, 基因復(fù)制導(dǎo)致的某些基因家族表現(xiàn)為基因功能冗余或者分化[62-64]。有些基因的表達(dá)水平易受到晝夜節(jié)律的影響, 這使得植物可以預(yù)測周圍環(huán)境的變化從而協(xié)調(diào)自身發(fā)育和新陳代謝過程以適應(yīng)環(huán)境變化[65-68]。然而, SsLRRII-RLK基因大部分在晝夜節(jié)律不同的時(shí)間段表達(dá)水平很低, 甚至檢測不到, 說明它們很可能不響應(yīng)光合反應(yīng)。只有少數(shù)幾個基因, 例如SsLRRII-RLK1、SsLRRII-RLK4-2和SsLRRII-RLK14等在甘蔗成熟葉片的晝夜循環(huán)中表達(dá)量有所變化, 說明這些基因有可能調(diào)節(jié)光合反應(yīng)。一些SsLRRII-RLK基因在2種病害脅迫下表達(dá)呈現(xiàn)上升或下降, 說如SsLRRII-RLK1、SsLRRIIRLK4和SsLRRII-RLK11, 說明它們在一定程度上響應(yīng)病害的侵染。在水稻中也有報(bào)道OsSERK1-2會被病原體信號或者其他脅迫信號激活表達(dá), 從而調(diào)節(jié)免疫信號通路[53,69], 在本氏煙草中, 證明NbSERK3A/NbSERK3B對晚疫病具有抗性[70], 因此推測SsLRRII-RLK基因是植物抵御真菌和病毒病原體防御機(jī)制的組成部分, 這些結(jié)果將有助于了解甘蔗的抗病機(jī)制。
本研究在甘蔗割手密種全基因組水平上鑒定到了27個LRRII-RLK家族基因, 其中單倍型16個, 分布在17條染色體上, 分別屬于NIK、SERK和LRRII-C這3個分支, 具有較高的保守性。共線性分析表明, 該家族在甘蔗割手密種中主要以片段復(fù)制的方式進(jìn)行擴(kuò)增, 與高粱分化的過程中經(jīng)歷了嚴(yán)格的純化選擇作用。轉(zhuǎn)錄組數(shù)據(jù)分析表明, SsLRRIIRLK基因表達(dá)具有時(shí)間和組織特異性, 同時(shí)也表明了它們參與了甘蔗光合反應(yīng)和對病害的防御反應(yīng)。本研究為LRRII-RLK基因家族成員在甘蔗生長發(fā)育、光合作用以及在病害脅迫中的功能研究提供初步的理論基礎(chǔ)。