崔曉霞,趙 碩,郭書巧,束紅梅,何曉蘭,倪萬潮,鞏元勇,劉來華
(1.江蘇省農(nóng)業(yè)科學(xué)院 經(jīng)濟作物研究所,江蘇 南京 210014;2.教育部植物與土壤互作重點實驗室, 中國農(nóng)業(yè)大學(xué)資源、環(huán)境及糧食安全中心,北京 100193)
植物谷氨酸受體(Glutamate receptors-like receptors,GLRs)最早是Lam等[1]于1998年在擬南芥中發(fā)現(xiàn)的,通過序列的同源性分析獲得20個與動物離子型谷氨酸受體(Ionotropic glutamate receptors, iGLuRs)同源的基因,命名為AtGLRs。隨后在多個不同植物中有關(guān)于谷氨酸受體基因家族的報道。在水稻基因組中都發(fā)現(xiàn)有同擬南芥谷氨酸受體高度同源的24個OsGLRs基因[2],Aouini等[3]鑒定出番茄基因組中包含13個SlGLRs基因,蘋果基因組中鑒定出32個MdGLRs基因[4]。
目前,已有多個植物GLRs基因的分子生理功能獲得解析,作為模式植物擬南芥的AtGLRs基因研究的相對較多[5],其他植物也有報道。根部的AtGLR3.2和AtGLR3.4主要在韌皮部表達,AtGLR3.2和AtGLR3.4缺失突變體表現(xiàn)出有大量側(cè)根原基出現(xiàn),推測和這2個基因相關(guān)的離子通道可能通過韌皮部的Ca2+信號調(diào)控側(cè)根的生長[6]。Kang等[7]研究表明,AtGLR1.1參與擬南芥的ABA生物合成和C/N代謝以此調(diào)控種子的萌發(fā),AtGLR1.1還參與了擬南芥的水分調(diào)節(jié)[8]。Zheng等[9]研究證實,AtGLR1.2和AtGLR1.3通過調(diào)控茉莉酸信號途徑增強擬南芥的耐寒性。Kong等[10]的研究結(jié)果表明,在種子萌發(fā)過程中AtGLR3.5上調(diào)表達促進胞質(zhì)Ca2+濃度的增加,從而抑制ABI4的表達,達到促進種子萌發(fā)的作用。Cho等[11]發(fā)現(xiàn)AtGLR3.1在葉片的保衛(wèi)細胞中表達,超表達AtGLR3.1基因?qū)⒂绊懕Pl(wèi)細胞對Ca2+信號的接收或轉(zhuǎn)導(dǎo)。AtGLR3.4基因在植株受到外界機械損傷刺激時表達量會增加3~6倍,細胞質(zhì)中酸中毒也可以誘導(dǎo)該基因的上調(diào)表達[12],這些研究結(jié)果表明,AtGLR3.4基因可能參與了植物的抗逆反應(yīng)。Li等[13]研究報道,OsGLR3.1在維持水稻根尖分生組織細胞活力的過程中發(fā)揮重要作用。小蘿卜RsGLuR基因在擬南芥中超表達,可以提高植株抗真菌感染的能力[14]。
大豆是全世界種植面積最大的豆科植物,根瘤菌與大豆共生的生物固氮作用是世界農(nóng)業(yè)非常重要的組成部分,此外大豆還是世界范圍內(nèi)動物飼料蛋白和食用油的重要植物來源。2010年,大豆栽培品種美國的Williams 82(Glycine_max_v2.0) 基因組序列公布[15],并成為當前參考應(yīng)用最多的大豆基因組序列。最近,我國科學(xué)家對國審大豆品種中黃13的基因組(Gmax_ZH13) 進行從頭組裝,最終得到1.025 Gb的基因組序列,包含20條染色體和1條葉綠體[16]。這些大豆基因組測序工作的完成為大豆基因的基礎(chǔ)性研究提供了很好的參考條件,很多大豆的基因家族在基因組中被鑒定和發(fā)掘,但是還沒有關(guān)于大豆GmGLRs基因相關(guān)信息的研究報道。本研究也是參考Williams 82(Glycine_max_v2.0) 基因組序列,在全基因組層面鑒定出GmGLRs基因,并就這些基因從生物信息學(xué)角度進行分析,同時也研究了它們的組織表達模式,為深入研究該家族成員的分子生物學(xué)功能奠定基礎(chǔ)。
在TAIR(http://www.arabidopsis.org)獲取擬南芥AtGLRs的基因序列,以擬南芥的序列為探針在Phytozome(https://phytozome.jgi.doe.gov/pz/portal.html#!infoalias=Org_Gmax)大豆基因組(Wm82.a2.v1)Blast,搜索獲得E值小于e-10的相似性序列,將獲得的序列(大豆和擬南芥)在InterProscan5 (http://www.ebi.ac.uk/Tools/pfa/iprscan/)在線分析功能結(jié)構(gòu)域存在情況,最終確定目標序列。序列的轉(zhuǎn)錄名稱、編碼區(qū)長度、CDS序列長度、外顯子個數(shù)均在Phytozome獲得;利用ProtParam tool(http://web.expasy.org/protparam/)在線分析獲得GmGLRs基因蛋白氨基酸序列的分子質(zhì)量、等電點等基本信息。
通過大豆基因組數(shù)據(jù)庫Phytozome(https://phytozome.jgi.doe.gov/pz/portal.html)獲得GmGLRs基因在大豆染色體上的位置信息,用Map Inspect軟件繪制基因的染色體物理分布圖。
GmGLRs蛋白質(zhì)氨基酸序列在Phytozome獲得,擬南芥AtGLRs蛋白序列在TAIR上獲取,用Mega 6 軟件采用Neighbor-Joining構(gòu)建大豆GmGLRs和擬南芥AtGLRs蛋白的系統(tǒng)進化樹,校驗參數(shù)Bootstrap=1 000。
采用GSDS(Gene Structure Dispely Server,http://gsds.cbi.pku.edu.cn/)在線繪制大豆GmGLRs基因結(jié)構(gòu)圖[17];大豆GmGLRs蛋白序列的跨膜結(jié)構(gòu)域預(yù)測在TMHMM Server v. 2.0;http://www.cbs.dtu.dk/services/TMHMM在線進行。
GmGLRs基因在花、葉、根瘤、豆莢、根、根毛、種子、頂端生長點、莖等9個組織部位表達量數(shù)據(jù)(FPKM)來自Phytozome(https://phytozome.jgi.doe.gov/pz/portal.html)[18],將獲得數(shù)據(jù)log2均一化處理后,用HemI 1.0軟件繪制GmGLRs基因表達熱圖[19]。
利用擬南芥AtGLRs基因序列在Phytozome大豆基因組(Wm82.a2.v1)Blast,共鑒定出18個GmGLRs候選基因。將這18個候選基因在InterProScan上鑒別功能結(jié)構(gòu)域,因4個結(jié)構(gòu)域IPR001638、IPR001828、IPR001320和IPR017103在擬南芥AtGLRs基因中都存在(表1),所以最后確定17個同時具有這4個結(jié)構(gòu)域的GmGLRs基因為GmGLR基因家族基因。
根據(jù)這17個GmGLRs基因在染色體上出現(xiàn)的先后順序分別命名為GmGLR1~GmGLR17(表2),這些基因編碼區(qū)平均長度約為4 727 bp,最長的是GmGLR15的5 491 bp,最短的是GmGLR16的3 404 bp;CDS平均長度為2 748 bp,最長的是GmGLR7、GmGLR13和GmGLR14基因的2 844 bp,最短的是GmGLR6基因的2 409 bp;這些基因的外顯子個數(shù)除了GmGLR8基因有7個,其他都有6個外顯子。蛋白質(zhì)理化性質(zhì)分析表明,17個GmGLRs基因的蛋白質(zhì)氨基酸序列個數(shù)平均為915個氨基酸,平均分子質(zhì)量是102.086 4 ku, 最大的是105.822 ku(GmGLR13),最小的是91.405 ku(GmGLR5);理論等電點最大的是GmGLR14的8.41,最小的是GmGLR8的6.17。只有GmGLR8的等電點小于7,說明該蛋白編碼弱酸性蛋白,將在亞細胞環(huán)境為酸性的條件下發(fā)揮功能[19]。
表1 InterPro 結(jié)構(gòu)域在大豆和擬南芥GLRs蛋白中的分布Tab.1 InterPro domains found in GmGLRs and AtGLRs
表2 GmGLRs基因家族基本信息Tab.2 Basic information of GmGLRs gene family of soybean
根據(jù)基因位置信息,將鑒定出的17個GmGLRs基因定位在大豆的10條染色體上,定位結(jié)果如圖1所示。這些基因在染色體上呈現(xiàn)不均勻分布,第9號和第12號染色體上各有3個GmGLRs基因,第6號、第7號和第13號染色體上各有2個GmGLRs基因,第1號、第4號、第11號、第14號和第16號染色體上都只有1個GmGLR基因。其中,第7號、第9號、第12號和第13號染色體的GmGLRs基因呈簇存在。
圖1 GmGLRs基因的染色體定位Fig.1 The chromosomal positions of GLRs gene in soybean
為了分析GmGLRs基因的系統(tǒng)進化關(guān)系,利用GmGLRs蛋白質(zhì)序列同擬南芥的AtGLRs蛋白質(zhì)序列構(gòu)建系統(tǒng)進化樹,結(jié)果如圖2所示。擬南芥AtGLRs基因分成3個亞家族,第一亞家族4個基因,第二亞家族和第三亞家族分別是9,7個基因。GmGLRs有GmGLR5和GmGLR62個基因同擬南芥第二亞家族聚在一起,其他的15個GmGLRs基因同擬南芥第三亞家族聚在一起,沒有基因與擬南芥第一亞家族聚在一起。從進化樹末端聚類可以看出,17個GmGLRs基因存在8對同源基因,只有GmGLR16單獨一個分支。
圖2 大豆與擬南芥GLRs蛋白序列的系統(tǒng)進化樹Fig.2 The phylogenetic tree of GLRs protein in soybean and Arabidopsis
根據(jù)搜索鑒定獲得17個GmGLRs基因的基因組編碼區(qū)序列和CDS序列,用GSDS 2.0軟件在線繪制GmGLRs基因結(jié)構(gòu)圖,同時分析這17個GmGLRs基因的外顯子和內(nèi)含子情況??傮w來看,除GmGLR8基因,其他16個GmGLRs基因都包含6個外顯子和5個內(nèi)含子(圖3)。從外顯子的長度分析保守性,保守性較高的外顯子依次為E4、E3、E5,E4長度為32 bp的基因有14個,E3長度為278 bp的基因有13個,E5長度為407 bp的基因有9個(表3)。同源基因在基因結(jié)構(gòu)上也表現(xiàn)出高度一致,其中GmGLR1和GmGLR10、GmGLR12和GmGLR15、GmGLR13和GmGLR14,所對應(yīng)的外顯子長度都一樣;GmGLR2和GmGLR3、GmGLR7和GmGLR17,除E6以外的其他外顯子長度是一樣的;GmGLR4和GmGLR11,除E1和E6以外的外顯子長度是一樣的;同源基因長度不同的外顯子差異也不大,所對應(yīng)的內(nèi)含子的長度差別也不大(表3)。GmGLR8基因結(jié)構(gòu)差異的原因,可能是在進化過程中,第一個外顯子插入一個內(nèi)含子造成的。
圖3 GmGLRs基因外顯子-內(nèi)含子結(jié)構(gòu)示意圖Fig.3 The diagram of extron and intron structure within GmGLRs
表3 GmGLRs基因外顯子和內(nèi)含子的比較Tab.3 Comparation of exons and introns in GmGLRs genes bp
利用TMHMM Server v.2.0 在線預(yù)測GmGLRs 蛋白跨膜結(jié)構(gòu)域,如表4所示,10 個GmGLRs蛋白有3個跨膜結(jié)構(gòu)域,4個GmGLRs蛋白有4 個跨膜結(jié)構(gòu)域,2 個GmGLRs蛋白有5個跨膜結(jié)構(gòu)域,1個GmGLRs蛋白有2 個跨膜結(jié)構(gòu)域。同源基因的跨膜結(jié)構(gòu)域在個數(shù)和位置上都表現(xiàn)高度一致,GmGLR2和GmGLR3、GmGLR7和GmGLR17,這3對等位基因跨膜結(jié)構(gòu)域的位置都一致;GmGLR1和GmGLR10、GmGLR12和GmGLR15,這2對等位基因?qū)?yīng)跨膜結(jié)構(gòu)域的位置只有幾個氨基酸的差異。GmGLRs 的跨膜位置多位于580-870 個氨基酸,該區(qū)域也是保守結(jié)構(gòu)域相對集中的區(qū)域,由此可見,跨膜結(jié)構(gòu)域在GmGLRs的生理功能上發(fā)揮重要作用。
利用Phytozome 數(shù)據(jù)庫中GmGLRs基因的組織表達量數(shù)據(jù)(FPKM),對GmGLRs基因在花、葉、根瘤、豆莢、根、根毛、種子、頂端生長點、莖等9個組織部位的表達模式進行分析,結(jié)果如圖4所示。17個GmGLRs基因的表達都沒有表現(xiàn)出組織特異性的差異,但是在表達豐度上存在顯著差異,有8個基因高豐度表達,5個基因中豐度表達,4個基因低豐度表達。同源基因具有相似的表達趨勢,GmGLR7和GmGLR17、GmGLR4和GmGLR11、GmGLR12和GmGLR15、GmGLR5和GmGLR6,這些同源基因在表達豐度和不同組織部位表達量上趨于一致。從不同組織部位表達高低的角度來看,GmGLR1在葉中表達量最高,GmGLR7在種子中表達量最高,GmGLR15在根中表達量最高,GmGLR12在頂端生長點中表達量最高,GmGLR8在花、葉和根中表達量最低,GmGLR6在根瘤、種子和頂端生長點中表達量最低。
表4 GmGLRs蛋白跨膜域預(yù)測Tab.4 Prediction of the transmembrane regions of GmGLRs proteins
F.花;L.葉;N.根瘤;P.豆莢;R.根;RH.根毛;Se.種子;SAM.頂端生長點;St.莖。 F.Flower;L.Leaves;N.Nodules;P.Pod;R.Root;RH.Root hair;Se.Seed;SAM.Shoot apical meristem;St.Stem.
結(jié)構(gòu)域是生物大分子中具有特異結(jié)構(gòu)和獨立功能的區(qū)域,也是蛋白質(zhì)功能單元[20],具有相同結(jié)構(gòu)域的蛋白質(zhì)分子在理論上具有相同生物學(xué)功能的可能性最大。擬南芥AtGLRs所有的成員都具有IPR001638、IPR001828、IPR001320和IPR017103這4個結(jié)構(gòu)域,因此,在篩選其他植物基因組中GLRs的時候,也應(yīng)以此為參考[3],所以本研究所最終確定的17個GmGLRs成員也是同時包含這4個結(jié)構(gòu)域。
擬南芥的AtGLRs基因根據(jù)系統(tǒng)進化的分析結(jié)果分成3個亞家族[21],水稻的OsGLRs基因根據(jù)系統(tǒng)進化的結(jié)果分成4個亞家族,都有基因同擬南芥的3個亞家族聚類到一起,還有一個分支的7個基因有別于這3個亞家族[2];番茄SlGLRs基因也分成3個亞家族,其中有2個亞家族同擬南芥的第二和第三亞家族聚類到一起,另一個亞家族單獨聚到一個分支[3];蘋果的MdGLRs基因同擬南芥的系統(tǒng)進化結(jié)果一致,分成3個亞家族[4]。本研究結(jié)果顯示,大豆的GmGLRs基因只包含同擬南芥AtGLRs基因第二和第三亞家族聚類到一起基因,缺少同擬南芥AtGLRs基因第一亞家族一致的基因,而且17個GmGLRs基因有15個同擬南芥AtGLRs基因第三亞家族聚類在一起,表明大豆的GmGLRs基因在生理功能上可能更趨同于擬南芥AtGLRs基因第三亞家族。
先前的研究表明,植物GLRs多拷貝基因通常成串地排列在同一條染色體上[2,3,22],大豆的GmGLRs基因也表現(xiàn)出了類似的特性。大豆基因組在進化過程中發(fā)生過大規(guī)模復(fù)制事件,使得大豆的很多基因表現(xiàn)出成對出現(xiàn)的分布模式[15,23-24],大豆的17個GmGLRs基因有8對基因成對出現(xiàn),也表現(xiàn)出了大豆基因的這一普遍規(guī)律。大豆的17個GmGLRs基因中的同源基因,不管是在基因內(nèi)含子-外顯子結(jié)構(gòu)上,還是跨膜結(jié)構(gòu)域的存在形式上,以及基因組織表達模式上都表現(xiàn)出了高度一致性,表明這些基因的分子生物學(xué)功能也可能存在重復(fù)。