王謝琴,李瑞雪,張 紅,陳 嬌,于小蓉,劉漢梅
(四川農(nóng)業(yè)大學生命科學學院,四川雅安 625000)
小麥是三大主要糧食作物之一,其籽粒富含蛋白質(zhì)、淀粉等多種營養(yǎng)物質(zhì)。在小麥灌漿期,籽粒淀粉合酶活性較高,促進了貯藏淀粉的合成和積累,進而影響小麥的產(chǎn)量和品質(zhì)。
淀粉合酶催化α-1,4糖苷鍵的形成,具有延伸淀粉鏈的功能。在綠色植物形成早期經(jīng)基因復制和功能分化產(chǎn)生了六種淀粉合酶亞型,即GBSS、SSⅠ、SSⅡ、SSⅢ、SSⅣ和SSⅤ。按進化關系,將其分為Group A(GBSS、SSⅠ、SSⅡ)和Group B(SSⅢ、SSⅣ、SSⅤ)兩大類。各淀粉合酶亞型經(jīng)功能分化后,具有各自獨特的底物和產(chǎn)物特異性,催化不同結構和不同鏈長淀粉鏈的延伸。GBSS亞型負責直鏈淀粉的合成,SSⅠ、SSⅡ和SSⅢ亞型負責支鏈淀粉的合成,分別延長短鏈(聚合度8~12 bp),中等鏈(聚合度13~25 bp)和長鏈(聚合度大于30 bp)。SSⅣ亞型負責淀粉顆粒的起始形成,SSⅤ亞型是本課題組近期鑒定并報道的一個新的植物淀粉合酶亞型,可影響淀粉顆粒的數(shù)量和大小。典型的淀粉合酶家族包含GT5和GT1結構域,可結合葡萄糖基供體ADPG,將葡萄糖基轉(zhuǎn)移至糖鏈的非還原端。淀粉合酶各亞型的催化結構域在進化中較為保守,但N端的結合結構域變化較大,決定了其結合不同鏈長的底物。在進化過程中,相同淀粉合酶亞型內(nèi)的基因經(jīng)復制后拷貝數(shù)增加。在水稻、高粱等二倍體作物中,GBSS亞型有兩個拷貝,SSⅡ有三個拷貝,SSⅢ兩個拷貝,這些基因拷貝在不同組織和不同發(fā)育時期存在表達差異,具有獨特的表達特性。如編碼GBSSⅠ的基因,主要負責胚乳等貯藏器官直鏈淀粉的合成,抑制其表達會導致直鏈淀粉合成受阻,籽粒表現(xiàn)為糯性。編碼GBSSⅡ的基因主要在根、莖、葉等營養(yǎng)器官中表達,負責這些器官中直鏈淀粉的合成。小麥是六倍體植物,淀粉合酶基因拷貝數(shù)多于二倍體物種;在二倍體植物中存在一個拷貝,在小麥中就可能存在三個拷貝。目前,小麥基因組測序已經(jīng)完成,雖然李春艷等對小麥淀粉合酶基因進行了鑒定,但并未報道小麥淀粉合酶基因不同拷貝間的序列特性、表達差異及分化機制。因此,本研究對小麥淀粉合酶基因家族所有成員進行鑒定,重點分析不同基因拷貝間的表達差異,并探究引起基因發(fā)生表達差異的潛在啟動子元件,以期為小麥產(chǎn)量和品質(zhì)改良奠定基礎。
在Gramene數(shù)據(jù)庫(http://www.gramene.org/)中初步檢索獲取已注釋的小麥淀粉合酶基因序列,再以水稻的淀粉合酶蛋白序列為查詢序列,利用SPDE軟件對小麥全基因組進行blastp搜索,篩選小麥全基因組中未被注釋的淀粉合酶基因,最后在Pfam數(shù)據(jù)庫進行結構域分析,將具有GT5和GT1兩個典型結構域的序列確定為小麥淀粉合酶基因。
從小麥基因組數(shù)據(jù)庫(http://www.wheatgenome.org),獲取小麥淀粉合酶基因序列的基本信息;通過MG2C在線軟件(http://mg2c.iask.in/mg2c_v2.0/)繪制小麥淀粉合酶基因的染色體定位圖;利用ExPASy在線軟件(https://prosite.expasy.org)分析蛋白分子量(MW)和等電點(pI);利用MEME在線軟件(http://meme-suite.org/tools/meme)和pfam數(shù)據(jù)庫(https://pfam.xfam.org/)預測保守基序和保守結構域,利用TBtools軟件進行可視化。通過Gramene數(shù)據(jù)庫獲取擬南芥()、高粱()、玉米()、水稻()、谷子()的淀粉合酶基因,利用MEGA 7.0軟件構建N-J樹,bootstrap設置為1 000。通過PlantCARE(http://bioinformatics.psb.ugent.be/webtools/PlantCARE/html/)和Place(https://www.dna.affrc.go.jp/PLACE/?action=newplace)在線軟件對小麥淀粉合酶基因起始密碼子上游2 000 bp序列進行順式作用元件分析,利用TBtools進行順式作用元件的統(tǒng)計及可視化。
從小麥基因表達數(shù)據(jù)庫(http://www.wheat-expression.com/)下載小麥品種中國春中淀粉合酶基因在不同組織和不同發(fā)育時期的表達數(shù)據(jù),計算并獲取小麥淀粉合酶基因的差異倍數(shù),采用TBtools軟件將表達結果可視化。
通過對小麥全基因組的搜索及蛋白結構域分析,共鑒定到27個小麥淀粉合酶基因,結合基因的進化樹分支及染色體分布對27個小麥基因進行命名,結果見表1。淀粉合酶基因集中分布于1A/1B/1D、2A/2B/2D、6A/6B/6D、7A/7B/7D染色體上,可編碼599~1 629個氨基酸,等電點為4.87~7.50,分子量為58~183 kD。
為了解淀粉合酶基因家族成員間的進化關系,用NJ法構建擬南芥、玉米、水稻、高粱、小麥的淀粉合酶蛋白序列的進化樹(圖1)。發(fā)現(xiàn)小麥淀粉合酶蛋白家族成員分為Group A和Group B兩大類,Group A包含GBSS、SSⅠ、SSⅡ三個亞家族,Group B包含SSⅢ、SSⅣ兩個亞家族。與玉米、水稻、高粱、擬南芥不同的是,小麥淀粉合酶基因家族中沒有SSⅤ亞家族。擬南芥作為雙子葉植物,籽粒胚乳退化,所有淀粉合酶亞家族只有單個基因拷貝。禾本科作物玉米、水稻、高粱、小麥的淀粉合酶亞家族基因經(jīng)歷了多次復制,存在多個基因拷貝。小麥中除SSⅠ和SSⅣ亞家族淀粉合酶基因為單拷貝之外,GBSS亞家族存在和兩個拷貝,SSⅡ亞家族存在、和三個拷貝,SSⅢ亞家族存在和兩個拷貝。由于玉米分化后經(jīng)歷了第二次全基因組復制事件,因此玉米的淀粉合酶基因拷貝數(shù)量最多。
小麥是異源六倍體,存在A、B、D三個染色體組,對27個小麥淀粉合酶基因進行染色體定位分析發(fā)現(xiàn),大多數(shù)小麥淀粉合酶基因都具有三個高度同源的基因。但同源群Ⅶ中的B染色體缺少,該基因位于同源群Ⅳ的A染色體上,表明小麥在進化過程中,同源群Ⅳ的A染色體與同源群Ⅶ的B染色體相應區(qū)段發(fā)生了染色體片段交換(表1)。
表1 小麥淀粉合酶基因家族成員的基本信息Table 1 Basic information of starch synthase gene family members in wheat
At:擬南芥;Os:水稻;Zm:玉米;Sb:高粱;Si:谷子;Ta:小麥。
為揭示小麥淀粉合酶基因的序列特征,根據(jù)其進化關系,比較分析不同拷貝間的基因結構、蛋白質(zhì)保守基序和結構域(圖2和圖3)?;蜻M化常伴隨著編碼區(qū)外顯子數(shù)目的增多或減少,進而引起蛋白結構域改變以及功能分化。從圖2可以看出,小麥不同淀粉合酶亞家族間和相同亞家族內(nèi)的基因拷貝間,基因的外顯子數(shù)目不同。部分同源群內(nèi)的淀粉合酶基因外顯子數(shù)目和內(nèi)含子相位則比較保守,僅、、的外顯子數(shù)目減少了1~3個,導致5′端編碼區(qū)片段缺失,蛋白序列變短,但與同源基因相比,蛋白結構域并無變化(圖3),因此推測缺失的5′端序列均為非結構域序列,對蛋白功能影響不大。外顯子數(shù)目增加,但沒有改變編碼區(qū)序列長度,僅改變了基因5′端的非編碼區(qū)序列(圖2)。
淀粉合酶家族蛋白都具有典型的GT5和GT1結構域(PF08323和PF00534),SSⅢ亞家族還具有CBM53結構域(PF16760)。利用MEME軟件在小麥淀粉合酶蛋白保守結構域中共鑒定到10個保守基序,其中,GroupA中淀粉合酶蛋白的motif十分保守,都具有motif1~motif10,且排列順序也一致;而GroupB中淀粉合酶蛋白都缺少motif9和motif10,且SSⅢ亞家族還缺少motif8。推測保守基序差異可能引起不同亞家族蛋白之間的功能特性差異。
小麥淀粉合酶不同亞家族間的基因以及相同亞家族內(nèi)的不同基因拷貝間在不同組織和不同發(fā)育時期均具有明顯的表達差異。其中,和是單拷貝,在小麥各個組織和發(fā)育時期都有表達,且在籽粒中表達量較高。、、在進化中均產(chǎn)生了多個拷貝,其中、、在胚乳中特異表達,而、、、在根、莖、葉等營養(yǎng)器官及早期階段的穗中表達量較高(圖4)。在胚乳中的表達量顯著高于、、,表明可能在小麥籽粒淀粉合成中扮演著十分重要的角色。
內(nèi)含子相位由內(nèi)含子在基因內(nèi)插入遺傳密碼子3個核苷酸的位置來確定。內(nèi)含子插入時,若位于兩密碼子之間,則稱為0相位;插入密碼子的第一、二位核苷酸之間,稱為1相位;插入第二、三位之間時,稱為2相位。
圖3 小麥淀粉合酶蛋白保守基序分析
不僅小麥淀粉合酶亞家族間的基因以及相同亞家族內(nèi)的基因拷貝之間存在表達差異,相同部分同源群內(nèi)的小麥淀粉合酶基因間也存在時空表達差異。其中,僅在開花期的穗中有較高的表達量,而和在穗的不同發(fā)育時期均有較高的表達量;在授粉后20 d和30 d的胚乳中表達量均比和低;在莖和穗中的表達量比和高;此外,與同源群內(nèi)的其他基因相比,和在不同組織和不同發(fā)育時期的表達量均最低。由此可見,小麥相同部分同源群內(nèi)的淀粉合酶基因間在不同組織和不同發(fā)育時期存在表達差異。
WE 10:授粉后10 d的整個胚乳;SE 20:授粉后20 d的淀粉胚乳;WE 20:授粉后20 d的整個胚乳;TC 20:授粉后20 d的轉(zhuǎn)移細胞;AL 20:授粉后20 d的糊粉層;SE 30:授粉后30 d的淀粉胚乳;AL and SE 30:授粉后30 d的糊粉層和淀粉胚乳;GR 2:授粉后2 d的籽粒;GR 4:授粉后4 d的籽粒;GR 30:授粉后30 d的籽粒;LSS:幼苗期葉片;LTS:分蘗期的葉片;Leaf 2:授粉后2 d的葉片;RST:幼苗期的根;RTL:三葉期的根;RFL:七葉期的根;SPT:可檢測到兩個節(jié)點的穗;SPF:七葉期的穗;SPA:開花期的穗;STS:穗長1 cm時的莖;STT:可檢測到兩個節(jié)點的莖;STA:開花期的莖。
利用Plant CARE在線軟件分析27個小麥淀粉合酶基因起始密碼子上游2 000 bp啟動子中的順式作用元件,發(fā)現(xiàn)其含有多種元件,按照功能可分為三大類,即植物激素反應類、生物/非生物脅迫類、生長發(fā)育調(diào)控類(圖5)。在生長發(fā)育調(diào)控類元件中,GCN4-motif、AACA-motif、RY-element是已報道的胚乳特異表達元件。
圖5 小麥淀粉合酶基因三類順式作用元件的比較分析
為進一步了解淀粉合成相關元件對小麥淀粉合酶基因表達差異的影響,又用Place在線軟件分析小麥淀粉合酶基因啟動子中與淀粉合成代謝相關的元件,結果共鑒定了12種元件(表2)。其中RYREPEATVFLEB4、AACACOREOSGLUB1、GCN4OSGLUB1/GLMHVCHORD分別是PlantCARE軟件預測到的RY-element、AACA-motif、GCN4-motif元件。Place軟件預測的RY-element、GCN4-motif元件與PlantCARE預測結果相同,但AACA-motif數(shù)目增加,可能是由于PlantCARE數(shù)據(jù)庫未及時更新,其參考序列水稻AACA-motif元件序列過長 導致。
表2 小麥淀粉合酶基因家族啟動子中預測到的與淀粉合成相關的順式作用元件Table 2 Cis-acting elements associated with starch synthesis in the promoters of starch synthase genes in wheat
進一步分析發(fā)現(xiàn),淀粉合成代謝相關順式作用元件總數(shù)在不同基因拷貝間均存在著較大差異。部分胚乳特異表達元件在胚乳高表達基因的數(shù)目明顯多于其對應的非胚乳特異表達基因,如RYREPEATVFLEB4、AACACOREOSGLUB1和AGGTOSGLUB1元件在、、中的總數(shù)明顯多于、、和(圖6)。由此表明,相同的淀粉合酶亞家族內(nèi)的基因拷貝間,在長期的進化中啟動子序列發(fā)生變化,改變了順式作用元件的類型和數(shù)量,進而導致基因出現(xiàn)表達差異,使得胚乳高表達的基因拷貝、、存在更多的胚乳特異表達元件。
小麥相同部分同源群內(nèi)淀粉合酶基因間也存在元件類型和數(shù)量差異,且與其表達特性差異相符。如和比部分同源群內(nèi)的其他兩個基因,在不同組織和不同發(fā)育時期的表達量均較低。從元件分布來看,的元件數(shù)量均少于和;的元件數(shù)量也均少于和(圖6)。由此可見,生長發(fā)育類元件對小麥部分同源群內(nèi)的淀粉合酶基因表達差異影響較大。
SUM1:RYREPEATVFLEB4、AACACOREOSGLUB1和ACGTOSGLUB1三類胚乳特異表達元件的數(shù)量之和;SUM2:除DOFCOREZM元件外,其他所有預測到的淀粉合成相關元件的數(shù)量之和。
小麥淀粉合酶經(jīng)基因復制產(chǎn)生不同淀粉合酶亞型,各亞型內(nèi)又產(chǎn)生不同數(shù)量的基因拷貝,這些拷貝在不同組織和不同發(fā)育時期均存在明顯的表達差異。探究小麥淀粉合酶基因主要調(diào)控元件對基因表達差異的影響,對小麥產(chǎn)量和品質(zhì)改良有重要意義。
在小麥基因組中共鑒定到27個淀粉合酶基因,由于小麥是六倍體植物,有三個染色體組,除缺失的SSⅤ亞家族外,小麥淀粉合酶各亞家族基因數(shù)目之和是二倍體高粱的三倍。水稻SSⅣ亞家族基因存在兩個拷貝,這與水稻在進化過程中發(fā)生染色體大片段復制有關。玉米淀粉合酶基因數(shù)目最多,這是因為玉米在演化中多經(jīng)歷了一次全基因組復制事件。本研究小麥27個淀粉合酶基因按照進化關系可分為GBSS、SSⅠ、SSⅡ、SSⅢ和SSⅣ五個亞家族,缺少TaSSⅤ亞家族,通過對麥類植物大麥、烏拉爾圖小麥和節(jié)節(jié)麥全基因組搜索,均未發(fā)現(xiàn)SSⅤ亞家族成員。本課題組曾報道在藻類、苔蘚類、雙子葉植物(擬南芥)和禾本科作物(水稻、高粱、玉米等)中都存在SSⅤ亞家族,因此推測可能在麥類植物的祖先中丟失了SSⅤ亞家族。
Dian等在水稻中共鑒定出10個淀粉合酶基因,對其進行表達分析發(fā)現(xiàn),相同亞家族內(nèi)不同基因拷貝間具有明顯的表達差異,可分為兩組,一組在胚乳中優(yōu)先表達,影響貯藏淀粉合成,另一組主要在葉片中表達,影響瞬時淀粉合成,如SSⅢ和SSⅣ亞家族內(nèi)水稻淀粉合酶基因各有兩個拷貝,其中和主要在葉片中表達,而和主要在胚乳中表達。本研究發(fā)現(xiàn),小麥淀粉合酶基因相同亞家族內(nèi)不同基因拷貝間也具有明顯的表達差異,如、和在胚乳中特異表達,而、、和在根、莖、葉等營養(yǎng)器官及早期階段的穗中表達量較高。
Zhao等分析發(fā)現(xiàn),多倍體小麥進化中,某些功能基因有多種表達模式。Pfeifer等對六倍體面包小麥的胚乳特異表達基因進行共表達分析,發(fā)現(xiàn)部分同源群內(nèi)只有28%的基因?qū)儆谝粋€共表達簇,而大多數(shù)分布在不同的共表達簇上,表明絕大多數(shù)的部分同源基因間存在表達差異。小麥淀粉合酶基因相同亞家族內(nèi)的基因拷貝在不同組織和不同發(fā)育時期存在表達差異,部分同源群基因間也存在表達差異,但差異程度不及相同亞家族內(nèi)基因拷貝間大。
特定的啟動子元件可以調(diào)控基因在不同組織和不同發(fā)育時期的表達,胚乳特異表達元件可引起基因在胚乳中高表達。Maier等發(fā)現(xiàn)-300CORE是決定玉米醇溶蛋白胚乳特異表達的必要元件,但本研究發(fā)現(xiàn)此元件的數(shù)目在小麥胚乳高表達與非胚乳表達的淀粉合酶基因間并沒有明顯差異。Wu等發(fā)現(xiàn),從水稻貯藏蛋白編碼基因中鑒定的GCN4-motif、AACA-motif、ACGT-motif都是胚乳特異表達元件,其中,GCN4-motif決定胚乳組織特異性,AACA-motif和ACGT-motif影響胚乳中谷蛋白基因表達量的高低;當AACA-motif和ACGT-motif單獨存在時,不能發(fā)揮作用,需與GCN4-motif共同作用才能決定胚乳的表達組織特性。本研究發(fā)現(xiàn),含GCN4-motif元件的小麥淀粉合酶基因數(shù)目較少,AACA-motif和ACGTOSGLUB1(ACGT-motif)元件在胚乳高表達基因的數(shù)目高于其他基因。Xiang等發(fā)現(xiàn)貯藏蛋白基因在胚乳中特異表達,而淀粉合成相關基因在胚和胚乳中協(xié)調(diào)表達。因此,胚乳貯藏蛋白基因中胚乳特異表達元件與淀粉合酶基因的順式作用元件不完全相同。
胚乳中基因的胚乳表達特異性受不同類型轉(zhuǎn)錄因子和元件的控制。水稻谷蛋白基因中的GCN4-motif元件主要受bZIP類轉(zhuǎn)錄因子Opaque-2(O2)的調(diào)控,參與基因的胚乳特異性表達。NAC128和NAC130是玉米胚乳特異性轉(zhuǎn)錄因子,與啟動子區(qū)域中的核心元件ACGCAA結合,通過調(diào)節(jié)關鍵淀粉生物合成酶和主要種子貯藏蛋白基因的表達來協(xié)調(diào)淀粉和蛋白質(zhì)的積累。由此可見,基因的胚乳表達特異性是由不同轉(zhuǎn)錄因子和順式作用元件相互作用來實現(xiàn)的。因此,胚乳表達特異性的調(diào)控機制非常復雜,不同物種不同類型基因的具體機制可能存在一定差異,可通過具有表達差異的基因拷貝間的元件差異來揭示胚乳特異表達機制。