羅 璇,林正雨,陳 章,雷 波,李 潔,全津瑩,劉海嵐
玉米DUF1685基因家族的鑒定和進(jìn)化分析
羅 璇1,林正雨1,陳 章1,雷 波1,李 潔1,全津瑩1,劉海嵐2*
1. 四川省農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息與農(nóng)村經(jīng)濟(jì)研究所,四川成都 610066;2. 四川農(nóng)業(yè)大學(xué)玉米研究所,四川成都 611130
本研究共鑒定出16個(gè)單、雙子葉植物和卷柏的211個(gè)DUF1685基因家族成員。蛋白理化性質(zhì)分析表明,211個(gè)基因的氨基酸序列長(zhǎng)度為83~1071 aa,分子量為9.2~116.3 kDa,理論等電點(diǎn)為3.66~11.90。系統(tǒng)發(fā)育進(jìn)化分析表明,DUF1685基因家族被劃分了3個(gè)亞家族(Class I、Class II和Class III),Class I和Class II亞家族產(chǎn)生A1和A2、B1和B2的事件發(fā)生在單、雙子葉植物分化后,同時(shí)A1和B2分支(成員均為雙子葉植物基因)出現(xiàn)了基因擴(kuò)張現(xiàn)象。保守基序和基因結(jié)構(gòu)分析結(jié)果表明,同一亞家族成員之間保守基序相似,211個(gè)DUF1685基因家族成員中大部分含有1個(gè)內(nèi)含子,少部分基因含有2個(gè)及以上內(nèi)含子或者不含內(nèi)含子。選擇壓分析表明,DUF1685基因家族在進(jìn)化過程中相關(guān)位點(diǎn)受到正向選擇,這可能是導(dǎo)致部分基因發(fā)生功能變化的原因。共線性分析表明,片段復(fù)制事件可能是玉米基因擴(kuò)增和進(jìn)化的潛在驅(qū)動(dòng)力?;騿?dòng)子區(qū)域順式元件分析結(jié)果表明,玉米基因啟動(dòng)子區(qū)域含有光響應(yīng)元件、ABA和非生物脅迫相關(guān)的順式作用元件,推測(cè)這些基因可能參與玉米對(duì)非生物脅迫的響應(yīng)。轉(zhuǎn)錄組數(shù)據(jù)分析表明,玉米基因與特定組織(成熟花粉)的生長(zhǎng)發(fā)育相關(guān)。本研究從多方面探究了玉米DUF1685基因家族的功能和進(jìn)化情況,以期為今后深入研究玉米基因生物學(xué)功能和進(jìn)化關(guān)系提供理論參考。
基因;基因鑒定;進(jìn)化分析
未知功能結(jié)構(gòu)域蛋白(domain of unknown function, DUF)是一群尚未被注釋功能的蛋白[1]。已有研究發(fā)現(xiàn),DUF基因家族成員廣泛參與調(diào)控植物的生長(zhǎng)發(fā)育,如DUF26亞家族的介導(dǎo)水稻根系發(fā)育并負(fù)調(diào)控根系卷曲[2],含有DUF647結(jié)構(gòu)的與調(diào)控?cái)M南芥早期幼苗形態(tài)和發(fā)育[3],DUF724基因家族成員通過RNA的轉(zhuǎn)運(yùn)參與植物細(xì)胞的極性生長(zhǎng)[4],和編碼的DUF642蛋白參與植物發(fā)育過程中果膠狀態(tài)的精細(xì)調(diào)節(jié)[5]。同時(shí),DUF基因家族成員也參與調(diào)控植物的花粉發(fā)育,如DUF784基因家族成員在介導(dǎo)胚囊發(fā)育的晚期或與花粉管的相互作用中起作用[6],含有DUF640結(jié)構(gòu)域的基因控制水稻外稃和內(nèi)稃發(fā)育[7]。此外,DUF基因家族成員也對(duì)各種非生物脅迫[8-10]和生物脅迫[11]積極響應(yīng)。
玉米(ssp)是玉蜀黍?qū)伲↙)一年生二倍體作物,起源于大約9000年前墨西哥野生大芻草[12]。玉米不僅是我國(guó)的關(guān)鍵農(nóng)作物之一,也是人類生存的基本食物和動(dòng)物飼料原料。面對(duì)全球氣候的嚴(yán)峻變化,非生物脅迫對(duì)作物的危害也越來越嚴(yán)重。因此,可以充分利用玉米參考基因組測(cè)序信息[13],挖掘并研究與生長(zhǎng)發(fā)育、脅迫應(yīng)答等相關(guān)的未知基因,進(jìn)而擴(kuò)寬玉米基因資源。目前,隨著各種植物基因組測(cè)序數(shù)據(jù)的公布,越來越多物種的DUF基因功能研究被報(bào)道與生長(zhǎng)發(fā)育、脅迫響應(yīng)有關(guān),同時(shí)已有研究發(fā)現(xiàn)在甘藍(lán)型油菜成熟花粉的轉(zhuǎn)錄組數(shù)據(jù)中含有DUF1685結(jié)構(gòu)域的基因存在,但未對(duì)其基因功能進(jìn)行深入探究[14],而DUF1685基因家族成員在其他植物中的功能研究還未見報(bào)道。因此,本研究基于已公布的16種單、雙子葉植物和卷柏基因組數(shù)據(jù),對(duì)DUF1685基因家族成員進(jìn)行研究,包括成員鑒定、理化性質(zhì)分析、系統(tǒng)發(fā)育樹和選擇壓分析、蛋白保守基序和基因結(jié)構(gòu)分析,全方位探究DUF1685基因家族的功能和進(jìn)化情況,最終聚焦玉米DUF1685基因家族共線性分析和組織特異性表達(dá),以期為今后深入研究玉米基因生物學(xué)功能和進(jìn)化關(guān)系提供理論參考。
從數(shù)據(jù)庫(kù)Phytozome(http://www.Phytozome. net)下載甘藍(lán)()、白菜()、菠蘿()、擬南芥()、大豆()、柳枝稷()、棉花()、大麥()、苜蓿()、水稻()、高粱()和卷柏()基因組數(shù)據(jù)。從數(shù)據(jù)庫(kù)Ensemble plant(http://plants.ensembl.org/index.html)下載甘藍(lán)型油菜()和玉米()基因組數(shù)據(jù)。從數(shù)據(jù)庫(kù)Brassica Database(http:// brassicadb.org/brad)下載芥菜型油菜()、黑芥()和蘿卜()基因組數(shù)據(jù)。DUF1685(PF07939)的HMM模型從Pfam數(shù)據(jù)庫(kù)(https://pfam.xfam.org/)獲取。使用hmmsearch程序從下載的擬南芥蛋白序列中獲取DUF1685保守的蛋白序列,然后以該序列為模板對(duì)下載的各物種的蛋白質(zhì)序列進(jìn)行blastp(E≤1e-9)搜索,所得候選序列使用Pfam(http:// pfam.xfam.org/search)、Smart(http://smart. embl-heidelberg.de/)和CDD(https://www.ncbi. nlm.nih.gov/cdd)軟件去冗余。用在線分析軟件ExPasy中的ProtPar am tool(http://web.expasy. org/protparam)分析基因蛋白序列的理化性質(zhì),包括分子量(molecular weight)和理論等電點(diǎn)(theoretical pI)。
用Muscle 3.8.31軟件對(duì)鑒定到的基因進(jìn)行核苷酸多序列比對(duì),然后使用MEGA v7[15]軟件構(gòu)建鄰接發(fā)育樹(NJ),重復(fù)抽樣1000次。使用PAML[16](phylogenetic analysis by maximum likelihood)軟件中的Site模型(M0、M1、M2、M3、M7、M8)計(jì)算dN/dS并確定正選擇位點(diǎn)(經(jīng)驗(yàn)貝葉斯法),并對(duì)M0/M3、M1/M2、M7/M8 3對(duì)似然比值進(jìn)行似然比檢驗(yàn)(likelihood ratio test, LRT)。
使用MEME[17]軟件分析所獲候選DUF1685基因家族的蛋白保守基序,設(shè)置保守基序數(shù)目6個(gè),保守氨基酸殘基最小數(shù)目為10 aa,最大氨基酸數(shù)目為50 aa,其他參數(shù)默認(rèn)。基因外顯子和內(nèi)含子結(jié)構(gòu)使用Gene Structure Display Server 2.07[18]軟件分析。
使用TBtools[19]軟件可視化玉米基因的染色體定位。此外,使用帶MCScanX[20]的TBtools軟件分析玉米DUF1685基因家族的片段復(fù)制(fragment duplication)和串聯(lián)重復(fù)(tandem duplication)事件。
使用Perl軟件提取玉米基因CDS前2000 bp的上游序列,隨后利用在線軟件Plant CARE9(http://bioinformatics.psb. ugent.be/webt-o-ols/plantcare/html/)進(jìn)行基因順式作用元件預(yù)測(cè),并使用在線網(wǎng)站DSGS(http://gsds.gao-lab.org/)進(jìn)行可視化。在MaizeGDB數(shù)據(jù)庫(kù)(https://mai-ze-gdb.org/)下載玉米‘B73’不同生長(zhǎng)發(fā)育時(shí)期和部位的轉(zhuǎn)錄組數(shù)據(jù),使用R[21]軟件中的pheatmap包繪制聚類熱圖。
本研究在低等植物卷柏(),雙子葉植物[擬南芥()、甘藍(lán)型油菜()、甘藍(lán)()、白菜()、蘿卜()、芥菜型油菜()、黑芥()、苜蓿()、棉花()和大豆()]和單子葉植物[菠蘿()、大麥()、水稻()、玉米()、柳枝稷()和高粱()]共17個(gè)物種中鑒定了211個(gè)基因(表1)。卷柏中有5個(gè)基因;10個(gè)雙子葉植物中,基因成員數(shù)量由高到低排序?yàn)椋焊仕{(lán)型油菜(34個(gè))>芥菜型油菜(33個(gè))>白菜=黑芥(16個(gè))>蘿卜=棉花(15個(gè))>甘藍(lán)(12個(gè))>大豆(10個(gè))>擬南芥(9個(gè))>苜蓿(6個(gè));單子葉植物中,DUF168基因家族成員數(shù)量由高到低排序?yàn)椋毫︷ⅲ?1個(gè))>玉米(7個(gè))>高粱=菠蘿(6個(gè))>水稻=大麥(5個(gè))。蛋白理化性質(zhì)分析表明,211個(gè)基因的氨基酸序列長(zhǎng)度為83~1071 aa,分子量為9.2~116.3 kDa,理論等電點(diǎn)為3.66~11.90。
表1 DUF1685基因家族在植物中的分布
在構(gòu)建的鄰接樹(NJ)中,DUF1685基因家族被劃分了3個(gè)亞家族(圖1):Class I、Class II和Class III,其中Class I包含2個(gè)分支A1和A2,Class II包含2個(gè)分支B1和B2。在Class I、Class II和Class III亞家族中分別有89、62和57個(gè)基因(圖2A,圖3A,圖4A)。
在最大亞家族Class I中,分支A1的基因均是雙子葉植物基因(67個(gè),31.75%),分支A2中均是單子葉植物基因(22個(gè),10.43%),表明在單、雙子葉植物分化后產(chǎn)生了分支A1和A2,分支A1和A2分別含有67和22個(gè)基因,表明基因在分支A1中發(fā)生了基因擴(kuò)張。在Class II亞家族中,分支B1的基因均是單子葉植物基因(11個(gè),5.21%),分支B2中均是雙子葉植物基因(51個(gè),24.17%),表明也在單、雙子葉植物分化后產(chǎn)生了分支B1和B2,分支B1和B2分別有11和51個(gè)基因,表明基因在分支B2中發(fā)生了基因擴(kuò)張。
圖1DUF1685基因家族系統(tǒng)進(jìn)化樹
使用MEME軟件進(jìn)行了蛋白保守基序分析,結(jié)構(gòu)顯示motif 1和motif 2為大部分基因所共有。除了這2個(gè)motif外,在Class I亞家族中(圖2B),A1和A2分支主要包含motif 3。同時(shí),A1分支大部分基因含有motif 5;而A2分支中單子葉植物除了菠蘿含有motif 5,其余單子葉植物基因不含有motif 5,另外有小部分基因含有motif 6;在Class II亞家族中(圖3B),主要包含motif 3,大部分基因含有motif 4和motif 6;在Class III亞家族中(圖4B),所有的基因含有motif 4,部分含有motif 6。因此,結(jié)果表明Class II和Class III亞家族親緣關(guān)系更近。
B:不同顏色代表不同保守基序;C:藍(lán)色方塊代表非編碼區(qū),紅色方塊代表CDS,灰色線條代表內(nèi)含子。
B: Different colors represent different conserved motifs; C: The blue squares represent noncoding regions, the red squares represent CDS, and the gray lines represent introns.
圖2DUF1685基因家族Class I亞家族系統(tǒng)進(jìn)化樹(A)、保守基序(B)和基因結(jié)構(gòu)(C)分析
Fig. 2 Phylogenetic tree (A), conserved motif (B) and gene structure (C) analysis of DUF1685 gene Class I subfamily
基因結(jié)構(gòu)分析結(jié)果顯示,在Class I亞家族中(圖2C),74個(gè)基因含有1個(gè)內(nèi)含子,9個(gè)基因含有2個(gè)及以上內(nèi)含子,6個(gè)基因不含內(nèi)含子;在Class II亞家族中(圖3C),54個(gè)基因含有1個(gè)內(nèi)含子,6個(gè)基因含有2個(gè)內(nèi)含子,2個(gè)基因不含內(nèi)含子;在Class III亞家族中(圖4C),42個(gè)基因含有1個(gè)內(nèi)含子,11個(gè)基因含有2個(gè)及以上內(nèi)含子,4個(gè)基因不含內(nèi)含子。綜上所述,在DUF1685基因家族中,大部分基因含有1個(gè)內(nèi)含子,少部分基因含有2個(gè)及以上內(nèi)含子或者不含內(nèi)含子。
B:不同顏色代表不同保守基序;C:藍(lán)色方塊代表非編碼區(qū),紅色方塊代表CDS,灰色線條代表內(nèi)含子。
B: Different colors represent different conserved motifs; C: The blue squares represent noncoding regions, the red squares represent CDS, and the gray lines represent introns.
圖3DUF1685基因家族Class II亞家族系統(tǒng)進(jìn)化樹(A)、保守基序(B)和基因結(jié)構(gòu)(C)分析
Fig. 3 Phylogenetic tree (A), conserved motif (B) and gene structure (C) analysis of DUF1685 gene Class II subfamily
基于基因結(jié)構(gòu)和保守基序分析,本研究發(fā)現(xiàn)不同亞家族不同基因之間存在差異,于是對(duì)各亞家族進(jìn)行了選擇壓分析。運(yùn)用CODEML軟件中的Site模型計(jì)算了各亞家族的dN/dS值(表2)。A1分支中,似然比檢驗(yàn)(LRT)顯示Model M1和Model M2之間差異極顯著(<0.001),因此Model M2分析證明,約有9.4%的位點(diǎn)受到正選擇,ω2值為2.028 98;Model M7和Model M8之間差異極顯著(<0.001),因此Model M8分析證明,約有23%的位點(diǎn)受到正選擇,ω值為1.205 03。同時(shí)研究分析發(fā)現(xiàn),A1分支在Model M2和Model M8分析得到的正選擇位點(diǎn)均是129L。A2分支中,似然比檢驗(yàn)顯示Model M1和Model M2之間差異不顯著(=1.000);Model M7和Model M8之間差異極顯著(<0.001),因此Model M8分析證明,約有8.9%的位點(diǎn)受到正選擇,ω值為7.676 29,分析得到的正選擇位點(diǎn)是320和327。B1分支中,似然比檢驗(yàn)顯示Model M1和Model M2之間差異不顯著(=1.000);Model M7和Model M8之間差異極顯著(<0.001),因此Model M8分析證明,約有8.9%的位點(diǎn)受到正選擇,ω值為113.620 63,分析得到的正選擇位點(diǎn)是338P。Class III亞家族中,似然比檢驗(yàn)顯示Model M1和Model M2之間差異不顯著(=1.000);Model M7和Model M8之間差異極顯著(<0.001),因此Model M8分析證明,約有21.5%的位點(diǎn)受到正選擇,ω值為42.241 90,受到正選擇的位點(diǎn)有141個(gè)(表2)。綜上所述,DUF1685基因家族的A1、A2、B1和Class III中基因部分位點(diǎn)遭受到了一定的正選擇作用,推測(cè)DUF1685基因家族成員在進(jìn)化過程中由于正選擇作用,可能導(dǎo)致部分基因發(fā)生功能變化。
B:不同顏色代表不同保守基序;C:藍(lán)色方塊代表非編碼區(qū),紅色方塊代表CDS,灰色線條代表內(nèi)含子。
B: Different colors represent different conserved motifs; C: The blue squares represent noncoding regions, the red squares represent CDS, and the gray lines represent introns.
圖4DUF1685基因家族Class III亞家族系統(tǒng)進(jìn)化樹(A)、保守基序(B)和基因結(jié)構(gòu)(C)分析
Fig. 4 Phylogenetic tree (A), conserved motif (B) and gene structure (C) analysis of DUF1685 gene Class III subfamily
利用玉米基因組注釋信息和TBtools可視化了DUF1685基因家族的染色體分布。圖5A結(jié)果表明7個(gè)在5條染色體上,每條染色體上的基因個(gè)數(shù)與染色體大小無關(guān)。最大的染色體(Chr01)不含基因,Chr02()、Chr03()、Chr08()和Chr 10()各含1個(gè)基因,Chr04含3個(gè)基因(、)。
全基因組復(fù)制分析對(duì)于物種的起源、進(jìn)化和基因組擴(kuò)展具有重要意義。因此,分析了玉米DUF1685基因家族復(fù)制事件,以了解基因復(fù)制事件的原因。結(jié)果顯示(圖5B),檢測(cè)到1對(duì)基因有片段復(fù)制事件(segmental duplication events),Chr03的和Chr08的為片段重復(fù)基因?qū)?。此外,發(fā)現(xiàn)玉米基因不存在串聯(lián)重復(fù)基因?qū)κ录?。綜上結(jié)果表明,基因的片段復(fù)制事件可能是玉米基因組中基因擴(kuò)增和進(jìn)化的潛在驅(qū)動(dòng)力。
對(duì)啟動(dòng)子序列進(jìn)行順式作用元件預(yù)測(cè)(圖6),發(fā)現(xiàn)7個(gè)玉米共有的順式作用元件有7個(gè)。7個(gè)共有的順式作用元件分別為ABRE、TATA-box、MYC、G-box、CAAT-box、MYB和STRE(表3)。7個(gè)順式作用元件中,啟動(dòng)子常見順式作用元件是轉(zhuǎn)錄起始–30核心啟動(dòng)子元件(TATA-box)和順式作用元件(CAAT-box);與非生物脅迫相關(guān)的順式作用元件包括脫落酸響應(yīng)元件(ABRE)、干旱和ABA應(yīng)答元件(MYB、MYC)、光響應(yīng)元件(G-box)、熱誘導(dǎo)元件(STRE)。由此可以推測(cè),在玉米進(jìn)化過程中,DUF1685基因家族成員在復(fù)制擴(kuò)增時(shí),依然有保守序列穩(wěn)定選擇,參與了玉米對(duì)非生物脅迫的響應(yīng)。
表2 Site模型下DUF1685基因家族dN/dS估計(jì)和似然比檢驗(yàn)
注:在99%水平下推斷為正選擇的位點(diǎn)以粗體列出,95%水平的位點(diǎn)以斜體列出。
Note: Sites inferred to be under positive selection at the 99% level are listed in bold and those at the 95% level are in italic.
灰線代表玉米中所有基因的復(fù)制事件,紅線代表DUF1685基因內(nèi)的片段復(fù)制事件。
圖6 DUF1685基因啟動(dòng)子順式作用元件預(yù)測(cè)
表3 玉米DUF1685基因啟動(dòng)子順式作用元件分析
為探究玉米基因的時(shí)空表達(dá)特異性,對(duì)7個(gè)玉米基因()在玉米不同生長(zhǎng)發(fā)育時(shí)期的轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行分析?;虮磉_(dá)聚類分析結(jié)果顯示,玉米基因在不同組織中表達(dá)差異較大(圖7)。在23個(gè)不同生長(zhǎng)時(shí)期均未表達(dá)(未在表達(dá)聚類圖7中顯示),說明未參與玉米相關(guān)生命活動(dòng)。和在玉米成熟花粉中表現(xiàn)出較高的表達(dá)水平;在玉米成熟花粉中表現(xiàn)出較低的表達(dá)水平。
1:6~7節(jié)間;2:7~8節(jié)間;3:植物分生組織16~19 d;4:耳原基2~4 mm;5:耳原基6~8 mm;6:授粉后20 d胚胎;7:授粉后38 d胚胎;8:授粉后12 d胚乳;9:授粉后27 d胚乳冠;10:籽粒發(fā)芽后2 d;11:授粉后27 d果皮/糊粉層;12:葉區(qū)1(對(duì)稱);13:葉區(qū)2(氣孔);14:葉區(qū)3(生長(zhǎng));15:成熟的葉子;16:主根;17:根—皮質(zhì)5 d;18:根—伸長(zhǎng)區(qū)5 d;19:根—分生組織區(qū)5 d;20:次生根7~8 d;21:成熟花粉;22:雌性小穗當(dāng)天收集為穗絲;23:穗絲。
目前,DUF1685基因家族的功能尚未被廣泛研究。本研究利用生物學(xué)手段從16個(gè)單、雙子葉植物和卷柏基因組中共鑒定到211個(gè)基因,各物種DUF1685基因家族成員數(shù)量不同以及各亞家族成員數(shù)量不同,一方面與各物種倍性不同有關(guān),另一方面說明DUF1685基因家族存在一定的基因丟失或擴(kuò)張現(xiàn)象。基因家族成員間的氨基酸數(shù)目、等電點(diǎn)、分子量區(qū)間范圍較大,表明家族成員之間理化性質(zhì)存在差異。同時(shí),大多數(shù)基因家族成員具有相同的基因結(jié)構(gòu)和保守基序,而各亞家族具有該亞家族特有的基因結(jié)構(gòu)和保守基序,因此筆者認(rèn)為DUF1685基因家族在進(jìn)化過程中存在一定的保守性,同時(shí)在進(jìn)化的過程中一些基因也發(fā)生了變化,以此來適應(yīng)人工和自然選擇。筆者認(rèn)為通過分析基因理化性質(zhì),能在一定程度上揭示基因家族進(jìn)化基本情況,為后續(xù)DUF1685基因家族進(jìn)化深入分析奠定了基礎(chǔ)。
植物在生長(zhǎng)發(fā)育過程中面臨環(huán)境壓力時(shí),基因上游的順式作用元件與特異性轉(zhuǎn)錄因子結(jié)合,特異性調(diào)節(jié)基因在植物中的表達(dá),增加對(duì)環(huán)境的適應(yīng)性,因此,啟動(dòng)子分析對(duì)研究基因功能起著至關(guān)重要的作用。MYB轉(zhuǎn)錄因子廣泛分布于高等植物中,在植物抗逆反應(yīng)中發(fā)揮著最重要的作用。已有研究表明,MYB轉(zhuǎn)錄因子通過與上游的順式作用元件特異結(jié)合,參與植物次生代謝、激素和環(huán)境因子反應(yīng),在細(xì)胞分化、細(xì)胞周期和葉片形態(tài)發(fā)生中起重要調(diào)節(jié)作用[22-24]。擬南芥的脫水反應(yīng)基因其啟動(dòng)子中一段67 bp序列對(duì)干旱和ABA應(yīng)答,并且在這段序列上包括順式作用元件MYC、MYB和GT-1[25]。G-box元件可能起到介導(dǎo)水稻葉片早期衰老誘導(dǎo)的表達(dá),并且順式元件的拷貝數(shù)顯著影響表達(dá)水平[26]。本研究發(fā)現(xiàn),7個(gè)玉米基因啟動(dòng)子均含有光響應(yīng)元件(G-box),結(jié)合已有研究[26],說明玉米基因可能參與光合作用調(diào)控途徑。在逆境脅迫方面,ABA響應(yīng)(ABRE)、干旱響應(yīng)(MYB和MYC)、熱誘導(dǎo)調(diào)控(STRE)元件均存在于玉米基因中,說明基因在玉米應(yīng)對(duì)這些逆境脅迫中均發(fā)揮著相應(yīng)作用?;蛟谔囟ㄆ鞴僦懈咚奖磉_(dá)意味著其在相關(guān)生理過程中發(fā)揮重要作用?;ǚ郯l(fā)育過程中的基因,大致分為3類:第一類是組成型表達(dá)基因,第二類是花粉發(fā)育特異表達(dá)基因,第三類是介于前二者之間的在花粉中表達(dá)較高而在少數(shù)幾種組織中也有少量表達(dá)的基因(玉米花粉發(fā)育相關(guān)基因的克隆及其原核表達(dá))。學(xué)者通常認(rèn)為只有在植物花粉發(fā)育過程中特異表達(dá)的基因,才能特異地在花粉發(fā)育中起作用[27]。ALLEN等[28]研究發(fā)現(xiàn)了1個(gè)結(jié)構(gòu)保守,在花粉成熟晚期特異表達(dá)的基因。陳曉陽[29]研究發(fā)現(xiàn),基因特異地在幼嫩的雄穗中表達(dá),通過參與脂類物質(zhì)的合成,從而調(diào)控花藥角質(zhì)層和花粉外壁的形成,進(jìn)而影響花粉發(fā)育。在本研究中,玉米基因在成熟花粉中出現(xiàn)表達(dá)差異,暗示了其可能參與了花粉發(fā)育相關(guān)的生理活動(dòng)過程,這為后續(xù)研究提供了玉米基因功能驗(yàn)證的初步方向。
研究者通過檢測(cè)基因組或基因中非同義與同義突變來研究自然選擇對(duì)物種進(jìn)化的影響。如果核苷酸序列的非同義替換率/同義替換率(dN/dS)的比小于1,則意味著純凈選擇(purifying selection);如果比值等于1,則意味著中性選擇(neutral selection);如果比值大于1,則意味著正向選擇(positive selection)[30]。大部分茶葉基因[31]和向日葵HaWRKY基因家族在進(jìn)化過程中都經(jīng)歷了強(qiáng)烈的純化選擇(dN/dS<1)[32]。在本研究中,7個(gè)玉米在進(jìn)化過程中受到了正向選擇,與茶葉基因和向日葵HaWRKY基因家族受到的選擇壓情況有所不同。同時(shí),進(jìn)化樹結(jié)合基因表達(dá)情況分析發(fā)現(xiàn),玉米成熟花粉中表現(xiàn)出高表達(dá)的2個(gè)基因(和)聚類在B1分支,低表達(dá)或零表達(dá)的4個(gè)基因(和)聚類在A2分支,說明序列相似度較高的基因可能其表達(dá)情況更相似。片段復(fù)制(segmentally duplicate)和串聯(lián)重復(fù)(tandemly duplicate)是基因加倍的2種重要方式[33]。已有研究發(fā)現(xiàn)片段重復(fù)事件是楊樹基因[34]和甘藍(lán)型油菜基因[35]擴(kuò)增和進(jìn)化的力量。在本研究中,玉米DUF1685基因家族的1對(duì)片段復(fù)制基因(和)同屬A2分支,而2個(gè)基因的表達(dá)情況存在一定差異。本研究?jī)H下載了玉米‘B73’的轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行表達(dá)分析,后期有必要選擇多個(gè)玉米品種和其他植物物種分析其表達(dá)情況。
[1] BATEMAN A, BIRNEY E, DURBIN R, EDDY S R, HOWE K L, SONNHAMMER E L. The pfam protein families database[J]. Nucleic Acids Research, 2000, 28(1): 263-266.
[2] JIANG J, LI J H, XU Y Y, YE H, BAI Y, ZHOU G X, LOU Y G, XU Z H, KANG C. RNAi knockdown ofroot meander curling gene led to altered root development and coiling which were mediated by jasmonic acid signalling in rice[J]. Plant, Cell & Environment, 2010, 30(6): 690-699.
[3] LEAURE C D, TONG H Y, YUEN G G, HOU X W, SEN X F, HE Z H. Root UV-B sensitive2 acts with root UV-B sensitive1 in a root ultraviolet B-sensing pathway[J]. Plant Physiology, 2009, 150(4): 1902-1915.
[4] CAO X, YANG K Z, XIA C, ZHANG X Q, YE C D. Characterization of DUF724 gene family in[J]. Plant Molecular Biology, 2010, 72(1-2): 61-73.
[5] Zú?IGA-SáNCHEZ E, SORIANO D, MARTíNEZ- BARA JAS E, OROZCO-SEGOVIA A, GAMBO-DEBUEN A., theDUF642 gene, is involved in pectin methyl esterase regulation duringseed germination and plant development[J]. BMC Plant Biology, 2014, 14: 338.
[6] JONES-RHOADES M W, BOREVITZ J O, PREUSS D. Genome-wide expression profiling of thefemale gametophyte identifies families of small, secreted proteins[J]. PLoS Genetics, 2007, 3(10): 1848-1861.
[7] LI X, SUN L J, TAN L B, LIU F X, ZHU Z F, FU Y C, SUN X Y, SUN X W, XIE D X, SUN C Q., a DUF640 domain-like gene controls lemma and palea development in rice[J]. Plant Molecular Biology, 2012, 78(4/5): 351-359.
[8] LUO C K, GUO C M, WANG W J, WANG L J, CHEN L. Overexpression of a new stress-repressive geneencoding a protein with a DUF966 domain increases salt and simulated drought stress sensitivities and reduces ABA sensitivity in rice[J]. Plant Cell Reports, 2014, 33(2): 323-336.
[9] HOU X, LIANG Y, HE X, SHEN Y. A novel ABA-responsivegene from wheat contributes to enhanced resistance to salt stress in[J]. Plant Molecular Biology Reporter, 2013, 31(4): 791-801.
[10] PALMEROS-SUáREZ P A, MASSANGE-SáNCHEZ J A, SáNCHEZ-SEGURA L,MARTíNEZ-GALLARDO N A, RANGEL E E, GóMEZ-LEYVAe J F, DéLANO-FRIER J P., an amaranth abiotic stress-induced DUF642 protein gene, modifies cell wall structure and composition and causes salt and ABA hyper-sensibility in transgenic[J]. Planta, 2017, 245(3): 623-640.
[11] XIE X Q, WANG Y J., a gene isolated from the Chinese grape, is involved in berry development and pathogen resistance[J]. Planta, 2016, 244(5): 1075-1094.
[12] MATSUOKA Y, VIGOUROUX Y, GOODMAN M M, SANCHEZ G J, BUCKLER E, DOEBLEY J. A single domestication for maize shown by multilocus microsatellite genotyping[J]. Proceedings of the National Academy of Sciences of the United States of America, 2002, 99(9): 6080- 6084.
[13] SCHNABLE P S, WARE D, FULTON R S, STEIN J C, WEI F S, PASTERNAK S, LIANG C Z, WILSON R K. The B73 maize genome: complexity, diversity, and dynamics[J]. Science, 2009, 326(5956): 1112-1115.
[14] YIN L Q, ZHU Z D, HUANG L J, LUO X, LI Y, XIAO C W, YANG J, WANG J S, ZOU Q, TAO L R, KANG Z M, TANG R, WANG M L, FU S H. DNA repair- and nucleotide metabolism-related genes exhibit differential CHG methylation patterns in natural and synthetic polyploids (L.)[J]. Horticulture Research, 2021, 8(1): 142.
[15] SUDHIR K, GLEN S, TAMURA K. MEGA7: molecular evolutionary genetics analysis version 7.0 for bigger datasets[J]. Molecular Biology & Evolution, 2016, 33(7): 1870-1874.
[16] YANG Z H. PAML 4: phylogenetic analysis by maximum likelihood[J]. Molecular Biology and Evolution, 2007, 24(8): 1586-1591.
[17] BALEY T L, BODEN M, BUKE F A, FRITH M, GRANT C E, CLEMENTI L, REN J Y, LI W W, NOBLE W S. MEME Suite: tools for motif discovery and searching[J]. Nucleic Acids Research, 2009, 37(suppl_2): W202-W208.
[18] HU B, JIN J, GUO A Y, ZHANG H, LUO J, GAO G. GSDS 2.0: an upgraded gene feature visualization server[J]. Bioinformatics, 2015, 31(8): 1296-1297.
[19] CHEN C, CHEN H, ZHANG Y, THOMAS H R, XIA R. TBtools: an integrative toolkit developed for interactive analyses of big biological data[J]. Molecular Plant, 2020, 13(8): 1194-1202.
[20] WANG Y P, TANG H B, DEBARRY J D, TAN X, LI J P, WANG X Y, LEE T, JIN H Z, MARLER B, GUO H, KISSINGER J C, PATERSON A H. MCScanX: a toolkit for detection and evolutionary analysis of gene synteny and collinearity[J]. Nucleic Acids Research, 2012, 40(7): e49.
[21] TEAM D C R. R: A Language and environment for statistical computing[J]. R Foundation for Statistical Computing, 2011, 1: 12-21.
[22] CHEN S, PENG S, HUANG G, WU K, FU X, CHEN Z. Association of decreased expression of a Myb transcription factor with the TPD (tapping panel dryness) syndrome in[J]. Plant Molecular Biology, 2003, 51(1): 51-58.
[23] SUO J, LIANG X E, PU L, ZHANG Y S, XUE Y B. Identification ofencoding aMYB transcription factor that expressed specifically in fiber initials and elongating fibers of cotton (L.)[J]. Biochimica et Biophysica Acta (BBA)-Gene Structure and Expression, 2003, 1630(1): 25-34.
[24] YANG X Y, LI J G, PEI M, GU H, CHEN Z L, QU L J. Over-expression of a flower-specific transcription factor genecauses aberrant anther development[J]. Plant Cell Reports, 2007, 26(2): 219-228.
[25] IWASAKI T, YAMAGUCHI-SHINOZAKI K, SHINOZAKI K. Identification of a cis-regulatory region of a gene inwhose induction by dehydration is mediated by abscisic acid and requires protein synthesis[J]. Molecular & General Genetics, 1995, 247(4): 391-398.
[26] LIU L, XU W, HU X, LIU H J, LIN Y J.andelements play important roles in early senescence of rice flag leaf[J]. Science Report, 2016, 6: 20881.
[27] WILLING R P, MASCARENHAS J P. Analysis of the complexity and diversity of mRNAs from pollen and shoots of[J]. Plant Physiology, 1984, 75(3): 865-868.
[28] ALLEN R L, LONSDALE D M. Molecular characterization of one of the maize polygalacturonase gene family members which are expressed during late pollen development[J]. Plant Journal, 2010, 3(2): 261-71.
[29] 陳曉陽. 玉米雄性不育基因克隆與功能分析[D]. 北京: 中國(guó)農(nóng)業(yè)大學(xué), 2017.
CHEN X Y. Cloning and functional analysis of maize male sterility gene[D]. Beijing: China Agricultural University, 2017. (in Chinese)
[30] BOWERS J E, CHAPMAN B A, RONG J, PATERSON A H. Unravelling angiosperm genome evolution by phylogenetic analysis of chromosomal duplication events[J]. Nature, 2003, 422(6930): 433-438.
[31] PAUL A, CHATTERJEE A, SUBRAHMANYA S, SHEN G X, MISHRA N.gene family in:genome-wide identification, expression profiles, and regulatory network analysis[J]. Frontiers in Plant Science, 2021, 12: 777884.
[32] LI J, ISLAM F, HUANG Q, WANG J, ZHOU W J, XU L, YANG C. Genome-wide characterization ofgene family inL. and their expression profiles under biotic and abiotic stresses[J]. PLoS One, 2020, 15(12): e0241965.
[33] ZHU Y, WU N, SONG W L, YIN G J, QIN Y J, YAN Y M, HU Y K. Soybean () expansin gene superfamily origins: segmental and tandem duplication events followed by divergent selection among subfamilies[J]. BMC Plant Biology, 2014, 14: 93.
[34] ZHAO K, CHEN S, YAO W, CHENG Z H, ZHOU B R, JIANG T B. Genome-wide analysis and expression profile of thegene family in poplar[J]. BMC Plant Biology, 2021, 21(1): 122.
[35] CHEN Y, ZHOU R, HU Q, WEI W, LIU J. Conservation and divergence of the() genes related to flowering and circadian rhythm in[J]. Frontiers in Plant Science, 2021, 12: 760379.
Identification and Evolutionary Analysis of Maize DUF1685 Gene Family
LUO Xuan1, LIN Zhengyu1, CHEN Zhang1, LEI Bo1, LI Jie1, QUAN Jinying1, LIU Hailan2*
1. Agricultural Information and Rural Economy Research Institute, Sichuan Academy of Agricultural Sciences, Chengdu, Sichuan 610066, China; 2. Maize Research Institute, Sichuan Agricultural University, Chengdu, Sichuan 611130, China
A total of 211 DUF1685 gene family members in 16 monocotyledonous and dicotyledon andwere identified in this study. Analysis of protein physicochemical properties showed that the amino acid sequences of 211genes ranged in length from 83 to 1071 aa, molecular weights from 9.2 to 116.3 kDa, and theoretical isoelectric points from 3.66 to 11.90. Phylogenetic evolution analysis showed that the DUF1685 gene family were divided into three subfamilies (Class I, Class II and Class III). The events of A1 and A2, B1 and B2 in the Class I and Class II subfamilies occurred after the differentiation of monocotyledonous plants, and A1 and B2 branches (members were all dicotyledonous genes) had gene expansion phenomenon. The results of conserved motifs and gene structure analysis showed that the conserved motifs among members of the same subfamily were similar. Most of the 211 DUF1685 family genes contained one intron, and a few genes contained two or more introns or no introns. Selection pressure analysis showed that the related loci of DUF1685 family genes were positively selected during the evolution process, which may be the reason for the functional changes of some genes. Collinearity analysis indicated that fragment duplication events may be a potential driver ofgene amplification and evolution in the maize. The results of cis-element analysis in the gene promoter region showed that the promoter region of maizegene contained light-responsive elements, ABA and cis-acting elements related to abiotic stress. It was speculated that the genes may be involved in the response of maize to abiotic stress. Transcriptome data analysis revealed that the maizegene was associated with the growth and development of specific tissues (mature pollen). This study explored the function and evolution of the maize DUF1685 gene family in various aspects to provide a theoretical reference for the in-depth study of the biological function and evolutionary relationship of the maizegene in the future.
gene; gene identification; evolutionary analysis
S513
A
10.3969/j.issn.1000-2561.2022.12.005
2022-04-24;
2022-05-23
四川省重點(diǎn)研發(fā)項(xiàng)目(No. 2021YFYZ0028);四川省科技計(jì)劃項(xiàng)目(No. 2020YJ0466)。
羅 璇(1995—),女,碩士,研究實(shí)習(xí)員,研究方向:作物遺傳育種。*通信作者(Corresponding author):劉海嵐(LIU Hailan),E-mail:lhlzju@hotmail.com。