張經(jīng)博,李波,楊洋,胡文冉,陳方圓,謝麗霞,范玲
(1. 新疆師范大學(xué)生命科學(xué)學(xué)院,烏魯木齊 830054;2. 新疆農(nóng)業(yè)科學(xué)院核技術(shù)生物技術(shù)研究所,烏魯木齊 830091)
?
陸地棉CAD基因家族的進(jìn)化和表達(dá)分析
張經(jīng)博1,2,李波2,楊洋2,胡文冉2,陳方圓1,2,謝麗霞2,范玲2
(1. 新疆師范大學(xué)生命科學(xué)學(xué)院,烏魯木齊 830054;2. 新疆農(nóng)業(yè)科學(xué)院核技術(shù)生物技術(shù)研究所,烏魯木齊 830091)
【目的】對(duì)陸地棉CAD基因家族成員進(jìn)行進(jìn)化和表達(dá)分析,了解其在棉纖維發(fā)育中的作用?!痉椒ā繎?yīng)用生物信息學(xué)方法,從棉花基因組中篩選出21個(gè)CAD基因,并對(duì)CAD的基因結(jié)構(gòu)、染色體分布、基因倍增模式以及系統(tǒng)進(jìn)化進(jìn)行分析。利用深度表達(dá)數(shù)據(jù)分析CAD基因在棉纖維發(fā)育各時(shí)期的表達(dá)。對(duì)比觀察擬南芥cad5突變體和野生型根毛表型。 【結(jié)果】同源性高的CAD基因復(fù)制對(duì)之間有相似的基因結(jié)構(gòu);片段重復(fù)和串聯(lián)重復(fù)是CAD基因擴(kuò)增的主要方式。進(jìn)化分析可知,CAD基因可分為七個(gè)亞組,且功能相近的基因聚類在相同亞組。利用深度測(cè)序表達(dá)數(shù)據(jù)分析可知,CAD基因在棉纖維各個(gè)發(fā)育時(shí)期均有表達(dá)。對(duì)比擬南芥cad5突變體和野生型根毛發(fā)現(xiàn),突變體相比于野生型有更長(zhǎng)的根毛?!窘Y(jié)論】CAD基因參與了棉纖維的發(fā)育的過(guò)程,并對(duì)棉花纖維發(fā)育起到一定的調(diào)控作用。
棉纖維;CAD基因家族;系統(tǒng)進(jìn)化分析;表達(dá)分析;cad5突變體;根毛
【研究意義】棉花是一種重要的經(jīng)濟(jì)作物,在全球100多個(gè)國(guó)家廣泛種植,由它生產(chǎn)的棉纖維是全球重要的紡織原料之一,具有極其重要的經(jīng)濟(jì)價(jià)值[1]。陸地棉(Gossypiumhirsutum)是栽培面積及經(jīng)濟(jì)效益最大的栽培棉種,它貢獻(xiàn)了超過(guò)90%的棉花產(chǎn)量。此外棉花還是研究染色體加倍,細(xì)胞伸長(zhǎng)和細(xì)胞壁合成的重要模式植物[2]。棉花纖維是由胚珠表皮單細(xì)胞分化而成, 在纖維發(fā)育過(guò)程初期,纖維細(xì)胞以極快的速度同步化延伸,并最終分化成為超長(zhǎng)的單一極性細(xì)胞[3],棉纖維需要經(jīng)歷纖維原始細(xì)胞的分化和突起、初生壁伸長(zhǎng)、次生壁增厚和脫水成熟 4 個(gè)依次并相互重疊的過(guò)程,一般 45~50 d,涉及上千個(gè)基因的特異表達(dá)和蛋白相互作用[4]。研究棉纖維發(fā)育為棉纖維品質(zhì)改良提供依據(jù),闡明植物細(xì)胞伸長(zhǎng)的重要手段,具有顯著的學(xué)術(shù)理論價(jià)值和潛在經(jīng)濟(jì)價(jià)值。隨著陸地棉的基因組測(cè)序工作已經(jīng)完成,為在陸地棉中識(shí)別不同的基因家族以及了解其在棉花生長(zhǎng)發(fā)育過(guò)程中的作用提供了可能[5]。【前人研究進(jìn)展】細(xì)胞壁是植物區(qū)別與動(dòng)物的主要器官之一。成熟棉花纖維細(xì)胞主要的組成部分就是細(xì)胞壁,細(xì)胞壁的沉積與改變對(duì)植物的生長(zhǎng)、發(fā)育以及對(duì)外界環(huán)境的響應(yīng)都有重要的作用,它最終決定了植物細(xì)胞的大小與形狀。木質(zhì)素是高等植物細(xì)胞壁的重要組成成分[6]。棉花纖維是單一超長(zhǎng)的極性細(xì)胞,成熟的棉花纖維細(xì)胞壁中存在有木質(zhì)素,木質(zhì)素通常在次生細(xì)胞壁中積累[7, 8]。肉桂醇脫氫酶(cinnamyl alcohol dehydrogenase, CAD) 是一類參與木質(zhì)素合成途徑中的酶[9], 通常情況下, 它能夠?qū)⒛举|(zhì)素前體和木脂素類物質(zhì)轉(zhuǎn)化成木質(zhì)素單體。 因此,CAD基因在植株生長(zhǎng)發(fā)育過(guò)程中的作用尤為重要。CAD蛋白都具保守結(jié)構(gòu)域 ADH_N 和ADH_zinc_N[10, 11]。根據(jù)種間核苷酸和氨基酸序列同源性的差異可將CAD基因分成 3 類, 其中第 1 類主要是石松類 、單子葉 、真雙子葉(eudicots) 和裸子植物的CAD基因; 第 2 和第 3 類主要是單子葉和真雙子葉植物的CAD基因。 第一類CAD基因都能夠參與到維管束的發(fā)育和和木質(zhì)素的合成過(guò)程,在木質(zhì)素合成過(guò)程中它們將松柏醛和芥子醛還原成相應(yīng)醇[12], 同第 1 類CAD基因相比第 2 和第3 類CAD基因在木質(zhì)素合成中的作用并不突出, 可能是第1類CAD基因的冗余基因,也不能排除在植物發(fā)育其它方面的功能作用。 【本研究切入點(diǎn)】目前已經(jīng)在多種植物中對(duì)CAD基因成員進(jìn)行了鑒定[13]。全面的基因家族分析尚未在棉花中研究。隨著陸地棉基因組測(cè)序的完成,能夠在全基因組水平上對(duì)CAD基因家族進(jìn)行分析和闡述?!緮M解決的關(guān)鍵問(wèn)題】利用生物信息學(xué)方法,對(duì)陸地棉全基因組的CAD基因進(jìn)行鑒定和系統(tǒng)進(jìn)化分析,并對(duì)其在棉纖維發(fā)育過(guò)程中的基因表達(dá)模式進(jìn)行分析,為改良棉花纖維品質(zhì)等重要農(nóng)藝性狀提供候選基因,為全基因組水平上的棉花分子育種提供參考和基礎(chǔ)。
1.1 材 料
陸地棉的基因組數(shù)據(jù)和蛋白質(zhì)數(shù)據(jù)均從cotton genome project(http://cgp.genomics.org.cn/page/species/download.jspategory=hirsutum) 處下載,利用本地blastp的方法以擬南芥的CAD蛋白質(zhì)序列為探針,預(yù)測(cè)陸地棉的CAD基因家族成員,E值設(shè)定 1.2 方 法 1.2.1CAD基因的系統(tǒng)進(jìn)化分析 將棉花、擬南芥、高粱、水稻、楊樹的CAD蛋白質(zhì)序列利用Cluster X19進(jìn)行比對(duì)。隨后將比對(duì)結(jié)果利用MEGA6.0軟件根據(jù)比對(duì)結(jié)果構(gòu)建系統(tǒng)進(jìn)化樹,構(gòu)建系統(tǒng)樹的方法采用鄰接法,Bootstrap 重復(fù)次數(shù) (Replications)設(shè)置為1 000[16],然后將生成的無(wú)根樹提交到ITOL(http://itol.embl.de/) 形成環(huán)形進(jìn)化樹。 1.2.2CAD基因染色體定位和復(fù)制共線性分析 利用本地BLASTN從陸地棉基因組數(shù)據(jù)庫(kù)中獲取各CAD基因的染色體定位信息,通過(guò)MapDraw 2.2 軟件作圖[17]。隨后根據(jù)文獻(xiàn)[18,19]研究方法檢查陸地棉CAD基因的復(fù)制情況,根據(jù)蛋白序列比對(duì)對(duì)結(jié)果識(shí)別同源基因?qū)Γ?jīng)過(guò)比對(duì)后短序列如果能覆蓋超過(guò)長(zhǎng)序列70%的區(qū)域,認(rèn)為這對(duì)同源基因?yàn)橹貜?fù)基因(duplication genes)。利用DnaSp軟件計(jì)算重復(fù)基因?qū)Φ膋a(非同義突變率)、ks(同義突變率)值,確定其在進(jìn)化過(guò)程中所受何種選擇。 1.2.3CAD基因結(jié)構(gòu)分析 將GhCAD基因的編碼序列和對(duì)應(yīng)的全基因組序列呈送到(http://gsds.cbi.pku.edu.cn/)[20]獲得各基因的內(nèi)含子、外顯子個(gè)數(shù)和排布情況。 1.2.4CAD基因在棉纖維不同發(fā)育時(shí)期的表達(dá)分析 為了獲得GhCAD基因在棉纖維發(fā)育過(guò)程中的表達(dá)情況,利用陸地棉標(biāo)準(zhǔn)系 TM-1 纖維的深度測(cè)序數(shù)據(jù)來(lái)分析CAD基因在纖維中的表達(dá)情況。數(shù)據(jù)下載與SRA 數(shù)據(jù)庫(kù)(http://www.ncbi.nlm.nih.gov/sra/)。登錄號(hào)為:5 dpa(SRX797917), 10 dpa(SRX797918),20 dpa(SRX797919),25 dpa(SRX797920)。隨后利用Tophat將轉(zhuǎn)錄組數(shù)據(jù)mapping到GhCAD基因上,然后利用cufflinks估計(jì)CAD基因的表達(dá)水平[21]。 1.2.5 棉花CAD基因和擬南芥CAD基因的同源性分析 利用進(jìn)化分析和序列比對(duì)的方法,找出GhCAD3和GhCAD6在擬南芥中的同源基因。并利用ClustlX2對(duì)三個(gè)基因進(jìn)行同源性分析。 1.2.6 擬南芥純和突變體的篩選和鑒定 擬南芥(Arabidopsisthaliana)野生型(Columbia-0型)和T-DNA插入突變系(Salk_019355)T1代種子由美國(guó)俄亥俄州立大學(xué)ABRC (Arabidopsis Biological Resource Center)提供。使用三引物法篩選 T-DNA 插入純合突變體(以下簡(jiǎn)稱純合突變體)基因型的鑒定需要 3 條引物(LBb1+LP+RP)[22],PCR 所用引物的設(shè)計(jì)參照 SIAGnAL 的相關(guān)資料(http://signal.salk.edu/isectprimers.html),3條引物序列為L(zhǎng)P:5' TCACCGCAATCAAATAAAACC3';RP:5' AGGTCAA GAATCAACAGCTGG 3';LBb1:5' GCGTGGA CCGCTTGCTGCAACT 3'。 將購(gòu)買的突變體cad5 種子播種于盛有蛭石的小缽內(nèi),待植株生長(zhǎng) 30 d 后,隨機(jī)選取 10 株,以 Col 野生型擬南芥為對(duì)照,分別提取全基因組 DNA,分別采用LP/RP 和 BP/RP 引物組合,以全基因組 DNA 為模板進(jìn)行 PCR 擴(kuò)增, 根據(jù)電泳結(jié)果判斷該植株是否為純合突變體。LP/RP 和 BP/RP 預(yù)期 PCR 產(chǎn)物大小分別為 1 287 bp 和 1 272 bp。 1.2.7 野生型和突變體AtCAD5基因轉(zhuǎn)錄水平比較 為了獲得野生型和突變體植株AtCAD5轉(zhuǎn)錄情況信息,取適當(dāng)生長(zhǎng)時(shí)期,已初步鑒定的純合突變體和 Col 野生型擬南芥的葉片組織作材料,采用 Trizol 法提取適當(dāng)組織的總 RNA,反轉(zhuǎn)錄為cDNA,根據(jù) TAIR 網(wǎng)站(http://www.arabidopsis.org)上公布的擬南芥AtCAD5基因 cDNA 序列, 采用Primer Premier 5 引物設(shè)計(jì)軟件設(shè)計(jì)了引物,引物采用Primer Premier 5 引物件設(shè)計(jì),序列為:AtCAD5-F: 5‘CAACGGTAAACTTGTTCTACTCGGT3’,AtCAD5-R: 5‘AGATCGAGTAGCAGCCAATGTATTA33’,AtUBQ5-F:5‘GGTGCTAAGAAGAGGAAGAAT3’,AtUBQ5-R:5‘CTCCTTCTTTCTGGTAAACGT3’。進(jìn)行RT-PCR和Quantitative RT-PCR檢測(cè)。 熒光定量PCR使用儀器為BIO-RAD CFX Connect 熒光定量系統(tǒng)。使用試劑Power SYBR Green PCR Master Mix (Applied Biosystems Cat:4367659)。 1.2.8 野生型和突變體植株根毛表型觀察 將生長(zhǎng)有擬南芥野生型和突變體幼苗的培養(yǎng)皿置于體式鏡(MZFLlll,LeicaMicrosystem,wetslar,Ge~ay)載物臺(tái)上, 對(duì)距根尖第2和第3 mm處根上的根毛進(jìn)行拍照,每個(gè)處理重復(fù)三次, 每個(gè)重復(fù)15棵苗,利用軟件MoticIinagesplus2.0分析根毛長(zhǎng)度[23]。 2.1 陸地棉基因組中CAD基因的鑒定 利用已知的擬南芥9個(gè)CAD基因作為模板,運(yùn)用本地BlastP, 設(shè)E值 2.2CAD基因的系統(tǒng)進(jìn)化 下載了已經(jīng)報(bào)道了的擬南芥、水稻、高粱以及楊樹的CAD基因的氨基酸序列同棉花的CAD蛋白進(jìn)行系統(tǒng)進(jìn)化分析。系統(tǒng)發(fā)育樹顯示植物CAD基因家族分成了7個(gè)亞組,棉花CAD基因分別屬于其中的五個(gè)亞組。圖1 圖1 5個(gè)物種CAD基因家族的系統(tǒng)進(jìn)化 基因名GeneNameGenesymbol氨基酸長(zhǎng)度Length(aa)氨基酸分子量MW(Da)等電點(diǎn)pI染色體位置Chr.Location亞細(xì)胞定位SubcellularlocationGhCAD1CotAD_13593297319743615At_chr1:86948713-86950083CytoplasmicGhCAD2CotAD_37609247265741556At_chr6:12446631-12447549CytoplasmicGhCAD3CotAD_04135357387986532At_chr8:78305297-78306865CytoplasmicGhCAD4CotAD_31920359390348571At_chr8:12980004-12983001CytoplasmicGhCAD5CotAD_4449335939054641At_chr9:43464845-43467239CytoplasmicGhCAD6CotAD_09220357387066541Dt_chr1:37664020-37665672CytoplasmicGhCAD7CotAD_04873361391913612Dt_chr3:25616682-25619358CytoplasmicGhCAD8CotAD_08476323349625671Dt_chr3:25566390-25569076CytoplasmicGhCAD9CotAD_23999359391779619Dt_chr3:28494614-28497505CytoplasmicGhCAD10CotAD_24215335361577563Dt_chr5:9949917-9951612CytoplasmicGhCAD11CotAD_64737159172548613Dt_chr5:35591335-35592866CytoplasmicGhCAD12CotAD_35578364390769585Dt_chr8:54689117-54693378CytoplasmicGhCAD13CotAD_7628031433656659Dt_chr8:17107622-17108873CytoplasmicGhCAD14CotAD_13395359391792713Dt_chr9:53004860-53007359CytoplasmicGhCAD15CotAD_41347358388125553scaffold1147.1:380188-381917CytoplasmicGhCAD16CotAD_67233362389899646scaffold3203.1:101376-102835CytoplasmicGhCAD17CotAD_67234200221814664scaffold3203.1:105389-106177CytoplasmicGhCAD18CotAD_72093361392312612scaffold3059.1:29884-32559CytoplasmicGhCAD19CotAD_72469151166283529scaffold3050.1:30741-31458CytoplasmicGhCAD20CotAD_74025145158515629scaffold5039.1:19922-20553CytoplasmicGhCAD21CotAD_74026361390652761scaffold5039.1:20945-22416Cytoplasmic 2.3CAD基因在棉花染色體上的分布和基因復(fù)制 通過(guò)本地blastn獲得了CAD基因在棉花染色體上的分布情況,其中有14個(gè)CAD基因被定位在特定的染色體上,還有7個(gè)CAD基因未被定位到染色體上,研究表明,CAD基因在棉花染色體上呈現(xiàn)出不均勻分布,棉花的26條染色體上只有八個(gè)染色體具有CAD基因。在棉花CAD基因中共有16基因形成19對(duì)復(fù)制基因,有的基因參與多次基因復(fù)制事件,例如GhCAD3、GhCAD7、GhCAD8分別參與三次基因復(fù)制。其中確定GhCAD7和GhCAD8為串聯(lián)重復(fù)基因?qū)Γ€有5對(duì)復(fù)制基因確定為片段復(fù)制基因?qū)?,其余部分基因未能定位到染色體上不能確定是何種復(fù)制方式。這19對(duì)復(fù)制基因中有12對(duì)復(fù)制基因的ka/ks小于1,說(shuō)明這些基因在進(jìn)化過(guò)程受到凈化選擇,即都是功能基因且功能保守,因此進(jìn)化速率較慢。而還有7對(duì)復(fù)制基因ka/ks大于1,說(shuō)明在進(jìn)化過(guò)程中受到積極選擇,即可能是功能冗余基因,因此進(jìn)化速度較快[24]。表2,圖2 表2 重復(fù)基因?qū)Φ膋a/ks 圖2 CAD基因在染色體上的分布和基因復(fù)制 2.4CAD基因結(jié)構(gòu) 對(duì)GhCAD基因的外顯子和內(nèi)含子排布進(jìn)行分析,發(fā)現(xiàn)復(fù)制基因?qū)χg擁有相似的基因結(jié)構(gòu),這也說(shuō)明了在進(jìn)化過(guò)程中是由同一祖先基因擴(kuò)增而來(lái)。CAD基因有三種extron-intron類型,三種類型分別有5、5、和6個(gè)外顯子組成,其中類型I和II的區(qū)別在于3和4號(hào)外顯子長(zhǎng)度不同,3號(hào)外顯子長(zhǎng)度長(zhǎng)于4號(hào)外顯子的屬于類型I[25, 26]。而棉花CAD基因除具有這三種類型的基因結(jié)構(gòu)外還具有3個(gè)外顯子組成的基因結(jié)構(gòu)類型。這說(shuō)明與其他物種相比,棉花CAD基因有更為多樣的基因結(jié)構(gòu)類型。圖3 圖3 CAD基因家族的系統(tǒng)進(jìn)化和基因結(jié)構(gòu) 2.5CAD基因在陸地棉纖維不同發(fā)育時(shí)期的表達(dá) 對(duì)陸地棉標(biāo)準(zhǔn)系 TM-1 中CAD家族基因進(jìn)行表達(dá)分析,深度測(cè)序數(shù)據(jù)選擇棉纖維發(fā)育的 4 個(gè)時(shí)期(5、10、20及 25 dpa)。研究表明,在21個(gè)CAD基因中共有14個(gè)基因在纖維中檢測(cè)到表達(dá)。其中GhCAD4和GhCAD9在5和10 dpa兩個(gè)發(fā)育時(shí)期有很高的表達(dá)量,GhCAD3和GhCAD6在20和25 dpa,此外GhCAD5,GhCAD8和GhCAD12也在棉花纖維發(fā)育中個(gè)各個(gè)時(shí)期或某個(gè)時(shí)期有較高的表達(dá)。圖4 2.6GhCAD3和GhCAD6與擬南芥CAD基因的同源性 根據(jù)多序列比對(duì)分析,得到GhCAD3和GhCAD6在擬南芥中的共同同源基因是AtCAD5,多序列比對(duì)分析顯示三個(gè)基因之間有很高的序列相似性。而AtCAD5已經(jīng)明確為可以參與木質(zhì)素的合成[27],為將AtCAD5基因作為研究對(duì)象提供了理論支持。圖5 圖4 CAD基因家族在棉花纖維不同發(fā)育時(shí)期表達(dá) 2.7 擬南芥cad5純合突變體的篩選 利用三引物法篩選擬南芥cad5純合突變體, PCR鑒定結(jié)果顯示野生型植株中只有利用LP+RP引物組合可以獲得1 287 bp左右的PCR產(chǎn)物條帶,而在純合突變體中只有利用LB1+RP引物組合可以獲得1 272 bp的PCR產(chǎn)物條帶(圖6A)。然后再分別以突變體和野生型DNA為模板,利用AtCAD5特異性引物進(jìn)行PCR檢測(cè),結(jié)果表明在野生型中檢測(cè)到AtCAD5基因而在突變體中未檢測(cè)到AtCAD5基因(圖6B)。這些結(jié)果說(shuō)明獲得了T-DNA插入的純合突變體植株。圖6 圖5 AtCAD5、GhCAD3和GhCAD6的氨基酸序列比對(duì) 2.8 擬南芥cad5突變體和野生型植株AtCAD5轉(zhuǎn)錄水平比較 通過(guò)RT-PCR和Quantitative RT-PCR檢測(cè)AtCAD5在突變體和野生型植株中轉(zhuǎn)錄水平。研究表明,野生型中AtCAD5轉(zhuǎn)錄水平明顯高于突變體。突變體中AtCAD5轉(zhuǎn)錄水平明顯下降。圖7 圖6 擬南芥Atcad5純合突變體的PCR鑒定 A:RT-PCR結(jié)果比較 B: Quantitative RT-PCR結(jié)果比較 2.9 擬南芥cad5突變體的篩選和根毛表型觀察 經(jīng)過(guò)PCR篩選的得到擬南芥cad5基因的純合突變體,研究表明,從5 d開始突變體植株的根毛長(zhǎng)度逐漸長(zhǎng)于野生型植株的根毛長(zhǎng)度,而后隨著生長(zhǎng)天數(shù)的增加時(shí)兩者的根毛長(zhǎng)度差異更加明顯。圖8 A: cad5突變體和野生型植株不同天數(shù)根毛表型觀察。 B: cad5突變體和野生型植株不同天數(shù)根毛長(zhǎng)度統(tǒng)計(jì)。 3.1CAD基因家族鑒定和系統(tǒng)進(jìn)化 在陸地棉全基因組水平上對(duì)CAD基因家族進(jìn)行了堅(jiān)定和功能分析。陸地棉中共鑒定到21個(gè)CAD基因,是擬南芥該家族成員2倍多,這也說(shuō)明陸地棉染色體相對(duì)于擬南芥染色體經(jīng)歷了多次全基因組復(fù)制事件。利用wolf和targetP對(duì)CAD蛋白進(jìn)行了亞細(xì)胞定位預(yù)測(cè),發(fā)現(xiàn)所有的CAD基因均定位于細(xì)胞質(zhì)當(dāng)中,這可能和CAD基因的功能有一定的關(guān)系。將棉花、高粱、水稻、擬南芥和楊樹的CAD基因進(jìn)行系統(tǒng)進(jìn)化分析,CAD基因分為了7個(gè)亞組且功能相近的基因在同一亞組中聚集,棉花CAD基因分別屬于其中的五個(gè)亞組。其中GhCAD1、GhCAD3、GhCAD6、GhCAD10和GhCAD15同屬于GroupII,這類CAD基因族中的AtCAD4、AtCAD5、AtCAD5、SbCAD2和OsCAD2的基因特性已經(jīng)明確,參與了木質(zhì)素的合成過(guò)程[24]。擬南芥AtCAD4和AtCAD5具有很高的同源性,當(dāng)對(duì)AtCAD4和AtCAD5進(jìn)行雙突變后,木質(zhì)素的含量大量減少[28],棉花中GhCAD3和GhCAD6也具有很高的同源性且在棉纖維20 和25 dpa有很高表達(dá)量,而又與AtCAD4和AtCAD5在同一亞組中,這說(shuō)明GhCAD3和GhCAD6在棉花的木質(zhì)素合成中發(fā)揮作用并且參與棉纖維的發(fā)育。GhCAD5、GhCAD14和AtCAD1同屬于一個(gè)亞組,AtCAD1已經(jīng)被報(bào)道在擬南芥AtCAD4和AtCAD5雙突變體中,對(duì)木質(zhì)素合成過(guò)程中起到功能補(bǔ)償作用[25],這說(shuō)明GhCAD5和GhCAD14也有相似的功能特性?;蚣易逯袑儆谕粊喗M的基因之間通常具有相同的功能特點(diǎn),通過(guò)與其他物種的CAD基因進(jìn)行系統(tǒng)的進(jìn)化分析有助于了解棉花CAD基因功能,為以后研究棉花CAD基因的功能提供參考。在這幾種植物來(lái)說(shuō),同屬于單子葉植物綱的高粱和水稻與其他三種植物相比有更近的親緣關(guān)系,可以看到親緣關(guān)系較近的植物間,CAD基因并沒(méi)有顯示出較近的進(jìn)化關(guān)系,這說(shuō)明CAD基因家族在不同植物中的分布是不保守的。對(duì)GhCAD基因家族成員進(jìn)行基因結(jié)構(gòu)分析發(fā)現(xiàn)親緣關(guān)系相近的基因擁有相似的基因結(jié)構(gòu),這些序列相似度極高的基因與基因組進(jìn)化過(guò)程中的串聯(lián)重復(fù)和片段復(fù)制有關(guān),這些復(fù)制在基因家族成員擴(kuò)增中起到重要作用?,F(xiàn)代陸地棉由大約150萬(wàn)年前的兩個(gè)祖先種二倍體棉花木本棉(AA)、雷蒙德氏棉(DD)雜交而成[5],研究陸地棉CAD基因的多次復(fù)制現(xiàn)象有助于了解棉花多倍化的進(jìn)程。陸地棉基因組經(jīng)歷了全基因組重復(fù)、染體重排和串聯(lián)重復(fù)等復(fù)雜的進(jìn)化過(guò)程。研究結(jié)果表明,染色體大片段復(fù)制和串聯(lián)重復(fù)在CAD基因家族的擴(kuò)增中起到了重要的作用。在陸地棉中共有15個(gè)基因形成19個(gè)基因復(fù)制對(duì),其中確定GhCAD7和GhCAD8為串聯(lián)重復(fù)基因?qū)?,還有5對(duì)復(fù)制基因?qū)Υ_定為片段復(fù)制,而GhCAD3和GhCAD6是一對(duì)復(fù)制基因且受到凈化選擇,因此是保守的功能基因,這為將這兩個(gè)基因作為后續(xù)的研究對(duì)象提供了依據(jù)。此外從棉花纖維表達(dá)數(shù)據(jù)來(lái)看,由同一祖先基因擴(kuò)增出來(lái)的基因表達(dá)模式并不相同,這說(shuō)明在進(jìn)化過(guò)程中表達(dá)特性發(fā)生了分化。 近年來(lái),對(duì)植物CAD基因家族的研究逐漸增多,已經(jīng)在多種植物中鑒定了CAD基因的數(shù)量和中累,其中擬南芥中12個(gè),水稻中12個(gè),高粱中14個(gè),葡萄中18個(gè),苜蓿中17個(gè),楊樹中14個(gè)[2]。并且已經(jīng)確定擬南芥CAD基因家族 中有6個(gè)可以催化5種肉桂醛生成肉桂醇,另外3個(gè)只有在底物濃度很高時(shí)才表現(xiàn)出活性,催化能力很低。擬南芥AtCAD4和AtCAD5具有很高的同源性,當(dāng)對(duì)AtCAD4和AtCAD5進(jìn)行雙突變后,木質(zhì)素的含量大量減少[28],而AtCAD1對(duì)其缺失的功能有一定的補(bǔ)償作用[29],說(shuō)明植物體內(nèi)的CAD基因家族是協(xié)同起作用的。 3.2CAD基因家族表達(dá) Han等在研究棉纖維細(xì)胞的伸長(zhǎng)和次生壁時(shí)發(fā)現(xiàn),木質(zhì)素和木質(zhì)素類似酚類化合物能夠顯著的影響棉纖維的質(zhì)量性狀,并且在棉纖維發(fā)育后期CAD6的表達(dá)量顯著提高,該CAD6與研究提到的GhCAD3同源性最高[30]。木質(zhì)素是苯丙烷代謝途徑的一種產(chǎn)物,Hovav等[31]在研究棉花纖維發(fā)育相關(guān)基因的表達(dá)時(shí)發(fā)現(xiàn),苯丙烷代謝途徑相關(guān)基因在參與棉纖維細(xì)胞的伸長(zhǎng)進(jìn)程。此外Li等在研究棉花纖維發(fā)育相關(guān)的QTL時(shí)發(fā)現(xiàn),CAD6基因定位在與棉花發(fā)育相關(guān)的的QTL位點(diǎn)上。由此推測(cè)CAD基因家族成員參與到棉花纖維發(fā)育的進(jìn)程當(dāng)中[32]。 從纖維表達(dá)數(shù)據(jù)發(fā)現(xiàn)多個(gè)CAD基因在棉花纖維中有較高的表達(dá),其中GhCAD4和GhCAD9在5和10 dpa有很高的表達(dá),GhCAD3和GhCAD6在20和25 dpa中有很高的表達(dá),此外GhCAD5,GhCAD8和GhCAD12也在棉花纖維發(fā)育中各個(gè)時(shí)期或某個(gè)時(shí)期有較高的表達(dá)。這些結(jié)果表明CAD基因家族參與了棉花纖維發(fā)育進(jìn)程。木質(zhì)素的積累通常發(fā)生在細(xì)胞發(fā)育的次生壁時(shí)期[7],GhCAD3和GhCAD6在棉纖維發(fā)育次生壁增厚期有很高的表達(dá),推斷GhCAD3和GhCAD6可能在棉纖維細(xì)胞次生壁增厚期起到重要的作用,觀察對(duì)比了GhCAD3和GhCAD6的同源基因AtCAD5突變體和野生型植株根毛長(zhǎng)度的差異,發(fā)現(xiàn)突變體相較于野生型有更長(zhǎng)的根毛,而AtCAD5已經(jīng)確定可以參與木質(zhì)素的合成,這些結(jié)果說(shuō)明CAD基因參與了棉纖維的發(fā)育進(jìn)程,并可能對(duì)其發(fā)育進(jìn)程有一定的調(diào)控作用。 在陸地棉基因組中共鑒定到21個(gè)CAD基因,串聯(lián)重復(fù)和片段重復(fù)是CAD基因家族主要的擴(kuò)增方式,進(jìn)化分析顯示CAD基因家族可以分為7個(gè)亞族,且功能相近的基因在同一亞族。深度測(cè)序數(shù)據(jù)分析顯示,大多數(shù)CAD基因均在棉纖維不同發(fā)育時(shí)期表達(dá),說(shuō)明CAD基因家族參與了棉纖維的發(fā)育,其中GhCAD4和GhCAD9在5和10 dpa兩個(gè)發(fā)育時(shí)期有很高的表達(dá),說(shuō)明參與了棉纖維細(xì)胞的起始和伸長(zhǎng)。GhCAD3和GhCAD6是保守的功能基因,也是在棉纖維中表達(dá)量最高的兩個(gè)基因,且這兩個(gè)基因都是20和25 dpa表達(dá)量顯著升高,因此這兩個(gè)基因應(yīng)該在棉纖微次生壁增后期發(fā)揮重要作用。觀察對(duì)比了GhCAD3和GhCAD6的同源基因AtCAD5突變體和野生型植株根毛長(zhǎng)度的差異,發(fā)現(xiàn)突變體相較于野生型有更長(zhǎng)的根毛,而AtCAD5已經(jīng)確定可以參與木質(zhì)素的合成,CAD基因參與了棉纖維的發(fā)育進(jìn)程,并可能對(duì)其發(fā)育進(jìn)程有一定的調(diào)控作用,為利用CAD基因改良棉纖維品質(zhì)奠定了基礎(chǔ)。 References) [1]Sunilkumar, G., Campbell, L. M., Puckhaber, L., Stipanovic, R. D., & Rathore, K. S. (2006). From the cover: engineering cottonseed for use in human nutrition by tissue-specific reduction of toxic gossypol.ProceedingsoftheNationalAcademyofSciencesoftheUnitedStatesofAmerica, 103(48):18,054-18,059. [2] Ruan, Y. L., Llewellyn, D. J., & Furbank, R. T. (2003). Suppression of sucrose synthase gene expression represses cotton fiber cell initiation, elongation, and seed development.PlantCell, 15(4):952-64. [3] Qin, Y. M., & Zhu, Y. X. (2011). How cotton fibers elongate: a tale of linear cell-growth mode.CurrentOpinioninPlantBiology, 14(1):106-111. [4] Hu, G., Jin, K., Yoo, M. J., Grupp, K., Chen, S., & Wendel, J. F. (2013). Proteomic profiling of developing cotton fibers from wild and domesticated gossypium barbadense.InteractiveCardiovascular&ThoracicSurgery, 200(2):570-582. [5] Li, F., Fan, G., Lu, C., Xiao, G., Zou, C., & Kohel, R. J., et al. (2015). Genome sequence of cultivated upland cotton (Gossypiumhirsutumtm-1) provides insights into genome evolution.NatureBiotechnology, 33(5):524-530. [6] Reiter, W. D., & Vanzin, G. F. (2001). Molecular genetics of nucleotide sugar interconversion pathways in plants.PlantMolecularBiology, 47(1-2):95-113. [7] Lerouxel, O., Cavalier, D. M., Liepman, A. H., & Keegstra, K. (2006). Biosynthesis of plant cell wall polysaccharides - a complex process.CurrentOpinioninPlantBiology, 9(6):621-630. [8] Ling, F., Shi, W. J., Hu, W. R., Hao, X. Y., Wang, D. M., & Hui, Y., et al. (2009). Molecular and biochemical evidence for phenylpropanoid synthesis and presence of wall-linked phenolics in cotton fibers.JournalofIntegrativePlantBiology, 51(7):626-637. [9] Mansell, R. L., Gross, G. G., Stckigt, J., Franke, H., & Zenk, M. H. (1974). Purification and properties of cinnamyl alcohol dehydrogenase from higher plants involved in lignin biosynthesis.Phytochemistry, 13(13):2,427-2,435. [11] Grosse, W., & Klapheck, S. (2010). Effects of 1-mcp and ethylene on expression of three cad genes and lignification in stems of harvested tsai tai (brassicachinensis).FoodChemistry, 123(1):32-40. [12] C, Halpin, & W, Schuch. (1992). Identification and characterization of cdna clones encoding cinnamyl alcohol dehydrogenase from tobacco.PlantMolecularBiology, 19(5):793-801. [13] Gasteiger, E., Hoogland, C., Gattiker, A., Duvaud, S., Wilkins, M. R., & Appel, R. D., et al. (2005). Protein identification and analysis tools on the expasy server.ProteomicsProtocolsHandbook, 112(112):571-607. [14] Emanuelsson, O., Nielsen, H., Brunak, S., & Heijne, G. V. (2000). Predicting subcellular localization of proteins based on their n-terminal amino acid sequence.JournalofMolecularBiology,300(4):1,005-1,016. [15] Horton P; Park KJ; Obayashi T; Fujita N; Harada H; Adams-Collier CJ; Nakai K. (2007). Wolf psort: protein localization predictor.NucleicAcidsResearch, 35(Web Server issue):585-587. [16] Ma, & Jun. (2015). Genome-wide identification and expression analysis of TCP transcription factors in cotton. [17] Liu, R. H., MENG Jin Ling ral University, Wuhan, & Chi. (2003). Mapdraw:a microsoft excel macro for drawing genetic linkage maps based on given genetic linkage data.Hereditas, 25(3):317-321. [18] Yang, S., Zhang, X., Yue, J. X., Tian, D., & Chen, J. Q. (2008). Recent duplications dominate nbs-encoding gene expansion in two woody species.MolecularGenetics&GenomicsMgg, 280(3):187-198. [19] Gu Z, Cavalcanti A, Chen FC, Bouman P, & Li WH. (2002). Extent of gene duplication in the genomes of drosophila, nematode, and yeast.MolecularBiology&Evolution, 19(3):256-262. [20] Guo, A. Y., Zhu, Q. H., & Chen, X. (2007). Gsds: a gene structure display server.Hereditas, 29(8):1,023-1,026. [21] Trapnell, C., Roberts, A., Goff, L., Pertea, G., Kim, D., & Kelley, D. R., et al. (2012). Differential gene and transcript expression analysis of rna-seq experiments with top hat and cufflinks.Psychopharmacology, 7(3):562-578. [22] 李敏, 楊雙, 阮燕曄, 等. 擬南芥 T-DNA 插入突變體 atsuc3 的 PCR 鑒定[J]. 植物生理學(xué)通訊,2006,42(1):91-94. LI Min, YANG Shuang, Ruan Yan-hua, et al. (2006). Identification of ATSUC3 with T-DNA Insertion by PCR [J].PlantPhysiologyCommunications, 42(1):91-94. (in Chinese) [23] Zhu, C., Gan, L., Shen, Z., & Kai, X. (2006). Interactions between jasmonates and ethylene in the regulation of root hair development in Arabidopsis.JournalofExperimentalBotany, 57(6):1,299-1,308. [24] Morant, M., Hehn, A., & Werck-Reichhart, D. (2002). Conservation and diversity of gene families explored using the codehop strategy in higher plants.BmcPlantBiology, 2(1):1-12. [25] Barakat, A., Bagniewska-Zadworna, A., Choi, A., Plakkat, U., Diloreto, D. S., & Yellanki, P., et al. (2009). The cinnamyl alcohol dehydrogenase gene family in populus: phylogeny, organization, and expression.BMCPlantBiology, 9(1):26. [26] 張魯斌, 谷會(huì), 弓德強(qiáng), 等. 植物肉桂醇脫氫酶及其基因研究進(jìn)展[J]. 西北植物學(xué)報(bào), 2011, 31(1):204-211. ZHANG Lu-bin, GU Hui, GONG De-qiang, et al. (2011). Research Progress of Cinnamyl Alcohol Dehydrogenase and Its Gene [J].ActaBotanicaBoreali-OccidentaliaSinica, 31(1):204-211. (in Chinese) [27] Ma, Q. H. (2010). Functional analysis of a cinnamyl alcohol dehydrogenase involved in lignin biosynthesis in wheat.JournalofExperimentalBotany, 61(10):2,735-2,744. [28] Sibout, R., & Séguin. (2005). Cinnamyl alcohol dehydrogenase-c and -d are the primary genes involved in lignin biosynthesis in the floral stem of Arabidopsis.PlantCell, 17(7):2,059-2,076. [30] Han, L. B., Li, Y. B., Wang, H. Y., Wu, X. M., Li, C. L., & Luo, M., et al. (2013). The dual functions of wlim1a in cell elongation and secondary wall formation in developing cotton fibers.PlantCell, 25(11):4,421-4,438. [31] Ran, H., Udall, J. A., Hovav, E., Rapp, R., Flagel, L., & Wendel, J. F. (2008). A majority of cotton genes are expressed in single-celled fiber.Planta, 227(2):319-329. [32] Li, X., Yuan, D., Zhang, J., Lin, Z., & Zhang, X. (2012). Genetic mapping and characteristics of genes specifically or preferentially expressed during fiber development in cotton.PlosOne, 8(1):65-65. Fund project:Supported by High-tech research and development program of Xinjiang "Research on the technology innovation of cotton fiber quality molecular Improvement (201111116) and NSFC "The function and regulation mechanism of cotton GhCAD6 gene in the development of cotton fiber" (31460386) Genomi-wide Investigation and Expression Analysis of CAD Gene Family inGossypiumhirsutum ZHANG Jin-bo1,2,LI Bo2,YANG Yang2,HU Wen-ran2,CHEN Fan-yuan1.2,XIE Li-xia2,F(xiàn)AN Ling2 (1. College of Life Sciences, Xinjiang Normal University, Urumqi 830054, China;2 Research InstituteofNuclearandBiotechnologies,XinjiangAcademyofAgriculturalSciences,Urumqi830091,China) 【Objective】 This study aims to conduct for the first time a genome-wide analysis ofCADgene family in cotton.【Method】A total of 21CADencoding genes were identified inGossypiumhirsutum. The phylogenic evolution, chromosome distribution, gene duplication and gene structure ofCADgene family went through phylogenetic analysis.【Result】The result revealed thatCADgene family could be clustered into 7 major subgroups and the genes which had similar functions were in the same subgroup. Both tandem duplications and segmental duplications were found to attribute to the expansion ofCADgene family.CADgene family had expression at different stages of development fiber. TheAtcad5 mutant had a longer root hair than that of the wild type.【Conclusion】CADgenes maybe are involved in developing fiber and play a role in regulating the development of fiber. cotton fiber;CADgene family; phylogenic analysis; expression pattern; cad5 mutant; root hair 10.6048/j.issn.1001-4330.2016.07.001 2016-03-05 新疆維吾爾自治區(qū)高技術(shù)項(xiàng)目“棉花纖維品質(zhì)分子改良技術(shù)創(chuàng)新研究”(201111116);國(guó)家自然科學(xué)基金項(xiàng)目“棉花GhCAD6基因在棉花纖維發(fā)育中的功能及調(diào)控機(jī)制”(31460386) 張經(jīng)博(1991- ),男,新疆人,碩士研究生,研究方向?yàn)樽魑锓肿由飳W(xué),(E-mail)952880259@qq.com 范玲(1958- ),女,新疆人,研究員,博士生導(dǎo)師,研究方向?yàn)槊藁ɡw維品質(zhì)分子改良,(E-mail)fanling@xaas.ac.cn S562;S188 A 1001-4330(2016)07-1177-112 結(jié)果與分析
3 討 論
4 結(jié) 論