閔凱麗,晁祥保,滕 露,蔡永生,雷慧辰,嚴中建,鄭 凱,2,陳全家
(1.新疆農(nóng)業(yè)大學農(nóng)學院/農(nóng)業(yè)生物技術(shù)重點實驗室,烏魯木齊 830052;2.新疆農(nóng)業(yè)大學博士后流動站,烏魯木齊 830052 )
【研究意義】中國棉花總產(chǎn)量占全世界的1/4,消費量占全世界的1/3,中國棉花市場供求關(guān)系變化直接影響國際棉花市場[1]。棉紡企業(yè)強調(diào)以較強、較細和纖維更整齊的棉纖維作為紡織原料[2]。新疆具有適合棉花生長的自然條件和資源優(yōu)勢,2016年棉花總產(chǎn)占全國總產(chǎn)的68%[3]。根據(jù)2008~2016年我國新體制棉花公正檢驗質(zhì)量數(shù)據(jù),比較分析全國5大植棉省(區(qū))的棉纖維品質(zhì)表明,纖維長度以新疆地方的最長,馬克隆值最優(yōu),斷裂比強度則以新疆最低,僅為28 cN/tex,但近幾年呈明顯升高的趨勢[4]。在棉花種植中,陸地棉產(chǎn)量高、適應(yīng)性廣使其占據(jù)主要地位,但棉纖維品質(zhì)較差;海島棉種植面積約占棉花種植總面積的5%~8%,生產(chǎn)規(guī)模較小,但棉纖維具有長、細、強等突出的特點。棉纖維的發(fā)育過程是一系列物質(zhì)共同參與的復雜過程。【前人研究進展】成熟的棉花纖維的細胞壁主要由90%或95%以上纖維素構(gòu)成,其余為纖維素伴生物和部分未知物。木質(zhì)素是芳香族雜多聚合物,是苯丙烷代謝途徑的重要產(chǎn)物,生物合成途徑已經(jīng)較為清楚[5-7],是纖維素后第2類最豐富的植物生物聚合物,主要沉積在維管植物的次生細胞壁中,是水分運輸、機械支持和植物病原防御所必須的[8]。木質(zhì)素單體的生物合成途徑涉及到許多酶的參與,C3H/HCT是發(fā)現(xiàn)較晚的2個酶,在從對-香豆酰輔酶A(p-coumaroylCoA)到咖啡酰輔酶A(caffeoylCoA)的羥基化過程中起作用,是控制木質(zhì)素H-單體與G/S-單體相互轉(zhuǎn)化的關(guān)鍵酶[9]。HCT是一種在木質(zhì)素單體合成途徑中發(fā)現(xiàn)的酶,最早是從煙草中分離得到的[10],屬于脂肪酰轉(zhuǎn)移酶的大家族,脂肪酰轉(zhuǎn)移酶主要涉及多種次生代謝生物合成過程。HCT不僅可以催化咖啡酰輔酶A與奎尼酸合成綠原酸,還可以逆向催化綠原酸生成咖啡酰輔酶A與奎尼酸,促使更多底物用于木質(zhì)素的合成[11]?!颈狙芯壳腥朦c】HCT能將對香豆酰輔酶A轉(zhuǎn)化成相應(yīng)的莽草酸/奎尼酸酯,而羥基化的底物來自C3H。莽草酸/奎尼酸酯可通過HCT的逆反應(yīng)過程轉(zhuǎn)化成相應(yīng)的輔酶A酯。通過分析擬南芥中C3H基因更加證實了HCT在木質(zhì)素合成途徑中的作用[12]。木質(zhì)素也是影響纖維素水解的一個重要因素,其存在嚴重阻礙了纖維生物質(zhì)能源的利用。改變木質(zhì)素含量和組分是當前木質(zhì)素研究的主要熱點。HCT基因在調(diào)控木質(zhì)素生物合成中有著重要作用且木質(zhì)素對棉花不同組織部位都有影響,木質(zhì)素的生物合成及在成熟纖維中的含量與棉花纖維的品質(zhì)有一定的關(guān)系[13],研究HCT基因在棉纖維發(fā)育中的功能?!緮M解決的關(guān)鍵問題】從海島棉新海21號中克隆GbHCT10基因,通過生物信息學方法分析GbHCT10的cDNA序列和氨基酸序列并實時熒光定量PCR技術(shù)分析海島棉GbHCT10基因在棉花纖維發(fā)育不同時期中的表達量差異,分析該基因的氨基酸序列和表達模式。
材料海島棉新海21號種植于新疆沙灣縣144團棉花遺傳育種基地。以開花當天記作0 d(開花后0 d),分別摘0 d的胚珠和5、10、15、20、25、30、35 d的共8個時期棉花纖維,置于液氮中速凍,-80℃冰箱中保存?zhèn)溆谩?/p>
1.2.1 植物總RNA的提取和cDNA第一鏈合成
采用植物多糖多酚RNA提取試劑盒(Quick RNA isolation Kit,北京天根生化科技有限公司),按照說明書操作,提取不同時期棉纖維的總RNA,再經(jīng)1%瓊脂糖凝膠電泳檢測RNA的完整性,將質(zhì)量完好的RNA用于后續(xù)試驗。使用Thermo Nano Drop2000C核酸蛋白分析儀(北京賽默飛世爾科技有限公司)檢測所提RNA的濃度和質(zhì)量,并置于-80℃冰箱保存?zhèn)溆谩J褂肨hermo反轉(zhuǎn)錄試劑盒(德國賽默飛)推薦反應(yīng)體系合成cDNA第一鏈,反應(yīng)體系和程序參照說明書。
1.2.2 海島棉GbHCT10基因克隆
根據(jù)海島棉轉(zhuǎn)錄組數(shù)據(jù)庫設(shè)計克隆引物,上游引物:GbHCT10-F:5'ATGGAGATTACTATAAAGGAGTCTG-3'和下游引物:GbHCT10-R:5'-TCACAAGCTCCCATCGTTGA-3'。
選用海島棉新海21號開花后5 d的棉纖維cDNA為模板,用高保真Taq聚合酶進行PCR擴增。PCR程序為:94℃預變性5 min,94℃變性 30 s,57℃復性 45 s,72℃延伸 1 min 30 s,共 35 個循環(huán);72℃延伸 10 min。采用1%瓊脂糖凝膠電泳檢測擴增產(chǎn)物,使用紫外凝膠成像儀觀察并切下目的片段。按照普通瓊脂糖凝膠DNA回收試劑盒(天根試劑公司)說明書步驟純化回收PCR產(chǎn)物,連接至T5載體,轉(zhuǎn)化入大腸桿菌DH5α感受態(tài)細胞(全式金公司)。通過菌液PCR篩選鑒定出陽性克隆,送至深圳華大基因有限公司測序,并對測序結(jié)果進行比對分析。
1.2.3 生物信息學分析
利用生物信息學網(wǎng)絡(luò)平臺NCBI網(wǎng)站(http://www.ncbi.nlm.nih.gov/)提供的blastn(http://blast.ncbi.nlm.nih.gov/Blast.cgi)程序?qū)u棉GbHCT10基因的cDNA序列進行進行相似性搜索,下載不同物種的HCT基因序列,再經(jīng)DNAMAN軟件分析序列的核苷酸組成以及進行多重序列比較和相似度比對,采用ClustalX2.0比對序列,再利用MEGA7.0軟件構(gòu)建系統(tǒng)發(fā)生樹。使用ORF Finder(http://www.ncbi.nlm.nih.gov/gorf/or
Fig.cgi)工具分析海島棉GbHCT10基因序列的開放閱讀框。使用Coden Usage Database網(wǎng)站提供的Countcodonprogram(http://www.kazusa.or.jp/codon/countcodon.html)分析海島棉GbHCT10基因完整ORF序列的密碼子使用頻率。利用blastp(http://blast.ncbi.nlm.nih.gov/Blast.cgi)程序?qū)u棉GbHCT10基因的編碼蛋白進行相似性搜索。使用ProtParam(physico-chemical parameters of a protein sequences,http://web.expasy.org/protparam/)在線程序計算海島棉GbHCT10基因編碼蛋白的理化參數(shù)。使用BioEdit軟件的Kyte&Doolittle方法計算蛋白質(zhì)序列的疏水性分布。使用SignalP(http://www.cbs.dtu.dk/services/SignalP)在線程序?qū)υ摰鞍踪|(zhì)進行信號肽預測。利用在線程序COILS(http://www.ch.embnet.org/software/COILS_form.html)預測該蛋白的卷曲螺旋結(jié)構(gòu)。該蛋白質(zhì)的可能跨膜區(qū),用TMHMM(http://www.cbs.dtu.dk/services/TMHMM-2.0)在線程序分析。通過https://web.expasy.org/protparam/在線預測蛋白質(zhì)分子量及等電點等理化性質(zhì)。通過在線預測軟件SoftBerry ProtComp9.0(http://www.SoftBerry.com)對GbHCT10蛋白進行亞細胞定位,利用http://bioinf.cs.ucl.ac.uk/psipred/在線預測蛋白質(zhì)二級結(jié)構(gòu),通過http://swissmodel.expasy.org/在線預測蛋白質(zhì)三級結(jié)構(gòu)。通過Plant care(http://oberon.fvms.ugent.be:8080/PlantCARE/index.html )網(wǎng)站對GbHCT啟動子上游2 000 bp進行順式作用元件分析。
1.2.4 實時熒光定量PCR
根據(jù)已獲得的目的基因序列,設(shè)計實時熒光定量PCR引物,以UBQ7為內(nèi)參基因,將海島棉新海21號不同時期棉纖維的cDNA用ddH2O稀釋10倍后作為模板,采用7 500 Fast實時熒光定量PCR儀檢測GbHCT10基因在不同時期棉纖維發(fā)育時期中的表達情況,用內(nèi)參基因檢測擴增效率一致性。QPCR擴增體系參照說明書。
試驗進行3次生物學重復,采用2-ΔΔCT法分析試驗數(shù)據(jù),數(shù)據(jù)分析采用Excel軟件進行數(shù)據(jù)統(tǒng)計分析和作圖。
通過DNAMAN軟件對新海21號GbHCT10與樹棉(Gossypiumarboreum),棕色棉(GossypiumhirsutumLinn.),煙草(Nicotianatabacum),擬南芥(Arabidopsisthaliana),毛白楊(Populustomentosa),輻射松(Pinusradiata),蒺藜苜蓿(Medicagotruncatula),蝶豆(ClitoriaternateaL),一串紅(Salviasplendens),金銀花(LonicerajaponicaThunb.),水稻(OryzasativaL),紫薯(ipomoeabatatas),可可(Theobromacacao),小果咖啡(Coffeaarabica),槿麻(Hibiscuscannabinus),蓖麻(Ricinuscommunis),丹參(SalviamiltiorrhizaBunge),葡萄(VitisviniferaL.),番茄(Solanumlycopersicum)的HCT氨基酸序列進行相似性比對分析。
研究表明,GbHCT10基因編碼區(qū)長度為1 248 bp,包含一個完整的ORF,編碼415個氨基酸,其中GUA密碼子的使用頻率最高。利用protparam在線預測得出,分子式為C2086H3246N552O603S10,蛋白質(zhì)分子量為45.13 kD,等電點為6.01,脂肪系數(shù)為94.43,總平均親水性為-0.144。該蛋白大約在200~220位氨基酸之間含有1個典型的親水性區(qū)域,屬于親水性蛋白??缒^(qū)分析顯示該蛋白的1~400個氨基酸位于細胞外,不含有跨膜區(qū),屬于非膜受體蛋白。SoftBerry ProtComp9.0在線預測亞細胞定位結(jié)果表明,GbHCT蛋白可能定位于線粒體(9.15),卷曲螺旋預測顯示,該蛋白含有2個典型的超螺旋結(jié)構(gòu)。蛋白質(zhì)二級結(jié)構(gòu)分析表明,GbHCT10基因編碼的415個氨基酸中,α-螺旋占3.4%,β-折疊占6.4%,無規(guī)則卷曲占90.2%。GbHCT10蛋白主要由螺旋卷曲構(gòu)成,與之前預測結(jié)果一致。啟動子序列中含有多種必備啟動子元件,如含有脫落酸響應(yīng)元件ABRE、機械損傷響應(yīng)元件WUN-motif、乙烯響應(yīng)元件ERE、防御與應(yīng)激響應(yīng)元件TC-rich repeats等與逆境脅迫響應(yīng)的順勢作用元件,GbHCT基因可能在多種逆境脅迫中發(fā)揮作用。還包含多個與激素信號轉(zhuǎn)導和其他信號運轉(zhuǎn)相關(guān)的順勢作用元件,如TGACG-motif等。圖1~6,表1
表1 GbHCT啟動子中的順式作用元件預測Table 1 Cis-regulatory element prediction in GbHCT promoter
研究表明,新海21號GbHCT10與樹棉同源性達94.5%,其他依次為棕色棉(59.9%),葡萄(59.1%),槿麻(58.7%),毛白楊(58.4%),小果咖啡(58.2%),可可(58.2%),蓖麻(57.7%),擬南芥(57.4%),金銀花(57.2%),蒺藜苜蓿(57.1%),輻射松(57.0%),煙草(56.9%),丹參(56.7%),蝶豆(56.6%),番茄(55.5%),水稻(41.1%),一串紅(25.4%)。通過MEGA7.0軟件構(gòu)建系統(tǒng)發(fā)生樹,新海21號GbHCT10基因與樹棉HCT基因在同一分支且親緣關(guān)系性最為相近。圖7,圖8
研究表明,GbHCT10基因在棉花不同纖維發(fā)育時期中均有表達,該基因在開花后第5 d和第10 d表達量高,第25 d表達量最低,呈現(xiàn)出先上升再下降再上升再下降的波動趨勢。圖9
棉花纖維是由胚珠表皮細胞在受精前后經(jīng)分化突起、伸長、次生壁增厚和脫水成熟而形成的,各時期具有不同特點但又相互重疊[14]。伸長期是生化反應(yīng)最活躍的時期,也是影響纖維品質(zhì)的關(guān)鍵時期[15]。已有研究表明,成熟棉花纖維細胞壁中含有苯丙烷代謝途徑的產(chǎn)物木質(zhì)素[16]。暗示木質(zhì)素的生物合成及在成熟纖維中的含量與棉花纖維的品質(zhì)可能有關(guān)系。木質(zhì)素的合成過程會受到不同基因的調(diào)控,是一個復雜的過程。當合成過程中某個酶的表達活性降低時,其他酶的表達活性也會受到影響[17-18]。HCT作為調(diào)控木質(zhì)素G/S-單體生物合成及H-單體和G/S-單體生物轉(zhuǎn)換的關(guān)鍵酶,對木質(zhì)素的單體組成及含量具有重要作用。HCT在高等植物上由一個小的基因家族組成[19-20],到目前為止,已從檸條錦雞兒[21],楊樹[22],紅腺忍冬[23],金銀花[24],鴨梨[25],野生鴨兒芹[26]等植物中克隆得到HCT基因,但是研究HCT基因在棉纖維發(fā)育中的功能報道還比較少有。從海島棉中克隆了木質(zhì)素合成途徑中的HCT基因全長cDNA,該序列全長1 248 bp,編碼415氨基酸。并通過進一步的生物信息學方法分析研究了GbHCT10的cDNA序列和氨基酸序列,對其編碼的蛋白進行了結(jié)構(gòu)和功能的預測,使用實時熒光定量PCR技術(shù)分析了海島棉GbHCT10基因在棉花纖維發(fā)育不同時期中的表達量差異。發(fā)現(xiàn)GbHCT10基因在分化突起期(0~3 d)表達量逐漸上升,纖維迅速伸長期(5~15 d)基因表達量最高,15~25 d纖維生長減緩時期,該基因表達量隨之降低,纖維加厚期(25~50 d)的早期表達量高,后期逐漸降低,總體表達呈現(xiàn)波動變化,研究HCT基因在棉纖維發(fā)育中的作用,進一步研究該基因的表達對纖維發(fā)育過程中木質(zhì)素含量的影響,對改善棉花纖維品質(zhì)有著重要研究意義。
克隆了1個海島棉HCT基因,命名為GbHCT10,該基因具有長度為1 248 bp的開放閱讀框,編碼了415個氨基酸,預測其蛋白質(zhì)分子量為45.13 kD,等電點為6.01,并對GbHCT10蛋白的跨膜區(qū),親水性,亞細胞定位,二級結(jié)構(gòu)和三級結(jié)構(gòu)等序列特征進行了預測。同源序列比對和系統(tǒng)進化樹表明GbHCT10基因序列與樹棉HCT基因序列相似度最高,通過對海島棉GbHCT10啟動子順勢作用元件分析,發(fā)現(xiàn)了ABRE、WUN-motif、MYB、TC-rich repeats等在不同逆境中參與防御和脅迫反應(yīng)的順勢作用元件,GbHCT10基因可能參與到不同種非生物脅迫響應(yīng)過程中,通過實時熒光定量PCR技術(shù)分析發(fā)現(xiàn)海島棉GbHCT10基因在棉花不同纖維發(fā)育時期中均有表達,主要在纖維伸長期和次生壁加厚時期優(yōu)勢表達,該基因可能參與棉花纖維發(fā)育進程。