王 輝,董永梅,郭偉鋒,曹新川,郭金成,謝宗銘,何良榮
(1.塔里木大學(xué)農(nóng)學(xué)院,新疆阿拉爾 843300;2. 新疆農(nóng)墾科學(xué)院棉花研究所,新疆石河子 832000;3.作物種質(zhì)創(chuàng)新與基因資源利用兵團(tuán)重點(diǎn)實(shí)驗(yàn)室,新疆石河子 832000)
【研究意義】近年來(lái),高溫天氣頻繁出現(xiàn),高溫脅迫造成作物的經(jīng)濟(jì)損失越來(lái)越嚴(yán)重[1]。高溫會(huì)導(dǎo)致作物的光合作用等生理活動(dòng)受到嚴(yán)重影響,并影響植株的正常生長(zhǎng)和發(fā)育,是作物減產(chǎn)的主要影響因素[2]。新疆棉區(qū)高溫出現(xiàn)時(shí)間是6~7月,35℃及以上高溫天氣天數(shù)達(dá)到9~33 d,而7月是棉花盛花期,高溫的出現(xiàn)造成棉花蕾鈴脫落,導(dǎo)致棉花質(zhì)量和產(chǎn)量下降[3-4]。因此,高溫對(duì)棉花生產(chǎn)的不利影響日益受到關(guān)注?!厩叭搜芯窟M(jìn)展】轉(zhuǎn)錄組測(cè)序技術(shù)對(duì)于探索植物在不同條件和生長(zhǎng)狀態(tài)下,可以挖掘和發(fā)現(xiàn)新調(diào)控機(jī)制基因,從而為農(nóng)作物、生態(tài)防護(hù)植被、優(yōu)良林草植物抗逆性遺傳改良以及新品種的培育奠定基礎(chǔ)。尹波等[5]研究在高溫脅迫下,番茄受高溫脅迫后轉(zhuǎn)錄調(diào)控是一個(gè)極其復(fù)雜的過(guò)程,受到多種不同途徑的共同調(diào)控,篩選出了36個(gè)功能未知的基因。徐洪國(guó)[6]研究表明在葡萄中響應(yīng)高溫脅迫的基因主要包括細(xì)胞滲透壓、抗氧化作用、熱激蛋白等基因,NAC轉(zhuǎn)錄因子家族、HSP20可能在強(qiáng)耐熱品種刺葡萄抵抗高溫脅迫中起著重要的作用。Waters等[7]認(rèn)為,在高溫脅迫下植物體內(nèi)會(huì)產(chǎn)生大量不同種類的sHSP,是植物對(duì)高溫脅迫的一種適應(yīng)機(jī)制。Timperio等[8]強(qiáng)調(diào),當(dāng)植物受到熱害,HSP作為分子伴侶發(fā)揮作用。而Kimpel等[9]則推測(cè)sHSPs可能作為熱受損蛋白的保護(hù)屏障起作用;另外,sHSPs可以有效地結(jié)合變性的蛋白,阻止不可逆轉(zhuǎn)的蛋白質(zhì)聚集, 從而提高細(xì)胞的耐脅迫能力[10]。【本研究切入點(diǎn)】轉(zhuǎn)錄組學(xué)是一個(gè)發(fā)現(xiàn)不同差異表達(dá)基因的強(qiáng)有力工具,并已被廣泛應(yīng)用在一些作物品種中,包括水稻[11-12]、玉米[13]、小麥[14]、油菜[15]、馬鈴薯[16]、番茄[17]。其中對(duì)水稻,玉米熱應(yīng)激的反應(yīng)進(jìn)行了轉(zhuǎn)錄組分析。需研究陸地棉高溫脅迫下關(guān)鍵基因的響應(yīng),比較基因表達(dá)差異?!緮M解決的關(guān)鍵問(wèn)題】采用轉(zhuǎn)錄組測(cè)序和分析,研究高溫脅迫下棉花不同差異表達(dá)上調(diào)基因和下調(diào)基因的生物學(xué)通路,為陸地棉的高溫脅迫研究及陸地棉品種在高溫脅迫下的轉(zhuǎn)錄變化提供參考。
材料為陸地棉品系YZ1(由華中農(nóng)業(yè)大學(xué)棉花育種組提供),即wide type(W)。
采用光照培養(yǎng)室溫度(N,26℃)播種、育苗至5~6葉期,設(shè)置正常溫度(N,26℃)處理和高溫(H,42℃)處理,分別在4、12、24、48 h取葉片迅速置于液氮中,于-80℃冰箱保存,進(jìn)行RNA提取。WN4、WN12、WN24、WN48代表YZ1在常溫處理下4、12、24和48 h,WH4、WH12、WH24、WH48則代表YZ1在高溫處理下4、12、24和48 h。
測(cè)序錯(cuò)誤率用e[18]表示,Illumina平臺(tái)測(cè)得數(shù)據(jù)的堿基質(zhì)量值(Quality score)表示,反映的是堿基識(shí)別出錯(cuò)的概率,進(jìn)而衡量測(cè)序數(shù)據(jù)的可靠性,則有:Qphred=-10log10(e)。
皮爾遜相關(guān)系數(shù)r(Pearson’s Correlation Coefficient)為生物學(xué)重復(fù)相關(guān)性的評(píng)估指標(biāo)[19]。r2越接近1,2個(gè)重復(fù)樣品相關(guān)性越強(qiáng)。
RNA樣品檢測(cè)合格后,送美因健康科技(北京)有限公司測(cè)序,采用Illumina測(cè)序平臺(tái)技術(shù)對(duì)構(gòu)建好的文庫(kù)進(jìn)行高通量測(cè)序。使用軟件:用fast qc軟件進(jìn)行質(zhì)量控制;使用Hisat2[20]軟件將質(zhì)控后獲得的Clean Reads與陸地棉參考基因組進(jìn)行序列比對(duì);利用feature Counts[21]計(jì)數(shù),得到每個(gè)基因在各個(gè)樣本中的原始記數(shù)(raw counts)。將數(shù)據(jù)導(dǎo)入R中,利用DESeq2[22]進(jìn)行差異表達(dá)分析。研究選取|log2F C|>1(log2F C代表處理與對(duì)照表達(dá)量比值的對(duì)數(shù)值)及pad j<0.05(pad j代表校正后的P值)的基因作為差異表達(dá)基因;使用R語(yǔ)言cluster Profiler包對(duì)差異表達(dá)基因進(jìn)行GO富集分析和KEGG富集分析。
研究表明,Q phred=-10 log10(e)。Q30的堿基正確識(shí)別率達(dá)到99.90%,Q20堿基正確識(shí)別率為99%,測(cè)序數(shù)據(jù)可靠。表1
表1 堿基識(shí)別正確識(shí)別率與Phred分值之間的簡(jiǎn)明對(duì)應(yīng)關(guān)系
研究表明,WN4/WH4,WN12/WH12,WN24/WH24,WN48/WH48兩兩比較后的r2均在0.85以上,兩兩比較的樣本相關(guān)性較好。圖1
圖1 兩兩樣品的相關(guān)性熱圖
研究表明,隨著時(shí)間增加,差異表達(dá)基因數(shù)量有所下降,在4~12 h時(shí),上調(diào)基因增加,下調(diào)基因減少,在12~48 h時(shí),上調(diào)基因大量減少,下調(diào)基因先增加后減少。鑒定出383個(gè)普遍上調(diào)基因和234個(gè)普遍下調(diào)基因。隨著熱處理時(shí)間延長(zhǎng),WN4/WH4,WN12/WH12,WN24/WH24,WN48/WH48之間特異上調(diào)基因的數(shù)量呈減少趨勢(shì),上調(diào)基因數(shù)量分別為2 359個(gè)、2 171個(gè)、1 092個(gè)、418個(gè),下調(diào)基因的數(shù)量趨于平緩增加,下調(diào)基因數(shù)量分別為1 733個(gè)、1 356個(gè)、1 424個(gè)、1 490個(gè),下調(diào)基因的數(shù)量趨于平緩增加。圖2,圖3
圖2 上調(diào)和下調(diào)基因總數(shù)
圖3 上調(diào)和下調(diào)基因的韋恩圖
研究表明,差異表達(dá)基因主要富集在L-苯丙氨酸分解代謝過(guò)程、應(yīng)激反應(yīng)、蛋白質(zhì)復(fù)性、類固醇生物合成的過(guò)程、超氧化物歧化酶活性的正調(diào)節(jié)、鋅離子跨膜轉(zhuǎn)運(yùn)、蛋白質(zhì)折疊、系統(tǒng)獲得性抵抗力的調(diào)節(jié)、金屬離子傳輸?shù)壬飳W(xué)過(guò)程,苯丙氨酸轉(zhuǎn)氨酶活性、催化活性、3-β-羥基-δ5-類固醇脫氫酶活性、過(guò)渡金屬離子結(jié)合、鋅離子跨膜轉(zhuǎn)運(yùn)體活性、金屬離子跨膜轉(zhuǎn)運(yùn)體活性、轉(zhuǎn)移酶活性,轉(zhuǎn)移?;?、ATP結(jié)合、鈣調(diào)素結(jié)合等分子功能,細(xì)胞質(zhì)細(xì)胞組分。圖4
圖4 DEGs基因GO功能富集
研究表明,有241個(gè)(P-value<0.000 1)差異基因被注釋。差異基因主要富集在類黃酮生物合成、次級(jí)代謝產(chǎn)物的生物合成、苯丙烷代謝、晝夜節(jié)律-植物、代謝途徑、酮體的合成與降解、內(nèi)質(zhì)網(wǎng)蛋白加工等12個(gè)途徑。內(nèi)質(zhì)網(wǎng)蛋白質(zhì)加工富集到17個(gè)差異基因都表達(dá)下調(diào),17個(gè)DEGs與熱激反映有關(guān),高溫脅迫下,熱激蛋白基因下調(diào),受到抑制。表2,表3
表2 17個(gè)差異基因熱激蛋白(HSP)
表3 差異基因KEGG富集變化
研究表明,在差異基因中,鑒定出39個(gè)轉(zhuǎn)錄因子,其主要富集在MYB、WRKY、ERF、NAC等轉(zhuǎn)錄因子家族,其中WRKY和MYB兩大家族具有最多差異基因,15個(gè)和9個(gè)差異基因,兩大家族差異基因主要參與高溫脅迫表達(dá),且大部分基因都是上調(diào)表達(dá),起著重要作用。表4
表4 差異基因的轉(zhuǎn)錄因子
研究表明,在整個(gè)時(shí)期表達(dá)量差異倍數(shù)較為顯著的基因Gohir.A08G104100(Small heat shock protein, chloroplastic,HSP22),熱休克蛋白家族成員,是高溫脅迫主要的基因,對(duì)植物的耐熱性至關(guān)重要。Gohir.D08G033300(Probable 1-deoxy-D-xylulose-5-phosphate synthase 2, chloroplastic,Os07g0190000),催化丙酮酸的C原子2和3與3-磷酸甘油醛之間的?;s合反應(yīng),生成1-脫氧-D-木酮糖-5-磷酸(DXP),是質(zhì)體類異戊二烯生物合成的限制酶,對(duì)葉綠體發(fā)育至關(guān)重要。
續(xù)表4 差異基因的轉(zhuǎn)錄因子
3.1高溫是影響植物生長(zhǎng)發(fā)育的不利因素,造成大量的產(chǎn)量損失[23]。盡管高溫脅迫對(duì)作物的生理效應(yīng)已被廣泛報(bào)道,但對(duì)其潛在的分子機(jī)制的了解仍然有限。研究對(duì)正常溫度和高溫脅迫下的陸地棉進(jìn)行RNA-Seq測(cè)序,鑒定出陸地棉轉(zhuǎn)錄組上調(diào)差異表達(dá)基因383個(gè),下調(diào)差異表達(dá)基因234個(gè);可見(jiàn),抗熱基因?yàn)樯险{(diào)表達(dá),高溫脅迫限制了陸地棉的某些代謝活動(dòng);下調(diào)表達(dá)低于上調(diào)表達(dá);與李川等[23]、翟秀明等[24]對(duì)植物高溫脅迫下的基因表達(dá)上下調(diào)結(jié)果一致。
3.2差異表達(dá)基因GO功能富集分析,陸地棉轉(zhuǎn)錄組特性與生物過(guò)程、細(xì)胞成分、分子功能相關(guān);富集到差異基因主要是L-苯丙氨酸分解代謝過(guò)程、應(yīng)激反應(yīng)、蛋白質(zhì)復(fù)性等生物學(xué)過(guò)程,苯丙氨酸轉(zhuǎn)氨酶活性、催化活性等分子功能,細(xì)胞質(zhì)細(xì)胞組分。進(jìn)一步對(duì)KEGG代謝通路富集,上調(diào)差異基因和下調(diào)差異基因共241個(gè)被富集到12個(gè)KEGG代謝通路,這些基因主要參與類黃酮生物合成,次級(jí)代謝產(chǎn)物的生物合成,晝夜節(jié)律-植物,苯丙烷代謝,酮體的合成與降解,內(nèi)質(zhì)網(wǎng)蛋白加工等途徑。與許小芳[25]富集到顯著通路一致。其中富集到內(nèi)質(zhì)網(wǎng)加工途徑的17個(gè)熱激蛋白差異基因,表達(dá)均下調(diào),為后續(xù)研究作為參考。黃酮和類黃酮物質(zhì)具有自由基清除能力和抗氧化能力,黃酮醇具有保護(hù)植物抵抗環(huán)境的各種刺激能力[26],在陸地棉中有大量差異表達(dá)基因注釋到黃酮和黃酮醇生物合成路徑,這些基因可能與陸地棉響應(yīng)高溫脅迫有關(guān)。上述代謝通路都與植物的抗逆性相關(guān),但個(gè)別代謝通路在陸地棉中的調(diào)控機(jī)理暫不清楚,也為進(jìn)一步了解陸地棉抗熱機(jī)理指明了研究方向。
3.3經(jīng)過(guò)高溫脅迫處理后,MYB、WRKY、NAC、ERF家族大多數(shù)成員表達(dá)上調(diào),上調(diào)應(yīng)答的轉(zhuǎn)錄因子在非生物脅迫下能提高植物逆境適應(yīng)能力,推測(cè)這4個(gè)家族的大多數(shù)成員上調(diào)表達(dá)能提高植株對(duì)熱的適應(yīng)性。與李鑫雨等[27]結(jié)論一致。RNA-Seq是一種在轉(zhuǎn)錄水平上更為精確的測(cè)定分析方法,其通量高、成本低、分辨率高、靈敏度高且不受物種限制[28-30]。
共鑒定出383個(gè)共有上調(diào)基因和234個(gè)共有下調(diào)基因,上調(diào)差異基因大于下調(diào)差異基因。將差異基因按GO功能分類,主要富集到上調(diào)差異基因和下調(diào)差異基因20個(gè)類別,富集到內(nèi)質(zhì)網(wǎng)加工途徑的17個(gè)熱激蛋白,均表現(xiàn)為下調(diào),鑒定出差異基因主要集中在MYB、WRKY、NAC、ERF這4大家族成員。差異基因顯著富集到類黃酮生物合成途徑、苯丙烷代謝、晝夜節(jié)律-植物、內(nèi)質(zhì)網(wǎng)加工等通路;鑒定出39個(gè)轉(zhuǎn)錄因子,主要是WRKY和MYB兩大家族;Gohir.A08G104100是熱脅迫主要的基因,對(duì)植物的耐熱性至關(guān)重要,Gohir.D08G033300是質(zhì)體類異戊二烯生物合成的限制酶,對(duì)葉綠體發(fā)育至關(guān)重要,2個(gè)差異基因在整個(gè)時(shí)期表達(dá)量差異倍數(shù)較為顯著。