国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

茶樹PPR基因家族全基因組鑒定及白化相關(guān)基因表達(dá)分析

2021-04-20 02:28:56劉丁丁王君雅湯榕津陳亮馬春雷
茶葉科學(xué) 2021年2期
關(guān)鍵詞:白化葉綠體結(jié)構(gòu)域

劉丁丁,王君雅,湯榕津,陳亮,馬春雷

茶樹基因家族全基因組鑒定及白化相關(guān)基因表達(dá)分析

劉丁丁1,2,王君雅1,2,湯榕津1,2,陳亮1*,馬春雷1*

1. 中國農(nóng)業(yè)科學(xué)院茶葉研究所/國家茶樹改良中心/農(nóng)業(yè)部茶樹生物學(xué)與資源利用重點(diǎn)實(shí)驗(yàn)室,浙江 杭州 310008; 2. 中國農(nóng)業(yè)科學(xué)院研究生院,北京 100081

三角狀五肽(PPR)蛋白作為一類靶向定位于半自主細(xì)胞器的序列特異性RNA結(jié)合蛋白,在植物的生長發(fā)育過程中具有重要的作用。本研究基于茶樹基因組數(shù)據(jù),利用生物信息學(xué)方法對茶樹基因家族進(jìn)行系統(tǒng)鑒定,并對其蛋白質(zhì)理化性質(zhì)、結(jié)構(gòu)域保守性、亞細(xì)胞定位、基因結(jié)構(gòu)、染色體定位與分布等進(jìn)行了分析。結(jié)果表明,在茶樹基因組數(shù)據(jù)中共鑒定到858個(gè)基因,分屬于P和PLS兩個(gè)亞家族;結(jié)構(gòu)域分析表明各個(gè)結(jié)構(gòu)域在茶樹中比較保守;亞細(xì)胞定位結(jié)果顯示超過一半的CsPPR蛋白定位于葉綠體;基因結(jié)構(gòu)分析表明茶樹基因家族中共有31%的基因不具有內(nèi)含子結(jié)構(gòu),并且家族成員在進(jìn)化過程中發(fā)生過多次基因復(fù)制事件。另外,為探究茶樹基因家族在調(diào)控茶樹白化相關(guān)基因表達(dá)過程中的作用,對正常葉色品種舒茶早和安吉黃茶等5個(gè)白化茶樹品種進(jìn)行轉(zhuǎn)錄組測序,共篩選到24個(gè)差異共表達(dá)基因,并利用實(shí)時(shí)熒光定量PCR技術(shù)對其在不同品種和不同組織中的表達(dá)模式進(jìn)行了分析,結(jié)果顯示大多數(shù)基因在新梢、成熟葉和莖中高表達(dá),但在花和根中痕量表達(dá)。本研究結(jié)果可為茶樹家族成員的基因克隆和功能研究提供參考。

茶樹;基因家族;轉(zhuǎn)錄組;生物信息學(xué);實(shí)時(shí)熒光定量PCR

三角狀五肽(Pentatricopeptide repeat,PPR)蛋白是一類在陸生植物中廣泛存在,數(shù)量龐大的蛋白家族。一般情況下,PPR蛋白由N端長度可變的信號(hào)序列、PPR重復(fù)基序單元和C端結(jié)構(gòu)域組成;根據(jù)PPR基序的種類、數(shù)量和排列順序,可分為P亞家族和PLS亞家族,其中PLS亞家族蛋白根據(jù)C末端結(jié)構(gòu)域的不同,又可分為PLS類、E類、E+類和DYW類4類蛋白質(zhì)[1-3]。研究表明,PPR蛋白大多定位于葉綠體或線粒體,通過參與調(diào)控RNA代謝過程,從而在植物生長發(fā)育、胚胎形成和調(diào)控細(xì)胞質(zhì)雄性不育等方面發(fā)揮作用[4-6]。除此之外,PPR蛋白也被鑒定到與植物的葉綠體發(fā)育密切相關(guān)[7-12]。如簡磊等[10]利用圖位克隆的方法在水稻第3號(hào)染色體InDel標(biāo)記3G5和SG3之間定位到1個(gè)編碼PPR蛋白的基因,該基因在1?387位發(fā)生了1個(gè)堿基G的插入,使編碼的蛋白失去功能,產(chǎn)生白化表型。何鵬等[12]利用基因沉默技術(shù)篩選到1個(gè)與棉花葉色形成相關(guān)的基因,該基因沉默后,調(diào)控葉綠體基因轉(zhuǎn)錄的和基因的表達(dá)水平降低,最終導(dǎo)致棉花葉色變黃。目前,袁玲[13]在白葉1號(hào)中克隆了1個(gè)基因,并推測該基因可能負(fù)向調(diào)控葉綠體基因的表達(dá),導(dǎo)致白化現(xiàn)象產(chǎn)生;其他關(guān)于茶樹中與調(diào)控葉綠體發(fā)育相關(guān)的基因的研究還鮮有報(bào)道。

鑒于基因家族部分成員具有靶向調(diào)控葉綠體基因表達(dá),進(jìn)而影響葉綠體發(fā)育及光合作用的功能,本研究通過對正常綠色品種舒茶早和安吉黃茶等5個(gè)白化品種進(jìn)行轉(zhuǎn)錄組測序,篩選到24個(gè)可能與茶樹白化表型相關(guān)的基因,并對其在不同品種和不同組織中的表達(dá)特性進(jìn)行了檢測;同時(shí)結(jié)合舒茶早基因組數(shù)據(jù),利用生物信息學(xué)方法對茶樹基因家族成員進(jìn)行系統(tǒng)鑒定,研究結(jié)果將為今后功能的深入挖掘提供幫助。

1 材料與方法

1.1 材料

以保存于國家種質(zhì)杭州茶樹圃內(nèi)的白雞冠、舒茶早、安吉黃茶、景白1號(hào)、景白2號(hào)、中白1號(hào)和中黃3號(hào)為試驗(yàn)材料,取其春季一芽二葉新梢,于液氮中速凍,后用于CsPPR基因序列分析和轉(zhuǎn)錄組測序分析。并以龍井43為試驗(yàn)材料,分別取其一芽二葉、莖、成熟葉、花和根等組織器官,于液氮中速凍,用于組織表達(dá)模式分析。

在茶樹基因組數(shù)據(jù)庫TPIA(http://tpia.teaplant.org/index.html)下載已測序完成的舒茶早2018版和2020版基因組序列、基因組注釋信息、預(yù)測CDS序列以及預(yù)測蛋白質(zhì)序列等數(shù)據(jù),用于茶樹基因家族的生物信息學(xué)分析。

1.2 茶樹CsPPR基因家族篩選與鑒定

在Pfam[14]數(shù)據(jù)庫下載PPR種子序列(PF01535),基于Linux系統(tǒng)利用隱馬爾可夫模型(profile hidden Markov models,profile HMMS)軟件包HMMER3.1b1[15-16]的搜索功能鑒定茶樹中的基因家族,定義閾值為1e-10;并利用NCBI的CDD數(shù)據(jù)庫分析基因的編碼蛋白特征,以確保家族成員僅具有PPR及其相關(guān)結(jié)構(gòu)域。

利用hmmpress程序格式化擬南芥基因家族的P(PPR)、S、L、L2、E、E+和DYW 7個(gè)保守結(jié)構(gòu)域定義的HMMER矩陣,得到一個(gè)HMM數(shù)據(jù)庫;通過hmmscan程序檢索CsPPR蛋白家族候選序列的PPR結(jié)構(gòu)域分布,定義閾值為1e-10,并人工逐條對候選序列進(jìn)行結(jié)構(gòu)分析和分類。

1.3 茶樹CsPPR蛋白保守結(jié)構(gòu)域分析

基于CsPPR蛋白序列結(jié)構(gòu),提取CsPPR蛋白序列中7種PPR相關(guān)結(jié)構(gòu)域,并分別利用ClustalW程序進(jìn)行多序列比對,并利用WebLogo(http://weblogo.berkeley.edu/l ogo. cgi)在線軟件繪制出motif logo圖。

1.4 茶樹CsPPR蛋白分析

利用ProtParam在線軟件分析CsPPR的理化性質(zhì);利用SignalP-5.0 Server(http://www.cbs.dtu.dk/services/SignalP)在線軟件對CsPPR蛋白的信號(hào)肽進(jìn)行分析;利用PSORT(https://wolfpsort.hgc.jp)在線軟件對CsPPR蛋白進(jìn)行亞細(xì)胞定位預(yù)測;利用ClustalW程序包對CsPPR蛋白家族序列進(jìn)行多序列比對,并通過MEGA 7.0軟件對多序列比對結(jié)果進(jìn)行分析并構(gòu)建序列進(jìn)化樹,通過EvolView(http://120.202.110.254:8280/evolview)在線工具對進(jìn)化樹進(jìn)行可視化作圖。

1.5 茶樹CsPPR家族的基因結(jié)構(gòu)分析及染色體定位與分布

基于舒茶早基因組數(shù)據(jù),利用GSDS在線軟件分析CsPPR家族成員的基因結(jié)構(gòu);并利用blast程序,分析茶樹基因家族成員的同源基因,之后利用Tbtools軟件基于基因注釋信息對同源關(guān)系進(jìn)行可視化。

1.6 茶樹部分CsPPR基因序列鑒定

采用艾德萊植物RNA快速提取試劑盒和天根植物總DNA提取試劑盒提取白雞冠總RNA和總DNA,之后利用微量紫外檢測儀Nano Drop檢測RNA和DNA的濃度,并利用1.2%的瓊脂糖凝膠電泳檢測其質(zhì)量。采用天根Fastking gDNA Dispelling RT SuperMix kit將RNA反轉(zhuǎn)錄為cDNA。以白雞冠的DNA和cDNA為模板分別進(jìn)行PCR擴(kuò)增,PCR引物利用NCBI網(wǎng)站中的primer blast程序設(shè)計(jì)。PCR反應(yīng)體系為:5?μL KOD buffer,5?μL dNTP,3?μL MgSO4,上下游PCR引物各1?μL,1?μL模板基因組DNA/cDNA,1?μL KOD酶,最后補(bǔ)加33?μL ddH2O至終體積50?μL。PCR反應(yīng)程序?yàn)椋?4℃預(yù)變性2?min;98℃變性30?s;設(shè)置52~64℃退火溫度梯度,退火1?min,68℃延伸30?s,40個(gè)循環(huán);最后,68℃再延伸7?min,4℃保溫。利用1.2%的瓊脂糖凝膠電泳對PCR產(chǎn)物進(jìn)行檢測,對檢測到含有單一目的條帶序列的PCR產(chǎn)物送浙江尚亞生物技術(shù)公司測序,驗(yàn)證片段的準(zhǔn)確性。

1.7 不同茶樹品種中差異共表達(dá)的CsPPR分析

本研究利用6個(gè)茶樹品種的轉(zhuǎn)錄組數(shù)據(jù),以正常綠色品種舒茶早為對照組,以白化品種安吉黃茶、景白1號(hào)、景白2號(hào)、中白1號(hào)和中黃3號(hào)為試驗(yàn)組,篩選差異共表達(dá)的基因,差異基因的篩選條件為:表達(dá)差異倍數(shù)|log2Fold Change|>1(Fold change=試驗(yàn)組/對照組)。根據(jù)獲得的表達(dá)數(shù)據(jù)利用R軟件包繪制韋恩圖。

1.8 實(shí)時(shí)熒光定量PCR分析

表1 熒光定量PCR引物序列

2 結(jié)果與分析

2.1 PPR基因家族的鑒定與分類

近幾年,隨著測序技術(shù)的不斷進(jìn)步,多個(gè)茶樹基因組草圖和染色體級(jí)別的茶樹參考基因組相繼完成[17-21],其中由安徽農(nóng)業(yè)大學(xué)于2018年和2020年分別發(fā)表的舒茶早基因組圖譜,因其較高的測序質(zhì)量,更具使用價(jià)值;兩個(gè)版本的基因組分別包含33?932個(gè)和50?525個(gè)蛋白編碼基因,為了進(jìn)一步了解兩版注釋基因的差別,本研究對兩版注釋中的茶樹PPR家族進(jìn)行了比較分析,分別鑒定得到676個(gè)和858個(gè)PPR蛋白序列(圖1)。隨后基于各序列中的PPR結(jié)構(gòu)域及其相關(guān)結(jié)構(gòu)域的分布情況,初步將PPR家族成員分成P和PLS兩個(gè)亞家族,其中PLS亞家族依據(jù)不同結(jié)構(gòu)域的分布情況,可分為PLS類、E類、E+類和DYW類。初步分析表明,2020版基因組注釋得到的茶樹PPR亞家族均包含更多成員,其中P亞家族包含383個(gè)基因,PLS亞家族包含475個(gè)基因,將其分別命名為;而2018版注釋中P亞家和PLS亞家族分別包含331和345個(gè)基因家族成員。兩版注釋的差別主要來自P類、E+類和DYW類基因數(shù)量,2020版基因組鑒定到3類基因的數(shù)量較2018版基因組多50個(gè)左右,說明新版基因組對復(fù)雜結(jié)構(gòu)域的注釋能力更強(qiáng)了。

圖1 茶樹PPR基因家族分類及數(shù)目

2.2 茶樹CsPPR家族的蛋白序列結(jié)構(gòu)域保守性分析

通過比較不同分類PPR蛋白的結(jié)構(gòu)域序列特征,對茶樹CsPPR蛋白的保守性進(jìn)行分析(圖2),結(jié)果顯示,茶樹CsPPR蛋白中的P、L、S、L2結(jié)構(gòu)域序列與PF01535種子序列之間存在較高的序列相似性,特別是P結(jié)構(gòu)域序列,與PF01535種子序列之間僅有5個(gè)堿基位點(diǎn)的差異;并且發(fā)現(xiàn)P、S結(jié)構(gòu)域的保守性要高于L、L2結(jié)構(gòu)域的保守性。進(jìn)一步對每個(gè)結(jié)構(gòu)域進(jìn)行單獨(dú)分析,發(fā)現(xiàn)P和L結(jié)構(gòu)域的第35位和L2結(jié)構(gòu)域的第36位分別存在一個(gè)保守氨基酸位點(diǎn),分別是Pro35、Ser35和Pro36;而E、E+和DYW結(jié)構(gòu)域的一些堿基位點(diǎn)也分別具有較高的保守性,特別是DYW結(jié)構(gòu)域序列末端具有3個(gè)保守氨基酸位點(diǎn):Asp-Tyr-Trp,且這3種結(jié)構(gòu)域序列長度大約為76、31、94個(gè)氨基酸殘基。

2.3 茶樹CsPPR家族基因編碼蛋白的理化性質(zhì)分析

對茶樹中的858個(gè)CsPPR蛋白進(jìn)行理化性質(zhì)分析,結(jié)果表明,蛋白質(zhì)的序列長度為106~2?284個(gè)氨基酸;相對分子質(zhì)量最小的是CsPPR613,為11.68?kDa,最大的是CsPPR50,為261.97?kDa;理論等電點(diǎn)為4.48~9.93,其中有443個(gè)CsPPR蛋白的pI小于7,表明茶樹中有超過一半的CsPPR蛋白為酸性蛋白;親疏水性分析表明,CsPPR蛋白家族中有583條親水性蛋白,273條疏水性蛋白;不穩(wěn)定系數(shù)分析表明,在CsPPR蛋白家族中,有557個(gè)CsPPR蛋白是穩(wěn)定蛋白,301個(gè)屬于不穩(wěn)定蛋白。

2.4 茶樹CsPPR家族基因編碼蛋白的信號(hào)肽分析

信號(hào)肽是位于新合成肽鏈的N端,由15~30個(gè)氨基酸殘基組成的一段多肽,通常含有6~15個(gè)帶正電荷的非極性氨基酸,其作用是將新生肽鏈轉(zhuǎn)移到內(nèi)質(zhì)網(wǎng)上,具有可判定一個(gè)蛋白質(zhì)是否為分泌蛋白的功能,也與蛋白質(zhì)的定位有關(guān)[22]。858個(gè)CsPPR蛋白質(zhì)的信號(hào)肽預(yù)測結(jié)果表明,幾乎所有的CsPPR蛋白的Signal peptide預(yù)測分值都小于0.5,僅有4個(gè)CsPPR蛋白的預(yù)測分值大于0.5,分別是CsPPR22、CsPPR62、CsPPR261和CsPPR668。表明在CsPPR蛋白家族中僅有4個(gè)蛋白存在信號(hào)肽,屬于分泌蛋白,其他均屬于非分泌蛋白,合成后不進(jìn)入內(nèi)質(zhì)網(wǎng)和高爾基體分泌途徑,而是直接釋放到細(xì)胞質(zhì)中。

2.5 茶樹CsPPR家族基因編碼蛋白的亞細(xì)胞定位分析

通過PSORT軟件對CsPPR基因家族的蛋白進(jìn)行亞細(xì)胞定位預(yù)測,預(yù)測結(jié)果表明(表2),超過一半的CsPPR蛋白定位在了葉綠體上;其次是定位在細(xì)胞質(zhì)、線粒體和細(xì)胞核上;少數(shù)CsPPR蛋白定位在細(xì)胞質(zhì)膜、液泡和內(nèi)質(zhì)網(wǎng)等區(qū)域;個(gè)別CsPPR蛋白同時(shí)定位在葉綠體和線粒體,以及細(xì)胞質(zhì)與細(xì)胞核上。對各類型CsPPR蛋白的亞細(xì)胞定位預(yù)測結(jié)果單獨(dú)分析發(fā)現(xiàn),總體上各類型CsPPR蛋白在不同細(xì)胞器的分布情況與總的CsPPR蛋白具有相似的趨勢??傮w來看,茶樹中的CsPPR蛋白以定位于葉綠體為主,少量定位于線粒體,且定位于半自主性細(xì)胞器的數(shù)量占CsPPR蛋白總數(shù)的一半以上,這與番茄、煙草、甘藍(lán)型油菜等植物的PPR蛋白定位結(jié)果存在一些差異,如譚暉等[23]利用Prot Comp 9.0軟件預(yù)測到甘藍(lán)型油菜中接近50%的PPR基因定位于線粒體。這說明PPR蛋白雖具有極高的分化程度,但是仍具有典型的定位于半自主性細(xì)胞器的特點(diǎn)。茶樹CsPPR蛋白大多定位于葉綠體,可能是因?yàn)椴铇鋵儆诙嗄晟>G木本植物,且以葉用為主,其葉片進(jìn)行光合作用的分子機(jī)制要復(fù)雜于其他植物。

注:字母高度與氨基酸的保守性相關(guān),字母高度越高,氨基酸越保守

表2 茶樹CsPPR蛋白亞細(xì)胞定位預(yù)測

2.6 茶樹CsPPR家族基因結(jié)構(gòu)分析

現(xiàn)有研究表明,陸生植物中的多數(shù)基因具有無內(nèi)含子的特點(diǎn)。為分析茶樹基因家族成員的序列結(jié)構(gòu),本研究利用茶樹基因內(nèi)含子、外顯子的注釋信息,以及家族序列比對結(jié)果,繪制基因的聚類樹(圖3)。結(jié)果表明,存在31%的基因不具有內(nèi)含子,而含有1~5個(gè)內(nèi)含子的基因數(shù)量最多,占整個(gè)基因家族的65%;少部分基因含有6~10個(gè)內(nèi)含子,僅14個(gè)基因含有內(nèi)含子的數(shù)量在11個(gè)以上。此外,對其非編碼區(qū)(Untranslation region,UTR)進(jìn)行分析(圖3-C)表明,接近40%的基因不存在UTR區(qū)域;對基因家族成員的基因序列長度分析發(fā)現(xiàn),序列長度為0.4~50?kbp,存在很大的差異。

2.7 CsPPR基因家族的染色體定位與分布

將鑒定到的858條基因與2020年發(fā)表的染色體級(jí)舒茶早基因組進(jìn)行比對分析,發(fā)現(xiàn)其中613條基因分布于15條染色體上(圖4-A),245條基因分布于211條contig序列上。15條染色體上包含的基因數(shù)量為20~74,其中12號(hào)染色體上分布數(shù)量最少,1號(hào)染色體上分布數(shù)量最多。隨后對分布于染色體上的基因家族成員進(jìn)行共線性分析,發(fā)現(xiàn)不同染色體間具有高度同源性的基因有26對,而在染色體內(nèi)具有高度同源性的基因有128對(圖4-B),表明茶樹基因家族在進(jìn)化過程中可能存在較多染色體內(nèi)部的基因復(fù)制事件。

注:A:茶樹中有無內(nèi)含子的CsPPR基因分布(橘色,無內(nèi)含子;藍(lán)色,有內(nèi)含子);B:茶樹CsPPR基因家族中包含不同數(shù)量內(nèi)含子的CsPPR基因分布;C:茶樹中有無UTR區(qū)域的CsPPR基因分布(綠色,無UTR;紅色,有UTR)

注:A. 茶樹各個(gè)染色體上PPR基因數(shù)量的分布;B. 茶樹各個(gè)染色體間PPR基因的共線性分析

2.8 茶樹CsPPR基因家族成員的進(jìn)化分析

茶樹基因家族成員之間的系統(tǒng)進(jìn)化結(jié)果表明(圖5),P和PLS兩個(gè)亞家族蛋白分別集中聚集成簇,但兩個(gè)亞家族內(nèi)均存在一定數(shù)量的離群序列,這在一定程度上反映了P亞家族和PLS亞家族成員在進(jìn)化上的差異,但也表明了兩個(gè)亞家族成員之間存在基因交流現(xiàn)象。就PLS亞家族而言,僅DYW類蛋白分布相對集中,而E、E+和PLS類蛋白均分布較離散,這可能是與不同結(jié)構(gòu)域之間的序列差異性和分化程度相關(guān),也進(jìn)一步反映了茶樹CsPPR家族蛋白序列結(jié)構(gòu)的復(fù)雜性,可能正是這種序列結(jié)構(gòu)的復(fù)雜性以及序列之間的差異性造就了基因家族功能的多樣性。

2.9 部分CsPPR家族成員序列鑒定

為進(jìn)一步對生信分析結(jié)果的準(zhǔn)確性進(jìn)行驗(yàn)證,我們隨機(jī)挑選了78個(gè)和55個(gè)基因,分別以DNA和cDNA為模板進(jìn)行擴(kuò)增。通過反復(fù)優(yōu)化PCR反應(yīng)體系,最終成功擴(kuò)增出76個(gè)基因的DNA序列和49個(gè)基因的cDNA序列(表3);測序結(jié)果表明,擴(kuò)增序列與基因組數(shù)據(jù)庫中的序列一致,這說明目前發(fā)布的茶樹基因組拼接質(zhì)量較好,已能夠滿足常規(guī)的基因家族分析及基因克隆試驗(yàn)。

2.10 不同茶樹品種中差異CsPPR基因分析

為進(jìn)一步探究基因家族在調(diào)控茶樹白化相關(guān)基因表達(dá)過程中的作用,我們對正常葉色品種舒茶早和安吉黃茶等5個(gè)白化茶樹品種進(jìn)行了轉(zhuǎn)錄組測序,測序質(zhì)量分析表明(表4),幾個(gè)品種的clean reads與參考基因組的比對率均在80%以上,其中比對到基因外顯子區(qū)域的reads數(shù)超過93%,Q30值在82.93%~89.51%,表明整體測序質(zhì)量較好、與參考基因組比對率高,符合后續(xù)分析要求。

隨后,我們對5個(gè)組合的差異基因進(jìn)行了初步分析(圖6),共篩選到379個(gè)差異表達(dá)的基因,其中24個(gè)基因在所有白化茶樹品種中差異共表達(dá);在24個(gè)基因中下調(diào)表達(dá)的有20個(gè),上調(diào)表達(dá)的有4個(gè),推測這些基因可能與茶樹的白化表型相關(guān)。

圖5 茶樹PPR基因家族的進(jìn)化分析

表3 部分CsPPR家族基因序列的PCR擴(kuò)增結(jié)果

表4 測序數(shù)據(jù)統(tǒng)計(jì)

注:SCZ:舒茶早;AJHC:安吉黃茶;JB1:景白1號(hào);JB2:景白2號(hào);ZB1:中白1號(hào);ZH3:中黃3號(hào)

Note: SCZ: Shuchazao. AJHC: Anji Huangcha. JB1: Jingbai 1. JB2: Jingbai 2. ZB1: Zhongbai 1. ZH3: Zhonghuang 3

2.11 實(shí)時(shí)熒光定量PCR分析

為驗(yàn)證轉(zhuǎn)錄組測序結(jié)果的可靠性,我們采用熒光定量PCR技術(shù)對篩選到的24個(gè)基因在6個(gè)茶樹品種的表達(dá)情況進(jìn)行了檢測(圖7)。結(jié)果表明,120組熒光定量數(shù)據(jù)中,與轉(zhuǎn)錄組表達(dá)趨勢相同的有103組,占所有檢測數(shù)據(jù)的85.8%。其中17個(gè)基因在5個(gè)白化茶樹品種中的熒光定量結(jié)果與轉(zhuǎn)錄組表達(dá)趨勢相一致;和在4個(gè)白化茶樹品種中的熒光定量結(jié)果與轉(zhuǎn)錄組表達(dá)趨勢一致;而、和等5個(gè)基因僅在2個(gè)或3個(gè)品種的表達(dá)趨勢與轉(zhuǎn)錄組相一致,這可能是由于熒光定量PCR技術(shù)和轉(zhuǎn)錄組數(shù)據(jù)在檢測基因表達(dá)差異上的靈敏度不同造成的試驗(yàn)誤差,因此上述差異在可接受范圍內(nèi),說明本文利用轉(zhuǎn)錄組數(shù)據(jù)篩選出的結(jié)果是可靠的。

2.12 差異共表達(dá)的基因在茶樹不同組織中的表達(dá)模式分析

為了進(jìn)一步探究基因在茶樹生長發(fā)育過程中的潛在功能,本文分析了24個(gè)基因在5個(gè)茶樹組織中的表達(dá)模式。表達(dá)熱圖顯示(圖8),24個(gè)基因在茶樹各個(gè)組織中均有表達(dá),但不同基因在不同組織中的表達(dá)量存在差異,且多數(shù)基因在茶樹新梢、成熟葉和莖中具有較高的表達(dá)量,但在花和根中痕量表達(dá)。其中基因在新梢中表達(dá)量最低;、、和在成熟葉中表達(dá)量較低;在莖中表達(dá)量較低;而、和在根中具有相對較高的表達(dá)量,表明這3個(gè)基因可能對茶樹根系具有重要調(diào)控作用。

3 討論

隨著多種植物基因組計(jì)劃的完成,從全基因組層面對基因家族進(jìn)行鑒定和研究已成為現(xiàn)實(shí)。目前,除了在模式植物擬南芥、水稻、番茄、煙草和白楊中分別鑒定到441、491、471、487個(gè)和626個(gè)基因[1,24-26],在非模式植物甘藍(lán)型油菜、小麥和谷子中也已分別鑒定到1?079、1?351個(gè)和486個(gè)基因[23,27-28]。本研究基于已測序完成的2018版和2020版舒茶早茶樹基因組數(shù)據(jù)[18,20],利用生物信息學(xué)的方法分別篩選到676個(gè)和858個(gè)茶樹基因,均分屬于P和PLS兩個(gè)亞家族,其中PLS亞家族又包括PLS、E、E+和DYW 4類,該基因家族成員數(shù)量差異表明新版基因組對復(fù)雜結(jié)構(gòu)域的注釋能力更強(qiáng);亞細(xì)胞定位預(yù)測結(jié)果顯示,茶樹CsPPR蛋白主要定位于葉綠體上,少數(shù)定位于細(xì)胞質(zhì)、線粒體和細(xì)胞核中,表明茶樹CsPPR蛋白具有調(diào)控半自主細(xì)胞器中RNA代謝的功能;基因在染色體上的分布結(jié)果顯示,茶樹基因在所有的染色體上均有分布,且比較分散[27],這與小麥基因在染色體上的分布趨勢相一致,而與水稻基因在染色體上的分布有差異,水稻基因在染色體上的分布則比較集中[29]。系統(tǒng)進(jìn)化分析發(fā)現(xiàn),家族成員中P類和DYW類分別聚集成簇,而PLS、E和E+類分布比較離散,這可能與基因的進(jìn)化過程有關(guān),為了更好的適應(yīng)環(huán)境變化,基因之間分化程度較高,序列之間差異較大,說明基因家族成員的功能具有多樣性和復(fù)雜性;基因結(jié)構(gòu)分析表明,茶樹中超過一半的基因不具有內(nèi)含子,這可能與基因在進(jìn)化過程中發(fā)生了反轉(zhuǎn)錄轉(zhuǎn)座事件有關(guān)[3]。

注:RNA-Seq數(shù)據(jù)是log2轉(zhuǎn)換后的fold change值;RT-qPCR數(shù)據(jù)是log2轉(zhuǎn)換后的基因相對表達(dá)量

圖8 茶樹不同組織間基因的表達(dá)模式分析

為了探究基因家族成員在調(diào)控茶樹白化相關(guān)基因表達(dá)過程中的作用,本研究從綠色品種舒茶早和安吉黃茶等5個(gè)白化品種的轉(zhuǎn)錄組數(shù)據(jù)中,篩選到24個(gè)差異共表達(dá)的基因;隨后對這24個(gè)基因在不同品種和不同組織中的表達(dá)情況進(jìn)行分析,結(jié)果表明,多數(shù)基因在茶樹新梢、成熟葉和莖中具有較高的表達(dá)量,這與水稻中定位到的多個(gè)調(diào)控白化表型的基因表達(dá)模式一致,如[30]、[31]等基因均在葉片中具有較高的表達(dá)水平。此外,我們將這24個(gè)差異基因與擬南芥基因家族成員進(jìn)行序列比對,發(fā)現(xiàn)、、、基因分別與擬南芥的、、、基因的同源性達(dá)到65%以上,表明它們可能具有相似的生物學(xué)功能?;蚨ㄎ挥谫|(zhì)體,通過與細(xì)胞器RNA編輯因子MORF2和MORF9相互作用,進(jìn)而調(diào)控與葉綠體發(fā)育相關(guān)的質(zhì)體基因的表達(dá),基因發(fā)生T-DNA插入導(dǎo)致擬南芥子葉色素缺失,進(jìn)而出現(xiàn)子葉白化現(xiàn)象[32];基因定位于葉綠體,是擬南芥中第一個(gè)發(fā)現(xiàn)與早期胚胎致死相關(guān)的基因,其突變會(huì)導(dǎo)致細(xì)胞持續(xù)分裂和胚膨大,形成異常的組織結(jié)構(gòu),進(jìn)而影響子葉發(fā)育[33];基因定位于葉綠體中,通過與葉綠體的操縱子相結(jié)合,從而調(diào)控葉綠體RNA代謝過程,該基因突變會(huì)影響細(xì)胞色素復(fù)合體的積累[34];是編輯葉綠體轉(zhuǎn)錄本和所需要的基因,該基因發(fā)生突變會(huì)導(dǎo)致葉綠體發(fā)育受損,幼苗呈現(xiàn)黃化表型,甚至死亡[35]。因此推測茶樹葉色白化變異也可能與某些基因的突變有關(guān),但具體的分子機(jī)理,還需進(jìn)一步的深入研究。

[1] Claire L, Charles A, Sebastien A, et al. Genome-wide analysis ofpentatricopeptide repeat proteins reveals their essential role in organelle biogenesis [J]. The Plant Cell, 2004, 16(8): 2089-2103.

[2] Small I D, Peeters N. The PPR motif-a TPR-related motif prevalent in plant organellar proteins [J]. Trends Biochem Sci, 2000, 25(2): 46-47.

[3] Dipnarayan S, Prasad A M, Ramamurthy S. Pentatricopeptide repeat proteins and their emerging roles in plants [J]. Plant Physiology and Biochemistry, 2007, 45 (8): 521-534.

[4] Barkan A, Waller M, Nolasco M. A nuclear mutation in maize blocks the processing and translation of several chloroplast mRNAs and provides evidence for the differential translation of alternative mRNA forms [J]. EMBO J, 1994, 13(13): 3170-3181.

[5] Sam M. An overview of pentatricopeptide repeat proteins and their applications [J]. Bochimine, 2015, 113: 93-99.

[6] Schmitz-Linneweber C, Small I. Pentatricopeptide repeat proteins: a socket for organelle gene expression [J]. Trends Plant Sci, 2008, 13(12): 663-670.

[7] 陳龍. 水稻淡綠葉基因PGL12的克隆與功能分析[D]. 武漢: 華中農(nóng)業(yè)大學(xué), 2019: 40-42. Chen L. Cloning and functional analysis of12 in rice [D]. Wuhan: Huazhong Agricultural University, 2019: 40-42.

[8] 陳璐. 水稻低溫條件下葉綠體發(fā)育必需基因TCM8的克隆與功能分析[D]. 上海: 上海師范大學(xué), 2019: 27-29. Chen L. Cloning and functional analysis of essential gene TCM8 for chloroplast development under low temperature conditions in rice () [D]. Shanghai: Shanghai Normal University, 2019: 27-29.

[9] 葛生珍. 水稻黃化突變體xnt7的生理特性和基因精細(xì)定位[D]. 重慶: 西南大學(xué), 2014: 28-33. Ge S Z. Physiological characteristics of a xanthic mutant and fine-mapping of its related genein rice [D]. Chongqing: Southwest University, 2014: 28-33.

[10] 簡磊, 王仲康, 曾冬冬, 等. 水稻白化轉(zhuǎn)綠突變體albg的鑒定和基因精細(xì)定位[J]. 核農(nóng)學(xué)報(bào), 2017, 31(12): 2289-2297.Jian L, Wang Z K, Zeng D D, et al. Characterization and fine mapping of a green-revertible albino (albg) mutant in rice [J]. Journal of Nuclear Agricultural Sciences, 2017, 31(12): 2289-2297.

[11] 尚麗娜, 陳新龍, 米勝南, 等. 水稻溫敏型葉片白化轉(zhuǎn)綠突變體tsa2的表型鑒定與基因定位[J]. 作物學(xué)報(bào), 2019, 45(5): 662-675. Shang L N, Chen X L, Mi S N, et al. Phenotypic identification and gene mapping of temperature-sensitive green revertible albino mutant tsa2 in rice (L.) [J]. Acta Agronomica Sinica, 2019, 45(5): 662-675.

[12] 何鵬, 張麗華, 牟亞楠, 等. 棉花葉片黃化基因的篩選、鑒定及功能分析[C]//中國農(nóng)學(xué)會(huì)棉花分會(huì)2017年年會(huì)暨第九次會(huì)員代表大會(huì)論文匯編. 安陽: 棉花學(xué)報(bào), 2017: 38. He P, Zhang L H, Mou Y N, et al. Dentification and functional analysis of yellow variegated leaf genein cotton [C]//2017 Annual Meeting of the Cotton Branch of Chinese Agricultural Association and the Ninth Member Congress. Anyang: Cotton Science, 2017: 38.

[13] 袁玲. 白葉1號(hào)階段性返白過程中差異表達(dá)基因的分離及部分基因全長cDNA克隆[D]. 長沙: 湖南農(nóng)業(yè)大學(xué), 2012: 29-39. Yuan L. Separation of differentially expressed genes and full length cDNA cloning of selective genes during periodic albinism in Anjibaicha() [D]. Changsha: Hunan Agricultural University, 2012: 29-39.

[14] Punta M, Coggill P C, Eberhardt R Y. The pfam protein families database [J]. Nucleic Acids Research, 2012, 40(1): 290-301.

[15] Simon C P, Aurelien L, Sean R. E, et al. HMMER web server: 2018 update [J]. Nucleic Acids Research, 2018, 46: 200-204.

[16] Finn R D, Clements J, Eddy SR. HMMER web server: interactive sequence similarity searching [J]. Nucleic Acids Res, 2011, 39: 29-37.

[17] Xia E H, Zhang H B, Sheng J, et al. The tea tree genome provides insights into tea flavor and independent evolution of caffeine biosynthesis [J]. Molecular Plant, 2017, 10(6): 866-877.

[18] Wei C L, Yang H, Wang S B, et al. Draft genome sequence ofvarprovides insights into the evolution of the tea genome and tea quality [J]. PNAS, 2018, 115(18): E4151-E4158.

[19] Chen J D, Zheng C, Ma J Q, et al. The chromosome-scale genome reveals the evolution and diversification after the recent tetraploidization ebent in tea plant [J]. Horticulture Research, 2020, 7: 63. doi: 10.1038/s41438-020-0288-2.

[20] Xia E H, Tong W, Hou Y, et al. The reference genome of tea plant and resequencing of 18 diverse accessions provide insights into genome evolution and adaptation of tea plants [J]. Molecular Plant, 2020, 13(6/7): 1013-1026.

[21] Zhang Q J, Li W, Li K, et al. The chromosome-level reference genome of tea tree unveils recent bursts of non-autonomous LTR retrotransposons to drive genome size evolution [J]. Molecular Plant, 2020, 13(7): 935-938.

[22] 韋雪芳, 王冬梅, 劉思, 等. 信號(hào)肽及其在蛋白質(zhì)表達(dá)中的應(yīng)用[J]. 生物技術(shù)通報(bào), 2006(6): 38-42. Wei X F, Wang D M, Liu S, et al. Signal sequence and its application to protein expression [J]. Journal of Biotechnology, 2006(6): 38-42.

[23] 譚暉, 官春云. 甘藍(lán)型油菜PPR家族生物信息學(xué)分析與新疆野生油菜候選育性基因克隆[J]. 作物研究, 2017, 31(3): 246-255. Tan H, Guan C Y. Bioinformatics analysis of PPR family inL. and cloning of candidate restorer gene of Xinjiang wild rapeseed [J]. Crop Research, 2006, 31(3): 246-255.

[24] Nicholas O, Mitsuru H, Charles A, et al. On the expansion of the pentatricopeptide repeat gene family in plants [J]. Society of Molecular Biology and Evolution, 2008, 25: 1120-1128.

[25] 丁安明. 番茄與煙草PPR基因家族分析及育性相關(guān)基因功能研究[D]. 北京: 中國農(nóng)業(yè)科學(xué)院, 2014. Ding A M. Identification of PPR gene family inand tomato and function analysis of Rf-related genes in tobacco [D]. Beijing: Chinese Academy of Agricultural Sciences, 2014.

[26] Xing H T, Fu X K, Yang C. et al. Genome-wide investigation of pentatricopeptide repeat gene family in poplar and their expression analysis in response to biotic and abiotic stresses [J]. Scientific Reports, 2018, 8: 2817. doi: 10.1038/s41598-018-21269-1.

[27] 郭彩娟, 公杰, 劉永杰, 等. 全基因組小麥PPR基因家族鑒定及表達(dá)分析[J]. 生物技術(shù)通報(bào), 2019, 35(8): 1-8. Guo C J, Gong J, Liu Y J, et al. Genome-wide bioinformatics identification of PPR gene family and expression profiles analysis in wheat [J]. Journal of Biotechnology, 2019, 35(8): 1-8.

[28] Liu J M, Xu Z S, Lu P P, et al. Genome-wide investigation and expression analyses of the pentatricopeptide repeat protein gene family in foxtail millet [J]. BMC Genomics. 2016, 17(1): 840. doi: 10.1186/s12864-016-3184-2.

[29] Chen G, Zou Y, Hu J, et al. Genome-wide analysis of the rice PPR gene family and their expression profiles under different stress treatments [J]. BMC Genomics, 2018, 19(1): 720. doi: 10.1186/s12864-018-5088-9.

[30] 倪晨子. 水稻PPR基因功能的初步分析[D]. 武漢: 武漢大學(xué), 2017: 38-39. Ni C Z. An initial function analysis of the PPR genein riceL) [D]. Wuhan: Wuhan University, 2017: 38-39.

[31] 高媛媛. 水稻PPR蛋白基因TCD34的克隆與功能分析[D]. 上海: 上海師范大學(xué), 2020: 27-36. Gao Y Y. Cloning and functional analysis of PPR genein rice () [D]. Shanghai: Shanghai Normal University, 2020: 27-36.

[32] Du L, Zhang J, Qu S F, et al. The pentratricopeptide repeat protein pigment-defective mutant2 is involved in the regulation of chloroplast development and chloroplast gene expression in[J]. Plant and Cell Physiology, 2017, 4(58): 747-759.

[33] Cushing D A, Forsthoefel N R, Gestaut D R, et al. Arabidopsis emb175 and other ppr knockout mutants reveal essential roles for pentatricopeptide repeat (PPR) proteins in plant embryogenesis [J]. Planta, 2005, 221: 424-436.

[34] Karin M, Susanne F, Takahiro N, et al. HCF152, an Arabidopsis RNA Binding Pentatricopeptide Repeat Protein Involved in the Processing of Chloroplast psbB-psbT-psbH-petB-petD RNAs [J]. Plant Cell, 2003, 15(6): 1480-1495.

[35] Hein A, Knoop V. Expected and unexpected evolution of plant RNA editing factors CLB19, CRR28 and RARE1: retention of CLB19 despite a phylogenetically deep loss of its two known editing targets in Poaceae [J]. BMC Evol Biol, 2018, 18(1): 85. doi:10.1186/s12862-018-1203-4.

Genome-wide Identification ofGene Family and Expression Analysis of Albino Related Genes in Tea Plants

LIU Dingding1,2, WANG Junya1,2, TANG Rongjin1,2, CHEN Liang1*, MA Chunlei1*

1. Tea Research Institute of the Chinese of Agricultural Sciences, National Center for Tea Improvement, Key Laboratory of Tea Biology and Resource Utilization, Ministry of Agriculture, Hangzhou 310008, China; 2. Graduate School of Chinese Academy of Agriculture Science, Beijing 100081, China

Pentatricopeptide repeat (PPR) proteins are a kind of sequence-specific RNA binding proteins and targeted at semi-autonomous organelles, which play essential roles in play growth and development. In this study, thegenes were systematically identified by bioinformatics analysis based on the tea genome data. Then, their subcellular localization, physicochemical properties, gene structures, the chromosome locations and distribution were analyzed. The results show that a total of 858 putativemembers were obtained from the genome data, which belong to P and PLS subfamilies. Domain analysis shows that each domains were relatively conservative in tea plants. Subcellular localization prediction indicates more than half of CsPPR proteins were located in the chloroplasts. Gene structure analysis shows that 31% ofgenes lacked intron and the gene family had undergone extensive gene duplication events in the process of evolution. Subsequently, In order to investigate the role ofgene family in regulating the gene expressions of albino tea plants, transcriptome analysis was performed on the normal leaf color cultivar ‘Shuchazao’ and five albino tea cultivars such as ‘Anji Huangcha’. And 24 differential co-expressedgenes were identified from transcriptome data of five groups, and the real-time quantitative PCR technology was used to analysis the expression pattern of the 24genes in different cultivars and tissues of tea plants, and the results show that the majority of them were highly expressed in shoots, mature leaves and stems. The research results would provide a basis forgene cloning and functional research.

tea plants,gene family, transcriptome, bioinformatics, real-time quantitative PCR

S571.1;Q946.84+1;Q939.1

A

1000-369X(2021)02-159-14

2020-07-13

2020-09-15

中國農(nóng)業(yè)科學(xué)院科技創(chuàng)新工程(CAAS-ASTIP-2017-TRICAAS)、現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)技術(shù)體系(CARS-19)、浙江省農(nóng)業(yè)(茶樹)新品種選育重大科技專項(xiàng)子課題(2016C02053-5)、中國農(nóng)業(yè)科學(xué)院茶葉研究所基本科研業(yè)務(wù)費(fèi)(1610212017008、1610212019004)

劉丁丁,女,碩士研究生,主要從事茶樹資源育種與遺傳改良研究。*通信作者:liangchen@tricaas.com;malei220@tricaas.com

(責(zé)任編輯:趙鋒).

猜你喜歡
白化葉綠體結(jié)構(gòu)域
白化黃喉擬水龜人工培育研究①
最嚴(yán)重白化
蛋白質(zhì)結(jié)構(gòu)域劃分方法及在線服務(wù)綜述
南方紅豆杉葉綠體非編碼序列PCR體系優(yōu)化及引物篩選
重組綠豆BBI(6-33)結(jié)構(gòu)域的抗腫瘤作用分析
組蛋白甲基化酶Set2片段調(diào)控SET結(jié)構(gòu)域催化活性的探討
白化茶種質(zhì)資源分類研究
茶葉(2015年3期)2015-12-13 06:31:06
白化和紫化茶種質(zhì)資源開發(fā)進(jìn)展
泛素結(jié)合結(jié)構(gòu)域與泛素化信號(hào)的識(shí)別
茶樹葉綠體DNA的PCR-RFLP反應(yīng)體系優(yōu)化
乌鲁木齐市| 永顺县| 扶余县| 台安县| 贵阳市| 南澳县| 梅河口市| 达日县| 靖安县| 古交市| 涟源市| 张家川| 永康市| 华宁县| 宝鸡市| 天气| 佛学| 甘肃省| 防城港市| 同仁县| 枝江市| 浦东新区| 凉城县| 金塔县| 石首市| 阜平县| 安康市| 扬州市| 囊谦县| 抚远县| 郴州市| 堆龙德庆县| 大渡口区| 靖江市| 仁化县| 平谷区| 柳林县| 绥化市| 康保县| 涿鹿县| 西乡县|