国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

中泰南五味子轉(zhuǎn)錄組測(cè)序及生物信息學(xué)分析

2022-10-13 08:47:00李靜宇徐友陽(yáng)蔡時(shí)可王繼華
關(guān)鍵詞:堿基五味子測(cè)序

李靜宇,徐友陽(yáng),蔡時(shí)可,王繼華

(1.廣東省農(nóng)作物遺傳改良重點(diǎn)實(shí)驗(yàn)室,廣東省農(nóng)業(yè)科學(xué)院作物研究所,廣東 廣州 510640;2.廣東省道地南藥資源保護(hù)與利用工程中心,廣東 廣州 510640;3.廣東清遠(yuǎn)和記黃埔有限公司,廣東 清遠(yuǎn) 526070)

中泰南五味子(Kadsura ananosmaKerr)為五味子科南五味子屬攀緣植物,屬于離蕊南五味子亞屬。南五味子,味酸甘、性溫,歸肺、心、腎經(jīng),具有收斂固澀、益氣生津、補(bǔ)腎寧心的功效,用于治療久嗽虛喘、夢(mèng)遺滑精、遺尿尿頻、久瀉不止、自汗、盜汗、津傷口渴、短氣脈虛、內(nèi)熱消渴、心悸失眠[1-3]。最早記載于《神農(nóng)本草經(jīng)》,被列為上品[4]。

對(duì)中泰南五味子化學(xué)成分的研究發(fā)現(xiàn),其含有較多的木脂素類(lèi)和三萜類(lèi)成分。木脂素類(lèi)成分主要為聯(lián)苯環(huán)辛烯類(lèi)木脂素類(lèi)化合物anano lignin A-N,而聯(lián)苯環(huán)辛烯類(lèi)木脂素是南五味子屬和五味子屬的特征性成分[5-6]。研究也發(fā)現(xiàn)不同種、藥用部分和產(chǎn)區(qū)的南五味子中木脂素含量和種類(lèi)差異較大[7-9]。三萜類(lèi)成分主要為羊毛甾脂烷型三萜類(lèi)化合 物kadnanosic acid A-B、ananosic acid B-C、kadnanolactone A-I和R、schisanlactone F、micrandilactone B-C和wuweizidilactone H[8-9]?,F(xiàn) 代藥理學(xué)研究發(fā)現(xiàn),南五味子除了具有抗炎、保肝作用外,還有一定的抗氧化、抗腫瘤和抗HIV活性作用[8,10-11]。但是,有關(guān)中泰南五味子木脂素類(lèi)和三萜類(lèi)等藥用成分生物合成分子機(jī)制的研究較為少見(jiàn)。

轉(zhuǎn)錄組學(xué)是植物功能基因組學(xué)研究的重要基礎(chǔ),能夠在整體水平上研究基因轉(zhuǎn)錄表達(dá)變化趨勢(shì)及調(diào)控規(guī)律,挖掘關(guān)鍵基因,解析藥用活性成分合成代謝通路[12]。中泰南五味子基因組學(xué)研究相對(duì)薄弱,其轉(zhuǎn)錄組學(xué)的研究尚未見(jiàn)報(bào)道。因此,本研究開(kāi)展中泰南五味子的轉(zhuǎn)錄組測(cè)序及生物信息學(xué)分析,以期為解析中泰南五味子藥用物質(zhì)合成關(guān)鍵基因的挖掘和調(diào)控以及開(kāi)發(fā)分子標(biāo)記提供遺傳學(xué)基礎(chǔ),現(xiàn)將研究結(jié)果報(bào)道如下。

1 材料與方法

1.1 實(shí)驗(yàn)材料中泰南五味子轉(zhuǎn)錄組測(cè)序材料在廣東省農(nóng)業(yè)科學(xué)院作物研究所南藥資源圃采集,取樣時(shí)間為2021年5月,采集健壯植株的葉片和嫩莖,用錫箔紙包裹并迅速浸入液氮處理20 min,置于超-80℃冰箱保存?zhèn)溆谩?/p>

1.2 中泰南五味子RNA的提取中泰南五味子總RNA采用康為世紀(jì)的Total RNA Extractor試劑盒進(jìn)行提取,然后通過(guò)1%凝膠電泳檢測(cè)所提取RNA的完整性。采用Invitrogen Qubit?2.0熒光計(jì)及試劑盒(Fluorometer Life Tech Invitrogen,Q32886)對(duì) 總RNA進(jìn)行定量。

1.3 轉(zhuǎn)錄組測(cè)序與拼接組裝委托北京百邁客生物科技有限公司采用Illumina HiSeq 2500高通量測(cè)序平臺(tái)進(jìn)行轉(zhuǎn)錄組測(cè)序。測(cè)序得到的原始數(shù)據(jù),通過(guò)FastQC軟件進(jìn)行質(zhì)量評(píng)估和Trimmomatic質(zhì)量剪切,過(guò)濾掉接頭、低質(zhì)量的序列(reads長(zhǎng)度小于35 nt的reads)、帶N堿基的序列、低質(zhì)堿基(Q值<20),得到高質(zhì)量的clean data[13]。使用Trinity軟件對(duì)clean data進(jìn)行de novo拼接組裝,再采用RSeQC(RNA-seq data QC)軟件去除轉(zhuǎn)錄本中的冗余序列,得到Unigene[14]。

1.4 基因功能注釋將組裝長(zhǎng)度在200 bp以上的中泰南五味子Unigene在保守域數(shù)據(jù)庫(kù)(Conserved Domain Database,CDD)、真 核 同 源 數(shù) 據(jù) 庫(kù)(Eukaryotic Orthologous Groups,KOG)、非冗余數(shù)據(jù)庫(kù)(Non-redundant Database,NR)、核酸序列數(shù)據(jù)庫(kù)(Nucleotide Sequence Database,Nt)、蛋白結(jié)構(gòu)域預(yù)測(cè)數(shù)據(jù)庫(kù)(Protein Families Database of Alignments and Hidden Markov Models,PFAM)、Swissprot和TrEMBL等多個(gè)數(shù)據(jù)庫(kù)中進(jìn)行功能注釋。根據(jù)轉(zhuǎn)錄本與數(shù)據(jù)庫(kù)比對(duì)結(jié)果和Transdecoder進(jìn)行編碼序列預(yù)測(cè)。根據(jù)Unigene與SwissProt、TrEMBL的注釋結(jié)果,分析得到基因本體論(Gene Ontology,GO)功能注釋信息,利用京都基因與基因組百科全書(shū)(Kyoto Encyclopedia of Genes and Genomes Database,KEGG)自 動(dòng) 注 釋 服 務(wù) 器(KEGG Automatic Annotation Server,KAAS)得到KEGG注釋信息。

1.5 基因結(jié)構(gòu)分析對(duì)長(zhǎng)度在1 000 bp以上的中泰南五味子Unigene使用微衛(wèi)星識(shí)別工具(Microisatellite Identification Tool,MISA)軟件鑒定簡(jiǎn)單序列重復(fù)(SSR)位點(diǎn),并利用Primer 3.0軟件(http://primer3.sourceforge.net/releases.php)設(shè)計(jì)相應(yīng)SSR引物[15]。

2 結(jié)果與分析

2.1 轉(zhuǎn)錄組測(cè)序與de novo組裝中泰南五味子cDNA文庫(kù)的構(gòu)建由北京百邁客生物科技有限公司完成,并利用Illumina HiSeq 2500測(cè)序平臺(tái)測(cè)序。使用Trimmomatic對(duì)原始測(cè)序數(shù)據(jù)進(jìn)行處理,去掉含有帶接頭、低質(zhì)量的序列,共得到21 545 302 clean reads,總堿基數(shù)目為6 430 141 426 bp,GC含量為47.16%,Q30 bases ratio達(dá)到94.61%,表明文庫(kù)構(gòu)建質(zhì)量良好,測(cè)序得到的數(shù)據(jù)準(zhǔn)確可靠。使用Trinity將clean reads進(jìn)行de novo組裝成轉(zhuǎn)錄本,共得到68 573條轉(zhuǎn)錄本,總長(zhǎng)86 867 930 bp,平均長(zhǎng)度為1 267 bp,N50為1 769 bp,序列長(zhǎng)度大于等于500 bp的有51 596條,占總序列數(shù)目的75.24%,序列長(zhǎng)度在1 000 bp以上的有33 601條,占總數(shù)的49.00%。見(jiàn)表1。對(duì)Trinity拼裝得到的轉(zhuǎn)錄本去冗余,共獲得29 915條Unigene,總長(zhǎng)30 888 944 bp,平均長(zhǎng)度為1 033 bp,N50為1 554 bp,其中18 629條序列長(zhǎng)度大于等于500 bp,占總序列數(shù)目的62.27%,序列長(zhǎng)度在1 000 bp以上的有10 747條,占總數(shù)的35.93%。見(jiàn)表1、圖1。

表1 中泰南五味子轉(zhuǎn)錄組測(cè)序結(jié)果Table 1 Transcriptome sequencing results of Kadsura ananosma Kerr

圖1 中泰南五味子Unigene序列長(zhǎng)度分布Figure 1 Length distribution of the unigene sequences of Kadsura ananosma Kerr

2.2 Unigene功能注釋見(jiàn)表2。中泰南五味子組裝后的Unigene序列與CDD、KOG、COG、NR、Nt、PFAM、SwissProt、TrEMBL等多個(gè)數(shù)據(jù)庫(kù)比對(duì),共有22 359條Unigene在至少1個(gè)數(shù)據(jù)庫(kù)中獲得功能注釋。其中,NR數(shù)據(jù)庫(kù)中注釋到的Unigene數(shù)目最多(21 231條),占總Unigene的95.0%,其次為T(mén)rEMBL數(shù)據(jù)庫(kù),注釋到的Unigene為21 099條,占94.4%。COG數(shù)據(jù)庫(kù)中注釋到的Unigene數(shù)目最少(5 863條,26.2%)。通過(guò)與NR庫(kù)的比對(duì),獲得中泰南五味子Unigene序列與近緣種屬的近似情況并獲得同源序列的功能信息,共有21 231條Unigene獲得注釋。匹配較多的物種主要有Nelumbo nucifera,Cinnamomum micranthum,Macleaya cordata,Amborella trichopoda和Nymphaea colorata,分 別占16.88%,15.65%,9.07%,8.78%和3.40%??梢?jiàn)中泰南五味子與荷花(Nelumbo nucifera)的序列相似度最高。見(jiàn)圖2。

圖2 非冗余數(shù)據(jù)庫(kù)(NR)數(shù)據(jù)庫(kù)的同源物種分類(lèi)Figure 2 Classification of homologous species in the NR database

表2 中泰南五味子Unigene的功能注釋Table 2 Functional annotation of unigenes of Kadsura ananosma kerr

2.3 KEGG功能注釋根據(jù)KEGG數(shù)據(jù)庫(kù)注釋結(jié)果,共有14 284條Unigene涉及五大類(lèi)功能,包括代謝、遺傳信息過(guò)程、細(xì)胞過(guò)程、環(huán)境信息過(guò)程和有機(jī)系統(tǒng)。Unigene共涉及137條代謝通路。見(jiàn)圖3。在有機(jī)系統(tǒng)中,涉及植物-病原相互關(guān)系通路的Unigene最多有497條,其次為植物晝夜節(jié)律通路共涉及90條Unigene;在代謝中,涉及碳代謝、淀粉和蔗糖代謝和氨基酸生物合成的Unigene最多,分別包含368、309和287個(gè)基因;在遺傳信息過(guò)程中,注釋到Unigene最多的3個(gè)代謝過(guò)程為核糖體、內(nèi)質(zhì)網(wǎng)中的蛋白質(zhì)加工和剪接體,分別包含343、298和277個(gè)基因;在環(huán)境信息響應(yīng)過(guò)程中,涉及到植物激素信號(hào)轉(zhuǎn)導(dǎo)、MAPK信號(hào)通路和ABC轉(zhuǎn)運(yùn)通路的基因最多,分別包含425、325和120條Unigene;在細(xì)胞過(guò)程中,內(nèi)吞作用、吞噬體和過(guò)氧化物酶體通路中包含基因數(shù)目最多,分別包含249、117和114個(gè)基因。南五味子中包含三萜、木脂素、揮發(fā)油和多糖等多種功能活性成分。本研究鑒定到181條Unigene涉及苯丙烷類(lèi)生物合成,38條Unigene涉及倍半萜類(lèi)和三萜類(lèi)生物合成,24條Unigene涉及二萜類(lèi)生物合成,17條Unigene涉及單萜類(lèi)生物合成,75條Unigene涉及萜類(lèi)骨架生物合成,59條Unigene涉及泛醌和其他萜-醌生物合成通路。這些與功能性物質(zhì)合成相關(guān)Unigene的鑒定,為進(jìn)一步解析中泰南五味子藥用成分的生物合成提供了可能。

圖3 中泰南五味子Unigene的京都基因與基因組百科全書(shū)(KEGG)功能分類(lèi)Figure 3 Functional classification of KEGG from the Kadsura ananosma Kerr unigenes

2.4 GO功能注釋GO數(shù)據(jù)庫(kù)是全面描述生物體中基因及其產(chǎn)物屬性的分類(lèi)系統(tǒng),主要分為生物過(guò) 程(Biological process)、細(xì) 胞 組 分(Cellular component)及分子功能(Molecular funtion)三大類(lèi)。根據(jù)GO數(shù)據(jù)庫(kù)注釋結(jié)果,共有18 084條中泰南五味子Unigene注釋成功,其中,生物過(guò)程中包含100 068條Unigene,細(xì)胞組分中包含46 406條Unigene,分子功能中包含39 806條Unigene。見(jiàn)圖4。這些Unigene總共被劃分為43個(gè)功能分類(lèi),其中:分子功能中的ATP結(jié)合注釋到的Unigene最多,共有2 259條;細(xì)胞組分中的膜的組成成分和細(xì)胞組分GO條目中注釋到的Unigene較多,分別為4 261和2 237條;生物過(guò)程大類(lèi)中的生物過(guò)程GO條目最多,包含2 262條Unigene。這些通路與中泰南五味子的生長(zhǎng)發(fā)育和藥用成分的合成密切相關(guān)。

圖4 中泰南五味子Unigene的基因本體論(GO)功能分類(lèi)Figure 4 GO functional classification of Kadsura ananosma Kerr unigenes

2.5 編碼序列(CDS)分析對(duì)中泰南五味子轉(zhuǎn)錄組所有Unigene的CDS序列進(jìn)行預(yù)測(cè),通過(guò)Blast比對(duì)共獲得CDS序列9 843個(gè),其中長(zhǎng)度大于200 bp的占66.26%。見(jiàn)圖5。

圖5 中泰南五味子Unigene的編碼序列(CDS)長(zhǎng)度分布Figure 5 CDS length distribution of assembled unigenes of Kadsura ananosma Kerr

2.6 SSR分析采用MISA對(duì)組裝長(zhǎng)度為1 000 bp以上的10 747條Unigene進(jìn)行SSR檢測(cè),并對(duì)SSR的類(lèi)型和密度進(jìn)行統(tǒng)計(jì)。結(jié)果表明,在3 560條Unigene中共鑒定到6 363個(gè)SSR位點(diǎn)。其中,2 127條Unigene中檢測(cè)到2個(gè)及以上的SSR位點(diǎn),632條Unigene中檢測(cè)到3個(gè)復(fù)雜重復(fù)類(lèi)型的SSR位點(diǎn)。最豐富的重復(fù)類(lèi)型是雙堿基重復(fù),共檢測(cè)到1 495個(gè)位點(diǎn),其次為單堿基重復(fù)1 433個(gè)、三堿基重復(fù)605個(gè)、四堿基重復(fù)16個(gè)、六堿基重復(fù)5個(gè)和五堿基重復(fù)6個(gè)位點(diǎn),見(jiàn)圖6。

圖6 中泰南五味子Unigene的簡(jiǎn)單序列重復(fù)(SSR)位點(diǎn)密度分布Figure 6 Density distribution of SSR loci of Kadsura ananosma Kerr unigenes

3 討論

轉(zhuǎn)錄組分析可以為系統(tǒng)解析藥用植物代謝途徑提供支撐。植物體內(nèi)存在復(fù)雜的基因調(diào)控網(wǎng)絡(luò),植物細(xì)胞中幾乎所有活動(dòng)都被基因網(wǎng)絡(luò)所控制[16]。依托大數(shù)據(jù)分析能力的進(jìn)步,通過(guò)對(duì)高通量測(cè)序數(shù)據(jù)構(gòu)建的基因及代謝網(wǎng)絡(luò)數(shù)據(jù)庫(kù)預(yù)測(cè)并挖掘新的生物合成網(wǎng)絡(luò)及途徑基因和分子標(biāo)記開(kāi)發(fā)上的應(yīng)用越來(lái)越廣泛[12]。本研究基于Illumina HiSeq 2500高通量測(cè)序平臺(tái)對(duì)中泰南五味子葉片進(jìn)行轉(zhuǎn)錄組測(cè)序,共獲得6.43 Gb Clean Data,經(jīng)過(guò)mRNA片段化隨機(jī)性檢驗(yàn)、插入片段長(zhǎng)度檢驗(yàn)、轉(zhuǎn)錄組測(cè)序數(shù)據(jù)飽和度檢驗(yàn)等轉(zhuǎn)錄組測(cè)序文庫(kù)質(zhì)量評(píng)估,其中Q30 bases ratio達(dá)到94.61%,GC含量為47.16%,結(jié)果表明,中泰南五味子轉(zhuǎn)錄組測(cè)序數(shù)據(jù)質(zhì)量較好,可信度高。通過(guò)de novo組裝,共獲得68 573條轉(zhuǎn)錄本,其中序列長(zhǎng)度大于等于500 bp的有51 596條,共獲得29 915條Unigene,平均長(zhǎng)度為1 033 bp,N50為1 554 bp,表明中泰南五味子轉(zhuǎn)錄組序列組裝質(zhì)量較高。對(duì)Unigene進(jìn)行功能注釋發(fā)現(xiàn)22 359條Unigene至少在一個(gè)公共數(shù)據(jù)庫(kù)中獲得注釋。其與荷花(Nelumbo nucifera)和沉水樟(Cinnamomum micranthum)親緣關(guān)系最為接近。通過(guò)KEGG功能注釋?zhuān)茶b定到181條Unigene涉及苯丙烷類(lèi)生物合成,38條Unigene涉及倍半萜類(lèi)和三萜類(lèi)生物合成,24條Unigene涉及二萜類(lèi)生物合成,17條Unigene涉及單萜類(lèi)生物合成,75條Unigene涉及萜類(lèi)骨架生物合成,59條Unigene涉及泛醌和其他萜-醌生物合成通路。本研究結(jié)果為解析中泰南五味子中藥用活性成分木脂素、三萜等的合成通路提供了基礎(chǔ)[17-18]。

SSR分子標(biāo)記引物的開(kāi)發(fā)是進(jìn)行SSR分子標(biāo)記研究的前提條件。利用轉(zhuǎn)錄組結(jié)果鑒定EST-SSR比非編碼序列更加容易,提高了遺傳多樣性和分子標(biāo)記輔助育種研究的準(zhǔn)確性。隨著技術(shù)的發(fā)展,開(kāi)展中藥材的分子鑒定研究和應(yīng)用十分必要[19]。目前,SSR標(biāo)記已廣泛應(yīng)用于甘草、鐵皮石斛、枸杞等中藥材的遺傳圖譜構(gòu)建[20-21]。本研究共檢測(cè)到6 363個(gè)SSR位點(diǎn),其中雙堿基重復(fù)最多,共檢測(cè)到1 495個(gè)位點(diǎn),與既往研究的中藥溪黃草、肇實(shí)和黃金艾蒿類(lèi)似[22-24]。本研究結(jié)果為中泰南五味子SSR分子標(biāo)記的開(kāi)發(fā)和解析中泰南五味子藥用活性成分合成通路及分子生物學(xué)研究提供了基礎(chǔ)的遺傳信息,也有利于其保護(hù)和利用。

猜你喜歡
堿基五味子測(cè)序
杰 Sir 帶你認(rèn)識(shí)宏基因二代測(cè)序(mNGS)
新民周刊(2022年27期)2022-08-01 07:04:49
二代測(cè)序協(xié)助診斷AIDS合并馬爾尼菲籃狀菌腦膜炎1例
傳染病信息(2021年6期)2021-02-12 01:52:58
應(yīng)用思維進(jìn)階構(gòu)建模型 例談培養(yǎng)學(xué)生創(chuàng)造性思維
中國(guó)科學(xué)家創(chuàng)建出新型糖基化酶堿基編輯器
生命“字母表”迎來(lái)4名新成員
生命“字母表”迎來(lái)4名新成員
HPLC-DAD法快速篩查五味子顆粒(糖漿)中南五味子代替五味子
中成藥(2018年12期)2018-12-29 12:26:02
五味子醇甲提取純化方法的研究進(jìn)展
中成藥(2017年3期)2017-05-17 06:09:06
北五味子化學(xué)成分的研究
中成藥(2017年3期)2017-05-17 06:09:01
HPLC法同時(shí)測(cè)定五酯膠囊中五味子醇甲、五味子酯甲、五味子甲素和五味子乙素的含量
黔西| 鄂托克前旗| 韶关市| 旬阳县| 定安县| 华亭县| 河池市| 浙江省| 扶风县| 巩留县| 阳江市| 方正县| 清镇市| 绩溪县| 湖北省| 五家渠市| 苍梧县| 江达县| 海城市| 漳州市| 泸溪县| 波密县| 叶城县| 视频| 道真| 洱源县| 江口县| 光山县| 永兴县| 莱芜市| 铜山县| 咸阳市| 万安县| 静乐县| 盐边县| 海林市| 斗六市| 肇庆市| 资兴市| 江口县| 鹤峰县|