王 宇,楊文麗,李嘉鈺,向雪靜,李月萍,蔡佳麗
(1.攀枝花學(xué)院附屬醫(yī)院,四川 攀枝花617000;2.攀枝花學(xué)院醫(yī)學(xué)院,四川攀枝花617000)
白芨是多年生草本植物,屬于蘭科白芨屬。主要分布在云南、四川、貴州、湖南、湖北、江西等省,多生長在海拔高度為950-3500 m的闊葉林下。白芨及其塊莖是我國藥典記錄的傳統(tǒng)中藥材之一,最早在《神農(nóng)本草經(jīng)》中就有記載,其塊莖中含有較豐富的芐類、萜類和多糖類化學(xué)成分,具有止血潤肺、消腫生肌、抗氧化、清除自由基、預(yù)防心血管疾病、抗菌和抗腫瘤等功效,在醫(yī)藥食品等領(lǐng)域已廣泛應(yīng)用[1-4]。
目前,通過構(gòu)建cDNA文庫和高通量轉(zhuǎn)錄組測序,已對多種藥用植物進(jìn)行分子生物學(xué)研究,挖掘出了一些重要功能基因,對于揭示不同生物學(xué)性狀的分子機制具有重要意義[5]。
本研究采用高通量測序技術(shù)對白芨塊莖進(jìn)行轉(zhuǎn)錄組分析,得到白芨的重要功能基因,對其進(jìn)行功能注釋、分類和代謝通路分析,這為下一步研究白芨的藥用成分、次生代謝等機制奠定基礎(chǔ)。
1.1.1實驗材料
植株由攀枝花市豐盛源農(nóng)林開發(fā)有限公司提供。
1.1.2主要儀器與試劑
凝膠成像系統(tǒng)和電泳儀購于美國伯樂公司、超微量核酸分析儀購于杭州奧盛儀器有限公司、RNA提取試劑盒購于天根生化科技有限公司。
1.2.1RNA提取
按照RNA提取試劑盒說明提取總RNA,使用凝膠電泳和超微量核酸分析儀對其質(zhì)量和濃度進(jìn)行分析。
1.2.2cDNA文庫的構(gòu)建
首先用磁珠富集poly(A)mRNA,然后以mRNA為模板,經(jīng)逆轉(zhuǎn)錄反應(yīng)合成第一鏈cDNA和第二鏈cDNA,對雙鏈cDNA進(jìn)行純化后再進(jìn)行末端修復(fù)、加尾和加接頭,片段分選以及PCR擴增,最后構(gòu)建成cDNA文庫,對文庫質(zhì)檢后進(jìn)行測序。
1.2.3生物信息學(xué)分析
對測序得到的原始數(shù)據(jù)用生物信息學(xué)軟件進(jìn)行處理,得到有效數(shù)據(jù)(Unigene序列),再將獲得的Unigene序列與SwissProt、Nr、GO、KEGG和COG數(shù)據(jù)庫進(jìn)行比對,獲得功能注釋,推測基因的功能與作用。
測序得到5624755條序列,經(jīng)過組裝得到130721條Unigene,N50長度為1490 bp,最短序列長度為201 bp,最長序列長15579 bp,平均長度為802 bp。在130721條Unigene中,76239條在200-500bp之間,占58.32%;21645條在500-1000 bp之間,占16.56%;11919條在1000-1500bp之間,占9.12%;8234條在1500-2000 bp之間,占6.30%;12683條大于2000bp,占9.70%(圖1)。
圖1 Unigene不同長度區(qū)間分布
圖2 Unigene在各數(shù)據(jù)庫注釋分布
將130721條Unigene序列通過NR、COG、Swissprot、KEGG等數(shù)據(jù)庫進(jìn)行比對,60827條Unigene獲得注釋。60033條Unigene在NR數(shù)據(jù)庫中獲得注釋,占45.92%,30267條Unigene在COG數(shù)據(jù)庫中獲得注釋,占23.15%;39368條在Swissprot數(shù)據(jù)庫中獲得注釋,占30.12%;8252條在KEGG數(shù)據(jù)庫中獲得注釋,占6.31%,見圖2。
25820條Unigene得到GO功能注釋,共分為54個小類,其中生物進(jìn)程、有19個小類,主要有:信號轉(zhuǎn)導(dǎo)、細(xì)胞調(diào)控、細(xì)胞自噬、生物調(diào)控、刺激反應(yīng)、繁殖進(jìn)程等;分子功能有22個小類,主要有:結(jié)構(gòu)分子活性、運輸活性、催化活性、營養(yǎng)儲存活性、抗氧化活性、與蛋白質(zhì)結(jié)合的轉(zhuǎn)錄因子活性、分子功能調(diào)控等;細(xì)胞組分有13個小類,主要有:細(xì)胞膜、突觸部分、細(xì)胞外基質(zhì)、大分子復(fù)合體等。
COG數(shù)據(jù)庫是由NCBI創(chuàng)建并維護(hù)的蛋白數(shù)據(jù)庫,通過比較大量生物的蛋白質(zhì)序列對基因產(chǎn)物進(jìn)行同源分類。將Unigene通過COG數(shù)據(jù)庫后進(jìn)行分類,可以分為RNA加工和修飾、細(xì)胞周期控制、防御機制等不同功能,詳見圖3。
圖3 Unigene的COG功能分類
30267條Unigene得到GO功能注釋,可分為26類;其中參與“一般功能預(yù)測”(General function prediction only)的轉(zhuǎn)錄物最多,有4286個,占 14.16%;第二為參與“信號傳導(dǎo)機制”(Siganl transduction mechanisms)的轉(zhuǎn)錄物,有3733個,比例為12.33%。此外,還包括核酸運輸代謝、RNA組裝修飾、糖類運輸代謝、輔酶運輸代謝、脂類運輸代謝、能量生產(chǎn)轉(zhuǎn)化等多數(shù)生理生化過程。
KEGG代謝途徑分析表明,1916條Unigene參與了葡萄糖、果糖、半乳糖等多種糖類代謝,1320條Unigene參與了多種氨基酸代謝;185條Unigene參與了萜類和酮類化合物的代謝,此外,參與脂類、核酸、能量等代謝類型的Unigene有9194條;1147條Unigene參與了各種細(xì)胞和組織系統(tǒng)(如運輸與分解代謝)進(jìn)程,4259條Unigene參與了遺傳物質(zhì)(如折疊、分類和降解)和環(huán)境信息(如信號轉(zhuǎn)導(dǎo))的處理和加工過程。
白芨膠質(zhì)的主要成分為白芨多糖,以葡萄糖和甘露聚糖為主,找到相關(guān)合成的酶基因,有利于闡明白芨膠質(zhì)多糖的生物合成與分解途徑。本研究發(fā)現(xiàn)了有關(guān)白芨多糖合成的多個酶基因,如β-葡萄糖苷酶、β-葡糖醛酸基轉(zhuǎn)移酶、α-甘露糖苷酶、磷酸異構(gòu)酶、6-磷酸果糖激酶等,這些酶基因都參與了糖代謝途徑。
微衛(wèi)星DNA序列就是簡單重復(fù)序列,廣泛分布于真核生物的基因中,可以作為優(yōu)良的遺傳標(biāo)記。在白芨中發(fā)現(xiàn)39585個星位點,以單核苷酸、雙核苷酸和三核苷酸三種類型為主,單核苷酸的基序為A/T/C,二核苷酸基序為AT/AG/CT,三核苷酸的基序為TTC/ATC/CGG。
白芨塊莖含有豐富的多糖,具有誘導(dǎo)免疫調(diào)節(jié)因子表達(dá)、增強天然殺傷性細(xì)胞活性等免疫功能,因此可以開發(fā)為抗腫瘤藥物或者化妝品添加物[6]。此外,白芨塊莖中含有萜類、甾類以及聯(lián)芐類物質(zhì),研究表明白芨萜類及其衍生物具有抗血管生成,誘導(dǎo)血管內(nèi)皮細(xì)胞凋亡的作用。目前,將白芨的化學(xué)成分和藥理研究結(jié)合起來,對研制新藥具有廣闊的應(yīng)用前景[7]。
本研究通過對白芨的轉(zhuǎn)錄組進(jìn)行分析,找到了大量參與白芨多糖和萜類合成與代謝相關(guān)的基因,這為研究白芨的藥用成分、次生代謝具有重要意義。同時,通過對微衛(wèi)星DNA序列分析可為白芨的遺傳多樣性和分子標(biāo)記輔助育種奠定基礎(chǔ)。