陸 昊,劉 敏,李衛(wèi)東,王沛政
(1.海南熱帶海洋學(xué)院 生態(tài)環(huán)境學(xué)院,海南 三亞 572022;2.海南大學(xué) 海洋學(xué)院,???570228)
軟珊瑚(Alcyonacea)屬于珊瑚蟲綱的軟珊瑚目,是珊瑚礁生態(tài)系統(tǒng)中重要組成部分[1].軟珊瑚科下有肉芝軟珊瑚屬(SarcophytonLesson,1834)、豆莢軟珊瑚屬(Lobophytumvon Marenzeller,1886)和手指軟珊瑚屬(SinulariaMay,1898)等 18 個屬,其中,肉芝軟珊瑚屬和豆莢軟珊瑚屬是軟珊瑚科中比較大的屬,在海南周邊海域廣泛分布.海南島附近海域蘊(yùn)藏著豐富的軟珊瑚資源,其天然代謝產(chǎn)物具有非常好的生理活性,已成為人們研究的熱點(diǎn)[2].近年來,由于環(huán)境因素的惡化,導(dǎo)致世界范圍內(nèi)珊瑚礁大面積白化和死亡[3].而珊瑚分子層面相關(guān)的研究起步較晚,李淑等[4]從細(xì)胞機(jī)制和光抑制機(jī)制2個方面綜述了珊瑚白化的機(jī)制,但至今仍未有標(biāo)準(zhǔn)的解釋.
隨著高通量技術(shù)的發(fā)展,轉(zhuǎn)錄組(transcriptome)測序成為了解物種在特定條件下細(xì)胞或組織內(nèi)的基因表達(dá)情況和生物學(xué)代謝途徑調(diào)節(jié)更為有效的辦法.2009年Meyer等[5]首次將高通量測序方法應(yīng)用至珊瑚的研究,獲得了大量的基因及相關(guān)注釋.隨后有越來越多的造礁石珊瑚轉(zhuǎn)錄組研究被報(bào)道,如Bellantuono等[6]報(bào)道了在高溫脅迫下,鹿角珊瑚(Acroporamillepora)的70個基因出現(xiàn)表達(dá)異常并對其進(jìn)行了注釋.Moya等[7]利用改變CO2濃度研究海洋酸化對Acroporamillepora基因表達(dá)的影響,結(jié)果發(fā)現(xiàn),大多數(shù)離子轉(zhuǎn)運(yùn)蛋白的表達(dá)不受酸化影響,但海洋酸化對一些鈣化通路中蛋白有影響.劉金豆[8]的研究結(jié)果表明,在溫度脅迫下,稀杯盔形珊瑚的一些基因表達(dá)出現(xiàn)差異,這為從基因?qū)用娼忉屔汉靼谆F(xiàn)象提供了一種新的技術(shù)手段.
近年來,關(guān)于珊瑚白化研究逐漸成為熱點(diǎn),大部分相關(guān)研究都集中在造礁石珊瑚.軟珊瑚研究目前僅僅局限于活性物質(zhì)的提取及共生微生物的分類等,軟珊瑚基因組等相關(guān)研究較少.本研究選取海南省三亞市周邊海域常見的軟珊瑚種花環(huán)肉質(zhì)軟珊瑚(Sarcophytonehrenbergi)和短指軟珊瑚(Sinulariaceramensis)作為研究對象.利用高通量測序技術(shù)對2種軟珊瑚的轉(zhuǎn)錄組測序分析,比較2種軟珊瑚的轉(zhuǎn)錄組特征和差異.旨在豐富我國南海軟珊瑚的轉(zhuǎn)錄組信息,為珊瑚礁保護(hù)、軟珊瑚白化、活性物質(zhì)等研究提供理論依據(jù).
花環(huán)肉芝軟珊瑚(Sarcophytonehrenbergi)和短指軟珊瑚(SinulariaceramensisVerseveldt)均采自三亞市西瑁島( 18°15′N,109°22′E)的珊瑚礁區(qū).于海南熱帶海洋學(xué)院珊瑚館暫養(yǎng)1周,珊瑚缸水體量60 L,溫度26 ℃,鹽度35,pH 8.2,光暗比12 h︰12 h.待2種珊瑚所有個體觸手伸展正常、恢復(fù)活力后,再進(jìn)行后續(xù)實(shí)驗(yàn).
從2株珊瑚的冠部及莖部分別剪取2塊質(zhì)量約0.5 g的珊瑚組織,分別命名為P-1(花環(huán)肉芝軟珊瑚冠部)、P-2(花環(huán)肉芝軟珊瑚莖部)、S-1(短指珊瑚冠部)、S-2(短指珊瑚莖部),用RNAiso Plus試劑從每個樣品中提取總RNA,經(jīng)NanoDrop 2000c檢測總RNA濃度和質(zhì)量符合轉(zhuǎn)錄組建庫標(biāo)準(zhǔn)后送往華大公司測序.
用帶有OligodT的磁珠富集帶有polyA尾巴的mRNA,并在得到的mRNA中加入適量打斷試劑并在高溫條件下使其片段化,以打斷后的mRNA為模板合成一鏈cDNA,然后緩沖液、dNTPs、RNase H 和 DNA polymerase I合成二鏈cDNA[9]2,并使用試劑盒純化回收、黏性末端修復(fù)、 cDNA 的3′末端加上堿基“A”并連接接頭,然后進(jìn)行片段大小選擇,最后進(jìn)行 PCR 擴(kuò)增;構(gòu)建好的文庫用Agilent 2100 Bioanalyzer質(zhì)檢,合格后使用Illumina HiSeqTM2000進(jìn)行測序.
先過濾掉低質(zhì)量、接頭污染以及未知堿基N含量過高的reads得到clean reads,然后使用Trinity軟件對clean reads進(jìn)行組裝得到Unigene,接著對得到的Unigene進(jìn)行功能注釋、SSR檢測.最后,根據(jù)每個樣品在All-Unigene的基礎(chǔ)上計(jì)算表達(dá)量差異,完成聚類分析和功能富集分析.
花環(huán)肉芝軟珊瑚和短指軟珊瑚不同部位的4個樣本測序后組裝共獲得130 587條Unigene(表1).Unigene是經(jīng)過去冗余之后得到的基因序列,這條序列和其他的序列是非冗余的,也就是理論上其他序列都和此序列代表的不是同1個基因.花環(huán)肉芝軟珊瑚冠部與莖部Unigene數(shù)目都超過80 000條,差異不大.短指珊瑚冠部Unigene數(shù)目遠(yuǎn)大于莖部,差異較為明顯.2種不同珊瑚Unigene平均長度差異明顯,花環(huán)肉芝軟珊瑚的Unigene平均長度要略高于短指珊瑚.花環(huán)肉芝軟珊瑚的N50(將所有 Unigene 從長到短排序,并依次累加長度.當(dāng)累加片段長度達(dá)到總片段長度的50%時,對應(yīng)片段的長度和數(shù)量,即為 Unigene N50 長度和數(shù)量)與GC含量都略大于短指珊瑚.從圖1可以看出,Unigene的長度都≧200 nt.長度在200~299 nt的Unigene數(shù)目為25 420條,長度為300~399 nt的Unigene數(shù)目為13700條,而長度在2 900~2 999 nt的Unigene數(shù)目僅為643條.
表1 組裝Unigene質(zhì)量指標(biāo)
圖1 Unigene長度分布
花環(huán)肉芝軟珊瑚和短指軟珊瑚測序數(shù)據(jù)通過Blast比對SwissProt和Hmmscan,搜索Pfam蛋白同源序列,共得到86 002條CDS(編碼序列,coding sequences)序列,占總Unigene的65.86%.不同長度CDS分布如圖2所示,從圖2可知,預(yù)測得到的CDS在300~399 nt之間所占比例最大,在200~299 nt之間所占比例最小.CDS大部分產(chǎn)物長度為200~1 000 bp范圍,表明測序都是正確的.
圖2 CDS長度分布
根據(jù)NR(Non-redundant,非冗余生物信息數(shù)據(jù)庫)注釋結(jié)果,統(tǒng)計(jì)花環(huán)肉芝軟珊瑚和短指軟珊瑚測序數(shù)據(jù)注釋上不同物種比例(圖3).從圖3中可知,注釋比例最高的為山地星珊瑚(Orbicellafaveolata),占所有注釋結(jié)果的46.15%.注釋結(jié)果比例前三占比分別為46.15%,17.83%(一種淡??鸒rbiceliafaveolata)和14.36%(形鹿角珊瑚Acroporadigitifera).另有6.48%的結(jié)果注釋為另一種???Nematostellavectensis). 結(jié)果顯示,相關(guān)軟珊瑚的基因信息幾乎沒有,說明花環(huán)肉芝軟珊瑚和短指軟珊瑚的相關(guān)研究極少.
圖3 NR數(shù)據(jù)庫注釋物種分布
將所有花環(huán)肉芝軟珊瑚和短指軟珊瑚Unigene與NR、KOG(Clusters of orthologous groups for eukaryotic complete genomes,真核生物蛋白相鄰類的聚簇)、KEGG(Kyoto encyclopedia of genes and genomes,京都基因與基因組百科全書)、Swissprot等基因數(shù)據(jù)庫進(jìn)行網(wǎng)上比對(表2),共獲得花環(huán)肉芝軟珊瑚和短指軟珊瑚74 970條Unigene注釋,占總Unigene數(shù)的57.41%.NR數(shù)據(jù)庫比對注釋獲得的Unigene數(shù)最多,為74 019條,占總Unigene 數(shù)的56.68%.KOG數(shù)據(jù)庫比對注釋的Unigene 數(shù)最少,為52 318條,占總Unigene 數(shù)的40.06%.4個數(shù)據(jù)庫比對結(jié)果均超過40%.以上結(jié)果表明,本研究測序的花環(huán)肉芝軟珊瑚和短指軟珊瑚數(shù)據(jù)約45%的基因功能注釋未能比對上,表明所測序花環(huán)肉芝軟珊瑚和短指軟珊瑚數(shù)據(jù)中存在很多新的功能基因.
表2 Unigene功能數(shù)據(jù)庫注釋
花環(huán)肉芝軟珊瑚和短指軟珊瑚Unigene與KEGG數(shù)據(jù)庫進(jìn)行比對,獲得56 822條注釋Unigene,占總Unigene 數(shù)的43.51%.這些注釋Unigene共分為6大類,分別為涉及到細(xì)胞組成過程,環(huán)境信息過程,遺傳信息過程,人類疾病,新陳代謝和有機(jī)物合成過程等功能(圖4).其中,注釋為人類疾病的基因數(shù)最多為28 540條,占50.23%.這6個大類共分為44個分支,其中,注釋為信號分支的基因最多為8 232條,占14.49%.這6大類的注釋Unigene與KOG數(shù)據(jù)庫進(jìn)行對比,獲得52 318條注釋Unigene,占總Unigene 數(shù)的40.06%,共分為25類,其中:注釋為細(xì)胞運(yùn)動的基因最少,僅有155條,占0.3%.這可能與珊瑚附著生活運(yùn)動較少有關(guān).
圖4 Unigene KEGG功能分類
本研究通過Illumina HiSeqTM2000對花環(huán)肉芝軟珊瑚與短指珊瑚進(jìn)行轉(zhuǎn)錄組測序,組裝后共獲得130 587條Unigene.這些Unigene通過比對4個數(shù)據(jù)庫后,共得到74 970條注釋基因,占總Unigene的百分比為 57.41%.出現(xiàn)大量未能注釋的Unigene,與先前研究結(jié)果相似,這可能是由于珊瑚基因組信息的缺乏和二代測序的局限性所致[9]7.本研究中,組裝后序列大小都在200~299 nt范圍(25 420條),這些序列通過Blast比對SwissProt和Hmmscan搜索Pfam蛋白同源序列,僅有278條序列比對為CDS,這與魏利斌等[10]的研究結(jié)果相似(重頭組裝測序中序列長度較短的獲得注釋信息的可能性就越小).本研究結(jié)果還表明,短指珊瑚冠部Unigene數(shù)目遠(yuǎn)大于莖部,差異較為明顯.其原因可能是短指珊瑚冠部細(xì)胞功能比其莖部細(xì)胞功能復(fù)雜,復(fù)雜的功能需要表達(dá)更多的功能蛋白去實(shí)現(xiàn)[11].Xin等[12]在牦牛轉(zhuǎn)錄組研究中發(fā)現(xiàn),肺與肌肉之間存在顯著差異,不同組織間基因表達(dá)差異可以很好解釋在珊瑚不同組織間出現(xiàn)的表達(dá)差異.本研究中,花環(huán)肉芝軟珊瑚的N50與GC含量都略大于短指珊瑚.花環(huán)肉芝軟珊瑚的轉(zhuǎn)錄組的GC含量約49%,短指珊瑚GC含量約46%,花環(huán)肉芝軟珊瑚的轉(zhuǎn)錄組GC含量明顯大于短指珊瑚GC含量.王沛政等對花環(huán)肉芝軟珊瑚與短指珊瑚進(jìn)行全基因組測序研究,所獲結(jié)果[13]表明:花環(huán)肉芝軟珊瑚GC%含量37.96%,短指珊瑚基因組GC%含量37.09%,也呈現(xiàn)花環(huán)肉芝軟珊瑚的基因組GC%含量高于短指珊瑚基因組GC%含量.通過以上比較發(fā)現(xiàn),本研究的軟珊瑚的轉(zhuǎn)錄組的GC含量遠(yuǎn)大于其基因組GC含量.
花環(huán)肉芝軟珊瑚與短指珊瑚進(jìn)行轉(zhuǎn)錄組測序數(shù)據(jù)與NR,KOG,KEGG,Swissprot數(shù)據(jù)庫進(jìn)行比對共獲得74 970條注釋基因.在KEGG功能分類比對中,花環(huán)肉芝軟珊瑚與短指珊瑚轉(zhuǎn)錄組中信號傳導(dǎo)功能包含的Unigene 數(shù)目最多為8 232條,次級代謝產(chǎn)物生物合成的Unigene包含的數(shù)目最少,僅有45條.近年來,軟珊瑚作為新型海洋藥物的來源,其次級代謝產(chǎn)物受到關(guān)注,如王洪亮等[14]在珊瑚共生黃柄曲霉的代謝產(chǎn)物中發(fā)現(xiàn)4個細(xì)胞松弛素類化合物.隨著更多的珊瑚基因組序列被挖掘,與劉金豆等[9]3先前關(guān)于稀杯盔形珊瑚轉(zhuǎn)錄組的研究相比,本研究組裝了更多的Unigene,更多的Unigene獲得了注釋.本研究結(jié)果豐富了南海軟珊瑚轉(zhuǎn)錄組數(shù)據(jù)庫,可為從分子機(jī)制研究軟珊瑚活性物質(zhì)提供數(shù)據(jù)支持,也能為南海珊瑚礁的保護(hù)提供理論依據(jù).