曾 錚,張亦陳,劉逸塵,郝 彤,孫金生,2
(1.天津師范大學(xué)a.生命科學(xué)學(xué)院,b.天津市動植物抗性重點(diǎn)實(shí)驗(yàn)室,天津300387;2.天津市水生動物疫病預(yù)防控制中心,天津300221)
蝦蟹是我國重要的水產(chǎn)養(yǎng)殖動物.近年來,隨著市場需求的增加,蝦蟹養(yǎng)殖規(guī)模持續(xù)擴(kuò)大,產(chǎn)業(yè)化水平也逐年提高.長期以來,蝦蟹養(yǎng)殖過程中由細(xì)菌、病毒等引起的病害十分嚴(yán)重,制約了蝦蟹養(yǎng)殖業(yè)的進(jìn)一步發(fā)展[1].目前,對蝦蟹的免疫器官和免疫系統(tǒng)組分仍缺乏全面系統(tǒng)的了解,這也是蝦蟹病害不能被有效預(yù)防和治療的重要原因之一.
表達(dá)序列標(biāo)簽(EST)是從一個隨機(jī)的cDNA克隆進(jìn)行5’端和3’端單一測序獲得的短cDNA部分序列,代表完整基因的一小部分,在數(shù)據(jù)庫中其長度一般為20~7000bp,平均長度為400bp[2].1991年Adams等[3]首次應(yīng)用EST技術(shù)研究人腦基因的表達(dá)狀況,迄今為止,EST技術(shù)在了解生物的基因組成和環(huán)境脅迫特異性表達(dá)方面發(fā)揮了重要作用.近年來,蝦蟹的EST序列測定工作取得很大進(jìn)展,如凡納濱對蝦(Litopenaeus vannamei)、斑節(jié)對蝦(Penaeus mondon)、中國明對蝦(Fenneropenaeus chinensis)、中華絨螯蟹(Eriocheir sinensis)、藍(lán)蟹(Callinectes sapidus)等蝦蟹的EST序列已被注冊到NCBI的dbEST數(shù)據(jù)庫中.這些已公布的蝦蟹EST序列為我們進(jìn)一步了解蝦蟹基因在不同組織或細(xì)胞中的特異性表達(dá)和尋找免疫、繁殖、生長等基因提供了大量信息.
數(shù)據(jù)挖掘與系統(tǒng)分析是獲得大量序列結(jié)果之后面臨的主要問題.通過對海量數(shù)據(jù)的全面系統(tǒng)分析,找出目標(biāo)序列,對開展深入研究至關(guān)重要.NCBI數(shù)據(jù)庫通過綜合不同實(shí)驗(yàn)室的實(shí)驗(yàn)檢測結(jié)果,得到了大量中國明對蝦和中華絨螯蟹的基因注釋信息.本研究在此基礎(chǔ)上,使用Blast2GO軟件從已公布的中國明對蝦和中華絨螯蟹EST序列中,篩選出尚未經(jīng)實(shí)驗(yàn)證實(shí)的推測的免疫相關(guān)基因,并研究中華絨螯蟹免疫基因在不同細(xì)胞或組織中的分布情況.
中國明對蝦和中華絨螯蟹的EST序列下載自GenBank的子庫dbEST.其中,中國明對蝦EST序列有10512條,中華絨螯蟹EST序列有17067條.
Blast2GO是一個基于java的集序列功能注釋和注釋數(shù)據(jù)分析為一體的工具,具有易操作、界面友好、高通量等特點(diǎn)[4].Perl程序Chimeric_Check.pl和PolyA_Check.pl來自文獻(xiàn)[2],分別用來去除嵌合序列和檢查polyA、polyT的序列條數(shù).CAP3是序列拼接程序[5],由 http://seq.cs.iastate.edu/cap3.html下載得到.
下載得到的EST序列文件中包含在不同時間由不同實(shí)驗(yàn)室提交的同一物種的不同器官、組織或細(xì)胞的所有EST.本研究認(rèn)為序列號連續(xù)并注釋相同的EST為一批序列,使用程序提取出來供后續(xù)分析.在文庫構(gòu)建過程中可能會產(chǎn)生嵌合序列,中間有很長的polyA或載體序列[2],使用Chimeric_Check.pl將嵌合序列去除.此外,若EST序列兩端存在poly A或者poly T,說明該序列表示的cDNA可能被完全測通,能夠代表完整的mRNA信息[2].使用PolyA_Check.pl查找poly A和poly T的序列,并去除序列中的poly A和poly T.使用CAP3對序列進(jìn)行聚類拼接,參數(shù)選擇默認(rèn)設(shè)置,得到的結(jié)果被視為Unigene.最后使用Blast2GO軟件注釋Unigene,Blasting步驟選用blastx默認(rèn)設(shè)置.
本研究通過篩選免疫相關(guān)GO注釋和檢索免疫關(guān)鍵詞2種方法尋找免疫基因.Blast2GO軟件在Annotation步驟中按照所設(shè)參數(shù)選取GO注釋,并在Analysis步驟中返回GO注釋餅圖,選擇GO注釋可被追溯至第 2層 GO術(shù)語 GO:0002376(immune system process)的所有基因?yàn)槊庖呋?另外,使用免疫基因的名稱和注釋信息作為檢索關(guān)鍵詞,分析Blasting過程中blastx的注釋結(jié)果文件,提取出相關(guān)基因.關(guān)鍵詞來源于免疫相關(guān)文獻(xiàn)資料,包括蝦、蟹、鱟等EST分析和綜述性文章中出現(xiàn)的免疫基因注釋信息[6-10].關(guān)鍵詞有140個,涉及模式識別蛋白、蛋白酶和蛋白酶抑制劑、酚氧化酶原激活系統(tǒng)、細(xì)胞毒性活性氧等14大類.例如,一個關(guān)鍵詞“phenoloxidase”可以完成“phenoloxidase(PO)”、“prophenoloxidase(proPO)”、“prophenoloxidase activating factor(PPAE)”和“prophenoloxidase activating enzyme(PPAE)”全檢索到.為了提高檢索的準(zhǔn)確性,研究中對整個過程進(jìn)行人工核查.
分析下載得到的EST數(shù)據(jù)顯示,中國明對蝦僅有頭胸部(cephalothorax)的EST信息,中華絨螯蟹的EST序列包括血細(xì)胞、肝胰腺(hepatopancreas)、性腺(sex gland)、精巢(testis).其中,中華絨螯蟹血細(xì)胞的EST序列有2套,為不同時間不同實(shí)驗(yàn)室提交的序列,在注釋上表現(xiàn)也不同,本研究分別使用血細(xì)胞Ⅰ(hemocyte)和血細(xì)胞Ⅱ(haemocyte)加以標(biāo)識,采用同一種方法分別處理.EST序列經(jīng)CAP3軟件聚類拼接后獲得相應(yīng)的Unigene,結(jié)果如表1所示.
表1 EST序列分析數(shù)目統(tǒng)計(jì)Tab.1 Statistics number of EST sequences analysis 條
由表1可知,除性腺的EST外,其余細(xì)胞或組織的EST中都發(fā)現(xiàn)了嵌合序列.其中,中國明對蝦頭胸部EST的嵌和序列數(shù)量最多,中華絨螯蟹精巢EST中嵌和序列所占比例則最高.除性腺外,其余細(xì)胞或組織的EST中都有包含polyA和polyT的EST.中國明對蝦頭胸部含有polyA的EST數(shù)目最多,所占比例也最高.經(jīng)CAP3軟件將EST聚類拼接后形成的序列為Unigene,中國明對蝦頭胸部EST拼接后獲得的Unigene最多,中華絨螯蟹中,血細(xì)胞ⅡEST拼接獲得的Unigene最多,性腺中最少.
Blast2GO注釋結(jié)果如表2所示.經(jīng)blastx比對,中國明對蝦頭胸部被注釋的Unigene數(shù)量最多,占Unigene總量的33.52%;中華絨螯蟹肝胰腺Unigene注釋的比例最高,達(dá)到53.06%;中華絨螯蟹性腺中被注釋的Unigene數(shù)量最少.
表2 Blast2Go注釋過程中各步驟注釋到的序列條數(shù)Tab.2 Number of Unigene statistic in each annotation step by Blast2Go 條
通過Blast2GO統(tǒng)計(jì)第2層的生物過程GO分布,得到與第2層GO術(shù)語GO:0002376(immune system process)有關(guān)的基因,包括中國明對蝦頭胸部、中華絨螯蟹血細(xì)胞Ⅰ、肝胰腺、性腺、精巢的Unigene,結(jié)果如表3所示.
表3 免疫相關(guān)GO注釋到的基因Tab.3 Genes annotated by immune-related GO term
由于通過GO分析確定的免疫基因數(shù)量過少,因此需要進(jìn)一步通過免疫關(guān)鍵詞檢索blastx比對結(jié)果來尋找免疫基因.本研究參考甲殼動物免疫系統(tǒng)的文獻(xiàn)和EST分析文獻(xiàn)[6-9],確定了與免疫相關(guān)的關(guān)鍵詞72條,在blastx的比對結(jié)果中進(jìn)行搜索,共獲得680條免疫基因.這些基因涉及模式識別蛋白、酚氧化酶原激活系統(tǒng)、蛋白酶和蛋白酶抑制劑等無脊椎動物免疫系統(tǒng)的重要組分.綜合以上2種方法篩選的免疫基因,去除其中的重復(fù)結(jié)果,最終共獲得免疫基因Unigene 680條,其中中華絨螯蟹血細(xì)胞Ⅰ發(fā)現(xiàn)的免疫基因最多.不同組織和細(xì)胞中的免疫基因在各免疫系統(tǒng)組分中的分布如表4所示,其中無法確定免疫系統(tǒng)組分的歸入“其他”類.
表4 不同細(xì)胞和組織免疫相關(guān)基因的功能分布Tab.4 Function distribution of immune-related genes from different cells and tissues 條
本研究首先通過GO注釋的提示篩選免疫基因,但數(shù)量較少.繼而通過檢索免疫關(guān)鍵詞的方法篩選,獲得了大量免疫相關(guān)基因.從另一角度來看,雖然GO注釋方法獲得的免疫基因數(shù)量不多,但得到的一些信息是關(guān)鍵詞檢索無法取代的.例如,gb|FL571594.1|是中華絨螯蟹血細(xì)胞Ⅰ的Unigene,GO注釋表明該基因參與Toll信號通路過程,而檢索免疫關(guān)鍵詞的方法并未發(fā)現(xiàn)該基因;利用這2種方法都能預(yù)測中華絨螯蟹gb|GE340553.1|是免疫基因,關(guān)鍵詞檢索僅能提示該基因是凝結(jié)蛋白,而GO注釋“hemolymph coagulation”(GO:0042381)則提供了更多的關(guān)于該基因的功能信息.除gb|GE340553.1|外,使用2種方法都能檢索到的免疫基因還包括中國明對蝦的Contig527、gb|BM297142.1|以及中華絨螯蟹血細(xì)胞Ⅰ的gb|FL571592.1|,分別為β-葡聚糖識別蛋白和toll-like受體.由此可見,GO提示信息和關(guān)鍵詞檢索方法具有互補(bǔ)性,二者相結(jié)合尋找免疫基因?qū)τ谕晟泼庖呋蛐畔⒑土私饷庖呦到y(tǒng)組分很有必要.
在綜合GO提示信息和關(guān)鍵詞檢索得到的免疫基因中,一部分與已報(bào)道的中國明對蝦和中華絨螯蟹的免疫基因一致,這些免疫基因的功能注釋來自NCBI數(shù)據(jù)庫.例如,在中華絨螯蟹血細(xì)胞中發(fā)現(xiàn)多種抗菌肽,包括crustin i、crustin iii、抗脂多糖因子、抗脂多糖因子2、抗脂多糖因子3和osmotin.另外,本文還通過預(yù)測獲得了一批在蝦、蟹中尚未報(bào)道的潛在免疫基因.其中,中國明對蝦頭胸部中有60個,約占總預(yù)測基因數(shù)量的40%,中華絨螯蟹中共有250個,在各組織和細(xì)胞中的分布如表5所示.中華絨螯蟹血細(xì)胞Ⅱ中,GeneBank號為FG984061.1的EST與胡椒屬(Piper colubrinum)的osmotin有79%的相似性.osmotin是一類植物抗病相關(guān)的蛋白,主要用來對抗真菌[11],因此,中華絨螯蟹體內(nèi)的FG984061.1也可能有抗御真菌的作用.這些預(yù)測的基因與其他物種的免疫基因高度相似,因此也很可能參與了蝦、蟹體內(nèi)的免疫過程.
表5 免疫基因注釋結(jié)果在不同物種中的分布Tab.5 Distribution of immune-related genes in different organisms 個
本研究發(fā)現(xiàn)中華絨螯蟹血細(xì)胞的免疫基因數(shù)量比其他組織多,其中含有參與酚氧化酶原激活系統(tǒng)的多種因子,抗菌肽類的免疫基因種類也更豐富.中華絨螯蟹血細(xì)胞和中國明對蝦頭胸部的EST中都發(fā)現(xiàn)了多種蛋白酶和蛋白酶抑制劑,如表6所示.
表6 蛋白酶和蛋白酶抑制劑在不同組織和細(xì)胞中分布的情況Tab.6 Distribution of protease and protease inhibitor from different tissues and cells
研究表明,血細(xì)胞作為先天免疫系統(tǒng)的重要參與者包含多種蛋白酶和蛋白酶抑制劑[12],蛋白酶及其抑制劑可以通過水解級聯(lián)反應(yīng)激活啟動Toll受體、類補(bǔ)體反應(yīng)、酚氧化酶原激活系統(tǒng)和凝集系統(tǒng)等免疫途徑,在先天免疫系統(tǒng)中發(fā)揮重要作用.本研究發(fā)現(xiàn)蝦、蟹具有很多先天免疫系統(tǒng)的重要組分,這進(jìn)一步證實(shí)了甲殼動物可依靠先天免疫系統(tǒng)抗御病原侵染,其中,血細(xì)胞是多種免疫應(yīng)答的發(fā)起者,在抗病過程中發(fā)揮了重要作用.
肝胰腺是甲殼動物重要的內(nèi)分泌器官和消化器官,近年來已有一些研究提示肝胰腺可能參與免疫過程[13].Du等[14]研究螺原體MR-1008對肝胰腺中AKP、ACP、SOD、CAT等免疫基因的影響時,發(fā)現(xiàn)MR-1008能夠啟動或抑制這些基因的免疫應(yīng)答,并且認(rèn)為肝胰腺在先天免疫系統(tǒng)中發(fā)揮重要作用.Jin等[15]在中華絨螯蟹中克隆出了2種C型凝集素,并且發(fā)現(xiàn)能夠在肝胰腺中表達(dá).此外,有報(bào)道指出蝦類肝胰腺中存在多種類型的凝集素,其表達(dá)量在細(xì)菌感染前后差異顯著[16-18].本研究在中國明對蝦的頭胸部、中華絨螯蟹的血細(xì)胞和肝胰腺中都發(fā)現(xiàn)了凝集素,其中中華絨螯蟹肝胰腺EST的凝集素種類最多,包括凝集素a、凝集素b、C型凝集素1、C型凝集素2、C型凝集素3等.這有助于全面認(rèn)識甲殼動物肝胰腺的功能以及正確評價其在免疫過程中的重要作用.
[1] 陳愛平,劉富林,吳凡修.2010年水產(chǎn)養(yǎng)殖病害發(fā)生情況與2011年流行趨勢分析[J].中國水產(chǎn),2011(3):56-59.
[2] 王俊,叢麗娟,鄭洪坤.常用生物數(shù)據(jù)分析軟件[M].北京:科學(xué)出版社,2008.
[3]ADAMS M D,KELLEY J M,GOCAYNE J D,et al.Complementary DNAsequencing:expressedsequencetagsandhumangenomeproject[J].Science,1991,252(5013):1651-1656.
[4]CONESA A,GOTZ S,GARCIA-GOMEZ J M,et al.Blast2GO:a universal tool for annotation,visualization and analysis in functional genomics research[J].Bioinformatics,2005,21(18):3674-3676.
[5]HUANG X,MADAN A.CAP3:a DNA sequence assembly program[J].Genome Res,1999,9(9):868-877.
[6] ZHAO D X,SONG S H.Discovery of immune-related genes in Chinese mitten crab(Eriocheir sinensis)by expressed sequence tag analysis of haemocytes[J].Aquaculture,2008,287(3/4):297-303.
[7] DONG B,XIANG J H.Discovery of genes involved in defense/immunity functions in a haemocytes cDNA library from Fenneropenaeus chinensis by ESTs annotation[J].Aquaculture,2007,272(1/2/3/4):208-215.
[8] 黃文樹,王克堅(jiān),李少菁.甲殼動物抗菌肽研究進(jìn)展[J].Marine Sciences,2005,29(2):64-68.
[9]王瑩.凡納濱對蝦和中華絨螯蟹免疫相關(guān)因子功能及應(yīng)用的初步研究[D].青島:中國科學(xué)院海洋研究所,2010.
[10]JIRAVANICHPAISAL P,LEE S Y,KIM Y A,et al.Antibacterial peptides in hemocytes and hematopoietic tissue from freshwater crayfish Pacifastacus leniusculus:characterization and expression pattern[J].Dev Comp Immunol,2007,31(5):441-455.
[11]VIKTOROVA J,KRASNY L,KAMLAR M,et al.Osmotin,a pathogenesis-related protein[J].Curr Protein Pept Sci,2012,13(7):672-681.
[12]FRANSSENS V,SIMONET G,BREUGELMANS B,et al.The role of hemocytes,serine protease inhibitors and pathogen-associated patterns in prophenoloxidase activation in the desert locust,Schistocerca gregaria[J].Peptides,2008,29(2):235-241.
[13]劉凌云,鄭光美.普通動物學(xué)[M].北京:高等教育出版社,1997.
[14]DU J,ZHU H,LIU P,et al.Immune responses and gene expression in hepatopancreas from Macrobrachium rosenbergii challenged by a novel pathogen spiroplasma MR-1008[J].Fish Shellfish Immunol,2013,34(1):315-323.
[15]JIN X K,LI W W,CHENG L,et al.Two novel short C-type lectin from Chinese mitten crab,Eriocheir sinensis,are induced in response to LPS challenged[J].Fish Shellfish Immunol,2012,33(5):1149-1158.
[16]SUN Y D,F(xiàn)U L D,JIA Y P,et al.A hepatopancreas-specific C-type lectin from the Chinese shrimp Fenneropenaeus chinensis exhibits antimicrobial activity[J].Mol Immunol,2008,45(2):348-361.
[17]WANG X W,ZHANG X W,XU W T,et al.A novel C-type lectin(FcLec4)fa-cilitates the clearance of Vibrio anguillarum in vivo in Chinese white shrimp[J].Dev Comp Immunol,2009,33(9):1039-1047.
[18]WEI X,LIU X,YANG J,et al.Two C-type lectins from shrimp Litopenaeus vannamei that might be involved in immune response against bacteria and virus[J].Fish Shellfish Immunol,2012,32(1):132-140.