劉 興,高 波,吉紅九,賈超峰,祝 斐,孟 乾,陳淑吟,張志勇,徐士霞
(1.南京師范大學生命科學學院,江蘇省生物多樣性重點實驗室,江蘇 南京 210023) (2.江蘇省海洋水產研究所,江蘇省海水魚類遺傳育種重點實驗室,江蘇 南通 226007)
鱸形目(Perciformes)是魚類中物種豐富度最高的一個目,包括25個亞目、160科、1 539屬、10 033種[1]. 鱸形目物種分布廣泛,大多生活在海洋,僅有少數(如鱸科、麗鯛科等)生活在淡水水域[1]. 鱸形目多個物種是中國重要的海水養(yǎng)殖魚類,具有重要食用價值和經濟價值. 據報道高密度養(yǎng)殖模式會引起鱸形目物種病害頻繁發(fā)生,尤其是受到多種細菌、病毒等病原微生物威脅[2]. 魚類病害的爆發(fā)會導致其產量和品質的下降,從而造成較為嚴重的經濟損失. 因此,研究鱸形目免疫基因的進化不僅有助于理解宿主和病原體間的作用機制,也為物種遺傳育種及疾病防治提供重要的參考依據.
先天性免疫在抵抗外界病原體入侵方面起著重要作用,是動物的主要防御機制,代表著抵御病原體入侵的第一道防線,在維持生物體生長、發(fā)育和生存過程中發(fā)揮最重要作用[3-4]. 魚類屬于變溫動物,其淋巴細胞增殖緩慢導致適應性免疫相對滯后且免疫應答能效較低,因此魚類先天性免疫在抵御病原體感染的過程中扮演更為重要的角色[5]. 研究表明,先天性免疫系統(tǒng)主要通過免疫細胞表面的模式識別受體(pattern recognition receptor,PRR)并結合病原體中存在的病原體相關分子模式(pathogen-associated molecular pattern,PAMP),包括微生物的CpG ODN、脂蛋白、dsRNA等,從而引發(fā)一系列的免疫反應,以消滅入侵的病原體[6]. 其中,抗原呈遞細胞上表達的Toll樣受體(Toll-like receptor,TLRs)家族是關鍵的PRR,在誘導先天性免疫應答以及適應性免疫應答中起著重要作用[3]. 根據不同TLRs識別不同病原相關分子模式,魚類TLR通常分為兩類,第一類包括TLR1、TLR2、TLR4、TLR5和TLR9,主要參與機體對細菌的識別,被稱為非病毒型TLRs;第二類包括TLR3、TLR7、TLR8和TLR22,主要參與病毒的識別,被稱為病毒型TLRs[7].
到目前為止,魚類中已經鑒定出大約23種TLRs[8],典型的TLRs蛋白結構包括亮氨酸重復區(qū)(LRRs)、跨膜結構域(TM)、胞內Toll/IL-1受體結構域(TIR),其中LRRs區(qū)通過與相應的配體結合,使得Toll樣受體被激活,進一步通過TIR結構域與接頭分子MyD88(髓樣分化因子)結合,誘導產生炎癥細胞因子抵御病原菌的入侵,TIR區(qū)相對保守,與分子信號轉導有關[3]. TLRs在魚類免疫中的作用已被廣泛研究,病原體感染后TLRs相關基因表達量會發(fā)生不同的變化來適應特定的生存環(huán)境. 大西洋鯛(Sparusaurata)被嗜水氣單胞菌感染后,TLR2表達發(fā)生上調[9];大黃魚(Larimichthyscrocea)被嗜水氣單胞菌感染后,TLR1、TLR3表達上調,TLR2、TLR22表達下調[10];海魚分枝桿菌也被證實可以誘導斑馬魚TLR9表達上調[11]. 值得注意的是,TLR9與其他非病毒型TLRs不同,該受體只存在于細胞內部,也是識別細菌和病毒DNA中CpG ODN的主要受體,通過與CpG特定的序列結合最終引起免疫器官的功能性成熟,進而產生一系列免疫效應細胞[12],此外,該受體也被認為能與其配體協(xié)同進化,因此是研究魚類抗病原體免疫適應的重要模型. 在非病毒型TLRs中,TLR1似乎也擁有獨特的抗病原免疫機制,盡管目前TLR1在大黃魚、綠河豚(Tetraodonnigroviridis)、斑馬魚等物種中鑒定出來,并且病原感染實驗也表明該受體在魚類病原免疫中發(fā)揮著重要作用,但是目前魚類TLR1的配體還未明確,相關研究表明TLR1可能需要與TLR2形成異源二聚體發(fā)揮作用,因此TLR1仍需要更深入的研究[13-14]. 目前國內外對鱸形目TLRs家族研究大多局限在免疫學實驗中,然而其分子進化基礎仍不完全清楚. 本研究以17種鱸形目物種的TLR1、TLR9為候選基因,嘗試通過分析這兩個基因分子進化揭示其先天性免疫機制. 研究結果對于鱸形目魚類的遺傳育種以及疾病防治具有一定的指導意義.
本研究共選取17種鱸形目物種,涵蓋攀鱸科、鲹科、狼鳚科、鱸科、鮨科、花鱸科、鱷冰魚科、龍科、南極魚科、石首魚科、鯛科,并選取斑馬魚作為外群. 除了真鯛以及黑鯛TLR1基因外,本研究所使用物種的TLR1、TLR9基因序列信息均來自NCBI(http://www.ncbi.nlm.nih.gov/)數據庫(表1). 進一步,以大西洋鯛TLR1作為參考序列在真鯛(Pagrusmajor)以及黑鯛(Acanthopagrusschlegelii)基因組中進行本地Blast[15]以獲取對應的TLR1基因,E-value值設定為1e-5,其中真鯛基因組來自NCBI數據庫,黑鯛基因組為江蘇省海洋水產研究所與南京師范大學合作測序數據(未發(fā)表). 使用Prank[16]軟件對每一個基因基于密碼子水平進行多序列比對,然后使用Gblocks[17]軟件對序列非保守區(qū)域進行比對和人工校對.
表1 本文研究所選物種基因序列登錄號Table 1 Accession numbers of species used in this study
為探討TLRs在鱸形目物種內部的系統(tǒng)發(fā)生關系,通過Modelgenerator[18]軟件選擇最佳核苷酸替換模型,使用RAxML[19]軟件構建最大似然系統(tǒng)發(fā)生樹,斑馬魚作為外群,自展1 000次估計節(jié)點的支持度(bootstrap value). 另外,為了使得樹的結果更加可靠,也使用了Mrbayes[20]軟件基于貝葉斯法進行構樹,其中后驗概率借助馬爾科夫鏈蒙特卡洛方法(markov chain monte carlo,MCMC)運行100000代進行估計.
為了探究TLR1和TLR9在鱸形目中的進化模式,本研究使用 PAML4.7(phylogenetic analysis by maximum Likelihood,PAML)軟件[21]中CODEML程序對非同義替換率(nonsynonymous,dN)和同義替代率(synonymous,dS)的比值(ω=dN/dS)進行評估.ω值為衡量選擇壓力的重要指標,其中ω<1、=1和>1分別意味著受純化選擇(Purify selection)、中性選擇(Neutral selection)和正選擇(Positive selective). 使用目前公認的鱸形目系統(tǒng)發(fā)生關系[22]以及TimeTree網站(http://www.timetree.org/)的系統(tǒng)發(fā)育樹作為PAML分析的輸入樹(圖1).
圖1 本研究用于PAML分析的輸入樹. Branch-site、Free ratio結果分別使用圓圈以及三角符號標記Fig.1 The input phylogenetic tree used in PAML analyses in this study. The results of Branch-site and Free ratio models were marked with circles and triangles,respectively
運用基于最大似然法的PAML4.7軟件包[21]和Datamonkey[23]進行評估鱸形目物種中TLR1和TLR9兩個基因座中受正選擇作用的位點. 首先,運用PAML 軟件包中的位點模型(Site model)中的兩對模型:M1a(中性模型)vs. M2a(正選擇模型)、 M8a(中性模型,beta 分布:0<ω0<1和ω1=1)vs. M8(正選擇模型;beta分布:0<ω0<1和ω1>1)進行檢測. 運用似然比檢驗(likelihood ratio test,LRT)評估嵌套模型中的最佳模型,并通過2ΔlnL值與自由度之間的卡方分布(Chi-square test,χ2)關系檢測上述兩個模型的顯著性. 當模型通過LRT檢驗且P值顯著時,運用貝葉斯經驗貝葉斯法[24](bayes empirical bayes,BEB)檢測正選擇位點,其中后驗概率(posterior probabilities,PP)值大于0.9的位點作為潛在的正選擇位點. 另外,基于同義替代的Datamonkey[23]方法進一步用于正選擇位點的檢測,運用了三種最大似然法,包括固定效應似然法(fixed effects likelihood,FEL)、隨機效應似然法(random effects likelihood,REL)、快速無約束貝葉斯估算法(fast unconstrained bayesian approximation,FUBAR). FEL顯著性水平設置為0.2,REL貝葉斯顯著水平設置為50,FUBAR中后驗概率固定閾值0.8.
為了進一步檢測正選擇是否局限于特定的進化譜系,運用PAML4.7軟件包中的自由比率模型(Free-ratio model)和支位點模型(Branch-site model)進行檢測. 自由比率模型假設每一支系具有獨立的ω值,該模型與零假設——單一比率模型(One-ratio model)即所有支系具有相同的ω值進行比較. 支位點模型(Branch-site model)是最嚴格的選擇壓力檢測的方法,不僅能夠檢測受正選擇的支系還能檢測受正選擇的位點. 該模型需要將進化譜系分為前景支(foreground branch,即感興趣的支系)與背景支(background branch,即其余的支系). 本研究中,將17種鱸形目物種分別標記為前景支,零假設Ma0(中性模型:0<ω0<1,ω1=1和ω2=1)和備擇假設Ma(正選擇模型:0<ω0<1,ω1>1和ω2≥1)進行比較. 運用LRT檢測嵌套模型的顯著性,P<0.05時則為模型顯著,且所檢測的位點PP>0.9時,被認為是正選擇位點.
通過MEGA[22]軟件將TLR1、TLR9完整核苷酸序列翻譯為氨基酸序列,利用SMART網站(http://smart.embl-heidelberg.de/)預測蛋白關鍵結構域. 蛋白質結構域中氨基酸的變化可能引起蛋白質空間構型的改變,進而影響蛋白質功能. 為了進一步為探究正選擇位點在蛋白質三維結構上的空間分布,本研究使用I-TASSER(Iterative Threading ASSEmbly Refinement)網站對黑鯛TLR1和TLR9蛋白三維結構進行預測,并通過EZMOL(http://www.sbg.bio.ic.ac.uk/ezmol/)網站定位正選擇位點在蛋白質三維結構上的位置,從而更直觀地分析位點對蛋白質生物學功能的影響.
為了探討鱸形目TLRs的系統(tǒng)發(fā)生關系,首先,基于Modelgenerator[19]軟件分析,發(fā)現 GTR+GAMMA+I模型為核苷酸替代的最佳模型. 其次,使用RAxML軟件構建基因最大似然樹(圖2). 基因樹的拓撲結構顯示鱸形目TLRs的基因根據TLR1和TLR9兩個基因座聚成了兩個基因簇. 但是,基因樹的拓撲結構與物種樹存在差異,在TLR1物種樹中,日本真鱸(Lateolabraxjaponicus)與鮸魚(Miichthysmiiuy)聚在一起,而在基因樹中,鮸魚與鯛科的大西洋鯛拓撲關系最近. 在TLR9基因樹中,除了兩個鮨科物種斜帶石斑魚(Epinepheluscoioides)以及鞍帶石斑魚(E.lanceolatus)沒有與黃鱸(Percaflavescens)聚在一起,基因樹與物種樹其他物種親緣關系基本一致. 同時,貝葉斯樹也同樣支持了最大似然法構建的基因樹,兩種方法得到的物種基因樹在整體拓撲結構上基本一致(圖3). 綜上,基因樹與物種樹的拓撲差異表明在魚類進化過程中,TLR1、TLR9基因已經發(fā)生了獨特的進化,以適應不同生境下病原微生物的侵染.
紅色和藍色三角形、五角星分別代表鱸形目TLR1以及TLR9支系. 節(jié)點數字表示支持度大于50%圖2 最大似然法構建鱸形目TLR1、TLR9系統(tǒng)發(fā)育樹Fig.2 Reconstruction of the TLR1 and TLR9 phylogenetic tree of Perciformes by the maximum likelihood method
紅色和藍色五角星三角形、五角星分別代表鱸形目TLR1以及TLR9支系. 節(jié)點數字表示后驗概率圖3 貝葉斯法構建鱸形目TLR1、TLR9系統(tǒng)發(fā)育樹Fig.3 Reconstruction of the TLR1 and TLR9 phylogenetic tree of Perciformes by Bayesian method
為了檢測TLR1和TLR9兩個基因座在鱸形目物種中是否存在正選擇位點,首先運用PAML4.7軟件中位點模型(M1a vs. M2a、M8a vs. M8)進行檢測. LRT結果顯示正選擇模型M2a和M8均顯著優(yōu)于中性模型M1a和M8a. 在TLR1基因座位中,正選擇模型M2a、M8中ω值分別為2.55和2.05,提示TLR1受正選擇,并且M2a,M8通過BEB方法分別檢測到3個、47個正選擇位點的后驗概率大于0.9,在TLR9檢測結果中,M2a、M8模型分別檢測到3、30個正選擇位點. 當后驗概率提高到0.95時,在TLR1檢測結果中,M2a,M8分別篩選到1個、20個正選擇位點,而在TLR9中,M2a模型未檢測到后驗概率大于0.95的位點,M8模型則檢測到10個正選擇位點. 另外,采用DataMonkey網站中的三種最大似然法(FEL、REL以及FUBAR)進一步對兩個基因座位進行選擇壓力檢測. 結果表明,運用三種方法在TLR1基因座位(FEL:28,REL:8,FUBAR:13)以及TLR9基因座位(FEL:24,REL:6,FUBAR:3)共檢測53個正選擇位點. 綜合以上五種最大似然法,TLR1與TLR9中被兩種以上方法同時檢測到的正選擇位點分別為16和8個,提示這些位點為強烈的正選擇位點,同時被三種以上方法檢測到的正選擇位點分別為7個和3個(表2).
表2 PAML和Datamonkey檢測到的正選擇位點Table 2 Sites under positive selection detected by PAML and Datamonkey
運用單一比率模型(One-ratio model)假設所有支系具有相同的進化速率,結果顯示鱸形目物種TLR1和TLR9的ω值分別為0.38與0.36,顯著小于1,提示這兩個基因整體受到強烈的選擇約束. 為了進一步探究正選擇是否局限于鱸形目特異的支系,運用自由比率模型(Free-ratio model)進行檢測. LRT結果顯示嵌套模型(One ratio vs. Free ratio)差異顯著(P<0.01),說明自由比率模型顯著優(yōu)于單一比率模型. Free-ratio模型發(fā)現TLR1在日本真鱸顯著受正選擇;而TLR9基因座位中則檢測到多個正選擇支系,例如黃鱸與白梭吻鱸(Sanderlucioperca)最近共同祖先支,日本真鱸、鮸魚、真鯛、大西洋鯛以及黑鯛的最近共同祖先支(圖2、表3). Free ratio模型檢測到一些支系中存在正選擇信號(ω>1),據報道這些支系長期受到病原微生物的侵襲,比如鯛科支系已被報道經常受到虹彩病毒侵襲,引起組織細胞腫大壞死[25].
運用最嚴格的支位點模型(Branch-site model)檢測選擇壓力,結果提示在TLR1基因座位中,正選擇分別發(fā)生在龜殼攀鱸(Anabastestudineus)、鮸魚、卵形鯧鲹(Trachinotusovatus)、伯氏肩孔南極魚(Trematomusbernacchii)以及南喬治亞擬冰魚(Pseudochaenichthysgeorgianus)、尖頭裸龍(Gymnodracoacuticeps)最近共同祖先支,斜帶石斑魚和鞍帶石斑魚最近共同祖先支,真鯛、黑鯛及大西洋鯛最近共同祖先支;在TLR9中,黃鱸、白梭吻鱸以及橙胸鏢鱸(Etheostomaspectabile)最近共同祖先支,真鯛、黑鯛及大西洋鯛最近共同祖先支也分別檢測到正選擇位點(表4).
表3 基因位點模型和分支模型檢測結果Table 3 The result for site model and branch model(PAML)tests of genes
表4 TLR1和TLR9基因支位點模型檢測結果Table 4 The result for Branch-site model test of genes
續(xù)表4 Table 4 continued
本研究選取了親緣關系較遠的大西洋鯛(鯛科)、伯氏肩孔南極魚(南極魚科)、龜殼攀鱸(攀鱸科)三個物種為代表進行氨基酸序列分析. 利用SMART網站分別預測TLR1、TLR9蛋白結構域并通過IBS[26]軟件對結構域進行可視化(圖4). 龜殼攀鱸、大西洋鯛、伯氏肩孔南極魚三個物種中,TLR1編碼序列長度相似,分別為798、802、802個氨基酸,其中大西洋鯛具有最多的亮氨酸重復區(qū)(13個),但值得注意的是,此物種未檢測到羧基端亮氨酸重復區(qū);伯氏肩孔南極魚亮氨酸重復區(qū)數量最少(4個)并且未檢測到跨膜區(qū). TLR9在三個物種中相對更為保守,都含有典型的TLRs蛋白結構域(LRR、TM、TIR),其中亮氨酸重復區(qū)數量分別為12、13、15個. 為了進一步探究正選擇位點對蛋白質功能的影響,將這些位點標注在蛋白三維結構中,首先利用I-TASSER網站預測了黑鯛蛋白三維結構模型并通過EZMOL在線網站將同時被兩種最大似然法鑒定到的正選擇位點(TLR1:16和TLR9:8)標注到三維模型中(圖5),發(fā)現58%的正選擇位點位于蛋白質重要功能域,且86%強烈的正選擇位點位于病原體識別區(qū)域亮氨酸重復區(qū)(LRRs).
SP:信號肽;LRR:亮氨酸重復區(qū);TM:跨膜區(qū);LRRCT:羧基端亮氨酸重復區(qū);TIR:Toll/IL-1受體結構域.圖4 不同物種TLR1、TLR9蛋白結構比較Fig.4 Comparison of the TLR1、TLR9 domain structures among various species
圖5 基因正選擇位點在蛋白三維結構中的標注Fig.5 Annotation of the positive selection sites of genes in the three-dimensional structure of the protein
TLRs是進化保守的蛋白質,傳統(tǒng)上受到強烈的功能約束. 然而,最近的研究已經在一些脊椎動物群體中發(fā)現正選擇的證據,如鳥類中TLR3、4、5和15基因、嚙齒動物的TLR4基因等[27-29]. 相對于恒溫哺乳類、鳥類物種,生活在水體中的魚類因沒有自我調節(jié)體溫的機制,當面臨病原微生物入侵時,低溫誘導的淋巴細胞的增值減少將導致適應性免疫相對滯后且免疫應答能效較低,因此對棲息于病原體較多的水環(huán)境魚類而言,先天性免疫在抵御病原體侵染的過程中扮演更為重要的角色[28]. 作為Toll樣受體基因家族中的重要成員,TLR1、TLR9分別可以識別三酰基脂肽、細菌與病毒非甲基化的CpG寡核苷酸序列,盡管在魚類免疫識別應答方面的功能已被廣泛的研究,但是基因的分子進化基礎尚不清楚. 目前,已經報道了鱸形目物種容易受到不同的病原微生物的感染,包括真鯛虹彩病毒(RSIV)、鱸魚虹彩病毒(WVIV)、淋巴囊腫病毒(LCDV)、紅細胞壞死病毒(VENV)、傳染性胰腺壞死病病毒(IPNV)、流行性造血器官壞死病毒(EHNV)、神經壞死癥病毒(NNV)等[25,30]. 本研究通過分析鱸形目物種先天免疫相關基因TLR1、TLR9的進化模式,發(fā)現物種普遍受到顯著的正選擇. 在位點模型中,TLR1與TLR9中被兩種以上方法檢測到的正選擇位點分別為18、6個,且86%位點處于LRR區(qū). 已報道LRR結構域在識別病原體組分中發(fā)揮核心作用,且LRR和LRR_CT區(qū)域還參與病原體刺激后的信號轉導過程[31]. 該區(qū)檢測到更多正選擇位點可能有利于物種在進化過程中識別不同的配體進而有效的抵抗病原微生物. 另外,相比于LRR區(qū),TIR區(qū)具有更高的保守性,并且在信號轉導過程中發(fā)揮重要作用. 鱸形目物種在TIR結構域未檢測到正選擇位點,提示該區(qū)域可能受到強烈的功能約束.
特別重要的是,也在鱸形目一些支系中檢測到特有的正選擇信號,并且檢測到的正選擇位點與位點模型所檢測到的位點不同,這些支系可能經歷了更多的選擇來應對不同病原體的感染. 兩個基因在鯛科的最近共同祖先支均檢測到正選擇信號,之前研究也證明鯛科物種經常感染淋巴囊腫病、病毒性表皮壞死病等[25]. 石斑魚屬是環(huán)境適應能力較強的暖水性魚類,尤其是斜帶石斑魚,生活溫度可以在11~41 ℃之間. 目前,病毒性神經壞死癥是石斑魚流行病之一[32],研究也在兩個石斑魚屬物種(斜帶石斑魚、鞍帶石斑魚)的祖先支檢測到TLR1基因正選擇的信號,可能與其獨特的環(huán)境適應能力有關. 另外,河鱸科物種被列為病毒性出血性敗血癥的易感物種[33]. 作為全球有鰭魚類致病性最強的病毒性疾病之一,宿主致死率可高達90%,在河鱸科物種的祖先支中也檢測到TLR9基因存在正選擇信號. 這些物種檢測到顯著的正選擇信號,表明隨著時間的推移,物種抗病毒免疫反應可能已經發(fā)生了進化(圖1,表4),提示鱸形目物種TLR1、TLR9的分子進化可能是由環(huán)境中的病原微生物介導的選擇壓力所驅動的,從而具有較強的抵御病原微生物侵襲的能力.
另外,兩個基因受正選擇的比例也明顯不同,在TLR1中檢測到更多的正選擇信號,并且系統(tǒng)發(fā)育樹也表明TLR1基因樹與物種樹相比,發(fā)生了更多的拓撲結構變化,表明魚類在適應病原微生物的過程中,TLR1、TLR9基因受到不同的選擇機制且TLR1進化更為明顯. 本研究也發(fā)現58%的正選擇位點位于蛋白質重要功能域,并且大多數位于病原體識別區(qū)域亮氨酸重復區(qū)(LRRs),該區(qū)域的進化有利于識別不同病原體PAMP,從而在抗病原免疫過程中發(fā)揮重要作用(圖4). 以上研究結果從進化的角度初步揭示了鱸形目物種先天性免疫基因TLR1、TLR9與病原體的相關性,為物種的疾病防治與預防提供理論依據.