王 智
(陜西學(xué)前師范學(xué)院生物科學(xué)與技術(shù)系,陜西西安710100)
協(xié)同系統(tǒng)發(fā)生(Cophylogeny,orparallel cladogenesis or co-cladogenesis)是研究生態(tài)上相關(guān)群體(如類群、地理區(qū)域,基因等)系統(tǒng)發(fā)生間的關(guān)系,在此,“主”(如有機(jī)體、寄生物的宿主或一個(gè)地區(qū))系統(tǒng)發(fā)生是獨(dú)立的,而“輔”(如基因、寄生物或有機(jī)體)系統(tǒng)發(fā)生在某種程度依賴于“主”系統(tǒng)發(fā)生[1]。兩個(gè)物種的協(xié)同進(jìn)化是協(xié)同系統(tǒng)發(fā)生研究的主要領(lǐng)域之一。使用協(xié)同進(jìn)化這個(gè)術(shù)語(yǔ)時(shí)要區(qū)別協(xié)同趨異(Codivergence)和協(xié)同成種(Cospeciation)。協(xié)同進(jìn)化(Coevolution)指的是兩個(gè)物種內(nèi)或相互作用的種群內(nèi)彼此進(jìn)化變化的一般過(guò)程。協(xié)同趨異指平行分支的進(jìn)化過(guò)程(當(dāng)一個(gè)物種分支為兩個(gè)或多個(gè)物種時(shí))或者說(shuō)一個(gè)生物體實(shí)體的成種導(dǎo)致與此相關(guān)的其它生物體實(shí)體的成種[2]。協(xié)同趨異與協(xié)同成種常常交替使用,一些學(xué)者認(rèn)為協(xié)同趨異是相關(guān)類群分成截然不同的群體的過(guò)程,注重過(guò)程;而協(xié)同成種指的是它們已經(jīng)獨(dú)立進(jìn)化為不同的物種,注重結(jié)果[3]。協(xié)同趨異或協(xié)同成種可以說(shuō)是協(xié)同進(jìn)化的一部分。以宿主——寄生物這種串聯(lián)模式為例,寄生物和宿主能彼此協(xié)同進(jìn)化,相互作用產(chǎn)生新的特征和性狀,如果這些新性狀的差異足夠大,可以形成新種,那么協(xié)同趨異(協(xié)同成種)就會(huì)發(fā)生。協(xié)同系統(tǒng)發(fā)生的研究?jī)?nèi)容就包括分析和比對(duì)生物的系統(tǒng)發(fā)生以揭示協(xié)同趨異的模式[2]。
在對(duì)宿主——寄生物關(guān)系的早期研究中產(chǎn)生了一些主流的關(guān)系規(guī)則,如Farenholz規(guī)則(Farenholz's Rule,1913)、Szidat 規(guī) 則 (Szidat's Rule,1940) 等,F(xiàn)arenholz規(guī)則宣稱寄生物的系統(tǒng)發(fā)生反映了宿主的系統(tǒng)發(fā)生[4]。實(shí)際上,幾乎所有協(xié)同成種的實(shí)例中,除了宿主反常地依靠其協(xié)作者的例子外,很少有遵循Farenholz規(guī)則的。因?yàn)榇艘?guī)則將協(xié)同進(jìn)化的可能性狹窄到只有協(xié)同趨異,而協(xié)同趨異僅僅是協(xié)同系統(tǒng)發(fā)生產(chǎn)生的眾多事件中的一種可能。協(xié)同趨異的模式?jīng)]有絕對(duì)的規(guī)則,因?yàn)閮蓚€(gè)物種不必遵循相同的進(jìn)化路徑。其它四種可能的進(jìn)化情境(Evolution scenario)(見(jiàn)圖1)增加了協(xié)同系統(tǒng)發(fā)生研究模式的復(fù)雜性[5-7]。
第一種情境稱為分類事件(Sorting events),表明似乎是宿主分類時(shí)寄生物不跟隨。這有三種生物學(xué)可能,一是寄生物出現(xiàn)但未被探測(cè)到(稱為x事件);二是被認(rèn)為失掉載體(Missing the boat,MTB),宿主形成新物種而寄生物只跟隨趨異的宿主,從而丟掉了其它的宿主種類。當(dāng)宿主遷移到一新的沒(méi)有寄生物的棲息地形成新物種就會(huì)發(fā)生這種情況;三是寄生物在宿主譜系上滅絕(Drowning on arrival,DOA),宿主與寄生物不再發(fā)生關(guān)聯(lián)。第二種情境稱為宿主轉(zhuǎn)換事件(Host switching events),寄生物寄生于不同于原先宿主譜系的宿主上,繼而開(kāi)拓新宿主的近親為宿主。第三種情境稱為復(fù)制(Duplication)或宿主內(nèi)成種(Intrahost speciation)。寄生物不刺激宿主形成新種,而在進(jìn)化上發(fā)生分歧,兩個(gè)寄生種群分隔進(jìn)入不同的生態(tài)位——可能為避免競(jìng)爭(zhēng),以形成新種而結(jié)束,但仍具相同的宿主。第四種情境稱為惰性(Inertia),即寄生物對(duì)宿主趨異不發(fā)生任何反應(yīng),這種“惰性”導(dǎo)致寄生物具有多個(gè)宿主,從而使得一種寄生物能在不同宿主上存活。不同于“丟失載體”的情形,此種寄生物遵循兩個(gè)以上的趨異宿主,雖然本身并不發(fā)生趨異。
這幾種生物學(xué)進(jìn)化情境為研究宿主——寄生物的協(xié)同系統(tǒng)發(fā)生提供了基礎(chǔ),使用這些生物類別,通過(guò)對(duì)比系統(tǒng)發(fā)生就可以更好地理解協(xié)同進(jìn)化事件,而這些事件導(dǎo)致了現(xiàn)存的物種分類結(jié)構(gòu)。將要討論的協(xié)同系統(tǒng)發(fā)生方法就是使用這些類別來(lái)描述進(jìn)化結(jié)果。關(guān)于協(xié)同系統(tǒng)發(fā)生研究必須要提的一點(diǎn)是假定取樣充分和徹底,除此之外,分類系統(tǒng)的構(gòu)建和每個(gè)物種的系統(tǒng)發(fā)生也假定正確。這些假定是值得注意的,因?yàn)槟强赡軙?huì)對(duì)分析協(xié)同系統(tǒng)發(fā)生有潛在的影響。先前描述的場(chǎng)景是按自然和生物發(fā)生規(guī)律發(fā)生的,人類在取樣和系統(tǒng)發(fā)生上的誤差可能會(huì)增加其他的進(jìn)化情境,從而導(dǎo)致對(duì)協(xié)同系統(tǒng)發(fā)生解釋的不正確或不完全。比如,觀察到的一個(gè)寄生物種離開(kāi)宿主而滅絕可能是生物進(jìn)化的合法結(jié)果或僅僅是不完全取樣的結(jié)果。更重要的是,必須做到物種系統(tǒng)發(fā)生的準(zhǔn)確構(gòu)建以確保隨后對(duì)協(xié)同系統(tǒng)發(fā)生的準(zhǔn)確分析。物種系統(tǒng)發(fā)生的細(xì)小差別都可能產(chǎn)生對(duì)發(fā)生的協(xié)同進(jìn)化情境不正確的描述。
圖1 五種可能的進(jìn)化情境Fig.1 Five possible evolutionary scenarios
協(xié)同系統(tǒng)發(fā)生的研究方法大體分為兩類:“基于事件法”(Event-based methods)和“整體擬合法”(Global-fit methods)[9]。前者試圖結(jié)合四種進(jìn)化情境將寄生物的系統(tǒng)發(fā)生圖做到宿主的系統(tǒng)發(fā)生作圖上。這種作圖可以通過(guò)“基于簡(jiǎn)約特征”(Parsimony-based character)的最優(yōu)化(如布魯克斯簡(jiǎn)約分析(Brooks parsimony analysis,BPA))或協(xié)調(diào)樹(shù)分析(Reconciled tree analysis)(如 TreeMap或TreeFitter)達(dá)到,在系統(tǒng)發(fā)生制圖的不一致可能要?dú)w因于進(jìn)化事件和進(jìn)化情境,因?yàn)樗岢龅倪M(jìn)化情境(通常是幾個(gè))首先是以最優(yōu)性標(biāo)準(zhǔn)為基礎(chǔ)的。相對(duì)地,整體擬合法不提出進(jìn)化情境,而是評(píng)估宿主和寄生物間的整體一致性,并識(shí)別有助于協(xié)同系統(tǒng)發(fā)生構(gòu)建的個(gè)別的宿主——寄生物關(guān)聯(lián)。此種方法中,一致性越高,協(xié)同成種就越普遍。
2.1.1 BPA
BPA是歷史生物地理學(xué)的研究方法之一,最早由D.R.Brooks于1981年提出理論基礎(chǔ),后在1986年被 E.O.Wiley正式命名為 BPA[10-12]。BPA 是一種直接應(yīng)用系統(tǒng)發(fā)育學(xué)原理,結(jié)合生物地理學(xué)知識(shí),探討“種歷史”的方法,它以“替代假說(shuō)”為框架,采用簡(jiǎn)約原則進(jìn)行分析。BPA分析寄生物的系統(tǒng)發(fā)生時(shí),把其轉(zhuǎn)化成一套累積的二進(jìn)制字符,然后經(jīng)由簡(jiǎn)約法繪制到宿主樹(shù)圖上。這些二進(jìn)制碼通過(guò)代表各自身份的所有樹(shù)節(jié)點(diǎn)定義每個(gè)分類單元。使用這些二進(jìn)制碼就可以構(gòu)建主系統(tǒng)發(fā)生圖,然后將宿主系統(tǒng)發(fā)生與獨(dú)立證據(jù)比對(duì),如獨(dú)立識(shí)別的宿主關(guān)系或地理學(xué)和生物地理學(xué)證據(jù)。與基于事件法中的其他方法不同(如協(xié)調(diào)樹(shù)分析)不同,BPA不是基于模型的,因此不會(huì)產(chǎn)生系統(tǒng)發(fā)生像模型那樣的整齊的臆斷,而且它并不試圖將預(yù)先假設(shè)做最大化調(diào)整。但正如Page和其他學(xué)者所說(shuō)[13],BPA由于源于寄生物樹(shù)的字符的非獨(dú)立性,使得其過(guò)多估計(jì)了宿主轉(zhuǎn)化的數(shù)目。
2.1.2 Component
Component即以計(jì)算機(jī)程序Component用于研究系統(tǒng)發(fā)生、樹(shù)形分布、基因樹(shù)(物種樹(shù))、宿主——寄生物的協(xié)同進(jìn)化及生物地理學(xué)等,由 Page發(fā)起[14]。Component并非由數(shù)據(jù)推導(dǎo)得到樹(shù),而是將已存在的樹(shù)導(dǎo)入程序中,通過(guò)幾種樹(shù)對(duì)比法,包括計(jì)算一致性樹(shù)、樹(shù)間的相似度及繪制一個(gè)樹(shù)圖到另一個(gè)上。也許對(duì)于用戶來(lái)說(shuō),組分分析最令人感興趣的是它的作樹(shù)圖能力,它可以將寄生物樹(shù)作圖到宿主樹(shù)上,物種樹(shù)作圖到區(qū)域樹(shù)上,基因樹(shù)作圖到物種樹(shù)上,使兩個(gè)不一致樹(shù)發(fā)生關(guān)聯(lián)。Component運(yùn)行快,界面友好,缺點(diǎn)是不對(duì)由于協(xié)同進(jìn)化事件引起的宿主轉(zhuǎn)換作解釋[15-16]。
2.1.3 協(xié)調(diào)樹(shù)分析(Reconciled tree analysis)
協(xié)調(diào)樹(shù)(Reconciled trees)的概念可追溯至Goodman等人試圖協(xié)調(diào)公認(rèn)的哺乳動(dòng)物進(jìn)化關(guān)系與血紅蛋白基因進(jìn)化關(guān)系的分歧[17]。協(xié)調(diào)樹(shù)分析通過(guò)對(duì)寄生物(或基因、有機(jī)體等“輔”)系統(tǒng)發(fā)生到宿主(或有機(jī)體、地區(qū)等“主”)系統(tǒng)發(fā)生作圖來(lái)推斷哪些進(jìn)化關(guān)系是真實(shí)的,哪些是不適合的,任何不一致的結(jié)果都可以歸于協(xié)同進(jìn)化事件來(lái)協(xié)調(diào)。
協(xié)調(diào)樹(shù)分析也是由Page開(kāi)發(fā),而由Component提供方法,它假定宿主的協(xié)同者有足夠多的復(fù)制和缺失(滅絕、非樣本類群)對(duì)于協(xié)同樹(shù)完全適合宿主樹(shù)的關(guān)系是必須的。宿主樹(shù)要和協(xié)調(diào)過(guò)的協(xié)同樹(shù)適合,可以通過(guò)三種不同方法達(dá)到:復(fù)制數(shù)目、增加的節(jié)點(diǎn)數(shù)目和獨(dú)立缺失的數(shù)目。宿主樹(shù)和其協(xié)同樹(shù)的相似度可以通過(guò)Component的隨機(jī)樹(shù)發(fā)生器產(chǎn)生大量的隨機(jī)樹(shù)而統(tǒng)計(jì)測(cè)定。最初的協(xié)同樹(shù)從而得以和每個(gè)隨機(jī)樹(shù)協(xié)調(diào),對(duì)三種適合方法產(chǎn)生一個(gè)評(píng)估可能性分布[18-19]。但Page承認(rèn),協(xié)調(diào)樹(shù)分析經(jīng)常產(chǎn)生一些非現(xiàn)實(shí)的協(xié)調(diào)協(xié)同樹(shù)。
2.1.3.1 TreeFitter
對(duì)于宿主——寄生物系統(tǒng)圖的協(xié)調(diào)經(jīng)常產(chǎn)生多種可能的關(guān)系,這就使得很難確定哪種才代表真實(shí)的關(guān)系。TreeFitter是第一個(gè)把事件——代價(jià)(Events-cost)分析組合到基于簡(jiǎn)約的程序。它采取隨意的代價(jià)分配使得復(fù)制、歸類和宿主轉(zhuǎn)換事件有零或正相關(guān)。協(xié)同趨異事件可能有正、負(fù)或零代價(jià)。這種事件——代價(jià)分配系統(tǒng)允許協(xié)調(diào)樹(shù)分析法首次回復(fù)到更可能的代表實(shí)際的系統(tǒng)發(fā)生關(guān)系[20]。
2.1.3.2 TreeMap
協(xié)調(diào)樹(shù)分析中下一個(gè)主要的發(fā)展就是由Page開(kāi)發(fā)的TreeMap,TreeMap是執(zhí)行系統(tǒng)發(fā)生作圖的一個(gè)Mac程序,由Component派生的,這個(gè)程序的主要更新是將宿主轉(zhuǎn)換事件作為宿主——寄生物系統(tǒng)發(fā)生不一致的可能解釋。當(dāng)前通用的TreeMap2.02在程序中增加了許多特征,其中一個(gè)重要的就是Jungle運(yùn)算法則,以解釋以往程序分析時(shí)的中斷。另一重要特征是用戶可以為回歸可行的重建設(shè)置限制,比如可以指定宿主轉(zhuǎn)換事件的最大數(shù)目,以消除某些不可能發(fā)生的生物學(xué)重建情境[13,19]。
如前所述,整體擬合法不像基于事件法那樣提出進(jìn)化情境,實(shí)際上,它們使用統(tǒng)計(jì)方法評(píng)價(jià)宿主和寄生物間系統(tǒng)發(fā)生的一致性程度,確定有助于協(xié)同系統(tǒng)發(fā)生的特定關(guān)聯(lián)。整體擬合法重要的一點(diǎn)是將最初系統(tǒng)發(fā)生重建時(shí)誤差率考慮得較為充分,使用一個(gè)分隔的一致性檢驗(yàn)計(jì)算了有關(guān)的不正確的系統(tǒng)發(fā)生概率。而基于事件法的臆斷是建立在將要分析的系統(tǒng)發(fā)生樹(shù)是完全而準(zhǔn)確的基礎(chǔ)上的。某些簡(jiǎn)單的一致性檢驗(yàn)包括K-H檢驗(yàn)(Kishino-hasegawa test,KH test)和不一致性長(zhǎng)度差異檢驗(yàn)(Incongruence-length difference test,ILD test)。前者估算不同樹(shù)形圖概似值的方差,后者重點(diǎn)評(píng)價(jià)各種來(lái)源的DNA序列(所研究的宿主和寄生物)系統(tǒng)發(fā)生的一致性。
2.2.1 最大似然法(Maximum likelihood)
Huelsenbec等人[21]提出了兩種不同的零假說(shuō),以驗(yàn)證檢查是否宿主和寄生物系統(tǒng)發(fā)生是同一的。第一種方法即最大似然法,使用概率比驗(yàn)證,以評(píng)估同一和不同一的程度。第二種方法即最大事后概率法,使用貝葉斯推論(Bayesian inference)直接計(jì)算宿主和寄生物系統(tǒng)發(fā)生的事后概率。
2.2.2 ParaFit
ParaFit是最新的協(xié)同系統(tǒng)發(fā)生數(shù)據(jù)檢驗(yàn),由Legendre開(kāi)發(fā)[22]。ParaFit不是要將協(xié)同成種最大化,而是在觀察協(xié)同成種時(shí)相當(dāng)保守(第一類錯(cuò)誤足夠,第二類錯(cuò)誤相當(dāng)?shù)?,而且,它也不是要重建協(xié)同趨異情境。ParaFit用一個(gè)置換檢驗(yàn)協(xié)同趨異評(píng)價(jià)宿主——寄生物協(xié)同進(jìn)化的整體假說(shuō),它使用三種類型的信息來(lái)描述矩陣式情形:寄生物系統(tǒng)發(fā)生、宿主系統(tǒng)發(fā)生和一套可觀測(cè)到的宿主——寄生物關(guān)聯(lián)。除了評(píng)價(jià)宿主——寄生物協(xié)同進(jìn)化的一致性水平,ParaFit還標(biāo)記每個(gè)宿主——寄生物關(guān)聯(lián),可用于以后更多特定的研究。
協(xié)同系統(tǒng)發(fā)生方法不僅影響研究宿主——寄生物關(guān)系,而且影響許多類似關(guān)系,如病毒與人類的協(xié)同進(jìn)化關(guān)系,可能會(huì)對(duì)醫(yī)學(xué)研究提供某些思路,這些方法越過(guò)各物種對(duì)比基因的差異來(lái)理解蛋白質(zhì)組的進(jìn)化,可以更好理解所有有機(jī)體功能。協(xié)同系統(tǒng)發(fā)生方法也和生物地理領(lǐng)域相關(guān),可以更好理解生物到達(dá)的不同地理區(qū)域的物種進(jìn)化。
總之,每種方法論都有其利弊,因此必須經(jīng)過(guò)權(quán)衡,選擇最優(yōu)方法?;诤?jiǎn)約字符的最優(yōu)化方法對(duì)于分析來(lái)說(shuō)好而簡(jiǎn)單,雖然它忽視了某些協(xié)同進(jìn)化場(chǎng)景情境;基于事件法似乎最具邏輯性,幾乎把所有可能的進(jìn)化路徑都考慮了,但是在一個(gè)給定分析中,過(guò)多的結(jié)果很難篩選,也很難發(fā)現(xiàn)真正的關(guān)系。這兩種方法都沒(méi)有考慮潛在的系統(tǒng)發(fā)生取樣和重建誤差。整體擬合法統(tǒng)計(jì)不僅考慮系統(tǒng)發(fā)生的誤差,還提供較好的關(guān)系一致性,但缺乏聯(lián)系協(xié)同進(jìn)化情境??偟膩?lái)說(shuō),改善每種方法都還有較大空間,如果能組合其優(yōu)點(diǎn),屏其弊端,那么研究協(xié)同系統(tǒng)發(fā)育關(guān)系將會(huì)受益更多。
References)
[1] CHARLESTON M A.Principles of cophylogenetic maps[C]//L?ssig M,Valleriani A.Biological Evolution and Statistical Physics .Berlin:Springer-Verlag,2002:122-147.
[2] CHARLESTON M A,PERKINS S L.Traversing the Tangle:Algorithms and Applications for Cophylogenetic Studies[J].Journal of Biomedical Informatics,2006,39(1):62-71.
[3] LIGHT J E,HAFNER M S.Codivergence in heteromyid rodents(Rodentia:heteromyidae)and their sucking lice of the genus Fahrenholzia(Phthiraptera:anoplura) [J].Systematic Biology,2008,57(3):449-465.
[4] FAHRENHOLZ H.Ectoparasiten und Abstammungslehre[J].Zoologischer Anzeiger,1913(41):371-374.
[5] PAGE R D M.Parallel phylogenies:reconstructing the history of host-parasite assemblages [J]. Cladistics,1994,10(2):155-173.
[6] PATERSON A M,PALMA R L,GRAY R D.How frequently do avian Lice miss the boat Implacations for coevolutionary studies [J].Systematic Biology,1999,48(1):214-233.
[7] PATERSON A M,GRAY R D. Host-parasitecospeciation,host switching and missing the boat[C]//Clayton-DH,Moore J.Host-Parasite Evolution:General Principles and Avian Models.Oxford:Oxford University Press,1997:236-50.
[8] PATERSON A M,BANKS J.Analytical approaches to measuring cospeciation of host and parasites:through a glass,darkly [J].International Journal for Parasitology,2001,31(9):1012-1022.
[9] DESDEVISES Y.Cophylogeny:insights from fish-parasite systems[J].Parassitologia,2007,49(3):125-128.
[10] BROOKS D R.Hennig's Parasitological Method:A Proposed Solution.[J].Systematics Biology ,1981,30(3):229-249.
[11] BROOKS D R.Historical ecology:a new approach to studying the evolution of ecological associations [J].Annals of the Missouri Botanical Garden,1985,72(4):660-680.
[12] WILEY E O.Methods in vicariance biogeography[C]//Hovenkamp PH,et al.Systematics and Evolution:A Matter ofDiversity.Utrecht:Institute ofSystematic Botany,Utrecht University,1986:83-306.
[13] PAGE R D M.Parallel phylogenies:reconstructing the history of host-parasite assemblages [J]. Cladistics,1994,10(2):155-173.
[14] PAGE R D M.Component:Tree comparison software for Microsoft Windows,version 2.0.London:The Natural History Museum,1993.
[15] SLOWINSKI J B. Review of the computer program Component[J].Cladistics,1993,9(3):351-353.
[16] CHARLESTON M A.Jungles:A new solution to the host/parasite phylogeny reconciliation Problem [J].Mathematical Biosciences,1998,149(2):191-223.
[17] GOODMAN M,CZELUSNIAK J,MOORE G W,et al.Fitting the gene lineage into its species lineage: a parsimony strategy illustrated by cladograms constructed from globin sequences[J].Systematic Biology,1979,28(2):132-168.
[18] PAGE R D M,CHARLESTON M A.From Gene to Organismal Phylogeny:Reconciled Trees and the Gene Tree/Species Tree Problem [J].Molecular Phylogenetic Evolution,1997,7(2):231-240.
[19]PAGE R D M.Maps between trees and cladistic analysis of historical associations among genes,organisms,and areas[J].Systematic Biology,1994,43(1):58-77.
[20] RONQUIST F.Reconstructing the history of host-parasite associations using generalised parsimony[J].Cladistics,1995,11(1):73-89.
[21] HUELSENBECK J P,CRANDALL K A.Phylogeny Estimation and Hypothesis Testing Using Maximum Likelihood[J].Annual Review of Ecology and Systematics,1997 ,28:437-466.
[22] LEGENDRE P,DESDEVISES Y,BAZIN E.A statistical Testfor Host-Parasite Coevolution [J].Systematic Biology,2002,51(2):217-234.