譚鑫鑫,李 明
(1. 中國科學院動物研究所 動物生態(tài)與保護生物學重點實驗室,北京 100101;2. 中國科學院大學,北京 100049)
生物多樣性(biological diversity)是人類生存的物質(zhì)基礎(chǔ),而全球生物多樣性正以驚人的速度不斷喪失[1].保護生物學(conservation biology)是研究如何保護生物及其生存環(huán)境,從而保護生物多樣性的科學[2].保護生物學發(fā)展迅速并形成許多分支學科,涉及生物學研究的不同領(lǐng)域,例如保護生態(tài)學、保護行為學、保護生理學、保護遺傳學等[3].近年來,由于高通量測序技術(shù)的發(fā)展,使得保護生物學面臨著新的挑戰(zhàn)和機遇:即如何將大規(guī)?;蚪M數(shù)據(jù)技術(shù)有效地整合到保護生物學的應(yīng)用之中,實現(xiàn)從保護遺傳學到保護基因組學的轉(zhuǎn)變?
保護遺傳學(conservation genetics)是指利用遺傳數(shù)據(jù)和研究來指導生物多樣性保護和物種及種群管理的學科[4],其研究包括遺傳多樣性量化、物種鑒定、親緣關(guān)系鑒定、歷史動態(tài)追溯、有效種群大小的監(jiān)測管理、種群結(jié)構(gòu)和生境適應(yīng)的探究等內(nèi)容[5-18].隨著遺傳標記的不斷發(fā)展,保護遺傳學研究逐漸成為保護瀕危物種的重要手段,相關(guān)報道也逐年穩(wěn)定增加[6].在過去的幾十年里,保護遺傳學已經(jīng)從基于理論的種群生物學發(fā)展為一個成熟的、有積累的學科[19].
作為保護遺傳學研究中的重要工具,遺傳標記經(jīng)歷了多次的變革,推動了保護遺傳學的發(fā)展.同工酶(allozyme)是最早的遺傳標記[20],它的出現(xiàn)可以使研究者基于多個位點對任意物種進行遺傳變異的檢測和比較[21].隨著分子標記種類的增多,保護遺傳學研究早期使用的同工酶標記被逐步取代[19].在動物類群中,應(yīng)用較為廣泛的分子標記有微衛(wèi)星(microsatellite)、線粒體DNA(mitochondrial DNA,簡稱mtDNA)、擴增片段長度多態(tài)性(amplified fragment length polymorphisms, 簡稱AFLPs)和單核苷酸多態(tài)位點(Single nucleotide polymorphisms, 簡稱SNPs)等.單一的遺傳標記不能適用于所有的分析,每一種標記的效用需要根據(jù)其技術(shù)原理、成本、時間、實驗樣本的數(shù)量和類型以及研究的具體問題來確定.例如:微衛(wèi)星標記(又被稱為短串聯(lián)重復,short tandem repeats, 簡稱STRs,一般由2~6 bp重復出現(xiàn)的DNA組成)廣泛地應(yīng)用于遺傳漂變、基因流、有效種群大小等分析中;而線粒體DNA序列作為一種母系遺傳的分子標記,常被用于重建物種的系統(tǒng)發(fā)育關(guān)系[22-24].
經(jīng)過近幾十年的發(fā)展,保護遺傳學取得了長足進展.保護遺傳學基于一些中性的遺傳標記,利用有效的研究方法來進行種群動態(tài)、基因流、有效種群大小、種群遺傳結(jié)構(gòu)的評估,取得了諸多進展[7-10].通過分析分子標記所帶來的數(shù)據(jù),掌握種群當前和過去狀態(tài)的多種信息,是指導和實施管理策略來緩解瀕危風險的依據(jù).另外,保護遺傳學不僅為保護生物學中的相關(guān)問題提供了新的見解,對進化生物學的其他領(lǐng)域同樣具有重要作用.通過近幾十年來分子標記的大規(guī)模的應(yīng)用,已經(jīng)積累并產(chǎn)生了一個巨大且不斷增加的數(shù)據(jù)庫,為生物學研究提供了相關(guān)資源和基礎(chǔ).
盡管保護遺傳學目前已經(jīng)取得了很多成就,但仍有許多局限性,尚不能有效地解決保護生物學中的所有問題.首先,保護遺傳學中使用分子標記的數(shù)量相對較少,例如一般的研究中常用十幾個微衛(wèi)星標記或者是幾百個AFLPs位點,這些標記只有幾千個核苷酸位點,分散在基因組的不同部位,覆蓋基因組的極小一部分,限制了其在基因組范圍估算參數(shù)的能力.因此,這樣的分子標記數(shù)量尚不足以代表基因組水平的研究結(jié)果[25].其次,基于一種標記無法對瀕危物種的所有問題進行全面研究,不同分子標記類型的應(yīng)用正變得更加專業(yè)化,更適合處理特定類型的問題.另外,保護遺傳學不一定適用于對環(huán)境適應(yīng)性的研究[26].由于保護遺傳學中用到的分子標記大多數(shù)是利用基因組中的中性位點,這些中性標記可能無法準確地反映出自然種群的基因組遺傳多樣性[27],也無法將環(huán)境適應(yīng)性和具體的基因功能相聯(lián)系.將基因組技術(shù)應(yīng)用到保護生物學是目前研究適應(yīng)性的有效方法和當務(wù)之急[26,28].
基因組測序技術(shù)可以在短時間內(nèi),對成千上萬的位點進行大規(guī)模測序,得到非常高的標記密度.隨著基因組測序技術(shù)在保護生物學中的廣泛應(yīng)用,為保護生物學帶來了更大的發(fā)展?jié)摿Γ诖吮尘跋卤Wo基因組學(conservation genomics)應(yīng)運而生[4].與保護遺傳學相比,保護基因組學具有諸多優(yōu)勢,在很大程度上克服了保護遺傳學的局限性,有助于解決保護生物學中一些懸而未解的問題.
首先,全基因組測序可以實現(xiàn)基因組范圍的標記篩選,得到數(shù)以萬計的高密度分子標記,因此在此基礎(chǔ)上對種群的各種參數(shù)的評估更具代表性,例如對個體雜合度、遺傳距離、基因流、種群增長、種群遺傳結(jié)構(gòu)等的統(tǒng)計[19].基因組測序還可以得到物種之間、種群之間以及種群內(nèi)部特有的分子標記,使得研究種群內(nèi)部、種群之間的基因組水平的遺傳變異成為可能.
其次,基因組測序技術(shù)的不斷發(fā)展使得分子標記的種類也越來越豐富,除了單核苷酸多態(tài)性位點外,全基因組測序還可以檢測到小片段的插入和缺失(insert and deletion)、大片段的結(jié)構(gòu)變異(structure variation)以及基因拷貝數(shù)變異(copy number variation)等,為新方法的探索提供了必要的基礎(chǔ).
第三,基因組測序技術(shù)為研究環(huán)境適應(yīng)性的機制提供了可能性[25],基因組測序能夠提供高密度的各類分子標記,極大地提高選擇性以及適應(yīng)性等方面的檢測能力.借助于基因注釋,基因組測序技術(shù)還可以實現(xiàn)對分子標記的分類、區(qū)分出編碼區(qū)的功能標記和基因間區(qū)的中性標記,將適應(yīng)性變異和具體的基因相結(jié)合,以探索分子標記與瀕危物種的特殊表型、生活習性之間的關(guān)系,增強我們對環(huán)境和基因如何相互作用來影響表現(xiàn)型和適應(yīng)性的了解.
研究人員根據(jù)目標物種是否有參考基因組可選擇基因組從頭測序(Denovosequencing)或基因組重測序(resequencing).Denovo測序是指對生物進行第一次的基因組拼裝,其組裝效果依賴于基因組的大小和復雜程度.而基因組重測序則是在已經(jīng)有參考基因組的前提下,對物種進行個體或者群體的測序分析,重測序法受到有無參考基因組的限制.
目前,除了全基因組測序外,簡化基因組測序也常被應(yīng)用于保護生物學的相關(guān)研究中.例如,RAD測序(restriction site associate DNA sequencing, 簡稱RAD-seq)就是一種常見的簡化基因組測序技術(shù)[29],它只是針對限制性酶切位點附近的序列進行測序,用于SNP分子標記的檢測.RAD不受參考基因組的限制,性價比較高,適合進行群體分析,鑒定不同種群的遺傳結(jié)構(gòu).除此之外,RNA測序和外顯子測序也可視為簡化基因組測序的范疇[30-31].
基因組學技術(shù)和方法已經(jīng)在生態(tài)學、進化生物學等方面得到了非常廣泛的應(yīng)用,近年來大量瀕危物種的基因組相繼被報道.盡管有些報道并未探討具體的物種保護問題,但其基因組數(shù)據(jù)資源的積累,為日后的保護生物學研究奠定了基礎(chǔ),利用基因組學的方法和技術(shù)解決物種保護問題的研究也逐漸增多.
物種是最基礎(chǔ)的分類單元,保護計劃的成功實施在很大程度上依賴于對保護目標的分類地位的正確識別,還要避免將不同種、不同來源的種群聚在一起.全基因組數(shù)據(jù)包含了一個物種的幾乎全部遺傳信息,通過全基因組信息來重建系統(tǒng)發(fā)育樹更具說服力,而利用基因組數(shù)據(jù)來確定種群遺傳結(jié)構(gòu)在很多瀕危物種中也得到了應(yīng)用.基因組技術(shù)可以更有效地解決保護生物學中傳統(tǒng)標記解決不了的爭議.
例如,金絲猴(仰鼻猴屬,Rhinopithecus)是分布在亞洲的一類瀕危靈長類.仰鼻猴屬內(nèi)的系統(tǒng)發(fā)育關(guān)系曾經(jīng)存在較多爭議.Zhou 等[32]通過Denovo測序并組裝了一只雄性的川金絲猴(R.roxellana)的基因組,將其與另外3種金絲猴(R.bieti,R.brelichi和R.strykeri)進行全基因組比較分析,解析了4種金絲猴的遺傳多樣性,并重建了仰鼻猴屬內(nèi)的進化歷史.繼首次完成川金絲猴基因組的Denovo測序后,Zhou 等[33]對來自金絲猴屬內(nèi)的4個物種共38個個體進行了全基因組重測序和群體基因組學分析,通過系統(tǒng)發(fā)育重建和遺傳結(jié)構(gòu)分析顯示在川金絲猴中主要有兩個遺傳簇,各自對應(yīng)于兩個獨立的遺傳管理單元.
長江江豚(Neophocaenaasiaeorientalis)僅分布于長江中下游,是全世界唯一的江豚淡水種群,也是生物多樣性和水生生態(tài)系統(tǒng)保護的新旗艦物種.由于長江江豚的生境被破壞,其種群數(shù)量在逐年降低[34],進一步加強對該物種的保護將具有極為特殊的必要性.傳統(tǒng)的研究中,江豚(N.phocaenoides)被定義為了單一的種,而基于線粒體DNA和形態(tài)學標記對江豚亞種的分類存在較多爭議,有研究將其分為3個亞種(N.p.phocaenoides,N.p.asiaeorientalis和N.p.sunameri)[35-36],而有研究又支持2個種的假說(N.phocaenoides和N.asiaeorientalis)[37].通過對江豚的Denovo測序和不同地理分布區(qū)個體的全基因組群體重測序分析,確定將江豚分為3個種:N.phocaenoides,N.asiaeorientalis和N.sunameri.通過種群基因組學分析發(fā)現(xiàn),3種江豚現(xiàn)在已有顯著遺傳分化,并且在幾千年的時間里都沒有發(fā)生基因交流[38].
中國大鯢(Andriasdavidianus)俗稱“娃娃魚”,是中國特有的珍稀野生動物,也是世界上現(xiàn)存的兩棲類中體型最大者.中國大鯢的基因組約有50 G,組裝難度極大,成本較高,不適合進行Denovo測序.研究人員選擇了簡化基因組的方法,對中國大鯢的野生種群開展了種群遺傳學分析[39].基因組分析與線粒體基因分析的結(jié)合意外發(fā)現(xiàn),中國大鯢并非單一物種,其名下至少隱藏有5個不同種.這5個物種的分布地與水系分布相關(guān),大致對應(yīng)黃河、長江、珠江、錢塘江等水系流域.
上述研究表明,保護基因組學可以清晰重建系統(tǒng)發(fā)育關(guān)系,確定種群遺傳結(jié)構(gòu),使傳統(tǒng)方法中存在爭議的諸多問題得到有效解決,對保護生物學具有重要意義.
種群歷史動態(tài)的研究內(nèi)容包括瓶頸、遷徙模式、擴散和歷史有效種群大小的評估等,在保護生物學中具有重要的意義.將現(xiàn)生種群的基因組與進化歷史結(jié)合起來,有助于了解過去的歷史事件及其對現(xiàn)生種群的基因組背景的影響,以應(yīng)對保護管理中的各種挑戰(zhàn).
例如,樹袋熊(Phascolarctoscinereus)是唯一現(xiàn)存的有袋類動物,由于棲息地的喪失和其易感染疾病的特點,樹袋熊被列為瀕危物種.2018年,研究人員利用基因組測序技術(shù)組裝得到完整的樹袋熊基因組[40],再利用順序配對馬爾可夫溯祖模型(PSMC)對樹袋熊進行歷史動態(tài)的模擬,發(fā)現(xiàn)位于兩個地理分布區(qū)的樹袋熊PSMC模擬結(jié)果不一致.這預(yù)示著在樹袋熊群體中存在著地區(qū)的差異,群體之間基因交流可能存在阻礙.這種區(qū)域的差異在之前基于線粒體進行的保護遺傳學分析中也有相關(guān)報道[41-42].歷史動態(tài)分析的結(jié)果表明,樹袋熊種群數(shù)量的大量降低與澳大利亞巨型動物的數(shù)量下降一致,而且現(xiàn)生的種群中存在生物地理界限.由此可見,基因組技術(shù)在保護生物學中的應(yīng)用,可以為保護管理策略提供科學的依據(jù).研究人員可以將這些研究成果應(yīng)用于樹袋熊的保護管理,以幫助樹袋熊在野外生存.
Zhao等[43]在2013年對34只大熊貓(Ailuropodamelanoleuca)進行種群基因組學分析.利用PSMC重塑了大熊貓從1萬年前到80萬年前的種群大小波動過程.此外,基于多個種群之間的聯(lián)合頻譜(allele frequency spectrum,簡稱AFS),通過擴散逼近的方法(diffusion approximation)模擬了大熊貓的3個種群近期的種群歷史.在此分析過程中,共鑒定到了2次種群擴張、2次瓶頸效應(yīng)以及2次分化過程,并推斷出了大熊貓種群數(shù)量在過去的3 000年里下降的原因可能是人類活動造成的.
以上的研究說明了全基因組數(shù)據(jù)如何促進對歷史有效種群波動的推斷和歷史動態(tài)事件的追蹤.基于全基因組數(shù)據(jù)的模擬可以提高對種群歷史動態(tài)和有效種群大小的模擬精確度,而這些事件可以幫助研究人員更好地理解現(xiàn)生種群的遺傳多樣性和種群遺傳結(jié)構(gòu),制定更有效的保護策略.
對支持物種適應(yīng)特定生境條件的基因組區(qū)域的識別是進化生物學的研究熱點之一,也是保護生物學中功能性保護的重要基礎(chǔ).這些信息可以告訴管理者,將相對受威脅的種群轉(zhuǎn)移到其他地方是否為一種可行的保護策略.全基因組掃描是確定與生境適應(yīng)性相關(guān)的位點和基因組區(qū)域的有效方法,借助于基因注釋結(jié)果,可以確定與這些區(qū)域關(guān)聯(lián)的適應(yīng)性基因的功能,在一系列的環(huán)境條件下將表型與基因相關(guān)聯(lián).
獼猴(Macacamulatta)是我國的II級保護動物.作為分布最廣泛的非人靈長類動物,獼猴的棲息地具有較大的多樣性,它們成了研究靈長類動物對不同氣候局部適應(yīng)的重要研究對象[44].此外,獼猴在生理、心理、認知等研究中也具有重要的應(yīng)用價值.因此,保護獼猴的生物多樣性對多方面的研究都意義非凡.Liu等[45]利用種群基因組學的方法,在重建中國獼猴的種群遺傳結(jié)構(gòu)和種群歷史動態(tài)的基礎(chǔ)上,通過全基因組范圍的掃描檢測了不同亞種對極端環(huán)境的適應(yīng)機制.分布于最北的寒冷氣候下的獼猴華北亞種(M.m.tcheliensis)和分布于最南部熱帶島嶼上的海南亞種(M.m.brevicaudus)的體型變化完全符合貝格曼規(guī)則,即華北亞種比海南亞種的體型更大[46].檢測發(fā)現(xiàn)華北亞種和海南亞種中與骨骼的生長和發(fā)育相關(guān)的基因受到選擇,這些基因可能和其體型大小相關(guān),代表了靈長類動物適應(yīng)不同氣候環(huán)境的一種新機制.此外,華北亞種的棲息地在冬季和早春時節(jié),氣候寒冷、食物匱乏,檢測過程中發(fā)現(xiàn)在華北亞種中,F(xiàn)BP1、FBP2基因受到正選擇.這2個基因所編碼的蛋白質(zhì)在糖異生過程中有重要作用,它們可能是華北亞種在食物短缺的情況下維持血糖穩(wěn)定的重要因素.
江豚(Neophocaena)同時分布在海水和淡水中,為了確定江豚對于咸淡水生境的適應(yīng)機制,研究人員對生活在海水和淡水的兩個種進行了全基因組掃描,鑒定得到一系列與滲透調(diào)節(jié)相關(guān)的基因.例如,與腎臟水穩(wěn)態(tài)、加壓素調(diào)節(jié)的水重吸收、尿素的轉(zhuǎn)運等有關(guān)的基因ADCY1、DYNC2H1和SLC14A2,以及與腎素-血管緊張素系統(tǒng)功能相關(guān)基因ACE2等[38].這預(yù)示著長江江豚已經(jīng)對不同于海洋的淡水環(huán)境產(chǎn)生了適應(yīng)性進化,在長江江豚與海洋江豚之間可能已經(jīng)出現(xiàn)了生殖隔離和物種的分化[38].
以上列舉的研究說明了基于全基因組數(shù)據(jù)可以將生物表型、環(huán)境和具體基因相結(jié)合,以檢測目標物種的適應(yīng)性進化,為制定合理有效的保護策略提供科學依據(jù).
近十多年來基因組測序技術(shù)的發(fā)展,被認為是解決保護生物學難題的契機.高通量測序技術(shù)給保護學者帶來很多便利,但也有其自身的局限性.首先,相比傳統(tǒng)的保護遺傳學,保護基因組學的測序技術(shù)難度較高,成本較大.其次,高通量測序技術(shù)對樣品的質(zhì)量要求較高,而瀕危物種的樣品采集難度大,很難保證用于保護基因組學分析的樣品數(shù)量.第三,基于全基因組測序得到的分子標記數(shù)量較多,而現(xiàn)有的一些算法多是基于傳統(tǒng)的少數(shù)分子標記開發(fā)的,應(yīng)用到基因組范圍將需要超長的運算時間.第四,基因注釋的準確性仍然是一個挑戰(zhàn),尤其是對于缺乏詳細的轉(zhuǎn)錄組數(shù)據(jù)的非模式生物,準確度不高的基因組注釋結(jié)果將直接影響到環(huán)境適應(yīng)性相關(guān)的功能基因的分析結(jié)果.
像任何新興領(lǐng)域一樣,保護基因組學也不得不面對上述挑戰(zhàn)和限制.目前,雖然沒有某種全基因組測序的檢測方法能夠滿足保護生物學的全部需要,而且分析方法都有各自的局限性.但是,隨著高通量測序技術(shù)的發(fā)展以及各種算法的優(yōu)化,以上的各種局限將會被逐一克服.可以設(shè)想,在不久的未來,全基因組分析必將為保護生物學研究提供最重要和最有效的基礎(chǔ).
* * * * * *
致謝:中國科學院動物研究所靈長類生態(tài)學研究組劉志瑾博士和周旭明博士對該論文提出寶貴的修改意見,在此一并感謝!