胡曉鐘, 趙 研, 2, 黃 潔,3, 高 鳳, 高 珊, 邵 晨,4, 宋微波**
(1. 中國海洋大學海洋生物多樣性與進化研究所,山東 青島 266003; 2. 首都師范大學生命科學學院,北京 100048; 3. 中國科學院水生生物研究所水生生物多樣性與保護重點實驗室, 湖北 武漢 430072; 4. 西安交通大學生命科學與技術學院,陜西 西安 710049)
在超過10億年漫長的動物演化中,處于真核生物起源階段的原生動物歷經一次次分化和演化,形成了多樣性極高的一類極具代表性的單細胞真核生物。其中的纖毛蟲類群,在生殖方式(獨特的接合生殖)、雙態(tài)核型(分司不同功能的大、小核)、極端多樣化的細胞發(fā)生模式等方面都代表了真核生物細胞分化與進化的最高階段,已成為細胞學、生理學、遺傳學等多個領域研究的模型生物。因此,圍繞纖毛蟲基礎生物學的研究,已成為當今國際原生動物學領域中最活躍的一個分支。纖毛蟲作為水體微食物網的核心組分,在物質循環(huán)、能量流動和水環(huán)境健康維護中發(fā)揮著重要作用[1-5]。此外,很多兼性和專性寄生、棲生類群又常因構成養(yǎng)殖動物的病害等成為產業(yè)的防范對象[6]。因此,以纖毛蟲為對象的研究一直是國際上基礎生物學和相關應用學科所關注的重要熱點之一。
然而,由于諸多原因,在中國以海洋纖毛蟲為核心的基礎生物學研究長期以來十分欠缺,特別是有關物種-基因水平的多樣性等基本資料構建、與生態(tài)學、環(huán)境生物學、病害學、圍繞模式種所開展的適應與進化、共生機制形成、與環(huán)境耦合的群落結構與動態(tài)變化等研究,普遍處于程度不同的缺位狀態(tài)。而基于分子技術等現代手段的纖毛蟲學研究起于20世紀后葉,先天不足加上缺乏系統(tǒng)的投入和有傳承的推進,使得在我國以纖毛蟲學為核心的現代原生動物學研究與國際水平曾長期處于距離越拉越大的趨勢。
這一現象直到21世紀初才有了根本改觀:借助于國家自然科學基金、多項重大基金以及國際合作項目的連續(xù)支持,在以作者所在團隊為核心的研究隊伍以及合作者們的不懈努力下,中國的纖毛蟲學研究(特別在海洋領域)在多個分支中實現了從追趕、并跑、再到領跑的變化。在這個研究探索、隊伍建設和發(fā)展過程中,以OUC(中國海洋大學)為符號的原生動物學研究室已發(fā)展成為國際上本領域內為數不多的旗艦級研究中心之一,形成了我們的突出特色和集團優(yōu)勢,并在多樣性、細胞學等傳統(tǒng)強項健康發(fā)展的同時,以纖毛蟲為模式的表觀遺傳學、組學、纖毛蟲大小核間的基因進化等領域也逐漸形成了我們的新拓展和新增長點,為未來纖毛蟲基礎生物學領域的研究奠定了重要基礎、開啟了新篇章。
傳統(tǒng)的纖毛蟲物種多樣性研究主要限于歐洲與北美地區(qū),沿海則包括大西洋兩岸、地中海及太平洋的東岸。而在整個西太平洋和東亞地區(qū),有關纖毛蟲的系統(tǒng)、專業(yè)級的研究普遍空缺或粗淺,大多數類群均缺乏了解、不明或不詳,因此,基本的家底信息長期不明[1]。
在過去的30年中,作者團隊及合作者先后開展了下列多樣性工作:(1)圍繞我國的黃渤海和南海近岸水域以及以紅樹林為核心的濕地纖毛蟲,完成了對其區(qū)系、物種多樣性的系統(tǒng)、全面的調查研究,形成了中國首份海洋纖毛蟲原生動物的專業(yè)級家底信息(見圖1)[1,6-13];(2)作為基因多樣性研究的重要內容,我們構建了全球最大的海洋纖毛蟲的遺傳資料(包括1 700余種-種群的DNA)信息庫,同步完成了對相關種類18SrRNA等基因的測序,進而構成了GenBank中有關資料的重要組成(見表1);(3)完成了對海水養(yǎng)殖水體中以危害性纖毛蟲(及魚類寄生粘孢子蟲)為主的病原原生動物分類、病原鑒定、檢索文獻等資料性工作[14];(4)系統(tǒng)開展了有關膠州灣纖毛蟲群落結構與變化、與環(huán)境耦合的生態(tài)響應及生物環(huán)境監(jiān)測技術的探索[15]。
(a 粗壯殼吸管蟲,自陳相瑞等[7];b 寡毛雙眉蟲,自宋微波等[1];c 喇叭蟲(未發(fā)表);d 旋口蟲(未發(fā)表);e, i 聚縮蟲(未發(fā)表); f 卡爾半列蟲,自Luo et al.[10];g 鐘蟲(未發(fā)表);h 海喙蟲(未發(fā)表);j 中縊蟲(未發(fā)表);k 瘦小偏體蟲,自宋微波等[14]; l 中華嗜污蟲,自Pan et al.[11];m 帆口蟲(未發(fā)表); n 擬黃色黃色新尾柱蟲,自Zhang et al.[13];o 扇形游仆蟲(未發(fā)表);p紡錘披巾蟲,自Chen et al.[8];q 縮頸半腹柱蟲(未發(fā)表);r,y 游仆蟲(未發(fā)表);s 美麗異列蟲(未發(fā)表);t杯狀靴纖蟲(未發(fā)表);u 乳突盤毛蟲,自Fan et al.[9];v 擬鈴蟲(未發(fā)表);w夏威夷擬稀毛蟲,自Luo et al.[10];x 多變擬雙列蟲(未發(fā)表);y 游仆蟲(未發(fā)表);z1偽康纖蟲(未發(fā)表);z2清亮阿內格蟲,自Yan et al.[12];z3 真鈴蟲(未發(fā)表)。aAcinetafoetida, from Chen et al.[7]; bDiophrysoligothrix,from Song et al.[1]; cStentorsp. (original); dSpirostomumsp. (original); e,iZoothamniumsp. (original); fHemiholostichakahli, from Luo et al.[10]; gVorticellasp. (original); hRemanellasp. (original); jMesodiniumsp. (original); kDysteriapusilla, from Song et al.[14]; lPhilastersinensis,from Pan et al.[11]; mPleuronemasp. (original); nNeourostylopsisflavaparaflava, from Zhang et al.[13]; oEuplotesvannus(original); pTiarinafusa, from Chen et al.[8]; qHemigastrostylaenigmatica(original); r, yEuplotessp. (original); sAnteholostichapulchra(original); t Cothurnia cyathiforme (original); uDiscotrichapapillifera, from Fan et al.[9]; vTintinnopsissp. (original); wPsilotrichideshawaiiensis, from Luo et al.[10]; xParaistichellavariabilis(original); z1Pseudocohnilembussp. (original); z2Anigsteiniaclarissima, from Yan et al.[12]; z3Eutintinnussp. (original).)
圖1 纖毛蟲原生動物的形態(tài)學與物種多樣性
Fig.1 Species diversity and morphology of ciliated protozoans
表1 作者團隊所完成的主要纖毛蟲類群DNA庫、標記基因及組學數據庫情況Table 1 DNA bank, genome/transcriptome data, and contribution to the GenBank rRNA gene database by authors’ group
Note: ①Ciliate taxa;②Genomic DNA extracted (species/population);③Genome/ transcriptome sequenced;④The number of 18SrRNA;⑤The number of ITS-5.8SrRNA;⑥The number of 28SrRNA;⑦From authors’ group;⑧Proportion of the sequences in GenBank from authors’ group.
這些工作的核心成果包括全面開展了中國溫帶、熱帶海區(qū)資料高度缺乏的40余目級類群自由生纖毛蟲之形態(tài)分類學研究,首次給出了包括纖毛圖式等現代物種鑒定的專業(yè)級資料,完成了對國際間長期不詳、鑒定混亂的大量“半知種類”的重描述、新定義及新模建立、異名清理等大量的各類歷史遺留問題的修訂。成果還包括研究建立了新目、新科、新屬、新種等大量新階元,填補了國際間包括溫帶、熱帶沿岸富營養(yǎng)區(qū)、離岸水體、熱帶紅樹林、河口低鹽區(qū)、砂隙潮間帶等生境中纖毛蟲區(qū)系研究的空白[16-29]。
這是國際范圍內迄今原生動物多樣性領域中堪稱浩大的一項工程:作者所在團隊連續(xù)投入了30年、全視野地覆蓋了溫帶-熱帶沿海海洋纖毛蟲各類群,描繪了多種生境中包括物種、基因、生態(tài)系多樣性的完整版圖,為研究相關類群的起源演化、近岸水體生態(tài)學、微型生物的協(xié)同進化與適應、大尺度下的水環(huán)境變化與原生動物生物地理格局等建立了重要檔案資料和理論依據,也為生物資源及環(huán)境評估與保護、為水產養(yǎng)殖中的病害防治等應用領域提供了一份重要的手冊性資料。
我們在此領域的近期新目標將重點關注迄今尚缺乏研究、兼具“水”“陸”特征和微氣象條件的淡水濕地生態(tài)系統(tǒng)。即圍繞濕地生態(tài)系中纖毛蟲的多樣性、群落結構與時空分布格局等,聚焦該生境中纖毛蟲的物種-基因-生境多樣性、生態(tài)系資料的建立、遺傳信息庫構建以及包括細胞學、基因進化等在內的基礎生物學探討。這項工作的目標和意義在于將完成涉及環(huán)境健康維持、資源開發(fā)與利用、特別是大時空尺度上濕地環(huán)境變遷的跟蹤以及歷史檔案資料的構建,這些要素均為國內外急需面對的科學問題。預期成果將建立和呈現中國淡水濕地生態(tài)系統(tǒng)內纖毛蟲多樣性與生態(tài)學等家底信息的全面、專業(yè)級資訊,填補國內外空白,體現科學研究服務于國家需要這一重要訴求,并有望在新物種發(fā)現、纖毛蟲遺傳信息庫的完善、分子生態(tài)學探索、生態(tài)學時空信息的構建等領域形成一批創(chuàng)新成果,鞏固和擴大我們的學科優(yōu)勢及在領域內的旗艦地位。
纖毛蟲的重要特征之一即為體表的纖毛器發(fā)生了結構和功能上的高度分化和特化。在細胞的分裂過程中通過不同的模式和過程經由原基而逐步發(fā)育為新生細胞的纖毛器,該過程被稱為“細胞發(fā)生”。這一過程本質上反映了細胞結構的分化與去分化,并由此構成了纖毛蟲學中有關“細胞分化”這一重要的科學問題。
鑒于這一背景,纖毛蟲的細胞發(fā)生學研究長期以來是纖毛蟲學和細胞生物學研究的重要分支。該領域研究的主要意義在于:為探討原生動物這一多源發(fā)生體系的系統(tǒng)關系與演化提供理論支持;為親緣種、隱存種的廓清提供發(fā)生學的鑒別特征;為在分子水平上揭示基因調控及相關的機制研究提供背景信息。
近20年來,作者團隊以高度特化的腹毛類纖毛蟲為模式,所完成的個體發(fā)生學研究覆蓋了目前所知的幾乎所有發(fā)生類型,涉及隸屬37科、88屬的150余種的細胞分化模式和過程(見圖2)。這些工作詳細跟蹤報道了無性繁殖行為中的細胞器、皮膜結構及核器的構建過程,刻畫了不同類群的皮層/胞器起源-分化-命運、重要結構的近祖-衍化分析[30]。
(A 自Luo et al.[33];B 自Zhang et al.[13];C 自Jiang et al.[31];D 自Shao et al.[35]。A from Luo et al.[33]; B from Zhang et al.[13]; C from Jiang et al.[31]; D from Shao et al.[35].)
圖2 纖毛蟲原生動物的細胞發(fā)生模式與結構分化
Fig.2 Patterns of morphogenesis in ciliated protozoans
代表性工作包括:(1)對信息殘缺類群完成了發(fā)生模式的修正和補足,進而完善了對游仆蟲屬內發(fā)生模式的刻畫;(2)完整描述了具大-小口型多態(tài)性的瞬膜蟲的生活史;(3)構建了散毛目內背面纖毛器結構的第6種分型:半腹柱蟲型;(4)闡釋了原本系統(tǒng)位置相距甚遠的偽瘦尾蟲屬和圓纖蟲屬同源,二者位于進化末端且發(fā)生背面結構的二次退化;(5)對比尾列蟲屬與瘦尾蟲屬發(fā)生模式的高相似度,界定其均為尾柱目和高等類群散毛目的居間類群,即尾柱目向散毛目進化的過渡態(tài)及關鍵節(jié)點;(6)揭示了偽小雙蟲屬屬內發(fā)生的高度不保守性;(7)通過比對偽角毛蟲屬、趨角蟲屬、偏角毛蟲屬和類角毛蟲屬的多元分析,為揭示偽角毛蟲科的系統(tǒng)演化提供了重要依據[30-36]。
上述成果揭示和描述了包括原腹毛類祖先型“原基滯后分化”、瘦尾蟲“次級背觸毛原基片段化”、獨角蟲背觸毛獨特的“兩組發(fā)生式”、針毛蟲緣棘毛的“尾棘毛發(fā)育模式”和類角毛蟲波動膜原基“多次片段化”等一系列發(fā)生學新現象[30]。
我們同時利用細胞發(fā)生學信息解答了若干長期存疑的系統(tǒng)進化問題,包括證明了凱毛蟲代表了廣義腹毛綱中的1個原始、低等的類群,為確定3個綱-亞綱級類群間真實的演化關系提供了重要的依據,同時綜合發(fā)生學信息建立了1新亞綱-原腹毛亞綱,解答了由上世紀后半葉以來長期存疑的凱毛蟲科系統(tǒng)定位及其與腹毛類和異毛類的系統(tǒng)關系等問題。其次,明確了盤頭類作為一個腹毛類祖先型,代表了介于游仆亞綱和腹毛亞綱之間的居間類群,證明其與腹毛亞綱具有更為接近的親緣關系并應為腹毛亞綱中獨立的側支,并且建立了1個目級新階元-盤頭目,該成果揭示了近40年來懸疑的盤頭類的系統(tǒng)定位及其與腹毛亞綱和游仆亞綱的系統(tǒng)關系等問題[30-36]。
由于纖毛蟲具有極高的物種多樣性、復雜的生活史和十分久遠的進化史,許多“相近階元”的分類學特征或許經歷了趨同、趨異或起源不詳的演化過程。因此,建立在形態(tài)學基礎上的類群間的系統(tǒng)演化關系在諸多類群中均存在著懸疑、不明和爭議,特別是在一些演化鄰接階元信息不明的類群。近年來,這些懸疑和爭議隨著以標記基因序列分析為代表的分子系統(tǒng)學技術的引入而不斷得到澄清或形成新的觀點。
但一個突出的問題構成了新的瓶頸:在國際GenBank信息庫中,太多的纖毛蟲類群因缺乏標記基因信息而導致系統(tǒng)發(fā)育樹構建中形成新的盲區(qū)。此外,信息庫中許多缺乏分類學依據的序列(錯誤鑒定的素材)為系統(tǒng)發(fā)育研究引入了新干擾和新混亂。
在此背景下,我們在開展上述纖毛蟲多樣性研究的過程中,完成了涵蓋了纖毛蟲常見類群的1 400余條核糖體標記基因的測序工作,累計向GenBank數據庫貢獻近20%纖毛蟲的標記基因序列(見表1)。迄今為止,基于標記基因信息對門下13個綱55個目級階元的系統(tǒng)進化關系進行了深層次的梳理和探討,揭示了大量類群的系統(tǒng)進化地位(見圖3)[37-52]。代表性成果包括:(1)建立了兩新綱(Mesodiniea,Protocruziea)[36-37]、一新亞綱(Protohypotrichia)、兩新目(Lynnellida,Discotrichida)[45-47]以及一新亞目(Pseudoamphisiellina)[48];(2)系統(tǒng)闡述了五個亞綱級類群(腹毛類、游仆類、寡毛類、緣毛類、盾纖類)內部的系統(tǒng)關系:明確了游仆亞綱及其轄屬的2目7科均為單源發(fā)生系,證實了盤頭目與游仆目具有更密切的系統(tǒng)關系;新建立的Lynnella屬代表了一個介于寡毛亞綱和環(huán)毛亞綱之間的一個目級新階元[44];(3)同步探討了有關物種選擇、建樹方法、環(huán)境未知序列和二級結構的使用、旁系同源基因、數據缺失和異質性等一系列因素對系統(tǒng)發(fā)育關系的影響[49-52]。
作為一份新成果,我們結合單細胞組學測序技術,構建了一種高效自動化序列分析方法 (Guided Phylogenomic Search in trees, GPSit),其具有一站式、高度流程化的特點并集成了全部的必需和可選操作,大大減少人工操作時間。該方法支持同時使用超級數據集與超級樹方法進行系統(tǒng)發(fā)育基因組學分析,能夠很好地重構深層系統(tǒng)發(fā)育關系并揭示淺層系統(tǒng)發(fā)育關系中的相關類群的系統(tǒng)進化地位。該方法很大程度上紓解了(不可培養(yǎng)類群)基因組數據難以獲取的困難[53]。
迄今為止的工作顯示,單基因和少數基因為基礎的纖毛蟲分子系統(tǒng)學研究依然不能回答一些包括隱存種厘定、關系混亂的形態(tài)屬的界定、形態(tài)特征-細胞發(fā)生學信息與分子信息相悖等問題。這些工作需要在系統(tǒng)基因組學(Phylogenomics)研究的水平上去探討和尋求解答。因此,作為新的關注點之一,我們將高通量測序技術、DNA信息庫利用與組學資訊開發(fā)整合成新的工作平臺,在組學和大數據背景下去解析包括物種鑒定、適應與進化相關的系統(tǒng)學科學問題。作者預期,新設想的實施將引領和推動纖毛蟲分子系統(tǒng)發(fā)育學的發(fā)展并將構成系統(tǒng)學領域新的研究熱點。
作為近幾十年來新形成的一項革命性成果,基因條碼技術成為銜接(以形態(tài)學為標志的)傳統(tǒng)分類學、進化生物學、生態(tài)學、遺傳學及系統(tǒng)分類學等學科間交叉研究的橋梁。其衍生出的相關分析方法對闡釋涉及傳統(tǒng)分類學、系統(tǒng)發(fā)生學、進化生態(tài)學、生物地理學、生物信息學等相關學科的一系列重要科學問題均產生了積極的促進作用[54-55]。
在信息化時代,通用性、客觀性和可操作性等生物多樣性工作的基本需求,函需在纖毛蟲物種鑒定、分類、進化及生態(tài)學等研究中引入輔助性的分子標記,而這一客觀需求推動了纖毛蟲領域分子技術的革新和多學科的交叉發(fā)展[2,56-57]。到本世紀初,得益于DNA條形碼技術和基于高通量測序技術的各種組學技術的快速發(fā)展,纖毛蟲分子標記的研究再次迎來新的機遇和挑戰(zhàn)。其中,適于纖毛蟲類群的DNA條形碼候選基因在不同層次、不同領域的應用和推廣對當今纖毛蟲生物多樣性的研究提出了新的要求, 也帶來了新的認知。
該技術自21世紀初建立以來,在動物、植物、真菌等類群的生物多樣性研究中大放異彩,但在真核微生物上的應用卻嚴重滯后。作為為數不多的代表性工作之一,作者團隊在過去幾年中圍繞纖毛蟲DNA條形碼候選基因的篩選工作開展了建設性的探索[58-60]。
研究進展可以概括為如下幾點:(1) 證實了常規(guī)barcode條碼標記基因——線粒體細胞色素c氧化酶I(COI)基因5’端序列不僅可(例如在草履蟲屬內)進行近緣種的物種界定,而且具有鑒別隱存種的優(yōu)勢;(2)比較探討了COI基因不同層面的差異對種類鑒定和種群結構分析的影響,明確了線粒體基因的異質性,揭示了COI基因在同一細胞內部以及個體間、種群間的遺傳差異,但該差異不影響其物種界定的能力;(3)以前口蟲為材料,我們綜合比較了7個核基因變異區(qū)和線粒體COI基因作為DNA條形碼的區(qū)分效力,揭示了COI、ITS1、ITS2、28SrRNA基因D2區(qū)具有明顯的barcode gap區(qū),特別是COI有發(fā)現隱存種的潛力;(4)我們隨后的研究發(fā)現,雖COI基因有較大優(yōu)勢,但其在不同類群間遺傳分化較大且存在長度各異的插入區(qū),不利于通用引物設計。此外,高變的ITS1/ITS2區(qū)及18SrRNA基因V2/V9區(qū)雖在一定程度上可進行物種界定但卻無法較好的反映物種間的演化關系。鑒于此,我們提出纖毛蟲物種多樣性研究適宜于用18SrRNA基因V4區(qū)對非近緣物種進行判讀,再借助進化速率較快的28SrRNA基因D1~D2區(qū)或COI基因進行近緣種或隱存種刻畫的策略(見圖4)[61]。
而隨著高通量測序技術的推進,應運而生的宏條形碼技術對纖毛蟲物種多樣性分析的分子標記又提出了新的要求:合適的通用引物、合適的片段長度和豐富準確的參考數據庫。因此,與前期的基因標記篩選工作相比,更為迫切的任務是物種參考數據庫的構建。目前制約建庫的首要因素是素材(物種、種群)的采集與正確鑒定,這仍需寄希望于分類學家專業(yè)的形態(tài)分類學知識。得益于作者及合作團隊過去二十年研究工作的積累和由此構建的內容豐富的纖毛蟲DNA庫提供的素材,基于18SrRNA基因V4區(qū)的宏基因組學分析初步完成了淡水環(huán)境樣本較大規(guī)模的摸底分析,實現了從類群水平到群落水平的推進??梢灶A見的前景是,基因條形碼技術的完善和應有將進一步助力于揭示纖毛蟲各種生態(tài)系統(tǒng)中重要生態(tài)學功能、地位及其與環(huán)境間的相互關系。
(A,D自Zhao et al.[58];B自Zhao et al.[60];C自Zhao et al.[59]。A, D from Zhao et al.[58]; B from Zhao et al.[60]; C from Zhao et al.[59].)
隨著高通量測序技術和生物信息學技術的迅猛發(fā)展,基因組和轉錄組等組學大數據的解析為研究生命的起源與演化、發(fā)育、遺傳、代謝等一系列生物學基本問題提供了全新的視野和有力的工具,已經成為當前生物科學領域中最具影響力的前沿領域[62-64]。與此領域大背景相對照,纖毛蟲組學的研究目前尚處于方興未艾的起步階段,大量未知等待解答。近年來,作者依托所在團隊的分類學背景,聚焦進化地位特殊種、環(huán)境極端種等類群,目前已經完成了對包括大彈跳蟲、玫瑰喇叭蟲、扇形游仆蟲、具溝急游蟲等十余種基因組和轉錄組的深度測序。此外,我們利用單細胞測序技術,累計完成了對80余代表物種單細胞水平的基因組/轉錄組測序(見圖5)。
作為代表性成果之一,我們以扇形游仆蟲為模式,分析了高質量的大核基因組、部分小核基因組及不同環(huán)境脅迫下的轉錄組數據[65],結果包括:(1)其大核基因組中含有超過25 000個完整的單基因的微型染色體 (單倍體基因組大小約85MB);(2)小核基因組中豐度最高的內部刪除序列的邊界都存在保守的序列基序5’-TA-3’,且染色體斷裂位點 (CBS) 被復制并保留在大核基因組中;(3)通過分析不同環(huán)境脅迫 (營養(yǎng)缺乏、極端溫度、極端鹽度等) 下轉錄組的差異表達,揭示了對外部物理或化學刺激作出反應的基因簇;(4)在鹽度和化學應激下,HSP70基因的轉錄顯著增加,但是對溫度刺激沒有反應;推測這種耐溫性與調節(jié)區(qū)溫度壓力敏感元件的演化缺失有關。這些數據的解析為理解具有高度適應能力的微生物的獨特生物學提供了分子證據。
我們對大彈跳蟲的基因組和轉錄組的工作顯示:(1)其大核染色體呈現高度的片段化,微型染色體的拷貝數不均勻,與基因表達水平相關;(2)DNA和RNA水平存在明顯的動態(tài)變化,包括大核形成過程中內部刪除序列的可變剪切和轉錄過程中內含子的大規(guī)模可變剪切;(3)大多數微型染色體的副端粒區(qū)存在一個穩(wěn)定的TATAbox結構,其轉錄終止機制高度簡潔;(4)對不同溫度下的轉錄組測序數據進行差異表達分析可以從細胞膜結構和跨膜轉運、細胞內吞和溶酶體、細胞周期控制、核小體組蛋白等層面解讀了大彈跳蟲對低溫脅迫的適應機制。
(A~D, K 自Chen et al.[65]; E, F自Chen et al.[53]; G~J自Zheng et al.[66];L自Gao et al.[70]; M自Gao et al.[71]。A~D, K from Chen et al.[65]; E, F from Chen et al.[53]; G~J from Zheng et al.[66]; L from Gao et al.[70]; M from Gao et al.[71]. )
圖5 纖毛蟲原生動物的基因組與進化
Fig.5 Genome and evolution of ciliated protozoans
結合基因組與轉錄組數據,我們對玫瑰喇叭蟲的大核基因組(內含子與非編碼基因間區(qū))和種群遺傳學研究表明:(1)與同屬種天藍喇叭蟲相比較顯示,喇叭蟲的進化歷程中存在一次全基因組的倍增事件,玫瑰喇叭蟲的基因組呈現為未發(fā)生全基因組倍增的祖先形態(tài);(2)兩種喇叭蟲均具有極短的內含子和非編碼基因間區(qū),且非編碼區(qū)域能夠有效地起始轉錄。
以檸檬類瘦尾蟲為材料,我們利用端粒引物PCR擴增和高通量測序相結合的方法,快捷地獲取了其部分大核基因組數據[66],確認該物種的端粒序列為(C4A4)2C4,主要發(fā)現包括:(1)大核基因組基本為“一條基因一條染色體”的模式,有少量染色體包含兩或三個基因;(2)密碼子偏好性分析顯示其存在終止密碼子重分配現象;(3)染色體分析顯示出明顯不對稱的GC偏移和正義鏈亞端粒區(qū)高AT偏好,同時在亞端粒區(qū)域的3’端發(fā)現11 bp高AT含量的結構單元及存在一個40 bp不敏感的GC振蕩區(qū),推測可能與端粒的添加、轉錄和復制的啟動等有關;(4)發(fā)現潛在的TATA-box存在于編碼鏈的5’亞端粒區(qū),集中在30~50 nt區(qū)段。
我們對具溝急游蟲轉錄組的深度測序和分析[67],完成了超級樹和超級數據集兩種系統(tǒng)發(fā)育關系重構方法的比較,結果表明兩種方法重構的纖毛蟲進化關系在綱級水平上是一致的;基于包括具溝急游蟲在內的 13 種纖毛蟲的形態(tài)學和基因表達差異信息比較,在組學水平上探究了表層胞質蛋白基因的表達水平與其細胞形態(tài)的相關性并揭示了 Alveolin 和 EPC 兩個表層胞質蛋白基因家族的表達量與圍口動基列、射出體、口區(qū)等形態(tài)學特征具有顯著相關性。
基因重組作為一重要的產生基因多樣性及驅動進化的機制,在許多真核細胞中都有發(fā)生。這一過程可以發(fā)生在某些特定基因上,也可以發(fā)生在全基因組層面。最劇烈和普遍的基因重組發(fā)生在纖毛蟲的大核基因組形成過程中。由于不同纖毛蟲的大小核數目不盡相同以及高度的物種多樣性,其細胞大小核演化過程中序列的刪除、亂序基因的重排、染色體片段化及基因多倍化程度等基因重組的模式和機制也因此呈現出顯著的差異[68-69]。圍繞此過程和機理的研究對于了解物種形成和分化、真核生物基因組進化等都具有重要的理論意義。
作者及合作者利用已完成轉錄組分析的鉤刺斜管蟲為材料,對其基因亂序和不同基因家族的選擇性拼接模式等進行了探討和揭示[70-71],主要成果包括:(1)對高通量轉錄組數據的分析,從中篩選出112個候選基因家族,發(fā)現選擇性拼接在基因家族中廣泛存在且這些基因可能是該纖毛蟲所特有;(2)首次測定鉤刺斜管蟲中三個選擇性拼接基因家族,發(fā)現不同基因家族具有不同的選擇性拼接模式;(3)提出了亂序基因進化的理論模型:基因亂序由基因復制及之后的分化來演繹,選擇性拼接可能是基因亂序進化過程的中間形式;(4)鉤刺斜管蟲隱匿種間大小核基因的重組模式較為保守,但是小核特異序列的進化速率較高,且接頭序列存在移位現象,揭示了基因重排在物種分化中的作用[72]。以上工作為基因組結構對基因家族進化的影響給出了新觀點和新詮釋,為纖毛蟲物種分化-形成機理提供了重要資訊。
在國際范圍內,圍繞纖毛蟲大小核間的基因組重組模式和機制的研究目前尚處于探索階段。與現有纖毛蟲的龐大系統(tǒng)相比,迄今有關兩型核間基因組重組的認知均來自對四膜蟲、草履蟲及個別“一個基因一條染色體”淡水模式種的研究,而對于具有更高多樣性的海洋類群仍一無所知。我們的目標是建立一海洋纖毛蟲新型模式動物:扇形游仆蟲。以此為材料,通過高通量測序技術及生物信息學手段,揭示其大小核基因組的重組模式;在此基礎上,探討大小核基因組的重組機制,為后續(xù)更深入的機理研究建立第一手的數據資料;同時,優(yōu)化扇形游仆蟲接合生殖的誘導條件,揭示其有性生殖過程中大小核演化的完整過程、界定性別決定相關的調控基因。這項工作的目的是將該物種構建為一新的海洋模式生物,從而為拓展更大空間的基因進化研究奠定基礎。
在過去近半個世紀中,以四膜蟲為模式動物的研究曾先后取得了包括核酶和端粒酶在內的重大發(fā)現。伴隨著全基因組測序及基因操作技術的建立,特別是自人類獲得其無菌培養(yǎng)體系以來,四膜蟲已發(fā)展成為細胞生物學、進化生物學、遺傳學、發(fā)育生物學等領域中理想的模式材料[73]。
與大部分纖毛蟲一樣,四膜蟲的大小核具有(幾乎)相同的DNA序列卻有著不同的表觀遺傳調控因素,二者在基因組大小、基因表達、基因拷貝數等各方面具有巨大的差異。迄今所知,這些差異在很大程度上是由表觀遺傳因素(如組蛋白修飾、DNA甲基化等)進行調控的。
利用四膜蟲為模式材料,我們及合作者團隊近年來聚焦于組蛋白修飾和DNA甲基化(見圖6),陸續(xù)開展和完成了以下工作:
(1)首次鑒定了組蛋白單甲基化酶TXR1(TetrahymenaTrithorax Related-1),可特異性地催化組蛋白第27位賴氨酸的甲基化(H3K27me1)。我們還證實了TXR1通過與PCNA的結合定位到復制叉上,催化形成H3K27me1,以維持正常的染色體構象或影響下游作用因子的結合。本工作為研究表觀遺傳信息和遺傳信息的協(xié)同復制提供了重要的模式平臺[74-77]。
(2)繪制了首份單堿基分辨率的四膜蟲N6-腺嘌呤甲基化(6mA)全基因組分布圖譜,并在此基礎上系統(tǒng)刻畫了其序列特征和染色質環(huán)境:發(fā)現6mA位點絕大部分位于5’-AT-3’序列上,偏向性的分布在RNA聚合酶II轉錄基因的5’端,但與轉錄活性僅存在弱相關性。另外,6mA聚集在連接DNA上,且該區(qū)域兩側富集占位穩(wěn)定性高、含有組蛋白變體H2A.Z的核小體。上述發(fā)現揭示了6mA的分布由序列特征和染色質環(huán)境共同決定,并由此提出6mA與基因轉錄、染色質重塑等同為染色質調控的重要組成,為后續(xù)研究6mA的功能和調控機制提供了重要數據[78]。
(3)改進了分離條件從而獲得了大量高純度的大核和小核并利用優(yōu)化的酶切和離心方案將核小體分辨率提高至單核小體水平。在此基礎上,通過分別對大核和小核的單核小體樣品進行高通量測序及分析,我們發(fā)現順式元件主要決定核小體占位,而反式元件主要決定核小體定位。同時,順式和反式元件對于核小體的全局分布具有協(xié)同調控效應。此工作充分利用了四膜蟲的雙元核對照系統(tǒng),為順式(序列特征)和反式(轉錄活性)作用元件共同決定核小體分布的理論提供了直接證據[79-80]。
(A, C, D, E, G, I, J, K 自 Zhao et al.[81]; F, G改自Wang et al.[78];H 改自Gao et al.[74]。A, C, D, E, G, I, J, K was adapted from Zhao et al.[81; F, G was adapted from Wang et al.[78]; H was adapted from Gao et al.[74].)
圖6 四膜蟲的表觀遺傳學
Fig.6 Epigenetic studies usingTetrahymenaas model organism
(4)發(fā)現了轉座子的編碼RNA(表達)和非編碼RNA(沉默)利用同一套轉錄系統(tǒng)進行轉錄,兩種RNA之間的平衡由Polycomb抑制通路和RNA干擾通路共同調控。新發(fā)現的現象包括:Polycomb抑制通路蛋白和RNA干擾通路蛋白的敲除株系中,通常狀況下應為沉默狀態(tài)的轉座子的表達被大規(guī)模激活,某些被激活的轉座子可能會編碼有活性的轉座酶并控制自身的轉座。該工作系首次針對四膜蟲中轉座子的調控機制進行的探討,解釋了其沉默與重新激活這一看似矛盾的現象,為深入研究轉座子與宿主的協(xié)同進化提供了重要理論支持[81]。
我們進展中的工作仍將繼續(xù)圍繞甲基化這一主流方向,特別聚焦在DNA 6mA催化酶學系統(tǒng)和表觀遺傳識別信號系統(tǒng)的鑒定和刻畫、組蛋白TXR1蛋白調控復制的分子機制的解析、轉座子對基因組穩(wěn)定性的影響等問題。此外,還將嘗試構建新的模式研究體系,即以海洋纖毛蟲為模式的動物模型。這項探索的潛在意義在于:將極大地補充現有纖毛蟲模式生物緊缺的現狀,為未來深入挖掘真核生物表觀遺傳調控中的新現象和新機制奠定基礎。
致謝:借此感謝(中國海洋大學)原生動物學研究室的歷屆畢業(yè)生以及在讀生們,在過去的20余年中,他們?yōu)閷嶒炇业慕ㄔO和發(fā)展、為該文中所涉成果做成了巨大的貢獻。特別謝意送給我們的國際合作者們,他們的加盟與合作,共同成就了團隊的今天。