黃羽豪,龔森瑞,李浩森,龐 虹
(有害生物控制與資源利用國家重點實驗室,中山大學生態(tài)學院/生命科學學院,廣州 510275)
生物體的遺傳物質大多數(shù)情況下是由親代到子代垂直傳遞的。然而,生物體中有的基因可能是從其它個體或線粒體、葉綠體等不同細胞器的遺傳物質中獲得的,這種現(xiàn)象被稱為水平基因轉移(horizontal gene transfer, HGT)或橫向基因轉移(lateral gene transfer, LGT),而這些不依賴親緣關系獲得的基因被稱為水平轉移基因(horizontally transferred genes, HTGs)。HGT可以發(fā)生在同種的不同生物個體或者單個細胞的不同細胞器之間,但由于檢測手段的限制和基因功能的探討意義等原因,物種間的HGT在研究中更為常見。
早在20世紀50-60年代,研究者發(fā)現(xiàn)遺傳物質可以在不同菌種之間傳遞,如從大腸桿菌Escherichiacoli傳遞至沙門氏桿菌Salmonella(Miyake and Demerec, 1959; Zinder, 1960),這是人們首次認識到HGT現(xiàn)象在細菌進化上的重要性,并能夠解釋抗藥性在菌群中的快速傳播。后續(xù)的大量研究發(fā)現(xiàn),HGT在原核生物中十分常見,其促進了新性狀的快速傳播,如抗生素耐藥性、致病性和其它各種有利于適應周圍環(huán)境的代謝特性,同時也有許多HGT不帶功能或功能未明(Ochmanetal., 2000; Pallen and Wren, 2007)。
近年來,真核生物中的HGT也逐漸被發(fā)現(xiàn),并被認為是普遍存在于單細胞真核生物(Keeling and Palmer, 2008)、動物(Hotoppetal., 2007; Gladyshevetal., 2008; Hotopp, 2011; Flotetal., 2013; Boto, 2014; Drezenetal., 2017; Sieberetal., 2017)、植物(Gaoetal., 2014; Wangetal., 2020)及真菌(Fitzpatrick, 2012)等類群中。在昆蟲(Nakabachi, 2015; Wybouwetal., 2016; Zakharov, 2016)以及近源的蜱螨(Chouetal., 2015; Wybouwetal., 2016; Hayesetal., 2020)、蜈蚣 (Undheim and Jenner, 2021)和彈尾蟲(Faddeeva-Vakhrushevaetal., 2016; Faddeeva-Vakhrushevaetal., 2017; Wuetal., 2017)等節(jié)肢動物中也有大量HGT的報道。隨著對共生微生物研究的不斷深入,人們對宿主生物、共生微生物以及它們之間的聯(lián)系也有了全新的理解,生物體對環(huán)境的適應離不開共生微生物的作用,甚至有觀點將宿主生物及其所有共生微生物作為一個整體的完全生物(holobionts),并將這個整體的所有基因集合作為完全基因組(hologenomes)看待(Haag, 2018);而HGT在這個共生系統(tǒng)中也扮演了重要的角色,是宿主生物和共生微生物聯(lián)系的紐帶之一。同時,HGT也更新了人們對于進化的觀點,生命之網(wǎng)似乎比生物之樹更符合真實的進化歷程(Soucyetal., 2015; Malletetal., 2016)。昆蟲物種多樣性高,與微生物關系密切,昆蟲體內的HGT研究是近年的熱點之一。本文將從HGT研究的常用流程和方法、昆蟲HGT的供體、HGT的受體昆蟲以及昆蟲HGT的功能4個方面進行綜述,并提出現(xiàn)階段昆蟲HGT研究的一些問題以及未來展望。
HGT研究主要分為三大環(huán)節(jié):搜索、驗證以及功能探究(圖1)。搜索通常是基于序列同源性的組學數(shù)據(jù)的搜索;驗證包含兩個方面,分別是系統(tǒng)發(fā)育關系的驗證和內含子、側翼序列、信號肽、不同數(shù)據(jù)及表達情況等污染排除的方面;功能探究則包括序列信息分析、選擇壓力分析等生物信息學探究和表達譜、功能驗證實驗等實驗方面的探究。
圖1 后生動物水平基因轉移研究的常用流程、方法及其作用Fig.1 Common processes and methods in research of horizontal gene transfer in Metazoa and their function
1.1.1后生動物水平基因轉移的搜索方法
真核生物HGT的發(fā)現(xiàn)一般為基因組、轉錄組、蛋白組和代謝組等組學研究中基因注釋后的意外發(fā)現(xiàn),也有專門對組學數(shù)據(jù)進行搜索得到的HGT。HGT的搜索主要是基于序列同源性的方法。許多研究會將NCBI的非冗余蛋白序列數(shù)據(jù)庫(Non-Redundant Protein Sequence Database, NR)、Swiss-Prot或基因組等數(shù)據(jù)庫分為后生動物Metazoa類群數(shù)據(jù)庫和細菌、真菌、植物、病毒及其它非后生動物的真核生物等其它類群數(shù)據(jù)庫,或者建立特定外群物種的子庫。為避免自身的序列或近源物種的序列造成干擾,后生動物的數(shù)據(jù)庫通常還會去除自身或近源物種的序列,然后進行BLAST (Camachoetal., 2009)搜索,再對后生動物數(shù)據(jù)庫和其它數(shù)據(jù)庫的結果進行手動的比較以及后續(xù)的驗證。在針對基因蛋白序列時有時也會使用DIAMOND (Buchfinketal., 2015)進行搜索,而搜索基因組中的HGT片段有時會使用MUMmer (Marcaisetal., 2018)搜索。手動比較通常是基于比對結果中的bitscore值、E值、一致度和覆蓋度等參數(shù),判斷與后生動物或其它類群的同源性大小,若與其它類群的基因比后生動物更近源,則認為是HGT。然而,手動比較存在一定的主觀性,導致標準不統(tǒng)一的問題;另外,需要檢測的基因或基因組片段數(shù)以萬計,手動比較工作量較大。因此,水平基因轉移的搜索需要更為系統(tǒng)性、流程化和標準化的方法。
目前,較為常用的流程化方法有4種:HGT指數(shù)h、外源指數(shù)(alien index, AI)、比對一致支
持度(Consensus Hit Support, CHS)和Wheeleretal.(2013)的檢測方法(表1)。h指數(shù)(Boschettietal., 2012)和外源指數(shù)(Gladyshevetal., 2008)分別是基于BLAST的bitscore值和E值計算的指標,h指數(shù)是非后生動物的物種序列數(shù)據(jù)庫最佳比對的bitscore值減去后生動物庫最佳比對bitscore值的差,當h≥30且bitscore≥100時認為該基因是HGT;外源指數(shù)則表現(xiàn)為兩個最佳比對的E值的對數(shù)比較,當≥45時認為該基因為HGT。Wheeleretal.(2013)的檢測方法同樣是以BLAST的E值作為指標,僅以小于1e-5的E值的大小作為直接判斷,若細菌數(shù)據(jù)庫比對的E值比后生動物數(shù)據(jù)庫的E值更小則作為HGT的候選。Wheeleretal.(2013)的方法較為簡單,后面更是改良為滑動窗口的方式搜索基因組的HGT片段,被用于光肩星天牛Anoplophoraglabripennis(McKennaetal., 2016)、煙盲蝽Nesidiocoristenuis(Fergusonetal., 2020)、乳草長蝽Oncopeltusfasciatus(Panfilioetal., 2019)、西花薊馬Frankliniellaoccidentalis(Rotenbergetal., 2020)、溫帶臭蟲Cimexlectularius(Benoitetal., 2016)、黑森癭蚊Mayetioladestructor(Zhaoetal., 2015)、茶翅蝽Halyomorphahalys(Sparksetal., 2020)、廄螯蠅Stomoxyscalcitrans(Olafsonetal., 2021)和一種寄生繭蜂Diachasmaalloeum(Tvedteetal., 2019)等許多基因組的HGT搜索中。CHS方法(Koutsovoulosetal., 2016)則基于DIAMOND搜索提供的物種來源信息,每條跟數(shù)據(jù)庫比對上的序列會對應相應的物種及其所屬階元,若90%以上的比對來源于細菌或其它非后生動物類群,則認為該基因可能是HGT的候選基因。
表1 后生動物HGT搜索環(huán)節(jié)常用的工具和方法
基于外源指數(shù)開發(fā)的Alienness網(wǎng)絡服務器(http://alienness.sophia.inra.fr)可以上傳用戶提供的NR數(shù)據(jù)庫搜索結果,計算外源指數(shù)和h指數(shù),并根據(jù)外源指數(shù)AI和對非目標類群的比對一致度的大小檢測出3類蛋白序列:AI>15且一致度<70%的候選HGT、0
1.1.2細菌水平基因轉移的搜索方法
在研究歷史更長、更成熟的細菌HGT研究中,更多HGT搜索的方法被開發(fā)出來(表2)。
表2 HGT搜索方法的類型Table 2 Types of search methods for HGT
這些方法主要可以分為兩類:基于序列組成的參數(shù)方法和基于系統(tǒng)發(fā)育的方法(Ravenhalletal., 2015)。
基于序列組成的參數(shù)方法主要使用GC含量、密碼子使用偏好、基因結構及寡核苷酸組成等參數(shù)判斷序列的外源性。最近開發(fā)的DeepHGT軟件正是基于序列特征,使用深度殘差網(wǎng)絡(deep residual network)訓練并識別HGT插入位點,但目前僅適用于細菌的基因組(Lietal., 2020)。而Arevaloetal.(2019)開發(fā)的PopCOGenT方法則基于近期發(fā)生HGT的基因組之間比自然突變的基因組擁有更長相同區(qū)域的原理,使用長度分布模型估計出細菌基因組之間近期的HGT事件,并構建出細菌的HGT網(wǎng)絡,將細菌分為不同功能的種群單元。基于序列組成的方法更有利于探索HGT機制的本質,但會受基因組內部的參數(shù)變化影響,且古老HGT由于長時間跟隨基因組經(jīng)歷相同的進化而被逐步同化,易造成識別不準(Ravenhalletal., 2015)。
系統(tǒng)發(fā)育的方法則包括隱式和顯式兩大類型(Ravenhalletal., 2015)。隱式的系統(tǒng)發(fā)育方法主要是各類非進化樹的聚類或同源性分析手段,包括最常用的基于序列同源性的BLAST搜索、基因和物種距離、同源基因分析及多態(tài)位點聚類等方法;而顯式系統(tǒng)發(fā)育方法則完全基于進化樹,如使用Shimodaira-Hasegawa檢驗(Shimodaira and Hasegawa, 1999)對物種樹和基因樹的拓撲結構進行比較等。但大多數(shù)顯式系統(tǒng)發(fā)育方法容易受基因復制丟失等其它進化事件和系統(tǒng)發(fā)育不確定性的影響,物種樹和基因樹協(xié)調的方法被嘗試用來分離這些影響,用來分析物種在進化過程中的HGT、基因漸滲、基因復制和基因丟失等進化事件。這種方法在昆蟲中也有零星的嘗試,如Chauveetal.(2018)對按蚊屬Anopheles基因組的分析。另外,顯式系統(tǒng)發(fā)育方法操作較為繁瑣,難以流程化(Ravenhalletal., 2015)。因此,研究中通常先使用同源性搜索尋找出候選的HGT,再將系統(tǒng)發(fā)育分析作為驗證的一個環(huán)節(jié)。
1.1.3水平基因轉移搜索方法的限制和注意事項
HGT的搜索方法大多只能用于搜索相對近期的HGT,古老的HGT由于序列組成趨同于受體的基因組,且數(shù)據(jù)庫中存在近源物種的同源基因,難以通過統(tǒng)一流程化的方法準確搜索到,需要在搜索前對數(shù)據(jù)庫進行一些近源物種的刪減,或在Alienness網(wǎng)絡服務器中排除對近源物種的考慮;也可以使用MEGAN (Husonetal., 2016)等軟件可視化同源搜索比對到的序列物種分布,人為做出判斷。
同時,基于同源性搜索的方法可能會因為非后生動物類群中偶然出現(xiàn)的同源序列(如后生動物轉移到非后生動物類群的HGT基因)而將檢測的基因判斷為HGT基因,或無法判斷HGT的方向,公用數(shù)據(jù)庫的物種序列缺失、物種序列污染以及序列信息錯誤等因素也會影響HGT的檢測。
另外,搜索和檢測HGT的方法一般無法區(qū)分HGT和污染序列。而其它物種尤其是共生菌或腸道微生物的污染可能會體現(xiàn)在基因組的部分序列中;由于二代測序讀長短,因此也容易發(fā)生拼接錯誤導致的污染片段(Ku and Martin, 2016)。一種水熊蟲Hypsibiusdujardini的HGT曾被認為占全部基因總數(shù)的1/6,明顯多于其它物種,而后續(xù)的研究卻表明其HGT僅占1%~4%,引起了很大的爭議,這種分歧可能就是由嚴重的細菌序列污染造成的(Boothbyetal., 2015; Arakawa, 2016; Bemmetal., 2016; Delmont and Eren, 2016; Koutsovoulosetal., 2016; Yoshidaetal., 2017)。Ku and Martin (2016)認為,真核蛋白與原核蛋白的一致度在70%以上時很可能是測序污染、組裝或者注釋等技術的問題,并提出了70%原則防止HGT的誤判。因此,搜索出來的候選HGT還需要進行進一步的驗證,防止污染序列的影響。
此外,HGT搜索前的基因組組裝、預測和注釋階段同樣可能給HGT的檢測帶來影響,例如寄生蜂Leptopilinaheterotoma的Lar基因為處于另一基因RRP8的長內含子內的嵌套基因(nested gene),昆蟲基因組中也含有較多嵌套基因,然而,基因預測中常用的EVidenceModeler等軟件默認情況下并不進行嵌套基因的預測(Haasetal., 2008; Huangetal., 2021),有可能造成HGT挖掘的不全面。
對于現(xiàn)階段的昆蟲及其它后生動物研究,HGT的搜索還無法做到準確的認定HGT事件及排除污染,只能以靈敏度為主,確定候選HGT的范圍,并交由系統(tǒng)發(fā)育分析進行進一步的驗證與認定,以及使用多種手段排除污染的可能。
為了驗證HGT候選基因的進化歷程和供體來源,進一步確認HGT事件,需要對候選基因及搜索到的同源基因進行系統(tǒng)發(fā)育構建,這在HGT研究中是定性的必要環(huán)節(jié),但由于同源基因等序列資源配置較為繁瑣,通常在流程化的同源性搜索確定候選范圍后再進行。系統(tǒng)發(fā)育關系可以使用RAxML (Stamatakis, 2014)或IQ-TREE (Minhetal., 2020)等軟件構建得到。隨后在構建出的進化樹中觀察基因的進化歷程,若候選基因或候選基因集在進化樹上被非近源物種的基因包圍,則這些基因可能是HGT基因,那些相鄰支系的物種可能是HGT的供體。
除此之外,昆蟲及其他后生動物的候選HGT還應排除可能為污染的情況。首先,需要驗證候選基因周圍的側翼基因或片段序列屬于真核生物,如利用基因組的注釋信息BLAST搜索周圍序列,還可以進一步采用PCR方法或者高通量數(shù)據(jù)中對應的原始序列驗證基因的連接處。另外,不同個體、種群與物種的數(shù)據(jù)可以使用BLAST相互印證,排除某個數(shù)據(jù)的污染,也可以用PCR直接驗證準備好的生物樣品,這一過程可以說明該基因在該物種或該類群的共同祖先出現(xiàn)前就已經(jīng)發(fā)生了HGT事件。真核基因的特征也可以用來輔助驗證,比較常用的特征包括內含子、信號肽、polyA位點和GC含量等。部分真核基因中含有內含子,研究表明內含子能夠增加基因的表達(Le Hiretal., 2003),因此可以證明含有內含子的基因來自真核生物,檢測HGT候選基因中是否存在內含子,也是對基因結構的描述,這一步可以通過基因組的注釋信息或PCR進行驗證。真核生物分泌系統(tǒng)的信號肽與原核生物不同,用SignalP (Armenterosetal., 2019)等軟件進行真核信號肽的預測,若HGT候選基因含有信號肽,則可以證明該基因為真核基因,并且為分泌蛋白。可以使用轉錄組或qRT-PCR等方法驗證該基因是否表達,同時得到該基因的表達譜。如果表達,不但能較大程度排除污染的可能性,還可以說明該基因在生物體中發(fā)揮了作用,通過表達譜也能推測該基因的作用。此外,轉錄本中的polyA位點也可以進一步說明該基因為真核基因。
HGT的功能探究通常可以分為生物信息學和實驗兩方面的探究。生物信息學分析包括了信號肽、結構域、同源性注釋、催化位點及蛋白結構等序列信息的分析,除此之外,選擇壓力分析也是常見的分析之一。基因在進化過程中經(jīng)歷正選擇或負選擇說明該基因在進化過程中發(fā)揮了重要的作用,選擇壓力可以使用HyPhy (Pondetal., 2020)或PAML程序包的CODEML程序(Yang, 2007)進行檢測。實驗方面,主要包括表達譜和功能驗證實驗。通過轉錄組或qRT-PCR等手段獲取基因在各部位或各發(fā)育階段的時空表達譜以及不同實驗處理的表達譜,不同情況下某一基因的表達上下調情況有利于間接推測該基因的作用。在表達譜和序列信息分析的基礎上,可以提出對基因功能的合理假設,設計實驗驗證基因的功能,常用的實驗手段包括RNA干擾、體外表達與底物實驗等。
HGT的供體是指提供基因的物種,即HGT基因的來源。HGT的供體通常是通過構建基因的進化樹推斷的,但由于數(shù)據(jù)庫的物種缺失、系統(tǒng)發(fā)育推斷的不確定性以及古老物種和現(xiàn)存物種的差異等,推測得出的HGT供體很可能并不是客觀的供體。Crispetal.(2015)通過HGT指數(shù)h的方法搜索了果蠅屬Drosophila的基因組,結果表明HGT主要來自細菌(26.5%)和原生動物(46.5%),也有來自植物(14.9%)、真菌(9.9%)和古菌(2.2%)的HGT。然而,從現(xiàn)有研究來看,昆蟲HGT的供體以細菌為主,真菌、植物和病毒等類群也有一些報道,還有少量已報道的HGT來自原生動物等其它類群(圖2,表3)。
HGT易發(fā)生在緊密聯(lián)系的生物之間,在自然界中昆蟲與細菌廣泛接觸,關系密切,使得來自細菌的HGT數(shù)量在昆蟲HGT總數(shù)中占比較高,胞內共生菌、腸道微生物、昆蟲病原細菌以及其它細菌都可能是昆蟲HGT的供體。而許多已報道的HGT是通過系統(tǒng)發(fā)育的方法推測來自細菌供體的,但由于發(fā)生時間久遠,具體的供體物種或是否有中間供體(如噬菌體)已難以推測。來自細菌的HGT中,以沃爾巴克氏體Wolbachia為供體的HGT報道較為常見,沃爾巴克氏體是昆蟲體內廣泛存在的胞內共生菌,能夠在昆蟲中穩(wěn)定垂直傳遞給后代,也能在物種間水平傳播(Correa and Ballard, 2016)。早在2002年,Kondoetal.(2002)發(fā)現(xiàn),通過抗生素處理的綠豆象Callosobruchuschinensis的X染色體上存在沃爾巴克氏體的DNA片段,這些片段上面包含了沃爾巴克氏體的多個基因。而到了2007年,昆蟲基因組上存在沃爾巴克氏體的片段才通過嚴謹?shù)膶嶒炞C明。Hotoppetal.(2007)通過BLAST搜索,同時使用PCR驗證側翼的連接處,并對不同種群、性別及物種數(shù)據(jù)進行相互驗證,還驗證了表達量與染色體定位等信息,確定了果蠅、寄生蜂和蚊子基因組上均存在沃爾巴克氏體的基因片段。隨后的研究在綠豆象和松墨天牛Monochamusalternatus體內分別發(fā)現(xiàn)其基因組整合有沃爾巴克氏體基因組約30%和超過10%的片段(Nikohetal., 2008; Aikawaetal., 2009)。Klassonetal.(2009)發(fā)現(xiàn)伊蚊屬Aedes內存在兩個相鄰的來源于沃爾巴克氏體的基因。Werrenetal.(2010)發(fā)現(xiàn)13個來自沃爾巴克氏體的錨蛋白重復痘蛋白基因水平轉移入金小蜂屬Nasonia的基因組中。隨后,來自沃爾巴克氏體的基因或基因組片段被陸續(xù)發(fā)現(xiàn)存在于茶翅蝽(Ioannidisetal., 2014)、光肩星天牛(McKennaetal., 2016)、網(wǎng)蛺蝶Melitaeacinxia(Ahmedetal., 2016)、廄螯蠅(Olafsonetal., 2021)、粉虱Aleyrodidae (Renetal., 2020)、木虱Psyllidae (Sloanetal., 2014)、螞蟻Formicidae與沫蟬Cercopoidea(Dhaygudeetal., 2019)等物種的基因組中。除此之外,粉蚧Psudococcidae中許多營養(yǎng)合成基因來自于其兼性腸道微生物和共生菌,如Tremblaya菌以及Tremblaya菌內的Moranella菌等γ-變形桿菌(Husniketal., 2013; Husnik and McCutcheon, 2016)。而家蠶Bombyxmori及其它鱗翅目中22個HGT基因主要來自昆蟲病原細菌,涉及糖基水解、氧化還原和氨基酸代謝等功能(Lietal., 2011)。來源于腸桿菌科Enterobacteriaceae等腸道微生物的HGT在鱗翅目(Sunetal., 2013; Wheeleretal., 2013)、鞘翅目(Keelingetal., 2013)和竹節(jié)蟲目(Shelomietal., 2016)等昆蟲中也有報道。
來自真菌的昆蟲HGT主要是分解果膠的聚半乳糖醛酸酶GH28基因(部分)和分解纖維素的纖維素酶GH45基因。這兩種酶廣泛存在于包括米象Sitophilusoryzae(Shenetal., 2003)、光肩星天牛(McKennaetal., 2016)和桑角天牛Aprionajaponica(Pauchetetal., 2014)等在內的植食性甲蟲Phytophaga,能夠幫助甲蟲消化植物細胞壁(Kirschetal., 2014; Buschetal., 2019; McKennaetal., 2019; Hazzourietal., 2020)。幫助紅棕象甲Rhynchophorusferrugineus有效消化食物的糖苷水解酶GH16基因也可能來自真菌或細菌(Hazzourietal., 2020)。另外,蚜蟲(Moran and Jarvik, 2010; Novakova and Moran, 2012)和癭蚊Cecidomyiidae (Cobbsetal., 2013)中的類胡蘿卜素合成基因被推斷來自真菌。煙粉虱Bemisiatabaci的基因組經(jīng)過HGT指數(shù)h的方法搜索出142個HGT基因,其中78個基因可能來自真菌(Chenetal., 2016)。來源真菌的HGT基因在家蠶(Wangetal., 2019)和寄生蜂(Martinsonetal., 2016)中也有報道。
來自植物的HGT除果蠅外,目前只發(fā)現(xiàn)存在于粉虱和家蠶中。Zhuetal.(2011)通過搜索家蠶的基因組,發(fā)現(xiàn)了10個HGT基因,包括1個來自植物的基因芳香開環(huán)雙加氧酶LigB亞基和9個來自細菌的基因。Lapadulaetal.(2020)在煙粉虱和溫室白粉虱Trialeurodesvaporariorum中均發(fā)現(xiàn)2~3個來自植物的HGT基因核糖體失活蛋白基因RIP,而Xiaetal.(2021)則在煙粉虱中驗證并探究了來自植物的酚苷丙二酰轉移酶BtPMaT1基因。
有報道表明,昆蟲中的HGT可能是由噬菌體或繭蜂病毒等病毒介導的(Zakharov, 2016; Drezenetal., 2017)。目前通過系統(tǒng)發(fā)育關系顯示是由病毒提供的HGT報道多見于鱗翅目中,如夜蛾屬Spodoptera中發(fā)現(xiàn)來自病毒的gasmin基因(Gasmietal., 2016; Di Lelioetal., 2019)和類繭蜂病毒凝集素Se-BLLs基因(Gasmietal., 2018),其中棉貪夜蛾Spodopteralittoralis的gasmin基因可能來自寄生蜂的共生病毒(Di Lelioetal., 2019)。Chengetal.(2014)發(fā)現(xiàn)裸病毒Nudiviridae提供了32個核心基因轉移到宿主褐飛虱Nilaparvatalugens的基因組上。Morozovetal.(2017)則發(fā)現(xiàn)RNA病毒的解旋酶序列整合到了鱗翅目、半翅目、直翅目、膜翅目和蚊子等昆蟲的轉座子中,可能有抑制轉錄后RNA沉默的作用。另外,果蠅(Versteretal., 2019)和黑森癭蚊(Zhaoetal., 2015)中也曾報道可能來自噬菌體的HGT。
少部分昆蟲HGT來自原生動物等非后生動物的其它生物。東亞飛蝗Locustamigratoria(Haoetal., 2019)、果蠅(Crispetal., 2015)、寄生蜂(Huangetal., 2021)及鱗翅目昆蟲(Sunetal., 2013)中均發(fā)現(xiàn)可能來自黏菌等原生生物的HGT基因。
昆蟲轉座子則被證實能夠在昆蟲之間進行水平轉移,昆蟲基因組中平均2.08%、最高24%的核苷酸是水平轉移的轉座子,水平轉移的轉座子在伊蚊屬基因組中占到7%,而在按蚊屬基因組僅占小部分,這些轉座子是影響昆蟲基因組進化的主要力量(Peccoudetal., 2017; de Melo and Wallau, 2020)。鱗翅目的轉座子水平轉移比其它昆蟲和節(jié)肢動物更多,而桿狀病毒經(jīng)常攻擊鱗翅目,在病毒感染過程中,蛾類DNA被整合到桿狀病毒基因組中,其中大多數(shù)是轉座元件,平均4.8%的病毒含有蛾類的DNA,說明桿狀病毒是節(jié)肢動物水平基因轉移潛在的重要媒介(Gilbertetal., 2016; Reissetal., 2019)。另外,HGT事件產生的基因也可能含有昆蟲本身的基因片段,如存在于雙翅目、膜翅目和蟋蟀等昆蟲的oskar基因,其LOTUS結構域來自昆蟲本身,而OSK結構域來自細菌的類GDSL結構域(Blondeletal., 2020)。
HGT的受體指的是外源基因轉入的物種。從以往的經(jīng)驗來看,HGT在真核生物物種中是廣泛存在的(Hotoppetal., 2007; Crispetal., 2015)。但目前昆蟲HGT的研究仍集中在部分昆蟲,尤其是模式昆蟲,主要包括半翅目、鱗翅目、鞘翅目、膜翅目和雙翅目等物種較多的類群,也有少部分其它類群的昆蟲(圖2,表3)。
表3 近年報道的功能較明確的昆蟲HGT經(jīng)典案例
續(xù)表1 Continued table 1
續(xù)表1 Continued table 1
圖2 現(xiàn)階段昆蟲HGT研究中發(fā)現(xiàn)的供體和受體Fig.2 Donors and recipients of HGT in insects identified in the present researches注:圖中昆蟲的系統(tǒng)發(fā)育關系參考Misof et al. (2014)的研究結果,現(xiàn)存物種數(shù)參考Rainford et al. (2014)的數(shù)據(jù)。Note: The phylogenetic relationship of insects in the figure referred to the research results of Misof et al. (2014), and extant richness referred to the data of Rainford et al. (2014).
半翅目的HGT研究主要集中在胸喙亞目Sternorrhyncha。胸喙亞目昆蟲與主要屬于γ-變形桿菌的共生菌組成密切的共生系統(tǒng),如蚜蟲和Buchnera菌(Nakabachietal., 2005; Nikoh and Nakabachi, 2009; Nikohetal., 2010; Richardsetal., 2010; Nakabachietal., 2014; Nicholsonetal., 2015)、粉蚧和Tremblaya/Moranella菌(Husniketal., 2013; Husnik and McCutcheon, 2016; Szaboetal., 2017; Bublitzetal., 2019)、粉虱和Portiera菌(Luanetal., 2015; Chenetal., 2016; Xieetal., 2018; Renetal., 2020; Renetal., 2021)以及木虱和Carsonella菌(Sloanetal., 2014)。這些研究發(fā)現(xiàn),昆蟲含菌體細胞中細菌來源的HGT基因的表達能夠補全共生菌缺失的營養(yǎng)和結構合成通路。相似的共生機制在頭喙亞目Auchenorrhyncha的葉蟬Cicadellidae中也有發(fā)現(xiàn)(Maoetal., 2018; Mao and Bennett, 2020)。蟬的共生菌也缺乏完整的tRNA合成通路(Van Leuvenetal., 2019),預示著這套共生機制可能在頭喙亞目甚至更廣的類群中也普遍存在。
此外,蚜蟲中存在來自細菌的溶菌酶GH25基因 (Metcalfetal., 2014)和來自真菌的類胡蘿卜素合成基因(Moran and Jarvik, 2010; Novakova and Moran, 2012),而粉虱中還檢測到RIP(Lapadulaetal., 2020)、BtPMaT1(Xiaetal., 2021)等植物基因和78個真菌基因(Chenetal., 2016)。褐飛虱(Chengetal., 2014)、茶翅蝽(Ioannidisetal., 2014; Sparksetal., 2020)、煙盲蝽(Fergusonetal., 2020)、乳草長蝽(Panfilioetal., 2019)與溫帶臭蟲(Benoitetal., 2016)等物種也有研究報道過HGT的存在。
在鱗翅目中,HGT研究最多的物種是模式生物的家蠶(Lietal., 2011; Sunetal., 2013; Wheeleretal., 2013; Wybouwetal., 2014; Wangetal., 2019),也涉及棉貪夜蛾(Di Lelioetal., 2019)、甜菜夜蛾Spodopteraexigua(Gasmietal., 2016; Gasmietal., 2018)、煙草天蛾Manducasexta(Kanostetal., 2016)、菜粉蝶Pierisrapae(van Ohlenetal., 2016)、東方菜粉蝶Pieriscanidia(Subbarayanetal., 2016)和網(wǎng)蛺蝶(Ahmedetal., 2016)等物種。鱗翅目的HGT基因中不少與植物的消化和解毒有關,如糖苷水解酶GH31基因(Wheeleretal., 2013)、β-呋喃果糖苷酶GH32基因 (Daimonetal., 2008)、半胱氨酸合成酶(Wybouwetal., 2014; van Ohlenetal., 2016)及犬尿氨酸酶(Mengetal., 2009)等。
植食甲蟲Phytophaga與以糖苷水解酶家族(glycoside hydrolases, GH)為主的內源性植物細胞壁降解酶(plant cell wall degrading enzymes, PCWDEs)是鞘翅目HGT研究的熱點。在植食甲蟲中普遍發(fā)現(xiàn)來自細菌或真菌的植物細胞壁降解酶或其它植物消化酶,這些HGT基因可能是植食甲蟲在中生代多元化的關鍵(Shenetal., 2003; Pauchetetal., 2010; Acunaetal., 2012; Keelingetal., 2013; Pauchet and Heckel, 2013; Eyunetal., 2014; Kirschetal., 2014; Pauchetetal., 2014; Vegaetal., 2015; Kirschetal., 2016; McKennaetal., 2016; Buschetal., 2019; Kirschetal., 2019; McKennaetal., 2019)。另外,在綠豆象(Kondoetal., 2002; Nikohetal., 2008)和松墨天牛(Aikawaetal., 2009)中存在沃爾巴克氏體的多個基因;而在瓢蟲亞科Coccinellinae中則存在支系特異的細菌細胞壁水解酶cwh基因(Lietal., 2021b)。
在膜翅目中,HGT研究以寄生蜂為代表。在Leptopilinaheterotoma、L.boulardi(Huangetal., 2021)、蠅蛹金小蜂Nasoniavitripennis(Werrenetal., 2010; Martinsonetal., 2016)、N.giraulti與N.longicornis(Werrenetal., 2010)及Diachasmaalloeum(Tvedteetal., 2019)等寄生蜂中均有HGT的報道。在螞蟻中也存在來自沃爾巴克氏體的DNA片段,包含轉座酶、ABC轉運體和錨蛋白重復包含蛋白等83個基因(Dhaygudeetal., 2019)。
果蠅作為模式生物類群,被用于許多HGT搜索的研究,例如Crispetal.(2015)、Versteretal.(2019)、Hotoppetal.(2007)以及Emamehetal.(2016)等的研究。另外,在廄螯蠅的基因組中發(fā)現(xiàn)來自沃爾巴克氏體的3個片段,但未發(fā)現(xiàn)蛋白基因(Olafsonetal., 2021)。庫蚊與伊蚊 (Lapadulaetal., 2017)、癭蚊(Cobbsetal., 2013; Zhaoetal., 2015; Subramanyametal., 2021)等蚊類物種中也有發(fā)現(xiàn)毒素和植物消化等不同作用的HGT基因。值得注意的是,在許多其它類群研究中發(fā)現(xiàn)的一些HGT在庫蚊、伊蚊、按蚊和癭蚊等蚊類物種中也存在相似的基因,不同的是,其中一部分基因是通過另外獨立的HGT事件進入的,如幾丁質酶GH19基因 (Martinsonetal., 2016)、β-碳酸酐酶β-CA基因(Emamehetal., 2016)、RNA病毒的解旋酶(Morozovetal., 2017)及細胞壁水解酶cwh基因(Lietal., 2021b)等,HGT的頻繁發(fā)生可能與蚊類較為惡劣的生存環(huán)境有關。
在竹節(jié)蟲及德國小蠊Blatellagermanica中也有內源性植物消化酶的報道,包括聚半乳糖醛酸酶GH28等消化果膠的酶(Shelomietal., 2014; Shelomietal., 2016; Wuetal., 2016; Brandetal., 2018)。此外,東亞飛蝗(Haoetal., 2019)與西花薊馬(Rotenbergetal., 2020)等物種也報道了HGT的存在。
早期研究普遍認為,昆蟲中缺乏植物細胞壁的消化酶,而共生微生物是昆蟲“半路出家”的關鍵,可以幫助植物消化、解毒植物的毒素,而隨著組學技術的發(fā)展,越來越多昆蟲HGT獲得的內源性植物細胞壁降解酶、營養(yǎng)吸收與解毒的基因被發(fā)現(xiàn)和研究(圖3),這些基因對昆蟲適應植食、“半路出家”有著重要的意義(Calderon-Cortesetal., 2012; Wybouwetal., 2016; Skidmore and Hansen, 2017; Masonetal., 2019; Tokuda, 2019)。
植物細胞壁降解酶除GH1和GH9來源于動物祖先(Chang and Lai, 2018)外,一般來自細菌或真菌,大多屬于糖苷水解酶GH家族,包括分解果膠的碳水化合物酯酶CE8、多聚糖裂解酶PL4和GH28;分解蔗糖的GH32;分解半纖維素的GH5-2、GH5-8、GH5-10、GH5-12、GH10、GH11和分解纖維素的GH43、GH44、GH45、GH48等,這些酶主要集中報道于植食甲蟲Phytophaga中,在許多植食性昆蟲中也有記錄 (Calderon-Cortesetal., 2012; Pauchet and Heckel, 2013; McKennaetal., 2019)。Shenetal.(2003)在米象中發(fā)現(xiàn)了一種可能來自真菌的果膠消化酶——聚半乳糖醛酸酶GH28;Acunaetal.(2012)在咖啡果小蠹Hypothenemushampei的中腸分泌組中發(fā)現(xiàn)一種屬于GH5家族的酶——甘露聚糖酶HhMAN1,能夠水解咖啡豆中的半乳甘露聚糖,而其基因組中搜索得到10個HGT基因,包括2個木聚糖酶和2個甘露聚糖酶基因(Vegaetal., 2015);在芥菜葉甲Phaedoncochleariae的基因組中,Pauchet and Heckel (2013)發(fā)現(xiàn)有編碼活性木聚糖酶GH11的基因存在;在山松甲蟲Dendroctonusponderosae(Keelingetal., 2013)、白蠟窄吉丁Agrilusplanipennis(Zhaoetal., 2014)和甘蔗象甲Sphenophoruslevis(Pedezzietal., 2014)體內則均發(fā)現(xiàn)了GH32家族的β-呋喃果糖苷酶scrB基因。在其他類群的植食性昆蟲中也有相似的HGT細胞壁降解酶的研究,如竹節(jié)蟲中來源于細菌的果膠酶基因在前中腸中大量表達,底物酶活性實驗也證明其可以降解果膠和聚半乳糖醛酸,證明了這些果膠酶在竹節(jié)蟲消化植物中的重要作用(Shelomietal., 2014; Shelomietal., 2016);黑森癭蚊GH32家族的MdesGH32基因的蛋白則擁有菊粉酶和轉化酶活性,協(xié)助將植物細胞壁菊粉聚合物分解為單體,并將植物主要運輸糖蔗糖轉化為葡萄糖和果糖,從而形成有利于黑森癭蚊寄生的富含營養(yǎng)的組織(Subramanyametal., 2021)。在這些細胞壁降解酶與植食性昆蟲聯(lián)系的認識基礎上,越來越多的研究將這些細胞壁降解酶與植食性昆蟲聯(lián)系成為一個整體,用大量數(shù)據(jù)去深入探究它們的作用。Buschetal.(2019)研究了植食甲蟲纖維素酶GH45的作用,發(fā)現(xiàn)其能夠降解3種底物:無定形纖維素、木葡聚糖和葡甘露聚糖。Kirschetal.(2019)則以植食甲蟲的GH28作為研究對象,探究了其中的假酶(pseudoenzymes),也就是失去了果膠催化活性的酶,他們認為這些假酶也是果膠消化途徑的一部分,假酶降低了能量轉化效率并延長了甲蟲的發(fā)育歷期,對消化過程的影響甚至超過了活性酶。McKennaetal.(2019)研究了鞘翅目昆蟲的進化歷史,以系統(tǒng)發(fā)育分析和比較基因組學為手段,發(fā)現(xiàn)不同支系的植食性甲蟲在獲得大量消化細胞壁的HGT后往往開始適應性輻射進化,占據(jù)了多樣的生態(tài)位。這些細胞壁降解酶在HGT發(fā)生后通常會經(jīng)歷基因的復制和擴張以及亞功能化(Kirschetal., 2016; Brandetal., 2018; Kirschetal., 2019)。
促進植物營養(yǎng)吸收的基因包括糖類代謝、氨基酸合成、維生素合成和類胡蘿卜素合成等的基因。促進糖類代謝的基因除消化細胞壁成分的降解酶外,還包括消化胼胝質的GH16基因 (Hazzourietal., 2020)與糖苷水解酶GH31基因 (Lietal., 2011; Sunetal., 2013; Wheeleretal., 2013)等。氨基酸和維生素合成基因包括精氨琥珀酸裂解酶argH、分支酸變位酶CM及生物素合成酶bioB等許多基因,這些基因與半翅目胸喙亞目及其共生菌的共生系統(tǒng)有關(Luanetal., 2015; Wybouwetal., 2016)。而類胡蘿卜素合成基因最初發(fā)現(xiàn)于豌豆長管蚜Acyrthosiphonpisum中,蚜蟲基因組中發(fā)現(xiàn)了來自真菌的類胡蘿卜素去飽和酶和類胡蘿卜素環(huán)化酶/合成酶(Moran and Jarvik, 2010)。Novakova and Moran (2012)研究發(fā)現(xiàn),蚜蟲和球蚜中均存在這些基因,說明HGT事件發(fā)生在這些類群的共同祖先出現(xiàn)之前。隨后,相似的基因在癭蚊中被發(fā)現(xiàn),而這些基因可能是由不同的HGT事件進入的(Cobbsetal., 2013)。另外,在其它節(jié)肢動物的葉螨中,也有真菌源類胡蘿卜素合成基因的報道(Altinciceketal., 2012)。
植物在昆蟲取食時會使用一些防御手段,如釋放氰化物等毒素,針對這個防御手段,昆蟲通過HGT獲得能夠解毒的基因,從而沖破植物的防線達到取食植物的目的。存在于鱗翅目和柑橘粉蚧Planococcuscitri等昆蟲的半胱氨酸合成酶CAS具有解毒植物氰化物的功能(Husniketal., 2013; Wybouwetal., 2014; van Ohlenetal., 2016)。家蠶中的β-呋喃果糖苷酶GH32具有解毒桑葉毒素的作用,犬尿氨酸酶同樣具有解毒植物毒素的作用(Daimonetal., 2008; Mengetal., 2009; Lietal., 2011; Zhuetal., 2011; Sunetal., 2013)。近日,Xiaetal.(2021)在煙粉虱中發(fā)現(xiàn)一個來自植物的近期HGT基因——酚苷丙二酰轉移酶BtPMaT1基因,經(jīng)過對番茄葉毒素的鑒定以及對煙粉虱的RNA干擾等實驗,發(fā)現(xiàn)該基因可以中和解毒植物中的毒素酚苷,這很可能促進了煙粉虱近期的食性擴張。另外,對不同物種的RNA干擾結果還表明通過dsRNA的手段可以對煙粉虱進行靶標性的防治。
胸喙亞目昆蟲,包括蚜蟲、粉蚧、粉虱和木虱等類群,體內通常伴隨著一類基因組小于0.5 Mb、十分微小的共生菌,這些共生菌能為宿主昆蟲提供植物汁液食物缺乏的必需氨基酸和維生素等營養(yǎng)(Baumann, 2005; McCutcheon and Moran, 2012; Douglas, 2016)。近期的研究顯示,這些胸喙亞目昆蟲中存在一種專門儲存共生菌的含菌體器官,其中的含菌體細胞能夠表達細菌來源的HGT基因,補全這類微小共生菌缺失的營養(yǎng)物質或結構合成環(huán)節(jié),使得胸喙亞目昆蟲與共生菌聯(lián)系緊密,難以分割(圖3)。
胸喙亞目昆蟲共生體系的HGT基因最初發(fā)現(xiàn)于蚜蟲中。Nakabachietal.(2005)在豌豆長管蚜的含菌體中發(fā)現(xiàn)了兩條區(qū)別于共生菌Buchnera的轉錄本,其含有與細菌相似的基因。對這兩條轉錄本測序發(fā)現(xiàn),這兩條轉錄本含有類似細菌的LD-羧肽酶ldcA基因和稀有脂蛋白rlpA基因,這兩個基因能夠參與合成細菌細胞壁的主要成分肽聚糖,而Buchnera菌正好缺失了這部分基因(Nikoh and Nakabachi, 2009)。Richardsetal.(2010)通過搜索豌豆長管蚜的基因組發(fā)現(xiàn)了12個HGT基因,包括了3個ldcA和5個rlpA基因以及2個來自Buchnera菌的基因,其中7個基因在含菌體細胞中表達較高。Nakabachietal.(2014)在之后的研究中通過免疫化學的實驗觀察到含菌體表達的rlpA4的蛋白被轉運進入Buchnera菌的細胞中。而Nicholsonetal.(2015)在麥雙尾蚜Diuraphisnoxia的基因組中同樣發(fā)現(xiàn)來自細菌的ldcA和rlpA基因。
在粉蚧中,這種共生機制進一步得到詮釋。Husniketal.(2013)在柑橘粉蚧的含菌體中尋找到22個轉錄的HGT基因,其中2個賴氨酸合成基因與5個維生素B合成基因能夠補全共生菌Tremblaya及其胞內共生菌Moranella的必需氨基酸以及維生素合成通路,為粉蚧提供食物中缺乏的營養(yǎng)物質,而另外9個肽聚糖合成相關基因與Moranella菌的細胞壁合成有關,為我們展示了粉蚧中復雜的三重共生體系。隨后,Husnik and McCutcheon (2016)調查了5種不同粉蚧物種內的共生體系,發(fā)現(xiàn)這套HGT的機制穩(wěn)定存在于粉蚧、Tremblaya菌和γ-變形桿菌的共生體系中,其中較為古老的HGT主要與氨基酸和維生素B合成和代謝有關,而后期HGT主要與肽聚糖合成代謝有關。同樣,甘露粉蚧Trabutinamannipara中也發(fā)現(xiàn)了類似的共生體系和HGT機制(Szaboetal., 2017)。對于粉蚧中獲得的肽聚糖合成相關基因,Bublitzetal.(2019)做了進一步的探究,揭示了粉蚧中的HGT與Moranella菌的基因共同協(xié)作合成Moranella菌外周的肽聚糖層,并通過免疫組織化學的手段發(fā)現(xiàn)其中一個HGT基因MurF編碼的蛋白已經(jīng)進入到Moranella菌的細胞質。
在煙粉虱的研究中,Luanetal.(2015)同樣發(fā)現(xiàn)其存在8個HGT基因能夠補全共生的Portiera菌中缺失的賴氨酸/蘇氨酸、苯丙氨酸/色氨酸和精氨酸合成通路,另外2個HGT基因BioA、BioB在已有的基礎上進一步增補共生的Hamiltonella菌生物素的合成。Chenetal.(2016)和Xieetal.(2018)測序得到的煙粉虱基因組也驗證了這些HGT的存在。Renetal.(2020)進一步探究了粉虱和Hamiltonella菌的維生素B7生物素合成途徑,發(fā)現(xiàn)粉虱體內的HGT基因BioA、BioD及BioB能夠合成生物素,與Hamiltonella菌合成的生物素相互補充,提高粉虱存活率和繁殖率。隨后,粉虱中的維生素B5泛酸合成途徑也被研究。Renetal.(2021)發(fā)現(xiàn)細菌中的泛酸合成基因panB和panC在煙粉虱中融合成一個基因panBC,能夠補全Portiera菌的泛酸合成通路,提高粉虱的適應性。
楊梅葉柄癭木虱Pachypsyllavenusta中也存在與共生菌互補的HGT基因,其中精氨琥珀酸裂解酶argH基因能夠補全共生的Carsonella菌的精氨酸合成通路,分支酸變位酶CM是苯丙氨酸合成的必要酶,另外還有維生素B2核黃素合成酶ribC基因等7個HGT基因(Sloanetal., 2014)。
胸喙亞目昆蟲與胞內共生菌這套“難舍難分”的協(xié)作共生機制似乎與線粒體、葉綠體等細胞器有很多相似的地方,可能為我們帶來細胞器初期演化的一些啟示。
昆蟲通過HGT能夠從細菌中奪取細菌細胞壁代謝的相關基因,從而用于降解細菌細胞壁,以達到抗菌的作用(圖3)。Hotopp and Estes (2014)認為,這是真核生物在生物戰(zhàn)爭中反擊的利器。煙粉虱奪取植物基因BtPMaT1對付植物毒素也是類似的機制(Xiaetal., 2021)。以子之“矛”攻子之“盾”,堪稱為生物進化中的智慧。
圖3 昆蟲HGT的主要功能Fig.3 The main function of insect HGT注:(A)“半路出家”,昆蟲通過HGT從細菌、真菌或植物中獲得與細胞壁降解、營養(yǎng)吸收與解毒相關的基因,從而獲得植食性;(B)“難舍難分”的共生,胸喙亞目昆蟲通過HGT從細菌中獲得部分營養(yǎng)合成基因,與共生菌基因協(xié)作合成所需的營養(yǎng);(C)以子之“矛”攻子之“盾”,昆蟲通過HGT從細菌中奪取抗菌作用的基因;(D)借“刀”殺“人”,昆蟲從微生物或原生動物中借來毒素或防御相關基因,在寄生蜂的寄生中發(fā)揮重要作用。Note: (A) Become a monk or nun late in life, insects acquired genes related to cell wall degradation, nutrient absorption and detoxification from bacteria, fungi or plants through HGT, thus acquiring herbivory; (B) Inseparable symbiosis, Sternorrhyncha insects acquired part of nutrient synthesis genes from bacteria through HGT, which can cooperate with genes in symbiosis bacteria to produce the required nutrients; (C) Turn somebody’s battery against himself, insects robbed antimicrobial genes from bacteriathrough HGT; (D) Borrow a knife to kill a man, insects borrowed toxins or defense-related genes from microorganisms or protozoans, which play an important role in parasitizing of parasitic wasps.
Lietal.(2021b)利用38種瓢蟲的轉錄組數(shù)據(jù),以及數(shù)個瓢蟲基因組,鑒定出一組細菌細胞壁水解酶cwh基因,該基因在真核生物中十分罕見,但在包含大部分瓢蟲科Coccinellidae物種的瓢蟲亞科物種中均穩(wěn)定存在,而在物種較少的小維氏瓢蟲亞科Microweiseinae中缺乏該基因。經(jīng)過系統(tǒng)發(fā)育分析,證明該基因是來源于細菌的HGT,在進入瓢蟲亞科祖先后分化為兩支,分別是無信號肽的cwh1和包含信號肽的cwh2,cwh1在食性范圍較廣的瓢蟲族Coccinellini的多個物種中發(fā)生了復制,表明了該基因對食性擴張可能有一定的貢獻。而時空表達譜表明,瓢蟲各器官以及各發(fā)育階段的表達量相似,說明這些基因在瓢蟲體內穩(wěn)定發(fā)揮作用。經(jīng)過實驗發(fā)現(xiàn),感染枯草芽孢桿菌導致瓢蟲體內cwh基因表達上調,而且體外表達的蛋白能夠抑制細菌的增殖,經(jīng)過RNA干擾后,其它抗菌基因的表達量顯著下調,表明cwh基因在抗菌免疫防御中發(fā)揮作用。隨后,Lietal.(2021a)測序了生物防治天敵孟氏隱唇瓢蟲Cryptolaemusmontrouzieri的高質量基因組,并做了比較基因組學和不同食物處理的轉錄組分析,發(fā)現(xiàn)cwh等免疫基因在取食人工飼料后相比天然獵物的粉蚧發(fā)生下調,揭示了免疫基因在瓢蟲取食胸喙亞目昆蟲的食性中發(fā)揮了重要作用。cwh基因在白堊紀晚期進入瓢蟲亞科祖先,可能在瓢蟲的獵物適應、生態(tài)位擴張和物種輻射進化中發(fā)揮了重要的作用(Lietal., 2021b)。
豌豆長管蚜(Metcalfetal., 2014)和茶翅蝽(Ioannidisetal., 2014)的基因組中也存在從細菌搶奪而來的溶菌酶基因;煙盲蝽從Sodalis菌奪取了吩嗪合成蛋白的編碼基因,而吩嗪有抗菌的效果,這個HGT可能在煙盲蝽體內發(fā)揮了抗菌的作用(Fergusonetal., 2020);乳草長蝽同樣存在與細胞壁代謝相關的HGT基因,可能有相同的抗菌作用(Panfilioetal., 2019)。在其它節(jié)肢動物中也有類似功能的HGT,細菌來源的抗菌性HGT酰胺酶效應器dae基因在蜱對抗皮膚細菌的過程中發(fā)揮著重要的作用(Chouetal., 2015; Hayesetal., 2020)。除此之外,甜菜夜蛾從多DNA病毒搶奪的gasmin基因能夠抑制桿狀病毒增殖(Gasmietal., 2016);而夜蛾屬奪取病毒的類繭蜂病毒凝集素Se-BLLs基因以對抗體內病毒(Gasmietal., 2018)。
然而,抗菌的HGT可能并不是從目標類群奪取的,昆蟲同樣不介意奪取其它類群物種的“矛”來攻擊細菌或真菌。棉貪夜蛾從寄生蜂共生病毒奪取的gasmin基因能夠參與免疫反應,促進血細胞吞噬細菌(Di Lelioetal., 2019)。家蠶與其它鱗翅目中來自真菌的4,5-多巴加雙氧酶BmDODA基因參與多巴代謝,并能夠促進抗菌活性(Wangetal., 2019)。而家蠶中GH18家族的幾丁質酶BmChi-h基因可能參與降解真菌的細胞壁,起到抗真菌的作用(Daimonetal., 2003)。
昆蟲可以通過HGT從其它類群生物中借來一些與毒素和防御有關的基因,用來對付天敵或者獵物,達到借“刀”殺“人”的目的(圖3)。Huangetal.(2021)對廣寄生性的果蠅寄生蜂Leptopilinaheterotoma和專性寄生蜂L.boulardi進行了轉錄組和蛋白組的研究,在L.heterotoma中發(fā)現(xiàn)可能來自微生物或原生動物的淋巴腺凋亡相關蛋白Lar基因,該蛋白能夠溶解果蠅的淋巴腺,從而主動抑制果蠅的免疫反應,達成該寄生蜂廣泛寄生的目的;而L.boulardi中存在來自共生菌的含有粘蛋白結合域的蜂卵粘附相關蛋白Warm基因,該蛋白能夠將蜂卵粘附在宿主組織上逃避宿主免疫細胞的完全包裹,使孵化的寄生蜂幼蟲能夠從粘附面逃出,而達成寄生專一宿主的功能。這些基因在獲得后均經(jīng)過復制和亞功能化,促進了寄生蜂宿主范圍的轉移。蠅蛹金小蜂從真菌微孢子蟲中獲得的幾丁質酶GH19基因能夠上調宿主真菌保護基因的表達,操縱宿主的免疫系統(tǒng),可能消耗宿主的能量并降低宿主營養(yǎng)質量,從而作為毒素提高寄生的成功率(Martinsonetal., 2016)。東方菜粉蝶則存在細菌HGT基因——半胱天冬酶依賴的細胞凋亡誘導蛋白pierisin-5基因,該基因能發(fā)揮細胞毒性的作用,促進細胞的凋亡(Subbarayanetal., 2016)。在其它節(jié)肢動物的蜈蚣中,至少有5個毒素基因來自細菌或真菌,而其中β-PFTx和centiPAD等多個毒素基因存在其它獨立轉移至鱗翅目、鞘翅目和膜翅目等類群中部分昆蟲的HGT事件(Undheim and Jenner, 2021)。
此外,粉虱中從植物、蚊子從藍藻中分別獲得核糖體失活蛋白RIP基因,之前的研究發(fā)現(xiàn)這個基因在果蠅中的共生螺原體Spiroplasma中具有防御線蟲的作用,以此推測粉虱和蚊子中這些HGT也有相似的功能(Hamiltonetal., 2016; Lapadulaetal., 2017; Lapadulaetal., 2020)。果蠅從蚜蟲共生菌CandidatusHamiltonelladefensa或其噬菌體獲得的細胞致死膨脹毒素cdtB基因可能也具有該共生菌防御寄生蜂的功能(Versteretal., 2019)。黑森癭蚊擁有來自噬菌體的YD毒素,同樣可能與寄生蜂防御有關(Zhaoetal., 2015)。
昆蟲中的HGT基因還存在許多其它的功能。鱗翅目中的犬尿氨酸酶(Mengetal., 2009; Lietal., 2011; Sunetal., 2013; Wheeleretal., 2013)、蚜蟲和癭蚊的類胡蘿卜素合成基因(Moran and Jarvik, 2010; Novakova and Moran, 2012; Cobbsetal., 2013)除了植物營養(yǎng)吸收外還可能與昆蟲的身體色彩有關。在果蠅中存在的oskar基因則與神經(jīng)模式和卵子發(fā)生有關,在昆蟲繁殖中發(fā)揮重要作用(Blondeletal., 2020)。蚊子和果蠅中的細菌源β-碳酸酐酶β-CA高效催化CO2的水合作用,參與包括呼吸、pH及CO2穩(wěn)態(tài)、生物合成與毒力調節(jié)等生理過程(Emamehetal., 2016)。東亞飛蝗的類黏菌蛋白激酶MPKL則有誘導光周期滯育的作用(Haoetal., 2019)。這些HGT基因往往幫助昆蟲獲得了新性狀,從而獲得更適應環(huán)境的能力。另外,還有大量搜索出來的HGT基因功能并未得到明確。
昆蟲HGT研究作為近年昆蟲研究的熱點,為我們揭開了昆蟲適應和進化機制的一角。昆蟲植食食性的獲得、營養(yǎng)合成、昆蟲免疫以及寄生蜂的寄生與宿主的防御等表型的改變或生理的過程,均與HGT有著密切的聯(lián)系。而且,無論是內源性植物消化解毒酶、與共生菌協(xié)作合成氨基酸和維生素、捕食性瓢蟲的免疫基因還是寄生蜂的宿主毒性,均與昆蟲食性的適應和擴張有關,表明了HGT與昆蟲食性之間千絲萬縷的關系。然而,在深入研究昆蟲HGT之前,我們需要注意現(xiàn)階段研究中一些不足:
(1) HGT的搜索與驗證缺乏一套嚴謹?shù)南到y(tǒng)化的方法,且供體類群考慮不全面。目前HGT的搜索大多基于同源搜索的結果,再加以系統(tǒng)發(fā)育分析和真核序列的驗證。但搜索階段容易受到數(shù)據(jù)庫質量、其它物種污染和近源物種HGT等問題的影響,缺乏一套系統(tǒng)化的方法,也容易造成搜索結果的缺失或誤判。目前較為常用的HGT指數(shù)h等的流程化方法較為簡單,但還很難解決以上的問題。另外,系統(tǒng)發(fā)育分析中可能會受到數(shù)據(jù)庫物種序列缺失或錯誤以及系統(tǒng)發(fā)育不確定性等影響,無法準確還原HGT的歷程,同時很難解釋獨立多次發(fā)生的古老HGT與基因復制丟失等其它進化事件的區(qū)別。而真核序列驗證過程較為繁瑣,也存在無法排除物種中穩(wěn)定且特異的胞內共生菌或腸道微生物基因的可能性。研究中對供體的考慮大多受限于細菌,而對真菌、植物、病毒和原生動物等類群的考慮較少,幾乎沒有古菌和其它后生動物等其它類群的報道,這可能是因為病毒序列不穩(wěn)定,而真菌、植物等真核生物與昆蟲較為近源,序列容易混淆造成誤判,造成研究者不愿考慮這些類群來源的HGT。Alienness網(wǎng)絡服務器能較好的處理HGT搜索中流程化、近源物種HGT和多種類型供體等的問題,但目前僅應用于Undheim and Jenner (2021)等較少的研究中,且仍然存在需要人為定義近源類群、無法嚴謹排除污染、無法確定HGT方向、準確性欠佳及后續(xù)還需要驗證等不足。
HGT的序列片段或結構域可能會重新參與組成新的基因,如與自身基因組成的oskar基因(Blondeletal., 2020)和互相融合而成的panBC基因(Renetal., 2021)。然而,目前HGT研究中仍以考慮整體基因為主,可能錯過一些含有部分HGT片段的基因。以結構域或基因片段為單位的HGT檢測方法可能會為我們帶來更全面的對HGT的認識。
長期來看,開發(fā)一套嚴謹?shù)南到y(tǒng)化方法是必要的。對于包括昆蟲在內的更加近源的后生動物類群供體,尤其是天敵、獵物及競爭物種等有密切關系的潛在供體,則需要開發(fā)更加精準的區(qū)分方法,基于序列組成的方法可能是一個突破口。
(2) 昆蟲HGT研究的受體昆蟲類群較為局限。HGT研究的受體昆蟲集中于半翅目、鱗翅目、鞘翅目、膜翅目及雙翅目等類群,尤其是胸喙亞目、植食甲蟲等類群和果蠅、蚊子、家蠶等模式生物,其他昆蟲研究較少,包括物種較為豐富的毛翅目、直翅目等類群,半翅目和全變態(tài)類Holometabola以外的昆蟲類群更是缺乏HGT的認識。要完全揭開HGT在昆蟲中的神秘面紗,還需要在更多類群中進行研究,將熱點普遍化。要探究HGT與食性的聯(lián)系,也不能僅關注植食性昆蟲和寄生蜂,捕食性昆蟲、腐食性昆蟲以及菌食性昆蟲也需要更深入的研究。
(3) HGT的功能驗證較為困難,搜索出來的大量HGT并未明確功能。HGT的基因在進入受體昆蟲后往往跟隨昆蟲基因組進行了很長時間的進化,會發(fā)生復制、插入內含子、添加信號肽和亞功能化等進化事件,其具體功能與在細菌等供體中的時候產生了微妙的差別,尤其在個體層面,HGT基因對供體和受體的意義可能相差甚遠。例如代謝酶和營養(yǎng)合成基因,它們在微觀的代謝通路上功能可能是相似的,但個體獲取這些基因的意義往往很難有合理的假設,這就增加了這些基因功能驗證的難度。這需要結合物種的進化歷史、與近緣的非HGT受體的生物學特性比較、表達譜的探究以及嚴謹?shù)南掠喂δ茯炞C。而目前,還有許多搜索發(fā)現(xiàn)的HGT并未得到功能驗證,如煙盲蝽中的吩嗪合成蛋白,可能與其抗菌免疫相關 (Fergusonetal., 2020),如果得到驗證將是一個有趣的發(fā)現(xiàn);而溫帶臭蟲中的類patatin基因僅在雄性表達(Benoitetal., 2016),該基因在生殖或性二型過程中的作用需要進一步挖掘。另外,未發(fā)現(xiàn)表達的HGT基因以及基因組上的HGT片段,究竟是進化過程中的偶然,還是具有潛在的功能,還需要進行探索。
HGT的研究正處于持續(xù)拓展的階段,在技術方法上還需要有更多的突破,在類群的研究上也需要進一步擴大范圍,而這些已發(fā)現(xiàn)的HGT也需要明確在新的生物體中的功能。相信在不久的將來,昆蟲HGT的研究必然會為我們講述更多HGT與昆蟲食性擴張、適應環(huán)境的精彩故事。