田 天, 袁 緩, 陳 斌
(重慶師范大學(xué)昆蟲與分子生物學(xué)研究所, 媒介昆蟲重慶市重點(diǎn)實(shí)驗(yàn)室, 重慶 401331)
肉食亞目(Adephaga)水生類群屬鞘翅目(Coleoptera),是一類具有水生習(xí)性的肉食性真正水生甲蟲,其中很多種類是重要的環(huán)境監(jiān)測生物;還有一些類群的行為活動比較特殊,可以為化學(xué)防御及機(jī)器人運(yùn)動等研究提供重要參考(Romey, 1995; Romey and Wallace, 2007; 習(xí)欠云和王殉章, 2010; Biltonetal., 2019)。根據(jù)Bouchard等(2017)的統(tǒng)計(jì),全世界已描述的肉食亞目水生類群有218屬5 480余種;肉食亞目水生類群共包括8個科,即豉甲科(Gyrinidae)、沼梭甲科(Haliplidae)、偽龍虱科(Noteridae)、瀑甲科(Meruidae)、龍虱科(Dytiscidae)、水甲科(Hygrobiidae)、兩棲甲科(Amphizoidae)和壁甲科(Aspidytidae)(Bouchardetal., 2011, 2017)。肉食亞目水生類群已被廣泛研究,但是其系統(tǒng)發(fā)育關(guān)系仍沒有得到統(tǒng)一的結(jié)論。2002年之前對該類群的研究主要是利用不同形態(tài)學(xué)特征進(jìn)行分析,Baehr, Kavanaugh和Beutel等多位分類學(xué)家先后根據(jù)不同的形態(tài)學(xué)特征提出了差異較大的多種系統(tǒng)發(fā)育假說(習(xí)欠云和王殉章, 2010)。自Ribera等(2002)使用18S rRNA基因作為分子標(biāo)記對肉食亞目水生類群進(jìn)行系統(tǒng)發(fā)育分析之后,Beutel, Balke及Xi 3位學(xué)者分別綜合更多的形態(tài)學(xué)特征和分子標(biāo)記數(shù)據(jù)對該類群進(jìn)行了系統(tǒng)發(fā)育重建(Beuteletal., 2006, 2012; Balkeetal., 2008; Xietal., 2008)。這些綜合更多數(shù)據(jù)的研究都支持豉甲科作為肉食亞目水生類群的基部類群,然而該類群其他科之間的系統(tǒng)發(fā)育關(guān)系仍沒有得到統(tǒng)一的結(jié)論。
線粒體基因組是真核生物的細(xì)胞器基因組,具有母系遺傳、基因組小、組成結(jié)構(gòu)穩(wěn)定等特點(diǎn),被廣泛應(yīng)用于比較基因組學(xué)、系統(tǒng)發(fā)育分析、分子鑒定等研究領(lǐng)域(孫錚等, 2010)。線粒體基因組的13個蛋白質(zhì)編碼基因(protein-coding genes, PCGs)已被廣泛證實(shí)可以用來解決昆蟲綱中不同階元的系統(tǒng)發(fā)育問題(Cameron, 2014)。近年來,許多學(xué)者利用線粒體基因組數(shù)據(jù)對鞘翅目不同階元和類群進(jìn)行過系統(tǒng)發(fā)育分析,但很少有研究對肉食亞目水生類群進(jìn)行專門探究(Yuanetal., 2016; Lopez-Lopez and Vogler, 2017; Nieetal., 2018, 2019; Biltonetal., 2019)。GenBank數(shù)據(jù)庫已公布的肉食亞目水生類群數(shù)據(jù)中(截止2019年9月30日),共有17個物種的線粒體基因組測序較完整,覆蓋了肉食亞目水生類群的8個科。在本研究中,我們測定和分析了圓鞘隱盾豉甲Dineutusmellyi和齒緣龍虱Eretessticticus的線粒體全基因組序列,并利用肉食亞目水生類群8科19種的線粒體基因組序列進(jìn)行了比較分析和系統(tǒng)發(fā)育構(gòu)建,系統(tǒng)地討論了肉食亞目水生類群的系統(tǒng)發(fā)育和進(jìn)化關(guān)系。
新測序的2種鞘翅目昆蟲標(biāo)本均侵泡在無水乙醇中,并保存于重慶師范大學(xué)昆蟲與分子生物學(xué)研究所的-20℃冰箱中。齒緣龍虱E.sticticus于2017年7月采集自重慶市城口縣大巴山;圓鞘隱盾豉甲D.mellyi于2018年10月采集自福建省武夷山。選擇這兩種昆蟲的胸部和足的肌肉組織提取基因組總DNA,并送至深圳市惠通生物科技有限公司構(gòu)建350 bp的小片段文庫和進(jìn)行高通量測序。采用Illumina HiSeq X Ten測序技術(shù)進(jìn)行PE150測序,測序結(jié)果下機(jī)后經(jīng)過質(zhì)控分別得到16.47 Gb(齒緣龍虱)和18.48 Gb(圓鞘隱盾豉甲)的clean reads。之后,按如下步驟進(jìn)行從頭組裝:(1)使用SPAdes 3.0.0將clean reads進(jìn)行從頭組裝得到contigs(Bankevichetal., 2012)。(2)基于序列特征,將來源不同的contigs進(jìn)行分類篩選。將抽取的線粒體序列合并成單獨(dú)的fasta文件。(3)利用PRICE(paired-read iterative contig extension)進(jìn)行迭代延伸,直至延伸的序列穩(wěn)定,長度不再發(fā)生變化為止,最終得到完整的線粒體基因組全序列。
目前,GenBank數(shù)據(jù)庫中已公布了線粒體基因序列的肉食亞目水生類群共有2 950余種,但是其中大部分物種都只測序了少數(shù)幾個基因,只有14個物種的線粒體基因組數(shù)據(jù)是測序完整的。除此以外,Noteridae sp.,Meruphyllisae和Gyrinidae sp.這3個關(guān)鍵類群物種的已測序線粒體基因序列中僅缺少nad2基因,本研究選取這3個物種的其他12個PCGs序列用于本研究。因此,本研究主要是對19個肉食亞目水生類群線粒體基因組的PCGs序列進(jìn)行比較分析,同時(shí)選用2個步甲科物種Damastermirabilissimus和Abaxparallelepipedus作為外群進(jìn)行該類群的系統(tǒng)發(fā)育重建分析。本研究涉及到的物種及線粒體基因組信息見表1。
表1 肉食亞目水生類群19個物種的線粒體基因組信息
先使用Mitos(http:∥mitos.bioinf.uni-leipzig.de/index.py)對圓鞘隱盾豉甲和齒緣龍虱的線粒體基因組全序列進(jìn)行初步注釋(Berntetal., 2013)。之后,將PCGs和rRNA基因通過與近緣種線粒體基因組的注釋結(jié)果進(jìn)行比較,并在Geneious v4.8.5中對初步注釋結(jié)果進(jìn)行校正(Kearseetal., 2012)。tRNA基因使用tRNAscan-SE 2.0進(jìn)行校正和二級結(jié)構(gòu)的預(yù)測分析(Lowe and Eddy, 1997)。注釋完成后使用OGDRAW1.3.1繪制圓鞘隱盾豉甲和齒緣龍虱的線粒體基因組結(jié)構(gòu)圖(Lohseetal., 2007)。13個PCGs的AT含量使用MEGA 6.0進(jìn)行計(jì)算(Tamuraetal., 2013);密碼子使用次數(shù)及相對同義密碼子使用頻率(relative synonymous codon usage, RSCU)使用CodonW v.1.4.4進(jìn)行計(jì)算(Peden, 2000);為了分析13個PCGs在肉食亞目水生類群進(jìn)化過程中的基因突變模式是否存在差異,分別計(jì)算了13個PCGs的非同義突變率(Ka)、同義突變率(Ks)以及非同義突變率與同義突變率的比值(Ka/Ks)。Ka/Ks值是基因進(jìn)化過程中選擇壓力的簡單量度,值的大小分別表示:中性選擇(Ka/Ks=1)、陰性或純化選擇(Ka/Ks<1)、陽性選擇(Ka/Ks>1)。Ka/Ks越接近1,說明該基因的選擇壓力越小(Hurst, 2002; Tomasco and Lessa, 2011)。13個PCGs在進(jìn)化過程中受到的選擇壓力通過DnaSP 5.10.01計(jì)算Ka和Ks值進(jìn)行分析(Librado and Rozas, 2009)。
13個PCGs的多重序列比對在TranslatorX Server(http:∥translatorx.co.uk/)上完成:使用MAFFT對13個PCGs分別進(jìn)行多重序列比對,并使用Gblocks刪除空位及模糊位點(diǎn)。單個基因的多重序列比對結(jié)果使用SequenceMatrix串聯(lián)在一起(Vaidyaetal., 2011),最終得到13個PCGs的氨基酸串聯(lián)序列和核苷酸串聯(lián)序列兩個數(shù)據(jù)集。使用PartitionFinder2計(jì)算每個數(shù)據(jù)集的最佳分區(qū)及其相應(yīng)的進(jìn)化模型(Lanfearetal., 2017)。
系統(tǒng)發(fā)育建樹在CIPRES Science Gateway(https:∥cushion3.sdsc.edu/portal2/)在線平臺上完成。我們利用最大似然法(maximum likelihood, ML)和貝葉斯推斷法(Bayesian inference, BI)兩種方法進(jìn)行系統(tǒng)發(fā)育分析:使用IQ-TREE 1.6.10進(jìn)行最大似然法建樹,分支節(jié)點(diǎn)的可靠性采用1 000次ultrafast bootstrap進(jìn)行評估;使用MrBayes 3.2.7a進(jìn)行貝葉斯推斷法建樹,參數(shù)設(shè)置為:4條獨(dú)立的馬爾可夫鏈(Markov chains)同時(shí)運(yùn)行800萬代(generation)。每運(yùn)行1 000代取樣一次,當(dāng)ESS(estimated sample size)>100且PSRF(potential scale reduction factor)接近1.0時(shí),即認(rèn)為兩個分析過程趨于穩(wěn)定狀態(tài),舍棄25%的老化樣本, 剩余樣本用來構(gòu)建50%一致樹,并計(jì)算出每個節(jié)點(diǎn)的貝葉斯后驗(yàn)概率值(posterior probability, PP)。
基于不同數(shù)據(jù)集進(jìn)行系統(tǒng)發(fā)育分析的結(jié)果不完全一致,根據(jù)建樹結(jié)果我們利用tree-puzzel 5.2軟件中的四簇似然映射(four-cluster likelihood mapping, FcLM)分析進(jìn)一步進(jìn)行了系統(tǒng)發(fā)育樹拓樸結(jié)構(gòu)檢驗(yàn)(Schmidtetal., 2002)。
如圖1所示,圓鞘隱盾豉甲和齒緣龍虱的線粒體基因組全長分別為16 123 bp和16 196 bp,都是由37個基因(13個蛋白質(zhì)編碼基因、2個rRNA基因、22個tRNA基因)和一個D-loop區(qū)(控制區(qū))組成的環(huán)狀DNA分子?;蚺帕许樞蚺c已測定的肉食亞目水生類群物種完全一致,沒有發(fā)現(xiàn)基因重排。與大部分昆蟲一樣,除trnS1缺少DHU臂外,剩下21個tRNA基因均能形成經(jīng)典的三葉草結(jié)構(gòu),包括氨基酸接受臂、DHU臂、TψC臂和反密碼子臂4個臂和1個可變環(huán)(孫錚等, 2010; Sunetal., 2019)。
圖1 圓鞘隱盾豉甲和齒緣龍虱的線粒體基因組結(jié)構(gòu)
如表2所示,圓鞘隱盾豉甲線粒體基因組的37個基因排列比較緊湊,僅有一些較小的基因間隔區(qū)(1~22 bp)。13個PCGs的序列總長度為11 178 bp(去除終止密碼子),除nad1基因使用TTG作為起始密碼子外,其余12個PCGs的起始密碼子均為ATN。除nad5基因和nad4基因具有不完整終止密碼子T外,其余PCGs的終止密碼子均為典型的TAA/TAG。rrnL基因和rrnS基因的大小分別是1 317 bp和785 bp;非編碼的D-loop區(qū)位于rrnS和trnI之間,長度為1 289 bp。
如表2所示,齒緣龍虱的線粒體基因組除了一些較小的基因間隔區(qū)(1~16 bp)外,在trnI基因和trnQ基因之間還存在一個長度為125 bp的非編碼區(qū)。13個PCGs的序列總長度為11 181 bp(去除終止密碼子),除nad1基因使用TTG作為起始密碼子外,其余12個PCGs的起始密碼子均為ATN。cox2,nad3,nad5和nad4 4個基因的終止密碼子為不完整終止密碼子T,其余PCGs的終止密碼子均為典型的TAA/TAG。rrnL基因和rrnS基因的大小分別是1 310 bp和785 bp;非編碼的D-loop區(qū)位于rrnS和trnI之間,長度為1 286 bp。
表2 圓鞘隱盾豉甲和齒緣龍虱的線粒體基因組注釋
與其他已測序鞘翅目昆蟲相似,肉食亞目水生類群線粒體基因組的PCGs在堿基使用上具有明顯的A+T偏向性。沼梭甲科3個物種的AT含量相對較高分別為78.81%, 79.03%和79.13%。龍虱科Limbodessus屬和Paroster屬4個物種的AT含量相對較低,分別為73.84%, 72.23%, 74.25%和74.73%;而Hydroporus屬和Eretes屬3個物種的AT含量則相對較高,分別為78.51%, 77.44%和77.85%。線粒體蛋白質(zhì)編碼基因不同編碼位點(diǎn)的AT含量存在較大差異,所有物種第3位點(diǎn)的AT含量均明顯高于第1位點(diǎn)和第2位點(diǎn)。肉食亞目水生類群線粒體基因組的高AT含量,同樣在蛋白質(zhì)編碼基因的密碼子使用上也有所體現(xiàn)。如圖2所示,從全部肉食亞目水生類群來看,62種密碼子在其線粒體基因組中都有被使用;但是其中富含GC的12種密碼子(ACG, AGG, AGC, CGC, CGG, CTG, GCG, GGC, GTC, GTG, TCG和TGC)在少數(shù)的不同物種中并沒有被使用。此外,以G/C結(jié)尾的31種密碼子在19個肉食亞目水生類群中的平均使用次數(shù)全部低于40(1~37.36),并且這些密碼子的RSCU值都明顯小于1(最高0.74);而以A/T結(jié)尾的31種密碼子的平均使用次數(shù)幾乎都高于40,并且RSCU值也幾乎都大于1。尤其是完全由A和T組成的6種密碼子(TAT, AAT, ATA, TTT, ATT和TTA)的使用次數(shù)明顯偏高,在肉食亞目水生類群線粒體基因組中的平均使用次數(shù)高達(dá)144.42~412.21。
圖2 肉食亞目水生類群線粒體基因組PCGs的密碼子使用數(shù)量和相對同義密碼子使用頻率
通過比較分析13個PCGs的Ka, Ks以及Ka/Ks值的大小,我們發(fā)現(xiàn)線粒體基因組的13個PCGs在肉食亞目水生類群的進(jìn)化過程中都受到了純化選擇。如圖3所示,在肉食亞目水生類群線粒體基因組的13個PCGs中:cox1基因的Ka值最低(0.064),atp8基因的Ka值最高(0.284);nad4l基因的Ks值最低(0.458),cox3基因的Ks值最高(1.068)。雖然13個PCGs的Ka值和Ks值存在一些差異,但是所有13個PCGs的Ka/Ks值都顯著小于1,atp8基因的Ka/Ks值最高為0.567,cox1基因的Ka/Ks值最低為0.075。
圖3 13個蛋白質(zhì)編碼基因(PCGs)在肉食亞目水生類群中的進(jìn)化速率
通過將線粒體基因組13個PCGs的多重序列比對結(jié)果進(jìn)行串聯(lián),得到氨基酸序列數(shù)據(jù)集(3 693 bp)和核苷酸序列數(shù)據(jù)集(11 079 bp)?;谶@兩個數(shù)據(jù)集構(gòu)建19個肉食亞目水生類群物種的最大似然樹和貝葉斯樹,總共得到了4個系統(tǒng)發(fā)育樹。如圖4和5所示,盡管這4個系統(tǒng)發(fā)育樹的拓?fù)浣Y(jié)構(gòu)有所差異,但是它們都共同支持:瀑甲科與偽龍虱科互為姐妹群,兩棲甲科與龍虱科構(gòu)成姐妹群。
圖4 基于線粒體蛋白質(zhì)編碼基因(PCGs)的氨基酸序列推斷的肉食亞目水生類群的系統(tǒng)發(fā)育關(guān)系
如圖4所示,基于氨基酸數(shù)據(jù)集得到的最大似然樹和貝葉斯樹的拓?fù)浣Y(jié)構(gòu)完全一致,僅在分支的支持率上存在輕微差異?;诎被嵝蛄械慕浣Y(jié)果將龍虱總科強(qiáng)烈恢復(fù)為一個單系類群,支持豉甲總科位于系統(tǒng)發(fā)育樹的基部,沼梭甲總科與龍虱總科構(gòu)成姐妹群。將龍虱總科分為2個分支:兩棲甲科與龍虱科構(gòu)成姐妹群,并一起與壁甲科構(gòu)成一個分支;瀑甲科與偽龍虱科構(gòu)成姐妹群,并一起與水甲科構(gòu)成一個分支。如圖5所示,基于核苷酸序列得到的最大似然樹和貝葉斯樹則不完全一致,在龍虱科內(nèi)不同屬之間的親緣關(guān)系存在輕微差異:最大似然樹支持Hydroporus屬和Paroster屬的親緣關(guān)系更接近;貝葉斯樹則與基于氨基酸序列的系統(tǒng)發(fā)育結(jié)果一致,支持Limbodessus屬和Paroster屬的親緣關(guān)系更接近?;诤塑账嵝蛄械南到y(tǒng)發(fā)育結(jié)果將龍虱總科作為一個并系類群:支持(偽龍虱科+瀑甲科)與豉甲科構(gòu)成姐妹群,并與沼梭甲科一起構(gòu)成一個分支;將龍虱總科剩余類群單獨(dú)構(gòu)成一個分支:龍虱科與兩棲甲科構(gòu)成姐妹群,壁甲科與水甲科構(gòu)成姐妹群。
圖5 基于線粒體蛋白質(zhì)編碼基因(PCGs)的核苷酸序列推斷的肉食亞目水生類群的系統(tǒng)發(fā)育關(guān)系
基于氨基酸序列和核苷酸序列的系統(tǒng)發(fā)育結(jié)果的差異主要表現(xiàn)在(偽龍虱科+瀑甲科)的系統(tǒng)發(fā)育位置發(fā)生了改變,這種變化也直接干擾了龍虱總科的單系性。利用FcLM分析可以對不同數(shù)據(jù)集支持不一致拓?fù)涞膯栴}進(jìn)行解決,該方法需要指定4個單系類群,并對可能的四重奏拓?fù)浣Y(jié)構(gòu)(quartet topologies)的支持值進(jìn)行估算(Zhangetal., 2019; Nieetal., 2020)。在本次FcLM分析中,我們將肉食亞目水生類群分為4個分支:(偽龍虱科+瀑甲科)單獨(dú)作為一個分支;龍虱總科剩余類群作為一個單獨(dú)的分支;豉甲科作為一個分支;沼梭甲科作為一個分支。我們基于氨基酸序列和核苷酸序列分別進(jìn)行了FcLM分析,來進(jìn)一步評估(偽龍虱科+瀑甲科)的系統(tǒng)發(fā)育位置。如圖6所示,基于FcLM分析的結(jié)果都強(qiáng)烈支持(偽龍虱科+瀑甲科)與龍虱總科剩余類群構(gòu)成姐妹群,氨基酸數(shù)據(jù)集和核苷酸數(shù)據(jù)集對于這種拓?fù)浣Y(jié)構(gòu)的支持值分別為66%和54%;而對于(偽龍虱科+瀑甲科)與豉甲科構(gòu)成姐妹群的支持度則相對較低,氨基酸數(shù)據(jù)集和核苷酸數(shù)據(jù)集的支持值分別僅有25%和28%。所以,F(xiàn)cLM分析的結(jié)果與基于氨基酸序列的建樹結(jié)果一致,這也進(jìn)一步證實(shí)了龍虱總科的單系性。
圖6 基于線粒體PCGs氨基酸序列和核苷酸序列的肉食亞目水生類群的FcLM分析
圓鞘隱盾豉甲和齒緣龍虱的線粒體基因組全長分別為16 123 bp和16 196 bp,在基因排序、堿基組成、密碼子使用及tRNA基因二級結(jié)構(gòu)等特征上與已測的肉食亞目水生類群線粒體基因組高度相似。本研究利用19個肉食亞目水生類群線粒體基因組的PCGs序列進(jìn)行堿基偏好性分析,AT含量和62種密碼子使用的統(tǒng)計(jì)結(jié)果都表明線粒體基因組PCGs偏向于使用堿基A+T。其堿基使用情況與大部分鞘翅目昆蟲的研究結(jié)果一致,PCGs的3個編碼位點(diǎn)都偏向于更多地使用堿基A+T;并且第3位點(diǎn)的AT含量明顯高于第1和2位點(diǎn)(Yuanetal., 2016)。雖然蛋白質(zhì)編碼基因不同編碼位點(diǎn)在堿基使用上存在明顯差異,但是肉食亞目水生類群8個科的物種在堿基使用上并沒有顯著差異。
與其他昆蟲中的研究結(jié)果一致,肉食亞目水生類群線粒體基因組PCGs的進(jìn)化模式分析結(jié)果表明13個PCGs在進(jìn)化過程中都受到純化選擇。在線粒體基因組的進(jìn)化中純化選擇是最主要的力量,純化選擇有利于去除有害突變,即對氨基酸影響較小(Tomasco and Lessa, 2011)。為了維持功能需求,cox1基因的氨基酸序列經(jīng)歷了強(qiáng)大的功能約束和強(qiáng)烈的進(jìn)化壓力。盡管atp8基因經(jīng)歷了弱的進(jìn)化壓力和功能約束,但代謝約束的這種放松可能使線粒體基因組中積累更多的突變(Zsurkaetal., 2010; Lietal., 2012; Yangetal., 2018)。這些結(jié)構(gòu)上和進(jìn)化上相對保守的特點(diǎn)表明其可以作為研究肉食亞目水生類群進(jìn)化關(guān)系的重要分子標(biāo)記。
基于氨基酸序列和核苷酸序列的建樹結(jié)果不完全一致,但是通過FcLM分析發(fā)現(xiàn)基于氨基酸數(shù)據(jù)集的建樹結(jié)果更加可靠。所以,基于線粒體基因組PCGs的氨基酸序列的肉食亞目水生類群系統(tǒng)發(fā)育重建結(jié)果為:(豉甲科Gyrinidae+(沼梭甲科Haliplidae+((壁甲科Aspidytidae+(兩棲甲科Amphizoidae+龍虱科Dytiscidae))+(水甲科Hygrobiidae+(瀑甲科Meruidae+偽龍虱科Noteridae)))));豉甲科位于肉食亞目水生類群的基部,沼梭甲科與龍虱總科構(gòu)成姐妹群。這些結(jié)果既支持了Bell(1966)最早提出的龍虱總科所有類群共同完成一次獨(dú)立水生習(xí)性入侵的理論,也進(jìn)一步支持了Arndt和Beutel(1995)早期提出的“豉甲科、沼梭甲科、龍虱總科3個類群獨(dú)立水生習(xí)性入侵過程”的假說。偽龍虱科與瀑甲科構(gòu)成姐妹群,這與Beutel等(2006)基于形態(tài)學(xué)以及Balke等(2008)基于分子數(shù)據(jù)的研究結(jié)果一致。此外,我們的結(jié)果將龍虱總科分在2支之內(nèi):兩棲甲科與龍虱科構(gòu)成姐妹群,并一起與壁甲科構(gòu)成一個分支;瀑甲科與偽龍虱科構(gòu)成姐妹群,并一起與水甲科構(gòu)成一個分支。這與習(xí)欠云等基于cox1序列的研究結(jié)果(Xietal., 2008)基本一致。
蛋白質(zhì)編碼基因的進(jìn)化模式分析表明氨基酸序列相對保守;基于氨基酸序列的建樹結(jié)果也十分穩(wěn)定;FcLM分析結(jié)果也表明使用氨基酸數(shù)據(jù)集的建樹結(jié)果更加可靠。這些都表明利用線粒體基因組對肉食亞目水生類群進(jìn)行系統(tǒng)發(fā)育重建時(shí),氨基酸序列是更好的選擇。另外,本研究中使用數(shù)據(jù)有限,部分科只包含了1個代表種,龍虱總科內(nèi)部各科之間的親緣關(guān)系還需更廣泛的物種取樣來驗(yàn)證。