国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大頭隆胸長(zhǎng)蝽線粒體基因組測(cè)序及分析(半翅目:地長(zhǎng)蝽科)

2021-03-30 02:54:16王月然王艷會(huì)
關(guān)鍵詞:密碼子大頭核苷酸

王月然,葉 飛,門 宇,王艷會(huì),謝 強(qiáng)*

(1. 南開(kāi)大學(xué)生命科學(xué)學(xué)院,天津 300071;2. 中山大學(xué)有害生物控制與資源利用國(guó)家重點(diǎn)實(shí)驗(yàn)室,廣州 510275;3. 中山大學(xué)生命科學(xué)學(xué)院,廣州 510275)

大頭隆胸長(zhǎng)蝽Eucosmetusincisus(Walker, 1872)隸屬于半翅目Hemiptera異翅亞目Heteroptera蝽次目Pentatomomorpha長(zhǎng)蝽總科Lygaeoidea地長(zhǎng)蝽科Rhyparochromidae縊胸族Myodochini隆胸長(zhǎng)蝽屬Eucosmetus。縊胸族是地長(zhǎng)蝽科中包含屬最多的族。然而,目前尚無(wú)縊胸族相關(guān)的線粒體基因組報(bào)道。

縊胸族昆蟲(chóng)均為植食性,已知其中部分物種以禾本科植物未成熟的種子為食,是一類重要的經(jīng)濟(jì)害蟲(chóng)(鄭樂(lè)怡和鄒環(huán)光, 1981)。這類昆蟲(chóng)通過(guò)喙直接吸食植物種子,并且會(huì)攜帶產(chǎn)生有毒物質(zhì)的真菌,間接影響植物的生長(zhǎng)(Rosmanaetal., 2014; Aminetal., 2015)。大頭隆胸長(zhǎng)蝽是東洋界特有且在我國(guó)水稻種植地區(qū)廣泛發(fā)生的縊胸族代表性昆蟲(chóng),常于灌漿期集中在穗部吸食水稻種子,造成稻米苦澀、發(fā)黃、易碎,并使作物減產(chǎn)。已有文章報(bào)道此類昆蟲(chóng)影響水稻種植,并將其列入水稻害蟲(chóng)名錄(宋慧英等, 1986)。

因此無(wú)論是基于其地理分布特殊性還是害蟲(chóng)防治,都有必要對(duì)大頭隆胸長(zhǎng)蝽開(kāi)展線粒體基因組研究,這也可以為地長(zhǎng)蝽科昆蟲(chóng)的分子系統(tǒng)發(fā)育研究積累更多數(shù)據(jù)。本研究擴(kuò)增并測(cè)定了大頭隆胸長(zhǎng)蝽線粒體基因組編碼區(qū)域的全部基因序列,并且分析了該線粒體基因組的核苷酸組成、密碼子使用、組成偏差、rRNA二級(jí)結(jié)構(gòu)等特征。除對(duì)大頭隆胸長(zhǎng)蝽線粒體基因組本身的分析外,還聯(lián)合了蝽次目毛點(diǎn)類(包括蝽總科、紅蝽總科、緣蝽總科和長(zhǎng)蝽總科)(Tullgren, 1918; Schaefer, 1975; Schuh and Slater, 1995)中其它物種的同源序列,基于13種蛋白質(zhì)編碼基因構(gòu)建系統(tǒng)發(fā)育樹(shù),對(duì)紅蝽總科、緣蝽總科和長(zhǎng)蝽總科間的系統(tǒng)發(fā)育關(guān)系進(jìn)行了探討。

1 材料與方法

1.1 標(biāo)本采集

大頭隆胸長(zhǎng)蝽的成蟲(chóng)個(gè)體,在2018年7月采自于廣西來(lái)賓市金秀縣青山瀑布,標(biāo)本浸泡在無(wú)水乙醇中儲(chǔ)存,帶回實(shí)驗(yàn)室后置于-20℃環(huán)境中保存。

1.2 DNA提取

通過(guò)解剖獲得大頭隆胸長(zhǎng)蝽胸部肌肉組織,并用液氮迅速冷凍研磨,利用CTAB法(Reinekeetal., 2010)結(jié)合試劑盒法提取全基因組,-20℃環(huán)境中保存。

1.3 引物設(shè)計(jì)、PCR擴(kuò)增和測(cè)序

利用前期設(shè)計(jì)并優(yōu)化的通用引物擴(kuò)增若干具有部分重疊區(qū)域的DNA片段(Lietal., 2013),擴(kuò)增失敗的DNA片段,根據(jù)已擴(kuò)增的上下游片段的序列,利用Primer premier 5(Lalithaetal., 2000)設(shè)計(jì)特異性引物,得到互相重疊的線粒體基因的片段(表1)。使用TaKaRa LA DNA聚合酶進(jìn)行PCR擴(kuò)增,PCR反應(yīng)過(guò)程:94℃預(yù)變性2 min,94℃變性30 s,引物最低擴(kuò)增溫度下退火45 s,72℃延伸1~3 min,共進(jìn)行35個(gè)循環(huán),72℃終延伸7 min。使用1%瓊脂糖凝膠電泳檢測(cè)PCR產(chǎn)物,若條帶單一并符合預(yù)期大小,則送交測(cè)序服務(wù)公司測(cè)序(BGI, 廣州; TSINGKE, 廣州)。測(cè)序濃度沒(méi)有達(dá)到要求的可通過(guò)增加模板量或者凝膠回收進(jìn)行處理以提高濃度再測(cè)序。

表1 本研究中使用的PCR引物

1.4 DNA序列拼接、注釋及分析

通過(guò)在GenBank中進(jìn)行BLAST搜索以初步判斷所得序列屬于目標(biāo)類群,用DNA star v7.1中的SeqMan(Swindell and Plasterer, 1997)組件對(duì)序列進(jìn)行拼接,得到大頭隆胸長(zhǎng)蝽的線粒體基因組序列。

tRNA基因通過(guò)Mitos WebServer(http://mitos.bioinf.uni-leipzig.de/index.py)(Berntetal., 2013)和tRNA scan-SE v2.0(http://lowelab. ucsc.edu/tRNAscan-SE/)(Lowe and Chan, 2016)這兩種在線工具進(jìn)行確認(rèn)并預(yù)測(cè)二級(jí)結(jié)構(gòu)。對(duì)于兩種方法都無(wú)法檢測(cè)到的tRNA基因,將其和已知親緣關(guān)系較近的昆蟲(chóng)線粒體基因組的tRNA序列進(jìn)行比對(duì),確定位置和序列,再利用RNA structure v5.8(Mathews and Reuter, 2010)推測(cè)二級(jí)結(jié)構(gòu)。

蛋白質(zhì)編碼基因利用NCBI中的開(kāi)放閱讀框查找工具ORF Finder (https://www.ncbi.nlm.nih. gov/orffinder/)進(jìn)行初步注釋,再將所得蛋白質(zhì)編碼基因序列與近緣物種的線粒體基因組相應(yīng)序列進(jìn)行比對(duì),進(jìn)一步確定各個(gè)蛋白質(zhì)編碼基因的邊界,同時(shí)獲取起始密碼子及終止密碼子。

核糖體RNA基因通常被認(rèn)為處于兩側(cè)基因間的空缺區(qū)域(Boore, 2001; Cameron, 2014b),如tRNA-Leu(UAG)和tRNA-Val之間的序列界定為16S rRNA,tRNA-Val和控制區(qū)之間的序列界定為12S rRNA。核糖體RNA的二級(jí)結(jié)構(gòu)參考黑腹果蠅Drosophilamelanogaster(雙翅目:果蠅科)(Cannoneetal., 2002),白斑地長(zhǎng)蝽Panaorusalbomaculatus(半翅目:地長(zhǎng)蝽科)(Lietal., 2016a)以及豆突眼長(zhǎng)蝽Chauliopsfallax(半翅目:束長(zhǎng)蝽科)(Lietal., 2013)的二級(jí)結(jié)構(gòu)進(jìn)行預(yù)測(cè),莖環(huán)結(jié)構(gòu)的命名參考煙草天蛾Manducasexta(鱗翅目:天蛾科)(Cameron and Whiting, 2008)和意大利蜜蜂Apismellifera(膜翅目:蜜蜂科)(Gillespieetal., 2006)的線粒體rRNA基因。確定線粒體基因組內(nèi)各個(gè)基因的位置后使用CGView Server (http://stothard.afns.ualberta.ca/cgview_server/index.html)(Grant and Stothard, 2008)在線平臺(tái)繪制線粒體基因組的結(jié)構(gòu)示意圖。

線粒體基因組的核苷酸組成和蛋白質(zhì)編碼基因的密碼子使用頻率通過(guò)MEGA v7.0(Kumaretal., 2016)進(jìn)行分析;計(jì)算各基因的核苷酸組成偏向性:AT-skew=(A-T)/(A+T)和GC-skew=(G-C)/(G+C)(Perna and Kocher, 1995)。

1.5 系統(tǒng)發(fā)育分析

選取蝽次目?jī)?nèi)21個(gè)物種的蛋白質(zhì)編碼基因序列分析長(zhǎng)蝽總科的系統(tǒng)發(fā)育地位,其中長(zhǎng)蝽總科的10個(gè)物種作為內(nèi)群,蝽總科、紅蝽總科、緣蝽總科的11個(gè)物種作為外群(表2)。除大頭隆胸長(zhǎng)蝽外的其它物種線粒體基因組均來(lái)自GenBank,按照物種名進(jìn)行排序形成了13個(gè)蛋白質(zhì)基因的數(shù)據(jù)集合,在MEGA v7.0中進(jìn)行多重比對(duì)并手工校正,得到包含13個(gè)蛋白質(zhì)編碼基因全部三個(gè)位點(diǎn)的矩陣PCG123。使用矩陣PCG123通過(guò)MEGA v7.0(Kumaretal., 2016)獲得去掉蛋白質(zhì)編碼基因第3位密碼子的矩陣PCG12。

表2 本研究中所使用的類群信息

本研究采用貝葉斯分析(Bayesian inference)和最大似然法(maximum likelihood)重建系統(tǒng)發(fā)育樹(shù),核苷酸替換模型通過(guò)IQ-TREE v 1.0(Lametal., 2015)分析得到。利用MrBayes v3.12(Huelsenbeck and Ronquist, 2001)進(jìn)行貝葉斯分析,共運(yùn)行1千萬(wàn)代。每隔1 000代取一次樣,舍去收斂之前的數(shù)據(jù)樣本。利用RAxML v8.2.9(Stamatakis, 2006)進(jìn)行最大似然法分析,自展檢驗(yàn)(bootstrap)值設(shè)為1 000。

2 結(jié)果與分析

2.1 大頭隆胸長(zhǎng)蝽線粒體基因組結(jié)構(gòu)

大頭隆胸長(zhǎng)蝽的線粒體基因組是雙鏈閉合環(huán)狀DNA大分子,GenBank序列號(hào)為MN857166。測(cè)得的長(zhǎng)度為14 562 bp,由于控制區(qū)的特殊結(jié)構(gòu)堿基組成,沒(méi)有測(cè)得控制區(qū)的全部序列。已測(cè)得的序列包含一部分控制區(qū)和典型的37個(gè)基因,包括22個(gè)轉(zhuǎn)運(yùn)RNA基因,13個(gè)蛋白編碼基因和2個(gè)核糖體RNA基因(圖1, 表3)。大頭隆胸長(zhǎng)蝽線粒體基因組的基因組成和排列方式保守,與果蠅Drosophilayakuba(雙翅目:果蠅科)和大多數(shù)蝽次目昆蟲(chóng)相同(Clary and Wolstenholme, 1985; Huaetal., 2008)。

圖1 大頭隆胸長(zhǎng)蝽線粒體基因組結(jié)構(gòu)Fig.1 Mitochondrial genome map of Eucosmetus incisus注:箭頭表示基因轉(zhuǎn)錄的方向。藍(lán)色代表蛋白質(zhì)編碼基因,紅色代表tRNA基因,紫色代表rRNA基因,灰色代表已測(cè)得控制區(qū),斜線代表未測(cè)得的控制區(qū)。Note: Arrows indicated the orientation of gene transcription. PCGs were showed as blue arrows, tRNA genes as red arrows, rRNA genes as purple arrows, the sequenced control region as gray arrows and the unsequenced control region as slash.

表3 大頭隆胸長(zhǎng)蝽線粒體基因組結(jié)構(gòu)

大頭隆胸長(zhǎng)蝽線粒體基因組內(nèi)發(fā)生基因重疊的區(qū)域共有15處,總長(zhǎng)度為32 bp,大小從1~7 bp不等。最長(zhǎng)2處基因重疊為7 bp,分別位于ATP8和ATP6,ND4和ND4L之間,并且這兩段重疊序列互為反向互補(bǔ)序列(ATGATAA),這與Cameron(2014a)中報(bào)道的重疊序列相同。最短的10處基因重疊為1 bp,分別位于tRNA-Gln和tRNA-Met、tRNA-Trp和tRNA-Cys、ATP6和COIII、ND3和tRNA-Ala、tRNA-Asn和tRNA-Ser(GCU)、tRNA-Ser(GCU)和tRNA-Glu、tRNA-Phe和ND5、ND4和ND4L、ND6和CytB以及CytB和tRNA-Ser(UGA)之間。同時(shí)觀察到基因間隔區(qū)域有6處,總長(zhǎng)度為34 bp,大小從1~17 bp不等,最長(zhǎng)的基因間隔發(fā)生在tRNA-Ser(UGA)和ND1之間,為17 bp。37個(gè)編碼基因中,有9個(gè)蛋白質(zhì)編碼基因和14個(gè)tRNA基因由J鏈編碼,4個(gè)蛋白質(zhì)編碼基因和8個(gè)tRNA基因以及2個(gè)rRNA基因由N鏈編碼。

2.2 蛋白質(zhì)編碼基因

大頭隆胸長(zhǎng)蝽的線粒體基因組包含13個(gè)蛋白質(zhì)編碼基因,全長(zhǎng)共10 937 bp。除起始和終止子之外,共發(fā)現(xiàn)3 622個(gè)密碼子。其中ND1、ND4、ND4L、ND5位于N鏈,而其余9個(gè)蛋白質(zhì)編碼基因位于J鏈。A+T含量為77.9%,G+C含量為22.1%。除了COI使用TTG作為起始密碼子以外,其它所有蛋白質(zhì)編碼基因都以ATN作為起始密碼子。其中,ND2、COII、ND5、ND4L、ND6和ND1使用ATT作為起始密碼子,ATP6、COII、ND4和CytB使用ATG作為起始密碼子,ATP8和ND3使用ATA作為起始密碼子。這種非傳統(tǒng)的COI起始密碼子在蝽次目昆蟲(chóng)中非常常見(jiàn)。終止密碼子方面,有10個(gè)蛋白質(zhì)編碼基因使用最常見(jiàn)的三聯(lián)體密碼(TAA和TAG)作為為終止密碼子,其中,ND5使用TAG作為終止密碼子,其余9個(gè)使用TAA作為終止密碼子。另外,ND1使用TA作為終止密碼子,COII和COIII的則使用單個(gè)T作為終止密碼子(表4)。以TA或T作為終止密碼子的現(xiàn)象在昆蟲(chóng)線粒體基因組中很常見(jiàn),有研究推測(cè)完全終止密碼子TAA可以通過(guò)轉(zhuǎn)錄后多腺苷酸化產(chǎn)生(Ojalaetal., 1981)。

表4 大頭隆胸長(zhǎng)蝽線粒體基因組中蛋白質(zhì)編碼基因的起始密碼子和終止密碼子

2.3 tRNA

大頭隆胸長(zhǎng)蝽線粒體基因組包含典型的22個(gè)tRNA基因,其中有14個(gè)位于J鏈上,8個(gè)位于N鏈上,長(zhǎng)度范圍在62 bp(tRNA-Asp和tRNA-Gly)到73 bp(tRNA-Lys)之間。其tRNA二級(jí)結(jié)構(gòu)比較保守,除tRNA-His之外的所有tRNA都能夠折疊成經(jīng)典的三葉草的二級(jí)結(jié)構(gòu)(圖2)。根據(jù)Mitos WebServer的分析,在tRNA-His的二級(jí)結(jié)構(gòu)中TψC臂的“環(huán)”結(jié)構(gòu)缺失,僅有“莖”結(jié)構(gòu),這一現(xiàn)象在巨紅蝽Macrocheraiagrandisgrandis(半翅目:大紅蝽科)(Menetal., 2019)中同樣有報(bào)道。

圖2 大頭隆胸長(zhǎng)蝽線粒體基因組中tRNA結(jié)構(gòu)Fig. 2 Predicted secondary structures of tRNAs in Eucosmetus incisus mitochondrial genome注:tRNAs使用相應(yīng)的氨基酸縮寫表示。Watson-Crick經(jīng)典配對(duì)用短線表示,GU配對(duì)用星號(hào)表示,其他非經(jīng)典配對(duì)用空心圓表示。Note: The tRNAs were labeled with the abbreviations of their corresponding amino acids. Inferred Watson-Crick bonds were illustrated by lines, GU bonds by asterisk and the other non-Watson-Crick interactions were represented by hollow circles.

大頭隆胸長(zhǎng)蝽的tRNA的氨基酸接受臂和反密碼子環(huán)具有極低的變異性,長(zhǎng)度都為7 bp。反密碼子臂長(zhǎng)度比較保守,除了tRNA-Arg和tRNA-Glu為4 bp外,其余tRNA的反密碼子臂長(zhǎng)度都為5 bp。DHU臂長(zhǎng)度為2~4 bp,TψC臂長(zhǎng)度為3~5 bp。變化量最大的是DHU環(huán)和TψC環(huán),分別為4~8 bp和1~8 bp (表5)。

表5 大頭隆胸長(zhǎng)蝽線粒體基因組中22個(gè)tRNA的核苷酸分布情況

此外,共發(fā)現(xiàn)17處非Watson-Crick堿基配對(duì)存在于大頭隆胸長(zhǎng)蝽線粒體tRNA基因二級(jí)結(jié)構(gòu)中,且都為G=U配對(duì),其中有15個(gè)集中在氨基酸接受臂和DHC臂上,剩余2個(gè)分別位于反密碼子臂和TψC臂上(表6)。

表6 大頭隆胸長(zhǎng)蝽線粒體基因組tRNA中非典型的堿基對(duì)

2.4 rRNA

大頭隆胸長(zhǎng)蝽的線粒體基因組中的16S rRNA基因長(zhǎng)1 257 bp,位于tRNA-Leu(UAG)和tRNA-Val之間,其二級(jí)結(jié)構(gòu)包含6個(gè)結(jié)構(gòu)域(節(jié)肢動(dòng)物中結(jié)構(gòu)域III缺失)和45個(gè)莖環(huán)結(jié)構(gòu)(圖3)。和長(zhǎng)蝽總科內(nèi)的其它物種相比,大頭隆胸長(zhǎng)蝽在H991、H1196、H235、H2735以及H183到tRNA-Val之間的莖環(huán)結(jié)構(gòu)存在較大變異。而H1775、H2064、H2507等二級(jí)結(jié)構(gòu)則和長(zhǎng)蝽總科其它物種相比,無(wú)論在序列還是在二級(jí)結(jié)構(gòu)上都十分保守。這與已報(bào)道的長(zhǎng)蝽總科線粒體基因組內(nèi)16S rRNA的結(jié)構(gòu)域IV和V比結(jié)構(gòu)域I、II、VI更保守的研究結(jié)果一致(Lietal., 2013; 2016ab)。

圖3 大頭隆胸長(zhǎng)蝽線粒體基因組中的16S rRNA的二級(jí)結(jié)構(gòu)Fig.3 Predicted secondary structure of the 16S rRNA in Eucosmetus incisus mitochondrial genome

12S rRNA基因長(zhǎng)807 bp,位于tRNA-Val和控制區(qū)之間,其二級(jí)結(jié)構(gòu)包括3個(gè)結(jié)構(gòu)域和27個(gè)莖環(huán)結(jié)構(gòu)(圖4),發(fā)現(xiàn)相比結(jié)構(gòu)域I和II,結(jié)構(gòu)域III更保守。特別是在結(jié)構(gòu)域II中,從H567到H769存在一個(gè)拉鏈狀二級(jí)結(jié)構(gòu),大頭隆胸長(zhǎng)蝽的這部分結(jié)構(gòu)與長(zhǎng)蝽總科其它物種相比,不僅在序列長(zhǎng)度上存在差異,而且在核苷酸組成上也存在較高的堿基替換,使得這部分莖和環(huán)的長(zhǎng)度各有不同,但整體上仍保持一個(gè)拉鏈狀結(jié)構(gòu)。rRNA的同源性更多的體現(xiàn)在二級(jí)結(jié)構(gòu)保守性上,而不是具有某一段保守的序列,說(shuō)明rRNA結(jié)構(gòu)構(gòu)成上的生物學(xué)意義要大于它的序列組成(陳國(guó)忠等, 2005)。

圖4 大頭隆胸長(zhǎng)蝽線粒體基因組中12S rRNA二級(jí)結(jié)構(gòu)Fig.4 Predicted secondary structure of the 12S rRNA in Eucosmetus incisus mitochondrial genome

2.5 核苷酸組成和密碼子使用

在所測(cè)得的大頭隆胸長(zhǎng)蝽線粒體基因組中,ATCG 4種核苷酸含量分別為45.9%、32.4%、13%和8.6%。AT偏斜率(AT-skew)大小為17%,GC偏斜率(GC-skew)為-20%,具有明顯的AT偏向性。這與大部分其它蝽次目昆蟲(chóng)類似,AT-skew基本為正值,即整體上A的含量大于T,GC-skew基本為負(fù)值,表明C的含量大于G。大頭隆胸長(zhǎng)蝽線粒體基因組總體上具有較高的A+T含量,為78.3%,在蛋白質(zhì)編碼基因中為77.9%,在tRNA基因中為79.1%,rRNA基因的A+T含量最高,為80%。在蛋白質(zhì)編碼基因中,A+T含量最高的基因是ND6(87.8%),含量最低的基因是COI(72.1%)??偦蚪M、蛋白質(zhì)編碼基因J鏈表現(xiàn)為AT偏移和CG偏移,總蛋白質(zhì)編碼基因及其N鏈、總rRNA編碼基因、tRNA編碼基因N鏈則剛好相反,表現(xiàn)為TA偏移和GC偏移,總tRNA編碼基因及其J鏈表現(xiàn)為AT偏移和GC偏移(表7)。由此可見(jiàn),線粒體基因組中核苷酸組成在不同鏈間是不對(duì)稱的。

表7 大頭隆胸長(zhǎng)蝽線粒體基因組核苷酸組成分析

值得注意的是,由N鏈編碼的蛋白質(zhì)基因和rRNA基因都是TA偏移和GC偏移,而除COI之外所有由J鏈編碼的蛋白質(zhì)基因都剛好相反,都是AT偏移和CG偏移,COI為TA偏移和CG偏移(圖5)。昆蟲(chóng)線粒體基因組J鏈、N鏈上蛋白質(zhì)編碼基因核苷酸組成偏向性剛好相反的情況在C.fallax(Lietal., 2013)也有發(fā)現(xiàn),有報(bào)道稱GC-skew和AT-skew的值因復(fù)制起點(diǎn)的方向和密碼子位置的變化而改變(Hassaninetal., 2005; Weietal., 2010)。為了深入了解這種現(xiàn)象的機(jī)制,需要進(jìn)行更多關(guān)于線粒體基因組序列和功能的研究工作。

核苷酸的AT偏向性也反映在密碼子使用中,蛋白質(zhì)編碼基因密碼子的使用表現(xiàn)出極大的不均質(zhì)性,其中密碼第三位的A+T含量最高,為86.5%,第一位和第二位次之,分別為74.2%和73%。密碼子ATT(371)、TTA(356)、ATA(330)以及TTT(309)是使用頻率最高的四種密碼子,全部由A、T構(gòu)成,分別轉(zhuǎn)運(yùn)氨基酸Ile、Leu、Met和Phe。對(duì)于大多數(shù)氨基酸來(lái)說(shuō),使用最頻繁的密碼子是NNA和NNU,而不是與tRNA反密碼子嚴(yán)格配對(duì)的密碼子(圖6)。如甲硫氨酸Met對(duì)應(yīng)的密碼子是AUA和AUG,使用次數(shù)分別為330和29,其中AUG是與tRNA-Met的反密碼子嚴(yán)格配對(duì)的密碼子。

圖5 大頭隆胸長(zhǎng)蝽線粒體基因組的AT偏移和GC偏移Fig.5 AT-skews and GC-skews of Eucosmetus incisus mitochondrial genome注:13個(gè)蛋白編碼基因和2個(gè)rRNA 基因用不同顏色圓環(huán)表示。Note: 13 protein coding genes (PCGs)and 2 rRNAs were represented in different color circles. Letter J meant J-strand, N meant N-strand.

圖6 大頭隆胸長(zhǎng)蝽線粒體基因組中每個(gè)氨基酸的同義密碼子使用率Fig.6 Percentage of synonymous codon usage of each amino acid in the Eucosmetus incisus mitochondrial genome注:X軸上為密碼子家族。Note: Codon families are provided on the x-axis.

2.6 系統(tǒng)發(fā)育

本研究選取4個(gè)總科共21個(gè)物種,根據(jù)含有蛋白質(zhì)編碼基因全部123位密碼子的矩陣PCG123,和去除第三位密碼子的矩陣PCG12,分別進(jìn)行最大似然法和貝葉斯分析,得到了不同的系統(tǒng)發(fā)育結(jié)果。其中,通過(guò)矩陣PCG123得到的兩個(gè)系統(tǒng)發(fā)育樹(shù)完全不相同,并且與客觀事實(shí)不盡相符,而通過(guò)矩陣PCG12分析得到具有相同拓?fù)浣Y(jié)構(gòu)的系統(tǒng)發(fā)育樹(shù)。通過(guò)對(duì)比有無(wú)密碼子第3位堿基得到的系統(tǒng)發(fā)育結(jié)果的拓?fù)浣Y(jié)構(gòu)是否一致,發(fā)現(xiàn)第3位密碼子的堿基組成異質(zhì)性較高,容易形成核苷酸替代飽和,嚴(yán)重影響樹(shù)形結(jié)構(gòu),表明密碼子第3位的存在與否對(duì)于系統(tǒng)發(fā)育研究非常重要。

根據(jù)矩陣PCG12得到系統(tǒng)發(fā)育樹(shù):{[(長(zhǎng)蝽總科+緣蝽總科)+紅蝽總科]+蝽總科},這個(gè)結(jié)果很好地支持了長(zhǎng)蝽總科的單系性,在總科關(guān)系方面,長(zhǎng)蝽總科和緣蝽總科親緣關(guān)系更近(圖7)。這與Xieetal.(2005)和Huaetal.(2008)根據(jù)18S rRNA和線粒體基因組數(shù)據(jù)得到的樹(shù)形一致。

從貝葉斯分析來(lái)看,關(guān)于長(zhǎng)蝽總科、緣蝽總科、紅蝽總科、蝽總科系統(tǒng)發(fā)育分支節(jié)點(diǎn)處的后驗(yàn)概率均為100%,而在長(zhǎng)蝽總科內(nèi)部,(地長(zhǎng)蝽科+長(zhǎng)蝽科)與束長(zhǎng)蝽的分支節(jié)點(diǎn)處后驗(yàn)概率為85%,小于95%這一通常認(rèn)為的較為可靠的閾值(Leaché and Reeder, 2002; Suzukietal., 2002)。從自展檢驗(yàn)的值來(lái)看,4個(gè)總科的分支節(jié)點(diǎn)支持率均高于70%這一通常認(rèn)為的可靠的閾值(Huelsenbecketetal., 1993),長(zhǎng)蝽總科內(nèi)部部分節(jié)點(diǎn)支持率偏低。

圖7 基于線粒體基因組蛋白質(zhì)編碼基因所得到的系統(tǒng)發(fā)育樹(shù)Fig.7 Phylogenetic tree inferred from the sequences of PCGs in mitochondrial genome注:貝葉斯和最大似然法分析具有一致的拓?fù)浣Y(jié)構(gòu)。節(jié)點(diǎn)處上方的數(shù)字代表貝葉斯后驗(yàn)概率,下方代表bootstrap值。Note: Bayesian analyses and Maximum likelihood showed the same topology. Numbers at the nodes were Bayesian posterior probabilities (up)and Maximum likelihood bootstrap values (down).

這說(shuō)明各總科間的系統(tǒng)發(fā)育關(guān)系總的來(lái)講得到了解析,但還需要進(jìn)一步去驗(yàn)證;而長(zhǎng)蝽總科內(nèi)部關(guān)系仍處于未解析的狀態(tài)。造成這種現(xiàn)象的原因可能有兩個(gè),一是長(zhǎng)蝽總科內(nèi)部取樣不充分,二是僅根據(jù)線粒體基因組進(jìn)行系統(tǒng)發(fā)育推斷對(duì)于類群選取比較敏感。

3 結(jié)論與討論

本研究測(cè)定了大頭隆胸長(zhǎng)蝽編碼區(qū)域的基因序列,并分析了該物種線粒體基因組特征,這是對(duì)縊胸族昆蟲(chóng)線粒體基因組序列的首次報(bào)道。大頭隆胸長(zhǎng)蝽線粒體基因組已測(cè)得部分大小為14 562 bp,包含標(biāo)準(zhǔn)的13個(gè)蛋白編碼基因,22個(gè)轉(zhuǎn)運(yùn)RNA基因,2個(gè)核糖體RNA基因以及部分控制區(qū)。其線粒體基因排列順序同亞庫(kù)巴果蠅Drosophilayakuba和大多數(shù)蝽次目昆蟲(chóng)排列順序相同。線粒體基因組序列存在基因重疊和基因間隔現(xiàn)象,并發(fā)現(xiàn)有兩個(gè)長(zhǎng)度為7 bp的基因重疊片段互為反向互補(bǔ)序列(ATGATAA),一個(gè)位于ATP8和ATP6之間,另一個(gè)位于ND4和ND4L之間。蝽次目昆蟲(chóng)中大部分物種在tRNA-Ser(UGA)和ND1之間存在長(zhǎng)度不等的非編碼區(qū)。

線粒體基因組中核苷酸組成在不同鏈間不對(duì)稱,大頭隆胸長(zhǎng)蝽線粒體核苷酸組成表現(xiàn)出了很高的AT偏向性,13個(gè)蛋白編碼基因和2個(gè)核糖體RNA中,由N鏈編碼的基因都是TA偏移和GC偏移,而除COI之外所有由J鏈編碼的基因都剛好相反,都是AT偏移和CG偏移,COI為TA偏移和CG偏移,該觀察結(jié)果很可能歸因于復(fù)制方向的不對(duì)稱。此外,核苷酸AT偏向性也反映在密碼子的使用中,使用最頻繁的密碼子均由AT組成,且多數(shù)并不與tRNA反密碼子嚴(yán)格配對(duì)。

非傳統(tǒng)起始密碼子TTG在蝽次目昆蟲(chóng)中廣泛存在,通常發(fā)生在蛋白質(zhì)編碼基因COI中,以單個(gè)T作為終止密碼子的現(xiàn)象多發(fā)生在COII和COIII中,而以TA作為終止密碼子的情況僅隨機(jī)出現(xiàn)在少部分基因中。大頭隆胸長(zhǎng)蝽線粒體基因中,除tRNA-His因缺少TψC環(huán),不能正常折疊外,其它21個(gè)tRNA均能折疊成經(jīng)典三葉草結(jié)構(gòu)。大頭隆胸長(zhǎng)蝽的rRNA二級(jí)結(jié)構(gòu)在一些非保守結(jié)構(gòu)域與長(zhǎng)蝽總科其它物種相比,存在長(zhǎng)度差異和較高的堿基替換,但并不影響各物種具有大致相同的二級(jí)結(jié)構(gòu),說(shuō)明rRNA結(jié)構(gòu)構(gòu)成上的生物學(xué)意義要大于它的序列組成。

長(zhǎng)期以來(lái),長(zhǎng)蝽總科、紅蝽總科、緣蝽總科三者間的系統(tǒng)發(fā)育關(guān)系一直存在爭(zhēng)議,且至今尚無(wú)較為統(tǒng)一的意見(jiàn)。本研究的系統(tǒng)發(fā)育結(jié)果是基于蛋白質(zhì)編碼基因的第1、2位密碼子構(gòu)成的數(shù)據(jù)集得到的,系統(tǒng)發(fā)育結(jié)果很好地確認(rèn)了長(zhǎng)蝽總科的單系性,并且支持(((長(zhǎng)蝽總科+緣蝽總科)+紅蝽總科)+蝽總科)這一關(guān)系。而長(zhǎng)蝽總科內(nèi)部關(guān)系仍處于未解析狀態(tài),可能原因是長(zhǎng)蝽總科內(nèi)部取樣不充分,另外僅根據(jù)線粒體基因組進(jìn)行系統(tǒng)發(fā)育推斷對(duì)于類群選取比較敏感,因此未來(lái)需要盡可能選取完整的科級(jí)分類單元類群,并結(jié)合更多分子標(biāo)記(核基因分子標(biāo)記)和形態(tài)學(xué)來(lái)較為全面的進(jìn)行探討和研究。大頭隆胸長(zhǎng)蝽線粒體基因組的測(cè)序不僅為確定長(zhǎng)蝽總科、緣蝽總科和紅蝽總科的系統(tǒng)發(fā)育關(guān)系提供更多證據(jù),還為將來(lái)開(kāi)展地長(zhǎng)蝽科縊胸族昆蟲(chóng)相關(guān)的分子系統(tǒng)發(fā)育研究初步提供了基礎(chǔ)數(shù)據(jù)。

猜你喜歡
密碼子大頭核苷酸
單核苷酸多態(tài)性與中醫(yī)證候相關(guān)性研究進(jìn)展
徐長(zhǎng)風(fēng):核苷酸類似物的副作用
肝博士(2022年3期)2022-06-30 02:48:28
密碼子與反密碼子的本質(zhì)與拓展
Acknowledgment to reviewers—November 2018 to September 2019
10種藏藥材ccmFN基因片段密碼子偏好性分析
中成藥(2018年7期)2018-08-04 06:04:10
大頭蔥(5)
大頭蔥(3)
大頭蔥(4)
大頭蔥(1)
嗜酸熱古菌病毒STSV2密碼子偏嗜性及其對(duì)dUTPase外源表達(dá)的影響
广平县| 习水县| 高碑店市| 津南区| 车险| 三穗县| 临湘市| 左云县| 大余县| 勐海县| 万全县| 黄冈市| 凭祥市| 德钦县| 博乐市| 津南区| 都安| 尚义县| 鄂托克前旗| 汉川市| 烟台市| 玉山县| 金坛市| 石景山区| 巴林右旗| 上虞市| 大兴区| 兴山县| 西藏| 余干县| 秦安县| 平果县| 徐州市| 易门县| 闵行区| 枝江市| 织金县| 绿春县| 邵武市| 宜兴市| 磴口县|