李敏,王青,陳晨,付藝杰,石太瑞
(1.太原師范學(xué)院 生物系,山西 晉中 030619;2.山西農(nóng)業(yè)大學(xué) 農(nóng)學(xué)院,山西 太谷 030801)
溫帶臭蟲(Cimexlectularius)屬于半翅目(Hemiptera)臭蟲科(Cimicidae)臭蟲屬(Cimex),是一種以吸食人類血液為生的昆蟲。因其唾液中含有抗凝劑,能夠刺激受害者皮膚,引起發(fā)紅、瘙癢,影響人類睡眠,還傳播某些疾病,如回歸熱、鼠疫等[1]。溫帶臭蟲在我國各地均有分布,近年來溫帶臭蟲咬人事件呈上升趨勢,尤其以珠江三角洲等地區(qū)最為嚴(yán)重,其發(fā)生的場所包括工廠宿舍、出租房、軍營等[2~4]。自20世紀(jì)90年代以來,鐵路旅客被臭蟲叮咬的事件經(jīng)常發(fā)生,迄今為止報(bào)道的列車干線已有6條[5]。近日筆者在山西省臨汾市某酒店和忻州市某學(xué)校也發(fā)現(xiàn)溫帶臭蟲。因此,研究溫帶臭蟲的遺傳多樣性、種群遺傳結(jié)構(gòu)和歷史動(dòng)態(tài)對(duì)其預(yù)測、預(yù)防和防治具有重要意義。
隨著分子生物學(xué)的發(fā)展,分子標(biāo)記技術(shù)已成為物種遺傳多性性研究的重要手段之一。微衛(wèi)星,也稱簡單重復(fù)序列(Simple Sequence Repeat, SSR),是以1~6個(gè)核苷酸堿基(bp)為重復(fù)單位組成的5~40個(gè)的簡單串聯(lián)重復(fù)序列[6]。微衛(wèi)星標(biāo)記技術(shù)因其數(shù)量多、多態(tài)性信息豐富、易于檢測、呈共顯性遺傳等優(yōu)點(diǎn)成為系統(tǒng)進(jìn)化、群體遺傳學(xué)、保護(hù)遺傳學(xué)以及遺傳育種等研究的有力工具,在植物、動(dòng)物、微生物及人類醫(yī)學(xué)等學(xué)科領(lǐng)域得到了廣泛應(yīng)用[7~9]。以往的SSR發(fā)掘方法較為繁瑣,需要多個(gè)步驟,花費(fèi)大量的財(cái)力和時(shí)間。隨著高通量測序技術(shù)的發(fā)展,可以快速精確地從轉(zhuǎn)錄組序列中發(fā)掘出物種中的SSR位點(diǎn)。單核苷酸多態(tài)性(Single Nucleotide Polymorphisms, SNP)指同一物種的不同個(gè)體在基因組水平上由單個(gè)核苷酸變異引起的DNA序列多態(tài)性,通常只有頻率大于1%時(shí)才被稱為SNP,占已知多態(tài)性的80%以上。多倍體物種中的SNPs大致可分為simple SNPs、hemi-SNPs和homoeo-SNPs[10]。SNP標(biāo)記作為目前最具發(fā)展?jié)摿Φ姆肿訕?biāo)記,在基因組中具有遺傳穩(wěn)定、數(shù)量多、分布廣且易于檢測等特點(diǎn),適合于數(shù)量龐大的檢測分析,也是研究遺傳多樣性的主要分子標(biāo)記之一[11,12]。
本研究擬利用軟件msatcommander v0.8.2[13]和SOAPsnp v1.03[14]對(duì)溫帶臭蟲轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行SSR和SNP位點(diǎn)分析,以期為溫帶臭蟲及近緣種的SSR標(biāo)記和SNP標(biāo)記的開發(fā)提供生物信息學(xué)基礎(chǔ),為進(jìn)一步研究其遺傳多樣性、種群遺傳結(jié)構(gòu)和歷史動(dòng)態(tài)乃至對(duì)臭蟲的預(yù)測防治奠定理論基礎(chǔ)。
溫帶臭蟲轉(zhuǎn)錄組數(shù)據(jù)及其全基因組數(shù)據(jù)均來自美國國立生物技術(shù)信息中心(National Center for Biotechnology Information, NCBI),在genome數(shù)據(jù)庫中的ID為11279。該轉(zhuǎn)錄組數(shù)據(jù)和全基因組數(shù)據(jù)分別包含25 468和41 503個(gè)unigene,平均長度均大于200 bp,可以用于溫帶臭蟲SSR與SNP的發(fā)掘。
SSR位點(diǎn)的發(fā)掘是使用msatcommander v0.8.2 軟件對(duì)獲得的溫帶臭蟲全轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行分析,核苷酸重復(fù)次數(shù)分為單核苷酸重復(fù)、二核苷酸重復(fù)、三核苷酸重復(fù)、四核苷酸重復(fù)、五核苷酸重復(fù)、六核苷酸重復(fù),重復(fù)次數(shù)分別為12、6、5、4、4、4。最終得到的符合標(biāo)準(zhǔn)的核苷酸重復(fù)在本次實(shí)驗(yàn)中定義為SSR。
SNP的發(fā)掘是以溫帶臭蟲全基因組作為參考基因組,轉(zhuǎn)錄組數(shù)據(jù)作為測序數(shù)據(jù),使用SOAPaligner/soap2軟件進(jìn)行比對(duì)。將得到的SOAP比對(duì)結(jié)果進(jìn)行排序,排序后的SOAP比對(duì)結(jié)果輸入到SOAPsnp v1.03進(jìn)行預(yù)測,最終得到的結(jié)果為SNP。
溫帶臭蟲轉(zhuǎn)錄組序列經(jīng)過msatcommander v0.8.2軟件的分析后,共得到了4 758個(gè)SSR,占總轉(zhuǎn)錄組序列的18.68%,即出現(xiàn)頻率。這4 758個(gè)SSR分布于4 171條序列中,占總序列的16.38%,即發(fā)生頻率。所發(fā)現(xiàn)的SSR長度在12~45個(gè)堿基之間變化。從溫帶臭蟲轉(zhuǎn)錄組中發(fā)掘出的6種核苷酸重復(fù)中,單核苷酸重復(fù)次數(shù)最多,占總SSR數(shù)量的58.74%,其次是三核苷酸重復(fù),其數(shù)量少于單核苷酸重復(fù),占總SSR個(gè)數(shù)的20.68%。六核苷酸重復(fù)的次數(shù)最少,只有2個(gè),僅占總數(shù)的0.04%,并且每種核苷酸重復(fù)在重復(fù)次數(shù)上存在一定的差異(表1)。例如,單核苷酸重復(fù)一般出現(xiàn)12~14次,二核苷酸重復(fù)則較多地出現(xiàn),為6~7次,三核苷酸重復(fù)的重復(fù)次數(shù)主要為5~6次,而四、五、六核苷酸重復(fù)次數(shù)主要為4次。
表1 溫帶臭蟲中開發(fā)的SSR數(shù)量及分布Table 1 The amount and distribution of SSR detected in Cimes lectularius
在溫帶臭蟲轉(zhuǎn)錄組中發(fā)掘出的4 758個(gè)SSR中,共有30種重復(fù)基元,6種核苷酸重復(fù)基元的種類數(shù)量分別為2、3、10、12、2、1。 在單核苷酸重復(fù)中,出現(xiàn)最多的是A/T,共出現(xiàn)2 757次,占總數(shù)的57.94%,出現(xiàn)頻率為10.825%。二核苷酸重復(fù)中,出現(xiàn)最多的基元為AT/AT,出現(xiàn)了474次,是總數(shù)的9.96%,出現(xiàn)頻率為1.861%。其次為AG/CT,是總數(shù)的4.17%。三核苷酸重復(fù)出現(xiàn)最多的為ATT/AAT,占總數(shù)的7.91%。四核苷酸重復(fù)、五核苷酸重復(fù)、六核苷酸重復(fù)出現(xiàn)的次數(shù)較少,共占總數(shù)的4.5%(表2)。
用SOAPsnp v1.03對(duì)溫帶臭蟲轉(zhuǎn)錄組25 468條Unigene預(yù)測得到109 301個(gè)SNP位點(diǎn),每條unigene平均含4.29 個(gè)SNP 位點(diǎn)。其中simple SNPs與hemi-SNPs分別為76 562個(gè)和32 739個(gè)。simple SNPs中轉(zhuǎn)換型46 634個(gè),占60.91%,顛換型29 928個(gè),占39.09%。6 種單核苷酸變異中,C/T和A/G發(fā)生的頻率最高,分別為30.69%和30.22%。其它4種單核苷酸變異中A/T、C/G、A/C和 G/T的發(fā)生頻率分別為13.41%、9.57%、8.65%和7.46%(表3)。
通過轉(zhuǎn)錄組測序的方法,本研究在溫帶臭蟲中發(fā)掘出4 758個(gè)SSR位點(diǎn),出現(xiàn)頻率為18.68%。比已報(bào)道的鞘翅目云南切梢小蠹Tomicusyunnanensis(1.293%)[15]、鱗翅目荔枝蒂蛀蟲Conopomorphasinensis(15.25%)[16]、東方粘蟲Mythimnaseparata(11.505%)[17]、細(xì)梢小卷蛾Rhyacionialeptotubula(3.091%)[18],雙翅目桔小實(shí)蠅(4.232%)[19]、半翅目蠋蝽Armachinensis(7.60%)[20]、扶桑綿粉蚧Phenacoccussolenopsis(6.334%)[21]等大多數(shù)昆蟲的出現(xiàn)頻率都要高,一定程度上說明溫帶臭蟲SSR標(biāo)記數(shù)量的豐富,較高多態(tài)性潛能,但是跟纓翅目西花薊馬(18.954%)[22]的出現(xiàn)頻率高的物種相比則要低,出現(xiàn)這種頻率差異的原因可能與物種的特異性、測序數(shù)據(jù)量大小和搜索序列標(biāo)準(zhǔn)有關(guān)。
溫帶臭蟲微衛(wèi)星種類較為豐富,其中單核苷酸重復(fù)出現(xiàn)的次數(shù)最多,這與報(bào)道的荔枝蒂蛀蟲[16]、西花薊馬[22]、玉米粘蟲[23]結(jié)果相似。然而,印度谷螟[24]則以二核苷酸重復(fù)最多,與此同時(shí),云南切梢小蠹[15]、桔小實(shí)蠅[19]、阿麥葉蜂Dolerusaeneus[25]、二點(diǎn)委夜蛾Athetislepigone[26]、褐飛虱Nilaparvatalugens[27]以及灰飛虱Laodelphaxstriatellus[28]則是以三核苷酸重復(fù)最豐富,可見各物種間的SSR類型仍存在著明顯差異[29]。
溫帶臭蟲的重復(fù)基元主要分布在單、二、三核苷酸重復(fù),占總SSR的95.48%,單核苷酸重復(fù)的主要重復(fù)基元A/T,與當(dāng)前發(fā)掘的大多數(shù)昆蟲的單核苷酸重復(fù)相同。與印度谷螟相似,溫帶臭蟲的二核苷酸重復(fù)以AT/AT為主,但與以AC/GT為主的西花薊馬的重復(fù)基元不同。二核苷酸重復(fù)中的GC/GC基元沒有在溫帶臭蟲上出現(xiàn),這跟以往研究的大部分昆蟲中GC/GC的含量非常低甚至沒有相一致;與之相反,在鱗翅目玉米粘蟲、二點(diǎn)委夜蛾和細(xì)梢小卷蛾中GC/GC基元,不僅常見而且所占比例較高,因此需要進(jìn)一步研究來確定此重復(fù)基元的具體功能。三核苷酸重復(fù)基元溫帶臭蟲的ATT/AAT占優(yōu)勢,而玉米粘蟲和印度谷螟以CCG/CGG為優(yōu)勢重復(fù)基元。
表2 SSR重復(fù)基元分布特征Table 2 The distribution characteristics of the motifs in Cimex lectularius
對(duì)溫帶臭蟲SNP類型分析發(fā)現(xiàn),simple SNPs
表3 溫帶臭蟲轉(zhuǎn)錄組中SNPs 位點(diǎn)統(tǒng)計(jì)Table 3 The statistics of SNP sites in Cimex lectularius
中轉(zhuǎn)換類型占總數(shù)的60.91%(46 634個(gè)),顛換類型占總數(shù)的39.09%(29 928個(gè)),顛換類型明顯少于轉(zhuǎn)換類型。在轉(zhuǎn)換類型中,C-T的發(fā)生頻率非常高,這可能是由于在CG序列上SNP的發(fā)生頻率最高,而胞嘧啶(C)通常以甲基化的形式存在,且脫氧之后就變成胸腺嘧啶(T)[30],這與錢荷英等人在家蠶的SNP發(fā)掘過程中得到的結(jié)論基本一致[31]。
本試驗(yàn)基于溫帶臭蟲的轉(zhuǎn)錄組數(shù)據(jù)發(fā)掘出大量SSR和SNP位點(diǎn),并進(jìn)行了特征分析,研究結(jié)果將為溫帶臭蟲的分子標(biāo)記開發(fā)提供寶貴資源,對(duì)溫帶臭蟲的遺傳多樣性、遺傳圖譜構(gòu)建、功能基因組學(xué)以及制定合理的檢測及預(yù)防措施等研究奠定了基礎(chǔ)。