李冬芝,張美霞,單伊曼,王 芳
(河北師范大學 生命科學學院,河北 石家莊 050024)
微衛(wèi)星(microsatellite)DNA由核心序列和側翼序列組成,其核心序列是由2~6個核苷酸經(jīng)多次串聯(lián)形成的序列,側翼序列通常是相對保守的單拷貝序列,位于核心序列的兩側[1].微衛(wèi)星由于數(shù)量多、分布廣、重復性好、簡便易行、省時高效,且具有豐富的多態(tài)性并符合孟德爾遺傳定律和共顯性遺傳等特點[2-4],被廣泛應用于昆蟲的種群遺傳多樣性研究、物種的起源、擴散及進化等研究領域[5].傳統(tǒng)上,采用文庫法進行微衛(wèi)星多態(tài)性位點的開發(fā),但隨著高通量測序技術的迅猛發(fā)展及測序成本的下降,通過轉錄組數(shù)據(jù)篩選微衛(wèi)星多態(tài)性位點的方法更成熟、更高效、更經(jīng)濟[6-8].轉錄組是特定組織或細胞在某一發(fā)育階段或功能狀態(tài)下所有RNA的總和,主要包括 rRNA,mRNA,tRNA,非編碼RNA和少量未知調控功能的內(nèi)含子[9-11],對于無參考基因組的非模式生物在遺傳進化等方面有重要的應用價值[12].目前,通過轉錄組數(shù)據(jù)庫已成功開發(fā)出扶桑綿粉蚧Phenacoccussolenopsis[13]、齒緣刺獵蝽Sclominaerinacea[14]、意大利蝗Calliptamusitalicus[15]等多種昆蟲的微衛(wèi)星分子標記.
褐軟蠟蚧CoccushesperidumLinnaeus,1758,隸屬于昆蟲綱Insecta、半翅目Hemiptera、蚧次目Coccomorpha、蠟蚧科Coccidae,是一類比較古老的昆蟲,在蚧次目占據(jù)著重要的分類地位[16].褐軟蠟蚧在全球各大動物地理區(qū)均有分布,通過刺吸式口器汲取植物汁液,引起植物枝葉枯黃萎蔫,分泌的蜜露可誘發(fā)植物產(chǎn)生霉污病,當蟲害大發(fā)生時,影響植物的光合作用,致使植物長勢衰退,嚴重時可致整株死亡[17-18].目前已知褐軟蠟蚧可為害49科170多種寄主植物,其中包含多種經(jīng)濟作物和觀賞性植物,如該種取食內(nèi)蒙古地區(qū)的米蘭Aglaiaodorata幼嫩樹梢的汁液,造成米蘭枯萎凋謝[19].微衛(wèi)星分子標記在入侵蚧蟲扶桑綿粉蚧的遺傳分化研究中得到廣泛應用.李慧等[20]通過5′錨定對扶桑綿粉蚧進行微衛(wèi)星DNA的篩選,并分析了扶桑綿粉蚧的微衛(wèi)星特征;羅梅等[13]通過扶桑綿粉蚧的轉錄組數(shù)據(jù),篩選出1 781個SSR位點;馬玲[21]利用扶桑綿粉蚧基因組數(shù)據(jù)成功開發(fā)出42對微衛(wèi)星引物,并基于此進行了該物種的種群遺傳學研究;王玉生[22]基于微衛(wèi)星探討了扶桑綿粉蚧在中國的種群遺傳結構特點和地理分布格局.然而,其他蚧蟲基于微衛(wèi)星的種群分化研究比較匱乏,因此本研究以全球分布且為害嚴重的褐軟蠟蚧為研究對象,利用高通量測序技術,基于轉錄組數(shù)據(jù)對褐軟蠟蚧進行微衛(wèi)星分子標記的開發(fā),以期為今后褐軟蠟蚧的種群遺傳學、功能基因等研究奠定基礎.
褐軟蠟蚧采集于河北石家莊(37 °59 ′58 ″ N,114 °30 ′59 ″ E;寄主為幸福樹Radermacherasinica)、湖北恩施(30 °16 ′19 ″ N,109 °29 ′17 ″ E;寄主為幸福樹)及遼寧錦州(41 °07 ′02 ″ N,121 °07 ′42 ″ E;寄主為鵝掌柴Scheffleraarboricola).所采集的試蟲均為雌成蟲,蟲體置于100 %酒精,于-20 ℃冰箱保存.
褐軟蠟蚧的轉錄組數(shù)據(jù)委托北京諾禾致源科技股份有限公司進行測序,測序平臺為Illumina,獲得的轉錄組原始數(shù)據(jù)經(jīng)過質量評估和過濾后得到測序數(shù)據(jù)的總條目數(shù)(clean reads),再經(jīng)過Trinity[23]拼接和Corset[24]層次聚類,得到最長群集(cluster)序列,最后將組裝得到的褐軟蠟蚧轉錄本數(shù)據(jù)與7大公共數(shù)據(jù)庫Swiss-prot(swiss prot protein database),Nr(non-redundant protein sequences),Nt(NCBI nucleotide sequences),KEGG(kyoto encyclopedia of genes and genomes),KOG(eukaryotic ortholog groups),Pfam(protein families database)和GO(gene ontology)進行Blast比對;選擇閾值條件為E<0.01,采用序列相似性進行功能注釋.
使用在線軟件MISA(http:∥pgrc.ipk-gatersleben.de/misa/misa.html)對褐軟蠟蚧轉錄組數(shù)據(jù)的unigenes進行搜索,查找SSR.查找標準如下:單核苷酸重復≥10次,二核苷酸重復≥6次,三核苷酸重復≥5次,四核苷酸重復≥5次,五核苷酸重復≥5次,六核苷酸重復≥5次.
使用Primer Premier 3軟件[25]批量設計SSR引物,從中隨機挑選50對引物用以驗證其穩(wěn)定性(表1,引物由大基因合成).樣品總基因組DNA通過組織提取試劑盒(中國,全式金EasyPure Genomic DNA Kit)提取,于-20 ℃冰箱保存?zhèn)溆?以樣品總DNA為模板,以超純水代替DNA模板為陰性對照進行PCR擴增,PCR反應體系:DNA模板1 μL,2×Es Taq PCR Master Mix 5 μL,上下游引物各0.25 μL,ddH2O 3.5 μL.PCR反應程序:94 ℃預變性3 min;94 ℃變性30 s,54~60 ℃退火30 s,72 ℃延伸1 min,共35個循環(huán);72 ℃延伸5 min,4 ℃保存.PCR產(chǎn)物經(jīng)1 %瓊脂糖凝膠電泳檢測.
表1 隨機選擇用于PCR驗證的褐軟蠟蚧微衛(wèi)星引物Tab.1 Randomly Selected Coccus hesperidum Microsatellite Primers for PCR Validation
續(xù)表
續(xù)表
2.1.1 褐軟蠟蚧轉錄組數(shù)據(jù)組裝分析結果
Illumina平臺測序得到的轉錄組原始數(shù)據(jù)經(jīng)過質量評估和過濾后,得到48 708 348 clean reads,經(jīng)Trinity拼接后獲得145 727條轉錄本(transcripts),堿基序列為196 655 017 bp,序列平均長度為1 349 bp,N50的片段長度為2 590 bp,G+C含量為40.01 %.所得轉錄本經(jīng)過Corset層次聚類后得到最長Cluster序列,最終獲得111 073 條unigenes,所得unigenes的總堿基序列為187 403 274 bp,unigenes序列長短不一,長度為201~23 463 bp,平均長度為1 687 bp,其N50為2 702 bp.
表2 褐軟蠟蚧轉錄組功能注釋Tab.2 Functional Annotation of Transcriptome in Coccus hesperidum
2.1.2 褐軟蠟蚧的基因功能注釋
本研究成功在111 073條unigenes中注釋出111 228個基因.其中有7 519條unigenes同時在7個數(shù)據(jù)庫中注釋成功,占總數(shù)的6.76 %,在7個數(shù)據(jù)庫中至少有1個數(shù)據(jù)庫注釋成功的,占58.69 %.根據(jù)數(shù)據(jù)庫注釋成功的unigenes統(tǒng)計,GO數(shù)據(jù)庫注釋分類信息最多,共注釋了53 149條unigenes,占總數(shù)的47.85 %(表2).根據(jù)GO功能的分類方式,GO注釋的unigenes可以分為生物過程、細胞組分和分子功能3大類,包含50個詳細的亞類(圖1).生物過程包含25個不同的亞類,褐軟蠟蚧的注釋基因中與細胞過程和代謝過程相關的unigenes所占比例較高,分別約占20.80 %和18.48 %;而與細胞聚集相關的基因所占比例最低,僅有6條。細胞組分包括20個不同的亞類,其中與細胞和細胞組分相關的unigenes所占比例最高,均約占18.49 %;其次為細胞器相關的基因序列,占12.90 %;細胞外基質成分相關的基因序列最少,僅有4條。分子功能包含10個亞類,與結合相關的unigenes數(shù)量較多,占46.78 %;其次是催化活性和轉錄活性的unigenes數(shù)量,占35.21 %;而與金屬離子結合相關的所占比例最少,僅有33條.
1-25為生物過程:1.行為;2.生物附著;3.生物相;4.生態(tài)調控;5.細胞聚集;6.細胞凋亡;7.細胞組織成分或生物發(fā)生;8.細胞過程;9.發(fā)育過程;10.生長;11.免疫過程;12.定位;13.運動;14.代謝過程;15.多種有機體過程;16.多細胞生物過程;17.生態(tài)負反饋過程;18.生態(tài)正反饋過程;19.生態(tài)過程調節(jié);20.生殖;21.生殖過程;22.應激反應;23.節(jié)律過程;24.信號;25.信號傳導過程;26-45為細胞組分:26.細胞;27.細胞黏附;28.細胞組分;29.細胞外基質;30.細胞外基質成分;31.胞外區(qū);32.胞外區(qū)組分;33.大分子復合物;34.細胞膜;35.細胞膜成分;36.膜封閉腔;37.擬核;38.細胞器;39.細胞器成分;40.其他組織;41.其他組織成分;42.突觸;43.突觸成分;44.病毒;45.病毒成分;46-55為分子功能:46.抗氧化活性;47.粘合;48.催化活性;49.金屬伴侶蛋白活性;50.分子功能調控;51.分子傳導活性;52.核酸結合轉錄因子活性;53.結構分子活;54.轉錄因子活性,蛋白質結合;55.轉運體活性.圖1 褐軟蠟蚧的unigene GO功能注釋Fig.1 GO Functional Annotation of Unigene of Coccus hesperidum
利用MISA軟件對褐軟蠟蚧轉錄組111 073條unigenes數(shù)據(jù)進行預測,共在30 331條unigenes中預測得到51 272個SSR位點,SSR位點的出現(xiàn)頻率為27.31 %(含SSR的unigenes數(shù)量/總unigenes數(shù)量),其中19 478條unigenes序列只含有1個SSR位點,10 853條unigenes序列含有1個以上SSRs位點.褐軟蠟蚧的SSR位點信息類型豐富,單核苷酸至六核苷酸重復類型均檢測到,其中單核苷酸占比最高,為87.14 %;其次為三核苷酸、二核苷酸和四核苷酸,分別占SSR位點總數(shù)的8.93 %,2.74 %,0.76 %;五核苷酸和六核苷酸含量較少,僅占0.20 %和0.23 %.在單核苷酸重復中,A/T基序重復為主要類型,占比為80.16 %;其次為C/G基序重復占比6.98 %.二核苷酸以AG/CT重復為主要類型;三核苷酸中ACG/CGT,AGC/CTG和CCG/CGG的重復超過1.00 %;四核苷酸中AAAT/ATTT基序重復最多,所占比例為0.37 %(表3,圖2).
表3 褐軟蠟蚧轉錄組數(shù)據(jù)中SSRs的類型及數(shù)目Tab.3 The Types and Number of SSRs in Transcriptome Data of Coccus hesperidum
圖2 褐軟蠟蚧的SSR重復基元出現(xiàn)頻率Fig.2 Fenquency of SSR Repeat Motif of Coccus hesperidum
使用Primer Premier 3對褐軟蠟蚧含有SSR位點的unigenes共設計118 215對SSR引物.本研究通過對三個不同地理種群的褐軟蠟蚧DNA進行PCR擴增,來驗證隨機挑選并合成的50對引物(表1)的穩(wěn)定性.結果顯示,有15對引物在3個地理種群中能成功擴增出與預期片段大小一致的特異性片段(圖3),引物SSR-02,SSR-09,SSR-10,SSR-11,SSR-13,SSR-18,SSR-19,SSR-27,SSR-29,SSR-31,SSR-32,SSR-34,SSR-35,SSR-36,SSR-37,SSR-38,SSR-39,SSR-40和SSR-48這19對引物在3個地理種群均未擴增出特異性條帶,而其余的16對引物則在部分地區(qū)擴增失敗或無特異性條帶.
M.2000 DNA marker;1~50.SSR 引物.圖3 褐軟蠟蚧 DNA 擴增的電泳圖Fig.3 Electrophoretic Map of DNA Amplification of Coccus hesperidum
隨著現(xiàn)代生物技術和生物信息學的快速發(fā)展,轉錄組測序技術因其無需參考基因組數(shù)據(jù)便可對目標物種進行分子生物學研究,已成為非模式物種基因信息挖掘的重要研究手段[12].目前,本研究通過對褐軟蠟蚧進行轉錄組測序,共獲111 073條unigenes,平均長度1 687 bp,N50 為2 702 bp,并且該物種的注釋基因信息將為研究褐軟蠟蚧乃至蚧蟲的代謝途徑、基因功能分類和信號傳導等方面提供重要的參考依據(jù).
本研究中通過褐軟蠟蚧的轉錄組數(shù)據(jù),從111 073條unigenes獲得30 331條SSR序列,褐軟蠟蚧SSR的出現(xiàn)頻率為27.31 %,其發(fā)生頻率遠高于另一種蚧蟲扶桑綿粉蚧(5.79 %)[13],同時遠高于桔小實蠅Bactroceradorsalis(4.00 %)[26]、溝眶象Eucryptorrhynchuschinensis(9.47 %)[27]和沙蔥螢葉甲Galerucadaurica(4.53 %)[28],但低于窄足真蚋Simulium(Eusimulium)angustipes(36.05 %)[29].由此看出,不同物種的SSR發(fā)生頻率不盡相同,這可能與物種自身的特性及差異有關,另一種可能是由于高通量測序標準或者SSR篩選方法設置的標準或參數(shù)不同所導致[30].在褐軟蠟蚧SSR位點中,單核苷酸重復(87.14 %)和三核苷酸重復(8.93 %)為主要類型,這與窄足真蚋[29]、孟氏隱唇瓢蟲Cryptolaemusmontrouzieri[31]、沙蔥螢葉甲[28]、扶桑綿粉蚧[13]、桔小實蠅[26]等昆蟲的結果相似,而意大利蝗Calliptamusitalicus[15]、梨小食心蟲Grapholithamolesta[32]、沙棘木蠹蛾Eogystiahippophaecolus[33]則以單核苷酸和二核苷酸重復為主要類型.這說明不同物種或者昆蟲SSR位點的核苷酸重復類型存在著一定的差異,這種差異可能是由于不同昆蟲的基因組測序數(shù)據(jù)、不同組裝方法獲得不同的轉錄組數(shù)據(jù)大小、不同昆蟲所具有的獨特的基因編碼特點、SSR位點篩選方法和參數(shù)設置的不同所導致的[30,34].此外,我們對從大批量SSR引物中隨機選擇的50對引物進行了擴增穩(wěn)定性的驗證,其中有15對引物在不同地理種群的褐軟蠟蚧樣本中得到了穩(wěn)定擴增,19對引物在不同地理種群均擴增失敗,而其余16對引物則在部分種群沒有擴增到目的片段或者擴增失敗.這種現(xiàn)象的出現(xiàn)主要是因為轉錄組測序得到的序列不含有內(nèi)含子及其它非編碼序列,進而篩選獲得的SSR也無內(nèi)含子序列,但物種的基因組SSR存在內(nèi)含子序列,這樣會造成部分SSR序列與物種自身基因組的差異,從而影響PCR的擴增結果,因此應選用可以穩(wěn)定擴增的SSR位點來作為未來褐軟蠟蚧種群遺傳學研究的微衛(wèi)星分子標記[35].
本研究對通過褐軟蠟蚧的轉錄組數(shù)據(jù)篩選出SSR位點,并成功驗證出15 對能穩(wěn)定擴增的引物,為褐軟蠟蚧的細胞學、代謝途徑、種群遺傳學等方面的研究奠定了堅實的基礎.