高旭,楊江華,*,張效偉,2
1. 污染控制與資源化研究國家重點實驗室,南京大學環(huán)境學院,南京 210023 2. 江蘇省環(huán)境保護化學品安全與健康風險研究重點實驗室,南京 210023
作為一種新型的生物監(jiān)測方法,DNA宏條形碼(DNA metabarcoding)利用環(huán)境DNA序列差異快速、準確和高效地識別物種,適用于從微生物、浮游植物到魚類等各個生物群落,在未來生態(tài)環(huán)境監(jiān)測中有巨大的應用潛力[1-6]。DNA宏條形碼技術不僅能實現(xiàn)物種有無監(jiān)測,還能通過DNA豐度在一定程度上反映生物量的大小,打破現(xiàn)有以生物個體為主的研究模式,可用于研究環(huán)境脅迫對生物群落的影響,甄別環(huán)境關鍵污染因子和推導建立地域化環(huán)境基準[7-9]。目前浮游動物DNA宏條形碼技術仍在發(fā)展階段,尚缺乏統(tǒng)一的操作方法,需要對其(采樣方法、引物選擇和數(shù)據(jù)分析等)進行標準化和調整,然后才能用于常規(guī)流域生態(tài)監(jiān)測。其中,如何選擇合適的PCR擴增引物是DNA宏條形碼生物監(jiān)測的關鍵。
DNA宏條形碼主要基于特定標志基因序列差異辨別物種,不同標志基因的物種覆蓋度(coverage)和物種敏感性(sensitivity)存在巨大差異。高敏感性、低覆蓋度的標志基因會導致大量物種的漏檢,而高覆蓋度、低敏感性的標志基因則不能有效地區(qū)分近源物種。因此,選擇合適的標志基因是DNA宏條形碼生物監(jiān)測的基本保障。傳統(tǒng)核糖體18SrDNA基因具有較高的物種覆蓋度,能擴增出包括原生動物、真核藻類、真菌和后生動物[10]在內的大部分真核生物類群,但由于基因序列過于保守,物種敏感性較差,難以識別到種水平[11]。細胞色素C氧化酶Ι(cytochrome c oxidase Ι,COI)是最常用的動物標志基因,具有大量條形碼序列積累[12-15]。COI是一個編碼蛋白質的基因,存在“第三位密碼子變異(third codon wobble)”,使傳統(tǒng)COI引物在部分物種的鑒定中存在缺陷(taxonomic bias)[16-17]。線粒體12S和16S基因同樣可用于DNA宏條形碼研究[18-19],但是這2對引物多是為整個真核生物類群設計的,對浮游動物特異性未知。截至目前,大部分浮游動物研究仍基于18S[10,15,20-22]或28SrDNA基因[1]。Zhan等[23]比較了COI、16S和18S等標志基因在浮游動物條形碼研究中的差異,發(fā)現(xiàn)傳統(tǒng)COI引物難以提供穩(wěn)定的PCR產(chǎn)物,建議選擇18S和16S基因進行研究。雖然,Leray和Knowlton[24]在研究魚類腸道浮游動物時設計了一個更適合高通量測序的COI引物,但其并未就該引物對浮游動物的覆蓋度和敏感性進行深入探討。
除各種通用引物外,學者們也針對不同生物類群設計了各種引物,譬如針對底棲動物、魚、浮游植物、昆蟲[25-27]和甲殼動物[1,28]的引物,也有很多引物的初衷是想覆蓋整個真核生物類群[29-30]。對于浮游動物群落來說,究竟何種引物更為合適目前尚未明確。本研究利用Ion Torrent PGM測序平臺比較了3對常見的宏條形碼引物(COI、16S和18SV9)對浮游動物群落表征的差異,探究引物對淡水浮游動物宏條形碼監(jiān)測的影響,從物種檢出、物種多樣性和群落結構解析等方面分析最適合浮游動物宏條形碼監(jiān)測的引物,為初步建立標準化的浮游動物宏條形碼監(jiān)測提供依據(jù)。
浮游動物采樣點位如表1所示,分別在2013年4月、8月和11月采集樣品。每個點位用13號浮游生物網(wǎng)濃縮20 L環(huán)境水樣(半定量采樣),濃縮液現(xiàn)場用冰盒儲存,在實驗室用0.45 μm的濾膜(Millipore, USA)進一步過濾去除水分,過濾后的濾膜裝入5 mL離心管中-20 ℃儲存直至DNA提取。
用E.Z.N.A. water DNA kit (Omega, USA)試劑盒提取濾膜DNA。簡要操作為:將濾膜剪碎后(3 mm大小)裝進5 mL無菌離心管中,加入0.2 mg的直徑為2 mm的玻璃珠(試劑盒提供),加入1 mL裂解液,用MoBio Vortex-Genie2 (MoBio Laboratories Inc., CA, USA)在最高轉速下均質5 min后按照試劑盒說明書完成后續(xù)操作。
表1 采樣點位經(jīng)緯度信息Table 1 Basic information of sampling sites
PCR擴增體系為50 μL,包含5 μL的10×PCR High Fidelity PCR buffer、2 μL 50 mmol·L-1的MgSO4、1 μL的10 mmol·L-1dNTP mix、0.2 μL的Platinum Taq DNA polymerase (Invitrogen, USA)、2 μL的模板DNA和1 μL的引物(表2)。PCR程序為:預變性95 ℃、30 s,35個擴增循環(huán)中95 ℃變性10 s、退火30 s(COI為48 ℃,16S為55 ℃,18S為65 ℃),72 ℃延伸30 s,72 ℃延伸5 min。PCR產(chǎn)物通過2%瓊脂糖凝膠電泳檢測后用MinElute gel extraction kit試劑盒(Qiagen, CA, USA)進行純化,純化后用Qubit dsDNA HS assay kits (Invitrogen, USA)定量。
為了保證樣本獲得大致等量的序列數(shù)(Reads),所有的PCR產(chǎn)物均被稀釋到10 ng·μL-1的濃度,然后將所有樣點樣品等體積混合在一起?;鞄旌笕?00 ng建庫,用Agencourt AMPure XP kit (Beckman Coulter, Germany)純化測序文庫,去除短片段(<100 bp),用Ion PGM測序儀(Life Technologies, USA)進行測序。
測序結束后用Fastx toolkits將FASTQ文件轉為FASTA和QUAL文件[31]。在QIIME(Quantitative Insights into Microbial Ecology v1.8.0)[32]中去除低質量(Q<20)的序列、錯配序列和長度<150 bp的序列。利用UCHIME[33]識別并去除PCR嵌和子,以上操作均在Bio-Linux 8系統(tǒng)[34]下完成。利用R “Biostrings”包[35]進行序列比對,去除離群序列。
利用UPARSE[36]進行操作分類單元(operational taxonomic unit, OTU)聚類。序列注釋在Statistical Assignment Package軟件中以默認參數(shù)進行[37],其中,序列相似性>95%且后驗概率>50%的OTU被注釋到物種水平。
表2 引物序列Table 2 Primer sequences
隨著測序深度的增加,COI、16S和18SV9檢出的OTU數(shù)量亦不斷增加。當測序深度達到2 000 000左右時,16S引物檢出的OTU數(shù)量趨于飽和,平均每10 000條序列新增1.9個OTU;測序深度達到30 000 000時,COI引物檢出的OTU數(shù)量趨于飽和,平均每10 000條序列新增1.8個OTU;18SV9引物在測序深度達到16 000 000時檢出的OTU才逐漸趨于平衡,增加率為平均每10 000條序列1.2個OTU(圖1)。
圖1 不同測序深度下檢出的操作分類單元(OTU)數(shù)量Fig. 1 The number of operational taxonomic unit (OTU) in different sequencing depth
18SV9引物共檢出超過16 000個OTU,其中有6 891個OTU(占總序列的8.6%)屬于未知序列,最后能夠被注釋的OTU有9 450個(占總序列的91.4%)。僅有1 461個18SV9的OTU隸屬于浮游動物群落,其中,輪蟲438個(占總序列的17.3%),枝角類159個(占總序列的3.78%),橈足類864個(占總序列的44.75%)(圖2)。
COI引物共檢出OTU 2 259個,其中有1 669個OTU能夠被注釋(占總序列的93.4%),這其中浮游動物OTU有1 211個,包括輪蟲729個(占總序列的27.4%),枝角類235個(占總序列的14.7%)和橈足類246個(占總序列的30.63%)(圖2)。
16S引物共檢出1 277個OTU,其中有390個OTU(占總序列的6.62%)無法確定物種來源,能被注釋的OTU有887個(占總序列的93.4%),這其中有782個OTU來自浮游動物類群,包括輪蟲548個(占總序列的59.6%),枝角類235個(占總序列的26.11%)和橈足類46個(占總序列的3.1%)(圖2)。
盡管18SV9引物檢出的總OTU數(shù)量遠大于16S和COI,但其中有大量OTU來自于藻類和原生動物,其檢出的浮游動物OTU數(shù)量與16S和COI引物接近。
COI和16S引物檢出的浮游動物物種種類較接近,有64種浮游動物能夠同時被COI和16S引物檢出,有28個物種僅能被COI引物檢出,另有10個物種僅能被16S檢出。18SV9引物獲得的大部分序列都無法注釋到物種水平,因此,在物種檢出上其與COI和16S差別較大,僅5個物種能夠同時被18SV9、COI和16S檢出(圖3)。
圖2 不同引物檢測到的OTU數(shù)和序列Reads組成注:(a)不能注釋OTU比例;(b)不能注釋Reads的比例;(c)OTU組成;(d)Reads組成。Fig. 2 The composition of OTU and Reads in zooplankton metabarcoding with different primersNote: (a) proportion of “unknown” OTU; (b) proportion of “unknown” Reads; (c) composition of OTU; (d) composition of Reads.
圖3 不同引物OTU注釋出浮游動物種數(shù)注:(a)浮游動物OTU數(shù)量和被注釋的等級;(b)檢出物種數(shù)。Fig. 3 The number of zooplankton species detected by different metabarcoding primersNote: (a) the number of zooplankton and the level of taxonomic assignment in each primer; (b) number of species detected by different primers.
COI和16S引物對輪蟲和枝角類檢測結果的一致性要好于對橈足類檢測結果的一致性。大部分輪蟲和枝角類都能同時被這2對引物檢出,且物種OTU數(shù)量也較為接近(圖4)。雖然,2對引物檢出的橈足的種類差別不大,但每個物種對應的OTU數(shù)卻相差明顯。例如16S引物發(fā)現(xiàn)指狀許水蚤(Schmackeriaforbesi)僅6個OTU,但是COI引物卻發(fā)現(xiàn)其OTU數(shù)量超過30個。類似的情況還出現(xiàn)在湯匙華哲水蚤(Sinocalanusdorrii)和中劍水蚤(Cyclopsp.)中。18SV9引物中除萼花臂尾輪蟲(Brachionuscalyciflorus)的檢出與COI和16S存在較高的一致性外,其他物種的檢出均與另外2對引物存在較大差異。18SV9中有大量OTU被注釋為鄂足綱(Maxillopoda),并不能往下細分。
COI橈足類多樣性與18SV9橈足類多樣性存在明顯的正相關(R2=0.4,P<0.05),而16S橈足類多樣性與COI及18SV9橈足類多樣性之間沒有明顯相關性。這部分說明,18SV9引物和COI引物能更穩(wěn)定地表征橈足類多樣性(圖5(a)、圖5(b)和圖5(c))。
對枝角類而言,16S引物檢出的枝角類多樣性與COI(R2=0.35,P<0.05)和18SV9存在明顯相關性(R2=0.43,P<0.05),但是COI和18SV9之間卻沒有明顯相關;這表明在物種多樣性的角度上,雖然16S、18SV9和COI引物都能表征枝角類多樣性,但16S監(jiān)測的結果相對更加穩(wěn)健(圖5(g)、圖5(h)和圖5(i))。
COI、18SV9和16S都能很好地表征浮游動物群落組成的季節(jié)差異。其中,COI和16S能夠明確區(qū)分3個采樣季節(jié)對浮游動物群落的影響。18SV9顯示8月份的浮游動物組成明顯與12月份和4月份不同,但4月份和12月份間的差別并不明顯(圖6)。宏條形碼監(jiān)測除了能反映季節(jié)差異,還反映了不同水體類型中浮游動物組成的差異,尤其是河流的浮游動物組成與太湖的浮游動物組成存在明顯差異,河流中輪蟲比例更高,而太湖中枝角類和橈足類更為豐富。
3對引物中,18SV9引物具有物種覆蓋度高、測序成本低的特點,更適合種以上水平的物種多樣性監(jiān)測。雖然,18S引物具有很高的物種覆蓋度,但其對浮游動物的擴增特異性較差[11]。盡管本研究的采樣方法已經(jīng)提前對浮游動物進行了富集,18SV9測序中仍有很大一部分OTU來自藻類、真菌和原生生物,說明18SV9引物更加適合原生生物和藻類多樣性研究[38]。此外,18S的V9可變區(qū)長度僅130 bp左右,長度過短可能是物種識別敏感性較差的主要原因。有研究表明,即便是產(chǎn)物長度更長的18SV4高變區(qū)對物種的辨識度也不如同等長度的COI和16S[39]。18SV9測序結果中大量的OTU僅被注釋到綱,導致物種水平多樣性評估效果并不理想。另一方面,盡管大量18SV9 OTU無法注釋到物種,但是基于OTU依然可以有效地反映季節(jié)和水體類型對浮游動物群落的影響[40]。因此,在不注重物種水平的多樣性時,18SV9引物亦可用于宏條形碼研究,畢竟其更為通用,能覆蓋更多的物種類群,更全面反映整體生物多樣性,且18SV9產(chǎn)物長度短、易于擴增,測序成本更低。
線粒體16S引物具有更高的浮游動物擴增特異性,更適合枝角類和輪蟲多樣性調查。16S測序產(chǎn)生的OTU大部分都來自浮游動物,說明其對浮游動物具有更好的特異性,使測序結果更加“高效”和“純凈”,數(shù)據(jù)浪費少,而另外2對引物測序都有相當比例的序列不屬于浮游動物類群。16S引物具有更長的擴增產(chǎn)物(340 bp),能夠很好地在物種水平上區(qū)分浮游動物。大部分輪蟲和枝角類都能同時被16S和COI所檢出。在16S發(fā)現(xiàn)的782個浮游動物OTU中,來自輪蟲的有548個(占總序列的59.6%),枝角類235個(占總序列的26.11%),而橈足類僅有46個(占總序列的3.1%),對橈足類的檢出效果稍差,會低估水體中橈足類多樣性。
COI引物的擴增產(chǎn)物長度適中,能更加全面、均衡地反映整個浮游動物群落的完整性,為浮游動物宏條形碼研究的理想引物之一。COI作為最常用于動物物種鑒定的條形碼基因[41],為了能區(qū)別近緣物種,傳統(tǒng)COI引物的擴增產(chǎn)物的長度為648 bp[29],超出了當前高通量測序的讀長(目前主流的測序平臺也只能穩(wěn)定地測到550 bp左右),無法用于宏條形碼研究。本研究中使用的COI引物的擴增產(chǎn)物長度為313 bp,在滿足高通量測序讀長要求的同時還兼顧了物種辨識敏感性。COI引物測序中共檢出1 669個浮游動物OTU,其中,輪蟲有729個(占總序列的27.4%),枝角類235個(占總序列的14.7%),橈足類246個(占總序列的30.63%),序列組成上在3個浮游動物群落中比較均衡。COI引物所發(fā)現(xiàn)的物種數(shù)量在3對引物中也是最多的,更為適合浮游動物群落組成的研究。理論上,引物的偏好性是不可避免的,本研究中討論的3種標志基因也都不可能完全覆蓋浮游動物群落的所有物種,需要根據(jù)不同的研究目的選擇合適的引物。在進行探索性多樣性調查及本底調查時,可采用多對引物的組合,以盡量檢出更多的物種,豐富物種編目。而進行生態(tài)健康評估或者生態(tài)質量評價時應選擇某種固定引物(如COI引物)進行調查,以減少多引物產(chǎn)生的不確定性。
圖5 不同引物檢出浮游動物多樣性間的相關性Fig. 5 The correlation of zooplankton diversities detected by different primers
圖6 浮游動物群落的季節(jié)差異注:基于OTU數(shù)據(jù)的非度量多維尺度法(NMDS)分析。Fig. 6 The difference of zooplankton community among different seasonNote: Non-metric multidimensional scaling (NMDS) analysis was based on the OTU data.